python读取word的自动编号(基于win32com)
有的时候需要提取word中带自动编号的信息。对于word中的文字很多第三方的库都可以搞定,但是,提取格式,可能还是要用pywin32来搞定。
首先,需要知道自动编号,在word对象中的名字,即ListFormat。
listformat的ListString,能获取到编号的字符串,即你看到word文档中编号的字符串,例如“1)”
而,ListValue,则读取到的是编号的值,例如文档中“5)”的编号,读取到的是5。
访问liststring和listvalue的vb代码示例,参考下面的链接
具体用哪个,就看个人需求。
示例:
读取的效果:
脚本:
import win32com.client as win32
from win32com.client import constants
import os
curr_path = os.getcwd()
path = r'%s\带编号.docx'%curr_path
doc_app = win32.gencache.EnsureDispatch('Word.Application')#打开word应用程序