添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

python读取word的自动编号(基于win32com)

有的时候需要提取word中带自动编号的信息。对于word中的文字很多第三方的库都可以搞定,但是,提取格式,可能还是要用pywin32来搞定。

首先,需要知道自动编号,在word对象中的名字,即ListFormat。

listformat的ListString,能获取到编号的字符串,即你看到word文档中编号的字符串,例如“1)”

而,ListValue,则读取到的是编号的值,例如文档中“5)”的编号,读取到的是5。

访问liststring和listvalue的vb代码示例,参考下面的链接

具体用哪个,就看个人需求。

示例:

读取的效果:

脚本:

import win32com.client as win32
from win32com.client import constants
import os
curr_path = os.getcwd()
path = r'%s\带编号.docx'%curr_path
doc_app = win32.gencache.EnsureDispatch('Word.Application')#打开word应用程序