word文档提取目录
25-04-08 02:29
953
0
某提案汇总文档没有做目录,wps、word自带的功能也不能正确提取目录,就用python写了一个提取word文档目录的代码。
使用前需安装库:
pip install python-docx
修改了一下,用正则表达式来取提案号,避免取错
修改了二下,正则+开头来取提案号,且提案号数字最多三位,提高容错度
import re from docx import Document # 遍历文档中的段,取目录 def get_table_of_contents(doc): toc = [] tmp="" i=0 for paragraph in doc.paragraphs: match i: case 0: if re.search("第\\d{1,3}号", paragraph.text) and paragraph.text.startswith("第") and len(paragraph.text)<=5: tmp=paragraph.text i=1 case 1: if paragraph.text.startswith("案 由:"): toc.append(tmp+" "+paragraph.text.strip("案 由:")) i=0 return toc # 打开Word文档 doc = Document("D:\\1.docx") # 取目录 table_of_contents = get_table_of_contents(doc) # 遍历打印目录 for para in table_of_contents: print(para)
-
CSS动态渐变彩色文字代码
HTML部分:<div class="wrap">闲看儿童捉柳花</div>CSS部分:@keyframes move { 0% { background-position: 0 0; } 100% { /*... 984 0 25-04-07 -
jquery移动端滑动图片展示
336 0 21-06-02 -
幼儿园活动设计精选案例
中班 健康领域体育活动《打纸球》教案.pdf中班健康活动《小猪生病了》教案.pdf中班健康领域《保护眼睛》教案.pdf中班社会领域《去旅游》教... 944 0 24-08-20 -
中公教师网综合素质写作专题
中学教师资格综合素质写作真题解析.doc小学综合素质写作真题范文:在教师工作中寻找快乐.doc幼儿园教资考试《综合素质》写作范文:教师,我... 1451 0 24-08-20 -
中医助理医师(2019)-基础学习笔记
01、中医助理-中医基础理论(2018)【全】02、中医助理-中医诊断学(2018)【全】03、中医助理-中药学(2018)【全】04、中医助理-方剂学(... 1736 0 24-08-20 -
HTML粘性滑块导航页面Demo - 可自由填充内容
HTML 代码<!doctype html> <html> <head> <meta charset="UTF-8" /> <meta name="viewport" content="width=device-width, user... 762 0 25-04-07 -
qrcode生成二维码
385 0 21-06-01 -
Safari浏览器内容被地址栏、菜单栏或工具栏遮挡导致的兼容问题
页面很多元素使用的是Fixed定位,当在手机端的Safari浏览器、安卓浏览器等测试时,会出现顶部元素、底部元素 被地址栏、菜单栏或工具栏遮... 1040 0 25-04-07
发表我的评论
共0条评论
- 这篇文章还没有收到评论,赶紧来抢沙发吧~