版权声明:本文为博主 http://blog.csdn.net/churximi 原创文章,未经允许不得转载,谢谢。 https://blog.csdn.net/churximi/article/details/79673494
python读取word【docx格式】方法
相关
- 安装库:python-docx【
pip install python-docx
】
代码
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
功能:word(docx格式)文本读取与操作
时间:2018年03月23日22:12:38
"""
import docx
def read_docx(path):
data = docx.Document(path)
for index, para in enumerate(data.paragraphs):
print(index, para.text)
if __name__ == "__main__":
read_docx("files/测试.docx")
备注
无法处理doc格式的word文本,doc格式不是基于xml的。