#代码生活# 读取PDF文字并存储到word文件中 - 代码天地

#代码生活# 读取PDF文字并存储到word文件中

其他 2021-03-27 10:42:44 阅读次数: 0

Python办公自动化：PDF文字提取到word文件中

需求解读
需要用到的扩展库
代码实现

# 把pdf中的文字提取到word文件中
import pdfplumber
import docx
# 利用扩展库打开pdf 文件，并存储pdf内存对象
with pdfplumber.open ('D://XX业务/XXX/XXX市场/2020销年1月XXX销年报告总结.pdf') as pdf:
    #新建一个文档对象
    dc=docx.Document()
    #循环遍历每一页的pdf
    for page in pdf.pages:
        #把每一页的pdf中的文本作为一个段落添加到文档中
        dc.add_paragraph(page.extract_text())
    dc.save('./2020.1报告.docx')

猜你喜欢

转载自blog.csdn.net/weixin_42961082/article/details/115156907

#代码生活# 读取PDF文字并存储到word文件中

#代码生活# 批量给文件添加前缀

代码的生活，都是if

如何读取图片文件并存储到数据库的BLOB属性中

python 读取数据库中的BLOB类型字段，并存储文件到本地

[代码记录生活]反射Reflection

技术改变生活| 脚本代码！

Python读取CSV文件并存储到MySQL

java读取csv和txt文件到代码中

逐行读取txt文件并存入到数组中

生活中的悖论

生活中遇到的问题

生活中的定律

生活中残忍的真相

生活中的小习惯

我的生活中的乐趣

生活中的仪式感

生活中的幽默

TFRecords文件的存储与读取讲解及代码实现

[代码记录生活]Serializable(序列化)

大二代码生活

[代码记录生活]无框架BaseDao的实现

从零开始的异世界代码生活

生活如此多娇，我为代码折腰

java读取word中的表格并存入到mysql数据库中实例

生活

[生活]

Python代码大全之selenium 从网页提出数据并存储到sqlite数据库（完整代码）

【已解决】基于C++ QT读取xml文件并存储到QMap里

去除PDF中的水印文字：实现方法与源代码

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)