码力十足学量化|用Python将pdf文件转换为txt文件 - 代码天地

码力十足学量化|用Python将pdf文件转换为txt文件

企业开发 2023-04-08 14:11:41 阅读次数: 0

pdf格式的文件必须用相应的pdf阅读器才能打开，而且一般的pdf阅读器打开pdf文件后并不支持编辑修改PDF文档的文字。如果可以把把pdf转化为txt文本文件，那么我们阅读编辑起来就容易的多。现在市场上已经有很多PDF转换程序，但是基本上需要付费。但是你只要学会了用Python来进行pdf文件转换为txt文件操作，仅仅只需要短短几行代码就可以搞定。废话不多说，直接上代码。
1）代码

import pdfplumber

path=r"..\requests\财务报表\\贵州茅台2021年半年度报告.pdf"
pdf=pdfplumber.open(path) # 打开PDF文件
pages=pdf.pages # 通过pages属性获取所有页的信息，此时pages是一个列表

text_all=[]
for page in pages:
    # 用extract_text()函数获取每页文本内容
    text=page.extract_text()
    text_all.append(text)

text_all="".join(text_all)
print(text_all)

# 将文件保存为txt文本格式
txt_file=open("贵州茅台2021年半年报报告.txt",mode='a',encoding='utf-8')
txt_file.write(text_all)
pdf.close()

输出效果

猜你喜欢

转载自blog.csdn.net/malishizu222/article/details/125106418

码力十足学量化|用Python将pdf文件转换为txt文件

码力十足学量化|macd 指标详解

码力十足学量化|多因子概述

码力十足学量化|Python安装及环境配置Mac版

码力十足学量化|用Python进行MySQL数据库存入、读取和删除股票数据操作

码力十足学量化|Python用requests+xpath爬取贵州茅台财务报告并保存在本地

码力十足学量化|如何在财务报告寻找合适的财务公告

码力十足学量化|MySQL数据库简介及安装

码力十足学量化|ccxt安装及获取实时K线数据

码力十足学量化|如何获取指数成分股及权重数据

码力十足学量化|基于MySQL数据库管理平台phpMyAdmin新建股票数据表

python利用pandas将excel文件转换为txt文件

将CSV文件转换为TXT文件

利用python将txt文件转换为csv

python对PDF文件做OCR识别，完成PDF转换为TXT文本！

C#实现将TXT文件转换为PDF文件

将txt文件批处理转换为csv文件

20230809在WIN10下使用python3将DOCX文件转换为TXT文件

学习资料pdf自动转换为tmp/txt文件

如何将Markdown文件转换为pdf文件

如何将PDF文件转换为PPT文件？

将txt数据文档转换为Excel文件

20230808在WIN10下使用python3将TXT文件转换为DOCX

python将py文件转换为pyc

如何将PDF文件转换成TXT文档

PDF可以转换为CAD格式吗？怎么将PDF文件转换为CAD格式？

Apache FOP 将Java对象转换为pdf文件

libreoffice将ppt、xls、doc等office文件转换为pdf

将多页PDF文件转换为多张JPG图片

如何将caj文件转换为pdf？

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)