活动地址:CSDN21天学习挑战赛
学习的最大理由是想摆脱平庸,早一天就多一份人生的精彩;迟一天就多一天平庸的困扰。各位小伙伴,如果您:
想系统/深入学习某技术知识点…
一个人摸索学习很难坚持,想组团高效学习…
想写博客但无从下手,急需写作干货注入能量…
热爱写作,愿意让自己成为更好的人…
…
欢迎参与CSDN学习挑战赛,成为更好的自己,请参考活动中各位优质专栏博主的免费高质量专栏资源(这部分优质资源是活动限时免费开放喔~),按照自身的学习领域和学习进度学习并记录自己的学习过程。您可以从以下3个方面任选其一着手(不强制),或者按照自己的理解发布专栏学习作品,参考如下:
**
学习日记
**
1,学习知识点
pdfplumber块
metadata和pages
2,学习遇到的问题
api没接触过
3,学习的收获
pdfplumber块的api使用
4,实操
pages类
属性
page_number:页码
width:页面宽度
height:页面高度
objects/charts/lines/rects/curves/figures/images:各种pdf对象
方法
extract_text:全文本
extract_words:全单词
extract_tables:页面表格
to_image:可视化观察
close:处理缓存
模块api相关
- pdfplumber.metadata
- pdfplumber.pages
速记:s记为string,将数据转换为字符串的方法。
…