如何更改Django默认主页为自定义主页,更改Djago默认主页为自定义主页,这是开始网页的第一步。......
如何使用python的PyPDF2模块读取pdf文档
python是个很有趣的语言,可以在cmd命令窗口运行,还有很多的功能强大的模块。这篇经验告诉你如何利用python的PyPDF2模块读取pdf文档。
工具/原料
- windows系统电脑一台
- python软件
方法/步骤
第一,先安装PyPDF2模块。打开cmd命令窗口,输入pip install PyPDF2,就可通过管道安装PyPDF2模块。
第二,进入cmd命令窗口,输入python,进入python交互环境,并引入PyPDF2模块。
第三,引入os模块,通过os.getcwd()获取当前工作目录,并将一份001.pdf文档放在该工作目录下。
第四,通过open()函数打开pdf文档,并将文档传入PyPDF2模块的PdfFileReader对象中。
第五,获取pdf文档的总页数,并输出某一页的字符。这里主要使用了PdfFileReader对象的getPage()方法获取某一页文档,并通过extractText()函数导出文档。
注意事项
- PyPDF2模块比较容易导出拉丁语系的pdf文档,要将中文文档解析成纯文本比较难。
以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!
标签: python
相关文章
- 详细阅读
-
python中关于单/双引号和转义引号的区别详细阅读
python中关于单/双引号和转义引号的区别,ytho中单/双引号的作用是将引号中间的符号以字符串的形式传递,而在ytho中它们两个的功能是一样的,只不过在遇到转义引号的时候,两者的使用才有所区别,现......
2023-03-16 350 python
- 详细阅读