首页 > 软件开发 > PYTHON >

如何用Python从PDF文件中导出数据

来源:互联网 2023-03-16 19:21:01 66

在Python语言中,可以用来读取pdf文件并从中获取相关的数据。那么,如何用Python从PDF文件中导出数据?4gX办公区 - 实用经验教程分享!

如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

工具/原料

  • Python
  • pycharm
  • 截图工具
  • WPS

方法/步骤

  • 1

    打开pycharm工具,点击File--->Settings,打开可利用的包,安装pdfminer24gX办公区 - 实用经验教程分享!

    如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

  • 2

    新建一个Python文件,依次导入io和pdfminer(模块中的类)4gX办公区 - 实用经验教程分享!

    如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

  • 2相关内容未经授权抓取自百度经验
  • 3

    定义函数show_data,传入参数文件路径;循环遍历pdf文档,获取内部文字内容4gX办公区 - 实用经验教程分享!

    如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

  • 4

    再定义一个函数et,参数还是文档路径;调用show_data,使用for...in语句遍历循环,打印内容4gX办公区 - 实用经验教程分享!

    如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

  • 5

    使用if语句判断__name__是否等于__main__,打印并调用et,传入pdf文件路径4gX办公区 - 实用经验教程分享!

    如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

  • 6

    保存代码并使用Python应用运行,结果控制台出现了报错,文件找不到4gX办公区 - 实用经验教程分享!

    如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

  • 7

    拷贝一个user.pdf文件到Python文件同级目录,然后运行Python文件4gX办公区 - 实用经验教程分享!

    如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

  • 8

    可以在控制台查看到打印结果,和pdf文件内容进行对比,一致4gX办公区 - 实用经验教程分享!

    如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

  • 总结

    • 1、安装pdfminer包4gX办公区 - 实用经验教程分享!

      2、新建Python文件4gX办公区 - 实用经验教程分享!

      3、依次导入所需包4gX办公区 - 实用经验教程分享!

      4、定义函数并遍历4gX办公区 - 实用经验教程分享!

      5、调用函数并打印4gX办公区 - 实用经验教程分享!

      6、保存代码并查看4gX办公区 - 实用经验教程分享!

      如何用Python从PDF文件中导出数据4gX办公区 - 实用经验教程分享!

    注意事项

    • 注意pdfminer模块中的方法的用法
    • 注意如何用Python从PDF文件中导出数据

    以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!4gX办公区 - 实用经验教程分享!


    标签: pythonPDF

    办公区 Copyright © 2016-2023 www.bgqu.net. Some Rights Reserved. 备案号:湘ICP备2020019561号统计代码