当前位置:网站首页 > 技术博客 > 正文

python 读pdf文件

这两天学习了一些处理 PDF 文档的方法,网上查找资料的过程中发现很多处理 PDF 文件的库,多方尝试后推荐两个比较好用的。若处理对象是 PDF 文档本身,则推荐使用 pypdf2,如对 PDF 文档进行分割, 合并, 插入等操作.若处理对象是 PDF 文档中的文本,表格等内容,则推荐使用 pdfplumber.

pypdf2

PdfFileMerger。

该类用来合并 pdf 文件,该类的构造方法有一个参数:PdfFileMerger(strict=True),注意这里的参数后面会介绍:

常用方法:

addBookmark(title, pagenum, parent=None):给 pdf 添加一个书签,title 是书签的标题,pagenum 是该书签指向的页面。

append(fileobj, bookmark=None, pages=None, import_bookmarks=True):将指定的 fileobj 文件添加到文件的末尾,bookmark 是赎前,pages 可以使用 (start, stop[, step]) 或者一个 Page Range 来设定将 fileobj 中的指定范围的页面进行添加。

merge(position, fileobj, bookmark=None, pages=None, import_bookmarks=True):与 append 方法类似,不过可以使用 p

  • 上一篇: 浏览器共享文件
  • 下一篇: pypdf2文档
  • 版权声明


    相关文章:

  • 浏览器共享文件2024-10-22 16:30:04
  • python操作pdf文件2024-10-22 16:30:04
  • centos安装traceroute2024-10-22 16:30:04
  • 徐伟签名设计2024-10-22 16:30:04
  • HTML上传文件2024-10-22 16:30:04
  • pypdf2文档2024-10-22 16:30:04
  • 探索ttyd:一款强大的在线终端共享工具2024-10-22 16:30:04
  • pypdf2文档2024-10-22 16:30:04
  • openwrt ttyd终端2024-10-22 16:30:04
  • python提取pdf信息做成表格2024-10-22 16:30:04