网站首页 > java教程 正文
今天给大家分享一下使用java处理pdf文件,包括提取pdf文本、提取pdf图片、pdf转图片三种操作。
主要使用到的库是apache开源的pdfbox,目前最新版本是2.0.x,网上的资料一般是1.8.x或者2.0.x的。如果是要处理pdf,推荐使用。如果是要生成pdf,推荐使用itext,有网友说pdfbox对中文支持不好,我还没尝试,只用过itext还是很棒的。
官网对pdfbox的介绍:
接下来介绍如何使用pdfbox。
首先你肯定要创建maven项目,添加pom依赖,这里一共用到四个依赖:
然后创建工具类,写方法就可以(以下只粘贴部分代码,具体内容可查看文章最后给出的分享链接)。
提取pdf中的文本
提取pdf中的图片
pdf转图片
将每一页pdf转换成一张图片,这个很实用。
为了页面更美观,所以以上代码都以图片形式展示,如果需要查看源文件,可以去github地址:https://github.com/zhouyc/sharecode/blob/master/com/zyc/util/PdfTest.java
下次再给大家分享如何使用itext生成pdf文件。
猜你喜欢
- 2024-10-09 Java 合并、拆分PDF文档(javapdf合并成一个pdf)
- 2024-10-09 Java 转换TIFF到PDF(java转pdf文件)
- 2024-10-09 Word处理控件Aspose.Words功能演示:使用 Java 将 RTF 转换为 PDF
- 2024-10-09 惊呆了了,居然发现了这本Java从小白到大牛的高清版PDF
- 2024-10-09 「Java」PDF文档格式转换之PDF转tiff
- 2024-10-09 Java 拆分PDF页面(java拆分word)
- 2024-10-09 使用Java 将PPT转换为PDF、XPS等格式
- 2024-10-09 Spire.PDF for Java v2.9.1上线!支持多页PDF转换为单个SVG
- 2024-10-09 java操作pdf之iText(java pdfwriter)
- 2024-10-09 SpringBoot集成文件 - 如何集成itextpdf导出PDF?itext的变迁?
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)