网站首页 > java教程 正文
在实际的开发中都会遇到 Java操作word文档,pdf文档,excel表格,以实现基本的功能和需要。如果没有接触之前,我们无从下手,今天我就对这些操作用什么工具或者方法做一些简单的陈述,以便可以直接查找对应的资料。
Java操作word文档:
Java 操作word,对word文档进行读写时,主要用 Apache写的POI这个工具类,网上有POI对用的API和文档,在自己实际的项目中可以查找对应的API进行对应的操作。特别注意的是: word 文档分03版和07版的,doc和docx两种,这两种读取的方式是不同的。以.docx文件结尾实际上也是压缩文件,当你把docx后缀名改成.zip,然后解压可以看到很多xml文件,实际上读取docx文档就是解析xml文档。不相信的可以自己尝试。
把docx改成为zip 的效果图
1 什么是Apache POI
全称Apache POI,使用Java编写的免费开源的跨平台的Java API。是创建和维护操作各种符合 Office Open XML(OOXML)标准和微软的 OLE 2 复合文档格式(OLE2)的 Java API。用它可以使用 Java 读取和创建, 修改 MS Excel 文件. 而且, 还可以使用 Java 读取和创建 MS Word 和 MSPowerPoint 文件。Apache POI 提供 Java 操作 Excel 解决方案(适用于 Excel97-2008)。
2 Apache POI的组件
Apache POI包含用于MS-Office的所有OLE2复合文档的类和方法。此API的组件列表如下:
附上一个简单的代码:
package com.lq.readDoc;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.ooxml.POIXMLDocument;
import org.apache.poi.ooxml.extractor.POIXMLTextExtractor;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
/**
* 读取文档中的doc和docx的内容
*/
public class ReadDocUtils {
public static String ReadDoc(String path) throws IOException {
String resullt = "";
//首先判断文件中的是doc/docx
try {
if (path.endsWith(".doc")) {
InputStream is = new FileInputStream(new File(path));
WordExtractor re = new WordExtractor(is);
resullt = re.getText();
re.close();
} else if (path.endsWith(".docx")) {
OPCPackage opcPackage = POIXMLDocument.openPackage(path);
POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
resullt = extractor.getText();
extractor.close();
} else {
System.out.println("此文件不是word文件");
}
} catch(Exception e){
e.printStackTrace();
}
return resullt;
}
}
Java 操作PDF文档:
Java 操作PDF文档使用Itext 工具类比较方便,可以替换文字,上传图片,进行word和PDf之间的转化。网上有对应的文档和API,可以自己查找封装工具类。
Java 操作Excel表格:
Java 操作Excel: 目前我了解到的主要工具类有两个,一个是Apache的POI,另一个是Alibaba 开源的EasyExcel,EasyExcel解决了 POI 中存在的问题,如果要excel数据量很小,可以用Apache下的,如何是海量数据,建议用EasyExcel,他又很多优势。
EasyExcel的核心功能
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。
本文链接:
https://blog.csdn.net/lq18894033018/article/details/97934901
猜你喜欢
- 2024-12-17 松勤软件测试:丢掉Excel,手把手教你用Python操作Excel
- 2024-12-17 Excel数据还可这样来查询:用SQL查询输出工作表指定区域更高效!
- 2024-12-17 Pandas:一个高性能的数据分析Python库
- 2024-12-17 《github精选系列》——数据可视化分析平台DataGear
- 2024-12-17 测试驱动技术(TDD)系列之5:从excel中读取数据
- 2024-12-17 Python读取与写入Excel模块:openpyxl
- 2024-12-17 基于java的开源BI可视化工具——DataGear使用教程
- 2024-12-17 将Excel表格直接导出成JSON文件格式的一个小工具
- 2024-12-17 java解析doc、docx内容踩坑日记 java解析文本文件
- 2024-12-17 深入解析 EasyExcel 组件原理与应用
你 发表评论:
欢迎- 04-27微服务部署架构设计详解(图文全面总结)
- 04-27Java微服务架构选型与对比:一场技术流派的巅峰对决
- 04-27微服务架构下Java的最佳实践
- 04-27Java微服务架构选型:优雅拆分与高效整合
- 04-27微服务架构下的Java代码拆分策略:像拼图一样构建系统
- 04-27微服务架构下的Java最佳实践
- 04-27微服务架构下Java的挑战与机遇
- 04-27微服务架构下Java事务管理的艺术
- 最近发表
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)