Office文件格式突变如何促使Java和Office更完美集成

小编今天带大家了解Office文件格式突变如何促使Java和Office更完美集成,文中知识点介绍的非常详细。觉得有帮助的朋友可以跟着小编一起浏览文章的内容,希望能够帮助更多想解决这个问题的朋友找到问题的答案,下面跟着小编一起深入学习“Office文件格式突变如何促使Java和Office更完美集成”的知识吧。

创新互联是一家集网站建设,平远企业网站建设,平远品牌网站建设,网站定制,平远网站建设报价,网络营销,网络优化,平远网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。

Office文件格式突变,促使Java和Office更完美集成

Office是大家非常熟悉的办公软件。它的强大的文字和表格的处理能力几乎无人能敌。而其中的Excel除了被应用在传统的表格处理中,也常被广大程序员“抓”来充当报表系统的前端。如我们使用的Java Web程序,在后台生成一个带报表数据的Excel文件,然后将这个文件送到前台浏览器(必须是IE),这样这个Excel文件就可以嵌入到IE中。 

这样处理报表既可以利用Excel强大的表格处理功能,又可以使程序员省了很多的麻烦。但这么做有一个限制。就是服务器的Java生成Excel报表时,一般不会使用COM来调用Excel组件,而是按着Excel文件的二进制格式直接生成Excel文件。但由于Office是商业软件,微软并没有将 Office的文件格式完全公开(就算公开,也不是最新版本的),这样就给生成Excel文件带来了一定的困难。虽然一些比较新的Office文档可以保存成XML格式,但这种文件格式只是一种简陋的替代,再说前端的IE并不认XML格式的Excel文档。也许是微软意识到了这个问题,在新推出的 Office2007中彻底解决了这个问题。

在以前老版本Office中,由于法律或技术原因,脱离Office来处理Office文档将会遇到非常多的问题。也许是开源给微软带来的压力,或许是其他的原因,微软对Office2007的格式做了和以前完全不同的处理。以前的 Office文档是100%的二进制格式。第三方的工具操作起来非常不方便,而Office2007从整体上都是基于XML格式的,这里并不是说 Office2007文档可以保存成XML格式。而是Office2007默认的文档格式就是XML的(Word的docx、Excel的xlsx等)。也许有人会感到奇怪,用文本编辑器打开docx后,显示的仍然是二进制格式,并不是什么XML。其实docx并不是普通的XML格式,当然,也不只是一个 XML文件,docx本质上是一个zip文件,里面有一系列的xml、目录和其他的文件。如果我们将docx改成zip。就可以用winzip等软件将其解开(从这一点我们可以看出,docx中的x就是指XML)。

目录中的XML都是基于OpenXML格式的,这个规范微软已经提供提交给了ECMA,因此,这已经成为公共的标准,我们可以自由地使用它们。由于Office2007文档全部使用了压缩的xml格式,因此,只有支持读取zip 格式和xml格式的语言都可以操作Office2007的文档,当然,Java也不例外。而使用Java和Office联合操作报表将更加容易。在本文中将演示如何使用Java来操作Office2007的文档,这里以word2007为例。

我们将这个文档保存为test.docx。注意,不要保存成向后兼容的word文档格式,也不要保存成Office2003或更好的Office的WordML格式。这个文档将是一个压缩的zip格式,如果将test.docx改成test.zip。 

从上面解开的文件结构可以非常清楚地了解test.docx的保存结构。在Java中我们可以使用java.util.zip包来解开test.docx。从这个目录结构我们可以很容易地猜出文档的主要内容保存在document.xml中。而其他的xml文件将保存不同的信息。如字体信息将保存在 fontTable.xml中,而Office主题将保存在theme.xml和theme1.xml中。

下面我们开使使用Java对这个文件进行操作。首先我们使用JUnit4来确定test.docx是否存在,以及是否可以对其进行读写,代码如下:

@Test public void verifyFile()

...{

assertTrue(new File("test.docx").exists()); 

assertTrue(new File("test.docx").canRead()); 

assertTrue(new File("test.docx").canWrite()); 

}

下面的代码将简单地验证

java.util.zip.ZipFile

类是否可以打开

test.docx

@Test public void openFile() throws IOException, ZipException

...{

ZipFile docxFile = new ZipFile(new File("test.docx")); 

assertEquals(docxFile.getName(), "test.docx"); 

}

经过测试,ZipFile完全可以操作test.docx。看来很多人都迫不急待了,下面就让我们来从test.docx中来读取数据吧。首先应该打开document.xml文件。代码如下:

Test public void listContents() throws IOException, ZipException

...{

boolean documentFound = false; 

ZipFile docxFile = new ZipFile(new File("test.docx")); 

Enumeration entriesIter = docxFile.entries(); 

while (entriesIter.hasMoreElements())

...{

ZipEntry entry = entriesIter.nextElement(); 

if(entry.getName().equals("document.xml"))

documentFound = true; 

}

assertTrue(documentFound); 

}

但是运行上面的代码将抛出一个异常,好象说明document.xml并不存在,事实上并不是如此。而是ZipFile API需要一个完整的文件或目录名,因此,需要将上面的路径变成word/document.xml。 

下一步我们将通过

ZipFile

得到一个

ZipEntry

对象,并通过这个对象来看看

xml

中有什么,代码如下:

@Test public void getDocument() throws IOException, ZipException

...{

ZipFile docxFile = new ZipFile(new File("test.docx")); 

ZipEntry documentXML = docxFile.getEntry("word/document.xml"); 

assertNotNull(documentXML); 

}

感谢大家的阅读,以上就是“Office文件格式突变如何促使Java和Office更完美集成”的全部内容了,学会的朋友赶紧操作起来吧。相信创新互联小编一定会给大家带来更优质的文章。谢谢大家对创新互联网站的支持!


新闻名称:Office文件格式突变如何促使Java和Office更完美集成
网页URL:http://scjbc.cn/article/jdsgcs.html

其他资讯