首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网络技术 > 网络基础 >

自各儿动手写搜索引擎(常搜吧历程七#解析文档之WORD#)(Java、Lucene、hadoop)

2013-03-21 
自己动手写搜索引擎(常搜吧历程七#解析文档之WORD#)(Java、Lucene、hadoop)一、POI对Word处理1、读取Word1、读

自己动手写搜索引擎(常搜吧历程七#解析文档之WORD#)(Java、Lucene、hadoop)

一、POI对Word处理

1、读取Word

1、读取Excel

3、下载地址:http://www.apache.org/dyn/closer.cgi/poi/dev/

代码实现:

package com.qianyan.test;import com.jacob.activeX.ActiveXComponent;import com.jacob.com.Dispatch;import com.jacob.com.Variant;public class TestJacob {public static void extractDoc(String inputFIle, String outputFile) {    boolean flag = false;       // 打开Word应用程序    ActiveXComponent app = new ActiveXComponent("Word.Application");    try {       // 设置word不可见       app.setProperty("Visible", new Variant(false));       // 打开word文件       Dispatch doc1 = app.getProperty("Documents").toDispatch();       Dispatch doc2 = Dispatch.invoke(             doc1,             "Open",             Dispatch.Method,             new Object[] { inputFIle, new Variant(false),                   new Variant(true) }, new int[1]).toDispatch();       // 作为txt格式保存到临时文件 Variant(7)      // 作为html格式保存到临时文件 Variant(8)      Dispatch.invoke(doc2, "SaveAs", Dispatch.Method, new Object[] {             outputFile, new Variant(8) }, new int[1]);       // 关闭word       Variant f = new Variant(false);       Dispatch.call(doc2, "Close", f);       flag = true;    } catch (Exception e) {       e.printStackTrace();    } finally {       app.invoke("Quit", new Variant[] {});    }    if (flag == true) {       System.out.println("Transformed Successfully");    } else {       System.out.println("Transform Failed");    } } public static void main(String[] args) {extractDoc("E:/test.doc","E:/test.htm");}}


热点排行