首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 软件管理 > PowerDesigner >

java施用cpdetecto 编码探测

2012-12-27 
java使用cpdetecto 编码探测在项目中加入 这几个包都在附件的cpdetector_1.0.8_binary.zip中- cpdetector_

java使用cpdetecto 编码探测
在项目中加入 这几个包都在附件的cpdetector_1.0.8_binary.zip中
- cpdetector_1.0.8.jar
- chardet.jar
- antlr.jar

/**
     * 文件流中 读取字节编码
     * @param in
     * @return
     * @throws Exception
     * @throws IllegalArgumentException
     */
    public static Charset getCharset(InputStream in){
    /*------------------------------------ 
      detector是探测器,它把探测任务交给具体的探测实现类的实例完成。 
      cpDetector内置了一些常用的探测实现类,这些探测实现类的实例可以通过add方法 
      加进来,如ParsingDetector、 JChardetFacade、ASCIIDetector、UnicodeDetector。   
      detector按照“谁最先返回非空的探测结果,就以该结果为准”的原则返回探测到的 
      字符集编码。 
    --------------------------------------*/ 
    CodepageDetectorProxy detector =   CodepageDetectorProxy.getInstance();  
    /*------------------------------------- 
      ParsingDetector可用于检查HTML、XML等文件或字符流的编码,构造方法中的参数用于 
      指示是否显示探测过程的详细信息,为false不显示。 
    ---------------------------------------*/ 
detector.add(new ParsingDetector(false)); 
/*-------------------------------------- 
  JChardetFacade封装了由Mozilla组织提供的JChardet,它可以完成大多数文件的编码 
  测定。所以,一般有了这个探测器就可满足大多数项目的要求,如果你还不放心,可以 
  再多加几个探测器,比如下面的ASCIIDetector、UnicodeDetector等。 
---------------------------------------*/   
detector.add(JChardetFacade.getInstance());  
//ASCIIDetector用于ASCII编码测定  
detector.add(ASCIIDetector.getInstance());  
//UnicodeDetector用于Unicode家族编码的测定  
detector.add(UnicodeDetector.getInstance());  
Charset charset = null;  
BufferedInputStream bis = new BufferedInputStream(in);
try {
//1024表示 需要探测流中的前1024个字节
charset = detector.detectCodepage(bis, 1024);
} catch (IllegalArgumentException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
//if(charset!=null){  
//     System.out.println("编码是:"+charset.name());  
//}else{ 
//    System.out.println("未知"); 
//}
return charset;
    }

热点排行