首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

Java URL抓取页面内容乱码有关问题解决方法

2012-10-29 
Java URL抓取页面内容乱码问题解决办法??页面utf-8 乱码?meta http-equivContent-Type contenttext/

Java URL抓取页面内容乱码问题解决办法

?

?

页面utf-8 乱码?

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

gbk正常

<meta http-equiv="Content-Type" content="text/html; charset=gbk" />

?

这个是字符说明

?

http://download.oracle.com/javase/6/docs/api/java/nio/charset/Charset.html

?

如何抓取的时候正常显示呢?

?

一种办法是同一按字节码来抓取,写到文件中,这样要 i/o file ,增加系统负担

?

另一种办法就是要根据页面的编码格式适当转码了

?

下面是我的解决办法?

?

弄了好几个办法,这个最简单

?

?

绝对原创,转载请注明 ??http://tomfish88.iteye.com/

?

BufferedReader in = new BufferedReader(

new InputStreamReader(

yahoo.openStream(),"utf-8"));

?

先查看页面的编码格式,页面是啥编码格式,上面的编码格式就用啥,一点乱码没有,搞定

?

?

1 楼 kevintop 2011-06-27   页面的编码格式不一定有,也不一定对! 你肿么办? :)

热点排行