HtmlParser初始研究

2012-10-16

HtmlParser初步研究HtmlParser初步研究by?lostfire? 转自：http://www.blogjava.net/lostfire/archive/2006

HtmlParser初步研究

HtmlParser初步研究by?lostfire? 转自：http://www.blogjava.net/lostfire/archive/2006/07/02/56212.html

这两天准备做一些网站编程的工作，于是对HtmlParse小研究了一下，目的是快速入手，而不是深入研究，做了一下整理，和大家共同讨论一下。?一，数据组织分析：

HtmlParser主要靠Node、AbstractNode和Tag来表达Html，因为Remark和Text相对简单，此处就将其忽略了。

Node分成三类：

实际上NodeVisitor里边这四种visit方法都是空的，因为在不同的Visitor中对于这三类节点的处理是不同的；对于需要处理的节点，只要重载对应的visit方法就行了，如果不处理那就不理会就可以了；另外，如果用户用自己的Visitor，那么还可以灵活的处理不同类型的节点了。

热点排行

CSS

HtmlParser初始研究