sax模块处理xml
sax的简单用法sax (Simple API for XML), 以事件处理为基础,按照遇到XML元素的顺序读取XML文档,触发处理函数来执行处理。为此,我们需要定义自己的处理器(Handler),定义遇到XML元素时,执行什么样的处理动作。如startElement()方法,定义了遇到开始tag时,应该做些什么。以下是示范代码:
from xml.sax import ContentHandler, parseclass MyHandler(ContentHandler): def startDocument(self): pass def startElement(self, name, attrs): pass def endElement(self, name): pass def characters(self, content): pass def endDocument(self): passparse('sample.xml', MyHandler())
tag可以是开始tag,也可以是结束tag。
文档启动的时候调用。
解析器到达文档结尾时调用。
遇到XML开始tag时调用,name是tag的名字,attrs是tag的属性值字典。
遇到XML结束tag时调用。