Python操作XML方式:
<?xml version="1.0" encoding="UTF-8"?> <mybook id="mb001"> <bookList> <book name="bookA" id="A">AAA</book> <book name="bookB" id="B">BBB</book> </bookList> <bc> <bookList> <book name="bookA" id="A">AAA</book> <book name="bookB" id="B">BBB</book> </bookList> </bc> </mybook>
一、dom解析
dom解析步骤:
1、加载XML文件
2、获取XML文档对象(dom对象)
3、节点操作
dom的xml操作:
AxmlPath="D:\\test\\test.xml"
1、加载XML文件
minidom.parse(xml文件路径)
示例:
doc=minidom.parse(AxmlPath)
2、获取XML文档对象(dom对象),其实也是一个节点,即根节点
doc.documentElement
示例:
root = doc.documentElement
3、节点操作
A、获取节点属性
node.getAttribute(AttributeName)
示例:获取根节点的属性id的值
root.getAttribute("id")
B、获取节点对象集合(列表)
node.getElementsByTagName(TagName)
示例:获取根节点的子节点中所有节点为”book“的节点列表集合
root.getElementsByTagName("book")
C、返回子节点列表
node.childNodes
D、获取XML节点值
node.childNodes[index].nodeValue
E、#访问第一个节点。等价于pagexml.childNodes[0]
node.firstChild
4、返回Node节点的xml表示的文本
doc = minidom.parse(filename)
doc.toxml('UTF-8')
二、tree解析
三、sax解析