XML:是可扩展的标记语言,所有的标签都是可自定义的。
常用于数据存储、配置文件和数据传输。(Java框架配置文件会用到)
常用于数据存储、配置文件和数据传输。(Java框架配置文件会用到)
html与xml的区别:
html用来做页面展示,xml用来做数据存储
html的所有标签都是预定义的,xml所有标签都是自定义的
xml标签区分大小写
html用来做页面展示,xml用来做数据存储
html的所有标签都是预定义的,xml所有标签都是自定义的
xml标签区分大小写
xml语法:
<?xml version="1.0" encoding="UTF-8"?>
<books>
<book>
<name>c++</name>
<price>66</price>
</book>
<book>
<name>c</name>
<price>77</price>
</book>
</books>
文档说明:必须写在xml文档中的第一行 <?xml version="1.0" encoding="utf-8"?>
standalone:指定文档是否独立,yes或no
元素:xml文档中的标签,文档中必须有且只有一个根元素,元素需要闭合,正确嵌套,区分大小写,数字不能开头
文本:转义字符 >
CDATA:里边的数据会原样显示; <![CDATA[数据内容]]>
属性:属性值必须使用引号引起来
xml约束 :
dtd:
内部dtd:在xml内部定义dtd
外部dtd:在外部文件中定义dtd
本地的dtd文件:<!DOCTYPE students SYSTEM "student.dtd">
网络的dtd文件:<!DOCTYPE students PUBLIC "名称空间(路径)" "student.dtd">
dtd:
内部dtd:在xml内部定义dtd
外部dtd:在外部文件中定义dtd
本地的dtd文件:<!DOCTYPE students SYSTEM "student.dtd">
网络的dtd文件:<!DOCTYPE students PUBLIC "名称空间(路径)" "student.dtd">
<!ELEMENT students (student*)>
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!ATTLIST student number ID #REQUIRED>
schema:
导入xsd约束文档:
导入xsd约束文档:
<?xml version="1.0"?>
<xsd:schema xmlns="http://www.kk.cn/xml"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.kk.cn/xml" elementFormDefault="qualified">
<xsd:element name="students" type="studentsType"/>
<xsd:complexType name="studentsType">
<xsd:sequence>
<xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
</xsd:sequence>
</xsd:complexType>
<xsd:complexType name="studentType">
<xsd:sequence>
<xsd:element name="name" type="xsd:string"/>
<xsd:element name="age" type="ageType" />
<xsd:element name="sex" type="sexType" />
</xsd:sequence>
<xsd:attribute name="number" type="numberType" use="required"/>
</xsd:complexType>
<xsd:simpleType name="sexType">
<xsd:restriction base="xsd:string">
<xsd:enumeration value="male"/>
<xsd:enumeration value="female"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="ageType">
<xsd:restriction base="xsd:integer">
<xsd:minInclusive value="0"/>
<xsd:maxInclusive value="256"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="numberType">
<xsd:restriction base="xsd:string">
<xsd:pattern value="kk_\d{4}"/>
</xsd:restriction>
</xsd:simpleType>
<?xml version="1.0" encoding="UTF-8" ?>
<!--
1、编写根标签
2、引入实例名称空间 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
3、引入名称空间 xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"
4、引入默认的名称空间
<!DOCTYPE student SYSTEM "student.dtd">
-->
<students
xmlns="http://www.kk.cn/xml"
xsi:schemaLocation="http://www.kk.cn/xml student.xsd"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
>
<student number="kk_1001">
<name>asfd</name>
<age>12</age>
<sex>male</sex>
</student>
</students>
XML解析:
解析xml可以做:
如果xml作为配置文件:读取
如果xml作为传输文件:写,读
xml解析思想:
DOM:将文档加载进内存,形成一颗dom树(document对象),将文档的各个组成部分封装为一些对象。
优点:因为,在内存中会形成dom树,可以对dom树进行增删改查。
缺点:dom树非常占内存,解析速度慢。
Document
Element
Text
Attribute
Comment
解析xml可以做:
如果xml作为配置文件:读取
如果xml作为传输文件:写,读
xml解析思想:
DOM:将文档加载进内存,形成一颗dom树(document对象),将文档的各个组成部分封装为一些对象。
优点:因为,在内存中会形成dom树,可以对dom树进行增删改查。
缺点:dom树非常占内存,解析速度慢。
Document
Element
Text
Attribute
Comment
SAX:逐行读取,基于事件驱动
优点:不占内存,速度快
缺点:只能读取,不能回写
xml常用的解析器:
DOM4J: 怎么用 查文档
1.导入jar包 dom4j.jar
2.创建解析器
SAXReader reader = new SAXReader();
3.解析xml 获得document对象
Document document = reader.read(url);
package dom4j;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;
public class TestDom4j {
@Test
public void test1() throws Exception{
SAXReader reader = new SAXReader(); //创建一个xml解析对象
Document document = reader.read("src/book.xml");//把xml文档加载到document对象中
Element root=document.getRootElement();
/*
Element bookNode=root.element("book");
System.out.println(bookNode.getName());
*/
List list=root.elements(); //得到当前节点的所有子节点
Element secondbook=(Element) list.get(1); //得到第二本书的对象
String name=secondbook.element("name").getText();//得到当前节点的文本内容
System.out.println(name);
}
@Test
public void test2() throws DocumentException{
SAXReader reader = new SAXReader(); //创建一个xml解析对象
Document document = reader.read("src/book.xml");//把xml文档加载到document对象中
Element root=document.getRootElement();
treewalk(root);
}
private void treewalk(Element ele){
System.out.println(ele.getName()); //输出当前节点的名字
for(int i=0;i<ele.nodeCount();i++){ //ele.nodeCount()得到当前节点的所有子节点的数量
Node node=ele.node(i);//取出下标为i的节点
if(node instanceof Element){//判断当前节点是否为标签
treewalk((Element)node);//把node强转为标签Element
}
}
}
}
XPATH:专门用于查询
定义了一种规则。
使用的方法:
selectSingleNode():
selectNodes():
使用步骤:
1、注意:要导包 jaxen...jar
2、创建解析器
SAXReader reader = new SAXReader();
3、解析xml 获得document对象
Document document = reader.read(url);
解析XML:
1、得到某个具体的节点内容:第2本书的书名-->c
2、遍历所有元素节点
定义了一种规则。
使用的方法:
selectSingleNode():
selectNodes():
使用步骤:
1、注意:要导包 jaxen...jar
2、创建解析器
SAXReader reader = new SAXReader();
3、解析xml 获得document对象
Document document = reader.read(url);
解析XML:
1、得到某个具体的节点内容:第2本书的书名-->c
2、遍历所有元素节点
XPath: 具体怎么用,需要查文档
nodename 选取此节点。
从根节点选取。
从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
.. 选取当前节点的父节点。
@ 选取属性。
[@属性名] 属性过滤
[标签名] 子元素过滤
package dom4j;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;
public class TestXPath {
@Test
public void test() throws Exception{
SAXReader reader = new SAXReader(); //创建一个xml解析对象
Document document = reader.read("src/book.xml");//把xml文档加载到document对象中
Node node=document.selectSingleNode("/books/book[2]/name");
System.out.println(node.getText());
}
@Test
public void test2() throws Exception{
SAXReader reader = new SAXReader(); //创建一个xml解析对象
Document document = reader.read("src/book.xml");//把xml文档加载到document对象中
List list=document.selectNodes("//*"); // //*去所有节点 忽略深度
for(int i=0;i<list.size();i++){
Node node=(Node)list.get(i);
System.out.println(node.getName());
}
}
}