xml和lxml库
时间:2023-01-16 01:30:00
xml
XML 用于传输和存储数据。
HTML 用于显示数据的设计。
什么是 XML
- XML 指扩展标记语言(EXtensible Markup Language)。
- XML 是一种很像HTML标记语言。
- XML 其设计目的是传输数据,而不是显示数据。
- XML 标签没有预定义,需要自己定义。
- XML 设计为自我描述。
- XML 是 W3C 推荐标准。
XML 树结构
XML 文档使用简单的自我描述语法:
第一行是 XML 声明。它的定义 XML 的版本(1.0)以及使用的编码 根元素 <note> 4 行描述根的 4 个子元素 <to>Toveto> <from>Janifrom> <heading>Reminderheading> <body>Don't forget me this weekend!body> note>
XML 文件形成树结构
XML 文档必须包含根元素。这个元素是所有其他元素的父元素。
XML 文档中的元素形成了一棵文档树。树从根开始,扩展到树的底部。
所有元素都可以有子元素:
<root> <child> <subchild>...subchild> child> <child> <subchild>...subchild> child> <child> <subchild>...subchild> child> <child> <subchild>.....subchild>
child>
root>
xml语法
- XML 文档必须有根元素
- XML 声明
XML 声明文件的可选部分,如果存在需要放在文档的第一行
- 所有的 XML 元素都必须有一个关闭标签(声明不是 XML 文档本身的一部分,它没有关闭标签。)
- XML 标签对大小写敏感
- XML 必须正确嵌套
- XML 属性值必须加引号
- 特殊字符
< < less than > > greater than & & ampersand ' ' apostrophe " " quotation mark - XML 中的注释
- 在 XML 中,空格会被保留。在 XML 中,文档中的空格不会被删减。
XML 元素
一个元素可以包含:
- 其他元素
- 文本
- 属性
XML 命名规则
XML 元素必须遵循以下命名规则:
- 名称可以包含字母、数字以及其他的字符
- 名称不能以数字或者标点符号开始
- 名称不能以字母 xml(或者 XML、Xml 等等)开始
- 名称不能包含空格
可使用任何名称,没有保留的字词。
XML 属性
属性难以阅读和维护。请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。
XML 命名空间
在 XML 中,元素名称是由开发者定义的,当两个不同的文档使用相同的元素名时,就会发生命名冲突。
假设两个文档都有