Java DOM解析器 - Java XML教程

文档对象模型是万维网联盟(W3C)的官方推荐。它定义了一个接口,使程序能够访问和更新样式,结构和XML文档的内容。支持DOM实现该接口的XML解析器。

何时使用?

在以下几种情况时,应该使用DOM解析器:

  • 需要知道很多关于文档的结构

  • 需要将文档的部分周围(例如,可能需要某些元素进行排序)

  • 需要使用的文件中的信息超过一次

会得到什么?

当使用DOM 解析器解析一个XML文档,会得到一个树形结构,其中包含的所有文档的元素。 DOM提供了多种可用于检查文档的内容和结构的函数。

优势

DOM是用于处理文档结构的通用接口。它的一个设计目标是Java代码编写一个DOM兼容的解析器,运行在任何其他的DOM兼容的解析器不会有变化。

DOM接口

DOM定义了几个Java接口。这里是最常见的接口:

  • 节点 - DOM的基本数据类型。

  • 元素 - 要处理的对象绝大多数是元素。

  • Attr - 代表元素的属性。

  • 文本 - 元素或Attr的实际内容。

  • 文档 - 代表整个XML文档。文档对象是通常被称为DOM树。

常见的DOM方法

当正在使用DOM,有经常用到的几种方法:

  • Document.getDocumentElement() - 返回文档的根元素。

  • Node.getFirstChild() - 返回给定节点的第一个子节点。

  • Node.getLastChild() - 返回给定节点的最后一个子节点。

  • Node.getNextSibling() - 这些方法返回一个特定节点的下一个兄弟节点。

  • Node.getPreviousSibling() - 这些方法返回一个特定节点的前一个兄弟节点。

  • Node.getAttribute(attrName) - 对于给定的节点,则返回所请求的名字的属性。