HTML DOM节点

在 DOM 树中，基本上一切都是节点。每个元素在最底层上都是 DOM 树中的节点。每个属性都是节点。每段文本都是节点。甚至注释、特殊字符（如版权符号 ©）、DOCTYPE 声明（如果 HTML 或者 XHTML 中有的话）全都是节点。因此在讨论这些具体的类型之前必须清楚地把握什么是节点。

节点是……

用最简单的话说，节点就是 DMO 树中的任何事物。之所以用 “事物” 这个模糊的字眼，是因为只能明确到这个程度。比如 HTML 中的元素（如 img）和 HTML 中的文本片段（如 “Scroll down for more details”）没有多少明显的相似之处。但这是因为您考虑的可能是每种类型的功能，关注的是它们的不同点。

通用节点类型

DOM 代码中最常用的任务就是在页面的 DOM 树中导航。比方说，可以通过其 “id” 属性定位一个 form，然后开始处理那个 form 中内嵌的元素和文本。其中可能包含文字说明、输入字段的标签、真正的 input 元素，以及其他
HTML 元素（如 img）和链接（a 元素）。如果元素和文本是完全不同的类型，就必须为每种类型编写完全不同的代码。

DOM 节点的属性主要有：

nodeName 报告节点的名称。
nodeValue 提供节点的 “值”。
parentNode 返回节点的父节点。记住，每个元素、属性和文本都有一个父节点。
childNodes 是节点的孩子节点列表。对于 HTML，该列表仅对元素有意义，文本节点和属性节点都没有孩子。
firstChild 仅仅是 childNodes 列表中第一个节点的快捷方式。
lastChild 是另一种快捷方式，表示 childNodes 列表中的最后一个节点。
previousSibling 返回当前节点之前的节点。换句话说，它返回当前节点的父节点的 childNodes 列表中位于该节点前面的那个节点（如果感到迷惑，重新读前面一句）。
nextSibling 类似于 previousSibling 属性，返回父节点的 childNodes 列表中的下一个节点。
attributes 仅用于元素节点，返回元素的属性列表。

接下来看看所有节点都具有的方法（与节点属性一样，我省略了实际上不适用于多数 HTML DOM 操作的少数方法）：

insertBefore(newChild, referenceNode) 将 newChild 节点插入到 referenceNode 之前。记住，应该对newChild 的目标父节点调用该方法。
replaceChild(newChild, oldChild) 用 newChild 节点替换 oldChild 节点。
removeChild(oldChild) 从运行该方法的节点中删除 oldChild 节点。
a(newChild) 将 newChild 添加到运行该函数的节点之中。newChild 被添加到目标节点孩子列表中的末端。
hasChildNodes() 在调用该方法的节点有孩子时则返回 true，否则返回 false。
hasAttributes() 在调用该方法的节点有属性时则返回 true，否则返回 false。

通用节点类型

多数 Web 应用程序中只用到四种节点类型：

    * 文档节点表示整个 HTML 文档。

    * 元素节点表示 HTML 元素，如 a 或 img。

    * 属性节点表示 HTML 元素的属性，如 href（a 元素）或 src（img 元素）。

    * 文本节点表示 HTML 文档中的文本，如 “Click on the link below for a complete set list”。这是出现在 p、a 或 h2 这些元素中的文字。

文档节点

基本上所有基于 DOM 的代码中都要用到的第一个节点类型是文档节点。文档节点实际上并不是 HTML（或 XML）页面中的一个元素而是页面本身。因此在 HTML Web 页面中，文档节点就是整个 DOM 树。在 JavaScript 中，可以使用关键字 document 访问文档节点：

var myDocument = document;

var htmlElement = myDocument.documentElement;

JavaScript 中的 document 关键字返回当前网页的 DOM 树。从这里可以开始处理树中的所有节点。

也可使用 document 对象创建新节点，如下所示：

    * createElement_x_x(elementName) 使用给定的名称创建一个元素。

    * createTextNode(text) 使用提供的文本创建一个新的文本节点。

    * createAttribute(attributeName) 用提供的名称创建一个新属性。

这里的关键在于这些方法创建节点，但是并没有将其附加或者插入到特定的文档中。因此，必须使用前面所述的方法如 insertBefore() 或 a() 来完成这一步。因此，可使用下面的代码创建新元素并将其添加到文档中：

var pElement = mydocument.create_rElement_x("p");

var text = mydocument.create_rTextNode("Here's some text in a p element.");

pElement.a(text);

bodyElement.a(pElement);

一旦使用 document 元素获得对 Web 页面 DOM 树的访问，就可以直接使用元素、属性和文本了。

元素节点

虽然会大量使用元素节点，但很多需要对元素执行的操作都是所有节点共有的方法和属性，而不是元素特有的方法和属性。元素只有两组专有的方法：

   1. 与属性处理有关的方法：

          * getAttribute(name) 返回名为 name 的属性值。

          * removeAttribute(name) 删除名为 name 的属性。

          * setAttribute(name, value) 创建一个名为 name 的属性并将其值设为 value。

          * getAttributeNode(name) 返回名为 name 的属性节点（属性节点在下一节介绍）。

          * removeAttributeNode(node) 删除与指定节点匹配的属性节点。

   2. 与查找嵌套元素有关的方法：

          * getElementsByTagName_r(elementName) 返回具有指定名称的元素节点列表。

处理属性

处理元素很简单，比如可用 document 对象和上述方法创建一个新的 img 元素：

var imgElement = document.create_rElement_x("img");

imgElement.setAttribute("src", "http://www.headfirstlabs.com/Images/hraj_cover-150.jpg");

imgElement.setAttribute("width", "130");

imgElement.setAttribute("height", "150");

bodyElement.a(imgElement);

现在看起来应该非常简单了。实际上，只要理解了节点的概念并知道有哪些方法可用，就会发现在 Web 页面和 JavaScript 代码中处理 DOM 非常简单。在上述代码中，JavaScript 创建了一个新的 img 元素，设置了一些属性然后添加到 HTML 页面的 body 元素中。

查找嵌套元素

发现嵌套的元素很容易。比如，下面的代码用于发现和删除清单 3 所示 HTML 页面中的所有 img 元素：

      // Remove all the top-level <img> elements in the body

      if (bodyElement.hasChildNodes()) {

        for (i=0; i<bodyElement.childNodes.length; i++) {

          var currentNode = bodyElement.childNodes[i];

          if (currentNode.nodeName.toLowerCase() == "img") {

            bodyElement.removeChild(currentNode);

          }

        }

      }

也可以使用 getElementsByTagName_r() 完成类似的功能：

属性节点

DOM 将属性表示成节点，可以通过元素的 attributes 来访问元素的属性.需要指出的是，attributes 属性实际上是对节点类型而非局限于元素类型来说的。有点古怪，不影响您编写代码，但是仍然有必要知道这一点。

虽然也能使用属性节点，但通常使用元素类的方法处理属性更简单。其中包括：

    * getAttribute(name) 返回名为 name 的属性值。

    * removeAttribute(name) 删除名为 name 的属性。

    * setAttribute(name, value) 创建一个名为 name 的属性并将其值设为 value。

这三个方法不需要直接处理属性节点。但允许使用简单的字符串属性设置和删除属性及其值。

文本节点

需要考虑的最后一种节点是文本节点（至少在处理 HTML DOM 树的时候如此）。基本上通常用于处理文本节点的所有属性都属于节点对象。实际上，一般使用 nodeValue 属性来访问文本节点的文本，少数其他几种方法是专门用于文本节点的。这些方法用于增加或分解节点中的数据：

    * appendData(text) 将提供的文本追加到文本节点的已有内容之后。

    * insertData(position, text) 允许在文本节点的中间插入数据。在指定的位置插入提供的文本。

    * replaceData(position, length, text) 从指定位置开始删除指定长度的字符，用提供的文本代替删除的文本。

什么节点类型？

到目前为止看到的多数代码都假设已经知道处理的节点是什么类型，但情况并非总是如此。比方说，如果在 DOM 树中导航并处理一般的节点类型，可能就不知道您遇到了元素还是文本。也许获得了 p 元素的所有孩子，但是不能确定处理的是文本、b 元素还是 img 元素。这种情况下，在进一步的处理之前需要确定是什么类型的节点。

所幸的是很容易就能做到。DOM 节点类型定义了一些常量，比如：

   1. Node.ELEMENT_NODE 是表示元素节点类型的常量。

   2. Node.ATTRIBUTE_NODE 是表示属性节点类型的常量。

   3. Node.TEXT_NODE 是表示文本节点类型的常量。

   4. Node.DOCUMENT_NODE 是表示文档节点类型的常量。

还有其他一些节点类型，但是对于 HTML 除了这四种以外很少用到。我有意没有给出这些常量的值，虽然 DOM 规范中定义了这些值，永远不要直接使用那些值，因为这正是常量的目的！

nodeType 属性

可使用 nodeType 属性比较节点和上述常量 —— 该属性定义在 DOM node 类型上因此可用于所有节点，得到节点的类型非常简单。更有挑战性的是知道节点的类型之后确定能做什么，只要掌握了节点、文本、属性和元素类型提供了什么属性和方法，就可以自己进行 DOM 编程了。

相关文章