HTML DOM节点

时间:2023-11-22 11:11:50

在 DOM 树中,基本上一切都是节点。每个元素在最底层上都是 DOM 树中的节点。每个属性都是节点。每段文本都是节点。甚至注释、特殊字符(如版权符号 ©)、DOCTYPE 声明(如果 HTML 或者 XHTML 中有的话)全都是节点。因此在讨论这些具体的类型之前必须清楚地把握什么是节点。

节点是……

用最简单的话说,节点就是 DMO 树中的任何事物。之所以用 “事物” 这个模糊的字眼,是因为只能明确到这个程度。比如 HTML 中的元素(如 img)和 HTML 中的文本片段(如 “Scroll down for more details”)没有多少明显的相似之处。但这是因为您考虑的可能是每种类型的功能,关注的是它们的不同点。

通用节点类型

DOM 代码中最常用的任务就是在页面的 DOM 树中导航。比方说,可以通过其 “id” 属性定位一个 form,然后开始处理那个 form 中内嵌的元素和文本。其中可能包含文字说明、输入字段的标签、真正的 input 元素,以及其他
HTML 元素(如 img)和链接(a 元素)。如果元素和文本是完全不同的类型,就必须为每种类型编写完全不同的代码。

DOM 节点的属性主要有:

  • nodeName 报告节点的名称。
  • nodeValue 提供节点的 “值”。
  • parentNode 返回节点的父节点。记住,每个元素、属性和文本都有一个父节点。
  • childNodes 是节点的孩子节点列表。对于 HTML,该列表仅对元素有意义,文本节点和属性节点都没有孩子。
  • firstChild 仅仅是 childNodes 列表中第一个节点的快捷方式。
  • lastChild 是另一种快捷方式,表示 childNodes 列表中的最后一个节点。
  • previousSibling 返回当前节点之前 的节点。换句话说,它返回当前节点的父节点的 childNodes 列表中位于该节点前面的那个节点(如果感到迷惑,重新读前面一句)。
  • nextSibling 类似于 previousSibling 属性,返回父节点的 childNodes 列表中的下一个节点。
  • attributes 仅用于元素节点,返回元素的属性列表。

接下来看看所有节点都具有的方法(与节点属性一样,我省略了实际上不适用于多数 HTML DOM 操作的少数方法):

  • insertBefore(newChild, referenceNode) 将 newChild 节点插入到 referenceNode 之前。记住,应该对newChild 的目标父节点调用该方法。
  • replaceChild(newChild, oldChild) 用 newChild 节点替换 oldChild 节点。
  • removeChild(oldChild) 从运行该方法的节点中删除 oldChild 节点。
  • a(newChild) 将 newChild 添加到运行该函数的节点之中。newChild 被添加到目标节点孩子列表中的末端
  • hasChildNodes() 在调用该方法的节点有孩子时则返回 true,否则返回 false。
  • hasAttributes() 在调用该方法的节点有属性时则返回 true,否则返回 false。

通用节点类型



多数 Web 应用程序中只用到四种节点类型:



    * 文档节点表示整个 HTML 文档。

    * 元素节点表示 HTML 元素,如 a 或 img。

    * 属性节点表示 HTML 元素的属性,如 href(a 元素)或 src(img 元素)。

    * 文本节点表示 HTML 文档中的文本,如 “Click on the link below for a complete set list”。这是出现在 p、a 或 h2 这些元素中的文字。



文档节点



基本上所有基于 DOM 的代码中都要用到的第一个节点类型是文档节点。文档节点 实际上并不是 HTML(或 XML)页面中的一个元素而是页面本身。因此在 HTML Web 页面中,文档节点就是整个 DOM 树。在 JavaScript 中,可以使用关键字 document 访问文档节点:

var myDocument = document;

var htmlElement = myDocument.documentElement;



JavaScript 中的 document 关键字返回当前网页的 DOM 树。从这里可以开始处理树中的所有节点。

也可使用 document 对象创建新节点,如下所示:

    * createElement_x_x(elementName) 使用给定的名称创建一个元素。

    * createTextNode(text) 使用提供的文本创建一个新的文本节点。

    * createAttribute(attributeName) 用提供的名称创建一个新属性。



这里的关键在于这些方法创建节点,但是并没有将其附加或者插入到特定的文档中。因此,必须使用前面所述的方法如 insertBefore() 或 a() 来完成这一步。因此,可使用下面的代码创建新元素并将其添加到文档中:



var pElement = mydocument.create_rElement_x("p");

var text = mydocument.create_rTextNode("Here's some text in a p element.");

pElement.a(text);

bodyElement.a(pElement);





一旦使用 document 元素获得对 Web 页面 DOM 树的访问,就可以直接使用元素、属性和文本了。



元素节点



虽然会大量使用元素节点,但很多需要对元素执行的操作都是所有节点共有的方法和属性,而不是元素特有的方法和属性。元素只有两组专有的方法:



   1. 与属性处理有关的方法:

          * getAttribute(name) 返回名为 name 的属性值。

          * removeAttribute(name) 删除名为 name 的属性。

          * setAttribute(name, value) 创建一个名为 name 的属性并将其值设为 value。

          * getAttributeNode(name) 返回名为 name 的属性节点(属性节点在 下一节 介绍)。

          * removeAttributeNode(node) 删除与指定节点匹配的属性节点。

   2. 与查找嵌套元素有关的方法:

          * getElementsByTagName_r(elementName) 返回具有指定名称的元素节点列表。



处理属性



处理元素很简单,比如可用 document 对象和上述方法创建一个新的 img 元素:



var imgElement = document.create_rElement_x("img");

imgElement.setAttribute("src", "http://www.headfirstlabs.com/Images/hraj_cover-150.jpg");

imgElement.setAttribute("width", "130");

imgElement.setAttribute("height", "150");

bodyElement.a(imgElement);





现在看起来应该非常简单了。实际上,只要理解了节点的概念并知道有哪些方法可用,就会发现在 Web 页面和 JavaScript 代码中处理 DOM 非常简单。在上述代码中,JavaScript 创建了一个新的 img 元素,设置了一些属性然后添加到 HTML 页面的 body 元素中。



查找嵌套元素



发现嵌套的元素很容易。比如,下面的代码用于发现和删除 清单 3 所示 HTML 页面中的所有 img 元素:



      // Remove all the top-level <img> elements in the body

      if (bodyElement.hasChildNodes()) {

        for (i=0; i<bodyElement.childNodes.length; i++) {

          var currentNode = bodyElement.childNodes[i];

          if (currentNode.nodeName.toLowerCase() == "img") {

            bodyElement.removeChild(currentNode);

          }

        }

      }



也可以使用 getElementsByTagName_r() 完成类似的功能:



属性节点



DOM 将属性表示成节点,可以通过元素的 attributes 来访问元素的属性.需要指出的是,attributes 属性实际上是对节点类型而非局限于元素类型来说的。有点古怪,不影响您编写代码,但是仍然有必要知道这一点。



虽然也能使用属性节点,但通常使用元素类的方法处理属性更简单。其中包括:



    * getAttribute(name) 返回名为 name 的属性值。

    * removeAttribute(name) 删除名为 name 的属性。

    * setAttribute(name, value) 创建一个名为 name 的属性并将其值设为 value。



这三个方法不需要直接处理属性节点。但允许使用简单的字符串属性设置和删除属性及其值。





文本节点



需要考虑的最后一种节点是文本节点(至少在处理 HTML DOM 树的时候如此)。基本上通常用于处理文本节点的所有属性都属于节点对象。实际上,一般使用 nodeValue 属性来访问文本节点的文本,少数其他几种方法是专门用于文本节点的。这些方法用于增加或分解节点中的数据:



    * appendData(text) 将提供的文本追加到文本节点的已有内容之后。

    * insertData(position, text) 允许在文本节点的中间插入数据。在指定的位置插入提供的文本。

    * replaceData(position, length, text) 从指定位置开始删除指定长度的字符,用提供的文本代替删除的文本。

什么节点类型?



到目前为止看到的多数代码都假设已经知道处理的节点是什么类型,但情况并非总是如此。比方说,如果在 DOM 树中导航并处理一般的节点类型,可能就不知道您遇到了元素还是文本。也许获得了 p 元素的所有孩子,但是不能确定处理的是文本、b 元素还是 img 元素。这种情况下,在进一步的处理之前需要确定是什么类型的节点。



所幸的是很容易就能做到。DOM 节点类型定义了一些常量,比如:



   1. Node.ELEMENT_NODE 是表示元素节点类型的常量。

   2. Node.ATTRIBUTE_NODE 是表示属性节点类型的常量。

   3. Node.TEXT_NODE 是表示文本节点类型的常量。

   4. Node.DOCUMENT_NODE 是表示文档节点类型的常量。



还有其他一些节点类型,但是对于 HTML 除了这四种以外很少用到。我有意没有给出这些常量的值,虽然 DOM 规范中定义了这些值,永远不要直接使用那些值,因为这正是常量的目的!



nodeType 属性



可使用 nodeType 属性比较节点和上述常量 —— 该属性定义在 DOM node 类型上因此可用于所有节点,得到节点的类型非常简单。更有挑战性的是知道节点的类型之后确定能做什么,只要掌握了节点、文本、属性和元素类型提供了什么属性和方法,就可以自己进行 DOM 编程了。