在 DOM 树中,基本上一切都是节点。每个元素在最底层上都是 DOM 树中的节点。每个属性都是节点。每段文本都是节点。甚至注释、特殊字符(如版权符号 ©)、DOCTYPE 声明(如果 HTML 或者 XHTML 中有的话)全都是节点。因此在讨论这些具体的类型之前必须清楚地把握什么是节点。
用最简单的话说,节点就是 DMO 树中的任何事物。之所以用 “事物” 这个模糊的字眼,是因为只能明确到这个程度。比如 HTML 中的元素(如 img
)和 HTML 中的文本片段(如 “Scroll down for more details”)没有多少明显的相似之处。但这是因为您考虑的可能是每种类型的功能,关注的是它们的不同点。
DOM 代码中最常用的任务就是在页面的 DOM 树中导航。比方说,可以通过其 “id” 属性定位一个 form
,然后开始处理那个 form
中内嵌的元素和文本。其中可能包含文字说明、输入字段的标签、真正的 input
元素,以及其他
HTML 元素(如 img
)和链接(a
元素)。如果元素和文本是完全不同的类型,就必须为每种类型编写完全不同的代码。
DOM 节点的属性主要有:
-
nodeName
报告节点的名称。 -
nodeValue
提供节点的 “值”。 -
parentNode
返回节点的父节点。记住,每个元素、属性和文本都有一个父节点。 -
childNodes
是节点的孩子节点列表。对于 HTML,该列表仅对元素有意义,文本节点和属性节点都没有孩子。 -
firstChild
仅仅是childNodes
列表中第一个节点的快捷方式。 -
lastChild
是另一种快捷方式,表示childNodes
列表中的最后一个节点。 -
previousSibling
返回当前节点之前 的节点。换句话说,它返回当前节点的父节点的childNodes
列表中位于该节点前面的那个节点(如果感到迷惑,重新读前面一句)。 -
nextSibling
类似于previousSibling
属性,返回父节点的childNodes
列表中的下一个节点。 -
attributes
仅用于元素节点,返回元素的属性列表。
接下来看看所有节点都具有的方法(与节点属性一样,我省略了实际上不适用于多数 HTML DOM 操作的少数方法):
-
insertBefore(newChild, referenceNode)
将newChild
节点插入到referenceNode
之前。记住,应该对newChild
的目标父节点调用该方法。 -
replaceChild(newChild, oldChild)
用newChild
节点替换oldChild
节点。 -
removeChild(oldChild)
从运行该方法的节点中删除oldChild
节点。 -
a(newChild)
将newChild
添加到运行该函数的节点之中。newChild
被添加到目标节点孩子列表中的末端。 -
hasChildNodes()
在调用该方法的节点有孩子时则返回 true,否则返回 false。 -
hasAttributes()
在调用该方法的节点有属性时则返回 true,否则返回 false。
通用节点类型
多数 Web 应用程序中只用到四种节点类型:
* 文档节点表示整个 HTML 文档。
* 元素节点表示 HTML 元素,如 a 或 img。
* 属性节点表示 HTML 元素的属性,如 href(a 元素)或 src(img 元素)。
* 文本节点表示 HTML 文档中的文本,如 “Click on the link below for a complete set list”。这是出现在 p、a 或 h2 这些元素中的文字。
文档节点
基本上所有基于 DOM 的代码中都要用到的第一个节点类型是文档节点。文档节点 实际上并不是 HTML(或 XML)页面中的一个元素而是页面本身。因此在 HTML Web 页面中,文档节点就是整个 DOM 树。在 JavaScript 中,可以使用关键字 document 访问文档节点:
var myDocument = document;
var htmlElement = myDocument.documentElement;
JavaScript 中的 document 关键字返回当前网页的 DOM 树。从这里可以开始处理树中的所有节点。
也可使用 document 对象创建新节点,如下所示:
* createElement_x_x(elementName) 使用给定的名称创建一个元素。
* createTextNode(text) 使用提供的文本创建一个新的文本节点。
* createAttribute(attributeName) 用提供的名称创建一个新属性。
这里的关键在于这些方法创建节点,但是并没有将其附加或者插入到特定的文档中。因此,必须使用前面所述的方法如 insertBefore() 或 a() 来完成这一步。因此,可使用下面的代码创建新元素并将其添加到文档中:
var pElement = mydocument.create_rElement_x("p");
var text = mydocument.create_rTextNode("Here's some text in a p element.");
pElement.a(text);
bodyElement.a(pElement);
一旦使用 document 元素获得对 Web 页面 DOM 树的访问,就可以直接使用元素、属性和文本了。
元素节点
虽然会大量使用元素节点,但很多需要对元素执行的操作都是所有节点共有的方法和属性,而不是元素特有的方法和属性。元素只有两组专有的方法:
1. 与属性处理有关的方法:
* getAttribute(name) 返回名为 name 的属性值。
* removeAttribute(name) 删除名为 name 的属性。
* setAttribute(name, value) 创建一个名为 name 的属性并将其值设为 value。
* getAttributeNode(name) 返回名为 name 的属性节点(属性节点在 下一节 介绍)。
* removeAttributeNode(node) 删除与指定节点匹配的属性节点。
2. 与查找嵌套元素有关的方法:
* getElementsByTagName_r(elementName) 返回具有指定名称的元素节点列表。
处理属性
处理元素很简单,比如可用 document 对象和上述方法创建一个新的 img 元素:
var imgElement = document.create_rElement_x("img");
imgElement.setAttribute("src", "http://www.headfirstlabs.com/Images/hraj_cover-150.jpg");
imgElement.setAttribute("width", "130");
imgElement.setAttribute("height", "150");
bodyElement.a(imgElement);
现在看起来应该非常简单了。实际上,只要理解了节点的概念并知道有哪些方法可用,就会发现在 Web 页面和 JavaScript 代码中处理 DOM 非常简单。在上述代码中,JavaScript 创建了一个新的 img 元素,设置了一些属性然后添加到 HTML 页面的 body 元素中。
查找嵌套元素
发现嵌套的元素很容易。比如,下面的代码用于发现和删除 清单 3 所示 HTML 页面中的所有 img 元素:
// Remove all the top-level <img> elements in the body
if (bodyElement.hasChildNodes()) {
for (i=0; i<bodyElement.childNodes.length; i++) {
var currentNode = bodyElement.childNodes[i];
if (currentNode.nodeName.toLowerCase() == "img") {
bodyElement.removeChild(currentNode);
}
}
}
也可以使用 getElementsByTagName_r() 完成类似的功能:
属性节点
DOM 将属性表示成节点,可以通过元素的 attributes 来访问元素的属性.需要指出的是,attributes 属性实际上是对节点类型而非局限于元素类型来说的。有点古怪,不影响您编写代码,但是仍然有必要知道这一点。
虽然也能使用属性节点,但通常使用元素类的方法处理属性更简单。其中包括:
* getAttribute(name) 返回名为 name 的属性值。
* removeAttribute(name) 删除名为 name 的属性。
* setAttribute(name, value) 创建一个名为 name 的属性并将其值设为 value。
这三个方法不需要直接处理属性节点。但允许使用简单的字符串属性设置和删除属性及其值。
文本节点
需要考虑的最后一种节点是文本节点(至少在处理 HTML DOM 树的时候如此)。基本上通常用于处理文本节点的所有属性都属于节点对象。实际上,一般使用 nodeValue 属性来访问文本节点的文本,少数其他几种方法是专门用于文本节点的。这些方法用于增加或分解节点中的数据:
* appendData(text) 将提供的文本追加到文本节点的已有内容之后。
* insertData(position, text) 允许在文本节点的中间插入数据。在指定的位置插入提供的文本。
* replaceData(position, length, text) 从指定位置开始删除指定长度的字符,用提供的文本代替删除的文本。
什么节点类型?
到目前为止看到的多数代码都假设已经知道处理的节点是什么类型,但情况并非总是如此。比方说,如果在 DOM 树中导航并处理一般的节点类型,可能就不知道您遇到了元素还是文本。也许获得了 p 元素的所有孩子,但是不能确定处理的是文本、b 元素还是 img 元素。这种情况下,在进一步的处理之前需要确定是什么类型的节点。
所幸的是很容易就能做到。DOM 节点类型定义了一些常量,比如:
1. Node.ELEMENT_NODE 是表示元素节点类型的常量。
2. Node.ATTRIBUTE_NODE 是表示属性节点类型的常量。
3. Node.TEXT_NODE 是表示文本节点类型的常量。
4. Node.DOCUMENT_NODE 是表示文档节点类型的常量。
还有其他一些节点类型,但是对于 HTML 除了这四种以外很少用到。我有意没有给出这些常量的值,虽然 DOM 规范中定义了这些值,永远不要直接使用那些值,因为这正是常量的目的!
nodeType 属性
可使用 nodeType 属性比较节点和上述常量 —— 该属性定义在 DOM node 类型上因此可用于所有节点,得到节点的类型非常简单。更有挑战性的是知道节点的类型之后确定能做什么,只要掌握了节点、文本、属性和元素类型提供了什么属性和方法,就可以自己进行 DOM 编程了。