小菜学网络之DNS服务器工作原理

时间:2022-06-01 17:58:59

小菜学网络之DNS服务器工作原理

通过上节学习,我们初步掌握了域名系统的基本原理。通过域名访问网络服务时,需要先向 DNS 服务器查询域名对应的 IP 地址。那么,是不是所有域名都保存在一台服务器上呢?

答案肯定是否定的。全球现有的域名数量是一个天文数字,不是一两台服务器就能保存的。实际上,DNS 服务器分为很多角色,形成了一个等级深严的分布式体系。

本节,我们一起来扒一扒这背后的故事。

管理机构

 

全球域名的最高管理机构是 ICANN ( Internet Corporation for Assigned Names and Numbers ),它是一个总部位于美国加州的组织。ICANN 负责管理整个域名系统的运作,主要工作是规划 *域名 ( top level domain ,简写为 TLD )。

*域名是域名的第一级,可分为两种:

  • 通用*域 ,例如 .com 、 .net 、 .edu 、 .org 等等;
  • 国家地区*域 ,例如 .cn 、 .hk 、.jp 、 .us 等等;

ICANN 不会直接管理这些*域,因为*域名太多,根本管不过来。目前,全球*域名超过 1000 个,每个*域名下还有很多批发商和零售注册商,管起来太麻烦了。

因此,ICANN 为每个*域名都找一个托管商,来负责该域名下的所有事项。这样一来,ICANN 只需与托管商打交道,日子也就舒服多了。

举个例子,.cn 域名托管给 中国互联网络信息中心 ( CNNIC ),由它制定 .cn 域名的各种政策;而 .com 域名则托管给 VeriSign 公司。

小菜学网络之DNS服务器工作原理

这样看来,ICANN 控制着 根域名 ( root domain )的控制权:

  • 一方面,它决定着根域下有多少子节点,即*域名;
  • 另一方面,它决定每个*域名的托管商;

根服务器

 

理论上,查询任何域名都需要先查询 ICANN 的根域。因为只有根域才能知道:某个域由谁托管,服务器是哪些。事实上也确实如此,ICANN 维护着一张映射表,记录了每个*域名和对应的托管商。

举个例子,查询 www.fasionchan.com 这个域名时,我们需要先查询 ICANN 的映射表。它会告诉我 .com 域名由 VeriSign 托管,所以我必须去找 VeriSign ,而 VeriSign 会告诉我查询 fasionchan.com 又该找谁。

ICANN 维护的这个根域名列表,叫做 DNS根区 ( DNS root zone )。ICANN 官网提供了根区相关信息,包括根区文件。根区文件保存着所有*域名的托管信息,所以非常大,超过 2MB 。

以 .com 这个*域为例,从根区可以查询到 13 个域名服务器:

  1. com.            172800  IN  NS  b.gtld-servers.net. 
  2. com.            172800  IN  NS  g.gtld-servers.net. 
  3. com.            172800  IN  NS  f.gtld-servers.net. 
  4. com.            172800  IN  NS  e.gtld-servers.net. 
  5. com.            172800  IN  NS  c.gtld-servers.net. 
  6. com.            172800  IN  NS  j.gtld-servers.net. 
  7. com.            172800  IN  NS  k.gtld-servers.net. 
  8. com.            172800  IN  NS  a.gtld-servers.net. 
  9. com.            172800  IN  NS  i.gtld-servers.net. 
  10. com.            172800  IN  NS  m.gtld-servers.net. 
  11. com.            172800  IN  NS  d.gtld-servers.net. 
  12. com.            172800  IN  NS  h.gtld-servers.net. 
  13. com.            172800  IN  NS  l.gtld-servers.net. 

也就是说, .com 结尾的域名可以到这 13 台服务器中的任一台去查询,比如 a.gtld-servers.net 。

我们注意到,这 13 台服务器还是以域名的形式提供的。换句话讲,我们必须先通过域名,找到 .com 服务器的 IP 地址。但是,这样不就造成循环查询了吗?

为此,DNS 根区还会同时提供这些服务器的 IP 地址,包括 IPv4 和 IPv6 两个版本:

  1. a.gtld-servers.net. 172800  IN  A   192.5.6.30 
  2. b.gtld-servers.net. 172800  IN  A   192.33.14.30 
  3. ... 
  4. m.gtld-servers.net. 172800  IN  A   192.55.83.30 
  5. a.gtld-servers.net. 172800  IN  AAAA    2001:503:a83e::2:30 
  6. b.gtld-servers.net. 172800  IN  AAAA    2001:503:231d::2:30 
  7. ... 
  8. m.gtld-servers.net. 172800  IN  AAAA    2001:501:b1f9::30 

那 DNS 根区列表保存在哪里呢?答案是 根域名服务器 ( root name server )。

早年间,全世界只有 13 台根域名服务器,编号从 a.root-servers.net 到 m.root-servers.net 。因为早期的 DNS 查询结果是通过一个 512 字节的 UDP 数据报来传输的,它最多只能容纳 13 个服务器地址。

根域名服务器列表可在 root-servers.org 上查询。

这 13 台根域名服务器,由 12 个独立的组织独立运营。其中,A 和 J 这两台是由 VeriSign 公司管理的。每个运营组织为了保证可用性,会部署很多个节点。单单根服务器 A 就部署了 16 个节点,分布在世界各地。

虽然每个根服务器都部署了多个节点,但他们的 IP 地址都是一样的。拿根服务器 A 来说,它的 16 个节点,IP 地址都是 198.41.0.4 。这也太神奇了吧!这么多节点共用一个 IP 地址,难道不会冲突吗?

得益于 Anycast 路由技术,分散在不同地理位置的多台服务器,可以使用相同的 IP 地址。当发送方向这个 IP 地址发送数据时,路由协议会自动选择一个最近的节点。Anycast 路由技术先按下不表,后续有机会再展开介绍。

这意味着全球只有 13 台根域名服务器,对应的 IP 地址也只有 13 个,执行 dig 命令即可获得:

  1. root@netbox [ ~ ]  ➜ dig . NS 
  2.  
  3. ; <<>> DiG 9.16.1-Ubuntu <<>> @10.2.66.66 . NS 
  4. ; (1 server found) 
  5. ;; global options: +cmd 
  6. ;; Got answer: 
  7. ;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 42791 
  8. ;; flags: qr rd ra; QUERY: 1, ANSWER: 13, AUTHORITY: 0, ADDITIONAL: 8 
  9.  
  10. ;; OPT PSEUDOSECTION: 
  11. ; EDNS: version: 0, flags:; udp: 4000 
  12. ;; QUESTION SECTION
  13. ;.              IN  NS 
  14.  
  15. ;; ANSWER SECTION
  16. .           1700    IN  NS  k.root-servers.net. 
  17. .           1700    IN  NS  m.root-servers.net. 
  18. .           1700    IN  NS  l.root-servers.net. 
  19. .           1700    IN  NS  b.root-servers.net. 
  20. .           1700    IN  NS  g.root-servers.net. 
  21. .           1700    IN  NS  f.root-servers.net. 
  22. .           1700    IN  NS  d.root-servers.net. 
  23. .           1700    IN  NS  e.root-servers.net. 
  24. .           1700    IN  NS  i.root-servers.net. 
  25. .           1700    IN  NS  a.root-servers.net. 
  26. .           1700    IN  NS  h.root-servers.net. 
  27. .           1700    IN  NS  j.root-servers.net. 
  28. .           1700    IN  NS  c.root-servers.net. 
  29.  
  30. ;; ADDITIONAL SECTION
  31. k.root-servers.net. 3282    IN  A   193.0.14.129 
  32. g.root-servers.net. 2845    IN  A   192.112.36.4 
  33. d.root-servers.net. 118 IN  A   199.7.91.13 
  34. e.root-servers.net. 494 IN  A   192.203.230.10 
  35. a.root-servers.net. 1771    IN  A   198.41.0.4 
  36. j.root-servers.net. 3197    IN  A   192.58.128.30 
  37. c.root-servers.net. 1830    IN  A   192.33.4.12 
  38.  
  39. ;; Query time: 14 msec 
  40. ;; SERVER: 10.2.66.66#53(10.2.66.66) 
  41. ;; WHEN: Thu Apr 08 09:01:17 CST 2021 
  42. ;; MSG SIZE  rcvd: 364 

迭代查询

 

当我们查询一个域名时,必须从根服务器开始,逐层查询,这就是所谓的 迭代查询 ( iterative query )。

小菜学网络之DNS服务器工作原理

如上图,当我们查询一个域名,例如 www.fasionchan.com 时:

先查询 根域名服务器 ;

  • 根域名服务器就 13 台,IP 大家都知道,极少改动;
  • 根域名服务器保存根区列表,列表包含*域名的托管商,以及相关服务器信息;
  • 根域名服务器根据根区列表,告诉我们 .com *域应该找谁查询;

根据根服务器返回结果,继续查询负责 .com 解析的服务器,一般叫做 *域名服务器 ;

  • 主域名 fasionchan.com 注册后,需要将负责该域名解析的服务器,登记在 .com *域名服务器上;
  • .com *域名服务器根据这个信息,告诉我们 fasionchan.com 这个域名应该找谁查询;

根据*域名服务器返回结果,继续查询负责 fasionchan.com 解析的服务器,一般叫做 权威域名服务器 ;

  • fasionchan.com 子域信息一般都登记在权威服务器上;
  • 权威服务器取出 www.fasionchan.com 对应记录,并返回给我们,查询结束;
  • 如果某个子域由其他权威服务器负责,我们还需要继续迭代,直到查询完毕;

无论查询什么域名,都需要先查根域名服务器。这样的话,根服务器不会压力太大了吗?

其实完全不用担心。因为保存在根服务器上的根区列表一般很少改变,因此客户端可以将它缓存起来,以此降低根服务器的查询压力。

缓存服务器

 

实际上,客户端一般不自己进行迭代解析,而是通过本地的 递归解析器 。以访问网站 www.fasionchan.com 为例:

小菜学网络之DNS服务器工作原理

  1. 客户端向本地的递归解析器查询域名 www.fasionchan.com ;
  2. 递归解析器向根域名服务器查询域名 www.fasionchan.com ;
  3. 根域名服务器告诉递归解析器,应该去找 .com 的*域名服务器;
  4. 递归解析器向*域名服务器查询域名 www.fasionchan.com ;
  5. *域名服务器告诉递归解析器,应该去找 fasionchan.com 的权威域名服务器;
  6. 递归解析器向权威域名服务器查询域名 www.fasionchan.com ;
  7. 权威服务器向递归解析器返回结果;
  8. 递归解析器向客户端返回结果;
  9. 客户端拿到域名对应的 IP 地址后,即可向该 Web 服务器发起请求;
  10. Web 服务器处理请求后,向客户端返回结果;

注意到,递归解析器需要从根服务器开始,逐层查询,这个过程是 迭代解析 。迭代解析最显著的特征在于,如果服务器没有关于待查域名的结果,它会告诉客户端应该去哪里查询,根服务器就是典型的例子。

递归解析器就不一样了。当它收到未知域名的查询请求后,它会替客户端向其他 DNS 服务器发起请求,然后再把结果返回给客户端,这个过程就叫 递归解析 ( recursive query )。

递归解析对客户端来说是完全透明的,客户端完全不用关心递归解析器背后的其他 DNS 服务器。

此外,递归解析器还会将查询结果在本地缓存起来。当域名再次被查询时,它可直接返回缓存结果,无须重新查询其他 DNS 服务器。正因如此,递归解析器通常被称为 DNS缓存服务器 。

那么,客户端主机如何配置 DNS 缓存服务器呢?以 Linux 系统为例,只需编辑 /etc/resolv.conf 配置文件:

  1. root@netbox [ ~ ]  ➜ cat /etc/resolv.conf 
  2. # This file is included on the metadata iso 
  3. nameserver 192.168.65.1 

关键字 nameserver 后面跟 DNS 缓存服务器地址,可以写多行配置多个 DNS 缓存服务器,以达到冗余效果。

原文地址:https://mp.weixin.qq.com/s/jXo36_jPiXSS7B3KGQZkcA