vmware平台下两次网络不通的诡异事件

时间:2024-01-17 13:13:02

  首先表明以下两种情况确实很少见,也可以说确实非常奇怪,无法定位原因由于机缘巧合确实出现了,虽然本文没有找到根因,但是希望能帮遇到类似问题的同学一点思绪。

RouteOS内网网卡不可用

  首先强调下RouteOS在vmware中,网卡如果工作在桥接模式,并且要启用RouteOS的VRRP服务,那么ESXI网卡的工作模式必须设置为Promiscuous Mode(混杂模式)和Forged Transmits(伪传输)这两个必须都为开启状态,否则VRRP服务将无法正常启动。
  在配置VRRP并成功运行了一段时间后,突然发现RouteOS其中的一块网卡不能ping通其他地址了,但是其他地址ping此台RouteOS的地址却是正常的,尝试过关机重启,但是仍未恢复,最终在经过客户同意后将此台RouteOS上所有的路由以及策略禁用,发现测试通网段地址可以通了,第一时间判断可能是错误的策略导致,但是有相同配置的RouteOS却是正常的,而且当最后将所有的路由以及策略启动后,发现该RouteOS仍然是正常状态,真是活久见。

CentOS7.5无法ping通网关

  今天又遇到了一个非常奇怪的现象,一台CentOS7云主机无法ping通网关,而且是突然出现的,客户收到报警后联系我们进行排查,发现同网段其他云主机正常,只有这一台有问题,表现为:

  • 该云主机ping网关不通;
  • 该云主机ping同网段其他云主机正常;
  • 同网段云主机ping网关以及同网段其他云主机正常;
  • 此问题是突然出现,出现前网络无调整,云主机无配置变更;
  • 查看云主机在故障时间段无错误日志。

排查思路

  1. 首先确认是否故障前是否存在人为操作,以及当前是否可以重启服务器(第一时间恢复业务才是重中之重,业务恢复后在开始排查原因,虽然最后确认了此问题无解)。
  2. 确认了网卡没有配置变更,并且在重启服务器后仍未恢复(问题开始变得棘手)。
  3. 查看该云主机是否可以学习到网关的MAC地址,发现这台云主机并不能学习到网关的MAC地址。
  4. 使用arp -s gateway.ip gateway.mac命令配置静态MAC地址,配置后发现可以通,确认了是无法学习到MAC地址导致。
  5. 使用这种方法不是长久之计,毕竟不能每次重启都配置静态MAC,虽然可以写rc.local配置文件,但是这并不是我和客户想要的。
  6. 克隆该云主机并新建同网段测试机,发现配置IP后到网关都没问题。
  7. 将此台云主机IP地址更改为其他地址,确认是否是该IP地址出现问题,并将测试机地址配置成不通的IP地址,发现配置后都正常。
  8. 将云主机地址更改回最初地址,使用arping测试发现可以学习到网关的MAC地址了,问题解决了。

总之是很无解的一件事情,子不语怪力乱神,但是还是要吐槽下,谁让这事情都让我碰到了呢!