FusionCompute日常故障维护

时间:2024-03-27 08:33:52


本章内容主要是对FC的维护以及出现故障时的处理方式介绍
内容上,针对重点列出来,常规操作就不一一列出了。(多图警告)

日常维护

日常监控

一方面对系统,可以查看系统告警。另一方面对机房环境,服务器等设备运行情况也要进行周期性检查。
FusionCompute日常故障维护
FusionCompute告警分为4个等级:紧急重要次要提示。在有告警时,先处理高级别告警,再处理低级别告警

在FC的界面上,管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运行状态。

配置管理

在FusionCompute系统管理中,可以查看任务与日志,可以修改系统权限、系统配置、业务配置、第三方对接和网络变更
管理员根据需求可以对FC系统配置参数做出相应调整,具体可调整内容如下。
FusionCompute日常故障维护

在“任务与日志”->“任务中心”当中可以查看操作任务的进度。
FusionCompute日常故障维护

用户管理

FC有两种登录模式

普通模式
admin/[email protected]!
具有系统管理员权限

三员分立模式
系统管理员:仅具有系统业务操作维护权限,以及创建、删除用户的权限
sysadmin/Sysadmin#
安全管理员:仅具有用户、角色的权限管理权,但不能创建用户
secadmin/Secadmin#
安全审计员:仅有日志查看和日志导出权限,用于对其他用户的操作进行审查
secauditor/Secauditor#
(上述登录使用的账号密码,具体根据所使用的版本结合产品文档自行确认。仅供参考)
(注意点:登录模式的选择,在安装FC时制定,一旦选择,无法修改。)

FusionCompute账户分为:本地用户、域用户、接口对接用户。
本地用户用于登录、管理系统;
在配置域后可用域用户登录系统;
接口对接用户用于其他用户对接

FusionCompute备份与恢复

作用:为了保证出现意料之外的情况下数据可以恢复,在对系统进行重大操作前(比如升级、数据调整),需要提前对VRM节点数据进行备份。
几个点:
FC支持自动备份手动备份两种备份方式
系统默认在每日凌晨02:00自动进行备份
默认每月1日做一次月备份,备份文件保存两份(本月1日和上月1日)
备份文件数超过最多保存数时,会自动清理创建时间最早的文件
若有第三方备份服务器,在完成本地备份后,会自动上传备份文件至第三方服务器

故障处理

主机和集群故障处理

结合创建集群并为集群添加主机的过程来思考,可以把主机和集群的故障分为以下几种可能:
站点故障、集群故障、主机故障、系统接口故障

站点、集群故障:不能使用FC,不能创建、修改、移除集群,集群配置故障

可能原因:-网络异常-VRM节点异常-站点配置异常-集群配置异常
FusionCompute日常故障维护

主机故障:不能添加、修改、移除主机,主机配置故障

可能原因:网络异常-代理服务异常-系统异常
FusionCompute日常故障维护

系统接口故障:网口绑定异常,业务管理接口异常,存储接口异常

可能原因:网络异常,主机异常,VRM异常
FusionCompute日常故障维护

存储故障处理

存储池可能涉及到的故障点:存储资源,存储设备,数据存储,虚拟磁盘故障。

存储资源和存储设备故障:不能添加、修改、删除存储资源,不能关联存储资源,扫描不到存储设备

可能原因:存储网络链路异常,对端存储设备异常,主机存储接口异常
FusionCompute日常故障维护

数据存储故障:不能添加、修改、移除数据存储,关联、解关联主机异常,数据存储异常

可能原因:
CNA节点与存储设备的网络连接故障。
CNA节点上虚拟化的本地存储文件系统损坏。
CNA节点上NAS共享存储文件系统损坏。
CNA节点上虚拟化的共享存储文件系统损坏。
存储设备的磁盘损坏。
CNA节点上的本地磁盘损坏。
CNA节点上的SAN存储被格式化成gpt分区。
FusionCompute日常故障维护

虚拟磁盘故障:不能创建、绑定、解绑定、删除虚拟磁盘,调整容量异常,快照异常,磁盘迁移异常

可能原因:数据存储异常,磁盘类型限制,磁盘配置模式设置,虚拟机状态限制
FusionCompute日常故障维护
存储资源裸设备映射不支持扩容

网络故障处理

网络可能涉及的故障点:分布式交换机故障,上行链路故障,VLAN池故障,端口组故障,子网故障(可以概括为虚拟机之间通讯故障,虚拟机与外网通讯故障)

虚拟机之间通讯故障:同一主机内虚拟机通信异常,不同主机内虚拟机通信异常

可能原因:端口组配置异常,分布式交换机异常,VLAN池异常,子网异常……
FusionCompute日常故障维护

虚拟机与外网之间通讯故障:虚拟机不能访问外网,或者访问慢

可能原因:上行链路异常,主机网络服务异常,外部交换机配置异常,硬件故障
FusionCompute日常故障维护

虚拟机和模板故障处理

先回忆一下虚拟机创建方式和流程

创建方式:直接创建虚拟机、使用模板创建虚拟机、克隆虚拟机
创建流程:选择创建位置->设置虚拟机属性->配置网卡磁盘->完成创建

故障点:创建、调整、回收虚拟机故障,模板转换、部署、导入导出、管理故障。

我们可以参考上述流程逐一检查:
虚拟机OS不兼容
计算资源限制
网络资源限制
存储资源限制
外部共享目录访问异常

FusionCompute日常故障维护