简要说明ORACLE11GR2 RAC的进程启动流程:
1.启动流程概览图:
二。RAC启动流程的梳理:
第一层:OHASD 启动:(OHASD派生)
1.CSSDAGENT负责启动CSSD的AGENT.以root用户权限启动,负责启动CSSD进程。
2.ORAROOTAGENT负责启动“root"用户下的OHASD的资源的AGENT.
以 root 用户权限启动,负责启动以下这些守护进程:CRSD进程、CTSSD进程、DISKMON进程、ACFS进程。这些进程也都是以ROOT用户权限启动。
3.ORAAGENT 负责启动所用GRID用户的OHASD的资源的AGENT.
以GRID用户权限启动,负责MDNSD进程、GIPCD进程、gpnpd进程、EVMD进程、ASM进程
4.CSSDMONITOR - 监控 CSSD 以及节点健康(和 cssdagent 一起)。
以ROOT用户权限启动,负责CSSDMONITOR进程和启动。
第二层:
1.OHASD rootagent 启动:
CRSD -管理集群资源的主要后台进程。
CTSSD-CLUSTER TIME SYNCHRONIZATION SERVICES DAEMON
DISKMON
ACFS (ASM CLUSTER FILE SYSTEM)驱动。
2.OHASD ORAAGENT启动:
MDNSD-用来实现DNS查询
GIPCD-用来做节点间通信
GPNPD-GRID PLUG &PLAY PROFILE DAEMON
EVMD-EVENT MONITOR DAEMON
ASM-ASM资源
第三层:CRSD启动:
ORAROOTAGENT-负责启动所有ROOT用户下的CRSD资源的AGENT.
ORAAGENT-负责启动所有GRID用户下的CRSD资源的AGENT
第四层:CRSD rootagent启动
NETWORK RESOURCE-监控公共网络
SCAN VIP(S) -SINGLE CLIENT ACCESS NAME VIRTURAL IPS
NODE VIPS-每个节点1个
ACFS REGISTERY 挂载ASM CLUSTER FILE SYSTEM
GNS VIP(OPTIONAL)VIP FOR GNS
第四层: CRSD oraagent 启动:
ASM RESOURCE -ASM 资源
DISKGROUP -用来管理/监控ASM磁盘组
DB RESOURCE -用来管理/监控数据库和实例
SCAN LISTENER -SCAN监听,监听在SCAN VIP 上
Listener -节点监听,监听在NODE VIP上
SERVICES -用来管理/监听 SERVICES
ONS- ORACLE NOTIFICATION SERVICES
EONS-加强版 ORACLE NOTIFICATION SERVICE
GSD 为了向下兼容9I
GNS (OPTIONAL)-GRID NAMING SERVICE -处理域名解析
启动流程对应日志:
Clusterware 后台进程日志都放在”GRID_HOME”/log/”NODENAME”之下,结构如下:
/<GRID_HOME>/log/<NODENAME>/alert<NODENAME>.log
对于clusterware的问题,先检查这个文件
/<GRID_HOME>/log/<NODENAME>/ohasd
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oraagent_<GRIDUSER>
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oracssdagent_root
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oracssdmonitor_root
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/orarootagent_root
对应的 OHASD进程和其启动的子进程日志和PID
/<GRID_HOME>/log/<NODENAME>/crsd
/<GRID_HOME>/log/<NODENAME>/ctssd
/<GRID_HOME>/log/<NODENAME>/diskmon
对应 OHASD rootagent 启动的CRSD、CTSSD和Diskmon
/<GRID_HOME>/log/<NODENAME>/mdnsd
/<GRID_HOME>/log/<NODENAME>/gipcd
/<GRID_HOME>/log/<NODENAME>/gpnpd
/<GRID_HOME>/log/<NODENAME>/evmd
对应 OHASD oraagent 启动的MDNSD、GIPCD、GPNPD和EVMD
/<GRID_HOME>/log/<NODENAME>/agent/crsd/orarootagent_root
/<GRID_HOME>/log/<NODENAME>/agent/crsd/oraagent_<ORACLEUSER>
对应 CRSD 启动的orarootagent和oraagent
/<GRID_HOME>/log/<NODENAME>/cssd
对应 OHASD cssdagent 启动的CSSD
<GRID_HOME> 和 $ORACLE_BASE 目录下的 cfgtoollogs 目录存放了一些其它的重要日志
比如 rootcrs.pl 以及其它配置工具,比如 ASMCA 等等
ASM 日志存放在 $ORACLE_BASE/diag/asm/+asm/<ASM Instance Name>/trace
<GRID_HOME>/bin 目录下的 diagcollection.pl 可以自动收集重要的日志
以 root 用户执行它
Clusterware 资源状态检查:
使用root用户检查状态
su -
cd "$(su - grid -c 'echo $ORACLE_HOME')/bin"
./crsctl status resource -t
或者直接使用grid用户检查状态
su - grid
crsctl status resource -t
集群资源管理和维护命令简介:
srvctl 和 crsctl 可以用来管理集群资源
尽量使用 srvctl 来管理资源,当srvctl无法操作时,使用crsctl管理资源
使用俩命令的-h参数列出所有的可用操作选项
ocrconfig 可以用来管理维护OCR(Oracle Cluster Registry)或OLR(Oracle Local Registry)
诸如导入导出升级、基于备份的恢复和备份策略等
olsnodes 可以用来管理维护集群的节点信息,如查看集群信息、节点状态等
cluvfy 集群相关状态的检查和维护命令,该命令可以用来对集群状态进行巡检
主要有 comp 和 stage 两类用法
查看相应的帮助:cluvfy comp -help、cluvfy stage -help
可以实现诸如节点探测、共享存储可用性探测、集群安装前的系统或硬件检查等