alwayson监控

时间:2021-09-13 04:07:48

最近大体自己写了点alwayson相关的监控,是通过存储过程的方法,做个笔记如下:

--alwayson启用状态
declare @isenabled sql_variant
SELECT @isenabled=SERVERPROPERTY ( 'IsHadrEnabled' )
if @isenabled=1
begin
print 'is enabled(alwayson启用状态)'
end
---------监控集群的状态
if exists(SELECT * FROM sys.dm_hadr_cluster_members where member_state <>1)
begin
print 'alwayson集群有拖机机器,请查看'
end
------------监控副本同步状态
if exists(select * from sys.dm_hadr_availability_replica_states where synchronization_health<>2)
begin
print 'alwayson集群同步异常,请查看'
end
---------------监控数据库同步状态
if exists(select * from sys.dm_hadr_database_replica_states where synchronization_state_desc NOT IN('SYNCHRONIZED','SYNCHRONIZED'))
begin
print 'alwayson有数据库同步异常,请查看'
end
if exists( select * from sys.dm_tcp_listener_states where state_desc not in('ONLINE'))
begin
print 'alwayson侦听器异常,请查看'
end
-----------------主从延迟的监控 IF EXISTS(
SELECT ag.name AS ag_name, ar.replica_server_name AS ag_replica_server, dr_state.database_id as database_id,
dr_state.log_send_queue_size, is_ag_replica_local = CASE
WHEN ar_state.is_local = 1 THEN N'LOCAL'
ELSE 'REMOTE'
END ,
ag_replica_role = CASE
WHEN ar_state.role_desc IS NULL THEN N'DISCONNECTED'
ELSE ar_state.role_desc
END
FROM (( sys.availability_groups AS ag JOIN sys.availability_replicas AS ar ON ag.group_id = ar.group_id )
JOIN sys.dm_hadr_availability_replica_states AS ar_state ON ar.replica_id = ar_state.replica_id)
JOIN sys.dm_hadr_database_replica_states dr_state on
ag.group_id = dr_state.group_id and dr_state.replica_id = ar_state.replica_id where dr_state.log_send_queue_size>300
)
begin
print 'alwayson主体有超过300M的日志没有同步,请尽快查看'
end if exists(
SELECT ag.name AS ag_name, ar.replica_server_name AS ag_replica_server, dr_state.database_id as database_id,
dr_state.redo_queue_size, is_ag_replica_local = CASE
WHEN ar_state.is_local = 1 THEN N'LOCAL'
ELSE 'REMOTE'
END ,
ag_replica_role = CASE
WHEN ar_state.role_desc IS NULL THEN N'DISCONNECTED'
ELSE ar_state.role_desc
END
FROM (( sys.availability_groups AS ag JOIN sys.availability_replicas AS ar ON ag.group_id = ar.group_id )
JOIN sys.dm_hadr_availability_replica_states AS ar_state ON ar.replica_id = ar_state.replica_id)
JOIN sys.dm_hadr_database_replica_states dr_state on
ag.group_id = dr_state.group_id and dr_state.replica_id = ar_state.replica_id where dr_state.redo_queue_size>300
)
begin
print 'alwayson副本有较多日志未重做,请登录查看'
end
---------------主从状态切换等监控
DECLARE @MASTER VARCHAR(20)
--select @MASTER=a.replica_server_name,a.join_state,a.join_state_desc,b.is_local ,b.role,b.role_desc from sys.dm_hadr_availability_replica_cluster_states a join sys.dm_hadr_availability_replica_states b
--on a.replica_id=b.replica_id where b.role=1 --and a.replica_server_name='ALWAYSON241'
select @MASTER=a.replica_server_name from sys.dm_hadr_availability_replica_cluster_states a join sys.dm_hadr_availability_replica_states b
on a.replica_id=b.replica_id where b.role=1 --and a.replica_server_name='ALWAYSON241'
print @MASTER
IF @MASTER IS NULL
BEGIN
PRINT '主从同步异常'
END
ELSE IF @MASTER<>'ALWAYSON241'
BEGIN
PRINT 'alwayson进行了切换,现在主库是'+@master
END
------------------------监控alwayson数据库状态
if exists(select * from sys.dm_hadr_database_replica_states a where a.database_state<>0 or a.synchronization_state not in(1,2))
begin
print 'alwayson有数据库异常'
end -----------发邮件预警
----declare @name nvarchar(222)
----declare @mailbody nvarchar(4000);
----declare @maillabel nvarchar(100);
----set @maillabel='作业失败'
--EXEC msdb.dbo.sp_send_dbmail @profile_name = 'sendmail',
-- @recipients = '729975475@qq.com',
-- @subject = 'alwayson预警',
-- @body = 'alwayson故障

于alwayson相关的系统视图主要涉及以下一些(这些系统的存储过程能让我们很直观的了解到我们可用性组的状态):

--监控alwayson可用性管理器是否启动
SELECT SERVERPROPERTY ( 'HadrManagerStatus' )
--监控alwayson可用性组是否启动
SELECT SERVERPROPERTY ( 'IsHadrEnabled' )
--查看服务器的集群信息
SELECT * FROM sys.dm_hadr_cluster
SELECT * FROM sys.dm_hadr_cluster_members
select * from sys.dm_hadr_availability_replica_cluster_nodes
SELECT * FROM sys.dm_hadr_name_id_map -----------------------------------------------
SELECT * FROM sys.availability_groups
SELECT * FROM sys.availability_groups_cluster
SELECT * FROM sys.dm_hadr_availability_group_states --监控可用性副本
select * from sys.availability_replicas
--查看只读路由
select * from sys.availability_read_only_routing_lists
---监控可用性副本状态
select * from sys.dm_hadr_availability_replica_cluster_states
select * from sys.dm_hadr_availability_replica_states --synchronization_health的状态为2才算正常。需要监控
--监视可用性数据库
select * from sys.availability_databases_cluster
select * from sys.databases where name in(select database_name from sys.availability_databases_cluster)
--该视图包含对应于给定主/辅助数据库上最新自动页修复尝试的行,每个数据库最多可对应 100 行,如果存储数据就要手动查看
select * from sys.dm_hadr_auto_page_repair
--除了已同步和为同步的alwayson的状态
select * from sys.dm_hadr_database_replica_states where synchronization_state_desc NOT IN('SYNCHRONIZED','SYNCHRONIZED') -------------------------监视可用性组侦听器的监控
select * from sys.availability_group_listener_ip_addresses where state_desc='ONLINE'
select * from sys.availability_group_listeners
-----我们可以用 NOT EXISTS来判断
select dns_name,port,ip_address from sys.availability_group_listener_ip_addresses A JOIN sys.availability_group_listeners B
ON a.listener_id=b.listener_id where a.state_desc='ONLINE' ---------------------------------------
select * from sys.dm_tcp_listener_states where state_desc not in('ONLINE')

alwayson监控的更多相关文章

  1. &lbrack;AlwaysOn Availability Groups&rsqb;AG排查和监控指南

    AG排查和监控指南 1. 排查场景 如下表包含了常用排查的场景.根据被分为几个场景类型,比如Configuration,client connectivity,failover和performance ...

  2. &lbrack;AlwaysOn Availability Groups&rsqb;使用Powershell监控AlwayOn健康

    使用Powershell监控AlwayOn健康 1.基本命令概述 AlwayOn Dashboard是很有用的查看整体AG健康状况的工具.但是这个工具不是用于7*24监控的.如果应用程序夜间发送严重的 ...

  3. &lbrack;AlwaysOn Availability Groups&rsqb;监控AG性能

    监控AG性能 AG的性能的性能方面,在关键任务数据库上进行语句级维护性能是很重要的.理解AG如何传输日志到secondary副本对评估RTO和RPO,表明AG是否性能不好. 1. 数据同步步骤 为了评 ...

  4. AlwaysON同步性能监控的三板斧

    延迟是AlwaysOn最大的敌人之一 延迟是AlwaysON的最大敌人之一.对AlwaysON而言,其首要目标就尽量减少(无法避免)主副本.辅助副本的数据延迟,实现主副本.辅助副本的“数据同步”.只有 ...

  5. Alwayson架构下 服务器 各虚拟IP漂移监控告警的功能实现

    1.需求概括 我们知道,在SQL Server Alwayson 架构中,有多种虚拟IP,例如 WindowsCluster IP,ListenIP,角色高可用性IP(类似于侦听IP).在某些条件下, ...

  6. SQL Server Alwayson架构下 服务器 各虚拟IP漂移监控告警的功能实现 -2(虚拟IP视角)

    1.需求描述 我们知道Windows Cluster 都是多节点的,当虚拟IP漂移的时候,一般都是从一个节点漂移到另外一个节点.如果可以及时捕捉到旧节点信息是什么.新节点信息是什么对我们提供高可用的数 ...

  7. &lbrack;AlwaysOn Availability Groups&rsqb; 健康模型 Part 2 ——扩展

    健康模型扩展 第一部分已经介绍了AlwayOn健康模型的概述.现在是创建一个自己的PBM策略,然后设置为制定的归类.创建这些策略,创建之后修改一下配置,dashboard就会自动评估这些策略. 场景, ...

  8. SQL 2014 AlwaysOn 搭建

    AlwaysOn底层依然采用Windows 故障转移群集的机制进行监测和转移,因此也需要先建立Windows Cluster,只不过可用性组中的数据库不一定非要再存放在共享存储上了.可以是存储在本地磁 ...

  9. &lbrack;AlwaysOn Availability Groups&rsqb;CLUSTER&period;LOG&lpar;AG&rpar;

    CLUSTER.LOG(AG) 作为故障转移资源,在SQL Server和windows故障转移集群服务的资源DLL(hadrres.dll)之间有额外的内部交流,DLL无法被SQL Server监控 ...

随机推荐

  1. ActivityGroup、TabHost之子页面不刷新——getLocalActivityManager&lpar;&rpar; 以及intent&period;setFlags&lpar;Intent&period;FLAG&lowbar;ACTIVITY&lowbar;CLEAR&lowbar;TOP&rpar;用法

    TabHost继承自ActivityGroup,以下不再单独列出. ActivityGroup在第一次创建的时候会完整的执行子Activity或子view的生命周期,但在从其他子activity或子v ...

  2. 安装Mysql5&period;7并修改初始密码

    Centos 安装MySQL可以参考之前写的一篇文章 Centos7.3 安装Mysql5.7并修改初始密码 windows安装mysql5.7有两种方式 1.下载.msi安装文件直接根据界面提示进行 ...

  3. 建立maven工程pom&period;xml报错:web&period;xml is missing and &lt&semi;failOnMissingWebXml&gt&semi; is set to true

    解决方式:如图添加web.xml文件即可

  4. 四&period;RabbitMQ之发布&sol;订阅(Publish&sol;Subscribe)

    一.基础知识点 在上述章节中,我们理解的RabbitMQ是基于如下这种模式运作的. 而事实上,这只是我们简单化了的模型的结果,真正的模型应该是这样的. P:Producer 生产者,生产消息,把它放进 ...

  5. linux定时器crontab

    linux定时器crontab用法: 1.基本格式 : * * * * * command 分 时 日 月 周 命令 第1列表示分钟1-59 每分钟用*或者 */1表示 第2列表示小时1-23(0表示 ...

  6. Python爬虫使用lxml模块爬取豆瓣读书排行榜并分析

    上次使用了BeautifulSoup库爬取电影排行榜,爬取相对来说有点麻烦,爬取的速度也较慢.本次使用的lxml库,我个人是最喜欢的,爬取的语法很简单,爬取速度也快. 本次爬取的豆瓣书籍排行榜的首页地 ...

  7. linux下钉钉,微信

    google-chrome --app=https://im.dingtalk.com/ google-chrome --app=https://wx.qq.com/

  8. react-eslintrc

    { "extends": ["eslint:recommended"], "plugins": [ "react" ], ...

  9. Android 的 ListView 的CheckBox标题栏显示文本之后显示单选框

    https://blog.csdn.net/u013790519/article/details/50036223 2.CheckBox的android:button=”@null”属性代码设置如下: ...

  10. C语言--第八周作业评分(5班)

    作业链接:https://edu.cnblogs.com/campus/hljkj/CS2017-5/homework/1400 一.评分要求 要求1 完成14.15周的所有PTA中题目集,总共4次题 ...