DB2 HADR 监控详解2 | 温室小花.技术.博客

心跳丢失数量（HeartBeatMissed）：主机会不断地向备机发送心跳，以确认仍然可以和对方通信。这个值表明了有多少心跳信号没有发送成功或者没有接收成功。

日志 LSN 差异（LogGapRunAvg）：这个值表示一段时间以内，主机和备机日志差异的平均值。如果这个值一直很大，可能表明网络状况比较差，或者备机的性能和主机差异太大，以至于日志不能及时的从主机传到备机。

连接状态（ConnectStatus）：包括三种 CONNECTED, DISCONNECTED, CONGESTED。CONNECTED 表示连接状况良好；DISCONNECTED 表示主机和备机已经断开连接；CONGESTED 表示当前的网络状况不太好，日志或者消息的发送遇到拥塞。

连接时间（ConnectTime）：如果主机和备机是连接的，表示连接建立起来的时间；如果连接时断开的，表示的是连接断开的时间；如果发生了网络拥塞，则表示上次网络拥塞的时间。

超时时间（Timeout）：如果 HADR 在这段时间内没有收到来自同伴的任何消息，它就会断开网络连接。需要注意的是，这个时间并一定是网络出现错误以后的等待时间。HADR 可以发现网络上的大部分错误，当这些错误发生时，HADR 会立刻断开和对方的连接，而并不会等待。另外，这项配置还有另外两个作用：

1. 心跳的时间间隔为 HADR_TIMEOUT/4 和 30 秒钟两者之间的较小的那个值

2. 如果首先在主机上执行启动 HADR 的操作，如果主机没有在 HADR_TIMEOUT 时间以内没有收到备机的连接，主机上的数据库就会停掉，以防止两台主数据库的存在而导致脑裂。

同伴窗口（PeerWindow）：相对应 DB2 配置文件中的 HADR_PEER_WINDOW，该参数只对 SYNC 和 NEARSYNC 两种同步模式有效。如果该参数不为零，当主机和备机断开连接时，在 HADR_PEER_WINDOW 这段时间以内，数据库处于 DISCONNECTED PEER 状态。主机在这段时间内不能提交任何事务。所以，这段时间内，如果备机做了接管，备机不会丢失任何事务。这个参数通对于在 TSA 对 HADR 自动做接管的环境中特别重要，因为 TSA 执行”takeover hard on db dbname by force peer window only”这个命令进行接管。

同伴窗口结束时间（PeerWindowEnd）：显示了同伴窗口的结束时间。过了这个时间以后，HADR 将处于 DISCONNECTED 状态。

本地主机名（LocalHost）：本地 HADR 所在的主机名或者 IP 地址。

本地服务名（LocalService）：本地 HADR 所使用的服务名称或者端口号。

远程主机名（RemoteHost）：对端 HADR 所在机器的的主机名或者 IP 地址。

远程服务名（RemoteService）：对端 HADR 使用的服务名称或者端口号。

远程实例（RemoteInstance）：对端 HADR 数据库所在的实例的名字。

主机日志文件（PrimaryFile）：主机目前正在写的日志文件。

主机日志页号（PrimaryPg）：主机目前正在写的日志文件中的页号。

主机日志序号（PrimaryLSN）：主机正在处理的日志记录的序列号。

备机日志文件（StandByFile）：备机目前正在写的日志文件。

备机日志页号（StandByPg）：备机目前正在写的日志文件中的页号。

备机日志序号（StandByLSN）：备机正在处理的日志记录的序列号。