HACMP的常用命令:
1启动HACMP
使用smitty clstart命令用来启动HACMP。
# smitty clstart
– 运行指令”smit clstart”回车. 等待命令执行OK,退出smit.
– 等待HACMP完全启动,可用指令”tail -f /tmp/hacmp.out”观察HACMP启动状况.
– 用指令”netstat -i”检查IP address,确认主网卡使用service IP adress,
备用网卡使用standby IP address.
– 用指令”lsvg -o”检查vary on 的VG,确认共享VG变为varyon状态.
– 用指令”df”检查mount的文件系统.
– 确认属于Node1的online应用正常.
注:有两种启动HACMP的方式:
now:手工启动HACMP
restart、both:在系统启动时自动启动HACMP
2停止HACMP
使用smitty clstop该命令用来停止HACMP。
– 运行指令”smit clstop”回车.在shutdown mode项选择graceful并回车, 等待命令执行OK,退出smit.
– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”观察HACMP停止状况.
– 用指令”netstat -i”检查IP address,确认主网卡变为boot IP adress,备用网卡使用standby IP address.
– 用指令”lsvg -o”检查vary on 的VG,确认共享VG变为varyoff状态.
注:有三种停止方式:
graceful: 只停止本节点上HACMP的运行,并释放由本节点管理的资源,但允许其它节点接管。(是指在关闭双机软件时将调用客户应用预定义的善后处理例程。)
graceful with takeover:停止本节点上HACMP的运行,释放资源,让其他节点接管。(是指该节点将关闭双机软件并释放资源请求备节点进行接管。)
forced:停止本节点上HACMP的运行,但不释放资源。(是指立即关闭双机软件不调用任何客户应用的善后处理例程。)
3查看cluster运行情况和HACMP状态
使用/usr/es/sbin/cluster/clstat命令用来显示HACMP状态。
查看cluster运行情况:/usr/sbin/cluster/clstat
# /usr/sbin/cluster/clinfo –a
/usr/sbin/cluster/clstat可以帮助你查看当前HACMP的节点状态。
屏幕会如下显示:
clstat – HACMP for AIX Cluster Status Monitor
—————————————————————-
Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999
State: UP Nodes: 2
SubState: STABLE
Node: j50a State: UP <–节点A状态
Interface: j50_a_srv (0) Address: 192.9.200.1 <– 服务IP地址
State: UP <–服务IP状态
Interface: j50_a_tty1 (1) Address: 0.0.0.0
State: UP <–心跳线状态
Node: j50b State: UP <–节点B状态
Interface: j50_b_srv (0) Address: 192.9.200.2 <– 服务IP地址
State: UP <–服务IP状态
Interface: j50_b_tty1 (1) Address: 0.0.0.0
State: UP <–心跳线状态
************************ f/forward, b/back, r/refresh, q/quit *****************
节点和CLUSTER绿色为正常,红色表示HACMP宕机或没有起来,黄色表示HACMP处在不稳定状态,可能是某节点HACMP正在启动、切换、停止。
4查看HACMP的输出
#tail -f /tmp/hacmp.out
HACMP启动时,用该命令查看该文件中有无报错显示
5查看地址信息
#netstat -i
用该命令查看网卡绑定的地址类型是否正确,三种类型:boot1、boot2、service。
6查看逻辑卷组和文件系统
#lsvg -o
用该命令查看应该激活(varyon)的VG是否激活。
#mount
用该命令查看应该mount上的文件系统是否正常。
7、查看HACMP配置情况
# /usr/es/sbin/cluster/utilities/cllscf 显示群集拓朴
# /usr/es/sbin/cluster/utilities/cllsclstr 显示群集定义
# /usr/es/sbin/cluster/utilities/cllsnode 按节点显示拓朴信息
# /usr/es/sbin/cluster/utilities/cllsnw 按网络名称显示拓朴信息
# /usr/es/sbin/cluster/utilities/cllsif 按网卡显示拓朴信息
# /usr/es/sbin/cluster/utilities/clshowres 显示资源组信息
8、查看Cluster的进程状态:
# ps -ef | grep cluster
注:应有三个HACMP进程:clstrmgr、clinfo、clsnuxpd
9、查看Cluster的日志及错误信息(HACMP环境下的排错):
HACMP的LOG文件:以下文件都是文本文件,可以用VI来看.每个日志文件都含有每个信息的产生时间.
/usr/adm/cluster.log :记录了HACMP的状态,由HA的守护进程所产生.
/tmp/hacmp.out :记录了HA的详细脚本.
/usr/sbin/cluster/history/cluster.mmdd :记录了HA的各个事件的发生.
/tmp/cm.log :由clstrmgr进程产生,每次HA重起时会被覆盖.
注:可以在启动HACMP时使用 # tail –f /tmp/hacmp.out命令,以查看HACMP的启动是否正常或跟踪启动时的错误信息。
10、查看Cluster运行的历史记录:
# cd /usr/sbin/cluster/history
注:此目录下存放着每天的Cluster运行记录
11、查看Cluster运行时的网络情况及资源组的使用情况:
HACMP启动之前:
# netstat -i
此时应可以看到boot和standby地址
# lsvg -o
此时只能看到本地的VG
HACMP启动之后:
# netstat -i
此时应可以看到service和standby地址
# lsvg -o
此时应可以看到本地的VG及共享VG
12、存储和恢复Cluster的配置:
存储cluster的配置:
#smitty hacmp
选择:Cluster Configuration→Cluster Snapshots→Add a Cluster Snapshot
键入Snapshot文件名(Cluster Snapshot Name)
恢复cluster的配置:
# smitty hacmp
选择:Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot
键入Snapshot文件名(Cluster Snapshot Name)
注:菜单中各项的意义:
Cluster Snapshot Name:指定Cluster Snapshot的文件名
Cluster Snapshot Des cription:对Cluster Snapshot地描述
Un/Configure Cluster Resource:是否重新配置Cluster资源
Force Apply if verify fails:当Cluster校验失败时,是否强制恢复配置
13、注意:向由HACMP管理的共享VG中增加FS时的具体步骤为:
1)、# smitty
选择:System storage management
File systems
Add/change/show/delete file systems
Journaled file systems
Add a journaled file system
Add a standard journaled file system
选择共享VG
指定FS的大小,Mount point
2)、# smitty clstop
停止HACMP的运行
3)、在增加FS的节点上作:
# varyoffvg SHARE_VG_NAME
# exportvg SHARE_VG_NAME
在另一个节点上作:
# importvg –y SHARE_VG_NAME –f hdiskX
# varyonvg SHARE_VG_NAME
作此步的目的是将新加入的FS的定义取过来
4)、# smitty hacmp
选择:cluster configuration
cluster resources
define resource group
change/show resources for a resource group
将增加的FS加入到Cluster资源组的定义中
5)、# smitty hacmp
选择:cluster configuration
cluster resources
synchronize cluster resources
同步Cluster的资源组的配置
6)、# smitty hacmp
选择:cluster configuration
cluster verification
进行Cluster配置的校验
14、Cluster的配置参数:
参数名称参数值
Cluster ID
Cluster Name
Node Name
Resource Group Name
Node RelationshipCascadingcascading
Participating Node Names
Service IP label
Filesystems
Filesystems Consistency Checkfsckfsck
Filesystems Recovery MethodSequentialsequential
Volume Groups
Application Servers
Start s cript
Stop s cript
检查心跳线是否已经配置好:
1、在两台上分别输入如下命令:
S85_1# cat /etc/hosts >/dev/tty0
S85_2# cat
如果在S85_2机能接收到信息,则表明心跳线已经配置好
2、测试心跳线是否可以正常工作:
在A机上:
# stty
在B机上:
# stty
如果在两台主机上均出现了该TTY的配置信息,则说明心跳线设置正确。
安装HACMP时,一般不选择全部安装,只安装一部分关键的软件,如cluster.adt、cluster.base、cluster.cspoc和cluster.doc.en_US。
15、HA可把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来.
1、/usr/es/sbin/cluster/utilities/cllscf Show Cluster Topology
2、/usr/es/sbin/cluster/utilities/cllsclstr Show Cluster Definitions
3、/usr/es/sbin/cluster/utilities/cllsnode Show Topology Information by Node
4、/usr/es/sbin/cluster/utilities/cllsnw Show Topology Information by Network Name
5、/usr/es/sbin/cluster/utilities/cllsif Show Topology Information by Network Adapter
6、/usr/es/sbin/cluster/utilities/clshowres -g’sxptt_con_rg’
Show Resource Information by Resource Group
7、/usr/es/sbin/cluster/utilities/clshowres -n’s85a’
Show Resource Information by Node
Filesystems Consistency Check
1. fsck
2. logredo
Resource Group的三种节点关系
(Node Relationship):
(1) Cascading
(2) Concurrent
(3) Rotating
HA启动脚本:/usr/sbin/cluster/local/app_start1
HA停止脚本:/usr/sbin/cluster/local/app_stop1
lspv -p hdiskx 列出hdiskx上PP的状态
lspv hdiskx 看hdiskx上的详细信息
lspv 看硬盘及所在VG
lslv lv00 查看LV状态
lsvg -p datavg 看指定VG上所有的硬盘
16、人为接管HACMP
在某些维护情况下,需将某节点的HACMP及应用切换至另一节点.
– 运行指令”smit clstop”回车.在shutdown mode项选择takeover并回车, 等待命令执行OK,退出smit.
– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”观察HACMP停止状况.
– 用指令”netstat -i”检查IP address,确认主网卡变为boot IP adress, 备用网卡使用standby IP address.
– 用指令”lsvg -o”检查vary on 的VG,确认共享VG变为varyoff状态.
– 在另一节点运行相同命令,确认网卡,VG及应用接管成功。
17、如何删除系统发给root用的mail ?
# change to system mail directory
cd /var/spool/mail
# backup root mail to OtherUser ( can use pop3 recevied mail user)
# if you have configure /etc/aliases file, you can ignore the step
cat root >> [OtherUserID]
# clean root mail file
true > root
以下文章点击率最高
Loading…