HACMP/PowerHA/Cluster 常用操作程及命令(说明)

HACMP的常用命令:
1启动HACMP

使用smitty clstart命令用来启动HACMP。

# smitty clstart

– 运行指令”smit clstart”回车. 等待命令执行OK,退出smit.

– 等待HACMP完全启动,可用指令”tail -f /tmp/hacmp.out”观察HACMP启动状况.

– 用指令”netstat -i”检查IP address,确认主网卡使用service IP adress,

备用网卡使用standby IP address.

– 用指令”lsvg -o”检查vary on 的VG,确认共享VG变为varyon状态.

– 用指令”df”检查mount的文件系统.

– 确认属于Node1的online应用正常.

注:有两种启动HACMP的方式:

now:手工启动HACMP

restart、both:在系统启动时自动启动HACMP

2停止HACMP

使用smitty clstop该命令用来停止HACMP。

– 运行指令”smit clstop”回车.在shutdown mode项选择graceful并回车, 等待命令执行OK,退出smit.

– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”观察HACMP停止状况.

– 用指令”netstat -i”检查IP address,确认主网卡变为boot IP adress,备用网卡使用standby IP address.

– 用指令”lsvg -o”检查vary on 的VG,确认共享VG变为varyoff状态.

注:有三种停止方式:

graceful: 只停止本节点上HACMP的运行,并释放由本节点管理的资源,但允许其它节点接管。(是指在关闭双机软件时将调用客户应用预定义的善后处理例程。)

graceful with takeover:停止本节点上HACMP的运行,释放资源,让其他节点接管。(是指该节点将关闭双机软件并释放资源请求备节点进行接管。)

forced:停止本节点上HACMP的运行,但不释放资源。(是指立即关闭双机软件不调用任何客户应用的善后处理例程。)

3查看cluster运行情况和HACMP状态

使用/usr/es/sbin/cluster/clstat命令用来显示HACMP状态。

查看cluster运行情况:/usr/sbin/cluster/clstat

# /usr/sbin/cluster/clinfo –a

/usr/sbin/cluster/clstat可以帮助你查看当前HACMP的节点状态。

屏幕会如下显示:

clstat – HACMP for AIX Cluster Status Monitor

—————————————————————-

Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999

State: UP Nodes: 2

SubState: STABLE

Node: j50a State: UP <–节点A状态

Interface: j50_a_srv (0) Address: 192.9.200.1 <– 服务IP地址

State: UP <–服务IP状态

Interface: j50_a_tty1 (1) Address: 0.0.0.0

State: UP <–心跳线状态

Node: j50b State: UP <–节点B状态

Interface: j50_b_srv (0) Address: 192.9.200.2 <– 服务IP地址

State: UP <–服务IP状态

Interface: j50_b_tty1 (1) Address: 0.0.0.0

State: UP <–心跳线状态

************************ f/forward, b/back, r/refresh, q/quit *****************

节点和CLUSTER绿色为正常,红色表示HACMP宕机或没有起来,黄色表示HACMP处在不稳定状态,可能是某节点HACMP正在启动、切换、停止。

4查看HACMP的输出

#tail -f /tmp/hacmp.out

HACMP启动时,用该命令查看该文件中有无报错显示

5查看地址信息

#netstat -i

用该命令查看网卡绑定的地址类型是否正确,三种类型:boot1、boot2、service。

6查看逻辑卷组和文件系统

#lsvg -o

用该命令查看应该激活(varyon)的VG是否激活。

#mount

用该命令查看应该mount上的文件系统是否正常。

7、查看HACMP配置情况

# /usr/es/sbin/cluster/utilities/cllscf 显示群集拓朴

# /usr/es/sbin/cluster/utilities/cllsclstr 显示群集定义

# /usr/es/sbin/cluster/utilities/cllsnode 按节点显示拓朴信息

# /usr/es/sbin/cluster/utilities/cllsnw 按网络名称显示拓朴信息

# /usr/es/sbin/cluster/utilities/cllsif 按网卡显示拓朴信息

# /usr/es/sbin/cluster/utilities/clshowres 显示资源组信息

8、查看Cluster的进程状态:

# ps -ef | grep cluster

注:应有三个HACMP进程:clstrmgr、clinfo、clsnuxpd

9、查看Cluster的日志及错误信息(HACMP环境下的排错):

HACMP的LOG文件:以下文件都是文本文件,可以用VI来看.每个日志文件都含有每个信息的产生时间.

/usr/adm/cluster.log :记录了HACMP的状态,由HA的守护进程所产生.

/tmp/hacmp.out :记录了HA的详细脚本.

/usr/sbin/cluster/history/cluster.mmdd :记录了HA的各个事件的发生.

/tmp/cm.log :由clstrmgr进程产生,每次HA重起时会被覆盖.

注:可以在启动HACMP时使用 # tail –f /tmp/hacmp.out命令,以查看HACMP的启动是否正常或跟踪启动时的错误信息。

10、查看Cluster运行的历史记录:

# cd /usr/sbin/cluster/history

注:此目录下存放着每天的Cluster运行记录

11、查看Cluster运行时的网络情况及资源组的使用情况:

HACMP启动之前:

# netstat -i

此时应可以看到boot和standby地址

# lsvg -o

此时只能看到本地的VG

HACMP启动之后:

# netstat -i

此时应可以看到service和standby地址

# lsvg -o

此时应可以看到本地的VG及共享VG

12、存储和恢复Cluster的配置:

存储cluster的配置:

#smitty hacmp

选择:Cluster Configuration→Cluster Snapshots→Add a Cluster Snapshot

键入Snapshot文件名(Cluster Snapshot Name)

恢复cluster的配置:

# smitty hacmp

选择:Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot

键入Snapshot文件名(Cluster Snapshot Name)

注:菜单中各项的意义:

Cluster Snapshot Name:指定Cluster Snapshot的文件名

Cluster Snapshot Des cription:对Cluster Snapshot地描述

Un/Configure Cluster Resource:是否重新配置Cluster资源

Force Apply if verify fails:当Cluster校验失败时,是否强制恢复配置

13、注意:向由HACMP管理的共享VG中增加FS时的具体步骤为:

1)、# smitty

选择:System storage management

File systems

Add/change/show/delete file systems

Journaled file systems

Add a journaled file system

Add a standard journaled file system

选择共享VG

指定FS的大小,Mount point

2)、# smitty clstop

停止HACMP的运行

3)、在增加FS的节点上作:

# varyoffvg SHARE_VG_NAME

# exportvg SHARE_VG_NAME

在另一个节点上作:

# importvg –y SHARE_VG_NAME –f hdiskX

# varyonvg SHARE_VG_NAME

作此步的目的是将新加入的FS的定义取过来

4)、# smitty hacmp

选择:cluster configuration

cluster resources

define resource group

change/show resources for a resource group

将增加的FS加入到Cluster资源组的定义中

5)、# smitty hacmp

选择:cluster configuration

cluster resources

synchronize cluster resources

同步Cluster的资源组的配置

6)、# smitty hacmp

选择:cluster configuration

cluster verification

进行Cluster配置的校验

14、Cluster的配置参数:

参数名称参数值

Cluster ID

Cluster Name

Node Name

Resource Group Name

Node RelationshipCascadingcascading

Participating Node Names

Service IP label

Filesystems

Filesystems Consistency Checkfsckfsck

Filesystems Recovery MethodSequentialsequential

Volume Groups

Application Servers

Start s cript

Stop s cript

检查心跳线是否已经配置好:

1、在两台上分别输入如下命令:

S85_1# cat /etc/hosts >/dev/tty0

S85_2# cat

如果在S85_2机能接收到信息,则表明心跳线已经配置好

2、测试心跳线是否可以正常工作:

在A机上:

# stty

在B机上:

# stty

如果在两台主机上均出现了该TTY的配置信息,则说明心跳线设置正确。

安装HACMP时,一般不选择全部安装,只安装一部分关键的软件,如cluster.adt、cluster.base、cluster.cspoc和cluster.doc.en_US。

15、HA可把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来.

1、/usr/es/sbin/cluster/utilities/cllscf Show Cluster Topology

2、/usr/es/sbin/cluster/utilities/cllsclstr Show Cluster Definitions

3、/usr/es/sbin/cluster/utilities/cllsnode Show Topology Information by Node

4、/usr/es/sbin/cluster/utilities/cllsnw Show Topology Information by Network Name

5、/usr/es/sbin/cluster/utilities/cllsif Show Topology Information by Network Adapter

6、/usr/es/sbin/cluster/utilities/clshowres -g’sxptt_con_rg’

Show Resource Information by Resource Group

7、/usr/es/sbin/cluster/utilities/clshowres -n’s85a’

Show Resource Information by Node

Filesystems Consistency Check

1. fsck

2. logredo

Resource Group的三种节点关系

(Node Relationship):

(1) Cascading

(2) Concurrent

(3) Rotating

HA启动脚本:/usr/sbin/cluster/local/app_start1

HA停止脚本:/usr/sbin/cluster/local/app_stop1

lspv -p hdiskx 列出hdiskx上PP的状态

lspv hdiskx 看hdiskx上的详细信息

lspv 看硬盘及所在VG

lslv lv00 查看LV状态

lsvg -p datavg 看指定VG上所有的硬盘

16、人为接管HACMP

在某些维护情况下,需将某节点的HACMP及应用切换至另一节点.

– 运行指令”smit clstop”回车.在shutdown mode项选择takeover并回车, 等待命令执行OK,退出smit.

– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”观察HACMP停止状况.

– 用指令”netstat -i”检查IP address,确认主网卡变为boot IP adress, 备用网卡使用standby IP address.

– 用指令”lsvg -o”检查vary on 的VG,确认共享VG变为varyoff状态.

– 在另一节点运行相同命令,确认网卡,VG及应用接管成功。
17、如何删除系统发给root用的mail ?

# change to system mail directory

cd /var/spool/mail

# backup root mail to OtherUser ( can use pop3 recevied mail user)

# if you have configure /etc/aliases file, you can ignore the step

cat root >> [OtherUserID]

# clean root mail file

true > root

以下文章点击率最高

Loading…

发表评论