HACMP/PowerHA/Cluster 常用操作程及命令(說明）

HACMP的常用命令：
1啟動HACMP

使用smitty clstart命令用來啟動HACMP。

# smitty clstart

– 運行指令”smit clstart”回車. 等待命令執行OK,退出smit.

– 等待HACMP完全啟動,可用指令”tail -f /tmp/hacmp.out”觀察HACMP啟動狀況.

– 用指令”netstat -i”檢查IP address,確認主網卡使用service IP adress,

備用網卡使用standby IP address.

– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyon狀態.

– 用指令”df”檢查mount的文件系統.

– 確認屬於Node1的online應用正常.

註：有兩種啟動HACMP的方式：

now：手工啟動HACMP

restart、both：在系統啟動時自動啟動HACMP

2停止HACMP

使用smitty clstop該命令用來停止HACMP。

– 運行指令”smit clstop”回車.在shutdown mode項選擇graceful並回車, 等待命令執行OK,退出smit.

– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”觀察HACMP停止狀況.

– 用指令”netstat -i”檢查IP address,確認主網卡變為boot IP adress,備用網卡使用standby IP address.

– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyoff狀態.

註：有三種停止方式：

graceful: 只停止本節點上HACMP的運行，並釋放由本節點管理的資源，但允許其它節點接管。（是指在關閉雙機軟件時將調用客戶應用預定義的善後處理例程。）

graceful with takeover：停止本節點上HACMP的運行，釋放資源，讓其他節點接管。（是指該節點將關閉雙機軟件並釋放資源請求備節點進行接管。）

forced：停止本節點上HACMP的運行，但不釋放資源。（是指立即關閉雙機軟件不調用任何客戶應用的善後處理例程。）

3查看cluster運行情況和HACMP狀態

使用/usr/es/sbin/cluster/clstat命令用來顯示HACMP狀態。

查看cluster運行情況：/usr/sbin/cluster/clstat

# /usr/sbin/cluster/clinfo –a

/usr/sbin/cluster/clstat可以幫助你查看當前HACMP的節點狀態。

屏幕會如下顯示：

clstat – HACMP for AIX Cluster Status Monitor

—————————————————————-

Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999

State: UP Nodes: 2

SubState: STABLE

Node: j50a State: UP <–節點A狀態

Interface: j50_a_srv (0) Address: 192.9.200.1 <– 服務IP地址

State: UP <–服務IP狀態

Interface: j50_a_tty1 (1) Address: 0.0.0.0

State: UP <–心跳線狀態

Node: j50b State: UP <–節點B狀態

Interface: j50_b_srv (0) Address: 192.9.200.2 <– 服務IP地址

State: UP <–服務IP狀態

Interface: j50_b_tty1 (1) Address: 0.0.0.0

State: UP <–心跳線狀態

************************ f/forward, b/back, r/refresh, q/quit *****************

節點和CLUSTER綠色為正常，紅色表示HACMP宕機或沒有起來，黃色表示HACMP處在不穩定狀態，可能是某節點HACMP正在啟動、切換、停止。

4查看HACMP的輸出

#tail -f /tmp/hacmp.out

HACMP啟動時，用該命令查看該文件中有無報錯顯示

5查看地址信息

#netstat -i

用該命令查看網卡綁定的地址類型是否正確，三種類型：boot1、boot2、service。

6查看邏輯卷組和文件系統

#lsvg -o

用該命令查看應該激活(varyon)的VG是否激活。

#mount

用該命令查看應該mount上的文件系統是否正常。

7、查看HACMP配置情況

# /usr/es/sbin/cluster/utilities/cllscf 顯示群集拓樸

# /usr/es/sbin/cluster/utilities/cllsclstr 顯示群集定義

# /usr/es/sbin/cluster/utilities/cllsnode 按節點顯示拓樸信息

# /usr/es/sbin/cluster/utilities/cllsnw 按網絡名稱顯示拓樸信息

# /usr/es/sbin/cluster/utilities/cllsif 按網卡顯示拓樸信息

# /usr/es/sbin/cluster/utilities/clshowres 顯示資源組信息

8、查看Cluster的進程狀態：

# ps -ef | grep cluster

註：應有三個HACMP進程：clstrmgr、clinfo、clsnuxpd

9、查看Cluster的日誌及錯誤信息（HACMP環境下的排錯）：

HACMP的LOG文件:以下文件都是文本文件,可以用VI來看.每個日誌文件都含有每個信息的產生時間.

/usr/adm/cluster.log :記錄了HACMP的狀態,由HA的守護進程所產生.

/tmp/hacmp.out :記錄了HA的詳細腳本.

/usr/sbin/cluster/history/cluster.mmdd :記錄了HA的各個事件的發生.

/tmp/cm.log :由clstrmgr進程產生,每次HA重起時會被覆蓋.

註：可以在啟動HACMP時使用 # tail –f /tmp/hacmp.out命令，以查看HACMP的啟動是否正常或跟蹤啟動時的錯誤信息。

10、查看Cluster運行的歷史記錄：

# cd /usr/sbin/cluster/history

註：此目錄下存放着每天的Cluster運行記錄

11、查看Cluster運行時的網絡情況及資源組的使用情況：

HACMP啟動之前：

# netstat -i

此時應可以看到boot和standby地址

# lsvg -o

此時只能看到本地的VG

HACMP啟動之後：

# netstat -i

此時應可以看到service和standby地址

# lsvg -o

此時應可以看到本地的VG及共享VG

12、存儲和恢復Cluster的配置：

存儲cluster的配置：

#smitty hacmp

選擇：Cluster Configuration→Cluster Snapshots→Add a Cluster Snapshot

鍵入Snapshot文件名（Cluster Snapshot Name）

恢復cluster的配置：

# smitty hacmp

選擇：Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot

鍵入Snapshot文件名（Cluster Snapshot Name）

註：菜單中各項的意義：

Cluster Snapshot Name：指定Cluster Snapshot的文件名

Cluster Snapshot Des cription：對Cluster Snapshot地描述

Un/Configure Cluster Resource：是否重新配置Cluster資源

Force Apply if verify fails：當Cluster校驗失敗時，是否強制恢復配置

13、注意：向由HACMP管理的共享VG中增加FS時的具體步驟為：

1）、# smitty

選擇：System storage management

File systems

Add/change/show/delete file systems

Journaled file systems

Add a journaled file system

Add a standard journaled file system

選擇共享VG

指定FS的大小，Mount point

2）、# smitty clstop

停止HACMP的運行

3）、在增加FS的節點上作：

# varyoffvg SHARE_VG_NAME

# exportvg SHARE_VG_NAME

在另一個節點上作：

# importvg –y SHARE_VG_NAME –f hdiskX

# varyonvg SHARE_VG_NAME

作此步的目的是將新加入的FS的定義取過來

4）、# smitty hacmp

選擇：cluster configuration

cluster resources

define resource group

change/show resources for a resource group

將增加的FS加入到Cluster資源組的定義中

5）、# smitty hacmp

選擇：cluster configuration

cluster resources

synchronize cluster resources

同步Cluster的資源組的配置

6）、# smitty hacmp

選擇：cluster configuration

cluster verification

進行Cluster配置的校驗

14、Cluster的配置參數：

參數名稱參數值

Cluster ID

Cluster Name

Node Name

Resource Group Name

Node RelationshipCascadingcascading

Participating Node Names

Service IP label

Filesystems

Filesystems Consistency Checkfsckfsck

Filesystems Recovery MethodSequentialsequential

Volume Groups

Application Servers

Start s cript

Stop s cript

檢查心跳線是否已經配置好：

1、在兩台上分別輸入如下命令：

S85_1# cat /etc/hosts >/dev/tty0

S85_2# cat

如果在S85_2機能接收到信息，則表明心跳線已經配置好

2、測試心跳線是否可以正常工作：

在A機上：

# stty

在B機上：

# stty

如果在兩台主機上均出現了該TTY的配置信息，則說明心跳線設置正確。

安裝HACMP時，一般不選擇全部安裝，只安裝一部分關鍵的軟件，如cluster.adt、cluster.base、cluster.cspoc和cluster.doc.en_US。

15、HA可把故障機的應用及其資源（包括用到的IP地址和磁盤空間等）接管過來.

1、/usr/es/sbin/cluster/utilities/cllscf Show Cluster Topology

2、/usr/es/sbin/cluster/utilities/cllsclstr Show Cluster Definitions

3、/usr/es/sbin/cluster/utilities/cllsnode Show Topology Information by Node

4、/usr/es/sbin/cluster/utilities/cllsnw Show Topology Information by Network Name

5、/usr/es/sbin/cluster/utilities/cllsif Show Topology Information by Network Adapter

6、/usr/es/sbin/cluster/utilities/clshowres -g’sxptt_con_rg’

Show Resource Information by Resource Group

7、/usr/es/sbin/cluster/utilities/clshowres -n’s85a’

Show Resource Information by Node

Filesystems Consistency Check

1. fsck

2. logredo

Resource Group的三種節點關係

(Node Relationship):

(1) Cascading

(2) Concurrent

(3) Rotating

HA啟動腳本：/usr/sbin/cluster/local/app_start1

HA停止腳本：/usr/sbin/cluster/local/app_stop1

lspv -p hdiskx 列出hdiskx上PP的狀態

lspv hdiskx 看hdiskx上的詳細信息

lspv 看硬盤及所在VG

lslv lv00 查看LV狀態

lsvg -p datavg 看指定VG上所有的硬盤

16、人為接管HACMP

在某些維護情況下,需將某節點的HACMP及應用切換至另一節點.

– 運行指令”smit clstop”回車.在shutdown mode項選擇takeover並回車, 等待命令執行OK,退出smit.

– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”觀察HACMP停止狀況.

– 用指令”netstat -i”檢查IP address,確認主網卡變為boot IP adress, 備用網卡使用standby IP address.

– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyoff狀態.

– 在另一節點運行相同命令,確認網卡,VG及應用接管成功。
17、如何刪除系統發給root用的mail ?

# change to system mail directory

cd /var/spool/mail

# backup root mail to OtherUser ( can use pop3 recevied mail user)

# if you have configure /etc/aliases file, you can ignore the step

cat root >> [OtherUserID]

# clean root mail file

true > root

以下文章點擊率最高

Loading…