HACMP/PowerHA/Cluster 常用操作程及命令(說明)

HACMP的常用命令:
1啟動HACMP

使用smitty clstart命令用來啟動HACMP。

# smitty clstart

– 運行指令”smit clstart”回車. 等待命令執行OK,退出smit.

– 等待HACMP完全啟動,可用指令”tail -f /tmp/hacmp.out”觀察HACMP啟動狀況.

– 用指令”netstat -i”檢查IP address,確認主網卡使用service IP adress,

備用網卡使用standby IP address.

– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyon狀態.

– 用指令”df”檢查mount的文件系統.

– 確認屬於Node1的online應用正常.

註:有兩種啟動HACMP的方式:

now:手工啟動HACMP

restart、both:在系統啟動時自動啟動HACMP

2停止HACMP

使用smitty clstop該命令用來停止HACMP。

– 運行指令”smit clstop”回車.在shutdown mode項選擇graceful並回車, 等待命令執行OK,退出smit.

– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”觀察HACMP停止狀況.

– 用指令”netstat -i”檢查IP address,確認主網卡變為boot IP adress,備用網卡使用standby IP address.

– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyoff狀態.

註:有三種停止方式:

graceful: 只停止本節點上HACMP的運行,並釋放由本節點管理的資源,但允許其它節點接管。(是指在關閉雙機軟件時將調用客戶應用預定義的善後處理例程。)

graceful with takeover:停止本節點上HACMP的運行,釋放資源,讓其他節點接管。(是指該節點將關閉雙機軟件並釋放資源請求備節點進行接管。)

forced:停止本節點上HACMP的運行,但不釋放資源。(是指立即關閉雙機軟件不調用任何客戶應用的善後處理例程。)

3查看cluster運行情況和HACMP狀態

使用/usr/es/sbin/cluster/clstat命令用來顯示HACMP狀態。

查看cluster運行情況:/usr/sbin/cluster/clstat

# /usr/sbin/cluster/clinfo –a

/usr/sbin/cluster/clstat可以幫助你查看當前HACMP的節點狀態。

屏幕會如下顯示:

clstat – HACMP for AIX Cluster Status Monitor

—————————————————————-

Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999

State: UP Nodes: 2

SubState: STABLE

Node: j50a State: UP <–節點A狀態

Interface: j50_a_srv (0) Address: 192.9.200.1 <– 服務IP地址

State: UP <–服務IP狀態

Interface: j50_a_tty1 (1) Address: 0.0.0.0

State: UP <–心跳線狀態

Node: j50b State: UP <–節點B狀態

Interface: j50_b_srv (0) Address: 192.9.200.2 <– 服務IP地址

State: UP <–服務IP狀態

Interface: j50_b_tty1 (1) Address: 0.0.0.0

State: UP <–心跳線狀態

************************ f/forward, b/back, r/refresh, q/quit *****************

節點和CLUSTER綠色為正常,紅色表示HACMP宕機或沒有起來,黃色表示HACMP處在不穩定狀態,可能是某節點HACMP正在啟動、切換、停止。

4查看HACMP的輸出

#tail -f /tmp/hacmp.out

HACMP啟動時,用該命令查看該文件中有無報錯顯示

5查看地址信息

#netstat -i

用該命令查看網卡綁定的地址類型是否正確,三種類型:boot1、boot2、service。

6查看邏輯卷組和文件系統

#lsvg -o

用該命令查看應該激活(varyon)的VG是否激活。

#mount

用該命令查看應該mount上的文件系統是否正常。

7、查看HACMP配置情況

# /usr/es/sbin/cluster/utilities/cllscf 顯示群集拓樸

# /usr/es/sbin/cluster/utilities/cllsclstr 顯示群集定義

# /usr/es/sbin/cluster/utilities/cllsnode 按節點顯示拓樸信息

# /usr/es/sbin/cluster/utilities/cllsnw 按網絡名稱顯示拓樸信息

# /usr/es/sbin/cluster/utilities/cllsif 按網卡顯示拓樸信息

# /usr/es/sbin/cluster/utilities/clshowres 顯示資源組信息

8、查看Cluster的進程狀態:

# ps -ef | grep cluster

註:應有三個HACMP進程:clstrmgr、clinfo、clsnuxpd

9、查看Cluster的日誌及錯誤信息(HACMP環境下的排錯):

HACMP的LOG文件:以下文件都是文本文件,可以用VI來看.每個日誌文件都含有每個信息的產生時間.

/usr/adm/cluster.log :記錄了HACMP的狀態,由HA的守護進程所產生.

/tmp/hacmp.out :記錄了HA的詳細腳本.

/usr/sbin/cluster/history/cluster.mmdd :記錄了HA的各個事件的發生.

/tmp/cm.log :由clstrmgr進程產生,每次HA重起時會被覆蓋.

註:可以在啟動HACMP時使用 # tail –f /tmp/hacmp.out命令,以查看HACMP的啟動是否正常或跟蹤啟動時的錯誤信息。

10、查看Cluster運行的歷史記錄:

# cd /usr/sbin/cluster/history

註:此目錄下存放着每天的Cluster運行記錄

11、查看Cluster運行時的網絡情況及資源組的使用情況:

HACMP啟動之前:

# netstat -i

此時應可以看到boot和standby地址

# lsvg -o

此時只能看到本地的VG

HACMP啟動之後:

# netstat -i

此時應可以看到service和standby地址

# lsvg -o

此時應可以看到本地的VG及共享VG

12、存儲和恢復Cluster的配置:

存儲cluster的配置:

#smitty hacmp

選擇:Cluster Configuration→Cluster Snapshots→Add a Cluster Snapshot

鍵入Snapshot文件名(Cluster Snapshot Name)

恢復cluster的配置:

# smitty hacmp

選擇:Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot

鍵入Snapshot文件名(Cluster Snapshot Name)

註:菜單中各項的意義:

Cluster Snapshot Name:指定Cluster Snapshot的文件名

Cluster Snapshot Des cription:對Cluster Snapshot地描述

Un/Configure Cluster Resource:是否重新配置Cluster資源

Force Apply if verify fails:當Cluster校驗失敗時,是否強制恢復配置

13、注意:向由HACMP管理的共享VG中增加FS時的具體步驟為:

1)、# smitty

選擇:System storage management

File systems

Add/change/show/delete file systems

Journaled file systems

Add a journaled file system

Add a standard journaled file system

選擇共享VG

指定FS的大小,Mount point

2)、# smitty clstop

停止HACMP的運行

3)、在增加FS的節點上作:

# varyoffvg SHARE_VG_NAME

# exportvg SHARE_VG_NAME

在另一個節點上作:

# importvg –y SHARE_VG_NAME –f hdiskX

# varyonvg SHARE_VG_NAME

作此步的目的是將新加入的FS的定義取過來

4)、# smitty hacmp

選擇:cluster configuration

cluster resources

define resource group

change/show resources for a resource group

將增加的FS加入到Cluster資源組的定義中

5)、# smitty hacmp

選擇:cluster configuration

cluster resources

synchronize cluster resources

同步Cluster的資源組的配置

6)、# smitty hacmp

選擇:cluster configuration

cluster verification

進行Cluster配置的校驗

14、Cluster的配置參數:

參數名稱參數值

Cluster ID

Cluster Name

Node Name

Resource Group Name

Node RelationshipCascadingcascading

Participating Node Names

Service IP label

Filesystems

Filesystems Consistency Checkfsckfsck

Filesystems Recovery MethodSequentialsequential

Volume Groups

Application Servers

Start s cript

Stop s cript

檢查心跳線是否已經配置好:

1、在兩台上分別輸入如下命令:

S85_1# cat /etc/hosts >/dev/tty0

S85_2# cat

如果在S85_2機能接收到信息,則表明心跳線已經配置好

2、測試心跳線是否可以正常工作:

在A機上:

# stty

在B機上:

# stty

如果在兩台主機上均出現了該TTY的配置信息,則說明心跳線設置正確。

安裝HACMP時,一般不選擇全部安裝,只安裝一部分關鍵的軟件,如cluster.adt、cluster.base、cluster.cspoc和cluster.doc.en_US。

15、HA可把故障機的應用及其資源(包括用到的IP地址和磁盤空間等)接管過來.

1、/usr/es/sbin/cluster/utilities/cllscf Show Cluster Topology

2、/usr/es/sbin/cluster/utilities/cllsclstr Show Cluster Definitions

3、/usr/es/sbin/cluster/utilities/cllsnode Show Topology Information by Node

4、/usr/es/sbin/cluster/utilities/cllsnw Show Topology Information by Network Name

5、/usr/es/sbin/cluster/utilities/cllsif Show Topology Information by Network Adapter

6、/usr/es/sbin/cluster/utilities/clshowres -g’sxptt_con_rg’

Show Resource Information by Resource Group

7、/usr/es/sbin/cluster/utilities/clshowres -n’s85a’

Show Resource Information by Node

Filesystems Consistency Check

1. fsck

2. logredo

Resource Group的三種節點關係

(Node Relationship):

(1) Cascading

(2) Concurrent

(3) Rotating

HA啟動腳本:/usr/sbin/cluster/local/app_start1

HA停止腳本:/usr/sbin/cluster/local/app_stop1

lspv -p hdiskx 列出hdiskx上PP的狀態

lspv hdiskx 看hdiskx上的詳細信息

lspv 看硬盤及所在VG

lslv lv00 查看LV狀態

lsvg -p datavg 看指定VG上所有的硬盤

16、人為接管HACMP

在某些維護情況下,需將某節點的HACMP及應用切換至另一節點.

– 運行指令”smit clstop”回車.在shutdown mode項選擇takeover並回車, 等待命令執行OK,退出smit.

– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”觀察HACMP停止狀況.

– 用指令”netstat -i”檢查IP address,確認主網卡變為boot IP adress, 備用網卡使用standby IP address.

– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyoff狀態.

– 在另一節點運行相同命令,確認網卡,VG及應用接管成功。
17、如何刪除系統發給root用的mail ?

# change to system mail directory

cd /var/spool/mail

# backup root mail to OtherUser ( can use pop3 recevied mail user)

# if you have configure /etc/aliases file, you can ignore the step

cat root >> [OtherUserID]

# clean root mail file

true > root

以下文章點擊率最高

Loading…

     

如果這文章對你有幫助,請掃左上角微信支付-支付寶,給於打賞,以助博客運營