HACMP的常用命令:
1啟動HACMP
使用smitty clstart命令用來啟動HACMP。
# smitty clstart
– 運行指令”smit clstart”回車. 等待命令執行OK,退出smit.
– 等待HACMP完全啟動,可用指令”tail -f /tmp/hacmp.out”觀察HACMP啟動狀況.
– 用指令”netstat -i”檢查IP address,確認主網卡使用service IP adress,
備用網卡使用standby IP address.
– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyon狀態.
– 用指令”df”檢查mount的文件系統.
– 確認屬於Node1的online應用正常.
註:有兩種啟動HACMP的方式:
now:手工啟動HACMP
restart、both:在系統啟動時自動啟動HACMP
2停止HACMP
使用smitty clstop該命令用來停止HACMP。
– 運行指令”smit clstop”回車.在shutdown mode項選擇graceful並回車, 等待命令執行OK,退出smit.
– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”觀察HACMP停止狀況.
– 用指令”netstat -i”檢查IP address,確認主網卡變為boot IP adress,備用網卡使用standby IP address.
– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyoff狀態.
註:有三種停止方式:
graceful: 只停止本節點上HACMP的運行,並釋放由本節點管理的資源,但允許其它節點接管。(是指在關閉雙機軟件時將調用客戶應用預定義的善後處理例程。)
graceful with takeover:停止本節點上HACMP的運行,釋放資源,讓其他節點接管。(是指該節點將關閉雙機軟件並釋放資源請求備節點進行接管。)
forced:停止本節點上HACMP的運行,但不釋放資源。(是指立即關閉雙機軟件不調用任何客戶應用的善後處理例程。)
3查看cluster運行情況和HACMP狀態
使用/usr/es/sbin/cluster/clstat命令用來顯示HACMP狀態。
查看cluster運行情況:/usr/sbin/cluster/clstat
# /usr/sbin/cluster/clinfo –a
/usr/sbin/cluster/clstat可以幫助你查看當前HACMP的節點狀態。
屏幕會如下顯示:
clstat – HACMP for AIX Cluster Status Monitor
—————————————————————-
Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999
State: UP Nodes: 2
SubState: STABLE
Node: j50a State: UP <–節點A狀態
Interface: j50_a_srv (0) Address: 192.9.200.1 <– 服務IP地址
State: UP <–服務IP狀態
Interface: j50_a_tty1 (1) Address: 0.0.0.0
State: UP <–心跳線狀態
Node: j50b State: UP <–節點B狀態
Interface: j50_b_srv (0) Address: 192.9.200.2 <– 服務IP地址
State: UP <–服務IP狀態
Interface: j50_b_tty1 (1) Address: 0.0.0.0
State: UP <–心跳線狀態
************************ f/forward, b/back, r/refresh, q/quit *****************
節點和CLUSTER綠色為正常,紅色表示HACMP宕機或沒有起來,黃色表示HACMP處在不穩定狀態,可能是某節點HACMP正在啟動、切換、停止。
4查看HACMP的輸出
#tail -f /tmp/hacmp.out
HACMP啟動時,用該命令查看該文件中有無報錯顯示
5查看地址信息
#netstat -i
用該命令查看網卡綁定的地址類型是否正確,三種類型:boot1、boot2、service。
6查看邏輯卷組和文件系統
#lsvg -o
用該命令查看應該激活(varyon)的VG是否激活。
#mount
用該命令查看應該mount上的文件系統是否正常。
7、查看HACMP配置情況
# /usr/es/sbin/cluster/utilities/cllscf 顯示群集拓樸
# /usr/es/sbin/cluster/utilities/cllsclstr 顯示群集定義
# /usr/es/sbin/cluster/utilities/cllsnode 按節點顯示拓樸信息
# /usr/es/sbin/cluster/utilities/cllsnw 按網絡名稱顯示拓樸信息
# /usr/es/sbin/cluster/utilities/cllsif 按網卡顯示拓樸信息
# /usr/es/sbin/cluster/utilities/clshowres 顯示資源組信息
8、查看Cluster的進程狀態:
# ps -ef | grep cluster
註:應有三個HACMP進程:clstrmgr、clinfo、clsnuxpd
9、查看Cluster的日誌及錯誤信息(HACMP環境下的排錯):
HACMP的LOG文件:以下文件都是文本文件,可以用VI來看.每個日誌文件都含有每個信息的產生時間.
/usr/adm/cluster.log :記錄了HACMP的狀態,由HA的守護進程所產生.
/tmp/hacmp.out :記錄了HA的詳細腳本.
/usr/sbin/cluster/history/cluster.mmdd :記錄了HA的各個事件的發生.
/tmp/cm.log :由clstrmgr進程產生,每次HA重起時會被覆蓋.
註:可以在啟動HACMP時使用 # tail –f /tmp/hacmp.out命令,以查看HACMP的啟動是否正常或跟蹤啟動時的錯誤信息。
10、查看Cluster運行的歷史記錄:
# cd /usr/sbin/cluster/history
註:此目錄下存放着每天的Cluster運行記錄
11、查看Cluster運行時的網絡情況及資源組的使用情況:
HACMP啟動之前:
# netstat -i
此時應可以看到boot和standby地址
# lsvg -o
此時只能看到本地的VG
HACMP啟動之後:
# netstat -i
此時應可以看到service和standby地址
# lsvg -o
此時應可以看到本地的VG及共享VG
12、存儲和恢復Cluster的配置:
存儲cluster的配置:
#smitty hacmp
選擇:Cluster Configuration→Cluster Snapshots→Add a Cluster Snapshot
鍵入Snapshot文件名(Cluster Snapshot Name)
恢復cluster的配置:
# smitty hacmp
選擇:Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot
鍵入Snapshot文件名(Cluster Snapshot Name)
註:菜單中各項的意義:
Cluster Snapshot Name:指定Cluster Snapshot的文件名
Cluster Snapshot Des cription:對Cluster Snapshot地描述
Un/Configure Cluster Resource:是否重新配置Cluster資源
Force Apply if verify fails:當Cluster校驗失敗時,是否強制恢復配置
13、注意:向由HACMP管理的共享VG中增加FS時的具體步驟為:
1)、# smitty
選擇:System storage management
File systems
Add/change/show/delete file systems
Journaled file systems
Add a journaled file system
Add a standard journaled file system
選擇共享VG
指定FS的大小,Mount point
2)、# smitty clstop
停止HACMP的運行
3)、在增加FS的節點上作:
# varyoffvg SHARE_VG_NAME
# exportvg SHARE_VG_NAME
在另一個節點上作:
# importvg –y SHARE_VG_NAME –f hdiskX
# varyonvg SHARE_VG_NAME
作此步的目的是將新加入的FS的定義取過來
4)、# smitty hacmp
選擇:cluster configuration
cluster resources
define resource group
change/show resources for a resource group
將增加的FS加入到Cluster資源組的定義中
5)、# smitty hacmp
選擇:cluster configuration
cluster resources
synchronize cluster resources
同步Cluster的資源組的配置
6)、# smitty hacmp
選擇:cluster configuration
cluster verification
進行Cluster配置的校驗
14、Cluster的配置參數:
參數名稱參數值
Cluster ID
Cluster Name
Node Name
Resource Group Name
Node RelationshipCascadingcascading
Participating Node Names
Service IP label
Filesystems
Filesystems Consistency Checkfsckfsck
Filesystems Recovery MethodSequentialsequential
Volume Groups
Application Servers
Start s cript
Stop s cript
檢查心跳線是否已經配置好:
1、在兩台上分別輸入如下命令:
S85_1# cat /etc/hosts >/dev/tty0
S85_2# cat
如果在S85_2機能接收到信息,則表明心跳線已經配置好
2、測試心跳線是否可以正常工作:
在A機上:
# stty
在B機上:
# stty
如果在兩台主機上均出現了該TTY的配置信息,則說明心跳線設置正確。
安裝HACMP時,一般不選擇全部安裝,只安裝一部分關鍵的軟件,如cluster.adt、cluster.base、cluster.cspoc和cluster.doc.en_US。
15、HA可把故障機的應用及其資源(包括用到的IP地址和磁盤空間等)接管過來.
1、/usr/es/sbin/cluster/utilities/cllscf Show Cluster Topology
2、/usr/es/sbin/cluster/utilities/cllsclstr Show Cluster Definitions
3、/usr/es/sbin/cluster/utilities/cllsnode Show Topology Information by Node
4、/usr/es/sbin/cluster/utilities/cllsnw Show Topology Information by Network Name
5、/usr/es/sbin/cluster/utilities/cllsif Show Topology Information by Network Adapter
6、/usr/es/sbin/cluster/utilities/clshowres -g’sxptt_con_rg’
Show Resource Information by Resource Group
7、/usr/es/sbin/cluster/utilities/clshowres -n’s85a’
Show Resource Information by Node
Filesystems Consistency Check
1. fsck
2. logredo
Resource Group的三種節點關係
(Node Relationship):
(1) Cascading
(2) Concurrent
(3) Rotating
HA啟動腳本:/usr/sbin/cluster/local/app_start1
HA停止腳本:/usr/sbin/cluster/local/app_stop1
lspv -p hdiskx 列出hdiskx上PP的狀態
lspv hdiskx 看hdiskx上的詳細信息
lspv 看硬盤及所在VG
lslv lv00 查看LV狀態
lsvg -p datavg 看指定VG上所有的硬盤
16、人為接管HACMP
在某些維護情況下,需將某節點的HACMP及應用切換至另一節點.
– 運行指令”smit clstop”回車.在shutdown mode項選擇takeover並回車, 等待命令執行OK,退出smit.
– 等待HACMP完全停止,可用指令”tail -f /tmp/hacmp.out”觀察HACMP停止狀況.
– 用指令”netstat -i”檢查IP address,確認主網卡變為boot IP adress, 備用網卡使用standby IP address.
– 用指令”lsvg -o”檢查vary on 的VG,確認共享VG變為varyoff狀態.
– 在另一節點運行相同命令,確認網卡,VG及應用接管成功。
17、如何刪除系統發給root用的mail ?
# change to system mail directory
cd /var/spool/mail
# backup root mail to OtherUser ( can use pop3 recevied mail user)
# if you have configure /etc/aliases file, you can ignore the step
cat root >> [OtherUserID]
# clean root mail file
true > root
以下文章點擊率最高
Loading…