H3Cloud云計(jì)算軟件故障處理手冊(cè)_第1頁(yè)
H3Cloud云計(jì)算軟件故障處理手冊(cè)_第2頁(yè)
H3Cloud云計(jì)算軟件故障處理手冊(cè)_第3頁(yè)
H3Cloud云計(jì)算軟件故障處理手冊(cè)_第4頁(yè)
H3Cloud云計(jì)算軟件故障處理手冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、H3Cloud云計(jì)算軟件套件故障處理手冊(cè) 存儲(chǔ)故障處理問(wèn)題1共享文件系統(tǒng)存儲(chǔ)池啟動(dòng)失敗處理故障描述iSCSI存儲(chǔ)管理器上,創(chuàng)建“iSCSI共享文件系統(tǒng)”類(lèi)型的存儲(chǔ)池時(shí),顯示“internal error Child process (/bin/mount -t ocfs2 /dev/disk/by-path/ip-:3260-.h3c:storware.target4-lun-0 /vms/target4) status unexpected: exit status 1啟動(dòng)存儲(chǔ)池失敗提示信息只讀屬性故障處理流程iSCSI存儲(chǔ)上配置的物理主機(jī)對(duì)于target的權(quán)限是只讀造成的,修改其權(quán)限為非獨(dú)

2、占式讀寫(xiě)時(shí);由于物理主機(jī)和iSCSI存儲(chǔ)之間的session(會(huì)話(huà))已經(jīng)建立,無(wú)法重新賦予物理主機(jī)權(quán)限,需要手工采用ssh或其它方式登錄到物理主機(jī)上,斷開(kāi)物理主機(jī)和iSCSI存儲(chǔ)target之間的會(huì)話(huà)。故障處理步驟管理員手工登錄到對(duì)應(yīng)的物理服務(wù)器上, 如采用ssh,或直接登錄到物理機(jī)上;采用命令查詢(xún)對(duì)應(yīng)的session會(huì)話(huà):iscsiadm -m session 如查詢(xún)出結(jié)果為: rootvmc-10:/vms/isos# iscsiadm -m session tcp: 2 :3260,1 .h3c:storware.target4 tcp: 4 :3260,1 .h3c:storware.

3、640f02.target3選擇需要logout的target會(huì)話(huà),在iSCSI存儲(chǔ)管理器上的.h3c:storware.target4取消失敗,則執(zhí)行命令: rootvmc-10:/vms/isos# iscsiadm -m node -T .h3c:storware.target4 -u Logging out of session sid: 2, target: .h3c:storware.target4, portal: ,3260 Logout of sid: 2, target: .h3c:storware.target4, portal: ,3260: successful在iS

4、CSI存儲(chǔ)管理器上,將對(duì)應(yīng)的物理主機(jī)從.h3c:storware.target4上取消關(guān)聯(lián)即可, 如取消vmc-10物理主機(jī)對(duì)于target的使用。問(wèn)題2 Web界面上無(wú)法暫?;騽h除存儲(chǔ)池故障描述服務(wù)器上某些進(jìn)程正在使用存儲(chǔ)池掛接的目錄, 導(dǎo)致umount命令失敗,報(bào)錯(cuò):“internal error Child process (/bin/umount /vms/target3) status unexpected: exit status 1”停止共享文件系統(tǒng)的存儲(chǔ)池失敗故障處理流程檢查物理服務(wù)器上是否有進(jìn)程或用戶(hù)正在使用對(duì)應(yīng)的存儲(chǔ)池;根據(jù)查詢(xún)結(jié)果,確認(rèn)可以停止對(duì)應(yīng)的進(jìn)程后,將使用對(duì)應(yīng)的存

5、儲(chǔ)池的進(jìn)程殺掉;在H3Clou配置臺(tái)上再次暫?;騽h除共享存儲(chǔ)池。故障處理步驟手工登錄(如采用ssh,或者直接通過(guò)終端)到對(duì)應(yīng)的物理服務(wù)器上;如存儲(chǔ)池掛接到/vms/share_dir目錄下,則采用命令行:lsof +d /vms/share_dir 查詢(xún)出所有使用該目錄的進(jìn)程; rootvmc-216:# lsof +d /vms/target3 COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME bash 11349 root cwd DIR 8,16 3896 513 /vms/target3 vim 12138 root cwd DIR

6、8,16 3896 513 /vms/target3 vim 12138 root 3u REG 8,16 12288 1412504 /vms/target3/.test.txt.swp采用“kill -9 進(jìn)程號(hào)”方式殺掉所有查詢(xún)出來(lái)的進(jìn)程;注意:這里執(zhí)行完一次kill -9之后,都需要重新采用lsof +d /vms/target3查詢(xún)一下,直到?jīng)]有為止; rootvmc-216:# kill -9 11349 rootvmc-216:# lsof +d /vms/target3在H3Cloud配置臺(tái)部分,對(duì)應(yīng)的存儲(chǔ)池就可以暫停或刪除了。問(wèn)題3刪除iSCSI存儲(chǔ)器上邏輯資源導(dǎo)致物理重啟故

7、障描述在iSCSI存儲(chǔ)管理器上刪除共享文件系統(tǒng)使用的target中的邏輯資源,導(dǎo)致使用該target的物理服務(wù)器重新啟動(dòng)。 故障處理流程管理員需要在H3Cloud上確認(rèn)是否有物理主機(jī)使用target作為共享文件系統(tǒng)后再作刪除決定;管理員需要預(yù)先評(píng)估這種在iSCSI存儲(chǔ)管理器上刪除的風(fēng)險(xiǎn),和其它的類(lèi)似風(fēng)險(xiǎn)。故障處理步驟iSCSI存儲(chǔ)管理員預(yù)先評(píng)估風(fēng)險(xiǎn)后,再作刪除操作。問(wèn)題4物理機(jī)之間系統(tǒng)時(shí)間差別很大時(shí),導(dǎo)致共享文件系統(tǒng)集群異常故障描述共享文件系統(tǒng)的各個(gè)使用物理接點(diǎn)之間系統(tǒng)時(shí)間差別很大時(shí),會(huì)導(dǎo)致共享文件系統(tǒng)集群異常,有些物理機(jī)會(huì)出現(xiàn)共享存儲(chǔ)池的訪(fǎng)問(wèn)異常,無(wú)法列出最新的文件等。故障處理流程在加入對(duì)應(yīng)

8、的物理節(jié)點(diǎn)時(shí),需要檢查物理服務(wù)器的系統(tǒng)時(shí)間是否一致,確保和節(jié)點(diǎn)之間的系統(tǒng)時(shí)間差別在5分鐘之內(nèi)。故障處理步驟檢查各個(gè)物理節(jié)點(diǎn)的系統(tǒng)時(shí)間,確保各個(gè)節(jié)點(diǎn)間的系統(tǒng)時(shí)間差別小于5分鐘。問(wèn)題5共享文件系統(tǒng)使用的磁盤(pán)容量較小時(shí)的異常故障描述共享文件系統(tǒng)采用了OCFS2文件系統(tǒng)格式化磁盤(pán),當(dāng)磁盤(pán)容量小于10G,且其格式化時(shí)采用了很多節(jié)點(diǎn),如32個(gè)節(jié)點(diǎn),可能格式化成功,但磁盤(pán)共享文件系統(tǒng)不可用。故障處理流程對(duì)于容量較小的磁盤(pán)作為共享文件系統(tǒng),采用OCFS2格式化的時(shí)候選擇輸入數(shù)目小的節(jié)點(diǎn)數(shù),如4個(gè),而不采用默認(rèn)的32個(gè)節(jié)點(diǎn)。故障處理步驟共享文件系統(tǒng)格式化時(shí)采用數(shù)據(jù)較少的訪(fǎng)問(wèn)節(jié)點(diǎn)。格式化時(shí)選擇4個(gè)訪(fǎng)問(wèn)節(jié)點(diǎn)問(wèn)題6虛

9、擬機(jī)采用FTP方式備份異常故障描述虛擬機(jī)備份的時(shí)候,采用FTP方式備份,由于在FTP上缺少登錄用戶(hù)的上傳和創(chuàng)建目錄權(quán)限,導(dǎo)致備份過(guò)程中無(wú)法在FTP上創(chuàng)建目錄并上傳文件,備份失敗。故障處理流程修改FTP服務(wù)器上備份時(shí)采用的登錄用戶(hù)的權(quán)限,增加創(chuàng)建目錄和上載權(quán)限。故障處理步驟修改FTP服務(wù)器上備份時(shí)采用的登錄用戶(hù)的權(quán)限,增加創(chuàng)建目錄和上載權(quán)限;再次備份虛擬機(jī)到FTP服務(wù)器。HA故障處理問(wèn)題1 啟用動(dòng)態(tài)資源調(diào)整,虛擬機(jī)未自動(dòng)遷移或遷 移失敗故障描述集群?jiǎn)⒂脛?dòng)態(tài)資源調(diào)整,設(shè)置好持續(xù)時(shí)間、CPU和內(nèi)存利用率閥值、檢查時(shí)間間隔,發(fā)現(xiàn)主機(jī)達(dá)到資源調(diào)整條件,但虛擬機(jī)未自動(dòng)遷移,或遷移失敗。遷移失敗,在系統(tǒng)管理

10、-操作日志中顯示,如下圖顯示虛擬機(jī)遷移失敗故障處理流程如果虛擬機(jī)未自動(dòng)遷移,則查看自動(dòng)遷移條件,是否已經(jīng)滿(mǎn)足遷移條件。如果虛擬機(jī)自動(dòng)遷移失敗,則查看是否是本地存儲(chǔ)等。故障處理步驟如果虛擬機(jī)未自動(dòng)遷移,則按以下步驟查找:檢查動(dòng)態(tài)資源調(diào)整設(shè)置閥值,是否某臺(tái)主機(jī)CPU和內(nèi)存都已超過(guò)閥值,而其余某臺(tái)主機(jī)的CPU和內(nèi)存都未超過(guò)該設(shè)置的閥值?待遷移主機(jī)CPU和內(nèi)存都要超過(guò)閥值,而集群中存在CPU和內(nèi)存都未超過(guò)該閥值的主機(jī)。如果條件滿(mǎn)足,則檢查步驟2。查看CPU和內(nèi)存都超過(guò)閥值的主機(jī)中虛擬機(jī)是否都已勾選“允許自動(dòng)遷移”選項(xiàng),如果沒(méi)有勾選,則在修改虛擬機(jī)面板中勾選即可。如果以上條件滿(mǎn)足,還未遷移,則聯(lián)系技術(shù)人

11、員支持。如果虛擬機(jī)遷移失敗,則按以下步驟查找:查看遷移失敗的虛擬機(jī)是否是本地存儲(chǔ),如果是本地存儲(chǔ),則會(huì)自動(dòng)遷移,但遷移失敗。查看遷移失敗的虛擬機(jī)中是否掛載著光驅(qū),而待遷移到的主機(jī)中沒(méi)有光驅(qū),如果掛載著光驅(qū),則在修改虛擬機(jī)面板取消連接即可。查看遷移失敗的虛擬機(jī)中是否掛載著本地的iso文件,如果是則在修改虛擬機(jī)面板中取消連接即可。如果非以上步驟引起失敗,則查看后臺(tái)日志,請(qǐng)技術(shù)人員支持,查看后臺(tái)日志方法,如下步驟。登錄到集群中主機(jī)中,依次查看后臺(tái)HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當(dāng)前月份),查看當(dāng)前時(shí)刻是否有HA腳本vm_m

12、igrate_*.sh相關(guān)錯(cuò)誤信息?如果錯(cuò)誤日志出現(xiàn)“Failed to migrate vm.”則繼續(xù)查看libvirt和qemu日志。查看libvirt日志,查看方法 tail -100f /var/log/libvirt/libvirtd.log,查看具體遷移失敗原因。查看qemu日志,查看方法tail -100f /var/log/libvirt/qemu/*.log(*為遷移的虛擬機(jī)名稱(chēng)),查看具體遷移失敗原因。問(wèn)題2 集群中在線(xiàn)遷移虛擬機(jī),使用本地存儲(chǔ)提示失敗故障描述在集群中手動(dòng)在線(xiàn)遷移虛擬機(jī)時(shí),提示該虛擬機(jī)使用本地存儲(chǔ),不允許在線(xiàn)遷移失敗。使用本地存儲(chǔ)的虛擬機(jī)不允許在線(xiàn)遷移故障處

13、理流程查看虛擬機(jī)的磁盤(pán)是否使用本地存儲(chǔ)或另一臺(tái)主機(jī)不能識(shí)別共享存儲(chǔ)。查看虛擬機(jī)的光驅(qū)中是否掛載有本地或另一臺(tái)主機(jī)不能識(shí)別存儲(chǔ)的iso,是否掛載有主機(jī)的光驅(qū)。故障處理步驟如果虛擬機(jī)的磁盤(pán)使用本地存儲(chǔ)或另一臺(tái)主機(jī)不能識(shí)別共享存儲(chǔ),則不能遷移。如果虛擬機(jī)有多個(gè)磁盤(pán),其中某個(gè)磁盤(pán)使用本地存儲(chǔ),需要修改虛擬機(jī)面板,刪除該磁盤(pán)后即可遷移。如果虛擬機(jī)的光驅(qū)掛載到主機(jī)光驅(qū),則不能遷移,則修改虛擬機(jī)面板,取消光驅(qū)連接后既可以遷移。如果虛擬機(jī)的光驅(qū)中掛載有本地或另一臺(tái)主機(jī)不能識(shí)別存儲(chǔ)的iso,則修改虛擬機(jī)面板,取消光驅(qū)連接后既可以遷移。問(wèn)題3 集群中離線(xiàn)遷移虛擬機(jī)失敗故障描述手動(dòng)離線(xiàn)遷移虛擬機(jī),遷移虛擬機(jī)的存儲(chǔ),

14、提示失敗,如下圖所示。故障處理流程查看任務(wù)臺(tái)中任務(wù)描述,如果失敗描述原因清楚比如SSH連接錯(cuò)誤,目標(biāo)存儲(chǔ)已存在等,則可知道原因。如果原因不清晰則需查看日志。登錄到云計(jì)算管理平臺(tái)的安裝主機(jī)中,查看運(yùn)行日志;查看方法 tail -100f /var/log/tomcat6/ catalina.out,查看該時(shí)刻是否有異常情況?登錄到集群中主機(jī)中,依次查看后臺(tái)HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當(dāng)前月份),查看當(dāng)前時(shí)刻是否有HA腳本vm_migrate_*.sh相關(guān)錯(cuò)誤信息?如果錯(cuò)誤日志出現(xiàn)“Failed to migrate

15、 vm.”則繼續(xù)查看libvirt和qemu日志。故障處理步驟如果遷移到的主機(jī)的存儲(chǔ)中已經(jīng)存在該虛擬機(jī)的同名鏡像,則遷移需要先確認(rèn)刪除該同名鏡像,本錯(cuò)誤為遷移的鏡像在目標(biāo)主機(jī)中已存在,但也可能由以下錯(cuò)誤引起遷移失敗(非存儲(chǔ)存在失敗)。注意,如果虛擬機(jī)有多個(gè)磁盤(pán),是一并遷移,所以保證不能有一個(gè)存在沖突。如果遷移到的主機(jī)的存儲(chǔ)中剩余磁盤(pán)容量小于虛擬機(jī)鏡像大小,則需要重新掛接磁盤(pán)。注意,離線(xiàn)遷移存儲(chǔ),如果虛擬機(jī)有多個(gè)磁盤(pán),是一并遷移,要保證遷移到的主機(jī)有容納該全部磁盤(pán)的容量。如果為網(wǎng)絡(luò)異常比如SSH連接錯(cuò)誤,確認(rèn)網(wǎng)絡(luò)聯(lián)通后即可。非以上原因,則聯(lián)系技術(shù)人員處理,查看日志方法。登錄到云計(jì)算管理平臺(tái)的安裝

16、主機(jī)中,查看運(yùn)行日志;查看方法 tail -100f /var/log/tomcat6/ catalina.out,查看該時(shí)刻是否有異常情況?登錄到集群中主機(jī)中,依次查看后臺(tái)HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當(dāng)前月份),查看當(dāng)前時(shí)刻是否有HA腳本vm_migrate_*.sh相關(guān)錯(cuò)誤信息?如果錯(cuò)誤日志出現(xiàn)“Failed to migrate vm.”則繼續(xù)查看libvirt和qemu日志。查看libvirt日志,查看方法 tail -100f /var/log/libvirt/libvirtd.log,查看具體遷移失敗

17、原因。查看qemu日志,查看方法tail -100f /var/log/libvirt/qemu/*.log(*為遷移的虛擬機(jī)名稱(chēng)),查看具體遷移失敗原因。問(wèn)題4 集群中某主機(jī)宕機(jī),虛擬機(jī)未在其它主機(jī)中重新啟動(dòng)故障描述集群中多臺(tái)主機(jī),如果某臺(tái)主機(jī)出現(xiàn)宕機(jī)或網(wǎng)絡(luò)故障,而其上的虛擬機(jī)未在集群中其余主機(jī)中重新啟動(dòng)。故障處理流程查看該前臺(tái)集群是否已經(jīng)啟用HA,如果該集群未啟用HA,則不會(huì)擁有高可靠性,不會(huì)重新啟動(dòng)虛擬機(jī)。如果已經(jīng)啟用HA,虛擬機(jī)還未啟動(dòng),查看未啟動(dòng)的虛擬機(jī)是否采用了本地存儲(chǔ),如果采用本地存儲(chǔ),則不能重新啟動(dòng)。非以上問(wèn)題,則查看后臺(tái)日志。故障處理步驟查看該前臺(tái)集群是否已經(jīng)啟用HA,如果該

18、集群未啟用HA,則不會(huì)擁有高可靠性,不會(huì)重新啟動(dòng)虛擬機(jī)。如果前臺(tái)已經(jīng)啟用HA,則ssh登錄后臺(tái),輸入crm status命令,如果出現(xiàn)類(lèi)似如下的輸出:rootH3CRDS09-RD:/# crm statusConnection to cluster failed: connection failedrootH3CRDS09-RD:/#則表示后臺(tái)未啟用HA,前后臺(tái)HA不一致,聯(lián)系技術(shù)人員處理。如果出現(xiàn)類(lèi)似以下輸出,則表示后臺(tái)HA運(yùn)行正常rootH3CRDS13-RD:/# crm status=Last updated: Thu Sep 13 17:24:23 2012Last change:

19、 Wed Sep 12 14:11:19 2012 via crm_resource on H3CRDS13-RDStack: openaisCurrent DC: H3CRDS13-RD - partition with quorumVersion: 1.1.6-9971ebba4494012a93c03b40a2c58ec0eb60f50c4 Nodes configured, 4 expected votes173 Resources configured.=Online: H3CRDS10-RD H3CRDS11-RD H3CRDS12-RD H3CRDS13-RD VMv0000-h

20、05170-160.50(ocf:heartbeat:VirtualDomain):Started H3CRDS10-RD VMv0052-z00398-160.113(ocf:heartbeat:VirtualDomain):Started H3CRDS11-RD VMv0105-z01925-160.166(ocf:heartbeat:VirtualDomain):Started H3CRDS11-RD fence-ssh(stonith:external/ssh):Started H3CRDS11-RDrootH3CRDS13-RD:/#如果后臺(tái)HA也正常,則是未知錯(cuò)誤,則聯(lián)系技術(shù)人員支

21、持。查看后臺(tái)日志方法,如下:登錄到云計(jì)算管理平臺(tái)的安裝主機(jī)中,查看運(yùn)行日志;查看方法 tail -100f /var/log/tomcat6/ catalina.out,查看該時(shí)刻是否有異常情況?登錄到集群中主機(jī)中,依次查看后臺(tái)HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當(dāng)前月份),查看當(dāng)前時(shí)刻是否有HA腳本相關(guān)錯(cuò)誤信息? 如果HA腳本沒(méi)有相關(guān)錯(cuò)誤信息,則查看syslog日志,查看是否有pacemaker的相關(guān)錯(cuò)誤信息?查看方法:tail -100f /var/log/syslog問(wèn)題5 集群?jiǎn)⒂肏A,虛擬機(jī)未能納入HA管理故障

22、描述集群中主機(jī)已經(jīng)存在多臺(tái)虛擬機(jī),現(xiàn)在集群?jiǎn)⒂肏A,其集群下的全部虛擬機(jī)要納入HA管理,便于主機(jī)宕機(jī)時(shí)虛擬機(jī)的重啟。在啟用HA時(shí),某臺(tái)虛擬機(jī)可能未能納入HA管理,此時(shí)啟動(dòng)虛擬機(jī),則失敗,提示集群內(nèi)不存在虛擬機(jī)。類(lèi)似如下錯(cuò)誤:故障處理流程查看任務(wù)臺(tái)中任務(wù)描述,表示在集群中不存在該主機(jī),就是啟用HA時(shí),該虛擬機(jī)未能納入HA管理。ssh登錄到集群任一主機(jī)中,crm status查看集群狀態(tài)。如果確認(rèn)該虛擬機(jī)為加入集群,則后臺(tái)手動(dòng)添加該虛擬機(jī)到集群中。命令如下(共四個(gè)參數(shù)):vm_add.sh vm-name vm-priority 1 host-name ; echo $?命令運(yùn)行失敗,查看后臺(tái)HA

23、腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當(dāng)前月份),查看當(dāng)前時(shí)間段內(nèi),該日志的錯(cuò)誤信息顯示。 故障處理步驟查看任務(wù)臺(tái)中任務(wù)描述,表示在集群中不存在該主機(jī),就是啟用HA時(shí),該虛擬機(jī)未能納入HA管理。ssh登錄到集群任一主機(jī)中,crm status查看集群狀態(tài),如果HA出現(xiàn)未知錯(cuò)誤,類(lèi)似如下:rootH3CRDS09-RD:/# crm statusConnection to cluster failed: connection failedrootH3CRDS09-RD:/#請(qǐng)聯(lián)系技術(shù)人員處理。否則,顯示集群中虛擬機(jī)的狀態(tài),如下:

24、rootH3CRDS13-RD:/# crm status=Last updated: Thu Sep 13 17:24:23 2012Last change: Wed Sep 12 14:11:19 2012 via crm_resource on H3CRDS13-RDStack: openaisCurrent DC: H3CRDS13-RD - partition with quorumVersion: 1.1.6-9971ebba4494012a93c03b40a2c58ec0eb60f50c4 Nodes configured, 4 expected votes173 Resourc

25、es configured.=Online: H3CRDS10-RD H3CRDS11-RD H3CRDS12-RD H3CRDS13-RD VMv0000-h05170-160.50(ocf:heartbeat:VirtualDomain):Started H3CRDS10-RD VMv0052-z00398-160.113(ocf:heartbeat:VirtualDomain):Started H3CRDS11-RD VMv0105-z01925-160.166(ocf:heartbeat:VirtualDomain):Started H3CRDS11-RD fence-ssh(ston

26、ith:external/ssh):Started H3CRDS11-RDrootH3CRDS13-RD:/#查看該狀態(tài)信息,確認(rèn)出現(xiàn)錯(cuò)誤的虛擬機(jī)不在集群狀態(tài)顯示中,則進(jìn)行第3步驟。否則該虛擬機(jī)出現(xiàn)在該顯示狀態(tài)信息中,則聯(lián)系技術(shù)人員處理。后臺(tái)手動(dòng)添加該虛擬機(jī)到集群中。命令如下(共四個(gè)參數(shù)):vm_add.sh vm-name vm-priority 1 host-name ; echo $?Vm-name表示要加入虛擬機(jī)的名稱(chēng)。vm-priority表示HA中虛擬機(jī)的啟動(dòng)優(yōu)先級(jí),為high/middle/low中的一個(gè),如圖,查看集群的虛擬機(jī)啟動(dòng)優(yōu)先級(jí),中級(jí)為middle,其余類(lèi)似。集群?jiǎn)⒂肏

27、A并指定虛擬機(jī)啟動(dòng)優(yōu)先級(jí) Host-name表示要加入的主機(jī)的名稱(chēng),隨便選擇集群中的一個(gè)虛擬機(jī)較少主機(jī)即可。命令返回值:如果為0,表示命令執(zhí)行成功,如果不為0,表示失敗,請(qǐng)確認(rèn)命令調(diào)用是否錯(cuò)誤,如果失敗,定位錯(cuò)誤日志,請(qǐng)聯(lián)系技術(shù)人員處理,則進(jìn)行步驟4。如果命令執(zhí)行成功,再運(yùn)行crm status,查看該虛擬機(jī)是否已經(jīng)加入到集群中,如果已加入集群中,則說(shuō)明已成功恢復(fù)虛擬機(jī)狀態(tài),否則,聯(lián)系技術(shù)人員處理,則進(jìn)行步驟4。查看后臺(tái)HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當(dāng)前月份),查看當(dāng)前時(shí)間段內(nèi),該日志的錯(cuò)誤信息顯示。問(wèn)題6 集群?jiǎn)?/p>

28、用HA失敗,設(shè)置主機(jī)在線(xiàn)失敗故障描述集群中主機(jī)已經(jīng)存在多臺(tái)虛擬機(jī),現(xiàn)在集群?jiǎn)⒂肏A,啟用HA過(guò)程中任務(wù)等待時(shí)間較長(zhǎng),之后任務(wù)臺(tái)報(bào)錯(cuò),錯(cuò)誤如下:集群?jiǎn)⒂肏A時(shí)設(shè)置主機(jī)在線(xiàn)失敗 故障處理流程登錄到集群主機(jī)中,查看運(yùn)行日志,如果多臺(tái)主機(jī),依次ssh登錄,查看后臺(tái)錯(cuò)誤日志。查看網(wǎng)絡(luò)信息后,請(qǐng)重新嘗試。 故障處理步驟登錄到集群主機(jī)中,查看運(yùn)行日志,如果多臺(tái)主機(jī),依次ssh登錄,查看后臺(tái)錯(cuò)誤日志,因?yàn)殄e(cuò)誤日志可能在任一臺(tái)中。查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當(dāng)前月份),查看當(dāng)前時(shí)刻HA腳本”Host online failed”相關(guān)錯(cuò)誤信息, 再查

29、看syslog日志,查看該時(shí)間段是否有pacemaker的相關(guān)錯(cuò)誤類(lèi)似信息?Totem is unable to form a cluster because of an operating system or network fault.查看方法:tail -100f /var/log/syslog。之后進(jìn)行步驟2。確認(rèn)出現(xiàn)錯(cuò)誤日志的主機(jī)的網(wǎng)絡(luò)連接正常,如果網(wǎng)絡(luò)中流量過(guò)大,請(qǐng)等待網(wǎng)絡(luò)流量變小后,重新啟用HA。如果還出現(xiàn)該錯(cuò)誤,請(qǐng)聯(lián)系技術(shù)人員處理。問(wèn)題7 集群虛擬機(jī)遷移時(shí)出現(xiàn)宕機(jī)等故障,之后啟動(dòng)虛擬機(jī)失敗故障描述集群在手動(dòng)遷移虛擬機(jī)或自動(dòng)遷移虛擬機(jī)時(shí),目標(biāo)主機(jī)出現(xiàn)宕機(jī)或者其它嚴(yán)重故障,導(dǎo)致遷移

30、失敗,但源主機(jī)的遷移任務(wù)還一直在持續(xù),也未出現(xiàn)任務(wù)超時(shí),任務(wù)失敗(未知原因)。之后啟動(dòng)虛擬機(jī)出現(xiàn)故障。如果集群未啟用HA,則前臺(tái)報(bào)如下錯(cuò)誤:如果集群?jiǎn)⒂肏A,則前臺(tái)報(bào)錯(cuò)誤不明確,如下,此時(shí)需要后臺(tái)確認(rèn)日志報(bào)錯(cuò)。后臺(tái)libvirt日志/var/log/libvirt/libvirt.log出現(xiàn)如下錯(cuò)誤error : qemuDomainObjBeginJobInternal:781 : Timed out during operation: cannot acquire state change lock, current job mini2 migration out故障處理流程查看后臺(tái)日志,

31、確認(rèn)錯(cuò)誤信息。Virsh domjobinfo vm-name, virsh domjobabort vm-name等命令修改該遷移錯(cuò)誤。 故障處理步驟Ssh登錄到該虛擬機(jī)所在主機(jī),查看后臺(tái)libvirt日志,查看方法:tail -100f /var/log/libvirt/libvirt.log,如果確認(rèn)為該錯(cuò)誤,則進(jìn)行后續(xù)步驟。運(yùn)行命令virsh domjobinfo vm-name; vm-name為出現(xiàn)錯(cuò)誤的虛擬機(jī)名稱(chēng)。運(yùn)行該命令后,會(huì)出現(xiàn)類(lèi)似如下信息:此時(shí)再運(yùn)行virsh domjobabort vm-name,取消該任務(wù),再次運(yùn)行virsh domjobinfo vm-name,出

32、現(xiàn)如下信息:則任務(wù)取消成功。再次啟動(dòng)虛擬機(jī),會(huì)啟動(dòng)正常,如果再有該錯(cuò)誤,則聯(lián)系技術(shù)人員處理。 問(wèn)題8 集群?jiǎn)⒂肏A,虛擬機(jī)啟動(dòng)超時(shí)失敗故障描述集群?jiǎn)⒂肏A,之后啟動(dòng)虛擬機(jī),但是虛擬機(jī)啟動(dòng)過(guò)程過(guò)慢,導(dǎo)致超時(shí),啟動(dòng)失敗,啟動(dòng)過(guò)程過(guò)慢可能是因?yàn)橹鳈C(jī)內(nèi)存過(guò)少,CUP利用率過(guò)高導(dǎo)致。集群?jiǎn)⒂肏A,則前臺(tái)報(bào)錯(cuò)誤不明確,如下,此時(shí)需要后臺(tái)確認(rèn)日志報(bào)錯(cuò)。后臺(tái)HA日志/var/log/ ha_shell_2012*.log(*為當(dāng)前月份),出現(xiàn)如下錯(cuò)誤error : Virtual domain mini2 hasnt been started yet(60 s), FAILED!因?yàn)槭菃?dòng)超時(shí)(即60秒內(nèi),因

33、為內(nèi)存小主機(jī)慢等原因,未能啟動(dòng)完全),可能超時(shí)后,虛擬機(jī)還會(huì)啟動(dòng)成功。故障處理流程查看后臺(tái)日志,確認(rèn)錯(cuò)誤信息。確認(rèn)錯(cuò)誤信息后,等待幾秒,刷新前臺(tái),看是否超時(shí)后虛擬機(jī)又啟動(dòng)成功。 故障處理步驟Ssh登錄到該虛擬機(jī)所在主機(jī),查看后臺(tái)libvirt日志,查看方法:tail -100f /var/log/ ha_shell_2012*.log(*為當(dāng)前月份),如果確認(rèn)為該錯(cuò)誤,則進(jìn)行后續(xù)步驟。確認(rèn)錯(cuò)誤信息后,等待幾十秒,刷新前臺(tái),看是否超時(shí)后該虛擬機(jī)又啟動(dòng)成功運(yùn)行正常,如果又啟動(dòng)成功,則停止操作即可了。如果還是啟動(dòng)失敗,則查看主機(jī)內(nèi)存CPU等信息,清理無(wú)用任務(wù)減少內(nèi)存使用或CPU使用后,再重新啟動(dòng)該虛

34、擬機(jī),如果還出現(xiàn)異常,則聯(lián)系技術(shù)人員處理。問(wèn)題9 集群?jiǎn)⒂肏A,虛擬機(jī)啟動(dòng)失敗故障描述集群?jiǎn)⒂肏A,之后啟動(dòng)虛擬機(jī),但因?yàn)槲粗e(cuò)誤,導(dǎo)致虛擬機(jī)啟動(dòng)失敗。集群?jiǎn)⒂肏A,則前臺(tái)報(bào)錯(cuò)誤不明確,如下,此時(shí)需要后臺(tái)確認(rèn)日志報(bào)錯(cuò)。導(dǎo)致虛擬機(jī)啟動(dòng)失敗的原因很多,主要有:虛擬機(jī)網(wǎng)卡vswitch配置不正確,虛擬機(jī)掛接光驅(qū)但主機(jī)光驅(qū)沒(méi)有,主機(jī)內(nèi)存不夠,虛擬機(jī)鏡像不能找到等。其詳細(xì)信息,請(qǐng)參見(jiàn)中的虛擬機(jī)啟動(dòng)失敗故障。故障處理流程查看后臺(tái)HA日志,查看方法:tail -100f /var/log/ ha_shell_2012*.log(*為當(dāng)前月份), 查看后臺(tái)libvirt和qemu日志。查看libvirt日志,

35、查看方法 tail -100f /var/log/libvirt/libvirtd.log。查看qemu日志,查看方法tail -100f /var/log/libvirt/qemu/*.log(*為虛擬機(jī)名稱(chēng)),查看具體啟動(dòng)原因。 故障處理步驟查看后臺(tái)HA日志,查看方法:tail -100f /var/log/ ha_shell_2012*.log(*為當(dāng)前月份)。查看后臺(tái)libvirt和qemu日志。查看libvirt日志,查看方法 tail -100f /var/log/libvirt/libvirtd.log。查看qemu日志,查看方法tail -100f /var/log/libvi

36、rt/qemu/*.log(*為虛擬機(jī)名稱(chēng)),查看具體啟動(dòng)原因。查找完具體原因后,重新啟動(dòng)虛擬機(jī),如果還失敗,請(qǐng)聯(lián)系技術(shù)人員處理。問(wèn)題10 集群新加入主機(jī),組織管理員部署虛擬機(jī)失敗故障描述系統(tǒng)中存在組織,系統(tǒng)管理員已經(jīng)分配集群、虛擬交換機(jī)、共享存儲(chǔ)、虛擬機(jī)模板給該組織使用,該組織管理員可用使用分配的虛擬機(jī)模板在分配的集群中創(chuàng)建虛擬機(jī)。如果該集群加入一臺(tái)新主機(jī),而新主機(jī)的虛擬交換網(wǎng)絡(luò)和存儲(chǔ)與集群中的原主機(jī)不同,此時(shí)新主機(jī)可以加入集群,但是,已經(jīng)分配使用該集群的組織管理員,通過(guò)模板部署虛擬機(jī)時(shí)可能會(huì)失敗(虛擬機(jī)正好部署到新主機(jī)中,且新主機(jī)沒(méi)有虛擬機(jī)所使用的網(wǎng)絡(luò)與存儲(chǔ),就會(huì)失敗,否則不會(huì)失敗)。錯(cuò)誤

37、如下,但原因可能不同:故障處理流程查看集群中新加入主機(jī)與集群中其余主機(jī)的虛擬交換機(jī)配置和存儲(chǔ)配置。修改新主機(jī)的虛擬交換機(jī)配置和存儲(chǔ)配置,使其與集群中其它主機(jī)一致。 故障處理步驟查看集群中新加入主機(jī)與集群中其余主機(jī)的網(wǎng)絡(luò)配置和存儲(chǔ)配置,前臺(tái)虛擬機(jī)交換機(jī)查看位置如下:虛擬交換機(jī)配置前臺(tái)存儲(chǔ)查看位置如下:主機(jī)上的存儲(chǔ)配置修改新主機(jī)的虛擬交換機(jī)配置和存儲(chǔ)配置,使其與集群中其它主機(jī)一致。虛擬交換機(jī)修改如上圖虛擬機(jī)交換機(jī)圖示所示,修改即可。存儲(chǔ)修改也如上圖所示,但是刪除存儲(chǔ)不允許修改,如要修改需刪除后再添加。但是刪除存儲(chǔ)時(shí),如果有虛擬機(jī)使用該存儲(chǔ),則不允許刪除該存儲(chǔ)。所以需要先刪除虛擬機(jī)再刪除存儲(chǔ),如果虛

38、擬機(jī)不能刪除,則需要全部遷移到其它主機(jī)中,之后再刪除存儲(chǔ)。實(shí)際現(xiàn)場(chǎng)情況,添加的新主機(jī)多數(shù)是沒(méi)有虛擬機(jī),則只需添加比其它主機(jī)少的存儲(chǔ),刪除比其它主機(jī)多的存儲(chǔ)即可。如果新添加主機(jī)與集群中其它主機(jī)虛擬交換機(jī)配置和存儲(chǔ)配置一致,部署還是失敗,請(qǐng)聯(lián)系技術(shù)人員處理。問(wèn)題11 集群?jiǎn)⒂肏A,虛擬機(jī)在線(xiàn)遷移失敗故障描述集群?jiǎn)⒂肏A,虛擬機(jī)在線(xiàn)遷移時(shí),出現(xiàn)錯(cuò)誤,類(lèi)似如下。故障處理流程根據(jù)任務(wù)臺(tái)提示和查看后臺(tái)HA日志,可以得出出錯(cuò)原因是由于目標(biāo)主機(jī)中同名虛擬機(jī)已經(jīng)啟動(dòng)。查看方法:tail -100f /var/log/ ha_shell_2012*.log(*為當(dāng)前月份)。Virsh list查看目標(biāo)主機(jī)中,啟動(dòng)

39、的主機(jī)中是否有待遷移的同名虛擬機(jī)。如果存在同名虛擬機(jī)啟動(dòng),調(diào)用virsh destroy vm-name銷(xiāo)毀該虛擬機(jī),之后再遷移虛擬機(jī)就可以了。 故障處理步驟根據(jù)任務(wù)臺(tái)提示和查看后臺(tái)HA日志,可以得出出錯(cuò)原因是由于目標(biāo)主機(jī)中同名虛擬機(jī)已經(jīng)啟動(dòng)。集群?jiǎn)⒂肏A,則所有的主機(jī)中都會(huì)存在一份相同的虛擬機(jī),以便于某臺(tái)主機(jī)出現(xiàn)故障,虛擬機(jī)在其它主機(jī)中重啟,但是相同虛擬機(jī)只能有一個(gè)在運(yùn)行或暫停,此時(shí)因?yàn)楫惓T驅(qū)е?臺(tái)虛擬機(jī)同時(shí)運(yùn)行,所以遷移時(shí)出錯(cuò)。查看方法:tail -100f /var/log/ ha_shell_2012*.log(*為當(dāng)前月份)。Virsh list查看目標(biāo)主機(jī)中,啟動(dòng)的主機(jī)中是否有

40、待遷移的同名虛擬機(jī),結(jié)果如下:如果沒(méi)有同名主機(jī)在運(yùn)行,請(qǐng)聯(lián)系技術(shù)人員處理。如果存在同名虛擬機(jī)啟動(dòng),調(diào)用virsh destroy vm-name停止該虛擬機(jī),vm-name為虛擬機(jī)名稱(chēng),再調(diào)用virsh list查看是否已經(jīng)停止該虛擬機(jī)。再次遷移虛擬機(jī)就可以了。如果遷移還失敗,請(qǐng)聯(lián)系技術(shù)人員處理。虛擬機(jī)故障處理問(wèn)題1虛擬機(jī)啟動(dòng)失敗故障處理故障描述虛擬機(jī)啟動(dòng)失敗故障處理流程查看虛擬機(jī)鏡像文件是否存在如果虛擬機(jī)鏡像文件不存在或者大小為,查看日志文件/var/log/libvirt/libvirt.log,顯示如下錯(cuò)誤:cannot stat file /vms/images/test_libvir

41、t: No such file or directory。查看虛擬機(jī)光驅(qū)是否存在如果光驅(qū)掛載的是iso文件,到存放iso文件的目錄下查看掛載的iso文件是否存在,如果iso文件不存在查看/var/log/libvirt/libvirt.log,顯示如下錯(cuò)誤:cannot stat file /vms/zxk/vmc-1.63.iso: No such file or directory查看與該虛擬機(jī)連接的虛擬交換機(jī)是否存在。查看服務(wù)器上是否存在與該虛擬機(jī)連接的虛擬交換機(jī),如果不存在查看/var/log/libvirt/libvirt.log,顯示如下錯(cuò)誤:Cannot get interfac

42、e MTU on vs1: No such device查看服務(wù)器內(nèi)存是否被分配完。虛擬機(jī)所在的物理主機(jī)上的物理內(nèi)存太小,已經(jīng)啟動(dòng)的虛擬機(jī)的內(nèi)存總和大于實(shí)際物理內(nèi)存大小,導(dǎo)致虛擬機(jī)無(wú)法啟動(dòng),查看/var/log/libvirt/libvirt.log,顯示如下錯(cuò)誤:Failed to allocate 2529165312 B: Cannot allocate memory故障處理步驟用qemu-img命令重新創(chuàng)建虛擬機(jī)鏡像文件。將系統(tǒng)iso鏡像文件拷貝到相應(yīng)的目錄下。創(chuàng)建xml文件中定義的虛擬交換機(jī)或者改變與虛擬機(jī)網(wǎng)卡相連的虛擬交換機(jī)。給服務(wù)器添加物理內(nèi)存。問(wèn)題2啟動(dòng)時(shí)連接光驅(qū)失敗故障處理故

43、障描述系統(tǒng)從光驅(qū)啟動(dòng)時(shí)不出現(xiàn)系統(tǒng)安裝界面。 故障處理流程檢查光驅(qū)是否連接選擇修改虛擬機(jī)選項(xiàng),查看IDE光驅(qū)選項(xiàng),看光驅(qū)是否處于連接狀態(tài)。如果源路徑是/dev/cdrom,查看服務(wù)器上沒(méi)有光驅(qū)或者光驅(qū)中沒(méi)有放入安裝盤(pán)。如果源路徑是文件,該路徑下不存在鏡像文件。故障處理步驟連接光驅(qū),源路徑選擇/dev/cdrom或者鏡像文件。如果沒(méi)有光驅(qū)可以選擇鏡像文件方式安裝,如果有光驅(qū),將安裝盤(pán)放入光驅(qū),然后從光驅(qū)啟動(dòng)。將安裝鏡像拷貝到相應(yīng)目錄下。問(wèn)題3虛擬機(jī)遷移失敗故障處理故障描述兩臺(tái)主機(jī)運(yùn)行正常,虛擬機(jī)從一臺(tái)主機(jī)遷移到另一臺(tái)主機(jī)失敗。 故障處理流程虛擬機(jī)使用了本地存儲(chǔ),所以不能在線(xiàn)遷移。虛擬機(jī)鏡像文件存儲(chǔ)

44、在共享文件系統(tǒng),但是目的主機(jī)上沒(méi)有掛載該共享文件系統(tǒng),所以遷移失敗。遷移的目的主機(jī)上不存在同名虛擬交換機(jī)或者存在同名虛擬交換機(jī)但是轉(zhuǎn)發(fā)模式不同。故障處理步驟遷移之前先關(guān)閉虛擬機(jī),選擇更改數(shù)據(jù)存儲(chǔ)或同時(shí)遷移主機(jī)和數(shù)據(jù)存儲(chǔ)。在目的主機(jī)上創(chuàng)建和和源主機(jī)相同的共享文件系統(tǒng),或者將源主機(jī)上虛擬機(jī)鏡像文件存儲(chǔ)到一個(gè)和目的主機(jī)相同的共享文件系統(tǒng)中。將源主機(jī)上待遷移的虛擬機(jī)網(wǎng)卡連接到另外一臺(tái)虛擬交換機(jī),該交換機(jī)的名稱(chēng)與轉(zhuǎn)發(fā)模式在與目的主機(jī)上存在的虛擬交換機(jī)相同?;蛘咴谀康闹鳈C(jī)上創(chuàng)建虛擬交換機(jī),該交換機(jī)的名字和轉(zhuǎn)發(fā)模式同源主機(jī)上連接待遷移虛擬機(jī)的虛擬交換機(jī)相同。問(wèn)題4關(guān)閉虛擬機(jī)失敗故障處理故障描述點(diǎn)擊關(guān)閉按鈕不

45、能關(guān)閉虛擬機(jī)。故障處理流程檢查要關(guān)閉的是否linux虛擬機(jī),如果是linux虛擬機(jī),由于缺少acpid進(jìn)程,所以關(guān)閉按鈕不起作用。故障處理步驟直接點(diǎn)擊關(guān)閉電源按鈕關(guān)閉虛擬機(jī)。虛擬交換機(jī)故障處理問(wèn)題1有網(wǎng)口接入VEPA或多通道類(lèi)型的虛擬交換機(jī)上的虛擬機(jī),啟動(dòng)成功后,界面上提示”虛擬網(wǎng)卡異?!?故障描述主機(jī)h3cvms01上創(chuàng)建有多通道類(lèi)型的虛擬交換機(jī)vs1,其上行物理接口為eth1,eth1同鄰接交換機(jī)的Ten-GigabitEthernet1/0/11直連,且在交換機(jī)(比如s5830v2)的直連接口上已配置使能EVB功能,如下:#interface Ten-GigabitEthernet1/0

46、/11 evb enable evb vdp timer resource-wait-delay exponent 22lldp tlv-enable dot1-tlv evb#交換機(jī)上已經(jīng)配置default manager ID為iMC的地址(例如02):evb default-manager ip 02 port 8080主機(jī)h3cvms01上已配置網(wǎng)絡(luò)策略模板vsi-vlan10-imc,從iMC獲取VSI策略等信息虛擬機(jī)vm01有且僅有一個(gè)網(wǎng)絡(luò)接口,接入vs1,引用策略模板vsi-valn10-imc啟動(dòng)虛擬機(jī)vm01,啟動(dòng)成功,但界面右下角上出現(xiàn)提示“虛擬機(jī)網(wǎng)卡異常”的小窗口,類(lèi)似如

47、下:虛擬機(jī)網(wǎng)卡異常示意圖故障處理流程檢查服務(wù)器側(cè)和交換機(jī)側(cè)的配置是否正確檢查服務(wù)器上虛擬交換機(jī)的上行口同交換機(jī)的連接是否正常檢查交換機(jī)同iMC的連接是否正常,是否可達(dá)檢查服務(wù)器側(cè)的lldpad進(jìn)程是否處于運(yùn)行狀態(tài)檢查iMC的license是否正常,是否授權(quán)了ReSTful接口,虛擬機(jī)的mac地址在iMC的連接管理中是否可見(jiàn)。故障處理步驟檢查虛擬交換機(jī)vs1的上行物理接口eth1同物理交換機(jī)s5830v2的連線(xiàn)是否正常;可以在5830v2上通過(guò)dis interface brief命令行查看接口Ten-GigabitEthernet1/0/11是否是UP的:5830dis interface b

48、rief The brief information of interface(s) under route mode:Link: ADM - administratively down; Stby - standbyProtocol: (s) - spoofingInterface Link Protocol Main IP Description M-GE0/0/0 UP UP 2 NULL0 UP UP(s) - REG0 DOWN DOWN - The brief information of interface(s) under bridge mode:Link: ADM - adm

49、inistratively down; Stby - standbySpeed or Duplex: (a)/A - auto; H - half; F - fullType: A - access; T - trunk; H - hybridInterface Link Speed Duplex Type PVID Description XGE1/0/1 DOWN auto A A 1 XGE1/0/10 DOWN auto A A 1 XGE1/0/11 UP 10G(a) F(a) T 1 XGE1/0/12 DOWN auto A A 1 XGE1/0/24 DOWN auto A

50、A 1 5830檢查交換機(jī)側(cè)接口Ten-GigabitEthernet1/0/11上是否正確配置了使能EVB功能,一個(gè)正確的配置類(lèi)似如下,其中藍(lán)色部分的內(nèi)容是必須配置的。5830-Ten-GigabitEthernet1/0/11dis this#interface Ten-GigabitEthernet1/0/11 evb enable evb vdp timer resource-wait-delay exponent 22 evb s-channel 2 service-vlan 2 evb s-channel 3 service-vlan 3 port link-type trunk

51、port trunk permit vlan 1 lldp tlv-enable dot1-tlv evb#return5830-Ten-GigabitEthernet1/0/11檢查交換機(jī)側(cè)是否配置了網(wǎng)絡(luò)策略模板中指定的vlan,比如本例中為vlan10,可以通過(guò)dis vlan 命令檢查,類(lèi)似如下5830dis vlan 190The specified VLANs do not exist.5830dis vlan 10 VLAN ID: 10 VLAN type: Static Route interface: Not configured Description: VLAN 0010

52、 Name: VLAN 0010 Tagged ports: None Untagged ports: None5830不管vswitch(即vs1)的轉(zhuǎn)發(fā)模式為VEPA或多通道,交換機(jī)側(cè)的默認(rèn)s通道接口上都必須配置為trunk類(lèi)型,如下:5830interface S-Channel 1/0/11:1#這里的:1即表示缺省S通道5830-S-Channel1/0/11:1dis this#interface S-Channel1/0/11:1#return5830-S-Channel1/0/11:1port link-type trunk5830-S-Channel1/0/11:1dis t

53、his#interface S-Channel1/0/11:1 port link-type trunk port trunk permit vlan 1 #return5830-S-Channel1/0/11:1檢查虛擬機(jī)的MAC地址是否正確,必須是單播mac;即mac地址的最高一個(gè)字節(jié)的第0位不能是1,比如MAC地址cd a4 11 d1 cc 09中的最高一個(gè)字節(jié)cd,其二進(jìn)制為1100 1101,第0位為1,所以是多播mac。這種情況下,請(qǐng)關(guān)閉虛擬機(jī),給網(wǎng)絡(luò)接口重新分配一個(gè)mac。檢查服務(wù)器側(cè)的lldpad進(jìn)程是否正常運(yùn)行,可以ssh登錄到h3cvms01,執(zhí)行如下命令查看,如果是ru

54、nning狀態(tài)的,則說(shuō)明正常運(yùn)行:rooth3cvms01:# service lldpad statusChecking for service lldpad: runningrooth3cvms01:#檢查交換機(jī)同iMC的連接是否正常,可以通過(guò)在交換機(jī)上執(zhí)行ping操作查看如果是多通道類(lèi)型的vswitch,檢查CDCP協(xié)商是否正常,可以通過(guò)在h3cvms01服務(wù)器終端上執(zhí)行如下命令查看,正常情況下的信息如下:rooth3cvms01:# lldptool -t -i eth5 -V cdcpCfg scidscid = 2-3rooth3cvms01:# lldptool -t -i et

55、h5 -V cdcpCfg operscidoperscid = ,rooth3cvms01:#如果紅色部分的SVID為0,則說(shuō)明CDCP協(xié)商失敗。需要抓包或打開(kāi)服務(wù)器側(cè)和交換機(jī)側(cè)的debug信息進(jìn)一步分析。檢查服務(wù)器側(cè)是否有異常的VDP連接信息存在,比如vm01的網(wǎng)絡(luò)接口的VSIID為55b299ed-d78a-4e52-bcd5-0b87b84b18c4,那么在vm01處于關(guān)閉狀態(tài)時(shí),在h3cvms01的終端上執(zhí)行如下命令,應(yīng)該看不到有該VSIID的信息存在(其中eth1為vs1的上行物理接口名):rooth3cvms01:# lldptool -t -i eth1 -V vdp inst

56、ance=allinstancerooth3cvms01:# rooth3cvms01:#如果有的話(huà),則說(shuō)明有殘留的VDP連接信息存在,請(qǐng)先執(zhí)行如下命令刪除殘留VDP連接:rooth3cvms01:# lldptool -T -i eth5 -V vdp delinst=55b299ed-d78a-4e52-bcd5-0b87b84b18c4rooth3cvms01:#然后,再重新啟動(dòng)虛擬機(jī)vm01檢查iMC的license是否過(guò)期,如果過(guò)期,請(qǐng)重新申請(qǐng)license;是否申請(qǐng)了ReSTful接口的授權(quán),如果沒(méi)有授權(quán),請(qǐng)重新申請(qǐng)license。在iMC同交換機(jī)側(cè)相連接的接口上進(jìn)行抓包,分析交換

57、機(jī)同iMC的http交互報(bào)文,查看交換機(jī)是否向iMC發(fā)送了上線(xiàn)的http請(qǐng)求,iMC側(cè)是否回應(yīng)了成功的http應(yīng)答。如果交換機(jī)沒(méi)有向iMC發(fā)送上線(xiàn)的http請(qǐng)求,則問(wèn)題同iMC無(wú)關(guān),需要在服務(wù)器的eth1口上抓包,同時(shí)打開(kāi)交換機(jī)上的evb相關(guān)debug,進(jìn)行協(xié)議層面的分析定位。如果交換機(jī)向iMC發(fā)送了http上線(xiàn)請(qǐng)求,而iMC無(wú)http應(yīng)答或應(yīng)答錯(cuò)誤(即返回碼不是200 OK),則需要進(jìn)一步分析iMC側(cè)的日志信息,以便確定具體原因。問(wèn)題2服務(wù)器同非VEPA交換機(jī)的連接在iMC拓?fù)渖衔凑_展現(xiàn) 故障描述主機(jī)h3cvms01的eth0同s5800相連接,s5800不支持VEPA功能(或同s5820

58、v2相連接,但是不啟用VEPA功能)在iMC上增加了設(shè)備h3cvms01、s5800等設(shè)備在iMC的拓?fù)渖险宫F(xiàn)的h3cvms01同s5800的連接關(guān)系不正確,看不到鄰居信息故障處理流程查看iMC同s5800以及h3cvms01的連通情況,確??蛇_(dá)登錄到s5800查看同h3cvms01相連接的接口上的鄰居信息是否正確故障處理步驟ssh登錄到h3cvms01上判斷eth0口上是否使能了發(fā)送lldpad報(bào)文:rooth3cvms01:# lldptool -l -i eth1 adminstatusadminStatus = disabledrooth3cvms01:#如上為未使能狀態(tài),則執(zhí)行如下命

59、令使能發(fā)送lldp報(bào)文:rooth3cvms01:# lldptool -L -i eth1 adminstatus=rxtxrooth3cvms01:# lldptool -l -i eth1 adminstatusadminStatus = rxtxrooth3cvms01:#虛擬機(jī)客戶(hù)操作系統(tǒng)使用的故障處理問(wèn)題1在Google Chrome瀏覽器中打開(kāi)H3Cloud云計(jì)算管理平臺(tái),打開(kāi)某虛擬機(jī)的控制臺(tái),無(wú)法出現(xiàn)控制臺(tái)窗口故障描述虛擬機(jī)vm01安裝了window7系統(tǒng),處于運(yùn)行狀態(tài)使用Google Chrome瀏覽器打開(kāi)H3Cloud云計(jì)算管理平臺(tái),選中虛擬機(jī)vm01,并點(diǎn)擊“控制臺(tái)”頁(yè)簽下的“打開(kāi)控制臺(tái)”按鈕,無(wú)法出現(xiàn)控制臺(tái)窗口,如下圖所示:Google Chrome瀏覽器中打開(kāi)虛擬機(jī)控制臺(tái)故障處理流程確認(rèn)Google Chrome瀏覽器所在的主機(jī)是否已經(jīng)安裝了JRE。設(shè)置故障處理步驟如果Google Chrome瀏覽器所在的主機(jī)未安裝了J

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論