版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、Veritas Storage Foundation and High Availability Solutions 故障排除指南AIX6.0Veritas Storage Foundation and High Availability Solutions 故障排除指南本手冊所述軟件是根據(jù)版本 6.0文檔版本 6.0.0協(xié)議而提供,僅可按該協(xié)議的條款使用。法律Copyright © 2012 Symantec Corporation. © 2012 Symantec Corporation所有。Allrights. 保留所利。Symantec、Symantec 徽標(biāo)、Ve
2、ritas、Veritas Storage Foundation、CommandCentral、NetBackup、Enterprise Vault 和LiveUpdate 是Symantec Corporation 或其附屬公司在美國和其他/地區(qū)的商標(biāo)或商標(biāo)?!癝ymantec”和“賽門鐵克”是Symantec Corporation在中國的商標(biāo)。其他名稱可能為其各自所有者的商標(biāo),特此。本文檔中介紹的根據(jù)限制其使用、分發(fā)和反編譯/逆向工程的協(xié)議分發(fā)。,不得Symantec Corporation(賽門鐵克公司)及其特許人(如果存在)事先以任何方式本文檔的。本文檔按“現(xiàn)狀”提供,對于所有明示或
3、暗示的條款、陳述和保證,包括任何適銷性、針對特定用途的適用性或無知識產(chǎn)權(quán)的暗示保證,均不提供任何擔(dān)保,除非此類免責(zé)的范圍在法律上視為無效。Symantec Corporation(賽門鐵克公司)不對任何與提供、執(zhí)行或使用本文檔相關(guān)的伴隨或后果性損害負(fù)責(zé)。本文檔所含信息更改,恕不另行通知。根據(jù) FAR 12.212 中的定義,的軟件和文檔被視為“商業(yè)計算機軟件”,受 FAR 第52.227-19 節(jié)“Commercial Computer Software - Restricted Rights”(商業(yè)計算機軟件受限權(quán)利)和 DFARS 第 227.7202 節(jié)“Rights in Commer
4、cial Computer Software or Commercial Computer Software Documentation”(商業(yè)計算機軟件或商業(yè)計算機軟件文檔權(quán)利)中的適用規(guī)定,以及所有后續(xù)中規(guī)定的權(quán)利的制約。美國僅可根據(jù)本協(xié)議的條款對的軟件和文檔進行使用、修改、發(fā)布、執(zhí)行、顯示或披露。Symantec Corporation 350 Ellis StreetMountain View, CA 94043http:技術(shù)支持Symantec 技術(shù)支持具有全球性支持中心。技術(shù)支持的主要任務(wù)是響應(yīng)有關(guān)特性和功能的特定。技術(shù)支持小組還負(fù)責(zé)編寫我們的聯(lián)機知識庫文章。技術(shù)支持小組與 Sym
5、antec 內(nèi)的其他相互協(xié)作,及時解答您的問題。例如,技術(shù)支持小組與工程和 Symantec 安全響應(yīng)中心協(xié)作,提供警報服務(wù)和服務(wù)。Symantec 提供的維護服務(wù)包括:定義更新 一系列支持服務(wù),使您能為任何規(guī)模的選擇適用的支持服務(wù) 通過和 Web 支持快速響應(yīng)并提供最新信息 升級保證可保證軟件順利升級 全天候提供全球支持高級功能,包括“客戶管理服務(wù)”有關(guān) Symantec 維護計劃的http:信息,請我們的:/support/index.jsp與技術(shù)支持具有有效維護協(xié)議的客戶可以通過以下技術(shù)支持信息:http:在/support/index.jsp技術(shù)支持之前,請確保您的計算機符合文檔中所列
6、的系統(tǒng)要求。而且您應(yīng)當(dāng)坐在發(fā)生問題的計算機旁邊,以便需要時重現(xiàn)問題。技術(shù)支持時,請準(zhǔn)備好以下信息: 版本信息 硬件信息 可用內(nèi)存、磁盤空間和 NIC 網(wǎng)卡信息 操作系統(tǒng) 版本和補丁程序級別 網(wǎng)絡(luò)結(jié)構(gòu) 路由器、網(wǎng)關(guān)和 IP 地址信息 問題說明: 錯誤消息和日志文件Symantec 之前執(zhí)行過的故障排除操作 最近所做的軟件配置更改和網(wǎng)絡(luò)更改與如果您的 Symantec需要或/證密鑰,請我們的技術(shù)支持網(wǎng)頁:客戶服務(wù)可從以下http:獲得客戶服務(wù)信息:/support/index.jsp客戶服務(wù)可幫助您解決一些非技術(shù)性問題,例如以下幾類問題: 有關(guān)或序列號的問題更新(例如,更改地址或名稱)信息(功能、
7、可用的語言、當(dāng)?shù)亟?jīng)銷商) 更新和升級的最新信息 一般 有關(guān) 有關(guān)升級保障和維護合同的信息 Symantec 采購計劃的相關(guān)信息 有關(guān) Symantec 技術(shù)支持選項的建議 非技術(shù)性的售前問題 與光盤或手冊相關(guān)的問題維護協(xié)議如果想就現(xiàn)有維護協(xié)議事宜聯(lián)絡(luò) Symantec,請通過以下方式聯(lián)絡(luò)您所在地區(qū)的維護協(xié)議管理部門:/地區(qū)電子郵件800 810 8826-陸0080 1611 391-中國800 963 421-中國特別行政區(qū)文檔介質(zhì)中提供了PDF 格式的指南。請確保您使用的是文檔的最新版本。每個指南的第 2 頁提供了文檔版本信息。從 Symantec可以獲取最新的文檔。https:/docu
8、ments您對文檔的反饋對我們很重要。請改進建議和有關(guān)錯誤或疏漏的報告。請在您的報告中包括所報告的文本內(nèi)容的文檔標(biāo)題和文檔版本(位于第二頁上)以及章節(jié)標(biāo)題。請將反饋doc_fee關(guān)于 Symantec Connect到:Symantec Connect 是為 Symantec 企業(yè)客戶提供的點對點技術(shù)社區(qū)。參與者可以與其他用戶聯(lián)絡(luò)并共享信息,包括創(chuàng)建帖子、文章、博客和提出建議,并可與 Symantec行評分,成員可憑其貢獻獲得團隊和技術(shù)支持進行交流。內(nèi)容會由社區(qū)進。http:/connect/storage-management目錄技術(shù)支持4第 1 章簡介13關(guān)于 Veritas Storag
9、e Foundation and High Availability Solutions 產(chǎn)品故障排除13關(guān)于 Symantec Operations Readiness Tools13用于收集 VxExplorer 故障排除存檔的增強功能14關(guān)于 SORT 數(shù)據(jù)收集器15關(guān)于唯一消息標(biāo)識符15使用Symantec Operations Readiness Tools 查找唯一消息標(biāo)識符說明和解決方案15部分 1第 2 章Veritas File System 故障排除17診斷消息19文件系統(tǒng)對問題的響應(yīng)19恢復(fù)禁用的文件系統(tǒng)20關(guān)于內(nèi)核消息20關(guān)于全局消息 ID20部分 2第 3 章Veri
10、tas Volume Manager 故障排除21硬件故障后恢復(fù)23關(guān)于硬件故障后恢復(fù)23列出不可啟動的卷24顯示卷和 Plex 狀態(tài)24Plex 狀態(tài)循環(huán)25恢復(fù)不可啟動的鏡像卷28恢復(fù)不可啟動的卷(其中禁用的 Plex 為 RECOVER 狀態(tài))28強制重新啟動禁用的卷29清除磁盤上的 failing 標(biāo)志30重新掛接出錯的磁盤31在 Plex 掛接或同步操作失敗后恢復(fù)318目錄RAID-5 卷上的故障32系統(tǒng)故障32磁盤故障33RAID-5 的默認(rèn)啟動恢復(fù)過程34恢復(fù) RAID-5 卷35在移動 RAID-5 子磁盤后恢復(fù)37不可啟動的 RAID-5 卷38在整的磁盤組移動后恢復(fù)40在
11、DCO 卷出現(xiàn)故障后恢復(fù)40恢復(fù) 0 版 DCO 卷42恢復(fù) 30 版 DCO 卷45第 4 章在即時快照故障后恢復(fù)47在 vxsnap prepare 失敗后恢復(fù)47在對完整空間即時快照執(zhí)行 vxsnap make 失敗后恢復(fù)48在對斷開即時快照執(zhí)行 vxsnap make 失敗后恢復(fù)48在對優(yōu)化空間即時快照執(zhí)行 vxsnap make 失敗后恢復(fù)49在 vxsnap restore 失敗后恢復(fù)49在 vxsnap reattach 或 vxsnap refresh 失敗后恢復(fù)49在“寫入時”失敗后恢復(fù)50發(fā)生重新同步 I/O 錯誤后恢復(fù)50DCO 卷發(fā)生 I/O 故障后恢復(fù)51第 5 章在
12、引導(dǎo)磁盤故障后恢復(fù)53VxVM 和引導(dǎo)磁盤故障53通過重新安裝來恢復(fù)53一般重新安裝信息53重新安裝系統(tǒng)并恢復(fù) VxVM54第 6 章管理命令和事務(wù)63命令日志63事務(wù)日志65命令日志和事務(wù)日志的關(guān)聯(lián)66將從從屬節(jié)點發(fā)出的 CVM 命令關(guān)聯(lián)到主節(jié)點67未啟用命令完成69第 7 章備份和還原磁盤組配置71關(guān)于磁盤組配置備份71備份磁盤組配置72還原磁盤組配置73解決磁盤組的備份75目錄9第 8 章對磁盤組導(dǎo)入問題進行故障排除77清除非克隆磁盤的 udid_mismatch 標(biāo)志77第 9 章從 CDS 錯誤恢復(fù)79CDS 錯誤代碼和恢復(fù)操作79第 10 章錯誤消息83關(guān)于錯誤消息83如何錯誤消息
13、83中配置日志84在啟動消息類型85消息86第 11 章Veritas Volume Replicator 故障排除87RLINK 連接出現(xiàn)問題后恢復(fù)87發(fā)生配置錯誤后恢復(fù)90RLINK 掛接期間的錯誤90修改 RVG 期間的錯誤93恢復(fù)97主節(jié)點主機97主節(jié)點數(shù)據(jù)卷發(fā)生錯誤后恢復(fù)97主節(jié)點 SRL 卷錯誤清除和重新啟動100重新啟動時主節(jié)點 SRL 卷出錯101主節(jié)點 SRL 卷溢出恢復(fù)101主節(jié)點 SRL 頭錯誤和恢復(fù)101輔助節(jié)點數(shù)據(jù)卷錯誤清除和恢復(fù)102輔助節(jié)點 SRL 卷錯誤清除和恢復(fù)104輔助節(jié)點 SRL 頭錯誤清除和恢復(fù)104重新啟動時發(fā)生輔助節(jié)點 SRL 頭錯誤106部分 3第
14、 12 章動態(tài)多徑處理故障排除109DMP 故障排除111升級到 DMP 6.0 后顯示擴展屬性111降級陣列支持11210目錄部分 4Veritas Storage Foundation Cluster File System High Availability 故障排除113Veritas Storage Foundation Cluster File SystemHigh Availability 故障排除115關(guān)于 Veritas Storage Foundation Cluster File System High Availability故障排除115CFS 故障排除115root
15、 用戶的 <library> 路徑中的順序不正確116非 root 用戶運行 CFS 命令時 CFS 命令可能會掛起 (2403263)116防護配置故障排除117已有網(wǎng)絡(luò)(裂腦)的示例117從已有網(wǎng)絡(luò)(裂腦)中恢復(fù)117Cluster Volume Manager 故障排除119將節(jié)點添加到集群后,CVM 組處于脫機狀態(tài)119無法導(dǎo)入共享磁盤組120導(dǎo)入共享磁盤組時出錯121無法啟動 CVM121即使 CVMCluster 處于聯(lián)機狀態(tài),CVMVolDg 也不能聯(lián)機121第 13 章部分 5第 14 章Veritas Cluster Server 故障排除123VCS 的故障排除
16、與恢復(fù)125VCS 消息日志GAB 消息日志. 125. 127為啟用調(diào)試日志127啟用 IMF 的調(diào)試日志128對 VCS 引擎啟用調(diào)試日志129關(guān)于調(diào)試日志標(biāo)記用法129收集 VCS 信息以進行支持分析130收集 LLT 和 GAB 信息以進行支持分析131收集 IMF 信息以進行支持分析132消息目錄132VCS 引擎故障排除133HAD 診斷133HAD 連續(xù)重新啟動133DNS 配置問題導(dǎo)致 GAB 終止 HAD134設(shè)定和 I/O 防護134聯(lián)機前 IP 檢查134Low Latency Transport (LLT) 故障排除135目錄11LLT 啟動顯示錯誤135LLT 檢測到
17、使用了交叉鏈路135LLT 鏈路狀態(tài)消息136Group Membership Services/Atomic Broadcast (GAB) 故障排除138GAB 計時器問題138端口在重新打開時出現(xiàn)延遲139由于客戶端進程故障,導(dǎo)致節(jié)點139VCS 啟動故障排除140VCS:10622 local configuration missing140VCS:10623 local configuration invalid140VCS:11032 registration failed.Exiting140Waiting for cluster membership.141智能監(jiān)視框架 (IM
18、F) 故障排除141服務(wù)組故障排除142VCS自動啟動服務(wù)組142系統(tǒng)未處于 RUNNING 狀態(tài)142服務(wù)組未配置為在該系統(tǒng)上運行142服務(wù)組未配置為自動啟動143服務(wù)組已凍結(jié)143故障轉(zhuǎn)移服務(wù)組在另一個系統(tǒng)上處于聯(lián)機狀態(tài)143某個關(guān)鍵出現(xiàn)故障143已自動禁用服務(wù)組143服務(wù)組正在等待聯(lián)機/脫機144服務(wù)組正在等待某個依賴關(guān)系得到滿足144未完全探查到服務(wù)組144故障排除145由于故障轉(zhuǎn)移而使服務(wù)組聯(lián)機145正在等待服務(wù)組狀態(tài)145正在等待子145正在等待父145正在等待響應(yīng)145未運行145磁盤組的 Monitor點返回 ONLINE,即使磁盤組已被禁用也是如此146I/O 防護故障排除1
19、46正在逐出某個節(jié)點時,另一個節(jié)點不能加入集群147當(dāng) SCSI TEST UNIT READY 命令失敗時,vxfentsthdw 實用程序?qū)⑹?47手動刪除 SCSI-3 磁盤中的現(xiàn)有鍵147為防止?jié)撛跀?shù)據(jù)損壞,系統(tǒng)發(fā)生149協(xié)調(diào)器磁盤的 I/O 防護鍵上的集群 ID 與本地集群的 ID 不匹配153防護啟動報告已有的裂腦15412目錄鍵會在協(xié)調(diào)器磁盤中丟失156集群脫機時替換損壞的磁盤156如果 rcp 命令或 scp 命令不能正常運行,vxfenswap 實用程序會. 158CP 服務(wù)器故障排除159SFHA Solutions 集群節(jié)點上基于服務(wù)器的防護的故障排除160協(xié)調(diào)點聯(lián)機遷
20、移期間發(fā)生的問題161通知故障排除161已配置通知程序,但在 SNMP 控制臺上看不到陷阱161全局集群的故障排除與恢復(fù)162. 162丟失的心跳和機制162VCS 警報162對 steward 進程進行故障排除164故障排除165驗證證密鑰165錯誤消息166索引1691簡介 關(guān)于 Veritas Storage Foundation and High Availability Solutions除 關(guān)于 Symantec Operations Readiness Tools 關(guān)于唯一消息標(biāo)識符故障排關(guān)于 Veritas Storage Foundation and High Availab
21、ilitySolutions故障排除本文檔介紹在使用 Veritas Storage Foundation and High Availability Solutions 時可能會出現(xiàn)的常見問題并提供針對這些問題的可能解決方案。除了本文檔中的故障排除信息之外,還可以參見相應(yīng)的 Symantec題和軟件限制?!鞍姹菊f明”文檔以了解已知問關(guān)于 Symantec Operations Readiness ToolsSymantec Operations Readiness Tools (SORT) 是一個,可自動處理和簡化某些最耗時的管理任務(wù)。SORT 有助于您更高效地管理數(shù)據(jù)中心,并充分利用Sym
22、antec。SORT 可以幫助您執(zhí)行以下操作:14簡介關(guān)于 Symantec Operations Readiness Tools為下一次安裝或升級做準(zhǔn)備列出安裝和升級要求,包括操作系統(tǒng)版本、內(nèi)存、磁盤空間和體系結(jié)構(gòu)。分析系統(tǒng)以確定是否已做好安裝或升級 Symantec的準(zhǔn)備。從儲存庫最新的修補程序、文檔和高可用性。硬件、軟件、數(shù)據(jù)庫和操作系統(tǒng)的最新兼容性列表。管理風(fēng)險從儲存庫獲取有關(guān)對修補程序、陣列特定模塊(ASL/APM/DDI/DDL) 和高可用性件通知。確定并降低系統(tǒng)和環(huán)境風(fēng)險。所做更改的自動電子郵顯示數(shù)百個 Symantec 錯誤代碼的說明和解決方案。提高效率根據(jù)版本和平臺查找并修補
23、程序。證密鑰。列出已安裝的 Symantec調(diào)整并優(yōu)化您的環(huán)境。和注意:SORT 的某些功能并非對所有SORT 不需要額外費用。都可用。要SORT,請轉(zhuǎn)到:https:/用于收集 VxExplorer 故障排除存檔的增強功能SORT 數(shù)據(jù)收集器包含收集和提交VxExplorer 存檔的功能。您可以將此存檔給Symantec 技術(shù)支持以便診斷并排除故障。VxExplorer 不收集。舊 VxExplorer已廢棄,因此未在 Veritas Storage Foundation and HighAvailability Solutions 6.0 版本中提供。您可以使用 SORT 數(shù)據(jù)收集器選擇性
24、地執(zhí)行下列操作: 使用基于操作系統(tǒng)的Shell (RSH) 或安全 Shell (SSH)器收集 VxExplorer 數(shù)據(jù)。功能從多臺服務(wù) 將數(shù)據(jù)自動上傳到的ing 目錄。 確定指定服務(wù)器是否為集群的一部分,并將其他集群節(jié)點添加到數(shù)據(jù)收集/VxExplorer 進程(部分集群檢查)。 自動升級數(shù)據(jù)收集器。如果服務(wù)器沒有 Internet 連接,則會自動禁用此功能。您還可以通過更新 sortdc.conf 配置文件來手動禁用自動升級。簡介關(guān)于唯一消息標(biāo)識符15關(guān)于 SORT 數(shù)據(jù)收集器SORT 數(shù)據(jù)收集器包含在 VRTSspt 軟件包中,并在安裝 SFHA Solutions 時安裝在系統(tǒng)上。
25、標(biāo)準(zhǔn)數(shù)據(jù)收集器功能包括下列功能: 采用可讀的標(biāo)準(zhǔn) Perl編寫。 使用同一工具生成 SORT 自定義報告并收集 VxExplorer 存檔。 數(shù)據(jù)收集器日志和 SFHA Solutions 安裝日志具有相同格式。數(shù)據(jù)收集器日志存儲在 /sort/log/ 目錄中。要了解有關(guān)使用數(shù)據(jù)收集器收集 VxExplorer 存檔的詳細信息,請參見:http:/docs/HOWTO32575關(guān)于唯一消息標(biāo)識符Symantec 企業(yè)會顯示唯一消息標(biāo)識符 (UMI) 消息代碼。UMI 包括錯誤、警告和信息性消息。如果您收到 UMI,可以使用 Symantec Operations Readiness Tool
26、s (SORT) 查找消息說明和解決方案。請參見第 13 頁的“關(guān)于 Symantec Operations Readiness Tools”。請參見第 15 頁的“使用 Symantec Operations Readiness Tools 查找唯一消息標(biāo)識符說明和解決方案”。使用Symantec Operations Readiness Tools 查找唯一消息標(biāo)識符說明和解決方案您可以使用 Symantec Operations Readiness Tools (SORT) 查找唯一消息標(biāo)識符(UMI) 說明和解決方案。查找唯一消息標(biāo)識符說明和解決方案1將 Web 瀏覽器指向以下 URL
27、: http:/在任意SORT 頁的“search (搜索)”字段中,輸入UMI 代碼,然后單擊“search (搜索)”圖標(biāo)。216簡介關(guān)于唯一消息標(biāo)識符3在“Search Result (搜索結(jié)果)”頁的“Error codes (錯誤代碼)”窗格中,單擊指向您的消息代碼的。如果有大量搜索結(jié)果,請使用頁面頂部的復(fù)選框只顯示可輕松查找您的代碼的錯誤代碼。此時將顯示 UMI 代碼的“Error Code details (錯誤代碼詳細信息)”頁,其中提供了說明以及任何可能的解決方案。如果該頁上的信息未提供適合您問題的解決方案,您可以單擊頁面上的任一鏈接,執(zhí)行下列操作之一: 對 UMI 或其解決
28、方案進行評論。 請求解決方案。 添加您自己的解決方案。4 1 部分Veritas File System 故障排除 2. 診斷消息182診斷消息 文件系統(tǒng)對問題的響應(yīng) 關(guān)于內(nèi)核消息文件系統(tǒng)對問題的響應(yīng)當(dāng)文件系統(tǒng)遇問題時,它將按下列方式之一進行響應(yīng):標(biāo)記錯誤的 inode如果 inode 更新或目錄塊更新失敗,則將 Inode 可以標(biāo)記為出錯。在這些類型的失敗中,文件系統(tǒng)不知道磁盤上的具體信息,但會考慮它查到所有無效信息。在將 inode 標(biāo)記為出錯后,內(nèi)核仍然允許,但是任何文件中的數(shù)據(jù)或更改 inode 的嘗試對文件名的均會失敗。禁用事務(wù)處理如果文件系統(tǒng)在寫入意向日志時檢測到錯誤,則它將禁用事
29、務(wù)處理。禁用事務(wù)處理之后,仍可以或?qū)懭胛募到y(tǒng)中的文件,但不允許任何塊或 inode他對元數(shù)據(jù)的更改?;蚍峙?、結(jié)構(gòu)更改、目錄條目更改或其如果發(fā)生了錯誤進而損害了文件系統(tǒng)的完整性,則 VxFS 將禁用本身。如果意向日志失敗或 inode 列表發(fā)生錯誤,超級塊通常會更新(設(shè)置VX_FULLFSCK 標(biāo)志),以便下一fsck 執(zhí)行整個結(jié)構(gòu)檢查。如果此超級塊更新失敗,任何對文件系統(tǒng)的更改都可能造成不一致,而意向日志重放無法檢查到這些不一致。要避免此情形,文件系統(tǒng)將禁用本身。禁用文件系統(tǒng)20診斷消息關(guān)于內(nèi)核消息恢復(fù)禁用的文件系統(tǒng)禁用文件系統(tǒng)后,不能向磁盤寫入任何數(shù)據(jù)。盡管一些次要的文件系統(tǒng)仍可工作, 但
30、是大多數(shù)文件系統(tǒng)只返回EIO。禁用文件系統(tǒng)之后,唯一可做的事是執(zhí)行umount 命令和完全運行 fsck。雖然日志重放可以生成一個干凈的文件系統(tǒng),但是執(zhí)行整個結(jié)構(gòu)檢查會更安全。文件系統(tǒng)通常會由于磁盤錯誤而遭到禁用。磁盤故障將會導(dǎo)致禁用文件系統(tǒng),因此,應(yīng)盡快將其修復(fù)。請參見 fsck_vxfs(1M) 手冊頁。執(zhí)行整個結(jié)構(gòu)檢查 使用 fsck 命令執(zhí)行整個結(jié)構(gòu)檢查:# fsck -V vxfs -o full -y /dev/vx/rdsk/diskgroup/volume警告:運行此命令時,應(yīng)。通過指定 -y 選項,所有 fsck 用戶提示均以yes 回答,如果它執(zhí)行了整個文件系統(tǒng)檢查,則會造
31、成不可撤消的更改。關(guān)于內(nèi)核消息內(nèi)核消息是Veritas File System (VxFS) 內(nèi)核生成的診斷性或錯誤消息。每個消息均有說明和如何處理或改正基本錯誤的建議。關(guān)于全局消息 ID當(dāng) VxFS 內(nèi)核消息顯示在系統(tǒng)控制臺上時,它位于t 字段顯示的數(shù)字 ID 之后。此 ID 編號隨著每個消息實例而增大,以保證在分析文件系統(tǒng)問題序是已知的。件的順 2 部分Veritas Volume Manager 故障排除 3. 硬件故障后恢復(fù) 4. 在即時快照故障后恢復(fù) 5. 在引導(dǎo)磁盤故障后恢復(fù) 6. 管理命令和事務(wù) 7. 備份和還原磁盤組配置 8. 對磁盤組導(dǎo)入問題進行故障排除 9. 從 CDS 錯
32、誤恢復(fù) 10. 錯誤消息 11. Veritas Volume Replicator 故障排除223硬件故障后恢復(fù)關(guān)于硬件故障后恢復(fù)列出不可啟動的卷 顯示卷和 Plex 狀態(tài)Plex 狀態(tài)循環(huán)恢復(fù)不可啟動的鏡像卷恢復(fù)不可啟動的卷(其中禁用的 Plex 為 RECOVER 狀態(tài)) 強制重新啟動禁用的卷清除磁盤上的 failing 標(biāo)志重新掛接出錯的磁盤在 Plex 掛接或同步操作失敗后恢復(fù)RAID-5 卷上的故障在整的磁盤組移動后恢復(fù)在 DCO 卷出現(xiàn)故障后恢復(fù)關(guān)于硬件故障后恢復(fù)Symantec 的 Veritas Volume Manager (VxVM) 可以保護系統(tǒng)免受磁盤和其他硬件故障的
33、影響,并幫助您從這類中恢復(fù)?;謴?fù)過程可幫助您防止因磁盤和其他硬件故障導(dǎo)致數(shù)據(jù)丟失或無法系統(tǒng)。如果一個卷發(fā)生磁盤 I/O 故障(例如,由于磁盤有無法糾正的錯誤),VxVM 可分離此故障所涉及的 Plex。I/O 在該 Plex 上停止,但在卷的其他 Plex 上繼續(xù)。24硬件故障后恢復(fù)列出不可啟動的卷如果磁盤徹底損壞,VxVM 可將該磁盤從所在的磁盤組中分離出來。該磁盤上的所有 Plex 都被禁用。如果分離時磁盤上有任何未鏡像的卷,這些卷也被禁用。注意:明顯的磁盤故障可能不是由物理磁盤介質(zhì)或磁盤控制器中的故障引起的,而可能是由中間組件或輔助組件(如電纜、主機總線適配器或電源)的故障引起的。VxV
34、M 中的熱重功能自動檢測磁盤故障,并用電子郵件將故障通知給系統(tǒng)管理員和其他指定用戶。熱重保持對鏡像卷和 RAID-5 卷的還嘗試使用備用磁盤和空閑磁盤空間來還原冗余,并能力。有關(guān)管理熱重的詳細信息,請參見Veritas Storage Foundation 管理指南。有關(guān)在 LVM 引導(dǎo) (rootvg) 磁盤故障后恢復(fù)的信息,請參考 LVM 文檔。請參見第 53 頁的“VxVM 和引導(dǎo)磁盤故障”。列出不可啟動的卷不可啟動的卷可能未正確配置或存在其他妨礙其啟動的錯誤或情況。要顯示不可啟動的卷,請使用 vxinfo 命令。此命令用于顯示卷的可列出不可啟動的卷 鍵入以下命令:性和可用性信息。# v
35、xinfo -g diskgroup volume .以下示例輸出表明卷 mkting 不可啟動:home mkting src rootvolswapvolfsgen fsgen fsgen rootswapStarted Unstartable Started StartedStarted顯示卷和 Plex 狀態(tài)要顯示有關(guān)卷配置(包括卷的狀態(tài)和卷的Plex 的狀態(tài))的詳細信息,請使用vxprint命令。硬件故障后恢復(fù)Plex 狀態(tài)循環(huán)25顯示卷和 Plex 狀態(tài) 鍵入以下命令:# vxprint -g diskgroup -hvt volume .以下示例顯示了一個禁用的卷 vol,它有兩
36、個干凈的 Plex(vol-01 和vol-02),每個 Plex 都有一個子磁盤:# vxprint -g mydg -hvt volDisk group: mydgV PL SD SV SC DCSPNAME NAME NAME NAME NAME NAMENAMERVG/VSET/CO VOLUMEPLEX PLEX PLEXPARENTVOLSNAPVOLKSTATE KSTATE DISK VOLNAME CACHE LOGVOLDCOSTATESTATELENGTHLENGTHREADPOLLAYOUTPREFPLEX UTYPENCOL/WID MODEDISKOFFS LENG
37、TH NVOLLAYR LENGTHDISKOFFS LENGTHCOL/OFF DEVICE COL/OFF AM/NMCOL/OFF DEVICEMODE MODEMODEv pl sd plsdvol vol-01mydg11-01 vol-02mydg12-01-vol vol-01 vol vol-02DISABLED DISABLEDmydg11 DISABLEDmydg12ACTIVE CLEAN 0 CLEAN0212880212880212880212880212880SELECT CONCAT 0 CONCAT0-hdisk11-hdisk12fsgen RW ENA RW
38、ENA有關(guān) Plex 和卷可能狀態(tài)的說明,請參見Veritas Storage Foundation 管理指南。Plex 狀態(tài)循環(huán)更改Plex 狀態(tài)是正常操作的一部分,并不一定表示出現(xiàn)了必須糾正的異常情況。清楚地了解各種Plex 狀態(tài)及其相互之間的關(guān)系對于正確執(zhí)行任何恢復(fù)步驟是十分必要的。圖 3-1 顯示了發(fā)生在 VxVM 中的 Plex 狀態(tài)之間的主要轉(zhuǎn)換。26硬件故障后恢復(fù)Plex 狀態(tài)循環(huán)主要的 Plex 狀態(tài)循環(huán)啟動(vxvol start)圖 3-1PS:干凈PKS:已禁用PS:活動PKS:已啟用關(guān)閉(vxvol stop)PS = plex state(Plex 狀態(tài))PKS =
39、plex kernel state(Plex 內(nèi)核狀態(tài))有關(guān) Plex 狀態(tài)的詳細信息,請參見Veritas Storage Foundation 管理指南。系統(tǒng)啟動時,卷自動啟動并且 vxvol start 任務(wù)使所有 CLEAN Plex 變?yōu)?ACTIVE 狀態(tài)。關(guān)機時,vxvol stop 任務(wù)將所有 ACTIVE Plex 標(biāo)記為 CLEAN。如果啟動時所有 Plex 為 CLEAN 狀態(tài),則表明曾發(fā)生了受控關(guān)機,系統(tǒng)將優(yōu)化啟動卷所需的時間。圖 3-2 顯示了因硬件問題、間的附加轉(zhuǎn)換。關(guān)機和系統(tǒng)管理員干預(yù)而可能導(dǎo)致的Plex 狀態(tài)之硬件故障后恢復(fù)Plex 狀態(tài)循環(huán)27附加的 Plex
40、 狀態(tài)轉(zhuǎn)換圖 3-2創(chuàng)建 PlexPS:空PKS:已禁用PS:活動PKS:已禁用后重新啟動(vxvol start)使 Plex 脫機(vxmend off)初始化 Plex (vxvol init clean)恢復(fù)數(shù)據(jù)(vxvol resync)啟動(vxvol start)PS:干凈PKS:已禁用PS:活動PKS:已啟用PS:脫機PKS:已禁用重新同步數(shù)據(jù)(vxplex att)關(guān)閉 (vxvol stop)無法糾正的I/O 故障使 Plex 聯(lián)機(vxmend on)重新同步失敗PS:I/O 失敗PKS:已分離PS:失效PKS:已分離PS = plex state(Plex 狀態(tài))PKS
41、 = plex kernel state(Plex 內(nèi)核狀態(tài))Plex 剛創(chuàng)建時的狀態(tài)為EMPTY,且一直保持到掛接該Plex 的卷被初始化為止。然后其狀態(tài)被設(shè)置為 CLEAN。其 Plex 內(nèi)核狀態(tài)保持為 DISABLED,直到卷啟動后才設(shè)置為 ENABLED。在系統(tǒng)并重新啟動后,卷的所有 Plex 均為 ACTIVE 狀態(tài),但 Plex 內(nèi)核狀態(tài)仍為 DISABLED,并且一直保持到 Plex 數(shù)據(jù)被 vxvol resync 任務(wù)恢復(fù)為止??梢允褂胿xmend off 命令使Plex 脫機,使用vxmend on 命令使其重新聯(lián)機,并在使用 vxplex att 重新掛接 Plex 時使
42、其數(shù)據(jù)與其他 Plex 重新同步。失敗的重新同步或無法糾正的 I/O 故障會將 Plex 置為 IOFAIL 狀態(tài)。在系統(tǒng)或 I/O 錯誤導(dǎo)致鏡像卷的所有 Plex 均以采取多種措施。請參見第 28 頁的“恢復(fù)不可啟動的鏡像卷”。請參見第 32 頁的“RAID-5 卷上的故障”。CLEAN 和 ACTIVE 狀態(tài)時可28硬件故障后恢復(fù)恢復(fù)不可啟動的鏡像卷恢復(fù)不可啟動的鏡像卷系統(tǒng)或 I/O 錯誤會損壞鏡像卷的一個或多個 Plex,并使所有 PlexCLEAN或ACTIVE 狀態(tài)??梢詫⑵渲幸粋€Plex 標(biāo)記為CLEAN,并指示系統(tǒng)使用該Plex 作為修復(fù)其他 Plex 的來源。恢復(fù)不可啟動的鏡像
43、卷1使用以下命令將所需的 Plex 置為 CLEAN 狀態(tài):# vxmend -g diskgroup fix clean plex例如,將 Plex vol01-02 置為 CLEAN 狀態(tài):# vxmend -g mydg fix clean vol01-022要從 CLEAN Plex 恢復(fù)卷中的其他 Plex,必須禁用該卷,并且其他 Plex 必須處于 STALE 狀態(tài)。可根據(jù)需要對所有其他 CLEAN 或 ACTIVE Plex 依次運行以下命令,使其狀態(tài)變?yōu)?STALE:# vxmend -g diskgroup fix stale plex承載卷的所有鏡像Plex 的幾個磁盤或其
44、他相關(guān)子系統(tǒng)發(fā)生嚴(yán)重的硬件故障后, 用戶可能無法使用 vxmend 恢復(fù)卷。在這種情況下,可以先刪除該卷,在正常工作的硬件上重新創(chuàng)建它,然后從備份或快照映像中還原該卷的內(nèi)容。請參見 vxmend(1M) 手冊頁。要啟用 CLEAN Plex 并從中恢復(fù) STALE Plex,請使用以下命令:3# vxvol -g diskgroup start volume例如,要恢復(fù)卷 vol01,請使用以下命令:# vxvol -g mydg start vol01請參見 vxvol(1M) 手冊頁。恢復(fù)不可啟動的卷(其中禁用的 Plex 為 RECOVER 狀態(tài))如果某個 Plex 的內(nèi)容相對于卷來說已
45、過時,則該 Plex 會顯示為 RECOVER 狀態(tài)。當(dāng)包含 Plex 的一個或多個子磁盤的磁盤被替換或重新掛接時,會發(fā)生這種情況。如果某個 Plex 顯示為這種狀態(tài),可通過 vxmend 和 vxvol 命令恢復(fù):硬件故障后恢復(fù)強制重新啟動禁用的卷29恢復(fù)不可啟動的卷(其中禁用的 Plex 為 RECOVER 狀態(tài))1使用以下命令將 Plex 強制設(shè)為 OFFLINE 狀態(tài):# vxmend -g diskgroup -o force off plex2使用以下命令將 Plex 置于 STALE 狀態(tài):# vxmend -g diskgroup on plex3如果卷中有其他 ACTIVE
46、或 CLEAN 狀態(tài)的 Plex,請使用以下命令將 Plex 重新掛接到卷中:# vxplex -g diskgroup att volume plex如果卷已經(jīng)啟用,Plex 的重新同步將立即開始。如果卷中沒有其他CLEAN 狀態(tài)的Plex,請使用以下命令將Plex 設(shè)為DISABLED和 CLEAN 狀態(tài):# vxmend -g diskgroup fix clean plex4如果尚未啟用卷,請使用以下命令啟動卷,并在步:執(zhí)行所有的 Plex 重新同# vxvol -g diskgroup -o bg start volume當(dāng)Plex 中的數(shù)據(jù)已損壞,并且卷中沒有可以從中重新同步卷內(nèi)容
47、的ACTIVE 或CLEAN 冗余 Plex 時,必須從備份或快照映像中還原卷。強制重新啟動禁用的卷如果由于磁盤故障導(dǎo)致某個卷被禁用,并且該卷中未包含任何有效的冗余Plex,則必須在更換出錯的磁盤后從備份還原該卷。對于所有被列為Unstartable 的卷,必須先使用 vxvol 命令重新啟動這些卷,然后才能從備份中還原其內(nèi)容。強制重新啟動禁用的卷 鍵入以下命令:# vxvol -g diskgroup -o bg -f start volume-f 選項將強制重新啟動卷,而 -o bg 選項則作為任務(wù)重新同步其 Plex。例如,要重新啟動卷 myvol,以便能夠從備份中還原它,可使用以下命令
48、:# vxvol -g mydg -o bg -f start myvol30硬件故障后恢復(fù)清除磁盤上的 failing 標(biāo)志清除磁盤上的 failing 標(biāo)志如果 I/O 錯誤是間歇性的而非持久性的,則 Veritas Volume Manager 會在磁盤上設(shè)置failing 標(biāo)志,而不是分離磁盤。臨時拔掉電纜、控制器出錯、磁盤陣列中有部分出錯的 LUN 或者磁盤中有少量損壞的扇區(qū)或磁道,都會此類錯誤。如果硬件錯誤不是由磁盤本身造成的(例如,是由控制器出問題或磁盤電纜出問題造成的),則可以在從根本上糾正 I/O 錯誤之后,使用 vxedit 命令清除 failing 標(biāo)志。警告:如果不知道
49、I/O 錯誤的原因,請不要清除 failing 標(biāo)志。如果磁盤硬件確實出現(xiàn)了問題,而您又清除了 failing 標(biāo)志,則會有丟失數(shù)據(jù)的。清除磁盤上的 failing 標(biāo)志1使用 vxdisk list 命令找出出錯的磁盤:# vxdisk listDEVICEhdisk10 hdisk11 hdisk12. . .TYPEauto:simple auto:simple auto:simpleDISKmydg01 mydg02 mydg03GROUPmydg mydg mydgSTATUSonlineonline failing online2使用vxedit set 命令為每個被標(biāo)記為fail
50、ing 的磁盤(在本例中為mydg02) 清除標(biāo)志:# vxedit -g mydg set failing=off mydg023使用 vxdisk list 命令確認(rèn)已清除 failing 標(biāo)志:# vxdisk listDEVICEhdisk10 hdisk11 hdisk12. . .TYPEDISKGROUPmydg mydg mydgSTATUSonline online onlineauto:simple auto:simpleauto:simplemydg01 mydg02mydg03硬件故障后恢復(fù)重新掛接出錯的磁盤31重新掛接出錯的磁盤如果系統(tǒng)在啟動時找不到某個磁盤,或者在V
51、xVM啟動時某些磁盤驅(qū)動程序被卸載或無法裝載(從而導(dǎo)致磁盤進入 failed 狀態(tài)),則可以執(zhí)行重新掛接操作。解決根本問題(如電纜或控制器錯誤)之后,使用 vxreattach 命令重新掛接磁盤,重新掛接之后 Plex卷之前進行。被標(biāo)記為 STALE。但是,重新掛接操作必須在啟動磁盤上的作為磁盤恢復(fù)過程的一部分,可以在引導(dǎo)期間從vxdiskadm 菜單中調(diào)用vxreattach命令。如果可能,vxreattach 將出錯的磁盤介質(zhì)重新掛接到具有同一設(shè)備名稱的磁盤上。重新掛接操作會將磁盤放在它以前所屬的同一磁盤組中,并保留其原有磁盤介質(zhì)名。重新掛接出錯的磁盤1如下例所示,使用 vxdisk li
52、st 命令查看出錯的磁盤:# vxdisk listDEVICEhdisk10 hdisk11-TYPEauto:simple auto:simple-DISKmydg01 mydg02 mydg03 mydg04GROUPmydg mydg mydg mydgSTATUSonline onlinefailed was: hdisk12failed was: hdisk132一旦糾正錯誤,便可使用如下命令重新掃描設(shè)備列表,進而重新掛接磁盤:# /usr/sbin/vxdctl enable3使用不帶任何選項的 vxreattach 命令重新掛接磁盤:# /etc/vx/bin/vxreattach執(zhí)行重新掛接操作之后,除非磁盤出錯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職(市場營銷)市場定位策略試題及答案
- 2026年烹飪工藝(中式烹飪技巧)試題及答案
- 2025年中職(會計電算化)會計電算化階段測試試題及答案
- 2025年高職植物保護管理應(yīng)用(應(yīng)用技術(shù))試題及答案
- 初中數(shù)學(xué)專題07 用勾股定理構(gòu)造圖形解決問題(解析版)
- 養(yǎng)老院老人心理咨詢師管理制度
- 養(yǎng)老院投訴處理與改進制度
- 養(yǎng)老院入住老人法律法規(guī)宣傳教育制度
- 公共交通廣告發(fā)布管理制度
- 2026年兒童誤服藥物電動洗胃急救處理流程練習(xí)題及答案
- 【二下數(shù)學(xué)】計算每日一練60天(口算豎式脫式應(yīng)用題)
- 北京市東城區(qū)2025-2026學(xué)年高三上學(xué)期期末考試地理 有答案
- 2025年健康體檢中心服務(wù)流程手冊
- 2026年黑龍江林業(yè)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試備考題庫有答案解析
- 貴金屬產(chǎn)業(yè)2026年發(fā)展趨勢與市場價格波動分析
- 現(xiàn)代環(huán)境監(jiān)測技術(shù)
- 2026福建能源石化集團校招面筆試題及答案
- 華東理工大學(xué)2026年公開招聘工作人員46名備考題庫及參考答案詳解
- 云南師大附中2026屆高三高考適應(yīng)性月考卷(六)歷史試卷(含答案及解析)
- 2025桐梓縣國土空間規(guī)劃城市年度體檢報告成果稿
- ISO-26262功能安全培訓(xùn)
評論
0/150
提交評論