LVM、文件系統(tǒng)與磁盤問題的診斷_第1頁
LVM、文件系統(tǒng)與磁盤問題的診斷_第2頁
LVM、文件系統(tǒng)與磁盤問題的診斷_第3頁
LVM、文件系統(tǒng)與磁盤問題的診斷_第4頁
LVM、文件系統(tǒng)與磁盤問題的診斷_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、當(dāng)每個(gè)硬盤被加入一個(gè)卷組(VG)的時(shí)候就被分配了一個(gè)物理卷標(biāo)識(shí)符(PVID)。不能使用dd命令拷貝兩個(gè)物理卷的內(nèi)容,因?yàn)镻VID也會(huì)被拷貝的,這樣兩個(gè)不同的物理卷就有了相同的PVID,系統(tǒng)會(huì)出錯(cuò)。當(dāng)硬盤出現(xiàn)錯(cuò)誤的時(shí)候,一般會(huì)進(jìn)行數(shù)據(jù)重定位。有三種類型的數(shù)據(jù)重定位:1)硬盤內(nèi)部的數(shù)據(jù)重定位:最底層的重定位,發(fā)生在磁盤內(nèi)部,出現(xiàn)的時(shí)候不會(huì)通知用戶。2)由LVM產(chǎn)生的硬件重定位:更高層次的重定位,LVM將有問題的物理地址A上的數(shù)據(jù)拷貝到物理地址B,LVM會(huì)繼續(xù)讀地址A上的數(shù)據(jù),但是硬盤已經(jīng)將真實(shí)的IO轉(zhuǎn)向物理地址B。3)軟件重定位:最高層次的重定位,也由LVM設(shè)備產(chǎn)生。LVM生成一個(gè)壞道表,當(dāng)讀物理

2、地址A上的數(shù)據(jù)時(shí),先檢查壞道表,如果A在壞道表中,就轉(zhuǎn)向物理地址B。當(dāng)用戶覺得LVM有問題的時(shí)候,首先要做的事情就是備份,盡可能地保存卷組中的數(shù)據(jù)。卷組發(fā)生問題后進(jìn)行的備份需要和發(fā)生問題前進(jìn)行的備份進(jìn)行對(duì)比。ODM 重新同步:LVM發(fā)生問題往往是硬盤的物理問題造成ODM中的數(shù)據(jù)與硬盤上儲(chǔ)存的VGDA,VGSA,LVCB不同步。當(dāng)LVM操作不正常地結(jié)束并和ODM不一致的話,ODM就會(huì)出錯(cuò)。例如,當(dāng)導(dǎo)入一個(gè)卷組的時(shí)候,ODM所在文件系統(tǒng)(通常是root,/)大小溢出。1)如果用戶覺得某個(gè)卷組的ODM有問題,使ODM與正確的數(shù)據(jù)同步的方法是:將該卷組從系統(tǒng)中varyoff并export,再impor

3、t并varyon卷組,這樣就可以刷新ODM中的數(shù)據(jù)。不過這種方法只能對(duì)非rootvg 的卷組有效。2)對(duì)于rootvg卷組,可以使用命令#redefinevg rootvg來刷新ODM中的數(shù)據(jù)。該命令將對(duì)系統(tǒng)中硬盤和卷組的對(duì)應(yīng)關(guān)系進(jìn)行檢測。3)如果硬盤上的LVM信息出錯(cuò),使用命令#synclvodm v myvg來重建并同步LVCB,VGDA等信息。該命令將同步myvg卷組中所有的邏輯卷。4)如果卷組中的一個(gè)或多個(gè)邏輯卷被做過鏡像,并且懷疑鏡像可能有損壞可以使用命令#syncvg l lv02。這個(gè)命令將同步邏輯卷lv02的鏡像。用syncvg命令可用來同步單個(gè)邏輯卷,或者一個(gè)物理分區(qū)或者整個(gè)

4、卷組。導(dǎo)入卷組(importvg)的問題:如果使用importvg命令不能成功將一個(gè)卷組導(dǎo)入進(jìn)一個(gè)系統(tǒng)的話,很有可能是下面的幾種問題:1)AIX的版本:檢查要導(dǎo)入的卷組是否被系統(tǒng)運(yùn)行的AIX版本支持。低版本的AIX不能支持由高版本的AIX所導(dǎo)出的卷組。2)錯(cuò)誤的PVID:檢查要導(dǎo)入的卷組中的硬盤是否都有有效的PVID號(hào)??梢允褂?lspv命令來顯示硬盤的PVID號(hào),如果某個(gè)盤不顯示PVID號(hào),使用#chdev命令來解決問題。例如#chdev l hdisk4 a pv=yes命令就可以使一個(gè)原先沒有PVID的hdisk4獲得一個(gè)正確的PVID號(hào)。3)當(dāng)卷組導(dǎo)出后硬盤被更改了:0516056 v

5、aryon testvg:The volume group is not varied on because a physical volume is maked missing.Run diagnostics.如果使用importvg命令失敗,并且出現(xiàn)以上錯(cuò)誤信息的話,說明有物理卷丟失了,很有可能是在卷組被導(dǎo)出后又對(duì)硬盤進(jìn)行了變更??梢允褂?importvg f命令來對(duì)卷組進(jìn)行強(qiáng)制導(dǎo)入。然后根據(jù)情況使用#reducevg命令來去除系統(tǒng)提示出錯(cuò)的硬盤。4)共享的硬盤環(huán)境:在共享硬盤的環(huán)境,比如說一個(gè)SSA系統(tǒng),在被2個(gè)或者更多的系統(tǒng)所使用的情況下,定義的物理卷就不可以用了,因?yàn)樗鼈円呀?jīng)被其它的

6、機(jī)器導(dǎo)入并且vary on了。此時(shí)應(yīng)使用lspv命令在所有的機(jī)器上對(duì)比PVID號(hào)。如果使用importvg命令失敗,通過查詢錯(cuò)誤日志可以找到問題所在。擴(kuò)展最大的物理分區(qū)(PP)量:當(dāng)在一個(gè)卷組中加入一個(gè)比該卷組現(xiàn)有容量大的多的硬盤時(shí),很有可能出現(xiàn)先前定義的PP數(shù)量不夠??梢允褂?lsvg testvg命令來查看現(xiàn)有的卷組信息。使用命令#chvg t 2 testvg可以將testvg卷組的最大PP量擴(kuò)大為原來的兩倍。更換硬盤1)如何檢查磁盤錯(cuò)誤:通常情況下錯(cuò)誤日志分析系統(tǒng)在系統(tǒng)錯(cuò)誤的時(shí)候會(huì)給root用戶發(fā)一封郵件,通過查看郵件可以得到硬盤錯(cuò)誤信息。也可以使用命令#lsvg l mirrorvg

7、來查看所有鏡像的信息,如果某個(gè)鏡像邏輯卷的LV STATE為stale狀態(tài),就表明該鏡像卷不處于同步狀態(tài)。使用#errpt命令來查看錯(cuò)誤日志,錯(cuò)誤日志的信息將會(huì)顯示該鏡像卷不處于同步狀態(tài)的原因。在更換硬盤前,需要對(duì)文件系統(tǒng)做好備份,以避免在更換過程中出現(xiàn)不可預(yù)料的問題。如果文件系統(tǒng)中含有數(shù)據(jù)庫文件,需要使用特定的數(shù)據(jù)庫備份工具來備份。2)卸載一塊壞的硬盤:使用rmlvcopy命令卸載一個(gè)邏輯卷鏡像的物理分區(qū),該物理分區(qū)處于壞的硬盤上。例如命令#rmlvcopy lvdb02 1 hdisk4,該條命令的含義為去除邏輯卷lvdb02在物理卷hdisk4上的鏡像,命令執(zhí)行完后,該邏輯卷每個(gè)LP對(duì)應(yīng)

8、一個(gè)PP,也就是說該邏輯卷沒有鏡像。使用#lslv l lvdv02檢查上一條命令執(zhí)行完畢后的結(jié)果。然后使用命令#reducevg f mirrorvg hdisk4將原先做為鏡像用的hdisk4物理硬盤從卷組中去除。使用命令#lsvg l mirrorvg來檢查上一條命令執(zhí)行后的結(jié)果。使用命令#rmdev d l hdisk4將該硬盤信息從ODM庫中去除。(注意,上述步驟可以用來卸載SCSI硬盤,但是對(duì)于SSA硬盤還需要在smit菜單中將pdisk和hdisk的對(duì)應(yīng)關(guān)系去除。)現(xiàn)在就可以安全地將壞的硬盤從槽位中拔出來。3)添加一塊新的硬盤:下面的步驟講述的是如何在一個(gè)生產(chǎn)環(huán)境中添加一塊新的硬

9、盤。將硬盤插入槽位后使用命令#cfgmgr來使系統(tǒng)識(shí)別出新的硬盤,并且會(huì)將該硬盤做為一個(gè)正確的對(duì)象添加進(jìn)該系統(tǒng)。如果使用命令#cfgmgr v則會(huì)顯示更詳細(xì)的信息,方便進(jìn)行除錯(cuò)。使用命令#lsdev Cc disk來檢查系統(tǒng)是否已經(jīng)識(shí)別出新加的硬盤。然后使用命令#extendvg mirrorvg hdisk4把該硬盤添加進(jìn)卷組。重新建立邏輯卷的鏡像#mklvcopy lvdb02 2 hdisk4。執(zhí)行了上述命令后邏輯卷lvdb02的每1個(gè)LP就對(duì)應(yīng)2個(gè)PP,也就是說為邏輯卷lvdb02在hdisk4上建立了一個(gè)鏡像。不過鏡像卷還沒有和邏輯卷同步,使用命令#syncvg p hdisk4將邏

10、輯卷和物理卷同步。syncvg命令可以對(duì)物理卷、邏輯卷、卷組進(jìn)行同步。4)在錯(cuò)誤地移除一塊硬盤后所需的處理:如果在拔除硬盤前對(duì)系統(tǒng)沒有進(jìn)行正確的操作,拔除后系統(tǒng)又重啟了,這時(shí)候就需要使用命令#synclvodom v lvxxx來重建LVCB信息。不過這種情況通常適用于剩余的文件系統(tǒng)不依賴于拔除的硬盤。如果文件系統(tǒng)分布在所有的硬盤上,包括壞的,這時(shí)候一般只能使用備份來恢復(fù)了:(。AIX JFS問題:和LVM中產(chǎn)生的問題一樣,AIX JFS產(chǎn)生的問題也可以追溯到底層的物理硬盤的問題。使用命令#lsjfs來檢查各個(gè)掛載點(diǎn)上的文件系統(tǒng)的信息。增加文件系統(tǒng)的大小:例如使用命令#chfs a size=

11、+300000 /usr可以把./usr的大小增加300000個(gè)block的大小,每個(gè)bolck的大小為512byte。如果不加“”就表示為增到到,比如#chfs a size=300000 /usr就表示把/usr增大到300000個(gè)512的byte,大約為150M。注意這里實(shí)際增加的容量和增加到的容量都是PP大小的整數(shù)倍,因?yàn)榉峙浣o文件的最小的塊就是一個(gè)PP。系統(tǒng)的檢查和恢復(fù):使用命令#fsck /mountpoint來檢查掛載點(diǎn)的文件系統(tǒng),建議用戶在每次掛載文件系統(tǒng)之前都使用該命令來檢查。如果執(zhí)行了該命令后發(fā)現(xiàn)文件系統(tǒng)有錯(cuò)誤那系統(tǒng)會(huì)提示是否修復(fù)該錯(cuò)誤,如果不能修復(fù),那就只能從備份上恢復(fù)了

12、:(。修復(fù)一個(gè)壞的超級(jí)塊(superblock):如果在使用fsck或者mount命令時(shí)出現(xiàn)下面的錯(cuò)誤,就表明存在一個(gè)損壞的超級(jí)塊。fsck: Not an AIX3 file systemfsck: Not an AIXV3 file systemfsck: Not an AIX4 file systemfsck: Not an AIXV4 file systemfsck: Not a recognized file system typemount: invalid argument使用命令# dd count=1 bs=4k skip=31 seek=1 if=/dev/lv00 f=/

13、dev/lv00可以從備份上還原的錯(cuò)誤的超級(jí)塊。這里count表示的if模塊的數(shù)量,bs表示的是指定的模塊的大小,skip表示的是在開始拷貝之前跳過的模塊數(shù)量,seek表示的是在開始拷貝之前從輸入文件尋找seek所指定的記錄。在很多情況下,從備份上回復(fù)超級(jí)塊會(huì)覆蓋文件系統(tǒng),如果問題還不能解決的話重建一個(gè)文件系統(tǒng)再從備份上恢復(fù)。稀疏文件:不是所有的邏輯塊都被分配一個(gè)相應(yīng)的邏輯塊的文件叫做稀疏文件。稀疏文件一般用于數(shù)據(jù)庫文件。使用#ls命令只能查看稀疏文件開始文件塊和結(jié)束文件塊之間的大小,而不能查看文件真正的大小,這時(shí)候需要使用命令#du rs sparsefile來查看。#tar命令不具備備份稀

14、疏文件的功能。新的AIX5版本中的restore和backup命令提供了對(duì)稀疏文件的支持。卸載文件系統(tǒng)的問題:在卸載文件系統(tǒng)的時(shí)候有可能遇到這樣的錯(cuò)誤提示:Device busy或者A device is already mounted or cannot be unmounted如果一個(gè)文件系統(tǒng)打開了一個(gè)文件,那么必須在卸載之前將該文件關(guān)閉。例如:# umount /homeumount: 0506-349 Cannot unmount /dev/hd1: The requested resource is busy.# fuser -x -c /home/home: 11630# ps -

15、fp 11630UID PID PPID C STIME TTY TIME CMDguest 11630 14992 0 16:44:51 pts/1 0:00 -sh# kill -1 11630# umount /home1)當(dāng)用戶要卸載/home掛載點(diǎn)的時(shí)候,系統(tǒng)提示設(shè)備正忙,這時(shí)可以使用#fuser x c /home來查看哪個(gè)進(jìn)程還在訪問home掛載點(diǎn)。系統(tǒng)顯示進(jìn)程號(hào)為11630的進(jìn)程還在訪問home掛載點(diǎn)。使用命令#ps fp 11630來查看該進(jìn)程的詳細(xì)信息,用過#kill l 11630來將該進(jìn)程殺死。這時(shí)候就可以成功卸/home掛載點(diǎn)了。2)如果還是不能卸載掉文件系統(tǒng),很有可

16、能是系統(tǒng)加載了一個(gè)擴(kuò)展內(nèi)核,這時(shí)候擴(kuò)展內(nèi)核所在的文件系統(tǒng)就不能被成功地卸載掉。即使使用fuser也不能查看是什么擴(kuò)展內(nèi)核還在運(yùn)行,因?yàn)檫@不是用戶進(jìn)程加載的,但是可以使用命令#genkex來查看系統(tǒng)加載的所有的擴(kuò)展內(nèi)核,以及內(nèi)核的代碼是在哪個(gè)文件系統(tǒng)上的。3)如果A文件系統(tǒng)下面又掛載了另外一個(gè)B文件系統(tǒng),那么A文件系統(tǒng)是不能被卸載的,必須先將B文件系統(tǒng)卸載掉之后再卸載A文件系統(tǒng)。4)刪除一個(gè)文件系統(tǒng):在刪除一個(gè)文件系統(tǒng)之前,首先需要把該文件系統(tǒng)卸載掉,使用命令#rmfs來卸載文件系統(tǒng)。對(duì)于JFS類型的文件系統(tǒng),rmfs命令不僅將文件系統(tǒng)所在的邏輯盤移除掉,而且刪除/etc/filesystems

17、文件中對(duì)應(yīng)的文件系統(tǒng)的信息。例如:# umount /u/testfs# rmfs /u/testfsrmlv: Logical volume lv02 is removed.先卸載掉/u/testfs文件系統(tǒng),然后使用rmfs命令就可以成功刪除testfs文件系統(tǒng)。磁盤定額:磁盤定額系統(tǒng)可以通過3個(gè)參數(shù)來確定:1.用戶和組的最低限額2.用戶和組的最高限額3.磁盤定額的使用寬限期限。這些參數(shù)都可以使用命令#edquota來變更。最低限額指的是用戶或組至少要擁有的1KB文件塊或是文件的數(shù)量,最高限額指的是最多擁有的數(shù)量,使用寬限期指的是用戶資源超過最高限額的期限,一般系統(tǒng)默認(rèn)是一個(gè)星期。如果一個(gè)

18、文件系統(tǒng)起用了磁盤定額功能,那么會(huì)在根目錄下生成quota.user和quota.group兩個(gè)用來記錄定額的文件。使用磁盤定額的情況一般為以下3種:1.系統(tǒng)的磁盤空間有限2.文件系統(tǒng)需要更高的安全性3.磁盤使用量大。注意:/tmp目錄中經(jīng)常會(huì)生成各種臨時(shí)文件,所以不能對(duì)其進(jìn)行定額。安裝磁盤定額的步驟:1檢查系統(tǒng)上是否已經(jīng)安裝了quota的文件包# lslpp -l |grep bos.sysmgt.quota2確定需要磁盤定額的文件系統(tǒng),這里我們假設(shè)為/home3將userquota和groupquota添加進(jìn)/home文件系統(tǒng)的屬性     

19、;    # chfs -a "quota = userquota,groupquota" /home4如果文件系統(tǒng)還沒有掛載,掛載文件系統(tǒng)5使用edquota命令來編輯定額屬性         # edquota -u quotausr(編輯用戶定額屬性)         # edquota -g quotagrp(編輯組定額屬性)    

20、60;    edquota命令其實(shí)是調(diào)用了vi來對(duì)一個(gè)臨時(shí)文件進(jìn)行編輯。6激活定額         # quotaon -u /home7比較設(shè)置的定額和當(dāng)前磁盤使用情況         # quotacheck /home交換分區(qū)AIX操作系統(tǒng)中經(jīng)常會(huì)出現(xiàn)以下和交換分區(qū)(paging space)有關(guān)的問題:*所有的交換分區(qū)都被建立在了一塊硬盤上*交換分區(qū)空間用盡*硬盤上的交換分區(qū)分配不均衡*卷組中的交

21、換分區(qū)碎片創(chuàng)建和增大交換分區(qū)的建議1)一個(gè)硬盤上只建一個(gè)物理分區(qū),不要超過1個(gè)2)啟動(dòng)過程中所有的進(jìn)程涉及到的交換空間都是在系統(tǒng)默認(rèn)的交換分區(qū)(hd6)上的。當(dāng)所有的交換分區(qū)都啟動(dòng)后,交換分區(qū)就以4KB為單位進(jìn)行循環(huán)的管理。如果有多個(gè)物理卷,但是只在其中一塊物理卷上建立了多個(gè)交換空間,這樣并不能分擔(dān)系統(tǒng)的交換活動(dòng),而應(yīng)該在每一個(gè)物理卷上建立一個(gè)交換分區(qū)。3)不要在一個(gè)使用頻繁的物理卷上建立交換分區(qū),比如說一個(gè)有數(shù)據(jù)庫文件的分區(qū)。4)所有的交換分區(qū)的大小要相同,如果交換分區(qū)的大小不相同,當(dāng)小的用完以后,交換操作就集中在大的分區(qū)上。5)不要把一個(gè)交換分區(qū)分布在不同的物理卷上,這樣會(huì)降低交換分區(qū)的性

22、能,如果需要使用一個(gè)沒有交換分區(qū)的物理卷上的空間來增大交換分區(qū)的話,此時(shí)應(yīng)該新建一個(gè)交換分區(qū)。6)為了達(dá)到最好的性能,應(yīng)該在連接不同SCSI卡的硬盤上建立交換分區(qū)。檢查是否需要增大交換分區(qū)交換分區(qū)過大會(huì)造成磁盤空間浪費(fèi),如果交換分區(qū)過小的話也會(huì)給系統(tǒng)造成一系列的問題。當(dāng)系統(tǒng)出現(xiàn)以下提示的時(shí)候就說明交換分區(qū)太小了,需要擴(kuò)大:INIT: Paging space is lowksh: cannot fork no swap spaceNot enough memoryFork function failedfork () system call failedUnable to fork, too

23、many processesFork failure - not enough memory availableFork function not allowed. Not enough memory available.Cannot fork: Not enough space使用命令#lsps s來查看交換分區(qū)的使用率是否大于80,如果大于80就需要增大交換分區(qū)了。使用命令:#iostat#vmstat#lsps來查看系統(tǒng)吞吐狀況,以決定是否需要擴(kuò)大交換分區(qū)。減小或移除交換分區(qū)如果需要移除或者減小一個(gè)交換的分區(qū)話,首先需要更改交換分區(qū)的auto屬性,當(dāng)auto屬性為no的時(shí)候,系統(tǒng)啟動(dòng)的時(shí)

24、候不會(huì)自動(dòng)激活該交換分區(qū),才可以對(duì)其進(jìn)行相應(yīng)的操作。在AIX Version 4.x中要移除一個(gè)交換分區(qū)必須要重啟系統(tǒng),因?yàn)橄到y(tǒng)不能動(dòng)態(tài)地停止一個(gè)交換分區(qū)。只有在系統(tǒng)重啟后,交換分區(qū)不被自動(dòng)激活了,才能對(duì)其進(jìn)行移除。在AIX Version 4.x中要減小一個(gè)交換分區(qū)的方法是先刪除原來的交換分區(qū),然后新建一個(gè)所需大小的交換分區(qū)。激活交換分區(qū)只需使用命令#mkps即可,不必重啟系統(tǒng)。注意:不正確地刪除了系統(tǒng)默認(rèn)的交換分區(qū)的話會(huì)造成系統(tǒng)不能重啟。只有在將交換分區(qū)停止了以后才能將其移除。如果刪除系統(tǒng)默認(rèn)的交換分區(qū)(hd6,hd61)需要經(jīng)過特殊的步驟。因?yàn)槟J(rèn)的交換分區(qū)在系統(tǒng)啟動(dòng)的過程中是通過shell腳本執(zhí)行的,要?jiǎng)h除默認(rèn)的交換分區(qū)必須要先更改這些腳本然后再創(chuàng)建一個(gè)新的boot鏡像。下面的步驟演示的是如果將一個(gè)非系統(tǒng)默認(rèn)的交換分區(qū)從系統(tǒng)中移除。1檢查系統(tǒng)中現(xiàn)有的交換分區(qū)         #lsps a2將paging00的auto屬性更改為no   &

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論