SUN平臺系統(tǒng)維護(hù)_第1頁
SUN平臺系統(tǒng)維護(hù)_第2頁
SUN平臺系統(tǒng)維護(hù)_第3頁
SUN平臺系統(tǒng)維護(hù)_第4頁
SUN平臺系統(tǒng)維護(hù)_第5頁
已閱讀5頁,還剩56頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SUN平臺系統(tǒng)維護(hù)培訓(xùn)內(nèi)容Sun平臺常見故障分析SunFire4800/4900的配置和維護(hù)實(shí)例分析2Sun平臺常見故障分析Sun平臺常見故障分析常用命令和參考文件硬件故障指示燈常見故障分析故障實(shí)例4常用命令和參考文件(命令)dmesg

分析最近的日志信息drvconfig

配置/devices目錄和設(shè)備樹的信息disks

創(chuàng)建/dev/dsk和/dev/rdsk的符號鏈接devlinks

用/devices目錄下的信息創(chuàng)建/dev目錄下的相關(guān)符號鏈接5常用命令和參考文件(命令)df-k

顯示磁盤使用情況,包括剩余空間eeprom

分析和改變PROM設(shè)置file

查看文件類型find

在系統(tǒng)中查找特定文件6常用命令和參考文件(命令)grep

分析文件內(nèi)容,查找特定字符串last

根據(jù)/var/adm/utmpx和/var/adm/wtmpx文件的記錄,顯示系統(tǒng)login和reboot事件的歷史prtdiag(在sun4u和sun4m系統(tǒng)上) 顯示系統(tǒng)配置和診斷信息 (/usr/platform/`uname-m`/sbin)7常用命令和參考文件(命令)netstat-a

顯示網(wǎng)絡(luò)端口的占用情況strings

在二進(jìn)制和目標(biāo)文件中查找并顯示ASCII字符sysdef(sysdef-i)

分析設(shè)備和軟件配置信息,hostid、核心結(jié)構(gòu)、設(shè)備樹、加載的核心模塊、swap使用情況、可調(diào)核心參數(shù)和值8常用命令和參考文件(命令)traceroute

在子網(wǎng)的環(huán)境中,顯示路由過程swap

增加、刪除或監(jiān)視swap區(qū)truss

追蹤系統(tǒng)的調(diào)用和信號,顯示系統(tǒng)錯誤(系統(tǒng)錯誤號在/usr/include/sys/errno.h文件中定義。)sys-unconfig

改變在系統(tǒng)安裝過程的sysidtool階段輸入的信息9常用命令和參考文件(文件)/etc/default/login

控制root能否從控制臺以外的設(shè)備登錄/etc/inetd.conf

列出所有由inetd進(jìn)程管理的服務(wù)/etc/nsswitch.conf

名字服務(wù)開關(guān)/etc/system

設(shè)置核心可調(diào)整參數(shù),核心模塊加載路徑、根分區(qū)位置、核心模塊強(qiáng)制加載或不加載10常用命令和參考文件(文件)/etc/vfstab

列出本地和遠(yuǎn)程資源的掛接情況/var/adm/messages

列出最近在控制臺上出現(xiàn)和啟動過程中出現(xiàn)的信息,當(dāng)文件達(dá)到一定長度時,由root的cron進(jìn)程自動更名為messages.n。清除文件內(nèi)容,可以用

cat/dev/null>messages/var/sadm/install/contents

列出系統(tǒng)中安裝的所有軟件包的信息11硬件故障指示燈Icon DescriptionPower-on Green Steady--Powerison Off--PowerisoffFault Yellow Flashingslow--POSTrunning Flashingfast--OBPDiagnostics onfull--AfailurewasdetectedActivity Green Flashing--SystemisoperatingnormallyDiskfault Yellow Onsteady--AharddiskfailurehasbeendetectedOver-temp Yellow Onsteady--Indicatesanovertemperaturecondition orafanfailureexistPowerfault Yellow Onsteady--Oneormorepowersupplieshasafailure12硬件故障指示燈(cont.)powerHardwarefailureCyclingorrunningnormallyOff off off Systemhasnopoweroff on on/off Failuremodeoff off on Failuremodeon off off Systemishung,eitherinPOST/OpenBoot orintheoperatingsystem.on off on HunginOS.On on off/on1.HunginPOST/OBPor2.HunginOS andfailedcomponentonboard.On off flash OSrunningon on flash OSrunningandfailedcomponentonboardon flash off slowflash=POST.Fastflash=OBPon flash on undefined.13常見故障分析(引導(dǎo)問題)查看以下參數(shù):boot-commandauto-boot?diag-switch?boot-deviceboot-filediag-devicediag-file14常見故障分析(scsi問題) 問題:系統(tǒng)中安裝了多塊盤,并且得到跟SCSI有關(guān)的報(bào)錯SCSI號沖突每次只保留一個SCSI設(shè)備.在ok狀態(tài)下檢測每個設(shè)備的target號:

okprobe-scsiSCSI纜太長從SCSI線上撤掉部分設(shè)備15常見故障分析(網(wǎng)絡(luò)問題)問題:網(wǎng)絡(luò)不通

ok狀態(tài)下

oktestnetokwatch-netprintenv查看tpe-link-test?的值是否為true查看hub的link-test功能是否enabled

在系統(tǒng)中ifconfig-a查看網(wǎng)口狀態(tài),注意IP、netmask和廣播地址

16常見故障分析(網(wǎng)絡(luò)服務(wù)問題)問題:網(wǎng)絡(luò)通,不能被telnet或ftp

查看/etc/inet/inetd.conf文件中有沒有包含該項(xiàng)服務(wù)查看/etc/services文件中有沒有規(guī)定該項(xiàng)服務(wù)的端口號,及端口號是否正確。必要時與其它機(jī)器比較。查看進(jìn)程inetd是否啟動查看系統(tǒng)中有沒有/etc/ftpd/ftpusers文件,該文件中規(guī)定的用戶不能作ftp;查看有沒有/etc/nologin文件,如果有該文件,只有超級用戶可以登錄,普通用戶不允許在本地和遠(yuǎn)程登錄;查看/etc/default/login文件,如果該文件中有CONSOLE=一句,只有普通用戶可以登錄。17常見故障分析(死機(jī)或掛起問題)可以rlogin或telnet到該系統(tǒng)嗎?可以ping通該系統(tǒng)嗎?鼠標(biāo)可以移動嗎?最近對系統(tǒng)做了那些改動?死機(jī)有多頻繁?什么情況下死機(jī)?可以通過執(zhí)行命令重復(fù)死機(jī)過程嗎?在必要的時候怎樣退出死機(jī)狀態(tài)(stop-a)18SunFire4800的配置和維護(hù)SunFire4800的配置和維護(hù)SunFire4800的安裝SunFire4800的維護(hù)20SunFire4800的配置和維護(hù)SunFire4800前臉21SunFire4800的配置和維護(hù)SunFire4800后臉22SunFire4800的配置和維護(hù)SunFire4800安裝1:控制卡的配置硬件連接:使用串口線連接管理終端主控制器(默認(rèn)SC0)軟件配置: 打開SunFire4800電源以后,控制板會自動啟動,在串口的輸出中可以看到SC(系統(tǒng)控制板)啟動過程。等待啟動完成后進(jìn)行一下操作。

23SunFire4800的配置和維護(hù)SystemController'':Type0forPlatformShell

Type1fordomainAconsoleType2fordomainBconsoleType3fordomainCconsoleType4fordomainDconsole

Input:0 //輸入0表示進(jìn)入platform,硬件管理平臺24SunFire4800的配置和維護(hù)

PlatformShell noname:SC> noname:SC>setup

//進(jìn)入設(shè)置狀態(tài)。網(wǎng)絡(luò)配置: NetworkConfiguration//進(jìn)行網(wǎng)絡(luò)配置。 ---------------------

Isthesystemcontrolleronanetwork?[yes]:↙//能否通過網(wǎng)絡(luò)控制。 UseDHCPorstaticnetworksettings?[DHCP]:static//設(shè)置成靜態(tài)計(jì)算機(jī)。

25SunFire4800的配置和維護(hù)

Hostname[ha132]:4800-sc0//控制板的邏輯主機(jī)名。 IPAddress[32]:1//控制板使用的IP地址。 Netmask[]:↙//網(wǎng)絡(luò)掩碼。

Gateway[54]://默認(rèn)網(wǎng)關(guān)。 DNSDomain[]://名字服務(wù)器DNS設(shè)置,一般使用不到的。 PrimaryDNSServer[]:↙

SecondaryDNSServer[]:↙ RebootingtheSCisrequiredforchangesinnetworksettingstotakeeffect.//提示這些配置信息只有在重新啟動后才能夠生效26SunFire4800的配置和維護(hù)

系統(tǒng)硬件資源的分配:

ACLs

//系統(tǒng)硬件資源的劃分(這里只分配一個domain)

----

ACLfordomainA[SB0SB2SB4IB6IB8]:↙//domainA可以利用所有硬件

ACLfordomainB[SB0SB2SB4IB6IB8]:-//domainB不能利用所有硬件

ACLfordomainC[SB0SB2SB4IB6IB8]:-//domainC不能利用所有硬件

ACLfordomainD[SB0SB2SB4IB6IB8]:-//domainD不能利用所有硬件

27SunFire4800的配置和維護(hù)SC自檢設(shè)置:

SCPOST//SC(系統(tǒng)控制板)自檢設(shè)置 ------- SCPOSTdiagLevel[min]:max//設(shè)備第一次啟動,最好做最大自檢,待完成一次完整自檢后,設(shè)置成為min PartitionMode -------------- Configurechassisforsingleordualpartitionmode?[single]: noname:SC> noname:SC>reboot//重新啟動控制板系統(tǒng)是上述配置生效28SunFire4800的配置和維護(hù)sc1的配置:

從控制板(sc1)的配置

============================================= SystemController'':Type0forPlatformShellInput:0 //由于系統(tǒng)控制的唯一性,因此這里僅僅可以對platform的信息進(jìn)行修改和查看,同時該控制板的功能受到很多限制。 PlatformShell-SlaveSystemController noname:SC>setup//開始進(jìn)行配置

29SunFire480000的配置和維護(hù)NetworkConfiguration---------------------

Isthesystemcontrolleronanetwork?[yes]:↙

UseDHCPorstaticnetworksettings?[DHCP]:static

Hostname[ha132]:4800-sc1

IPAddress[32]:Netmask[]:↙

Gateway[54]:

DNSDomain[]:↙

PrimaryDNSServer[]:↙

SecondaryDNSServer[]:↙30SunFire4800的配置和維護(hù)

RebootingtheSCisrequiredforchangesinnetworksettingstotakeeffect. SCPOST ------- SCPOSTdiagLevel[min]:max noname:SC>reboot Areyousureyouwanttorebootthesystemcontrollernow?[no]y31SunFire4800的配置和維護(hù)域(domain)的設(shè)置:4800-1-sc0:SC>consolea//從platform進(jìn)入域domain ConnectedtoDomainA DomainShellforDomainA 4800-1-sc0:A>↙ 4800-1-sc0:A>setup

DomainBootParameters ---------------------- diag-level[default]:max//建議第一次安裝時用 verbosity-level[min]:↙ error-level[max]:↙ interleave-scope[within-board]:↙ interleave-mode[optimal]:↙32SunFire4800的配置和維護(hù)reboot-on-error[false]:↙OBP.use-nvramrc?[<OBPdefault>]:↙OBP.auto-boot?[<OBPdefault>]:↙OBP.error-reset-recovery[<OBPdefault>]:↙SunFire4800的啟動:4800-1-sc0:A>disconnect//從域domain中退出進(jìn)入platformConnectionclosed.4800-1-sc0:SC>poweronall//對所有單元模塊加電。33SunFire4800的配置和維護(hù)4800-1-sc0:SC>↙//等待加電完成以后,執(zhí)行下面操作。4800-1-sc0:SC>consolea//進(jìn)入域A(domaina)4800-1-sc0:A>setkeyon//開機(jī),至此該計(jì)算機(jī)等同于其他主機(jī)開機(jī)。//如果系統(tǒng)不能自動到達(dá)ok狀態(tài),執(zhí)行如下操作。----PC終端:按下ctrl+break 4800-1-sc0:A>break//在這種情況下,break等同于原來SUN設(shè)備的stop+a resume回到操作系統(tǒng)操作界面。

34SunFire4800的配置和維護(hù)SUN終端:按下ctrl+]telnet>sendbreak//發(fā)送break信號4800-1-sc0:A>break//stop+a

ok//至此完成硬件系統(tǒng)的加電過程35SunFire4800的配置和維護(hù)安裝完后的工作:由于4800系列的主機(jī)硬件比較復(fù)雜,因此如果在設(shè)備啟動時,測試比較深的話啟動時間比較長,因此在確定安裝完成后,進(jìn)行如下修改。4800-1-sc0:A>setup修改diag-level[max]:quick4800-1-sc0:A>disc4800-1-sc0:SC>setup修改SCPOSTdiagLevel[max]:min同樣在sc1(從控制器)也要進(jìn)行修改。36SunFire4800的配置和維護(hù)SunFire4800定位系統(tǒng)故障:1:平臺、域和系統(tǒng)消息2:系統(tǒng)控制器命令顯示的平臺和域狀態(tài)信息3:Solaris操作環(huán)境命令顯示的診斷和系統(tǒng)配置信息37SunFire4800的配置和維護(hù)1:平臺、域和系統(tǒng)消息/var/adm/messages包含和顯示系統(tǒng)控制器錯誤及事件消息。由Solaris操作環(huán)境寫入域控制臺的消息系統(tǒng)控制器錯誤和事件消息38SunFire4800的配置和維護(hù)2:系統(tǒng)控制器命令顯示的平臺和域狀態(tài)信息showboards-vshowenvironmentshowdomain-vshowfru-rmanrshowlogs-v或showlogs-vddomainIDshowplatform-v或showplatform-ddomainID39SunFire4800的配置和維護(hù)三種錯誤狀態(tài):Failed狀態(tài)表示板未通過測試,不可使用。Disabled狀態(tài)表示板因被setls命令禁用或未通過POST而從系統(tǒng)中取消配置。Degraded狀態(tài)表示板上的某些組件發(fā)生故障或被禁用,但板上仍有可用部件。具有Degraded狀態(tài)的組件仍配置在系統(tǒng)中查看這類型狀態(tài)的命令:showboards或showcomponent40SunFire4800的配置和維護(hù)SB的更換:1:設(shè)備只有一塊SB,且domain運(yùn)行Solaris系統(tǒng)A:暫停操作系統(tǒng)環(huán)境;如果是Sun終端,在ok下執(zhí)行CTRL鍵+]會出現(xiàn)telnet提示符:telnet>sendbreak--->schostname:A>如果是PC終端,ok#.--->schostname:A>C:會出現(xiàn)schostname:A>setkeyswitchoffD:schostname:A>disconnect會回到SC提示符下E:schostname:SC>poweroffsbxx是SB的number41SunFire4800的配置和維護(hù)2:對于設(shè)備有多個SB A:執(zhí)行cfgadm-cdisconnectap_id ap_id指的是系統(tǒng)板連接的識別符號3:物理上更換SB4:對于domain沒有運(yùn)行Solaris系統(tǒng) A:schostname:SC>console-dA B:schostname:A>setkeyswitchon C:OKboot5:對于多個SBdomain且運(yùn)行Solaris A:cfgadm-cconfigureap_id42SunFire4800的配置和維護(hù)更換好新的SB后:1:對于domain沒有運(yùn)行Solaris系統(tǒng) A:schostname:SC>console-dA B:schostname:A>setkeyswitchon C:OKboot2:對于多個SBdomain且運(yùn)行Solaris A:cfgadm-cconfigureap_id43SunFire4800的配置和維護(hù)問題分析:WedMar2823:20:05lom:Agent{/N0/SB0/P0/C0}isdisabled.WedMar2823:20:06lom:Agent{/N0/SB0/P0/C1}isdisabled.WedMar2823:20:06lom:Port{/N0/SB0/P0}isdisabled.WedMar2823:20:06lom:Agent{/N0/SB0/P1/C0}isdisabled.WedMar2823:20:06lom:Agent{/N0/SB0/P1/C1}isdisabled.WedMar2823:20:06lom:Port{/N0/SB0/P1}isdisabled.44SunFire4800/6800的配置和維護(hù)從上面報(bào)錯看,POST過程報(bào)/N0/SB0/P0、/N0/SB0/P1disabled處理方法:用SC下service的命令setchs設(shè)置FRUcomponenthealthstatus。需要用以下信息算出service的password。lom>serviceTheuseofservicecommandscanbedestructiveanddestabilizethesystem.Useofservicemodeisauthorizedonlybypersonneltrainedinitsuse.45SunFire4800/6800的配置和維護(hù)EnterPassword:\\此處直接按回車Invalidpassword.HostID:83d5c2e0ScAppversion:5.19.1RTOSversion:43EnterPassword:根據(jù)以上信息通過SUN公司的軟件算出此主機(jī)的servicepassword為BGCkJ76hhq。lom>service46SunFire4800/6800的配置和維護(hù)Theuseofservicecommandscanbedestructiveanddestabilizethe

system.Useofservicemodeisauthorizedonlybypersonneltrainedinitsuse.EnterPassword:BGCkJ76hhqlom[service]>setchs-sok-r"ok"-cSB0/P0lom[service]>setchs-sok-r"ok"-cSB0/P1lom[service]>enablecomponentSB0/P0SB0/P0:willbeenabledatthenextdomainreboot,boardpowercycle,orpostexecution.lom[service]>enablecomponentSB0/P1SB0/P1:willbeenabledatthenextdomainreboot,boardpowercycle,orpostexecution.47SunFire4800/6800的配置和維護(hù)

48實(shí)例分析實(shí)例分析1:bj-mss02#more/var/adm/messagesJan2912:02:28bj-mss02unix:WARNING:[AFT0]6475softerrorsinlessthan24:00(hh:mm)detectedfromMemoryModule/N0/SB0/P0/B1/D1J13401bj-mss02#Jan2912:02:40bj-mss02unix:WARNING:[AFT0]6476softerrorsinlessthan24:00(hh:mm)detectedfromMemoryModule/N0/SB0/P0/B1/D1J13401Jan2912:03:07bj-mss02unix:WARNING:[AFT0]6477softerrorsinlessthan24:00(hh:mm)detectedfromMemoryModule/N0/SB0/P0/B1/D1J13401bj-mss02#Jan2912:03:25bj-mss02unix:WARNING:[AFT0]6478softerrorsinlessthan24:00(hh:mm)detectedfromMemoryModule/N0/SB0/P0/B1/D1J1340150實(shí)例分析2:bj-mss01#more/var/adm/messagesDec1700:43ss01-sc0Platform.SC:23bj-mss01unix:[ID596940:PS248VDC0Temp.kern.warning]WARNI0value:68DegreesNG:[AFT0]26softeCrrorsinlessthan24:00(hh:mm)detectedfromMemoryModule/Jan2912:35:02bj-mN0/SB2/P3/B1/D3J166ss01-sc0Platform.SC01Dec1700:43:38:Checkforabnormalbj-mss01SUNW,UltraSenvironmentaloperaPARC-III+:[ID78077tingconditions.9ke][AFT0]errID0x0013b2ad.3e7d0a30Jan2912:35:02bj-mss01-DataBit36wasinerrorasc0Platform.SC:PS2ndcorrectedDec17,sensorstatus,out00:43:38bj-mss01unsideacceptablelimits(7,1,0x605020b00030000)ix:[ID596940kern.warning]WARNING:[AFT0]27softerrorsinlessthan24:00(hh:mm)detectedfromMemoryModule/N0/SB2/P3/B1/D3J1660151實(shí)例分析3:bj-mss02-sc1:A>showcomponentComponentStatusPendingPOSTDescription-------------------------------------/N0/SB0/P0enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB0/P1enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB0/P2enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB0/P3enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB2/P0enabled-passUltraSPARC-III+,900MHz,8MECache52實(shí)例分析/N0/SB2/P1enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB2/P2enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB2/P3enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB4/P0enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB4/P1enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB4/P2enabled-passUltraSPARC-III+,900MHz,8MECache/N0/SB4/P3enabled-passUltraSPARC-III+,900MHz,8MECache53實(shí)例分析/N0/IB6/P0disabled-chsIOController0/N0/IB6/P1enabled-untestIOController1/N0/IB6/P0/B0disabled-chs66/33MHz.PCIBus/N0/IB6/P0/B1disabled-chs33MHz.PCIBus/N0/IB6/P1/B0enabled-untest66/33MHz.PCIBus/N0/IB6/P1/B1enabled-untest33MHz.PCIBus/N0/IB6/P0/B1/C0disabled-chs33MHz.5VShortPCIcard/N0/IB6/P0/B1/C1disabled-chs33MHz.5VShortPCIcard/N0/IB6/P0/B1/C2disabled-chs33MHz.5VLong/ShortPCIcard/N0/IB6/P0/B0/C3disabled-chs66/33MHz.3.3VLong/ShortPCIcard54實(shí)例分析4:bj-mss02-sc1:SC[service]>showchsComponentStatus-----------------------SSC1OKID0OKPS0OK/N0/SB2/P0/B1/D1OK/N0/SB2/P0/B1/D1/L0OK/N0/SB2/P0/B1/D1/L1OK/N0/SB2/P0/B1/D2OK/N0/SB2/P0/B1/D2/L0OK/N0/SB2/P0/B1/D2/L1Faulty

/N0/SB2/P0/B1/D3OK55實(shí)例分析5:bj-mss01-sc0:A>showlogs-vSep2714:44:17bj-mss01-sc0Domain-A.SC:[ID555160local1.notice]DomainShell-A:setkeyswitchon:Initiatingkeyswitch:on,domainA.Oct1320:10:57bj-mss01-sc0Domain-A.SC:[ID430800local1.notice]Active-PanickingOct1320:11:57bj-mss01-s

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論