2024 UIS 超融合管理平臺(tái)維護(hù)手冊(cè)_第1頁(yè)
2024 UIS 超融合管理平臺(tái)維護(hù)手冊(cè)_第2頁(yè)
2024 UIS 超融合管理平臺(tái)維護(hù)手冊(cè)_第3頁(yè)
2024 UIS 超融合管理平臺(tái)維護(hù)手冊(cè)_第4頁(yè)
2024 UIS 超融合管理平臺(tái)維護(hù)手冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩176頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

UISV2.0目錄H3CUIS平臺(tái)日常維 查看CASTools是否正常運(yùn) 查看 UIS操作風(fēng)險(xiǎn)說(shuō) 日常變更介 通過(guò)xml進(jìn)行虛擬機(jī)define操 日志收集和介 分布式存儲(chǔ)維 主機(jī)重啟導(dǎo)致系統(tǒng)下sdX盤號(hào)丟失或錯(cuò)位的恢復(fù)方 查詢OSD目錄所mount的數(shù)據(jù)分區(qū)、journal(寫加速)分 UIS界面未刪除故障osd,直接更換新盤導(dǎo)致原osd無(wú)法刪除的解決方 通過(guò)UISManager備份數(shù)據(jù)恢 系統(tǒng)盤空間利用率過(guò)高導(dǎo)致的mon 網(wǎng)絡(luò)錯(cuò)誤導(dǎo)致的mon 檢測(cè)是否開(kāi)啟extent備 卷掛載給windows客戶端在線創(chuàng)建快照可能會(huì)出現(xiàn)數(shù)據(jù)不一致情 同一個(gè)卷的不同時(shí)間點(diǎn)的多個(gè)只讀快照或者可寫快照同時(shí)映射給一個(gè)windows客戶端有些快 fs 負(fù)載均衡在intelixgbe網(wǎng)卡上導(dǎo)致存儲(chǔ)訪問(wèn)慢的規(guī)避方 USB插到cvk主機(jī)上后,主機(jī)無(wú)法識(shí)別到該設(shè) 常用命 H3CUIS為了保證局點(diǎn)UIS系統(tǒng)的穩(wěn)定運(yùn)行,需要進(jìn)行維護(hù)工作。主要包括查看告警、查看操作日志、查看集群、查看主機(jī)、查看虛擬機(jī)、查看License以及查看日志等。UISUIS系統(tǒng)運(yùn)行的告警指示燈,包括“緊急告警“次要告警”和“提示告警”4種告警指示燈。如果“緊急告警”和“重要告警”指示燈顯示有告警信息時(shí),說(shuō)明UIS系統(tǒng)運(yùn)行異常,需要盡快排如果在巡檢中發(fā)現(xiàn)異常,例如RAID卡、硬盤緩存異常,可以點(diǎn)擊修復(fù)如下圖是UISmanagerCVK上的虛擬機(jī)無(wú)法正常遷移到集群下其他的CVK檢查各個(gè)主機(jī)的CPU80%CVK主機(jī)的【概要】頁(yè)面中可以查看到主機(jī)的詳細(xì)配置信息,通過(guò)查看“運(yùn)行時(shí)間”可以確定CVKCPUI/O吞吐量、網(wǎng)在[性能監(jiān)控/CPU使用情況]頁(yè)面,點(diǎn)擊<…>按鈕可以查看更長(zhǎng)時(shí)間范圍內(nèi)的CPU在[性能監(jiān)控/I/O吞吐量統(tǒng)計(jì)]I/O<…>按鈕可以查看更長(zhǎng)I/O吞吐量信息。CASToolsVirtio磁盤(提升磁directsync(在虛擬機(jī)的“性能監(jiān)控”頁(yè)面下可以查看到虛擬機(jī)的CPUI/O吞吐量統(tǒng)計(jì)、查看虛擬機(jī)CPU在[性能監(jiān)控/CPU利用率]頁(yè)面,點(diǎn)擊<…>按鈕可以查看更長(zhǎng)時(shí)間范圍內(nèi)的CPU在[性能監(jiān)控/I/O吞吐量統(tǒng)計(jì)]I/O<…>按鈕可以查看更I/O吞吐量信息。查看UIS系統(tǒng)主要包含UISManager組件的License、CASlicense和分布式存儲(chǔ)的license,正式局止超期,影響UIS系統(tǒng)的正常使用。如下圖是UISManager組件的License告警管理功能用于統(tǒng)計(jì)和查看操作員需要關(guān)注的告警信息。目前,UIS統(tǒng)計(jì)的告警信息的類型包括CPU利用率、內(nèi)存利用等指標(biāo)項(xiàng)的告警閾值。當(dāng)指標(biāo)項(xiàng)的實(shí)際值達(dá)UISUIS系統(tǒng)在運(yùn)行過(guò)程中出現(xiàn)了問(wèn)題,需要按照一定的規(guī)則要求去變更,否則會(huì)影響現(xiàn)網(wǎng)業(yè)務(wù)的正常請(qǐng)參考版本說(shuō)明書的“版本升級(jí)操作指導(dǎo)”小節(jié)完成UIS100%。不允許在CVKIPCVK的共享存儲(chǔ)處于暫停狀態(tài)時(shí)刪除CVKCVK主機(jī)添UIS系統(tǒng)開(kāi)局完成后,可能會(huì)出現(xiàn)變更UISIPCVK主機(jī)添加到UISXconsoleIP所示。因此必須先將CVK主機(jī)從UIS系統(tǒng)中刪除。CVK主機(jī)上啟用了共享存儲(chǔ)或者運(yùn)行了虛擬機(jī),則無(wú)法刪除。因此需要先關(guān)閉虛擬機(jī)(或者刪除主機(jī)后,再次通過(guò)擴(kuò)容主機(jī)的形式添加主機(jī),在擴(kuò)容的過(guò)程中,給該主機(jī)手動(dòng)配置相應(yīng)的鏈路聚合根據(jù)bond口有沒(méi)有使能lacp協(xié)議,可分為靜態(tài)聚合和動(dòng)態(tài)聚合。ovs測(cè)和交換機(jī)側(cè)均使能lacp協(xié)議。ovsbond口上,lacp有兩種配置,active和offactive配置表示使能了lacp,off表示去使能lacp。lacp_statusnegotiated/configured/disabled三種狀態(tài),negotiated側(cè)未使能lacp。1所示,有bond口下面配置lacpactive狀態(tài),ovs測(cè)bond口上已經(jīng)使能了lacp,但是bondlacp_statusconfigurelacp導(dǎo)致的。圖1正常情況下,動(dòng)態(tài)聚合lacp協(xié)商成功,bond2圖2balance-tcp模式:根據(jù)以太網(wǎng)類型,(源,目的)Mac地址,vlan號(hào),IP報(bào)文協(xié)議,(源,balance-slb模式:只是根據(jù)源macvlanhash得到報(bào)文的轉(zhuǎn)發(fā)接口,這是當(dāng)前界面下發(fā)的bond_mode的配置參數(shù);圖3其中,bond口配置里面,lacp狀態(tài)為off,聚合lacp_status狀態(tài)為offovsdbbond端口中保存主鏈路的選擇方式,interface中保存物理網(wǎng)卡的優(yōu)先級(jí),進(jìn)行如下配ovs-vsctlsetPortbond-nameother_config:active-其中,speed表示按照網(wǎng)卡速率來(lái)選擇主鏈路,order表示按照網(wǎng)卡配置的順序來(lái)選擇主鏈路。此ovs-vsctlsetPortbond-nameother_config:active-其中,truedownup時(shí),會(huì)重新切換回去;false表示不會(huì)切換ovs-vsctlsetInterfaceethxother_config:slave-其中n1,2,3…圖4圖5ovsinterface下面以管理網(wǎng)vswitch0由單網(wǎng)口eth7eth5+eth7的動(dòng)態(tài)聚合高級(jí)/ovs側(cè)配置動(dòng)態(tài)聚合高級(jí)(bond_mode=balance-tcp)/基本(bond_mode=ovs-vsctldel-portvswitch0eth7;ovs-vsctl--add-bondvswitch0vswitch0_bondeth5eth7bond_mode=[balance-tcp|balance-slb]--setportvswitch0_bondlacp=activeeth5eth7ovs-vsctldel-portvswitch0eth7;ovs-vsctladd-bondvswitch0vswitch0_bondeth5eth7eth5和eth7對(duì)端交換機(jī)配置動(dòng)態(tài)聚合組,并把這兩個(gè)口加到了聚合組里面(不失一般性,假eth5連接對(duì)端交換機(jī)口GigabitEthernet1/0/5,eth7連接對(duì)端交換機(jī)口 [H3C-Bridge-Aggregation8]link-aggregationmodedynamic [H3C]interfaceGigabitEthernet1/0/5[H3C-GigabitEthernet1/0/5]portlink-aggregationgroup8//G1/0/5[H3C-GigabitEthernet1/0/7]portlink-aggregationgroup8//G1/0/7Bridge-Aggregation8里面聚合組的配置(尤其是vlan的配置)要個(gè)聚合組里面各接口(這里是ovs-vsctlsetportvswitch0_bondbond_mode=[balance-tcp|balance-slb]下面以管理網(wǎng)vswitch0由單網(wǎng)口eth7eth5+eth7的動(dòng)態(tài)聚合高級(jí)/ovs側(cè)配置動(dòng)態(tài)聚合高級(jí)(bond_mode=balance-tcp)/基本(bond_mode=ovs-vsctldel-portvswitch0eth7;ovs-vsctl--add-bondvswitch0vswitch0_bondeth5eth7bond_mode=[balance-tcp|balance-slb]--setportvswitch0_bondlacp=activeeth5eth7ovs-vsctldel-portvswitch0eth7;ovs-vsctladd-bondvswitch0vswitch0_bondeth5eth7eth5和eth7對(duì)端交換機(jī)配置動(dòng)態(tài)聚合組,并把這兩個(gè)口加到了聚合組里面(不失一般性,假eth5連接對(duì)端交換機(jī)口GigabitEthernet1/0/5,eth7連接對(duì)端交換機(jī)口[H3C]interfaceBridge-Aggregation8 [H3C]interfaceGigabitEthernet1/0/5[H3C-GigabitEthernet1/0/5]portlink-aggregationgroup8//G1/0/5[H3C-GigabitEthernet1/0/7]portlink-aggregationgroup8//G1/0/7Bridge-Aggregation8里面聚合組的配置(尤其是vlan的配置)要個(gè)聚合組里面各接口(這里是ovs-vsctlsetportvswitch0_bondbond_mode=[balance-tcp|balance-下面以vswitch0由動(dòng)態(tài)聚合(eth5+eth7)ovs-vsctlsetportvswitch0_bondbond_mode=active-backupeth5eth7對(duì)端交換機(jī)口的聚合組去使能lacp(Bridge-Aggregationovs-vsctlsetportvswitch0_bondbond_mode=[balance-tcp|balance-下面以vswitch0由靜態(tài)聚合(eth5+eth7)ovs-vsctlsetportvswitch0_bondbond_mode=active-ovs-vsctlsetportvswitch0_bondbond_mode=[balance-tcp|balance-slb]這里以vswitch0上eth5+eth7eth7ovs-vsctlsetportvswitch0_bondbond_mode=active-backup[H3C-GigabitEthernet1/0/5]undoportlink-aggregationgroup[H3C]interfaceGigabitEthernet1/0/7第將vswitch0eth7vswitch0ovs-vsctldel-portvswitch0_bond;ovs-vsctladd-portvswitch0ovs-vsctlsetportvswitch0_bondbond_mode=active-才能順利完成,具體請(qǐng)參考《H3CUIS不允許在CVKroot客戶基于用戶密碼的安全性要求,會(huì)定期修改用戶密碼的需求。下面介紹UISroot用戶密碼的修改WEB頁(yè)面修改主機(jī)root在彈出的【修改主機(jī)】對(duì)話框中輸入root用戶新的密碼,并點(diǎn)擊【確定】按鈕,完成主機(jī)密uisManager頁(yè)面有一個(gè)統(tǒng)一的初始密碼。如果需要修改密碼的話,可以進(jìn)入uismanager頁(yè)面之后,在右上角點(diǎn)擊admin選項(xiàng),可以更改密碼。圖6未被使用節(jié)點(diǎn):sd*ceph圖7已被使用:sd*cephRAID后才能加入到集群中而且擴(kuò)容節(jié)點(diǎn)硬盤必須與原集群節(jié)點(diǎn)的硬盤容量和osd,在對(duì)應(yīng)的節(jié)點(diǎn)后臺(tái)依次執(zhí)行以下命令(0對(duì)應(yīng)osdid,確保osdid正確,清理方法如下:systemctlstop\hceph-osd@0.serviceumount/var/lib/ceph/osd/ceph-0rm-rf/var/lib/ceph/osd/ceph-0cephosdout0cephosddown0cephosdrm0cephosdcrushremoveosd.0cephosdcrushremovedevice0cephauthdelosd.0若集群配置了flashcacheceph-diskrmfcachefastremovefcache28c81f-e89d-487d-9585-6da/dev/sd*(假定fcache28c81f-e89d-487d-9585-6daosd.0fcacheuuid)catvar/lib/ceph/osd/ceph-0/block.db_uuid(d737d16d-e97e-48a7-8c4c-2f58e904c7f5)parted-s/dev/sdfrm2readlinkfdev/disk/by-partuuid/a87efe76-de8b-4a4b-95a4-d65174c68b3d(假定輸出為/dev/sdf5)parted-s/dev/sdfrm5umount/var/lib/ceph/osd/ceph-0osd存在服務(wù)自動(dòng)拉起的機(jī)制,systemctlstop\hceph-osd@0.service確保已經(jīng)刪除對(duì)應(yīng)的數(shù)據(jù)盤RAIDRAID后再進(jìn)行后續(xù)操作,不要誤刪系統(tǒng)盤RAIDRAIDRAID0操作,注意:關(guān)閉物理磁盤的緩存,開(kāi)啟RAID卡的緩存。具體關(guān)閉開(kāi)啟方法參考開(kāi)局指導(dǎo)書。使用lsblkceph–s100%1-5選擇選擇主機(jī)-更多操作-刪除主機(jī),刪除主機(jī)后需要等待一段時(shí)間,集群健康度100%完成后才能3節(jié)點(diǎn)的要求。嚴(yán)禁向過(guò)去修改時(shí)間。該行為會(huì)導(dǎo)致web頁(yè)面被禁止登陸、文件系統(tǒng)異常服務(wù)器無(wú)法正常啟動(dòng)、多個(gè)功能邏輯混亂、顯示錯(cuò)誤等異常,可能導(dǎo)致H3CUIS管理平臺(tái)出現(xiàn)未知異常;間后web頁(yè)面主機(jī)/關(guān)機(jī)策略生效時(shí)間、ACL策略啟用時(shí)間段、備份策略、快照策略等定時(shí)功能將受到影響,功CVM雙機(jī)環(huán)境,修改時(shí)間過(guò)程中注意保證主備CVM時(shí)間一致,NTP同步時(shí)間慢時(shí)建議手動(dòng)7。0.15sec。Web頁(yè)面檢查確保虛擬化平臺(tái)無(wú)正在運(yùn)行中的任務(wù),確認(rèn)后在后臺(tái)修改時(shí)間。date命令修改–硬件時(shí)間是否修改無(wú)誤,offset0.15sec。時(shí)區(qū)修改可以使用命令timedatectlset-timezoneZONE],例如印度尼西亞timedatectlset-timezoneAsia/Jakarta腳本會(huì)羅列出集群的所有節(jié)點(diǎn),如果包括了所有節(jié)點(diǎn),則輸入yesnoyes后,會(huì)對(duì)集群各個(gè)節(jié)點(diǎn)進(jìn)行時(shí)區(qū)更改,并輸出前后設(shè)置的date各個(gè)主機(jī)后臺(tái)時(shí)區(qū)設(shè)置完成后,重啟tomcat8服務(wù)(雙機(jī)場(chǎng)景,只在當(dāng)前主節(jié)點(diǎn)執(zhí)行HAxmlCVMHA目錄下保存一份,一般來(lái)說(shuō)位置在/etc/cvm/ha/clust_id/cvk_name下,例如:/etc/cvm/ha/2/cvknode191。在對(duì)應(yīng)的目錄下口找到虛擬機(jī)所在cvk的目錄,進(jìn)入該目錄會(huì)有對(duì)應(yīng)的虛擬機(jī),例如test01虛擬機(jī)的xml。vimcatxml,找到對(duì)應(yīng)磁盤的位置,例如3.12.1xmlscp2中確認(rèn)了存儲(chǔ)卷位置的主機(jī)的/etc/libvirt/qemu目錄xml進(jìn)行虛擬機(jī)define在/etc/libvirt/qemu目錄下執(zhí)行virshdefinevm_xml可以看到虛擬機(jī)通過(guò)xmldefine起來(lái)后臺(tái)virshlist–all也能看到該虛擬機(jī)definelibvirt(確認(rèn)沒(méi)有中文虛擬機(jī))的方式自動(dòng)define虛擬機(jī),如圖所示,在define成功后,在前臺(tái)啟動(dòng)虛擬機(jī)。原有系統(tǒng)相同的UIS版本。文件,防止重啟服務(wù)器后HA注:如果ONEStorcvm舉例修改ONEStor200G在管理節(jié)點(diǎn)執(zhí)行onestorcmquerythandyha確認(rèn)ONEStorsudoupostgrespsqlcalamari;select*fromop_cluster_diskpool;查詢當(dāng)前poolupdateop_cluster_diskpoolsetflashcache_size=200where 321cephosdpoollsdetail查看數(shù)據(jù)池信息cephosdpoolsetxxxsize2(xxx為池的名字cephosdpoolsetxxxmin_size1(xxx為池的名字進(jìn)入postgresselect*fromop_cluster_poolwherepool_name=此時(shí)數(shù)據(jù)池的replicate_numsize使用updateop_cluster_poolsetsize=2,replicate_num=2wherepool_name='池名稱';修改遷走虛擬機(jī)后,需要將待刪除主機(jī)的共享存儲(chǔ)暫停并刪除,保證該主機(jī)上沒(méi)有iscsitgt-admins|grepInitiatorosd_max_backfillsosd_max_backfills50%,Cephtellosd.*injectargs--ONEStor==》主機(jī)管理==》存儲(chǔ)節(jié)點(diǎn)==》選擇節(jié)點(diǎn)==》刪除主機(jī),刪除主機(jī)后需要等待一段注:針對(duì)不能打開(kāi)ONEStor版本的情況,請(qǐng)執(zhí)行如下命令臨時(shí)打開(kāi)(主備都需執(zhí)行ONEStorONEStor管理界面添加該服務(wù)器,使用單機(jī)部署方式添加主機(jī)==》主機(jī)管理==》存儲(chǔ)節(jié)點(diǎn)==1的限制,點(diǎn)擊下一步ONEStor等待ONEStor100%onestor100%3.14.4-3.14.8,完成主機(jī)onestor集群刪除再添加。進(jìn)行緩存變更操作。所有節(jié)點(diǎn)更換完成后還原副本數(shù)。UISUIS在[管理/日志文件收集]頁(yè)面收集UIS選擇需要收集的CVK主機(jī),并點(diǎn)擊<收集日志文件>在CVK主機(jī)后臺(tái)執(zhí)行“cas_collect_log.sh”命令,收集完成后在“/vmsCVKONEStor相關(guān)無(wú)法執(zhí)行腳本收集,需要手動(dòng)拷貝/var/log/storage,/var/log/ceph日志,如果所需要的日志周期較短,或者以上日志太大,可以只收集歸檔/var/log/storage/backup的一部分。UIS_×××_×××.ta.gz*.diag.tar.bz2各CVKonestoretc:目錄包含了UISvar:目錄包含了UISVar目錄包含了UISmessages日志記錄了操作系統(tǒng)運(yùn)行中重要的信息,如下介紹CVK13:58:0114:06:35messages日志文件中沒(méi)有任何的信息記錄,說(shuō)明該時(shí)間段內(nèi)CVK主機(jī)異常。后面Kernel級(jí)別的日志記錄CVKFeb313:58:01XJYZ-CVK01CRON【64458】:(root)CMD(ump-node-sync)Feb313:58:01XJYZ-CVK01CRON【64459】rootCMDump-syncpALL) Feb313:58:01XJYZ-CVK01CRON【64443】CRONinfoNoMTAinstalleddiscardingoutput)Feb314:06:35XJYZ-CVK01kernel:imklog5.8.6,logsource=/proc/kmsgstarted.Feb314:06:35XJYZ-CVK01rsyslogd:originsoftware="rsyslogd"swVersion="5.8.6"x-pid="2747"x-info="\h"】startFeb314:06:35XJYZ-CVK01rsyslogd:rsyslogd'sgroupidchangedto103Feb314:06:35XJYZ-CVK01rsyslogd:rsyslogd'suseridchangedto101Feb314:06:35XJYZ-CVK01rsyslogd-2039Couldnotopenoutputpipedev/xconsole【\hFeb314:06:35XJYZ-CVK01kernel:【0.000000】InitializingcgroupsubsyscpusetFeb314:06:35XJYZ-CVK01kernel:【0.000000】InitializingcgroupsubsyscpuFeb314:06:35XJYZ-CVK01kernel【0.000000】InitializingcgroupsubsyscpuacctFeb314:06:35XJYZ-CVK01kernel【0.000000】Linuxversion3.13.6root@cvknode22(gccversion4.6.3(Ubuntu/Linaro4.6.3-1ubuntu5))#5SMPMonJul2110:07:26CST2014】Feb314:06:35XJYZ-CVK01kernel【0.000000】KERNELsupportedcpus:Feb314:06:35XJYZ-CVK01kernel:【0.000000】IntelGenuineIntelFeb314:06:35XJYZ-CVK01kernel:【0.000000】AMDAuthenticAMDFeb314:06:35XJYZ-CVK01kernel【0.000000】CentaurFeb314:06:35XJYZ-CVK01kernel【0.000000】e820BIOS-providedphysicalRAM 0.000000】 0x0000000000000000-0x000000000009cbff】usable 0.000000 】 0.000000 】 0.000000 】如下所示,日志文件【/var/log/libvirt/libvirtd.logCVK主機(jī)的缺少內(nèi)存資源告警,當(dāng)前內(nèi)存97%(CPU資源不足時(shí)提示信息類似)2014-10-2409:15:52.792+0000:2994:warning:virIsLackOfResource:1106:LackofMemoryresource!only374164free64068cachedandvmlockedmemory(4194304*0%)of16129760total,max:85;now:97outofmemoryorcpuistoobusy,pleasecheckit.root@UIS-CVK01:/var/log/libvirt/qemu#ls-ltotal44-rw1rootroot7067Jan919:08-rw1rootroot1969Jan1815:41-rw1rootroot26574Feb1116:152015-02-1115:50:18.349+0000:starting QEMU_AUDIO_DRV=none/usr/bin/kvm-namewindows2008-S-machine 43741f06-166d-4155-b47e-4137df68e91c-no-user-config-nodefaults-chardevync–devicechardeviceredirectedto/dev/pts/0(labelcharserial0)qemu:terminatingonsignal15frompid45302015-02-1116:15:28.825+0000:shutting如下所示,日志文件【/var/log/fsm/fsm_core*.logCVKocfs2fence觸發(fā)處理的2021-11-0406:40:35,882manager:233INFOReceivedanevent:{'index':7,'type':'fence_umount','uuid':u'851D36905AB74AFD93E1ABA8259DA3A2','seq':11538,'dev_name':2021-11-0406:40:35,923manager:204INFORemain0eventstobe2021-11-0406:40:35,923manager:131INFOManagerreceivedanevent:Poolsharefile06was2021-11-0406:40:35,923fspool:141INFOPoolsharefile06receivedaeventOperation日志記錄了在CVK4月19到4月21root@cvknode1:~/cas#ll/var/log/operation/total32drwxrwxrwx2rootroot4096Apr2110:06./drwxr-xr-x40rootroot4096Apr2111:01../-rwxrwxrwx1rootroot5162Apr1917:4918-04--rwxrwxrwx1rootroot829Apr2019:1118-04--rwxrwxrwx1rootroot8505Apr2111:0018-04-Operation日志文件的信息內(nèi)容如下所示,包括了命令的執(zhí)行時(shí)間、登錄用戶、登錄地址和登錄方2018/04/1916:56:50##rootpts/6()##/root##vi/var/log/tomcat8/cas.log2018/04/1916:57:05##rootpts/6()##/root##servicetomcat8restart2018/04/1917:02:21##rootpts/5()##/root##cat/etc/cvk/system_alarm.xml2018/04/1917:02:23##rootpts/5()##/root##lsblk2018/04/1917:49:04##rootpts/6()##/root##cephosdtree2018/04/1917:49:19##rootpts/6()##/root##stopceph-osdid=3UIS系統(tǒng)和虛擬機(jī)是相互隔離的,為了實(shí)現(xiàn)UIS系統(tǒng)對(duì)虛擬機(jī)的監(jiān)控和管理,需要在虛擬機(jī)內(nèi)部的castools工具。的【事件查看器】頁(yè)面右鍵點(diǎn)擊【W(wǎng)indowsLinux2019-09-17vm_test虛擬機(jī)的日志:KdumpLinux內(nèi)核的一個(gè)轉(zhuǎn)儲(chǔ)工具,其基本原理是在內(nèi)存中保留一塊區(qū)域,這塊區(qū)域用來(lái)存放UIS系統(tǒng)默認(rèn)支持Kdump功能,在CVK主機(jī)的內(nèi)核異常時(shí),會(huì)在/vms/crashcrash文件,以方便后續(xù)問(wèn)題定位,比如某CVKcrash文件如下:root@cvk29:/vms/crash#ls-drwxr-sr-x2rootwhoopsie4096Jul2217:342014-07-22-cvknode1節(jié)點(diǎn)反復(fù)重啟,將節(jié)點(diǎn)上的虛擬機(jī)全部遷移走,并刪除了共享存儲(chǔ)配置后,vmcore文件。root@cvk21:/vms/tmp#crachvmlinuxvmcoreNocommand'crach'found,didyoumean:Command'crash'frompackage'crash'(main)crach:commandnotfoundroot@cvk21:/vms/tmp#crashvmlinuxvmcorecrashCopyright(C)2002-2014RedHat,Copyright(C)2004,2005,2006,2010IBMCorporationCopyright(C)1999-2006Hewlett-PackardCoCopyright(C)2005,2006,2011,2012FujitsuLimitedCopyright(C)2006,2007VALinuxSystemsJapanK.K.Copyright(C)2005,2011NECCorporationCopyright(C)1999,2002,2007SiliconGraphics,Copyright(C)1999,2000,2001,2002MissionCriticalLinux,Thisprogramisfreesoftware,coveredbytheGNUGeneralPublicLicense,andyouarewelcometochangeitand/ordistributecopiesofitundercertainconditions.Enter"helpcopying"toseetheconditions.Thisprogramhasabsolutelynowarranty.Enter"helpwarranty"forGNUgdb(GDB)Copyright(C)2013FreeSoftwareFoundation,LicenseGPLv3GNUGPLversion3orlater【\h/licenses/gpl.html】Thisisfreesoftware:youarefreetochangeandredistributeit.ThereisNOWARRANTY,totheextentpermittedbylaw.Type"showcopying"and"showwarranty"fordetails.ThisGDBwasconfiguredas"x86_64-unknown-linux- KERNEL: DUMPFILEvmcore【PARTIALDUMP CPUS: DATE:WedNov512:25:19 UPTIME:LOADAVERAGE:0.06,0.05, TASKS: RELEASE: VERSION:#5SMPMonJul2110:07:26CST MACHINE:x86_64(2132 MEMORY:64 PANIC:"Kernelpanic-notsyncing:FatalMachine PID: COMMAND: TASKffff8807f4618000(1of8)【THREAD_INFOffff8807f4620000 CPU: STATE:TASK_RUNNINGcrash】PID: TASK:ffff8807f4618000CPU: COMMAND:#0【ffff8807ffc6ac50】machine_kexecatffffffff8104c991#1【ffff8807ffc6acc0】crash_kexecatffffffff810e97e8#2【ffff8807ffc6ad90】panicatffffffff8174ac9d#3【ffff8807ffc6ae10】mce_panicat#4【ffff8807ffc6ae60】do_machine_checkatffffffff810399d8#5【ffff8807ffc6af50】machine_checkatffffffff817589df 【exceptionRIPintel_idle+204 RIP:ffffffff8141006cRSP:ffff8807f4621db8RFLAGS: RAX:0000000000000010RBX:0000000000000004RCX: RDX:0000000000000000RSI:ffff8807f4621fd8RDI: RBP: R8: R9: R10:0000000000000001R11:0000000000000001R12: R13:0000000000000010R14:0000000000000002R15: ORIG_RAX:ffffffffffffffffCS:0010SS:【MCEexceptionstack】#6【ffff8807f4621db8】intel_idleat#7【ffff8807f4621df0】cpuidle_enter_stateatffffffff81602a8f#8【ffff8807f4621e50】cpuidle_idle_callatffffffff81602be0#9【ffff8807f4621ea0arch_cpu_idleat#10【ffff8807f4621eb0】cpu_startup_entryatffffffff810c1818#11【ffff8807f4621f20】start_secondaryatffffffff8104306b從異常??梢钥吹剑霈F(xiàn)MCEexceptionMachineCheckError 15.707981】8021q:802.1QVLANSupport 16.416569】drbd:initialized.Version:8.4.3(api:1/proto:86- 16.416573】drbd:srcversion: 16.416575】drbd:registeredasblockdevicemajor 17.142281】Ebtablesv2.0 17.203400】ip_tables:(C)2000-2006NetfilterCore 17.247387】ip6_tables:(C)2000-2006NetfilterCore【139.114172】Disablinglockdebuggingduetokernel 139.114185】mce:【HardwareError】:CPU2:MachineCheckException:4Bank5:【139.114192】mce【HardwareError】TSC10ba0482e78ADDR3fff81760d32MISC【139.114199mce【HardwareError】PROCESSOR0:206c2TIME1415161519SOCKET0APICmicrocode【139.114203】mce【HardwareError】Runtheabovethroughmcelog【139.114208】mce【HardwareError】MachinecheckProcessorcontext【139.114211】KernelpanicnotsyncingFatalMachinecheck從以上的信息基本可以確定是硬件CPU2某局點(diǎn)反映cvk節(jié)點(diǎn)無(wú)故重啟,分析syslog在重啟前后的日志信息,沒(méi)有發(fā)現(xiàn)異常記錄。crash】PID:0 TASK:ffffffff81c144a0CPU:0 COMMAND"swapper/0"#0【ffff880c0fa07c60】machine_kexecatffffffff8104c991#1【ffff880c0fa07cd0】crash_kexecat#2【ffff880c0fa07da0】panicat#3【ffff880c0fa07e20】asminline_callatffffffffa014c895【hpwdt】#4【ffff880c0fa07e40】nmi_handleatffffffff817598da#5【ffff880c0fa07ec0】do_nmiat#6【ffff880c0fa07ef0end_repeat_nmiat 【exceptionRIPintel_idle+204 RIP:ffffffff8141006cRSP:ffffffff81c01da8RFLAGS: RAX:0000000000000010RBX:0000000000000010RCX: RDX:ffffffff81c01da8RSI:0000000000000018RDI: RBP: R8: R9: R10:ffffffff81c01da8R11:0000000000000046R12: R13:0000000000000000R14:ffffffff81c01fd8R15: ORIG_RAX:0000000000000000CS:0010SS:【NMIexceptionstack】#7【ffffffff81c01da8】intel_idleat#8【ffffffff81c01de0】cpuidle_enter_stateatffffffff81602a8f#9【ffffffff81c01e40】cpuidle_idle_callatffffffff81602be0#10【ffffffff81c01e90】arch_cpu_idleatffffffff8101e2ce#11【ffffffff81c01ea0】cpu_startup_entryatffffffff810c1818#12【ffffffff81c01f10】rest_initatffffffff8173fc97#13【ffffffff81c01f20】start_kernelat#14【ffffffff81c01f70】x86_64_start_reservationsatffffffff81d375f8#15【ffffffff81c01f80】x86_64_start_kernelatffffffff81d3773e【10753.155822】sd3:0:0:1【sdd】VerybigdeviceTryingtouseREAD【10804.115376sbridgeHANDLINGMCEMEMORY【10804.115386】CPU23MachineCheckException0Bank9SOCKET1APIC2b【10804.283467sbridgeHANDLINGMCEMEMORY【10804.283473】CPU9MachineCheckException0Bank9SOCKET1APIC26【10804.303482】EDACMC128416CEmemoryscrubbingerroronCPU_SrcID#1_Channel#0_DIMM#0(channel:0slot:0page:0x12422f7offset:0x0grain:32syndrome:0x0-OVERFLOWarea:DRAMerr_code:0008:00c0socket:1channel_mask:1rank:0)【10804.303489】EDACMC1:192CEmemoryscrubbingerroronCPU_SrcID#1_Channel#0_DIMM#0(channel:0slot:0page:0x12424a7offset:0x0grain:32【10804.319474sbridgeHANDLINGMCEMEMORY【10804.319481】CPU6MachineCheckException0Bank9SOCKET1APIC20【10805.303772EDACMC1:64CEmemoryscrubbingerroronCPU_SrcID#1_Channel#0_DIMM#0(channel:0slot:0page:0x1243087offset:0x0grain:32syndrome:0x0-OVERFLOWarea:DRAMerr_code:0008:00c0socket:1channel_mask:1rank:0)【10813.602696】sd3:0:0:0【sdc】VerybigdeviceTryingtouseREAD【10813.603219】sd3:0:0:1【sdd】VerybigdeviceTryingtouseREAD【10840.833238】Kernelpanic-notsyncing:AnNMIoccurred,pleaseseetheIntegratedManagementLogfordetails.TryingtouseREADCAPACITY(16).Nov3007:05:55HBND-UIS-E-CVK09kernel【229875.188873CPU23MachineCheckException:0Bank9:cc1e0010000800c0Nov3007:05:55HBND-UIS-E-CVK09kernel:229875.188874】TSC0ADDR10638f7000MISC90868002800208cPROCESSOR0:306e4TIME1417302355SOCKET1APIC2bsyndrome:0x0-OVERFLOWarea:DRAMerr_code:0008:00c0socket:1channel_mask:1rank:0)root@gzh-139:/vms/issue_logs/hebeinongda/20141201/HBND-UIS-E-CVK09/logdir/var/log#grepOVERFLOWkern*|wc ceph.logcephw查ceph日志中發(fā)現(xiàn)打印如下異常日志,原因是集群主moniter2017-05-0919:44:03.400143mon.24:6789/02009:cluster[INF]callingnewmonitor2017-05-0919:44:03.404362mon.13:6789/02023:cluster[INF]callingnewmonitorwonleaderelectionwithquorum2017-05-0919:44:05.428131mon.13:6789/02025:cluster[INF]HEALTH_WARN;monsdown,quorum1,2osds:12up,18ceph100%,集群正處于恢復(fù)2017-06-0619:31:41.319993mon.01:6789/086387:cluster[INF]pgmap4096pgs:2561active+clean,1532active+remapped+wait_backfill,3active+remapped+backfilling;3362GBdata,6730GBused,21941GB/28672GBavail;0B/sobjectsmisplaced(67.696%);62992kB/s,15objects/srecoveringcephhandy以及非主moniter節(jié)點(diǎn)的存2017-05-1216:05:14.585496mon.01:6789/0106035:cluster[INF]osd.31itself2017-05-1216:05:15.095824mon.01:6789/0106038:cluster[INF]osd.33itselfosds:25up,362017-05-1216:05:15.287350mon.01:6789/0106042:cluster[INF]osd.27itselfosds:24up,362017-04-2514:34:08.8071467f5bf690a780-1journalUnable2017-04-2514:34:08.8071467f5bf690a780-1journalUnabletoreadpastsequencebutheaderindicatesthejournalhascommittedupthrough301115842,journalisceph-osd日志中發(fā)現(xiàn)打印如下異常日志,原因是OSD2017-03-0911:46:01.5760347f08783647001heartbeat_mapis_healthy'FileStore::op_tpthread0x7f086fa6c700'hadsuicidetimedoutafter1802017-03-0911:46:01.576049common/HeartbeatMap.cc:81:FAILEDassert(0=="hitsuicideceph-osd日志中發(fā)現(xiàn)打印如下異常日志,原因是OSD沒(méi)有2017-04-2719:46:18.2805107fcfb954c7005filestore(/var/lib/ceph/osd/ceph-85)819850ad/rbd_date.3b7055757a07.0000000000000ab1/7//1date_digest0xd7ac1812!=bestguessdate_digest0x43d61c5dfromauthshard0ceph-disk.log主要記錄部署OSD以及啟動(dòng)OSDceph-osd.*.log配合來(lái)定位ceph-disk日志中發(fā)現(xiàn)打印如下異常日志,原因是OSD激活掛載時(shí),掛載目錄“/var/lib/ceph/osd/ceph-*”下存在文件,osd停止掛載進(jìn)程退出;問(wèn)題出現(xiàn)的時(shí)間點(diǎn)一般在主機(jī)重啟時(shí),所有的OSD需要重新激活,在OSDmount前會(huì)檢查OSD目錄下是否有除ceph-disk:Error:anothercephosd.71alreadymountedinposition(old/differentclusterinstance?);unmountingours.ceph-disk日志中發(fā)現(xiàn)打印如下異常日志,原因是osdFri.07Apr201710:24:48ceph-disk[line:2438]ERRORFailedtoceph-mon.*.log主要記錄集群對(duì)應(yīng)監(jiān)控節(jié)點(diǎn)的信息,monitor的作用主要是監(jiān)控集群;若集群監(jiān)控節(jié)點(diǎn)出現(xiàn)問(wèn)題,對(duì)應(yīng)的mon日志將會(huì)記錄異常原因,作為定位問(wèn)題的依據(jù)。ceph-mon日志中查看mon異常的原因,ceph-mon日志對(duì)應(yīng)的查志,原因是主mon節(jié)點(diǎn)異常(常見(jiàn)原因是主mon節(jié)點(diǎn)業(yè)務(wù)網(wǎng)異?;蛑鱩onceph-mon進(jìn)程停止),mon觸發(fā)選舉機(jī)制;2017-05-0819:24:58.0179357fb173765700 1mon.cvknode84@2(peon).paxos(paxosactivec24348..24883)lease_timeout--callingnewelection2017-05-0819:24:58.0244567fb172f647000log_channel(cluster)log[INF]:mon.cvknode84callingnewmonitorelectioncalamari.loghandyhandy若是在calamari.log日志中發(fā)現(xiàn)打印如下異常日志,原因是handy2017-05-0815:08:29,060-ERROR-onestor_common.py[network_check][line:494]-django.request<network_check>Host"4"isunreachable,retryagain...2017-05-0815:08:29,060-ERROR-onestor_common.py[execute][line:622]-django.request[ONEStor]onestor_request_all_nodecvknode84:Hostisunreachable/var/log/onestor_cli/onestor_cli.log日志,onestor_cli.log日志記錄了若是在onestor_cli.log5G[2017-05-1010:47:01,980][WARNING][monitor.py][line:157]Wedetectthecurrentcollectinglogsizeisupto5GB,endingcollectingautomatically!若是發(fā)現(xiàn)節(jié)點(diǎn)onestor_cli.logcephosdreweight-by-utilization命c(diǎn)eph-s顯示healthHEALTH_OK后硬盤的數(shù)據(jù)平衡完成。系統(tǒng)盤空間可以通過(guò)dfhUse達(dá)到100%apache、ceph的mon進(jìn)程等無(wú)法啟動(dòng),導(dǎo)致的現(xiàn)象如mondown,管理節(jié)點(diǎn)無(wú)法登錄等。root@cvknode86:~#df- SizeUsedAvailUse%Mounted 28G4.0G23G16%執(zhí)行fio時(shí)未指定--filename的情況下,fio的數(shù)據(jù)會(huì)自動(dòng)寫入系統(tǒng)盤,生成一個(gè)test0.0的大文件占據(jù)大量磁盤空間。echo“”>XXX然后rm-rfXXX刪除該文件釋放空間即可。解決方法:增加主機(jī)之前先手動(dòng)umountPGsdX將主機(jī)重啟,將會(huì)造成該硬盤在操作系統(tǒng)上不可見(jiàn),lsblkfdisk觀察少了一個(gè)硬盤。controllerallshowconfigsdd對(duì)應(yīng)的邏輯分區(qū)FAIL,如下圖:hpssaclictrlslot=0logicaldrive4deletehpssaclicontrollerallshowconfigunassigned,未被分配的物理硬盤,hpssaclictrlslot=0createtype=lddrives=2I:2:3載至/dev/sde1硬盤分區(qū)。若此時(shí)ONEStorsdesde正常mountumountmountOSDjournal(寫加速)盤分區(qū),需要通過(guò)查詢partuuid來(lái)準(zhǔn)確地查詢到對(duì)應(yīng)關(guān)系。OSD目錄下的fdisOSD數(shù)據(jù)分區(qū)的cat/var/lib/ceph/osd/ceph-8/fsidOSD目錄下的journal_uuid文件,里面記錄了OSDjournalcat/var/lib/ceph/osd/ceph-8/journal_uuid lrwxrwxrwx1rootroot10Dec619:551f8b0b99-69c6-404a-acfe-186f435fd877->lrwxrwxrwx1rootroot10Dec619:55260c435a-2c35-4562-979d-7a3d641dda48->找到相同的partuuidUIS界面未刪除故障osdosdUISOSD,直接更換新的硬盤后,HandyOSD,導(dǎo)致原來(lái)OSD顯示暫無(wú)數(shù)據(jù),無(wú)法刪除,此時(shí)可以通過(guò)后臺(tái)命令刪除該OSD。lsblkosd是否仍然掛載,保證已取消掛載正常mount狀態(tài):ps–ef|greposdosdstopceph-osdid=xcephosdoutcephosdcrushremoveosd.xcephauthdelosd.xcephosdrm確保主機(jī)管理接口與Managershutdownup端口;如果配置了動(dòng)態(tài)端口聚合,需要配置端口為邊緣端口(lacpedge-port需要查看每個(gè)cvk/etc/cvkcvm_info文件和/root/.ssh下的mhost文rm–rfcvm_inform–rfmhost要加入的主機(jī)曾經(jīng)做過(guò)manager查看/root/.ssh下是否存在isCvmFlagrm–rfip后檢測(cè)連通性。在主機(jī)后臺(tái)使用命令lsblk查看磁盤是否存在分區(qū),如果存在需要?jiǎng)h除對(duì)應(yīng)分區(qū)parteddev/sdxrmy(x為盤符,y為分區(qū)號(hào)。sdd磁盤的第三個(gè)分區(qū):parteddev/sddrm這種情況可以通過(guò)后臺(tái)重新安裝onestor服務(wù)器或者raidUIS0716handycheck_raid_support這個(gè)腳本,,屏蔽設(shè)備管理,sed–i‘s/\$result/false/g’/opt/h3c/sbin/check_raid_support,然后執(zhí)行check_raid_supportfalse,即可。UIS0716之后版本:修改handy節(jié)點(diǎn)的/opt/h3c/sbin/devmgr_check_dev_type這個(gè)腳本屏蔽設(shè)備管理,在defcheck_raid_card()函數(shù)中,直接添加一行代碼:returnFalse。FalseUIS后臺(tái),使用ping硬盤故障或RAIDUIS前臺(tái)界面查看告警是否存在硬盤或者RAIDosd目錄是否被打開(kāi),可以確定該問(wèn)題是由于刪除主機(jī)時(shí)打開(kāi)osd目錄。cd命令退出該osd目錄,然后手動(dòng)執(zhí)行umountvar/lib/ceph/osd/ceph-11sgdiskzap-alldev/sdfosdcephlsblk查看想要添加的硬盤,查看硬盤已有分區(qū),再使用gdisk-l/dev/xxx(xxx為盤符名稱)ceph標(biāo)識(shí),則認(rèn)為此硬盤已被ceph-diskzapdev/xxx(xxx為盤符名稱)當(dāng)前UIS最新版本已經(jīng)支持前臺(tái)清理分區(qū),如果清理分區(qū)后仍然無(wú)法掃描到磁盤,可以嘗試再次執(zhí)ceph-diskzap/dev/xxxhandy節(jié)點(diǎn)不支持設(shè)備管理,需要新擴(kuò)容的主機(jī)也不支持設(shè)備管UIS0716版本以前版本:修改handycheck_raid_support這個(gè)腳本,,屏蔽設(shè)備sed–i‘s/\$result/false/g’/opt/h3c/sbin/check_raid_support,然后執(zhí)行check_raid_supportfalse,即可。UIS0716之后版本:修改handy節(jié)點(diǎn)的/opt/h3c/sbin/devmgr_check_dev_type這個(gè)腳本屏蔽設(shè)備管理,在defcheck_raid_card()函數(shù)中,直接添加一行代碼:returnFalse。Falsemondown“1mons”->”osddown,例如“3osdsareosdsshIP,輸入命令行“cephosdtree”顯示所有的osd查看所有osd進(jìn)程是否已啟動(dòng)“ps-ef|grepceph-將未啟動(dòng)的osd進(jìn)程手動(dòng)啟動(dòng)“systemctlstart\hceph-osd@xx.service(xxosd的id編號(hào)先使用lsblk命令找到down的硬盤對(duì)應(yīng)的osd輸入ll查看軟連接是否存在,正常如下,journal文件對(duì)應(yīng)了一個(gè)diskpg狀態(tài)告警,例如“32pgsdegraded”“108pgsstale”“15pgsstuckunclean”“32pgs候如果是手動(dòng)做的raid,可能沒(méi)有按照緩存設(shè)置標(biāo)準(zhǔn)去開(kāi)啟關(guān)閉緩存,第二是在集群使用過(guò)程中的故障造成,例如raid卡電池故障可能引起的邏輯緩存異常等。UISManager擬化業(yè)務(wù)管理功能,確保H3CUIS超融合管理平臺(tái)的故障不會(huì)影響到虛擬化環(huán)境的管理。H3CUIS超融合管理平臺(tái)所在的服務(wù)器故障后,需要在備用的服務(wù)器上重新安裝H3CUIS超融合管理平臺(tái),此時(shí),先前備份的UISManager配置將被導(dǎo)入到新的H3CUIS超融合管理平臺(tái)。如下是UISManager主機(jī)故障時(shí)的還原操作步驟:UIS超融合管理平臺(tái),在導(dǎo)航菜單中依次選擇【管理】/【管理數(shù)據(jù)備份】,在“管理數(shù)據(jù)備點(diǎn)擊“備份歷史”標(biāo)簽頁(yè),H3CUIS超融合管理平臺(tái)將自動(dòng)從指定的備份位置獲取所有的備在“備份歷史”中,選擇需要恢復(fù)的UISManager配置數(shù)據(jù),點(diǎn)擊該數(shù)據(jù)所在行的“”mon查看monps-ef|grepceph-若mondfhdfhFilesystemSizeUsedAvailUse%Mounted/dev/sda110G9.6G0.4G96%/udev863M12K863M1%/devtmpfs349M348K349M1%/runnone5.0M05.0M0%/run/locknone873M4.0K873M1%/run/shm查看進(jìn)程狀態(tài):psaux|grepceph-root@cvknode20216:~/515#psaux|grepceph-root26195070.00.181122136pts/3S+17:470:00grep--color=autoceph-diskspace95%,mon進(jìn)程異常??赏ㄟ^(guò)釋放系統(tǒng)盤空間,啟動(dòng)monserviceceph-mon@cvknode2status(不同節(jié)mon查看mon若mon進(jìn)程存在,則測(cè)試mon之間的互pingarpaifconfigmonarp解決網(wǎng)絡(luò)問(wèn)題后,啟動(dòng)mon檢測(cè)是否開(kāi)啟extentcat/etc/crontab檢查下版本是否開(kāi)啟extent12extentcat/etc/crontab#Fordetailsseeman4crontabs#Exampleofjobdefinition: minute(0-# hour(0-#| dayofmonth(1-#|||.month(1-12)ORjan,feb,mar,apr#||| dayofweek(0-6)(Sunday=0or7)OR#||||#*****user-namecommandtobe22**5 python/opt/bin/ocfs2_pool_fstrim.pyc-s2***root*/1**** python */3****root*****root*/10****rootpython/opt/bin/ocfs2_cluster_config.pyc-0*/12***rootpython****root*/10****root****root/vms/.ocfs2_extent_backuplzollll–a-rw-r--r--1rootroot176Dec2400:00cd/homelzopcd/homelzop-dvpythonpython/opt/bin/ocfs2_restore_utils.pycdd/dev/dm-0:解壓后的/ms-fsmclishowpool--namedevicename:/dev/dm-devicepath:/dev/disk/by-id/dm-name-360000000000000000e0000003b75836cdevicenaa:360000000000000000e0000003b75836c舉例實(shí)施前主機(jī)后臺(tái)dfh增加硬件重新掛上數(shù)據(jù)盤,并選擇高速SCSI如本例中vdbsdamount/dev/sda虛擬機(jī)后臺(tái)執(zhí)行fstrimvms/ruitest總線類型為高速SCSImount-odiscard/dev/sda執(zhí)行mount命令確認(rèn)已為網(wǎng)管平臺(tái)接收不到getsnmp服務(wù)開(kāi)始監(jiān)聽(tīng)getport使用netstatapn|grepxxxxxxxx(xxxx為getport配置端口號(hào)),查看該端口占用情況,可以看到最右側(cè)的進(jìn)程pid,再使用psaux|grepxxxxxxxxxxxx為進(jìn)程pid)命令,查看該端口被snmp-get-responder進(jìn)程外還有其余進(jìn)程使用該端口,則認(rèn)為此端口已被其余進(jìn)程占用。killxxxxxx(xxxxxxpid)關(guān)閉snmpv1版本getoid在存儲(chǔ)端leadersnmpgetv1c$community$ip:$port$oid,其中$community為讀團(tuán)體名,不配置時(shí)輸入public,$ip為存儲(chǔ)端ip,$port為所配置的getport端口號(hào),$oid為網(wǎng)管oid配置錯(cuò)誤。snmpv2c版本和v3版本getoid存儲(chǔ)支持的 范圍如下:.4.1.2550.2、.4.1.2550.9。在配置/var/log/onestor/snmp_get_responder.logNoSuchObjectError”錯(cuò)誤提示,oidoid范圍內(nèi),miboid節(jié)點(diǎn)??赡艽嬖谌缦虑闆r:oid輸入了多于正確oid.4.1.2550.2.0.1,需檢查位數(shù)是否正確。節(jié)點(diǎn)存在,但該節(jié)點(diǎn)無(wú)讀寫權(quán)限。可能存在如下情況:oid輸入了少于正確oid的位數(shù),如oidoid修改為正確值,修改正確后,日志中將不會(huì)打印上述錯(cuò)誤信息,提示“Successtowritethevars產(chǎn)品提供快照功能是存儲(chǔ)側(cè)快照,創(chuàng)建快照的瞬間無(wú)法保證主機(jī)測(cè)沒(méi)有緩存數(shù)據(jù),通hangIO實(shí)現(xiàn)Windows客戶端有緩存機(jī)主機(jī)側(cè)需要agent軟件配合進(jìn)行快照創(chuàng)建時(shí)緩存刷盤。目前暫無(wú)此軟件,可采用離線快照的方式規(guī)建議不要將源LUN和快照LUN對(duì)卷打快照后,handy界面把卷移除映射后(不執(zhí)行掃盤和斷iscsi連接操作),進(jìn)mountmount,wrongfstypeLinux客戶端掛載原卷,新建的文件系統(tǒng)由于緩存的問(wèn)題未能刷盤,此時(shí)創(chuàng)建存儲(chǔ)側(cè)快照,快照文superblock損壞錯(cuò)誤。負(fù)載均衡在intelixgbe通過(guò)命令ethtool–ieth0查看網(wǎng)卡driver是否為ixgbe通過(guò)命令ethtool–keth0查看網(wǎng)卡的LRO(large-receive-offload)通過(guò)命令ethtool–Keth0lrooff關(guān)閉LRO在/etc/rc.local文件中加入ethtool–Keth0lrooff低限制的qos并發(fā)數(shù)IO0現(xiàn)象。IO2條方法中的配置文件。iSCSI連接進(jìn)行多連接的配置方案,進(jìn)行壓力分解??蛻舳诵薷膇SCSIIO在客戶端修改iSCSI啟動(dòng)器配置文件,增大啟動(dòng)器的IO限制,方法如下:打開(kāi)iSCSI啟動(dòng)器的配置文件,默認(rèn)路徑為/etc/iscsi/iscsid.conf2048。部分廠商的加密狗不支持網(wǎng)絡(luò)USB方式,在使用前需要先進(jìn)行對(duì)接測(cè)試。如果遇到問(wèn)題,請(qǐng)聯(lián)系H3C技服人員處理。USBcvk把USB設(shè)備插到cvkUIS的WEB管理界面給虛機(jī)添加USBUSB插槽可能沒(méi)有插對(duì),USB設(shè)備換一個(gè)插槽試試。用小辮子的,可以嘗試把USB設(shè)備直接插到服務(wù)器內(nèi)部的USBUSBUSBlsusb–tUSB設(shè)備插的插槽是否正確。例:root@cvk-163:~#lsusb-/:Bus04.Port1:Dev1,Class=root_hub,Driver=xhci_hcd/6p,/:Bus03.Port1:Dev1,Class=root_hub,Driver=xhci_hcd/15p,/:Bus02.Port1:Dev1,Class=root_hub,Driver=ehci-pci/2p,|Port1:Dev2,If0,Class=hub,Driver=hub/8p,/:Bus01.Port1:Dev1,Class=root_hub,Driver=ehci-pci/2p,|Port1:Dev2,If0,Class=hub,Driver=hub/6p,UHCIUSB1.1,EHCIUSB2.0,XHCI表示USB3.0。一般USB1.1最12Mbps,USB2.0480Mbps,USB3.05Gbps。USBUSB2.0USB2.0(ehci-pci)的總線下新增一個(gè)USB設(shè)備,則說(shuō)明USB設(shè)備插的插槽是正確的。root@CVK:~#Bus001D

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論