版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第頁文檔編號(hào)XX_應(yīng)急_數(shù)據(jù)庫緊急處理手冊版本號(hào)V1.0密級(jí)秘密應(yīng)急_數(shù)據(jù)庫緊急處理手冊XXX信息技術(shù)有限公司
版本控制編號(hào)修訂人修訂時(shí)間版本號(hào)修訂內(nèi)容說明23目錄1 數(shù)據(jù)庫故障緊急處理流程圖 42 數(shù)據(jù)庫故障緊急的分析處理 53 數(shù)據(jù)庫異常處理——查殺SQL處理 73.1 目的 73.2 適用范圍 73.3 執(zhí)行時(shí)間 73.4 流程說明 83.5 自動(dòng)化腳本原理及實(shí)現(xiàn)方法介紹 93.6 技術(shù)部處理流程 9 數(shù)據(jù)庫故障緊急處理流程圖數(shù)據(jù)庫故障緊急的分析處理緊急場景:服務(wù)器掉電或其它硬件故障緊急處理:如果服務(wù)器掉電或其它硬件故障,則直接切換數(shù)據(jù)庫到備機(jī)運(yùn)行。把數(shù)據(jù)庫浮動(dòng)ip地址綁定到切換后的主機(jī)。預(yù)防措施:做好服務(wù)器硬件的選型工作,減少硬件出現(xiàn)問題的概率做好服務(wù)器硬件方面的巡檢工作,提前發(fā)現(xiàn)問題保證數(shù)據(jù)庫雙機(jī)狀態(tài)的可用性,保證切換的有效性。緊急場景:數(shù)據(jù)庫服務(wù)器負(fù)載異常升高,檢查操作系統(tǒng)日志/var/log/messages,如果確定出現(xiàn)系統(tǒng)內(nèi)核bug,導(dǎo)致db2主進(jìn)程出現(xiàn)問題緊急處理:首先查看HADR備機(jī)的HADR狀態(tài),確定主備數(shù)據(jù)是否完全同步。如果主備數(shù)據(jù)同步,啟用備機(jī)提供服務(wù),將主機(jī)浮動(dòng)IP綁定在備機(jī)上;如果主備數(shù)據(jù)不同步,則直接重啟主機(jī)操作系統(tǒng),然后啟動(dòng)數(shù)據(jù)庫,重新綁定主機(jī)的浮動(dòng)IP地址。預(yù)防措施:做好數(shù)據(jù)庫服務(wù)器的硬件和操作系統(tǒng)選型工作,盡量減少系統(tǒng)內(nèi)核bug的出現(xiàn)。緊急場景:數(shù)據(jù)庫服務(wù)器負(fù)載異常升高,有大量的數(shù)據(jù)庫請求被阻塞,并且時(shí)間發(fā)生在數(shù)據(jù)庫全備份結(jié)束時(shí),可確定原因?yàn)閿?shù)據(jù)庫正在修剪備份歷史文件緊急處理:重啟數(shù)據(jù)庫實(shí)例,以中斷備份歷史文件的修剪操作或者停止應(yīng)用服務(wù)器,減少數(shù)據(jù)庫請求,以使修剪操作盡快完成預(yù)防措施:定期檢查數(shù)據(jù)庫備份歷史文件大小,如果比較大(經(jīng)驗(yàn)值超過10M),則在凌晨或者停機(jī)維護(hù)時(shí)使用prune命令修剪此文件。緊急場景:數(shù)據(jù)庫服務(wù)器負(fù)載高,發(fā)現(xiàn)存在耗時(shí)和耗資源的SQL語句緊急處理:視情況決定是否將此連接殺掉分析此SQL,如果SQL寫的有問題,則要求相應(yīng)開發(fā)人員修改SQL;如果統(tǒng)計(jì)信息有問題,則視情況重新收集統(tǒng)計(jì)信息;如果索引創(chuàng)建有問題,則視情況創(chuàng)建索引。預(yù)防措施:定期巡查各庫的SQL語句并進(jìn)行優(yōu)化緊急場景:表空間狀態(tài)異常,處于offline和前滾暫掛狀態(tài)緊急處理:確定表空間容器文件的權(quán)限是否異常,如果權(quán)限有異常,將權(quán)限更改后,前滾數(shù)據(jù)庫至日志末尾預(yù)防措施:嚴(yán)禁修改數(shù)據(jù)庫文件的權(quán)限(包括表空間容器文件、日志文件等)緊急場景:表空間狀態(tài)異常,處于備份暫掛狀態(tài)緊急處理:備份異常表空間預(yù)防措施:嚴(yán)禁在生產(chǎn)數(shù)據(jù)庫使用未帶copyyes選項(xiàng)的load命令帶有復(fù)制或者HADR的環(huán)境中,嚴(yán)禁使用load命令緊急場景:表狀態(tài)狀態(tài)異常,處于reorg暫掛狀態(tài)緊急處理:立即對異常表進(jìn)行重組預(yù)防措施:表結(jié)構(gòu)變更操作必須在測試環(huán)境嚴(yán)格測試后再在生產(chǎn)環(huán)境執(zhí)行嚴(yán)禁在生產(chǎn)數(shù)據(jù)庫中,進(jìn)行刪除列、設(shè)置已有字段非空等的表結(jié)構(gòu)變更操作。數(shù)據(jù)庫異常處理——查殺SQL處理目的為了解決部分應(yīng)用(SQL語句)導(dǎo)致數(shù)據(jù)庫負(fù)載過高,甚至導(dǎo)致數(shù)據(jù)庫無法響應(yīng),從而影響所有業(yè)務(wù),特制定該流程。適用范圍該流程的由系統(tǒng)部牽頭,技術(shù)部、產(chǎn)品部協(xié)助,共同制定。當(dāng)發(fā)現(xiàn)異常事件時(shí)啟動(dòng)該流程。異常事件定義:暫定為包含一次數(shù)據(jù)更改(包括插入,更新,刪除數(shù)據(jù))超過5000行的SQL語句的執(zhí)行(該操作將會(huì)被kill掉)。大負(fù)載的SQL語句。暫定為一個(gè)數(shù)據(jù)查詢操作行讀超過400萬條的SQL語句的執(zhí)行(此操作會(huì)被記錄下來,但是不會(huì)被kill掉)。執(zhí)行時(shí)間2009-6-22開始執(zhí)行流程說明出現(xiàn)問題,及時(shí)溝通處理。并且系統(tǒng)部數(shù)據(jù)庫組成員最晚(李卓總負(fù)責(zé))在第二個(gè)工作日的10:30之前,將前一天的kill事務(wù)(自動(dòng)化腳本)信息收集整理,填寫下表,郵件發(fā)送平臺(tái)負(fù)責(zé)人(張禮文和李均檸)cc給sysadmin@;yan.fu@,并口頭通知到平臺(tái)負(fù)責(zé)人(張禮文和李均檸)。格式如下:日期(系統(tǒng)部填寫)發(fā)起的機(jī)器(系統(tǒng)部填寫)執(zhí)行用戶(系統(tǒng)部填寫)執(zhí)行時(shí)間(系統(tǒng)部填寫)更新記錄數(shù)(系統(tǒng)部填寫)SQL語句(系統(tǒng)部填寫)影響的業(yè)務(wù)(技術(shù)部填寫)解決方案(技術(shù)部填寫)何時(shí)優(yōu)化(技術(shù)部填寫)效果(系統(tǒng)部在填寫)6月15號(hào)效果不明顯,XXX技術(shù)部就相關(guān)信息進(jìn)行分析,如果需要其他部門配合,由技術(shù)部牽頭。當(dāng)天下午15:30之前,由技術(shù)部填寫該表(影響的業(yè)務(wù)、解決方案),全部回復(fù)收件人。系統(tǒng)部數(shù)據(jù)庫組進(jìn)行存檔,并對效果進(jìn)行檢驗(yàn),并補(bǔ)充填寫“效果”一列,并全部回復(fù)給收件人。如果相同的異常事件連續(xù)發(fā)生兩天,以上郵件必須抄送給系統(tǒng)部與應(yīng)用中心負(fù)責(zé)人。如達(dá)不到效果,由系統(tǒng)部數(shù)據(jù)庫組重新發(fā)起該流程。
自動(dòng)化腳本原理及實(shí)現(xiàn)方法介紹1)原理編寫shell腳本通過數(shù)據(jù)庫快照表函數(shù)監(jiān)控?cái)?shù)據(jù)庫的運(yùn)行,分析快照并抓取我們認(rèn)為運(yùn)行異常的事務(wù),記錄下該事務(wù)的相關(guān)信息并取得該事務(wù)的applicationhandle。在shell中執(zhí)行forceapplication停止該異常事務(wù)的執(zhí)行。2)實(shí)現(xiàn)監(jiān)控?cái)?shù)據(jù)庫并抓取異常事務(wù)SELECTAGENT_ID,ROWS_READ,STMT_ELAPSED_TIME_MS,STMT_TEXTFROMTABLE(SNAPSHOT_STATEMENT('mobile',-1))asdynSnapTabwhereSTMT_STARTisnotnullandSTMT_TEXTisnotnullandminute(currenttimestamp-STMT_START)>1orROWS_READ>50000停止異常事務(wù)的執(zhí)行db2"forceapplications($id)"技術(shù)部處理流程平臺(tái)負(fù)責(zé)人(XX)接到系統(tǒng)部數(shù)據(jù)庫小組“數(shù)據(jù)庫異常更新”的通知,著手處理。13:30前,根據(jù)系統(tǒng)部提供的“異常數(shù)據(jù)庫更新”發(fā)起的機(jī)器IP、服務(wù)名稱、SQL語句,初步判定異常更新SQL語句對應(yīng)的應(yīng)用、根據(jù)SQL語句定位到相應(yīng)的代碼。(如果無法判斷,則召集相關(guān)人員討論)根據(jù)分析結(jié)果,找到負(fù)責(zé)相應(yīng)應(yīng)用的小組或開發(fā)人員,評(píng)估該SQL語句的影響到的業(yè)務(wù)、解決方案、解決方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學(xué)單片機(jī)應(yīng)用技術(shù)(單片機(jī)編程)試題及答案
- 2025年中職(油氣儲(chǔ)運(yùn)技術(shù))油氣儲(chǔ)存基礎(chǔ)測試題及答案
- 2026年黑龍江單招英語完形填空閱讀理解專項(xiàng)題庫含答案高頻考點(diǎn)全覆蓋
- 2026年河北單招語文文言文閱讀現(xiàn)代文理解專項(xiàng)經(jīng)典題含答題模板
- 2026年陜西單招低空經(jīng)濟(jì)大類無人機(jī)應(yīng)用技術(shù)專業(yè)技能經(jīng)典題集含答案
- 2026年江蘇普高生單招文化素質(zhì)提分題庫含答案3個(gè)月沖刺計(jì)劃適配
- 2026年寧夏中職生單招專業(yè)技能對口升學(xué)通關(guān)卷含答案原專業(yè)精準(zhǔn)匹配
- 2026年重慶單招大數(shù)據(jù)與會(huì)計(jì)專業(yè)技能測試題庫含答案智能記賬稅務(wù)
- 2026年青海單招專升本銜接備考經(jīng)典題含答案職業(yè)本科方向
- 2026年四川單招服裝設(shè)計(jì)專業(yè)面試經(jīng)典題含作品解讀
- 福建省寧德市2024-2025學(xué)年九年級(jí)上學(xué)期期末考試道德與法治試題
- 人教版五年級(jí)語文上冊期末考試卷【含答案】
- 四川省2025年高考綜合改革適應(yīng)性演練測試化學(xué)試題含答案
- 籃球原地投籃教學(xué)
- 醫(yī)療機(jī)構(gòu)安全生產(chǎn)事故綜合應(yīng)急預(yù)案
- 水利信息化計(jì)算機(jī)監(jiān)控系統(tǒng)單元工程質(zhì)量驗(yàn)收評(píng)定表、檢查記錄
- 《管理學(xué)原理》課程期末考試復(fù)習(xí)題庫(含答案)
- 電力系統(tǒng)經(jīng)濟(jì)學(xué)原理課后習(xí)題及答案
- DL-T+5174-2020燃?xì)?蒸汽聯(lián)合循環(huán)電廠設(shè)計(jì)規(guī)范
- 消費(fèi)者在直播帶貨中沖動(dòng)行為的影響因素探究
- 人工智能中的因果驅(qū)動(dòng)智慧樹知到期末考試答案章節(jié)答案2024年湘潭大學(xué)
評(píng)論
0/150
提交評(píng)論