硬件設備運維方案_第1頁
硬件設備運維方案_第2頁
硬件設備運維方案_第3頁
硬件設備運維方案_第4頁
硬件設備運維方案_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

年4月19日硬件設備運維方案文檔僅供參考,不當之處,請聯系改正。目錄TOC\o"1-5"\h\z\u1 概述 222 服務內容 222.1 服務目標 222.2 信息資產統計服務 232.3 網絡、安全系統運維服務 232.4 服務器設備、存儲系統運維服務 262.5 數據庫系統運維服務 282.6 視頻會議系統運維服務 302.7 中間件運維服務 303 運維服務流程 324 服務管理制度規(guī)范 344.1 服務時間 344.2 行為規(guī)范 344.3 現場服務支持規(guī)范 354.4 問題記錄規(guī)范 355 應急服務響應措施 375.1 應急基本流程 375.2 預防措施 375.3 突發(fā)事件應急策略 386 服務團隊 40概述XXX第二次土地調查數據庫及國土資源視頻會議系統運維項目內容主要分為土地調查數據庫軟硬件運維工作和視頻會議系統運維工作,服務內容涵蓋了網絡交換機機設備、網絡安全防護設備、服務器設備、存儲設備、操作系統以及數據庫等內容,存在技術多樣化、管理復雜化等問題,從而對運維公司的技術力量以及管理團隊都有著一定的要求。XXX公司根據多年的項目實施和服務,積累了豐富人力資源和管理經驗,根據本次項目特點,特制定如下運行維護解決方案。服務內容服務目標XXX公司可提供的運行維護服務包括,信息系統相關的網絡設備、服務器設備、存儲設備、操作系統、數據庫以及視頻會議系統的運行維護服務,保證用戶現有的信息系統的正常運行,降低整體管理成本,提高網絡信息系統的整體服務水平。同時根據日常維護的數據和記錄,提供用戶信息系統的整體建設規(guī)劃和建議,更好的為用戶的信息化發(fā)展提供有力的保障。用戶信息系統的組成主要可分為兩類:硬件設備和軟件系統。硬件設備包括網絡設備、安全設備、服務器設備、存儲設備和視頻會議系統設備等;軟件系統主要為操作系統、數據庫軟件、集群軟件等和業(yè)務應用軟件等。XXX公司經過運行維護服務的有效管理來提升用戶信息系統的服務效率,協調各業(yè)務應用系統的內部運作,改進網絡信息系統部門與業(yè)務部門的溝通,提高服務質量。結合用戶現有的環(huán)境、組織結構、IT資源和管理流程的特點,從流程、人員和技術三方面來規(guī)劃用戶的網絡信息系統的結構。將用戶的運行目標、業(yè)務需求與IT服務的相協調一致。XXX公司提供的信息系統服務的目標是,對用戶現有的信息系統基礎資源進行監(jiān)控和管理,及時掌握網絡信息系統資源現狀和配置信息,反映信息系統資源的可用性情況和健康狀況,創(chuàng)立一個可知可控的IT環(huán)境,從而保證用戶信息系統的各類業(yè)務應用系統的可靠、高效、持續(xù)、安全運行。服務項目范圍覆蓋的信息系統資源以下方面的關鍵狀態(tài)及參數指標:運行狀態(tài)、故障情況配置信息可用性情況及健康狀況性能指標信息資產統計服務此項服務為基本服務,包含在運行維護服務中,幫助我們對用戶現有的信息資產情況進行了解,更好的提供系統的運行維護服務。服務內容包括:硬件設備型號、數量、版本等信息統計記錄軟件產品型號、版本和補丁等信息統計記錄網絡結構、網絡路由、網絡IP地址統計記錄綜合布線系統結構圖的繪制其它附屬設備的統計記錄網絡、安全系統運維服務從網絡的連通性、網絡的性能、網絡的監(jiān)控管理三個方面實現對網絡系統的運維管理。網絡、安全系統基本服務內容:序號服務模塊內容描述提供方1現場備件安裝配合用戶進行,按備件到達現場時間工程師到達現場XXX公司2現場軟件升級首先分析軟件升級的必要性和風險,配合用戶進行軟件升級XXX公司3現場故障診斷按服務級別:7×24小時5×8小時XXX公司4電話遠程技術支持7×24小時XXX公司5問題管理系統對遇到的問題進行匯總和發(fā)布XXX公司網絡核心交換機巡視典型作業(yè)計劃書系統管理單位:維保單位:設備名:設備型號:管理IP:檢查內容參考標準檢查結果檢查結論巡視方法描述巡檢周期硬件運行狀態(tài)電源運行狀態(tài)□正?!醍惓oL扇運行狀態(tài)□正?!醍惓DK運行狀態(tài)□正?!醍惓O到y運行狀態(tài)檢查VLAN狀態(tài)□正?!醍惓E渲脿顟B(tài)□正?!醍惓SPF狀態(tài)□正?!醍惓H罩緳z查日志狀態(tài)□正?!醍惓F渌鼨z查內容□正?!醍惓!跽!醍惓!跽!醍惓S脩衄F場技術人員值守XXX公司可根據用戶的需求提供長期的用戶現場技術人員值守服務,保證網絡的實時連通和可用,保障接入交換機、匯聚交換機和核心交換機的正常運轉?,F場值守的技術人員每天記錄網絡交換機的端口是否能夠正常使用,網絡的轉發(fā)和路由是否正常進行,交換機的性能檢測,進行整體網絡性能評估,針對網絡的利用率進行優(yōu)化并提出網絡擴容和優(yōu)化的建議。現場值守人員還進行安全設備的日常運行狀態(tài)的監(jiān)控,對各種安全設備的日志檢查,對重點事件進行記錄,對安全事件的產生原因進行判斷和解決,及時發(fā)現問題,防患于未然。同時能夠對設備的運行數據進行記錄,形成報表進行統計分析,便于進行網絡系統的分析和故障的提前預知。具體記錄的數據包括:配置數據性能數據故障數據現場巡檢服務現場巡檢服務是XXX公司對客戶的設備及網絡進行全面檢查的服務項目,經過該服務可使客戶獲得設備運行的第一手資料,最大可能地發(fā)現存在的隱患,保障設備穩(wěn)定運行。同時,XXX公司將有針對性地提出預警及解決建議,使客戶能夠提早預防,最大限度降低運營風險。巡檢包括的內容如下:編號巡檢內容1硬件運行狀態(tài)檢查項目單板狀態(tài)檢查電源模塊狀態(tài)檢查風扇狀態(tài)檢查整機指示燈狀態(tài)檢查機框防塵網檢查機房溫度、濕度檢查設備地線檢查2軟件運行情況檢查項目設備運行情況檢查網絡報文分析設備對接運行狀況檢查路由運行情況檢查3網絡整體運行情況調查網絡運行問題調查網絡變更情況調查網絡歷史故障調查網絡運行分析與管理服務網絡運行分析與管理服務是指XXX公司工程師經過對網絡運行狀況、網絡問題進行周期性檢查、分析后,為客戶提出指導性建議的一種綜合性高級服務,其內容包括:服務內容服務優(yōu)點向客戶提供網絡專家電話號碼。保證重大問題第一連線至網絡專家。網絡專家組每周與客戶進行不少于2小時的電話技術交流以最小成本保證及時解答客戶關心的技術問題,并就某一領域技術問題展開深層次溝通。每月向客戶提交CASE匯總分析報告,并可擴展到每年17次(月度、季度、年度)使客戶了解網絡歷史故障情況以及故障預防建議,最大程度減少網絡故障隱患,更高效的進行網絡管理。重要時刻專人值守服務XXX公司深刻知道保證重要時刻設備穩(wěn)定運行對客戶成功尤為關鍵,因此,XXX公司可對客戶提供重要時刻的專人現場值守支持,如客戶的重大會議期間或其它任何客戶認為可能對其業(yè)務運營產生重大影響的時刻。服務器設備、存儲系統運維服務XXX公司提供的主機、存儲系統的運維服務包括:服務器設備、存儲設備的日常監(jiān)控,設備的運行狀態(tài)監(jiān)控,故障處理,操作系統維護,補丁升級等內容。主機存儲系統基本服務內容:序號服務模塊內容描述提供方1現場備件安裝配合用戶進行。按備件到達現場時間工程師到達現場XXX公司2補丁服務消除軟件漏洞給系統帶來的安全隱患,并對安裝補丁所引起的系統連鎖反應進行合理的平衡。XXX公司3升級服務對系統進行軟件或硬件的升級,以改進、完善現有系統或消除現有系統的漏洞。XXX公司4現場故障診斷按服務級別:7×24小時5×8小時XXX公司5電話遠程技術支持7×24小時XXX公司6問題管理系統對遇到的問題進行匯總和發(fā)布XXX公司7系統優(yōu)化對客戶系統的括主機、存儲設備、操作系統、提供優(yōu)化服務。XXX公司XXX公司現場值守人員可進行監(jiān)控管理的內容包括:CPU性能管理;內存使用情況管理;硬盤利用情況管理;系統進程管理;主機性能管理;實時監(jiān)控主機電源、風扇的使用情況及主機機箱內部溫度;監(jiān)控主機硬盤運行狀態(tài);監(jiān)控主機網卡、陣列卡等硬件狀態(tài);監(jiān)控主機HA運行狀況;主機系統文件系統管理;監(jiān)控存儲交換機設備狀態(tài)、端口狀態(tài)、傳輸速度;監(jiān)控備份服務進程、備份情況(起止時間、是否成功、出錯告警);監(jiān)控記錄磁盤陣列、磁帶庫等存儲硬件故障提示和告警,并及時解決故障問題;對存儲的性能(如高速緩存、光纖通道等)進行監(jiān)控。服務器巡視典型作業(yè)計劃書應用業(yè)務類型主機名稱主機型號主機序列號IP地址和掩碼CPU型號/數量/主頻內存容量磁盤型號/數量/大小根盤鏡像(Y/N)服務器設備狀態(tài)檢查系統板正?!醍惓PU正常□異常內存正?!醍惓/O板正?!醍惓AID卡正?!醍惓CSI卡正?!醍惓>W卡正常□異常磁盤及陣列

AID盤狀態(tài)正?!醍惓O到y其它擴展卡正常□異常設備故障燈正?!醍惓7掌飨到y性能狀況CPU利用率正?!踺^高內存利用率正?!踺^高性能是否存在瓶頸無□有系統磁盤剩余空間正常□不足巡檢意見:工程師:巡檢日期:聯系電話:數據庫系統運維服務XXX公司提供的數據庫運行維護服務是包括主動數據庫性能管理,數據庫的主動性能管理對系統運維非常重要。經過主動式性能管理可了解數據庫的日常運行狀態(tài),識別數據庫的性能問題發(fā)生在什么地方,有針對性地進行性能優(yōu)化。同時,密切注意數據庫系統的變化,主動地預防可能發(fā)生的問題。XXX公司提供的數據庫運行維護服務還包括快速發(fā)現、診斷和解決性能問題,在出現問題時,及時找出性能瓶頸,解決數據庫性能問題,維護高效的應用系統。XXX公司的數據庫運行維護服務,主要工作是使用技術手段來達到管理的目標,以系統最終的運行維護為目標,提高用戶的工作效率。具體數據庫運行維護監(jiān)控的基本服務內容包括:序號服務模塊內容描述提供方1Oracle數據庫7*24電話支持服務每周7天,每天24小時支持中心電話,電子郵件答詢,以滿足業(yè)務發(fā)展的需要。Oracle產品技術專家直接同客戶對話,幫助解決客戶提出的疑難問題。根據問題的嚴重程度,將優(yōu)先解決客戶認為是關鍵而緊急的任務。對客戶提出的一般性問題進行技術咨詢、指導。定期的客戶管理報告,避免問題再度發(fā)生。XXX公司2Oracle數據庫產品現場服務響應數據庫宕機數據壞塊影響業(yè)務不能進行的產品問題軟件產品的更新及維護。XXX公司3Oracle數據庫產品系統健康檢查對系統的配置及運作框架提出建議,以幫助您得到一個更堅強可靠的運作環(huán)境降低系統潛在的風險,包括數據丟失、安全漏洞、系統崩潰、性能降低及資源緊張檢查并分析系統日志及跟蹤文件,發(fā)現并排除數據庫系統錯誤隱患檢查數據庫系統是否需要應用最新的補丁集檢查數據庫空間的使用情況協助進行數據庫空間的規(guī)劃管理檢查數據庫備份的完整性監(jiān)控數據庫性能確認系統的資源需求明確您系統的能力及不足優(yōu)化OracleServer的表現經過改進系統環(huán)境的穩(wěn)定性來降低潛在的系統宕機時間XXX公司4Oracle數據庫產品性能調優(yōu)分析用戶的應用類型和用戶行為評價并修改ORACLE數據庫的參數設置評價并調整ORACLE數據庫的數據分布評價應用對硬件和系統的使用情況,并提出建議利用先進的性能調整工具實施數據庫的性能調整培訓用戶有關性能調整的概念提供用戶完整的性能調整報告和解決方法XXX公司存儲設備巡視典型作業(yè)計劃書設備型號S/NIP地址Firmware版本(控制器)硬件狀態(tài)檢查檢查內容檢查結果備注控制器狀態(tài)√正常異常N/A電源模塊狀態(tài)√正常異常N/A風扇模塊狀態(tài)√正常異常N/A電池狀態(tài)√正常異常N/A物理硬盤和邏輯盤狀態(tài)√正常異常N/A擴展柜狀態(tài)√正常異常N/A設備故障燈狀態(tài)√正常異常N/A巡檢總結工程師:巡檢日期:聯系電話:視頻會議系統運維服務視頻會議系統是進行指令下達、工作協調、應急處理等的主要系統,是連接上下級單位的主要通道,系統的穩(wěn)定關乎XXX國土資源廳的穩(wěn)定和有序,具有重要的地位。XXX公司的視頻會議系統維護服務,主要工作是使用技術手段來達到管理的目標,以系統最終的運行維護為目標,提高用戶的工作效率。根據對自治區(qū)國土資源視頻會議系統現狀、問題及服務需求的深度分析,我們認為,本項專業(yè)服務的核心目標如下:經過預防為主的“平”時服務、迅捷為主的“戰(zhàn)”時保障、建立持續(xù)改進的服務管理體系、建立豐富有效的資源保障體系,持續(xù)不斷的提高視頻會議系統的可靠性!保證視頻會議系統的正常運行及其功能的完美呈現,保證視頻會議過程的順暢和高質量。中間件運維服務中間件管理是指對BEAWeblogic、MQ等中間件的日常維護管理和監(jiān)控工作,提高對中間件平臺事件的分析解決能力,確保中間件平臺持續(xù)穩(wěn)定運行。中間件監(jiān)控指標包括配置信息管理、故障監(jiān)控、性能監(jiān)控。執(zhí)行線程:監(jiān)控WebLogic配置執(zhí)行線程的空閑數量。JVM內存:JVM內存曲線正常,能夠及時的進行內存空間回收。JDBC連接池:連接池的初始容量和最大容量應該設置為相等,而且至少等于執(zhí)行線程的數量,以避免在運行過程中創(chuàng)立數據庫連接所帶來的性能消耗。檢查WEBLOG日志文件是否有異常報錯如果有WEBLOG集群配置,需要檢查集群的配置是否正常。運維服務流程XXX公司建議用戶采用的服務方式為兩種:一種為技術人員現場值守,另一種是定期巡檢結合故障現場服務。技術人員現場值守運行維護服務的基本操作流程如下圖所示:定期巡檢結合故障現場運行維護服務的基本操作流程如下圖所示:服務管理制度規(guī)范服務時間接收服務請求和咨詢:在5*8小時工作時間內設置由專人職守的熱線電話,接聽內部的服務請求,并記錄服務臺事件處理結果。在非工作時間設置有專人7*24小時接聽的移動電話熱線,用于解決內部的技術問題以及接聽7*24小時機房監(jiān)控人員的機房突發(fā)情況匯報。服務響應時間:故障級別響應時間故障解決時間I級:屬于緊急問題;其具體現象為:系統崩潰導致業(yè)務停止、數據丟失。30分鐘,2小時內提交故障處理方案12小時以內II級:屬于嚴重問題;其具體現象為:出現部分部件失效、系統性能下降但能正常運行,不影響正常業(yè)務運作。30分鐘,2小時內提交故障處理方案24小時以內III級:屬于較嚴重問題;其具體現象為:出現系統報錯或警告,但業(yè)務系統能繼續(xù)運行且性能不受影響。30分鐘,2小時內提交故障處理方案48小時以內IV級:屬于普通問題;其具體現象為:系統技術功能、安裝或配置咨詢,或其它顯然不影響業(yè)務的預約服務。30分鐘,2小時內提交故障處理方案5天內技術支持人員在解決故障時,會最大限度保護好數據,做好故障恢復的文檔,力爭恢復到故障點前的業(yè)務狀態(tài)。對于“系統癱瘓,業(yè)務系統不能運轉”的故障級別,如果不能于12小時內解決故障,XXX公司將在16小時內提出應急方案,確保業(yè)務系統的運行。故障解決后24小時內,提交故障處理報告。說明故障種類、故障原因、故障解決中使用的方法及故障損失等情況。行為規(guī)范遵守用戶的各項規(guī)章制度,嚴格按照用戶相應的規(guī)章制度辦事。與用戶運行維護體系其它部門和環(huán)節(jié)協同工作,密切配合,共同開展技術支持工作。出現疑難技術、業(yè)務問題和重大緊急情況時,及時向負責人報告。現場技術支持時要精神飽滿,穿著得體,談吐文明,舉止莊重。接聽電話時要文明禮貌,語言清晰明了,語氣和善。遵守保密原則。對被支持單位的網絡、主機、系統軟件、應用軟件等的密碼、核心參數、業(yè)務數據等負有保密責任,不得隨意復制和傳播。現場服務支持規(guī)范運維服務人員要做到耐心、細心、熱心的服務。工作要做到事事有記錄、事事有反饋、重大問題及時匯報。嚴格遵守工作作息時間,嚴格按照服務工作流程操作。現場支持工程師應著裝整潔、言行禮貌大方,技術專業(yè),操作熟練、嚴謹、規(guī)范;現場支持時必須遵守用戶單位的相關規(guī)章制度。現場支持工程師在進行現場支持工作時必須在保證數據和系統安全的前提下開展工作?,F場支持時出現暫時無法解決的故障或其它新的故障時,應告知用戶并及時上報負責人,尋找其它解決途徑。故障解決后,現場支持工程師要詳細記錄問題的發(fā)生時間、地點、提出人和問題描述,并形成書面文檔,必要時應向用戶介紹故障出現的原因及預防方法和解決技巧。問題記錄規(guī)范根據使用人員提出問題的類別,將問題分為咨詢類問題和系統缺陷類問題二類:咨詢類問題是指經過服務熱線或現場解疑等方式能夠當場解決用戶提出的問題,具有問題解答直接、快速和實時的特點,該問題到現場支持人員處即可中止,對于該類問題的記錄可使用咨詢類問題記錄模版進行記錄。系統缺陷類問題是指使用人員提出的問題涉及到系統相應環(huán)節(jié)的確認修改,需要經過逐級提交、診斷、確認、處理和回復等環(huán)節(jié),處理解決需要XXX公司項目組的分析確認,問題有解決方案后,將解決方案反饋給用戶。具體提交流程如下:問題提交。應用信息系統的用戶發(fā)現屬于系統缺陷類的問題時,填寫系統缺陷類問題提交單,提交服務支持中心。問題分析。服務中心接到用戶提交的問題單,要組織相應人員對問題單中描述的問題進行分析研判,確定問題的類型(技術問題、業(yè)務問題或者操作問題)。屬于技術問題,提交服務中心技術人員對存在的問題提出具體的處理意見和建議;屬于業(yè)務問題,提交服務中心業(yè)務人員進行處理;屬于操作問題,可安排相關人員對問題提出人進行解釋,并將系統缺陷類問題提交單轉為系統咨詢類問題提交單。問題確認、解決。服務中心的技術人員和業(yè)務人員收到系統缺陷類問題提交單后,對提交的問題進行歸類匯總和分析、確認。能夠解決的,明確問題解決的具體處理建議和措施,經主管領導簽字同意后,交實施人員進行解決方案的實施。服務人員確認是否解決,并將解決方法附在系統缺陷類問題提交單上反饋給問題提出人員。問題上報。服務人員收到經業(yè)務或技術人員確認的系統缺陷類問題提交單后,上報服務中心。問題回復。服務中心根據提交問題的進行分析,制定解決方案并進行實施的解決,同時做好變更記錄。將解決方案匯總后及時向問題提交單位或問題交辦單位作出回復,并將分析過程和問題產生原因一并提交。應急服務響應措施XXX公司已經針對本項目制定了詳盡的設計、應急處理預案,整個流程嚴謹而有序??墒牵诜站S護過程中,意外情況將難以完全避免。下面,我們將對項目實施的突發(fā)風險進行詳細分析,而且針對各類突發(fā)事件,設計了相應的預防與解決措施,同時提供了完整的應急處理流程。應急基本流程維護服務應急處理流程預防措施針對上門服務過程中可能遇到的各種各樣的風險,XXX公司總結多年維護服務經驗,針對一些可能出現的情況,制定了一系列預防處理措施,舉例如下:類型事件預防措施處理應用軟件無法啟動軟件可執(zhí)行文件上門人員提前準備好各類需維護軟件安裝程序將應用軟件數據文件備份后,重新安裝軟件打開過程中或運行中異常錯誤關閉上門人員準備好安裝程序,操作系統優(yōu)化和修補軟件,查殺病毒軟件判斷出錯原因,備份數據,采取相關修復措施操作系統使用者本機操作系統異?;蛳到y資源占用嚴重準備好系統檢查程序及修補程序,以及查殺病毒軟件告知使用者錯誤原因可能類型,提出解決方案,經使用者認可后采取相應措施B/S結構系統,IE瀏覽器異常或無法下載控件準備流氓軟件清理程序、修復瀏覽器軟件、查殺病毒軟件檢查IE瀏覽器選項設置,分析原因進行修復網絡或服務器B/S結構系統網絡流量異常或服務器登錄異常判斷服務器是否異常,否則準備殺毒軟件檢查網絡流量,流量異常小則報修網絡服務商,流量異常大則查殺病毒突發(fā)事件應急策略系統運維應急方案是對中斷或嚴重影響業(yè)務的故障,如宕機、數據丟失、業(yè)務中斷等,進行快速響應和處理,在最短時間內恢復業(yè)務系統,將損失降到最低。在系統維護過程中,突發(fā)事件的出現將是很難完全避免的,針對這種情況,XXX公司設計了完善的突發(fā)事件應急策略。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論