版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2018 年信息系統(tǒng)運維服務項目技術方案1XXXX 有限公司2018-62目錄一、運維方案31.1 運維服務定位和目標及服務范圍31.2 運維服務內容及運維重點難點分析31.2.1 運維服務內容3基礎設施維護3軟件及信息資源維護5信息系統(tǒng)安全服務5運維管理咨詢服務61.2.2 運維重點難點分析71.3 運維人員組織架構及管理制度101.3.1 運維組織結構介紹101.3.2 運維組織管理制度101.3.3 運維成員職責141.3.4 運維成員組織結構161.4 運維質量保證措施及服務承諾171.4.1 質量控制管理171.4.2 進度控制管理171.4.3 服務承諾171.5 運維流程及服務方
2、式191.5.1 服務方式191.5.2 運維流程201.6 運維方案及實施安排231.6.1 小型機、PC 服務器、網絡設備及存儲系統(tǒng)2331.6.2 機房空調、UPS 設備運維服務301.6.3 數據庫系統(tǒng)運維服務331.6.4 中間件系統(tǒng)運維服務401.7 應急服務響應措施481.7.1 突發(fā)事件應急流程481.7.2 預防措施及處理辦法511.8 對外委托專項服務情況表511.8 投標人近三年以來類似項目一覽表521.9 投標人與運維服務相關的資質等證書匯總表534一、運維方案1.1 運維服務定位和目標及服務范圍通過專業(yè)運維服務,進一步加強信息系統(tǒng)運行維護,對信息系統(tǒng)運行維護流程提供先
3、進的管理理念與流程,并通過專業(yè)的技術支持為信息系統(tǒng)運行維護工作提供專業(yè)的技術平臺,滿足信息系統(tǒng)軟硬件的維護要求,可以滿足多種基礎設施環(huán)境穩(wěn)定的要求,可以滿足軟件及信息資源高效、可靠和安全運行的要求,可以滿足運行設備統(tǒng)一管理、及時的故障恢復的要求,可以保證在信息系統(tǒng)構建的應用系統(tǒng)和數據集中運行的設備平臺正常運行,達到高效、穩(wěn)定、安全和高擴展性的要求,可以提供運維保障之外的管理咨詢要求,為實現省本級信息化建設的可持續(xù)發(fā)展奠定集中統(tǒng)一的設施基礎。1.2 運維服務內容及運維重點難點分析1.2.1 運維服務內容依據現網普遍的信息系統(tǒng)設備及常用軟件清單,我公司對提供如下服務內容:基礎設施維護業(yè)務系統(tǒng)服務項
4、保證措施辦法小型機、服務器、PC、多媒體系統(tǒng)、 網絡設備、存儲系統(tǒng)、信息安全設備等現場駐點服務(如需)58 小時到達客戶現場時間(應急響應)30 分鐘內電話后響應時間90 分鐘內5備件到達現場時間24 小時配件維修、更換服務提供高級工程師現場支持提供檢查設備各部件的狀態(tài)燈;提供檢查并處理設備的錯誤日志;提供硬件設備的全面檢查;提供網絡配置的檢查及測試;提供定期升級配套軟件的版本;提供系統(tǒng)重部署及調試:新機上架協(xié)助及系統(tǒng)移位協(xié)助;提供針對重要設備,實時監(jiān)控運行狀況,及時發(fā)現故障、排除故障;提供操作系統(tǒng)性能分析;提供小型機、網絡設備、信息安全設備配置信息,根據需要調整配置;提供設備的微碼版本檢查;
5、提供存儲設備運行情況檢查;提供提交詳細的預防性維護報告和總結;提供對檢查結果綜合分析,并形成分析報告;提供協(xié)助采購人制訂安全策略,定期檢查、排除風險,保障設備及網絡環(huán)境安全;提供協(xié)助采購人規(guī)范硬件管理維護標準化工作;提供周期性全面巡檢(與采購人協(xié)商、合同約定)提供系統(tǒng)運行環(huán)境檢查:包括機房溫度、濕度和提供6零地電壓、零火電壓等機房空調運維設備故障恢復時間48 小時內周期性全面巡檢(與采購人協(xié)商、合同約定)提供壞件更換提供日常清理及更換過濾網和加濕罐等耗材提供定期清理機房空調的室外機;檢修機房內各供水管路及排水管路,杜絕漏水,保證管路暢通。提供配備機房專業(yè)知識的人員對機房實行 5X8 小時值班(
6、如需)提供UPS 設備運維故障恢復時間72 小時內周期性全面巡檢(與采購人協(xié)商、合同約定),巡檢時檢查蓄電池使用情況,并且進行充放電;提供壞件更換提供配備機房專業(yè)知識的人員對機房實行 5X8 小時值班(如需)提供備件保證備件庫提供備件更換現場更換技術服務駐點服務:1.提供 724 小時免費故障檢測與維修換件現場服務 2.預防性維護服務提供遠程技術支持服務:1.提供 724 小時的故障響應電話支持 2.每周一次與客戶溝通交流提供培訓服務:1.專業(yè)知識培訓 2.日常運維管理提供7遠程診斷遠程撥入系統(tǒng)分析提供遠程故障解決提供遠程系統(tǒng)性能監(jiān)控提供軟件及信息資源維護系統(tǒng)軟件、數據庫、中間件現場駐點服務(
7、如需)58 小時到達客戶現場時間(應急響應)60 分鐘內要求完整、詳細、真實的維護記錄文檔,按月、季、年度提交規(guī)范的維護報告。提供維護文檔提供每日監(jiān)控系統(tǒng)運行情況,協(xié)助應用系統(tǒng)的升級以及各種安全補丁的升級工作提供BUG 管理、系統(tǒng)故障檢測及排除提供應用系統(tǒng)功能、數據庫優(yōu)化、調整服務及少量的二次開發(fā)提供系統(tǒng)軟件安裝、數據庫安裝、配置管理提供存儲管理提供根據備份策略定時進行系統(tǒng)及數據的備份,對重點數據要求能夠進行定時備份提供協(xié)助采購人規(guī)范計算機終端軟件安裝標準化工作提供周期性全面巡檢(與采購人協(xié)商、合同約定)提供解決數據庫運行中出現的各類故障立即響應文檔提交提供8技術服務駐點服務:1.提供 724
8、 小時免費故障檢測與維修換件現場服務 2.預防性維護服務提供遠程技術支持服務:1.提供 724 小時的故障響應電話支持 2.每周一次與客戶溝通交流提供培訓服務:1.專業(yè)知識培訓 2.日常運維管理提供遠程診斷遠程撥入系統(tǒng)分析提供遠程故障解決提供遠程系統(tǒng)性能監(jiān)控提供信息系統(tǒng)安全服務信息系統(tǒng)安全服務現場駐點服務(如需)58 小時到達客戶現場時間(應急響應)60 分鐘內漏洞掃描服務:制定安全掃描計劃,對信息系統(tǒng)的服務器、網絡設備、安全設備和應用系統(tǒng)進行安全漏洞掃描,包括系統(tǒng)漏洞掃描、數據庫掃描、應用安全掃描提供安全加固服務:根據漏洞掃描所發(fā)現的弱 點和安全隱患,對信息系統(tǒng)的服務器、網 絡設備、信息安全
9、設備進行安全加固服務,提高系統(tǒng)與服務器與系統(tǒng)平臺運行的安全 性、可靠性提供應急預案和演練服務:針對可能發(fā)生的重大事件,制定對應的應急預案,并通過應急演練發(fā)現應急過程中存在的問題,進而對應急預案和演練進行優(yōu)化提供信息系統(tǒng)安全測試服務提供9技術服務駐點服務:1.提供 724 小時免費故障檢測與維修換件現場服務 2.預防性維護服務提供遠程技術支持服務:1.提供 724 小時的故障響應電話支持 2.每周一次與客戶溝通交流提供培訓服務:1.專業(yè)知識培訓 2.日常運維管理提供遠程診斷遠程撥入系統(tǒng)分析提供遠程故障解決提供遠程系統(tǒng)性能監(jiān)控提供運維管理咨詢服務運維管理咨詢服務IT 服務管理現狀數據與信息收集;提
10、供建立服務臺,配置相關服務人員;提供協(xié)助部署 IT 服務管理軟件、設計管理制度和流程;提供IT 服務管理流程設計(應包括事件管理流程、問題管理流程、配置管理流程、變更和發(fā)布管理流程)。提供技術服務駐點服務:1.提供 724 小時免費故障檢測與維修換件現場服務 2.預防性維護服務提供遠程技術支持服務:1.提供 724 小時的故障響應電話支持 2.每周一次與客戶溝通交流提供培訓服務:1.專業(yè)知識培訓 2.日常運維管理提供遠程診斷10遠程撥入系統(tǒng)分析提供遠程故障解決提供遠程系統(tǒng)性能監(jiān)控提供1.2.2 運維重點難點分析網絡規(guī)模的發(fā)展和擴大,使得應用產品技術日漸多樣和復雜,越來越多的企事業(yè)單位的生產業(yè)務
11、和日常工作將實現信息化,并通過提高信息化水平實現對內提高經營水平、對外提高服務水平的目的。各企業(yè)事業(yè)單位業(yè)務的展開越來越依賴 IT 系統(tǒng)的正常運轉,生產業(yè)務日漸依賴 IT 部門提供的系統(tǒng)服務,IT 部門正由“成本中心”轉變?yōu)椤胺罩行摹?、“效益中心”。隨之而來的問題是運維部門將如何通過管理為企事業(yè)單位提供更好的、可度量的、符合業(yè)務需求的服務?同時,這些服務需要能夠適應業(yè)務需求以及新技術帶來的影響,為新業(yè)務系統(tǒng)的運行提供支撐,讓運維管理成為企事業(yè)單位成長的助力。運維管理包含內容IT 運維是 IT 管理的核心和重點部分,也是內容最多、最繁雜的部分,主要用于 IT 部門內部日常運營管理,涉及的對象分
12、成兩大部分,即 IT 業(yè)務系統(tǒng)和運維人員。其管理內容又可細分為七個子系統(tǒng):第一、設備管理:對網絡設備、服務器設備、操作系統(tǒng)運行狀況進行監(jiān)控, 對各種應用支持軟件如數據庫、中間件、群件以及各種通用或特定服務的監(jiān)控 管理,如郵件系統(tǒng)、DNS、Web 等的監(jiān)控與管理;11第二、數據/存儲/容災管理:對系統(tǒng)和業(yè)務數據進行統(tǒng)一存儲、備份和恢復;第三、業(yè)務管理:包含對企業(yè)自身核心業(yè)務系統(tǒng)運行情況的監(jiān)控與管理, 對于業(yè)務的管理,主要關注該業(yè)務系統(tǒng)的 CSF(關鍵成功因素CriticalSuccessFactors)和 KPI(關鍵績效指標 KeyPerformanceIndicators);第四、目錄/內容
13、管理:該部分主要對于企業(yè)需要統(tǒng)一發(fā)布或因人定制的內容管理和對公共信息的管理;第五、資源資產管理:管理企業(yè)中各 IT 系統(tǒng)的資源資產情況,這些資源資產可以是物理存在的,也可以是邏輯存在的,并能夠與企業(yè)的財務部門進行數據交互;第六、信息安全管理:該部分包含了許多方面的內容,目前信息安全管理 主要依據的國際標準是 ISO17799,該標準涵蓋了信息安全管理的十大控制方面, 36 個控制目標和 127 中控制方式,如企業(yè)安全組織方式、資產分類與控制、人員安全、物理與環(huán)境安全、通信與運營安全、訪問控制、業(yè)務連續(xù)性管理等;第七、日常工作管理:該部分主要用于規(guī)范和明確運維人員的崗位職責和工作安排、提供績效考
14、核量化依據、提供解決經驗與知識的積累與共享手段 IT 運行維護管理的每一個子系統(tǒng)中都包含著十分豐富的內容,實現完善的 IT 運維管理是企業(yè)提高經營水平和服務水平的關鍵。IT 運維管理面臨的難題IT 運維管理是一門探討如何提高網絡應用性能的課題,怎樣利用網絡管理做到企業(yè) IT 基礎設施建設的管理、合理分配網絡資源、保障生產業(yè)務、對網絡規(guī)劃和新業(yè)務上馬提供支撐,而其最核心的目的是保障企業(yè)生產業(yè)務。日常 IT 運維管理面臨諸多難題,具體體現在以下多個方面: 網絡設備12在企業(yè) IT 基礎設施的搭建過程中,底層的網絡設備廠商和類型多樣且復雜。隨之而來的問題是:如何將不同廠商的網絡和應用管理產品在界面級
15、、消息級和數據級集成起來實現統(tǒng)一管理?如何讓 IT 管理員了解到整個網絡全局的運行情況、發(fā)展趨勢和可能存在的故障隱患點,以便及時采取相應措施,實現事前管理??茖W的運維管理思路告訴我們,首先需要解決的是對 IT 基礎設施的管理, 管理范圍要能覆蓋到機房所有硬件設備。這一點是前提和基礎。其次,才是對各種應用系統(tǒng)做到很好的監(jiān)控。最后,才能為業(yè)務系統(tǒng)提供足夠的保障。網絡流量在絕大多數的企業(yè)網絡中,存在不同程度的網絡延遲,造成重要業(yè)務和應用時斷時續(xù),這直接成為企業(yè)業(yè)務的殺手。另外,網絡的帶寬也是企業(yè)關心的重點。比如,哪個時間段很擁擠,哪個時間段很空閑,有沒有規(guī)律,怎么樣去調查擁塞的原因,網絡帶寬都是被誰
16、占用了,是被哪些客戶端、哪些應用或者異常應用所占用了。這些都是擺在每一個企業(yè)運維管理領域中很實際的問題。該如何很好的解決這些問題呢?根據多年的運維管理經驗得出,對于這種情況,需要采用流量分析的方式。通過對出口流量或者監(jiān)控對象進行采集,進行 24 小時實時的監(jiān)控和分析,可以對流量進行多角度多層次的挖掘分析,比如按照流量、數據包個數、連接數、協(xié)議等類別分析當前網絡的負載情況,為網絡的優(yōu)化配置提供參考。通過報表 分析展現流量特征,讓 IT 管理員明白流量被誰、被何種應用、被何種異常行為占用得怎么樣。IT 運維管理怎么樣幫助 IT 管理員判斷和控制安全問題,也就是作為與防病毒、防火墻、IPS 等安全產
17、品不同的角色,從網絡的整體情況要能夠判斷未知的安全問題,并提供修復方案,在不影響正常網絡運行狀況下將安全問題防13患于未然。如果 IT 管理員能針對異常行為的特征建立自動告警,在某些安全攻擊出現前發(fā)現故障隱患,并提供連動的判斷和處理機制,這樣 IT 管理員可以及時采取了措施避免業(yè)務遭受損失。如果能在對問題特征自動告警的同時,自動記錄問題的原始數據以供事后分析,這樣 IT 管理員可以再現數據異常行為、捕捉網絡數據異動入侵記錄,對癥下藥制訂策略防止問題的再次發(fā)生。業(yè)務系統(tǒng)針對日益復雜的業(yè)務系統(tǒng),現有的運維管理系統(tǒng)更多的強調的是功能的展 現。比如,從業(yè)務主機負載、數據庫服務器負載、數據庫、中間件、應
18、用系統(tǒng)、網際流量、進程狀況等等不同角度實施聯(lián)合監(jiān)控,強調的是性能參數指標的多 少,或者是界面的美觀程度。當然,這是落實業(yè)務系統(tǒng)管理環(huán)節(jié)所采用的方法。但事實上,作為企業(yè)自身來說,無論采用哪種監(jiān)控也好,IT 管理手段或者運維管理系統(tǒng)也罷,其核心總是需要圍繞保障和改進企業(yè)的業(yè)務系統(tǒng)。這就提出一個問題,如何來保障又如何改進企業(yè)的業(yè)務系統(tǒng)呢?首先,需要了解清楚業(yè)務系統(tǒng)所涉及的具體環(huán)節(jié),針對每一個環(huán)節(jié)進行管理落實。按照科學運維管理的建設思路,分為:用戶-網絡-硬平臺-軟平臺-業(yè)務系統(tǒng)這五個環(huán)節(jié)。需要從這五個環(huán)節(jié)所涉及到的五個方面去做工作。這五個方面分別是:全局的性能管理、故障和事件管理、資源的使用狀況管理
19、、安全管理和數據分析管理。其次,通過性能和歷史數據的反映,又可以做到對業(yè)務系統(tǒng)提供改進決策的指導。當然,對于如何保障和改進業(yè)務系統(tǒng)這個問題,目前業(yè)界眾說紛紜,沒有統(tǒng)一的標準。但有一點是肯定的,就是需要從企業(yè)用戶的角度出發(fā),通過明確的管理思路作為指引,使用軟件+服務的方式和企業(yè)用戶共同探索和研究,最終達到對業(yè)務的保障和改進。14當前 IT 運維管理的任務在企業(yè)網絡運維早期,IT 運維管理側重于網絡、硬件等設備。隨著業(yè)務系統(tǒng)涉及的環(huán)節(jié)日益增多,單一的網絡管理已經不足以滿足管理需求,越來越多的企業(yè)已經將關注點從單一網絡轉變到當前的業(yè)務系統(tǒng),落實保障業(yè)務系統(tǒng)的各個環(huán)節(jié)成為重中之重。1.3 運維人員組織
20、架構及管理制度1.3.1 運維組織結構介紹我公司將在此運維項目中投入業(yè)務水平高、技術能力強的運維人員和質量控制人員,采用公司嚴格規(guī)范的運維管理模式,進行全方位管理。為了進一步確保運維項目的進度與質量,公司在項目運維階段、質量管理、技術文檔等方面進行嚴密規(guī)范的部署。公司的運維隊伍組成包括: 運維項目總負責人(常務總經理兼任); 運維管理委員會(項目經理、甲方代表、監(jiān)理代表); 運維駐點服務小組; 技術支持專家組; 備品備件供應小組; 文檔管理小組1.3.2 運維組織管理制度運維部工作職責15根據維保項目實施推進和發(fā)展目標,負責系統(tǒng)信息協(xié)同管理及協(xié)同數據交換策略研究的整體架構、應用系統(tǒng)等技術開發(fā)方
21、案制定和組織開發(fā),保障基礎設施平臺的穩(wěn)定性和先進性。信息系統(tǒng)基礎設施設備和軟件操作規(guī)程和應用管理制度的制定,并負責監(jiān)督執(zhí)行。信息系統(tǒng)基礎設施設備和軟件安裝、調試和驗收,使用培訓和維修保養(yǎng)。信息系統(tǒng)基礎設施日常運行過程中信息安全和技術問題的協(xié)調解決,保障系統(tǒng) 24 小時安全穩(wěn)定運行。主要管理制度一覽表序號管理制度名稱執(zhí)行起始時間備注1機房基礎設施及硬件運維管理辦法2 0 1 6 . 12信息類設備運維管理辦法2 0 1 6 . 73主機運維管理辦法2017.3項目名稱: 招標編號: 企業(yè)名稱:說明:表格中列出目錄即可,主要規(guī)章制度的具體內容可在下方提供圖片或者截圖。附:各類制度圖片或截圖:161
22、7181.3.3 運維成員職責項目經理職責:項目經理受公司總經理任命和委托,全權負責運維項目合同的各項條款的履行。對運維項目的優(yōu)質、高效、安全負全責。運維工程師職責:191、負責對基礎設施維護(如服務器與存儲設備、網絡和信息安全設備、機房基礎設備及環(huán)境、桌面設備、多媒體設備等),軟件及信息資源維護(如系統(tǒng)軟件、工具軟件、業(yè)務系統(tǒng)及數據等)相關的申報事件進行處理和解決。2、負責對基礎設施維護(如服務器與存儲設備、網絡和信息安全設備、機房基礎設備及環(huán)境、桌面設備、多媒體設備等),軟件及信息資源維護(如系統(tǒng)軟件、工具軟件、業(yè)務系統(tǒng)及數據等)提供日常性能和運行狀況監(jiān)控,對故障進行分析處理及建立完善預警
23、機制。3、負責保障基礎設施正常運行,遵循用戶的安全保障管理要求。4、接受用戶對信息系統(tǒng)維護事件的督辦、檢查,協(xié)助服務臺完成對用戶意見進行回訪和事件統(tǒng)計、分析。對服務過程和反饋的意見進行改進,同時接受服務臺的績效考評工作。5、及時提供信息新系統(tǒng)運行和問題處理情況,并向用戶負責,并按周、月、季、年提交運維運維服務工作進度總結和計劃。6、負責整理和歸納服務器日常維護知識庫,提交至運維服務平臺。7、負責整理和提交信息系統(tǒng)運維過程資料和相關配套維護文檔。20技術支持專家職責:1. 為客戶提供 724 小時的故障響應電話支持。2. 接聽客戶服務熱線電話和接收(電話/Email/Fax 等)客戶服務請求;3
24、. 通過網絡或電話為客戶提供即時的遠程技術支持, 包括軟硬件故障的診斷和排除, 客戶端軟件的安裝和設置。4. 協(xié)調多方服務團隊,及時跟進未完成的服務請求并及時更新系統(tǒng)信息和狀態(tài);備品備件管理員職責:1. 組織實施備品備件的訂購、運輸及入庫工作2. 負責匯總待料備件,及時采購或調撥,并主動向項目經理說明待料原因、追蹤處理。1.3.4 運維成員組織結構針對單維保項目我公司配備了 4-5 名專職人員具體如下表:序號分派職位數量(人)姓名獲得證書1項目經理1項目管理師資格證2運維工程師1專業(yè)化證書3技術支持專家1廠商認證證書214備件管理員15文檔管理員1備注:人員證書附下頁:項目名稱: 招標編號:
25、企業(yè)名稱:序號姓名年齡文化程度專業(yè)獲得資格證書情況入職本單位時間崗位安排業(yè)績說明其他說明說明:1.上述人員必須是本企業(yè)在職職工,應與本單位近期社保繳納證明一致,否則不予認可。2.崗位安排指在具體運維項目中可擔任的崗位,如技術支持專家、項目經理、現場維護人員、其他服務人員及是否可安排駐場等。3.業(yè)績說明:指在以往運維項目曾經擔任的崗位,如技術支持專家、項目經理(負責人)、現場維護人員、其他服務人員等。附相關學歷證書:221.4 運維質量保證措施及服務承諾1.4.1 質量控制管理按照相應的 ISO9001:2000 國際質量體系標準及國家規(guī)定進行質量控制,還以相應的規(guī)范要求對設計質量,施工質量、材
26、料和設備質量進行管理、要求、控制。公司的施工階段性內部驗收制度,是質量控制管理的有利保證。工程的每一個階段完成時,公司技術支持部門都要按有關部門規(guī)范和要求進行嚴格的內部驗收。驗收標準整體上高于用戶驗收標準。1.4.2 進度控制管理針對普遍客戶的需求做出如下運維計劃:序號名稱人員周期1小型機、存儲系統(tǒng)巡檢報告運維工程師/技術支持專家每周2PC 服務器、存儲系統(tǒng)運維工程師/技術支持專家每周3多媒體系統(tǒng)運維工程師每周4網絡設備、信息安全設備運維工程師/技術支持專家每周5機房空調巡檢報告運維工程師每周6UPS 巡檢報告運維工程師每季7數據庫系統(tǒng)運維運維工程師/技術支持專家每周8中間件系統(tǒng)運維運維工程師
27、/技術支持專家每周9問題報告運維工程師/技術支持專家問題解決后10信息系統(tǒng)安全服務運維工程師/技術支持專家每半年11月總結報告運維工程師每月12季度總結報告運維工程師/技術支持專家每季度13年總結報告運維工程師/技術支持專家/項目經理每半年14運維管理咨詢服務運維工程師/技術支持專家每周15定期培訓技術支持專家每季度1.4.3 服務承諾1.系統(tǒng)定期巡檢是指我司安排現場工程師對應用系統(tǒng)實施現場檢查,及時發(fā)現系統(tǒng)運行中出現的隱患,減少系統(tǒng)發(fā)生故障的概率,保證系統(tǒng)的穩(wěn)定運行。在系統(tǒng)巡檢過程中發(fā)現的問題,依據我司故障分類標準,由現場技術服務工程師進行相應的故障排除。本項目中巡檢服務主要指軟件檢查,內容
28、包括:數據完整性檢查、性能指標檢查、告警功能檢查、軟件可用性與安全性檢查等。2.電話故障診斷是指用戶在遇到使用中的疑難問題或者系統(tǒng)出現不正常狀態(tài), 通過電話或傳真向我司尋求技術支持和幫助,我司在確認用戶的服務請求后,將安排技術人員在規(guī)定的時間內(即響應時間)通過電話幫助用戶進行故障定位, 并提出解決方案,最終指導用戶排除設備故障。表:故障性質定義用戶在維護系統(tǒng)過程中,當出現技術故障的時候,應對故障現象進行仔細認 真的調查和記錄,然后通過服務熱線向我司提供故障的詳細情況、服務請求時間、聯(lián)系人和聯(lián)系電話等。我司服務熱線提供每周 5 天、每天 8 小時的電話故障診斷,如熱線電話號碼需要更改,我司至少
29、提前三天以書面形式(含傳真)通知用戶。用戶應及時反饋解決方案的有效性,以便我司是否進一步采取技術支持措施。3.遠程故障診斷是指用戶在遇到使用中的疑難問題或者系統(tǒng)出現不正常狀態(tài), 通過電話或傳真向我司尋求技術支持和幫助,我司在確認用戶的服務請求后,通過服務項目不能解決系統(tǒng)故障問題的情況下,或在進行的同時,根據需要并征得用戶同意后,采用遠程撥號技術,將用戶系統(tǒng)與工程師所在地終端連通,在遠端對用戶設備進行診斷,提出解決問題的方案,并最終指導用戶解決問題。我司工程師負責進行遠程故障診斷,即只查看數據,尋找故障原因,不對數據進行修改,具體故障排除由工程師指導用戶現場維護人員進行。用戶應按我司的要求提供必
30、要的配合和協(xié)助,確認并反饋方案的有效性。 我司還可以通過遠程故障診斷對用戶數據進行檢查,進行遠程巡檢。 我司提供每周 5 天,每天 8 小時的遠程故障診斷。1.5 運維流程及服務方式1.5.1 服務方式針對本次項目我公司為保證各系統(tǒng)的穩(wěn)定可靠的運行我公司根據該項目的具體要求提供三種方式的技術支持服務,分別為:現場服務、遠程技術支持服務、針對甲方運維人員的技術培訓服務?,F場服務對客戶的系統(tǒng)進行現場維護和巡檢,運維工程師對各個應用系統(tǒng)完成定期巡檢,同時輸出巡檢報告提交給客戶,駐點工程是還應對客戶的故障設備進行維修和更換備件服務。為了讓客戶得到更及時和更快的服務,運維工程師還提供724 小時的故障響
31、應電話支持。遠程技術支持服務遠程技術服務主要是通過電話或其他方式受理客戶和運維工程師的疑難問題, 通過溝通來指導客戶或運維工程師解決問題,同時遠程技術服務工程師還通過電話或者其他方式與客戶主動溝通來提高客戶管理和運維能力。技術培訓服務為提高客戶的運維人員的技術水平及運維管理能力,我公司將派遣具有豐富實施經驗的技術專家定期對客戶進行相關專業(yè)(主機、存儲、數通、網絡、安全、機房環(huán)境等)的培訓。培訓可以采用靈活多樣的方式如面對面交流、課堂授課、郵件溝通等。1.5.2 運維流程我公司除培訓服務外,為本項目提供兩種服務方式:一種為技術人員現場值守,另一種是定期巡檢結合故障現場服務。1、技術人員現場值守運
32、行維護服務的基本操作流程如下圖所示:2、定期巡檢結合故障現場運行維護服務的基本操作流程如下圖所示:1.6 運維方案及實施安排1.6.1 小型機、PC 服務器、網絡設備及存儲系統(tǒng)小型機、PC 服務器、網絡設備及存儲系統(tǒng)運維部分主要分為三部分,分別為小型機存儲系統(tǒng)運維、PC 服務器運維、網絡設備運維。小機存儲系統(tǒng)運維內容主要包含小型機設備、光纖交換機、存儲設備三部分主要從以下幾個方面進行維護:1、檢查設備各部件的狀態(tài)燈;2、檢查并處理設備的錯誤日志;3、硬件設備的全面檢查;4、網絡配置的檢查及測試;5、操作系統(tǒng)性能分析;6、核對各小型機配置信息,根據需要調整配置;7、檢查設備的微碼版本;8、檢查存
33、儲設備運行情況;針對如上要求輸出如下檢測報告:小型機系統(tǒng)巡檢報告用戶單位名稱:設備名:設備型號:產品序列號:檢測項目檢測方式說明檢查結果巡檢周期電源風扇檢查主電源燈狀態(tài)指示燈常綠表示系統(tǒng)正在運行正常異常檢查直流電源指示燈狀態(tài)指示燈常綠表示電源供電正常正常異常檢查直流電源風扇狀態(tài)檢查風扇是否散熱正常異常處理器執(zhí)行命令:lsdevCcprocessor檢查 CPU 的數量及狀態(tài)。CPU 狀態(tài)為 Available,表示CPU 使用正常正常異常內存執(zhí)行命令:檢查內存數量及狀態(tài)。size 與 goodsize 的數量相等表正常異常lsattr El mem0示內存使用正常磁盤執(zhí)行命令:lsdev Cc
34、 disk檢查磁盤的數量及狀態(tài)。磁盤狀態(tài)為 Available,表示磁盤使用正常正常異常適配器執(zhí)行命令:lsdev Cc adapter檢查系統(tǒng)中配置了哪些適配器及使用狀態(tài)。各個適配器的狀態(tài)為 Available,表示各個適配器目前工作正常。若適配器狀態(tài)為 Define,則表示該設備已經被配置但是未被當前系統(tǒng)使用。正常異常分頁空間執(zhí)行命令:lsps -a檢查分頁空間的分配數量及利用率。Size 為已分配的分頁空間數量;%Used 為目前系統(tǒng)的分頁空間使用率,該值若超過70,表示系統(tǒng)內存不足正常異常系統(tǒng)鏡像執(zhí)行命令:lsvg l rootvg檢查系統(tǒng)卷組的鏡像狀態(tài)。各個邏輯卷的 PPs 數量應該
35、為 LPs 數量的整數倍,倍數大于 1 并且能被 PVs 整除,表示卷組已經作鏡像。各個邏輯卷的 LV STATE 應該為 syncd,否則表示鏡像不同步。正常異常文件系統(tǒng)執(zhí)行命令:df -k檢查已經掛載的文件系統(tǒng)的使用狀態(tài)。重點檢查 /(根)/tmp(臨時)/var(日志文件)這些動態(tài)文件系統(tǒng)的使用率最好保持在 70以下。正常異常錯誤日志執(zhí)行命令:errpt檢查系統(tǒng)日志是否有硬件或軟件方面的永久錯誤。若發(fā)現錯誤類型為 P 的信息,則需要注意。正常異常網卡配置情況執(zhí)行命令:ifconfig a檢查各個網卡的配置情況,狀態(tài)是否為 UP,檢查 ip 地址和子網掩碼等配置是否正確。正常異常系統(tǒng)備份執(zhí)
36、行命令:lsmksysb-V -f /dev/rmt0檢查磁帶備份的可讀性。若沒有錯誤顯示,則表示備份磁帶的數據是有效可恢復的。正常異常客戶確認巡檢結論:【】合格【】不合格用戶代表簽字:年月日服務工程師簽字:年月日存儲系統(tǒng)設備巡檢:設備名稱:檢查時間: 年 月 日 時本年度第次檢查檢查項目:檢查結果:1. 檢查存儲硬件情況:設備故障燈是否有亮SAN 交換機端口 LED 狀態(tài)有無正常不正常2. 存儲系統(tǒng)故障報告(Problem Log):正常不正常Problem Log/Serviceable Event正常不正常有否硬件故障3. 存儲系統(tǒng)運行狀態(tài):View Storage Facility S
37、tate /正常不正常CdaPreverify / View RIO Topology正常不正常4. 通信:正常不正常/Master Console/SMC/HMC 和存儲設備的通信Good Degraded OfflineRebuilding6. 存儲設備內部狀態(tài):正常不正常7. 存儲系統(tǒng)硬件狀態(tài):正常不正常雙控制器同時正常工作正常不正常電池、電源和風扇模塊是否物理硬盤和邏輯盤是否8. 微碼(Microcode)是否滿足 IBM 的最低要求是否9. 是否啟用了 Call Home是否10.收集存儲設備基本信息存檔是否目前存在的問題:改進措施或建議:檢查結論:客戶簽字:工程師簽字:日期: 年
38、月 日日期:年 月 日PC 服務器運維內容主要包含設備硬件、操作系統(tǒng)、軟件幾個方面進行考慮。PC 服務器巡檢:服務器設備巡檢報告用戶單位名稱:設備名:設備型號:產品序列號:檢測項目檢測方式說明檢查結果巡檢周期顯示器正常異常光驅正常異常磁帶機正常異常電源正常異常鍵盤/鼠標正常異常風扇正常異常系統(tǒng)指示燈狀態(tài)前面板指示燈正常異常電源指示燈正常異常磁盤指示燈正常異常系統(tǒng)控制板指示燈(CPU/MEM,I/O 等)正常異常系統(tǒng)日志信息IML 日志正常異常操作系統(tǒng)日志正常異常交換區(qū)使用率TOP 或任務管理器查看使用率正常異常磁盤分區(qū)使用率Windows 系統(tǒng)Unix 系統(tǒng)用命令 df -kC:/使用率正常異
39、常D: /usr使用率正常異常E:/var使用率正常異常其它分區(qū)正常異常正常異常操作系統(tǒng)版本/正常異常核心 patch 版本正常異常高可用性軟件正常異常數據庫軟件正常異常存儲軟件正常異常備份軟件正常異常正常異常正常異常巡檢結論:【】合格【】不合格用戶代表簽字:年月日服務工程師簽字:年月日網絡安全設備巡檢報告用戶單位名稱:設備名:設備型號:產品序列號:檢測項目檢測方式說明檢查結果巡檢周期正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常網絡設備的運維內容主要包含交換機、防火墻以及負載均衡等相關設備輸出文檔按照如下:正常異常正常
40、異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常正常異常1.6.2 機房空調、UPS 設備運維服務為保證機房內各個應用系統(tǒng)的設備正常穩(wěn)定的運行,良好的機房環(huán)境是非常 必要的,我公司針對本次項目主要從機房空調系統(tǒng)、UPS 供配電系統(tǒng),作為重點運維內容,同時對機房內的其他指標項進行檢測如機房內溫度、濕度、消防系統(tǒng)、新風系統(tǒng)等。機房空調系統(tǒng)的運維內容主要遵循如下表單進行巡檢:機房空調巡檢報告用戶單位名稱:設備名:設備型號:產品序列號:系統(tǒng)檢查項目檢查時間:檢查時間:空調 1控制溫度控制濕度%當前溫度當前濕度%業(yè)務機房當前溫度當前濕度%監(jiān)控室、/ups當前溫度當前濕度%當前運行空調
41、檢查空調是否有排水不出產生積水、漏水現象( ) 1 號機在用( ) 2 號機在用() 1 號機在用() 2 號機在用()無積水、漏水現象()無積水、漏水現象()有積水、漏水現象()有積水、漏水現象目前存在的問題:改進措施或建議:巡檢結論:客戶簽字:工程師簽字:日期:年月日日期:年月日備注:我公司巡檢人員每周會嚴格按照機房空調巡檢報告具體要求對客戶的 空調系統(tǒng)檢測,為保證空調系統(tǒng)的工作正常,每年不低于 2 次的全面巡檢,對故障配件進行檢修,在日常維護中及時清理及更換過濾網和加濕罐等耗材,定期清 理機房空調的室外機,檢修內各供水管路及排水管路,杜絕漏水,保證管路暢通。在設備出現故障后,保證在 48
42、 小時內恢復正常。機房 UPS 系統(tǒng)的運維內容主要遵循如下表單進行巡檢:UPS 巡檢報告設備型號:產品序列號:信息顯示檢查檢查量測量值顯示值檢查量測量值顯示值1輸入電壓 Vab輸入電流 Ia2輸入電壓 Vbc輸入電流 Ib3輸入電壓 Vca輸入電流 Ic4輸出電壓 Vab輸出電流 Ia5輸出電壓 Vbc輸出電流 Ib6輸出電壓 Vcb輸出電流 Ic7輸入頻率 Hz輸出頻率 Hz8輸出功率 KW輸出視在功率9電池電壓 Vdc電池電流 Id當前 UPS 運行狀態(tài)市電逆變 旁路 電池逆變 故障停機 單機 并機旁路或電池逆變的原因:內部檢查:(檢查時可能斷電,用戶需斷開負載)是否合格處理概要1檢視輸入
43、/輸出端子、螺栓、螺帽緊固性2檢視所有主控板電氣連接是否安全可靠3檢查器件、電纜等損壞、老化情況4檢查風扇及風道狀況5檢查機柜、電池架等結構件腐蝕、形變與連接緊固情況6檢查機內變壓器、散熱器等散熱環(huán)境和通道狀況7檢測所有濾波電容外觀、緊固和泄露情況8清掃可達空間和無源空間9視檢整流器和逆變器驅動板是否過熱或燒焦10視檢整流器充電器晶體二極管是否老化11視檢直流電容/交流電容是否老化12檢查所有保險絲是否正常功能測試(如果必須進行以下測試,經客戶同意后按照操作流程進行)1市電逆變/旁路轉換功能正常異常 2實際負荷下電池放電和充電等電池管理功能正常異常 3UPS 逆變同步,并機均流正常異常 4報警
44、功能和歷史故障信息記錄,并清除歷史記錄正常異常 處理概要:其他問題或建議:電池檢測報告有 無巡檢人簽名:用戶簽名:日期日期備注:我公司巡檢人員每周會嚴格按照 UPS 巡檢報告具體要求對客戶的 UPS 供配電系統(tǒng)進行檢測,根據具體的檢測結果對 UPS 設備進行合理維修,為保證 UPS 設備的正常運行,每年至少進行一次全面巡檢,巡檢時檢查蓄電池使用情況,在客戶授權的情況下進行充放電,當 UPS 設備發(fā)生故障時,應在 72 小時內恢復正常運行。1.6.3 數據庫系統(tǒng)運維服務針對數據系統(tǒng)的運維我公司提供如下解決方案:本方案適用于技術人員的日常運維工作。ORACLE DB 維護方法數據庫啟動1、以 or
45、acle 用戶用戶登錄, sqlplus/as sysdba sqlplus startup2、以 oracle 用戶或 ora816 用戶登錄sqlplus/as sysdba sqlplusstartup nomuntsqlplus alter database mount;sqlplus alter database open; 3、第一種啟動方式是最常用的手工啟動方式,第二種啟動方式是數據庫有故障時常用的逐步啟動方式,可以觀察故障點。因為 startup nomount 語句只讀取spfile(server parameter file 數據庫參數文件),啟動 instance,啟動
46、SGA 和后臺進程;alter database mount 語句打開控制文件,確認數據文件和聯(lián)機日志文件的位置,但此時不對數據文件和日志文件進行校驗檢查;alter databaseopen 打開包括 Redolog 文件在內的所有數據庫文件,這種方式下可訪問數據庫中的數據。Startup 完成功能是上述三條語句的之和。數據庫停止1、 sqlplus /as sysdba sqlplusshutdown normal正常方式關閉數據庫。2、shutdown immediate立即方式關閉數據庫,在 SQLPLUS 中執(zhí)行 shutdown immediate,數據庫并不立即關閉,而是在所有事務執(zhí)行完畢并提交工作后才關閉,所以可能會等待,因此在關閉數據前要停掉連接到數據庫的所有應用程序。建議日常維護工作中的關閉數據庫,采用此方式。3、shutdown abort直接關閉數據庫,正在訪問數據庫的會話會被突然終止。如果數據庫中有大量操作正在執(zhí)行,這時執(zhí)行 shutdown abort 后,因日志回滾、前滾(R
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 南京交安考試試題及答案
- 系統(tǒng)工程師考試題及答案
- 呼和浩特安全員b證考試題及答案
- 農村信用社筆試試題及答案
- 黨紀知識競賽題庫及答案
- 質檢員專業(yè)管理實務復習模擬試題及答案
- 重慶中職計算機題庫及答案
- 鐵路職業(yè)技能鑒定試題預測試卷附答案詳解
- 醫(yī)技三基三嚴模考試題+答案
- 保育員高級理論知識試卷及答案2
- 中華人民共和國職業(yè)分類大典是(專業(yè)職業(yè)分類明細)
- 2025年中考英語復習必背1600課標詞匯(30天記背)
- 資產管理部2025年工作總結與2025年工作計劃
- 科技成果轉化技術平臺
- 下腔靜脈濾器置入術的護理查房
- 基建人員考核管理辦法
- 2025體育與健康課程標準深度解讀與教學實踐
- 礦山救援器材管理制度
- 2025西南民族大學輔導員考試試題及答案
- T/CSPSTC 17-2018企業(yè)安全生產雙重預防機制建設規(guī)范
- 2025年《三級物業(yè)管理師》考試復習題(含答案)
評論
0/150
提交評論