版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、內蒙古大學碩士學位論文商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃 姓名:趙旭鵬申請學位級別:碩士專業(yè):計算機技術指導教師:劉鐵英;傅加寧20080508內蒙古大學工程碩士學位論文商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃摘要保險業(yè)作為我國新興的朝陽產(chǎn)業(yè),正面臨著飛速發(fā)展的成長階段,伴隨著整個行業(yè) 的發(fā)展,其信息化建設步伐也在大力推進。新的歷史任務,新的挑戰(zhàn)與機遇,為我們保 險行業(yè)的信息技術人員提出了新的課題。本文旨在結合我所就職的中國人民財產(chǎn)保險公司包頭市分公司的實際情況和業(yè)務 需求,來嘗試著應用現(xiàn)在較為前沿的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術,創(chuàng)造性地研究現(xiàn)代商業(yè) 財產(chǎn)保險公司業(yè)務分析系統(tǒng)的設計與規(guī)劃,以服
2、務于公司管理層的決策支持,完善公司 內部的信息化建設。關鍵詞:財產(chǎn)保險,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘,業(yè)務分析系統(tǒng) 滕 鼎 要CO .MMEORPcER隊A¨TIO購N盹AN盯ALYY型ZE戳劂1E嘩N1 wM IS YABSTRACTInsll舢ce is a developing domain in China.Its development is Veryquick呲舭 dcvel。pment ofme柵趾ce,its c。mmunicati。n is building fastThe ncw missi吣曲n洲 淵lenge觚d me new chance are making to
3、the new topics for all the IT engineers in鋤eseIn this僦,1will according to the condition and the requirement of the PICC B衲uBr砌comp娜And aCc0池g to the data-storehouse technology and da蛐gtechnology to research the commercial property。insurance companysop咖on刪yzesystem.I嘶姒砌I do could make service to the
4、managers of the咖齜company and develop the communication buildings.Keyw。rds:property.insurance,data-storehouse,data-mining,。peration砌yze system II內蒙古大學工程碩士學位論文圖表目錄V原創(chuàng)性聲明本人聲明:所呈交的學位論文是本人在導師的指導下進行的研究工作及取得的研究成果。除本文已經(jīng)注明引用的內容外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也 一:? 不包含為獲得內墓直太堂及其他教育機構的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢
5、獻均已在論文中作了明確的說明并表示謝意。學位論文作者簽名:盤堂壹鴣 指導教師簽名:日 期:坐壁:堇:金 日 期:在學期間研究成果使用承諾書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,即:內蒙古大學有權將 學位論文的全部內容或部分保留并向國家有關機構、部門送交學位論文的復印件和磁盤,允 許編入有關數(shù)據(jù)庫進行檢索,也可以采用影印、縮印或其他復制手段保存、匯編學位論文。 為保護學院和導師的知識產(chǎn)權,作者在學期間取得的研究成果屬于內蒙古大學。作者今后 使用涉及在學期間主要研究內容或研究成果,須征得內蒙古大學就讀期間導師的同意;若用 于發(fā)表論文,版權單位必須署名為內蒙古大學方可投稿或公開發(fā)表
6、。學位論文作者簽名:盤塑!遂 指導教師簽名;日 期:2塑室!堇! 日內蒙古大學工程碩士學位論文第一章緒論1.1項目背景保險業(yè)是我國新興而起的朝陽產(chǎn)業(yè)。隨著中國加入WTO后對我國保險業(yè)的全面開 放,以及我國經(jīng)濟長期穩(wěn)健的發(fā)展,我國的商業(yè)保險公司如雨后春筍般紛紛開辦并逐步 成長起來。前所未有的競爭態(tài)勢,前所未有的市場規(guī)模,給處于幼年期的我國保險業(yè)帶 來了前所未有的挑戰(zhàn)與機遇。從保險業(yè)的固有屬性來看,它是以經(jīng)營風險為方式的金融類行業(yè)。從我國當前的國 情來看,它是一個正在處于高度競爭中的不甚成熟的行業(yè)。在這個高度競爭和極富風險 的行業(yè)中,構成它的每一個主體都在努力尋求著決勝于競爭并竭力降低經(jīng)營風險的最
7、好 的方法論。由于我國保險業(yè)起步較晚、歷史短暫、經(jīng)驗缺乏,目前尚無絕對完美的應對 之策。但從對西方保險企業(yè)的研究所得的經(jīng)驗教訓來看,我國保險業(yè)的廣大主體已經(jīng)獲 得了普遍的一致。那就是“對經(jīng)濟效益的追求從依靠取得短期既得利益,轉向以正確的 戰(zhàn)略決策為依托在中長時期內取得最大利益。"企業(yè)戰(zhàn)略決策的重要性在此可見一斑。 可以說,決策的成功與否直接關系到整個企業(yè)的生死存亡,關系到企業(yè)全局的發(fā)展命脈。 同時,通過近年來對計算機系統(tǒng)的使用,我們不難發(fā)現(xiàn)作為行業(yè)主體的保險公司都擁有 著大量的信息數(shù)據(jù)。這些數(shù)據(jù)是公司最為重要、最為寶貴的財富,要想使這些數(shù)據(jù)能產(chǎn) 生出有用的信息,必須有一個適宜的分析手
8、段,具備了智能化的決策支持系統(tǒng)可以有效 的解決這一問題,應用于保險公司戰(zhàn)略決策的需求。決策支持系統(tǒng)是一個用系統(tǒng)技術描述動態(tài)領域的術語,是信息系統(tǒng)經(jīng)由電子數(shù)據(jù)處 理EDP和管理信息系統(tǒng)MIS而形成的最新形式,是由人機交互部件、模型及其管理部 件、數(shù)據(jù)庫及其管理部件三者有機結合的應用軟件系統(tǒng)。該系統(tǒng)能夠為決策者提供決策 所需的數(shù)據(jù)、信息和背景材料,幫助決策者明確決策目標和進行問題的識別,建立或修 改決策模型,提供各種備選方案,并且對各種方案進行評價和優(yōu)選,通過人機交互功能 進行分析、比較和判斷,為正確決策提供必要的支持。而任何決策都是需要用數(shù)據(jù)來說 話的,決策支持系統(tǒng)同樣是以信息數(shù)據(jù)為依托。可以說
9、,在任何決策支持系統(tǒng)中,數(shù)據(jù) 分析系統(tǒng)都是決策支持系統(tǒng)的核心構成,同時也是體現(xiàn)決策支持系統(tǒng)性能好壞的關鍵所 在。商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃中國人民財產(chǎn)保險股份有限公司(以下簡稱人保財險,其前身為中國人民保險公 司。是一家擁有著五十多年經(jīng)營歷史的、全國規(guī)模最大的國有非壽險保險公司。公司自 03年香港上市以來,真正開始進行公司制運作。其信息化建設一直走在我國金融類企業(yè) 前列,幾年來,分別經(jīng)歷了全國范圍的基礎網(wǎng)絡改造,業(yè)務數(shù)據(jù)及財務數(shù)據(jù)的層級大集 中,辦公自動化的實施及有效運行等大型信息化建設項目。而07年開始,為適應企業(yè) 更為長遠的戰(zhàn)略性發(fā)展,公司提出了此年為“數(shù)據(jù)質量管理年&quo
10、t;的口號,自此年始,公 司對海量的數(shù)據(jù)質量提出了更高的要求,以服務于高層決策,服務于公司經(jīng)營。這為我 們信息技術工作者提出了新的挑戰(zhàn)與新的思索。我意識到,作為人保財險分支機構的包 頭市分公司,多年以來之所以能夠一直保持其在包頭市場上的絕對優(yōu)勢,很重要的一點 是源于其多年來所積累的大量的信息數(shù)據(jù)資源。從西方的保險經(jīng)驗來看,保險公司的業(yè) 務數(shù)據(jù)又處于企業(yè)發(fā)展與行業(yè)內競爭的核心地位,同時也正是我公司此次數(shù)據(jù)質量管理 的監(jiān)管重心?;跀?shù)據(jù)分析的業(yè)務分析系統(tǒng)能方便地從已有數(shù)據(jù)中挖掘出有用的信息, 能較好地支持分公司領導和各級管理人員對數(shù)據(jù)分析的需求,并極大的減少信息技術部 門與各業(yè)務部門的冗余工作量。
11、而當前,在傳統(tǒng)數(shù)據(jù)庫技術上深化發(fā)展出來的數(shù)據(jù)倉庫 和數(shù)據(jù)挖掘技術則是對數(shù)據(jù)質量進行信息化管理與控制的有效技術支持手段和企業(yè)決 策分析手段。因而,我決定嘗試運用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術來進行基于數(shù)據(jù)分析的商 業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃。希望它能夠有效指導我公司管理層決策, 并能夠成為未來我公司決策支持系統(tǒng)的重要組成。1.2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術的發(fā)展數(shù)據(jù)倉庫是信息處理技術發(fā)展的必然產(chǎn)物。在應用信息處理技術的早期,受計算機 硬件和軟件技術發(fā)展的限制,這一時期信息處理技術重點在于通過模仿人工流程來提高 日常事務處理效率;上世紀80年代后,由于PC機的大量應用和價格的不斷下降,極大 地推動了
12、信息處理技術的發(fā)展,許多企業(yè)都開始使用數(shù)據(jù)庫系統(tǒng)開發(fā)自己的應用系統(tǒng), 這些應用主要是為生產(chǎn)自動化、精簡工作任務和高速采集數(shù)據(jù)服務,所以絕大部分的數(shù) 據(jù)庫應用屬于聯(lián)機事務處理類型(OLlP。這類應用的特征是快速事務響應和頻繁數(shù)據(jù) 變化,同時用戶可以通過網(wǎng)絡來實現(xiàn)信息資源共享。到了上世紀90年代,隨著企業(yè)數(shù)2內蒙古大學工程碩士學位論文數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中, 提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。又稱為 從數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database,簡稱KDD。數(shù)據(jù)挖掘與傳統(tǒng) 的
13、數(shù)據(jù)分析(如查詢、報表、聯(lián)機應用分析的本質區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設的 前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘所得到的信息應具有先未知、有效和實用三個 特征。這個定義包括好幾層含義:數(shù)據(jù)源必須是真實的、大量的、含噪聲的;發(fā)現(xiàn)的是 用戶感興趣的知識;發(fā)現(xiàn)的知識要可接受、可理解、可運用;并不要求發(fā)現(xiàn)放之四海皆 準的知識,但需支持特定的發(fā)現(xiàn)問題。即所有發(fā)現(xiàn)的知識都是相對的,是有特定前提和 約束條件,面向特定領域的,同時還要能夠易于被用戶理解。最好能用自然語言表達所 發(fā)現(xiàn)的結果。盡管數(shù)據(jù)挖掘僅僅是整個KDD過程中的一個重要步驟,但由于目前工業(yè)界、媒體、 數(shù)據(jù)庫研究領域中,“數(shù)據(jù)挖掘"一詞已
14、被廣泛使用并被普遍接受,因此本文也廣義地 使用“數(shù)據(jù)挖掘”一詞來表示整個KDD過程,即數(shù)據(jù)挖掘就是一個從數(shù)據(jù)庫、數(shù)據(jù)倉 庫或其它信息資源庫的大量數(shù)據(jù)中發(fā)掘出有用的知識。數(shù)據(jù)挖掘能夠極大的幫助企業(yè)降低成本、減少風險、提高資金回報率,以用最小的 花費得到最好的經(jīng)營業(yè)績。1.3數(shù)據(jù)倉庫與數(shù)據(jù)挖掘在保險行業(yè)的應用商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃進入二十世紀80年代后,計算機技術得到了迅猛發(fā)展,在保險行業(yè)中開始出現(xiàn)業(yè) 務計算機系統(tǒng)。隨著商業(yè)保險公司的業(yè)務系統(tǒng)日趨完善,數(shù)據(jù)交換和處理中心的建立, 如何滿足保險行業(yè)日益增長的各種查詢、統(tǒng)計、報表以及分析和預測的需求;如何提高 防范和化解經(jīng)營風險的能力
15、;如何有效利用這些數(shù)據(jù)來實現(xiàn)經(jīng)營管理的目標;如何利用 這些數(shù)據(jù)來設計保險企業(yè)的發(fā)展宏圖,從而在激烈的競爭中贏得先機是保險企業(yè)在信息 技術應用上的首要難題。通過多年來對業(yè)務計算機系統(tǒng)的使用,保險公司都有大量歷史數(shù)據(jù),這些數(shù)據(jù)是公 司最重要的財富。要想使這些數(shù)據(jù)能產(chǎn)生出有用的信息,必須有一個適宜的分析手段, 只有數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術真正符合這一要求。數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術在西方發(fā)達 國家的保險行業(yè)應用的已經(jīng)相當廣泛。我國保險業(yè)正在高速發(fā)展,隨著中國加入WTO, 實力雄厚的外資保險公司己經(jīng)涉足中國保險市場,這就要求我國保險公司必須加快信息 化建設步伐使自己立于不敗之地。所以國內的很多保險公司需要積
16、極地開發(fā)業(yè)務數(shù)據(jù)倉 庫與數(shù)據(jù)挖掘系統(tǒng)來更加有效地進行管理決策分析。而當前我國對商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究還停留在比較初級的階段。事 實上,一些所謂的業(yè)務分析系統(tǒng)只是在實現(xiàn)著一些簡單的數(shù)據(jù)查詢、修改等傳統(tǒng)的數(shù)據(jù) 。庫功能,并沒有真正實現(xiàn)具有智能化并足以輔助決策、支持決策的功能??傮w而言,國內外關于數(shù)據(jù)倉庫,數(shù)據(jù)挖掘的研究已較為成熟,但針對商業(yè)保險企 業(yè)的此類問題的研究還并不是很多,尚待完善??陀^上,這也為我們的工作提出了無限 廣闊的思索與研究空間。1.4人保財險包頭市分公司數(shù)據(jù)查詢和數(shù)據(jù)分析的現(xiàn)狀保險業(yè)與其他行業(yè)差異很大:保險業(yè)務系統(tǒng)比產(chǎn)業(yè)界甚至其它金融行業(yè)更為復雜, 4內蒙古大學工程碩
17、士學位論文原因是保險業(yè)務數(shù)據(jù)結構非常復雜,數(shù)據(jù)信息量極其巨大,而且變更相當頻繁。傳統(tǒng)的 數(shù)據(jù)倉庫理論認為數(shù)據(jù)倉庫中數(shù)據(jù)是穩(wěn)定的。在數(shù)據(jù)頻繁變更的業(yè)務系統(tǒng)基礎上建立數(shù) 據(jù)倉庫還存在許多需要解決的問題。人保財險包頭市分公司現(xiàn)有的數(shù)據(jù)查詢和數(shù)據(jù)分析主要是由總公司、作為省級分支 機構的內蒙古分公司和我們地市級的包頭市分公司信息技術人員開發(fā)的各種固定報表 來支撐的。一些臨時性的需求則是由我們包頭市分公司信息技術人員通過SQL直接在 業(yè)務系統(tǒng)中提取的。事實上,公司現(xiàn)有的,與業(yè)務系統(tǒng)相配套的數(shù)據(jù)庫,只是在實現(xiàn)著 一些簡單的數(shù)據(jù)查詢、修改等基礎的也是較為傳統(tǒng)的數(shù)據(jù)庫功能。對于其數(shù)據(jù)分析能力, 則基本是由各業(yè)務
18、部門人員來進行人工處理的。此外,在數(shù)據(jù)查詢上沒有統(tǒng)一的數(shù)據(jù)出 口和統(tǒng)計口徑,這種情況不但影響了數(shù)據(jù)的準確性和一致性,而且限制了對數(shù)據(jù)進行有 效靈活地分析,同時又加重了信息技術部和業(yè)務部門人員工作的強度。而隨著市場規(guī)模 的擴大和市場情況的變化莫測,業(yè)務部門和管理部門關于數(shù)據(jù)查詢和分析的需求與日俱 增且變化很快,為了更好地滿足這種需求,業(yè)務分析系統(tǒng)的建立就顯得極為迫切了。 1.5本文的主要工作及內容為建立一個能滿足人保財險包頭市分公司業(yè)務需求的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘系統(tǒng),必 須實現(xiàn)幾個不同業(yè)務數(shù)據(jù)庫的數(shù)據(jù)集中,可以自動聯(lián)機及時地進行數(shù)據(jù)維護和的高效率 地查詢。本項目中,主要工作可以分為項目分析、數(shù)據(jù)倉
19、庫搭建和運用數(shù)據(jù)挖掘技術進行財 產(chǎn)保險業(yè)務分析系統(tǒng)的規(guī)劃三個方面。項目分析:在公司內廣泛收集意見通過座談或單獨交流的方式,進行詳細的業(yè)務需 求分析,整理出一些有價值的報表,將主要統(tǒng)計指標、指標解釋及其統(tǒng)計口徑進行統(tǒng)一, 形成相應的數(shù)據(jù)字典,避免產(chǎn)生歧義確定系統(tǒng)的大體框架包括系統(tǒng)的功能、運行環(huán)境、 性能等并形成文檔。數(shù)據(jù)倉庫搭建:結合需求分析,運用數(shù)據(jù)倉庫建模技術規(guī)劃設計財產(chǎn)保險數(shù)據(jù)倉庫 的后臺數(shù)據(jù)結構,并設計出數(shù)據(jù)倉庫數(shù)據(jù)庫及其調度系統(tǒng),實現(xiàn)數(shù)據(jù)倉庫數(shù)據(jù)的增量抽 取,使數(shù)據(jù)倉庫的數(shù)據(jù)能夠及時更新,并對數(shù)據(jù)倉庫數(shù)據(jù)和綜合統(tǒng)計系統(tǒng)數(shù)據(jù)進行核對 同時將核對不上的數(shù)據(jù)清單記錄下來,然后調度一個錯誤處理
20、程序將這些數(shù)據(jù)進行重新 抽取,以保證數(shù)據(jù)倉庫數(shù)據(jù)的準確性。5商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃保險業(yè)務分析系統(tǒng)規(guī)劃:規(guī)劃建立面向主題的業(yè)務模型,并進行權限控制,在維護 了用戶組和用戶以后,將業(yè)務模型生成的數(shù)據(jù)立方體提供給業(yè)務分析人員進行靈活分 析,例如切片、旋轉、鉆取等,將數(shù)據(jù)立方體生成的固定報表發(fā)布給相關人員進行查詢 和分析,最后匯總發(fā)送至決策層。6內蒙古大學工程碩士學位論文第二章數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術概述2.1數(shù)據(jù)倉庫,題、集成的、非易失的,是隨時間變化的數(shù)據(jù)集合,用來支持管理決策。它有以下幾個 特征:面向主題數(shù)據(jù)倉庫以一個企業(yè)或組織中固有的業(yè)務主題作為處理的主體,從整體、全局的角
21、度來衡量這些主題在企業(yè)中的作用。傳統(tǒng)操作型系統(tǒng)主要針對具體業(yè)務設計解決問題的 方法,組織與此相關的一段時間內的業(yè)務統(tǒng)計、分析工作。例如對于一個保險公司來說, 應用問題包括各種各樣的保險業(yè)務處理,以及月度、季度、年度報表等。數(shù)據(jù)倉庫則以 一個企業(yè)或組織中固有的業(yè)務主題作為處理的主體,是從整體、全局的角度來衡量這些 主題在企業(yè)中的作用。集成. 數(shù)據(jù)倉庫是面向主題來組織數(shù)據(jù)的,必須包含所有相關事務處理系統(tǒng)的數(shù)據(jù),然而 數(shù)據(jù)倉庫中的數(shù)據(jù)不是各個事務處理系統(tǒng)中數(shù)據(jù)的簡單堆積。它必須將組織中不一致的數(shù)據(jù)進行有效的集成,使之在數(shù)據(jù)倉庫中有一致的表示,并且需要根據(jù)主題進行有效的 數(shù)據(jù)組織。而且數(shù)據(jù)倉庫為了提高
22、查詢反應速度,存儲了大量的統(tǒng)計結果,因此從各個 數(shù)據(jù)源抽取數(shù)據(jù)到數(shù)據(jù)倉庫時,必須要經(jīng)過統(tǒng)一與綜合編碼。穩(wěn)定性在操作型環(huán)境中,對數(shù)據(jù)可以進行反復的增加、刪除、修改、查詢等操作,這些操 作可以來自同一個系統(tǒng),也可以來自不同的系統(tǒng)。而在數(shù)據(jù)倉庫中,數(shù)據(jù)從操作型數(shù)據(jù) 中抽取而來,反映一段相當長的時間的歷史數(shù)據(jù)的內容,是不同時間點的數(shù)據(jù)庫快照的 集合,以及基于快照的統(tǒng)計、綜合和重組。數(shù)據(jù)僅在抽取和裝載時進行更新或修改。而 操作型數(shù)據(jù)進入數(shù)據(jù)倉庫,只要數(shù)據(jù)沒有超過數(shù)據(jù)倉庫的數(shù)據(jù)存儲期限,一般不對數(shù)據(jù) 進行更新操作,只進行查詢操作。即通常不進行一般意義上的更新,而且與操作型數(shù)據(jù) 相比更新的頻度要少得多,時間
23、要求更為寬松。7商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃隨時間變化數(shù)據(jù)倉庫中的數(shù)據(jù)本身并不隨時間變化,而是時間元素(如年、月、日等包含在 數(shù)據(jù)中,使得隨時間變化的趨向可以用于分析研究。1數(shù)據(jù)倉庫隨時間不斷增加新的數(shù)據(jù),不斷將當前最新的操作性數(shù)據(jù)統(tǒng)一集成到數(shù) 據(jù)倉庫中。這些數(shù)據(jù)一旦集成,除非將其刪除,否則不再進行更新操作。2數(shù)據(jù)倉庫中,存儲數(shù)據(jù)的時間跨度較操作型系統(tǒng)中存儲數(shù)據(jù)的時間跨度要大得 多。在操作型系統(tǒng)中存儲的數(shù)據(jù)通常不超過一年,而數(shù)據(jù)倉庫中通常需要存放510年 甚至更長時間的數(shù)據(jù)。3操作型數(shù)據(jù)庫中包含有當前的數(shù)據(jù),這些數(shù)據(jù)是準確的,可被有效地訪問和更新。 而數(shù)據(jù)倉庫中的數(shù)據(jù)僅僅是一系列某
24、一時刻生成的復雜“快照",它包含了對當前和歷 史數(shù)據(jù)的重新組織,被加工成面向主題的不同粒度的數(shù)據(jù)。4根據(jù)應用的需要,操作型數(shù)據(jù)中可以不包含時間元素。而數(shù)據(jù)倉庫中總是包含時 間元素,并且它還是關鍵字的一部分,主要用于趨勢分析。數(shù)據(jù)集市口的定義是:原始數(shù)據(jù)從數(shù)據(jù)倉庫流到不同部門中以支持這些部門的定制 化使用,這些部門級的數(shù)據(jù)倉庫就稱為數(shù)據(jù)集市。而數(shù)據(jù)倉庫在全組織范圍內為各個部 門提供管理、決策支持。從某種意義上說,數(shù)據(jù)倉庫是有關全局性的,而數(shù)據(jù)集市是局 部性的。數(shù)據(jù)倉庫是由多個數(shù)據(jù)集市組成的。數(shù)據(jù)倉庫通常采用分級的方式進行組織,一般包括早期細節(jié)數(shù)據(jù)、當前細節(jié)數(shù)據(jù)、 輕度綜合數(shù)據(jù)、高度綜合
25、數(shù)據(jù)以及元數(shù)據(jù)。8內蒙古大學工程碩士學位論文尚度鎵臺藏蠢一一-¥輕度埠臺藏囂一。-巍箭綴繁藏據(jù)葶嬲綏節(jié)藏鑲圖2.1數(shù)據(jù)倉庫數(shù)據(jù)組織結構圖早期細節(jié)數(shù)據(jù)存儲過去的詳細數(shù)據(jù),反映真實的歷史情況。當前細節(jié)數(shù)據(jù)最近的業(yè)務數(shù)據(jù),反映當前業(yè)務的情況,是數(shù)據(jù)倉庫用戶最感興趣的部分。隨著時 間的推移,將變成早期細節(jié)數(shù)據(jù)。輕度綜合數(shù)據(jù)從當前基本數(shù)據(jù)中提取出來,通常以較小的時間段粒度統(tǒng)計而形成的數(shù)據(jù)量較小的 數(shù)據(jù)。高度綜合數(shù)據(jù)(準決策數(shù)據(jù)元數(shù)據(jù)元數(shù)據(jù)是“關于數(shù)據(jù)的數(shù)據(jù),是用于支持數(shù)據(jù)倉庫開發(fā)和管理的任何信息,通常 保存于存儲庫中,并提供給用戶或軟件工具使用。通常將元數(shù)據(jù)分為技術元數(shù)據(jù)和業(yè)務 元數(shù)據(jù)。技術元數(shù)據(jù)是關于
26、系統(tǒng)技術細節(jié)的元數(shù)據(jù),用于開發(fā)、管理和運行業(yè)務元數(shù)據(jù) 提供面向業(yè)務的數(shù)據(jù)內容描述,使業(yè)務人員能夠理解數(shù)據(jù)含義。元數(shù)據(jù)有兩種使用方式:一種是作為數(shù)據(jù)倉庫系統(tǒng)的標準文檔,另一種是作為軟件工具的控制信息。元數(shù)據(jù)管理9商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃應支持數(shù)據(jù)倉庫的處理流程,支持開發(fā)和使用,并與各成員緊密集成。數(shù)據(jù)模型是數(shù)據(jù)倉庫的核心問題之一。傳統(tǒng)的數(shù)據(jù)模型(如實體模型和關系模型 不能有效地表示數(shù)據(jù)倉庫中的數(shù)據(jù)結構和語義,也難以支持OLAP應用。在多維建模中, 一個表和關系的模型是根據(jù)關系數(shù)據(jù)庫中的優(yōu)化決策性能的目的來建立的,與正在被建 模的商業(yè)過程成果的一種度量或度量集是相對應的。相反,傳統(tǒng)
27、的E.R建模是根據(jù)以下 目的來建立的:消除數(shù)據(jù)模型中的冗余?;謴湍承┖刑囟俗R的單個記錄。優(yōu) 化在線事務處理的性能。目前最流行的數(shù)據(jù)倉庫數(shù)據(jù)模型是多維數(shù)據(jù)模型。這種模型可以以星型模式、雪花 模式、或事實星座模式存在。星型模型:最常見的模式范式是星型模型,其中星型模型包括1一個大的包含大批數(shù)據(jù)和不含冗余的中心表(事實表。2一組小的附屬表(維表,每維一個。在星型模型中,每維只用一個表表示,每個表包含一組屬性。一個維表中的屬性可 能形成一個層次(全序或格(偏序。如下圖所示:薦 圖2.2星型模型的維表把一個事實表放在中間,周圍有各個維表與這個事實表相連。事實表有大量的行, 而維表相對來說較小,使得聯(lián)
28、接性能得到提高。大多數(shù)數(shù)據(jù)倉庫集成方案都采用這種方 式。雪花模型:雪花模型是星型模型的變種,其中某些維表是規(guī)范化的,因而把數(shù)據(jù)進一10肇慝 司n 宣凡 髑 嬲 糙 墨|綴內蒙古大學工程碩士學位論文 步分解到附加的表中。(如下圖所示月騎年存齠縫稿號 域南霹7r。 磊囂竣 | 日期舄靜 日期產(chǎn)鼴箱哮存佑地編學客,編號犖價諺價產(chǎn)品贛母 產(chǎn)品名掾 產(chǎn)品種類客戶緩弩 客戶名櫞 客_產(chǎn)所在城南 客戶所在瓣家圖2.3雪花模型例證圖當數(shù)據(jù)庫的維存儲在一系列的表中時,數(shù)據(jù)庫的結構被稱為雪花型設計因為雪花看 來就像射出光芒的星星一樣。雪花模型和星型模型的主要不同在于,雪花模型的維表可 能是規(guī)范化形式,以便減少冗余
29、。這種表易于維護,并節(jié)省存儲空間,因為當維結構作 為列包含在內時,大維表可能非常大。然而,與巨大的事實表相比,這種空間的節(jié)省可 以忽略。此外,由于執(zhí)行查詢需要更多的連接操作,雪花結構可能降低瀏覽的性能。這 樣,系統(tǒng)的性能可能相對受到影響。因此,在數(shù)據(jù)倉庫設計中,雪花模型不如星型模型 流行。 、 事實星座:復雜的應用可能需要多個事實表共享維表。這種模型可以看作星型模型 集,因此稱為星系模型,或事實星座。數(shù)據(jù)倉庫是由三個層次構成的,分別是:底層是倉庫數(shù)據(jù)庫服務器,他通常為一個關系數(shù)據(jù)庫系統(tǒng)。中間層是OLAP(聯(lián)機分析處理服務器。頂層是客戶,這一層包括查詢、報告工具、分析工具和數(shù)據(jù)挖掘工具。2.2數(shù)
30、據(jù)挖掘商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃贛姑倉瘁 目椽繁髦l翼鰱理熬蠢 特定敦撰鬃麓式 知識圖2.4數(shù)據(jù)挖掘過程圖在數(shù)據(jù)挖掘研究領域中匯聚了不同領域的研究者,尤其是數(shù)據(jù)庫、人工智能、數(shù)理 統(tǒng)計、可視化、并行計算等方面的大量學者和工程技術人員,使得它在短短幾年內,就 在理論上取得了重大進展。到目前為止,針對不同的應用需求,己研究出大量的算法、 工具及相應的評價體系。數(shù)據(jù)挖掘根據(jù)挖掘任務不同,可分為分類或預測模型發(fā)現(xiàn)、數(shù) 據(jù)總結、聚類、關聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關系或依賴模型發(fā)現(xiàn)、異常和趨勢 發(fā)現(xiàn)等等。挖掘方法一般可分為:機器學習方法、統(tǒng)計方法、神經(jīng)網(wǎng)絡方法和數(shù)據(jù)庫方法 等。機器學習方
31、法包括歸納學習方法(決策樹、規(guī)則歸納等、基于范例學習、遺傳算法 等。統(tǒng)計方法中有:回歸分析(多元回歸、自回歸等、判別分析(貝葉斯判別、費歇爾判 別、非參數(shù)判別等、聚類分析(系統(tǒng)聚類、動態(tài)聚類等、探索性分析(主元分析法、相 關分析法等等。神經(jīng)網(wǎng)絡方法又可細分為前向神經(jīng)網(wǎng)絡(BP算法等、自組織神經(jīng)網(wǎng)絡(自 組織特征映射、競爭學習等。數(shù)據(jù)庫方法主要是多維數(shù)據(jù)分析或聯(lián)機分析處理方法, 另外還有面向屬性的歸納方法等。 .12內蒙古大學工程碩士學位論文數(shù)據(jù)倉庫技術是數(shù)據(jù)庫研究領域前沿方向之一。由于數(shù)據(jù)倉庫中的數(shù)據(jù)已經(jīng)被集成 和預處理,因而具有較高的質量。將數(shù)據(jù)挖掘建立在數(shù)據(jù)倉庫之上,一方面能提高數(shù)據(jù) 倉庫
32、系統(tǒng)的決策支持能力;另一方面可以用數(shù)據(jù)倉庫及分析工具完成數(shù)據(jù)收集、變換存 儲及初步分析處理工作,從而完成數(shù)據(jù)預處理工作,甚至獲得初步的模糊知識。利用初 步的知識,發(fā)揮其潛在能力,以發(fā)現(xiàn)更具體的、更具實用價值的知識。13商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃第三章 商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)項目分析3.1商業(yè)財產(chǎn)保險公司業(yè)務流程分析現(xiàn)有保險業(yè)務流程比較復雜,與銀行等其他的金融服務衍業(yè)有很大區(qū)別。相對于銀 行而言,保險的要素繁多,比如車險,除了有投保人、被保險人、受益人、保險期限、 保費等保單基本信息以外,還有車牌號、發(fā)動機號、車架號、初始登記年月、廠牌型號、 車輛使用性質等眾多信息?,F(xiàn)有的保
33、險業(yè)務流程大致可分為“投?!?、“核保"、“收費”、“批改"、“理賠”、“付 費"和“合同終止"等大類,當前商業(yè)財產(chǎn)保險公司業(yè)務流程的一般通行做法如下。 投保如果客戶有投保意向,可由客戶或者客戶委托人(客戶自己、保險公司業(yè)務員、保 險公司營銷員或其他人填寫投保單提交給柜臺出單人員進行保單錄入。核保柜臺出單人員錄入投保單后復核并提交給分公司核保人員或總公司核保人員(根據(jù) 核保權限進行判斷進行核保,如果核保通過則由柜臺出單人員打印正式保單(車險還 需要打印車卡給客戶,如果核保不通過則告之客戶原因,由客戶決定是否改變承保條 件以滿足核保條件。收費柜臺出單人員打印
34、保單后,由柜臺出納人員打印發(fā)票并向客戶收取保費。批改如果客戶需要修改保單信息或者承保險種,由柜臺出單人員進行保單信息的批改, 也就是出具批單,批單出具后打印給客戶,需要收費或者付費的則由出納人員處理。 理賠 .客戶所保標的出險后,立即撥打全國統(tǒng)一客戶服務電話95518進行報案,由接報案 人員進行調度并安排相關查勘人員到出險現(xiàn)場進行查勘定損,如果屬于理賠范圍則在客 戶提供所需資料后進行理賠核算,核賠通過后打印出理賠計算書,并由出納將賠款劃撥 給客戶。合同終止 。保單即保險合同,保險期限到期則保險合同自動終止。當然,如果客戶申請終止合 14內蒙古大學工程碩士學位論文同或客戶沒按約定按時繳納保險費,
35、則由柜臺出單人員簽發(fā)終止責任批單,將保險合同 終止。下圖是商業(yè)財產(chǎn)保險業(yè)務的流程示意圖:圖3.1商業(yè)財產(chǎn)保險業(yè)務流程圖客戶購買一個保險服務,保險公司要給客戶一份保險單作為憑證。保險公司的業(yè)務 數(shù)據(jù)庫系統(tǒng)也同時要記錄下這個客戶的基本信息和所買保險的內容。保險業(yè)務數(shù)據(jù)庫里 記錄的信息基本上和客戶手中的保險單內容是一致的。產(chǎn)生一張保單的業(yè)務流程是:首 先客戶要填寫一張投保單,包括的內容有“投保人”、“被保人、“保險期限等基本信 息和所要保的保險項目,通過“核保"后交費就可以生效了。一張財產(chǎn)險保單的有效期 有長有短,但車險則一般都是一年??蛻舻谋kU在整個有效期內可能發(fā)生“批改"、“
36、收費、“付費"、“理賠和“合同 終止”等事件,于是保險單的內容就必須進行相應的修改,對應的業(yè)務數(shù)據(jù)庫里的數(shù)據(jù) 信息也要進行修改。保險業(yè)務數(shù)據(jù)庫的實質就是一個保險單記錄的數(shù)據(jù)庫。數(shù)據(jù)庫數(shù)據(jù) 的修改可以分成兩種,一種是更新原來記錄,另一種是增加新的記錄。日久天長數(shù)據(jù)越 來越多,形成一個數(shù)據(jù)量龐大的數(shù)據(jù)庫。以上這些業(yè)務的操作都是在各個分支公司的窗 口完成的。這些窗口使用終端來運行前臺程序通過網(wǎng)絡來和計算機中心的數(shù)據(jù)庫進行交 互操作。這些數(shù)據(jù)庫操作可以抽象成添加記錄、刪除記錄、修改記錄和查詢信息的簡單 操作。業(yè)務數(shù)據(jù)庫中的數(shù)據(jù)變化非常地頻繁,這是保險業(yè)務的特點。數(shù)據(jù)庫每天都產(chǎn)生 大量的修改信
37、息,是數(shù)據(jù)倉庫與數(shù)據(jù)挖掘實現(xiàn)的困難之處。3.2業(yè)務分析系統(tǒng)需求分析15商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃人保財險包頭市分公司業(yè)務結構大體是由車輛保險、財產(chǎn)保險、責任意外保險三大 塊構成。為了很好地體現(xiàn)這種業(yè)務構成模式,并與實際經(jīng)營決策相銜接,我所規(guī)劃設計 的業(yè)務分析系統(tǒng),也是由這三大模塊構成的。這種業(yè)務構成模式,在一般的商業(yè)財產(chǎn)保 險公司中具有普遍的意義,絕大部分商業(yè)財產(chǎn)保險公司的業(yè)務也是由這幾部分構成的。 因而對人保財險包頭分公司業(yè)務結構及業(yè)務需求的研究也是對商業(yè)財產(chǎn)保險公司地市 級分支機構業(yè)務構成與需求的普遍性研究。 i 如上所講的三大塊業(yè)務中,車輛保險業(yè)務占公司所有保費收入及業(yè)務量
38、的絕大部 分。同時,車輛保險業(yè)務屬于短期保險,具有一年一結的特點。此外,因商業(yè)財產(chǎn)保險 公司車輛保險產(chǎn)品種類繁多,并且,不同的車輛類型,不同的客戶需求,大而繁的業(yè)務 量使得車輛保險一方面具有極大的數(shù)據(jù)信息量,另一方面具有很大的個體差異性。這為 我們的業(yè)務分析系統(tǒng)提出了極高的要求,一方面要滿足海量數(shù)據(jù)的收集整理,另一方面 要保證這些數(shù)據(jù)的實時操作。鑒于車輛保險業(yè)務在各商業(yè)財產(chǎn)保險公司中都具有舉足輕 重的地位,它勢必會成為我們業(yè)務分析系統(tǒng)中最為重要的組成部分,同時也是此次業(yè)務 分析系統(tǒng)規(guī)劃和設計的難點所在。相對于車輛保險業(yè)務,財產(chǎn)保險具有單比保費金額較大,整體出單數(shù)較小的特點, 錄入過程相對簡單,
39、但在理賠時卻具有極大的復雜性。因而對此模塊的設計需要應用大 量的異類分析方法以指導決策。責任意外保險屬于短期保險。單比保費較少,數(shù)量較為繁多,一般承保期較短,對 其數(shù)據(jù)的實時操控功能及關聯(lián)分析是這個模塊的需求和特點所在。以最為復雜的車輛保險為例,根據(jù)各基層單位和車輛保險部的具體需求,我篩選出 一些有價值的基礎報表,并對報表的指標進行了統(tǒng)一的指標說明,統(tǒng)一了指標的統(tǒng)計口 徑,從而形成了數(shù)據(jù)字典。報表需求主要分為業(yè)務快報、承保統(tǒng)計、理賠統(tǒng)計和車險滿 期數(shù)據(jù)統(tǒng)計四大類,現(xiàn)羅列其中一些報表如下當月承保理賠快報1報表說明:所屬類別:業(yè)務快報定義:反映當月車險累計承保數(shù)量、理賠情況,并與上年同月作比較,管
40、理者可以 16內蒙古大學工程碩士學位論文了解車險承保理賠的同期變化程度。統(tǒng)計時間:分別以簽單時間、交費時間、賠付時間、結案時間統(tǒng)計。適用對象:分公司總經(jīng)理室成員、車險業(yè)務管理人員、支公司經(jīng)理。使用說明:該表所有指標均來自綜合統(tǒng)計系統(tǒng),屬于財務類指標,與財務統(tǒng)計口徑 葉保持一致。2指標解釋: .a.保單件數(shù):當月簽單的有效保單件數(shù)。數(shù)據(jù)來源:綜合統(tǒng)計庫,不考慮如果15天之內不打印保單、當年簽單跨年起保、補錄保單。統(tǒng)計時何為簽單日期。b.簽單數(shù)量:當月簽單的有效承保車輛數(shù)。數(shù)據(jù)來源:綜合統(tǒng)計庫,不考慮如果 15天之內不打印保單、當年簽單跨年起保、補錄保單。統(tǒng)計時間為簽單日期。c.簽單保費:當月簽單
41、的有效車輛保單的簽單保費(批改后最終保費。數(shù)據(jù)來源:綜合統(tǒng)計庫,不考慮如果不打印保單就不轉入綜合統(tǒng)計,當年簽單跨年起保、補錄保單。 統(tǒng)計時間為簽單日期。d.入帳承保數(shù)量:當月與入帳保費收入相對應的有效承保車輛數(shù)。數(shù)據(jù)來源:綜 合統(tǒng)計庫。統(tǒng)計時間為入帳日期。e.入帳保費收入:當月財務入帳保費(批改后最終保費。數(shù)據(jù)來源:綜合統(tǒng)計庫。 統(tǒng)計時間為入帳日期。f.當前月:本指標反映當前月,并定義為從當月1日至提取時點的累計數(shù)據(jù)。g.上年同月:反映上年同月數(shù)據(jù)。h.拒賠件數(shù):當月發(fā)生的拒賠案件數(shù)量。數(shù)據(jù)來源:綜合統(tǒng)計庫。統(tǒng)計時間為結 案日期。i.注銷件數(shù):當月發(fā)生的注銷案件數(shù)量。數(shù)據(jù)來源:綜合統(tǒng)計庫。統(tǒng)計
42、時間為結案 日期。j.己決賠案件數(shù):當月財務已決并按賠案號統(tǒng)計的案件數(shù)量(不包括業(yè)務己決財務 未決、拒賠和注銷案件。數(shù)據(jù)來源:綜合統(tǒng)計庫。統(tǒng)計時間為賠款支出日期。k.已決案件數(shù)(合計:包括當月財務己決、拒賠和注銷案件數(shù)量。數(shù)據(jù)來源:綜 合統(tǒng)計庫。統(tǒng)計時間為賠款支出日期或結案日期。1.己決賠付金額:當月財務己決的賠款支出金額。數(shù)據(jù)來源:綜合統(tǒng)計庫。統(tǒng)計時 間為賠款支出日期。17商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃m.月增長:月增長=當前月.上年同月。n.月增長率:月增長率=二月增長/上年同月。車險業(yè)務結構統(tǒng)計報表1報表說明所屬類別:承保統(tǒng)計定義:反映提車險、摩托車險、綜合險各自的承保情況,以
43、及綜合險各使用性質的 承保情況,為控制承保結構提供依據(jù),可按日期、險種、使用性質、車型過濾。適用對象:車險業(yè)務管理部使用說明:該表所有指標均來自綜合統(tǒng)計系統(tǒng),屬于財務類指標,與財務統(tǒng)計口徑 保持一致。2指標解釋a.簽單數(shù)量:統(tǒng)計期間內簽單的有效承保車輛數(shù)。數(shù)據(jù)來源:綜合統(tǒng)計庫,不考 慮如果15天之內不打印保單、當年簽單跨年起保、補錄保單,統(tǒng)計時間為簽單日期。 b.簽單保費:統(tǒng)計期間內簽單的有效車輛保單的簽單保費(批改后最終保費。數(shù) 據(jù)來源:綜合統(tǒng)計庫,不考慮如果不打印保單就不轉入綜合統(tǒng)計,當年簽單跨年起保、 補錄保單。統(tǒng)計時間為簽單日期。c.簽單保額:與簽單數(shù)量相對應的簽單保額。數(shù)據(jù)來源:綜合
44、統(tǒng)計庫。統(tǒng)計時間 為簽單日期。d.機動車輛綜合險合計:機動車輛綜合險合計=私人生活用車+行政用車+生產(chǎn)用車 +營運用車+租賃用車。e.機動車輛04版綜合險合計:機動車輛04版綜合險合計=私人生活用車+行政用 車+生產(chǎn)用車+營運用車+租賃用車。 f.全部車險合計:全部車險合計=機動車輛04版綜合險合計+機動車輛綜合險合計 +提車暫保險+摩托車定額保單。車險理賠各類指標統(tǒng)計基礎報表1報表說明所屬類別:理賠統(tǒng)計定義:用于了解車險理賠的各類指標。適用對象:可適用于理賠部門經(jīng)理。18內蒙古大學工程碩士學位論文使用說明:該報表屬于業(yè)務管理類報表,按分公司車險管理部門的要求運用和分析。 2指標解釋 .a.入
45、帳承保數(shù)量:指在統(tǒng)計期間內的與入帳保費收入相對應的有效承保車輛數(shù)。數(shù)據(jù)來源:綜合統(tǒng)計庫。統(tǒng)計時間為入帳時間。_:?b.立案前注銷件數(shù):報案后立案前注銷的案件數(shù)量。數(shù)據(jù)來源:車險庫。c.立案件數(shù):立案的案件數(shù)量,包括有效的案件數(shù)量和注銷、拒賠案件數(shù)量。數(shù) 據(jù)來源:綜合統(tǒng)計庫。統(tǒng)計時間為立案時間。d.立案后注銷和拒賠件數(shù):立案后注銷和拒賠的案件數(shù)量。數(shù)據(jù)來源:綜合統(tǒng)計 庫。統(tǒng)計時間為結案時間。e.賠案件數(shù):財務已決賠案件數(shù)和業(yè)務己決財務未決的賠案件數(shù)。數(shù)據(jù)來源:綜 合統(tǒng)計庫。統(tǒng)計時間為賠付時間和核賠時間。f.賠付金額:財務已決賠款金額和業(yè)務己決財務未決的賠款金額。數(shù)據(jù)來源:綜 合統(tǒng)計庫。統(tǒng)計時間為
46、賠付時間和核賠時間。g.業(yè)務未決賠案件數(shù):以立案時間統(tǒng)計的尚未結案的立案件數(shù)。數(shù)據(jù)來源:綜合 統(tǒng)計庫。統(tǒng)計時間為立案時間。h.業(yè)務未決估損金額:以立案時間統(tǒng)計的尚未結案的估損金額。數(shù)據(jù)來源:綜合 統(tǒng)計庫。統(tǒng)計時間為立案時間。i.輛均賠款=賠付金額/賠案件數(shù)。綜合險滿期賠付率1報表說明所屬類型:滿期數(shù)據(jù)統(tǒng)計定義:按使用性質、車輛種類、主要險種(車損、三者、綜合、展業(yè)方式、險種、 分支機構反映包頭分公司及各分支機構按精算方法預測的業(yè)務經(jīng)營情況。適用對象:包頭分公司及以下各分支機構統(tǒng)計時間:起保日期統(tǒng)計(滾動12個月使用說明:該報表中數(shù)據(jù)與總公司車險部的車險精算分析報告保持一致,應與財務 報表區(qū)別開
47、。2指標解釋a.車輛年數(shù):對一張保單而言,車輛年數(shù)保單在調查期間內生效的天數(shù)/365,對一 19商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃個評估期而言,車輛年數(shù)為在該評估期內所有有效保單的車輛年數(shù)之和。數(shù)據(jù)來源:綜 合統(tǒng)計庫。b.承保數(shù)量:評估期內所有起保車輛數(shù)。數(shù)據(jù)來源:綜合統(tǒng)計庫。c.簽單保費:評估期間內起保的有效車輛保單的簽單保費(批改后最終保費。數(shù) 據(jù)來源:綜合統(tǒng)計庫。d.入帳保費:評估期間內起保保單的財務入帳保費(批改后最終保費。數(shù)據(jù)來源:綜合統(tǒng)計庫。e.實收保費:評估期間內所有起保保單的入帳保費收入中實際收到現(xiàn)金或銀行存 款的保費。數(shù)據(jù)來源:綜合統(tǒng)計庫。f.已經(jīng)簽單保費=簽單保費幸車
48、輛年數(shù)。g.已經(jīng)入帳保費=入帳保費母車輛年數(shù)。h.已經(jīng)實收保費=實收保費木車輛年數(shù)。i.己決賠款:評估期間內所有起保保單的己決案件的賠款金額合計。數(shù)據(jù)來源:綜 合統(tǒng)計庫。J.已決件數(shù):評估期間內所有起保保單已決案件的立案件數(shù)合計。數(shù)據(jù)來源:綜合 統(tǒng)計庫。k.未決估損:評估期間內所有起保保單的未決案件的估損金額合計。數(shù)據(jù)來源:綜合統(tǒng)計庫。1.未決件數(shù):評估期間內所有起保保單未決案件的立案件數(shù)合計。數(shù)據(jù)來源:綜合 統(tǒng)計庫。m.最終損失:已決賠款+未決估損。11.滿期賠付率:最終損失/滿期保費。內蒙古大學工程碩士學位論文第四章商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的規(guī)劃4.1業(yè)務分析系統(tǒng)結構規(guī)劃按公司業(yè)務構成
49、模式來進行總體結構規(guī)劃,即分為:車輛保險模塊、財產(chǎn)保險模塊、 責任意外保險模塊。每個大的模塊下又分為快報主題模型、承保主題模型、理賠主題模 型等模型結構。4.2數(shù)據(jù)倉庫的搭建粒度是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別,確定粒度是數(shù) 據(jù)倉庫開發(fā)過程中需要面對的一個最重要的設計問題。如果數(shù)據(jù)倉庫的粒度確定得合 理,設計和實現(xiàn)中的其余方面就可以進行得非常順暢。相反,如果粒度確定得不合理, 就會使得其他所有方面都很難進行。同時,粒度會影響到那些依賴于從中獲得數(shù)據(jù)的數(shù) 據(jù)倉庫的所有環(huán)境。粒度影響了數(shù)據(jù)傳送到不同環(huán)境中的效率,從而決定了可以進行的 分析的類型。粒度的主要問題是使其處于一個合
50、適的級別,粒度級別既不能太高也不能 太低。粗略估算確定適當粒度級別所要做的第一件事就是對數(shù)據(jù)倉庫中將來的數(shù)據(jù)行數(shù)進行粗略 估算。其實只需要一個對數(shù)量級的估計即可。在本項目中,承保的主表大概有30萬條 記錄,承保明細表大概有60多萬條記錄,其他的表的記錄都少于30萬條,而超過10萬條記錄的表最多只有三個。另外,每年增加的數(shù)據(jù)量是承保主表增加大概10萬條, 承保明細表增加二三十萬條,其他的表增加的記錄條數(shù)都是小于lO萬條的。確定粒度級別根據(jù)以上的粗略估算,數(shù)據(jù)倉庫的數(shù)據(jù)量很大,承保的數(shù)據(jù)大概有百萬條,而理賠 的數(shù)據(jù)有幾十萬條。而業(yè)務單位的需求中又有對承保、理賠、交付費的明細查詢,鑒于 此,故決定將
51、粒度級別定為細節(jié)級即承保、理賠、交付費等數(shù)據(jù)細節(jié)與綜合統(tǒng)計系統(tǒng)一 致。數(shù)據(jù)倉庫設計始于數(shù)據(jù)模型。企業(yè)數(shù)據(jù)模型用于操作型環(huán)境設計,而修改后的企業(yè) 21商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究與規(guī)劃數(shù)據(jù)模型用于數(shù)據(jù)倉庫。但是,將企業(yè)模型用到數(shù)據(jù)倉庫中要做相當多的改動。首先要 去除純粹用于操作型環(huán)境中的數(shù)據(jù)。然后,在企業(yè)數(shù)據(jù)模型的關鍵字結構中增加時間元 素。將導出數(shù)據(jù)加到企業(yè)數(shù)據(jù)模型中,這些導出數(shù)據(jù)作為公用并只經(jīng)過一次計算,而不 是重復計算。最后,在數(shù)據(jù)倉庫中將操作型系統(tǒng)中的數(shù)據(jù)關系轉變?yōu)椤叭斯りP系"???以說企業(yè)數(shù)據(jù)模型是操作型數(shù)據(jù)模型與數(shù)據(jù)倉庫數(shù)據(jù)模型的共同起源,但同時卻又各不 相同。數(shù)據(jù)倉
52、庫的數(shù)據(jù)建??梢苑譃槿齻€層次高層建模圖,實體關系層、中間層建模,數(shù) 據(jù)項集、底層建模物理模型,換一種比較通俗的說法就是概念模型設計、邏輯模型設計 和物理模型設計。在數(shù)據(jù)倉庫建模中,就是分概念模型設計、邏輯模型設計和物理模型 設計三步進行設計的。概念模型設計概念模型是客觀世界到計算機世界的一個中間層次,概念模型的設計要求創(chuàng)建一種 基于對象、代表實際業(yè)務的模型,以實體和關系為特征。在本項目中,由于承保和理賠 是財產(chǎn)保險公司的兩大業(yè)務流程,加上對車險的精算分析,組成了三個主要分析的對象。 如下圖所示,承保與理賠是一對多的關系,因為一筆保單可以有多個賠案(當然也可能 沒有,但一個賠案肯定只對應一筆保單
53、。而在承保方面,不僅有保單的基本信息,還 有批改信息、核保信息和財務交費信息。在理賠方面,不僅有案件的基本信息(立案信 息,還有報案信息、賠案信息和財務付費信息。就保險精算而言,我們采用了滾動12個月進行分析的方法。保險精算以承保中的保單為主線。包括承保信息和理賠信息。具 體來說,車險精算主要目的是得到車險的滿期賠付率,而滿期賠付率的計算公式為:滿 期賠付率=(已決賠款+未決賠款/已經(jīng)入帳保費,而已經(jīng)入帳保費不是指全額入帳保 費,而是按比例進行計算的,其計算公式為:已經(jīng)入帳保費=(保單的保險時間在統(tǒng)計 的12個月內的總天數(shù)/統(tǒng)計的12個月的總天數(shù)牽全額入帳保費。內蒙古大學工程碩士學位論文圖4.
54、1承保和理賠ER圖邏輯模型設計概念模型建好之后,就要建立下一層即邏輯模型。邏輯建模是數(shù)據(jù)倉庫實施中的一一:?個重要環(huán)節(jié),它對系統(tǒng)的物理實施有著重要的指導作用。在進行數(shù)據(jù)倉庫的邏輯模型設 計時,涉及到多個方面,在本系統(tǒng)中主要是分析主題域和構建星型模型。1分析主題域在概念模型設計中己經(jīng)確定了基本主題域,承保主題域、理賠主題域和精算主題域。 由于理賠事件的發(fā)生是基于在承保事件的基礎上,即只有承保了的客戶才可能發(fā)生理賠 事件,而精算也是以承保為主線,在保單的基礎上加上其相應的理賠信息。所以說承保 主題域是保險公司的最基本的業(yè)務對象,又是進行決策分析最重要的分析領域。而在我公司,針對承保方面的分析是很多
55、的.包括保單、批改、核保和交費。由于 保單與批改、核保和交費都是一對多的關系,且每一項的分析都很重要,因而將承保主 題域拆分為保單、批改、核保和交費四個新主題域。由于對保單的分析不但涉及到保單 的基本信息,而且還涉及到保單的明細信息(即每一個明細險種的保額、保費等,而 保單的基本信息與保單的明細信息也是一對多的關系,故將保單主題域拆分為保單主題 域和保單明細主題域。通過分析,承保主題域拆分為:保單主題域、保單明細主題域、 批改主題域、核保主題域和交費主題域,由于核保的大部分信息在內蒙古分公司,包頭 分公司本地的信息不能滿足需求,故暫時在本系統(tǒng)中不考慮核保主題域。在理賠方面,是以立案為主線,包括
56、立案、報案、賠案和付費。由于賠案與付費是 一對一的關系,故將付費合并到賠案中。立案與報案是一對一的關系,故仍然將報案與 立案分開。和保單相似,我們不僅要分析賠案的總體信息,還要分析賠案的明細信息, 而賠案的總體信息與賠案的明細信息是一對多的關系,故將賠案主題域拆分為賠案主題 域和賠案明細主題域。通過分析,理賠主題域拆分為:立案主題域、報案主題域、賠案 主題域和賠案明細主題域。在精算方面,是以保單為主線,一條記錄反映的是一張保單的總體的承保和理賠情 況,故精算主題域不需要拆分。2構建星型模型設計數(shù)據(jù)倉庫的邏輯模型一般采用星型建模技術。與傳統(tǒng)的數(shù)據(jù)庫邏輯模型設計方商業(yè)財產(chǎn)保險公司業(yè)務分析系統(tǒng)的研究
57、與規(guī)劃法相比,星型建模技術更適合海量數(shù)據(jù)查詢情況,其具有以下優(yōu)點:a.業(yè)務人員容易理解。b.性能a復雜查詢性能好(80%.90%的分析型查詢b多層次的匯總g.靈活性a支持設計和決策b易于管理和變化d.多層匯總a創(chuàng)建匯總表b被大多數(shù)前端展現(xiàn)工具支持e.減少因內連接、外連接、笛卡爾積引起的錯誤根據(jù)本系統(tǒng)數(shù)據(jù)量比較大、表關聯(lián)多(觀察的角度比較多的情況,我們采用數(shù)據(jù) 倉庫設計中最常用的星型結構進行建模。對于精算主題域,我們主要關心的是已經(jīng)入帳 保費、賠款金額、未決金額和其他一些指標,可以通過以上指標計算出滿期賠付率,它 可從多個方面對保險的精算情況進行分析。根據(jù)確認的主題域,對每一個主題域都建立了星型模式結構,其結構與精算邏輯結 構相似,在這里不再贅述。物理模型設計物理模型是從邏輯模型創(chuàng)建而來的,建立物理模型只需擴展邏輯模型,使模型中包 含有關鍵字和物理特性就可以實現(xiàn)。這時,物理模型看上去像一系列表,這些表有時被 稱作關系表。雖然說將這些表直接用于物理數(shù)據(jù)庫設計的想法很誘人,但還要做最后一個設計步 驟,這就是考慮性能特性,需要將其他的許多物理設計工作加進這項設計。其他的這些 物理設計因素的概要內容有數(shù)據(jù)數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 員工職責課件
- 高考物理之帶電粒子在電場、磁場中的運動試題詳解
- 倉庫交接管理培訓
- 倉存管理培訓
- 員工日常行為培訓
- 倉儲現(xiàn)場儲備干部培訓
- 員工情緒與壓力管理培訓
- 基金行業(yè)培訓
- 施工現(xiàn)場質量管理各項制度
- 酒店地毯銷售獎勵合作協(xié)議
- (2025)事業(yè)單位考試(面試)試題與答案
- CNAS-GC25-2023 服務認證機構認證業(yè)務范圍及能力管理實施指南
- 入伍智力測試題及答案
- 竣工驗收方案模板
- 企業(yè)安全生產(chǎn)內業(yè)資料全套范本
- 安全生產(chǎn)標準化與安全文化建設的關系
- DL-T5054-2016火力發(fā)電廠汽水管道設計規(guī)范
- 耳部刮痧治療
- 神經(jīng)外科介入神經(jīng)放射治療技術操作規(guī)范2023版
- 多模態(tài)數(shù)據(jù)的聯(lián)合增強技術
- 濱海事業(yè)單位招聘2023年考試真題及答案解析1
評論
0/150
提交評論