版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于數(shù)據(jù)挖掘技術(shù)的保險(xiǎn)行業(yè)決策分析研究摘要:本文針對(duì)目前保險(xiǎn)行業(yè)信息管理的現(xiàn)狀,提出數(shù)據(jù)挖掘技術(shù)對(duì)保險(xiǎn)行業(yè)的重大影響,簡(jiǎn)要說明了“保險(xiǎn)行業(yè)決策系統(tǒng)v1.0工程及其對(duì)挖掘算法的改良等。并通過實(shí)驗(yàn)論證了改良算法的優(yōu)勢(shì),通過分析結(jié)果展示了數(shù)據(jù)挖掘技術(shù)能使保險(xiǎn)行業(yè)有效地利用現(xiàn)有數(shù)據(jù)實(shí)現(xiàn)經(jīng)營(yíng)目的,預(yù)測(cè)保險(xiǎn)業(yè)的開展趨勢(shì),進(jìn)而在劇烈的競(jìng)爭(zhēng)中贏得先機(jī)。關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)分析;apriri1引言隨著數(shù)據(jù)庫(kù)技術(shù)的迅速開展以及數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用,各行各業(yè)積累的數(shù)據(jù)越來(lái)越多。日益劇增的數(shù)據(jù)背后隱藏著許多重要的信息,人們希望可以對(duì)其進(jìn)展更高層次的分析,以便更好地利用這些數(shù)據(jù)。目前的數(shù)據(jù)庫(kù)系統(tǒng)可以高效地實(shí)現(xiàn)數(shù)據(jù)
2、的錄入、查詢、統(tǒng)計(jì)等功能,但無(wú)法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)那么,無(wú)法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測(cè)將來(lái)的開展趨勢(shì)。缺乏挖掘數(shù)據(jù)背后隱藏的知識(shí)手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識(shí)貧乏的現(xiàn)象。隨著計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)的開展,獲得某一行業(yè)有關(guān)資料已實(shí)在可行。而對(duì)于數(shù)量大、涉及面廣的數(shù)據(jù),依靠傳統(tǒng)的簡(jiǎn)單匯總、按指定形式去分析的統(tǒng)計(jì)方法無(wú)法完成對(duì)數(shù)據(jù)的分析。因此,一種智能化的信息分析技術(shù)“數(shù)據(jù)挖掘(dataining)應(yīng)運(yùn)而生。數(shù)據(jù)挖掘(dataining)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。通過挖掘數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的大量數(shù)據(jù),從中發(fā)現(xiàn)有意義的新
3、的關(guān)聯(lián)形式和趨勢(shì)的過程。數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)展抽娶轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。從而使企業(yè)在劇烈的市場(chǎng)競(jìng)爭(zhēng)中獲得先機(jī)。就保險(xiǎn)行業(yè)而言,目前具有廣闊的市場(chǎng)需求。2工程說明本工程開發(fā)了“保險(xiǎn)行業(yè)決策系統(tǒng)v1.0。本系統(tǒng)操作主界面利用asp編程實(shí)現(xiàn):數(shù)據(jù)預(yù)處理、客戶購(gòu)置險(xiǎn)種分析、客戶購(gòu)置習(xí)慣分析、分析結(jié)果輸出等功能;后臺(tái)數(shù)據(jù)庫(kù)利用sqlserver2022網(wǎng)絡(luò)數(shù)據(jù)庫(kù)實(shí)現(xiàn);挖掘工具采用spssleentine11.0;在研究實(shí)驗(yàn)階段,針對(duì)apriri算法存在的“存儲(chǔ)復(fù)雜度及“大量冗余規(guī)那么兩大缺點(diǎn)進(jìn)展了算法改良,通過利用一
4、個(gè)形式樹構(gòu)造來(lái)降低apriri算法的存儲(chǔ)復(fù)雜度,并同時(shí)減少冗余規(guī)那么的出現(xiàn)。本系統(tǒng)共分:數(shù)據(jù)預(yù)處理、客戶購(gòu)置險(xiǎn)種分析、客戶購(gòu)置習(xí)慣分析、分析結(jié)果輸出等主要功能模塊。(1)“數(shù)據(jù)預(yù)處理模塊包括:上傳、數(shù)據(jù)平臺(tái)、數(shù)據(jù)處理、統(tǒng)計(jì)、生成數(shù)據(jù)集等功能。上傳:可完成保險(xiǎn)總公司下設(shè)所有分公司數(shù)據(jù)的上傳。數(shù)據(jù)平臺(tái):在數(shù)據(jù)上傳前允許對(duì)數(shù)據(jù)平臺(tái)進(jìn)展選擇。數(shù)據(jù)處理:對(duì)數(shù)據(jù)進(jìn)展清理、格式轉(zhuǎn)換等操作。統(tǒng)計(jì):對(duì)經(jīng)過預(yù)處理的數(shù)據(jù)進(jìn)展分析,提取有效性數(shù)據(jù)。生成數(shù)據(jù)集:將統(tǒng)計(jì)過程提取的有效數(shù)據(jù)生成數(shù)據(jù)集,為數(shù)據(jù)挖掘提供較高質(zhì)量的數(shù)據(jù)源。(2)“客戶購(gòu)置險(xiǎn)種分析模塊包括:數(shù)據(jù)導(dǎo)入、參數(shù)設(shè)定、結(jié)果分析等功能。數(shù)據(jù)導(dǎo)入:在此操作界面
5、上,可通過選擇不同數(shù)據(jù)平臺(tái)將經(jīng)過“數(shù)據(jù)預(yù)處理生成的數(shù)據(jù)集分別導(dǎo)入。參數(shù)設(shè)定:在此操作界面上設(shè)定“支持度“置信度等參數(shù),對(duì)有效數(shù)據(jù)集中有分析價(jià)值的數(shù)據(jù)記錄范圍進(jìn)展篩眩結(jié)果分析:在此操作界面上可將“客戶購(gòu)置險(xiǎn)種分析的最終分析結(jié)果以“報(bào)表、“圖表形式展示,此分析結(jié)果為行業(yè)提供了“同一客戶購(gòu)置本公司多種(次)保險(xiǎn)的客戶信息,進(jìn)而為行業(yè)提供了“可爭(zhēng)取客戶的決策根據(jù)。(3)“客戶購(gòu)置習(xí)慣分析模塊包括:數(shù)據(jù)導(dǎo)入、參數(shù)設(shè)定、結(jié)果分析等功能。數(shù)據(jù)導(dǎo)入:此操作同(2)“客戶購(gòu)置險(xiǎn)種分析模塊中的“數(shù)據(jù)導(dǎo)入。參數(shù)設(shè)定:在此分別設(shè)定“輸入?yún)?shù)(包括:年齡、性別、職業(yè)等客戶根本信息)及“輸出參數(shù)(客戶購(gòu)置的險(xiǎn)種信息)。結(jié)
6、果分析:通過此操作界面可展示出客戶購(gòu)置習(xí)慣的分析結(jié)果,進(jìn)而為行業(yè)提供了“可保持客戶的決策根據(jù)。(4)“分析結(jié)果輸出模塊包括:“客戶購(gòu)置險(xiǎn)種分析“客戶購(gòu)置習(xí)慣分析等分析結(jié)果的打印輸出功能。3工程中改良的快速算法由于apriri算法存在時(shí)間空間復(fù)雜度高及產(chǎn)生大量冗余規(guī)那么兩大缺陷。因此本工程通過利用一個(gè)形式樹構(gòu)造來(lái)降低apriri算法的存儲(chǔ)復(fù)雜度,并同時(shí)減少冗余規(guī)那么的出現(xiàn)。3.1一個(gè)形式樹的構(gòu)造rt是一個(gè)標(biāo)為“null的根結(jié)點(diǎn),rt以下是作為根結(jié)點(diǎn)的孩子的工程前綴子樹集合,以及工程頭表組成;樹中的每一結(jié)點(diǎn)包含四個(gè)域user_id,unt,nde_link,nde_next。其中,user_id為
7、user的標(biāo)記(唯一標(biāo)識(shí)一個(gè)user),unt為該父結(jié)點(diǎn)到達(dá)該結(jié)點(diǎn)的途徑的數(shù)目,nde_link指向樹中具有一樣的user_id的下一個(gè)結(jié)點(diǎn)的下一結(jié)點(diǎn),當(dāng)下一個(gè)結(jié)點(diǎn)不存在時(shí),nde_link為null,nde_next指向樹中其子結(jié)點(diǎn);工程頭表的每一表項(xiàng)包含三個(gè)域:user_id,unt,headfnde,user_id與樹中的定義一樣,unt為樹中所有一樣user_id之和,headfnde指向樹中具有一樣user_id值的首結(jié)點(diǎn)的指針。3.2建立形式樹算法如下:設(shè)事務(wù)數(shù)據(jù)庫(kù)為a,其中的一個(gè)項(xiàng)集為ai。算法:patterntree(tree,p),構(gòu)造形式樹輸入:用戶事務(wù)數(shù)據(jù)庫(kù)a輸出:用戶形
8、式樹predurepatterntree(t,p)reate_tree(t);/創(chuàng)立pattern-tree的根節(jié)點(diǎn),以“null標(biāo)記t=t;/t為當(dāng)前結(jié)點(diǎn)hileanulld讀入一個(gè)事務(wù)數(shù)據(jù)庫(kù)項(xiàng)集aihilep!=nulldifp.user_id=t的祖先n.user_idthenn.unt=n.unt+l;t=n;elseifp.user_id=t的孩子.user_idthen.unt=.unt+l;t=;elseinsert_patterntree(t,p);/把p作為新結(jié)點(diǎn)插入樹中,作為當(dāng)前結(jié)點(diǎn)的孩子結(jié)點(diǎn)p=p.next;3.3對(duì)形式樹進(jìn)展剪枝形式樹建立后,可能存在大量的冗余的分枝,為
9、了保證數(shù)據(jù)挖掘結(jié)果不被這些冗余分枝產(chǎn)生的噪聲所影響,因此需要對(duì)樹進(jìn)展剪枝,剔除噪聲信息。算法:spt(tree,a),通過調(diào)用此算法對(duì)形式樹進(jìn)展剪枝/spt為支持度形式樹,即supprtedaesspatterntree;a為工程頭表輸入:形式樹patterntree,in_sup(形式樹的最小支持度)輸出:經(jīng)過修剪后的支持度形式樹spt,形式b=bi|i=1,2,3nspt(tree,a)i=1;hile(ai!=null)/為工程頭表的某一項(xiàng)if(ai.unt=in_sup)then形式bi=ai.headfnde;p=ai.headfnde;/p指向ai在形式樹中的位置hile(p!=n
10、ullandai.unt=in_sup)查找p的前綴基,將p的前綴基和p連接,構(gòu)成形式b;if(bi.unt=in_sup)then/bi.unt為形式b中p與p的前綴基中的最小計(jì)數(shù)在形式bi中保存p及其前綴基;bi=bi.nde_linkelse根據(jù)形式b中的p及其前綴基刪除patterntree中的相應(yīng)節(jié)點(diǎn),重構(gòu)子節(jié)點(diǎn)與父節(jié)點(diǎn),同時(shí)修改工程頭表中的ai;p=p.nde_next/p指向在形式樹中的下一個(gè)位置;else修改工程頭結(jié)點(diǎn)的ai值;刪除形式樹中相應(yīng)的節(jié)點(diǎn)及其前綴基,重構(gòu)父子節(jié)點(diǎn);i+;通過形式樹的建立可以防止屢次掃描事務(wù)數(shù)據(jù)庫(kù);同時(shí)利用unt域有效的保存了項(xiàng)集的數(shù)目,防止大量產(chǎn)生頻
11、繁項(xiàng)集,對(duì)于減小空間時(shí)間復(fù)雜度起到了一定的作用。通過樹形構(gòu)造可以防止產(chǎn)生大量冗余規(guī)那么。通過對(duì)形式樹的剪枝,可以減除在形式樹產(chǎn)生過程中產(chǎn)生的大量冗余分枝,起到了減小空間復(fù)雜度的作用,同時(shí)可以利用輸出形式b產(chǎn)生規(guī)那么,防止了多項(xiàng)集的頻繁出現(xiàn),減小了時(shí)間復(fù)雜度。4完畢語(yǔ)本工程中通過形式樹構(gòu)造改良了apriri算法,彌補(bǔ)了apriri算法存在的缺陷。此種方法既可以對(duì)apriri算法從時(shí)間復(fù)雜度和空間復(fù)雜度上進(jìn)展改良,同時(shí)又防止了中間規(guī)那么的產(chǎn)生。本研究說明,通過利用一個(gè)形式樹構(gòu)造來(lái)降低apriri算法的存儲(chǔ)復(fù)雜度,并同時(shí)減少冗余規(guī)那么的出現(xiàn),這對(duì)于apriri算法的改良是一種有效的措施。參考文獻(xiàn)1鄧納姆.數(shù)據(jù)挖掘教程.郭崇慧,田鳳占,靳曉明,等譯.北京:清華大學(xué)出版社,2022.2蘇新寧,楊建林,江念南,等.數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘.北京:清華大學(xué)出版社,2022.3gals,kantrpb,shapirab.seurityinfratisandterrris:p
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)(商務(wù)軟件研發(fā))試題及答案
- 2026年酒店運(yùn)營(yíng)(運(yùn)營(yíng)管理)試題及答案
- 2026年圣斗士星矢玩具用品營(yíng)銷(營(yíng)銷規(guī)范)試題及答案
- 2025年大學(xué)編輯出版學(xué)(出版營(yíng)銷)試題及答案
- 2025年高職汽車維修(發(fā)動(dòng)機(jī)故障排除)試題及答案
- 2025年高職第二學(xué)年(物業(yè)安全管理)安全防范階段測(cè)試題及答案
- 2025年中職冷鏈物流服務(wù)與管理(冷鏈保鮮技術(shù))試題及答案
- 2025年大學(xué)自動(dòng)化應(yīng)用(自動(dòng)化應(yīng)用案例)試題及答案
- 2025年高職第二學(xué)年(園林工程技術(shù))園林工程監(jiān)理試題及答案
- 2025年高職網(wǎng)絡(luò)信息安全(病毒防護(hù)技術(shù))試題及答案
- 2026年教育平臺(tái)資源輸出協(xié)議
- 人力資源部2025年度工作總結(jié)與2026年度戰(zhàn)略規(guī)劃
- 2025年安徽理工大學(xué)馬克思主義基本原理概論期末考試參考題庫(kù)
- 機(jī)械工程師職稱評(píng)定技術(shù)報(bào)告模板
- 檔案移交數(shù)字化建設(shè)規(guī)劃
- 孤獨(dú)癥個(gè)案護(hù)理
- 高職汽車維修專業(yè)培訓(xùn)教材
- Starter-軟件簡(jiǎn)易使用手冊(cè)
- RFJ01-2008 人民防空工程防護(hù)設(shè)備選用圖集
- GB/T 27818-2011化學(xué)品皮膚吸收體外試驗(yàn)方法
- FZ/T 80004-2014服裝成品出廠檢驗(yàn)規(guī)則
評(píng)論
0/150
提交評(píng)論