5種數(shù)據(jù)挖掘工具分析比較_第1頁(yè)
5種數(shù)據(jù)挖掘工具分析比較_第2頁(yè)
5種數(shù)據(jù)挖掘工具分析比較_第3頁(yè)
5種數(shù)據(jù)挖掘工具分析比較_第4頁(yè)
5種數(shù)據(jù)挖掘工具分析比較_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)挖掘工具調(diào)查與研究姓名:學(xué)號(hào):5種數(shù)據(jù)挖掘工具分別為:1、IntelligentMiner2、SASEnterpreiseMiner3、SPSSClementine4、馬克威分析系統(tǒng)5、GDMIntelligentMiner一、綜述:RM的ExterpriseMiner簡(jiǎn)單易用,是理解數(shù)據(jù)挖掘的好的開(kāi)始。能處理大數(shù)據(jù)量的挖掘,功能一般,可能僅滿(mǎn)足要求.沒(méi)有數(shù)據(jù)探索功能。與其他軟件接口差,只能用DB2,連接DB2以外的數(shù)據(jù)庫(kù)時(shí),如Oracle,SAS,SPSS需要安裝DataJoiner作為中間軟件。難以發(fā)布。結(jié)果美觀,但同樣不好理解。二、基本內(nèi)容:一個(gè)挖掘項(xiàng)目可有多個(gè)發(fā)掘庫(kù)組成;每個(gè)發(fā)掘庫(kù)包含多個(gè)對(duì)象和函數(shù)對(duì)象:數(shù)據(jù):由函數(shù)使用的輸入數(shù)據(jù)的名稱(chēng)和位置。離散化:將記錄分至明顯可識(shí)別的組中的分發(fā)操作。名稱(chēng)映射:映射至類(lèi)別字段名的值的規(guī)范。結(jié)果:由函數(shù)創(chuàng)建的結(jié)果的名稱(chēng)和位置。分類(lèi):在一個(gè)項(xiàng)目的不同類(lèi)別之間的關(guān)聯(lián)層次或點(diǎn)陣。值映射:映射至其它值的規(guī)范。函數(shù):發(fā)掘:單個(gè)發(fā)掘函數(shù)的參數(shù)。預(yù)處理:單個(gè)預(yù)處理函數(shù)的參數(shù)。序列:可以在指定序列中啟動(dòng)的幾個(gè)函數(shù)的規(guī)范。統(tǒng)計(jì):單個(gè)統(tǒng)計(jì)函數(shù)的參數(shù)。統(tǒng)計(jì)方法和挖掘算法:?jiǎn)巫兞壳€(xiàn),雙變量統(tǒng)計(jì),線(xiàn)性回歸,因子分析,主變量分析,分類(lèi),分群,關(guān)聯(lián),相似序列,序列模式,預(yù)測(cè)等。處理的數(shù)據(jù)類(lèi)型:結(jié)構(gòu)化數(shù)據(jù)(如:數(shù)據(jù)庫(kù)表,數(shù)據(jù)庫(kù)視圖,平面文件)和半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)(如:顧客信件,在線(xiàn)服務(wù),傳真,電子郵件,網(wǎng)頁(yè)等)。架構(gòu):它采取客戶(hù)/服務(wù)器(C/S)架構(gòu),并且它的API提供了C++類(lèi)和方法IntelligentMiner通過(guò)其獨(dú)有的世界領(lǐng)先技術(shù),例如自動(dòng)生成典型數(shù)據(jù)集、發(fā)現(xiàn)關(guān)聯(lián)、發(fā)現(xiàn)序列規(guī)律、概念性分類(lèi)和可視化呈現(xiàn),可以自動(dòng)實(shí)現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘和結(jié)果呈現(xiàn)這一整套數(shù)據(jù)挖掘操作。若有必要,對(duì)結(jié)果數(shù)據(jù)集還可以重復(fù)這一過(guò)程,直至得到滿(mǎn)意結(jié)果為止。三、現(xiàn)狀:現(xiàn)在,IBM的IntelligentMiner已形成系列,它幫助用戶(hù)從企業(yè)數(shù)據(jù)資產(chǎn)中識(shí)別和提煉有價(jià)值的信息。它包括分析軟件工具IntelligentMinerforData和RMIntelligentMinerforText,幫助企業(yè)選取以前未知的、有效的、可行的業(yè)務(wù)知識(shí)如客戶(hù)購(gòu)買(mǎi)行為,隱藏的關(guān)系和新的趨勢(shì),數(shù)據(jù)來(lái)源可以是大型數(shù)據(jù)庫(kù)和企業(yè)內(nèi)部或Internet上的文本數(shù)據(jù)源。然后公司可以應(yīng)用這些信息進(jìn)行更好、更準(zhǔn)確的決策,獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。四、挖掘案例:(客戶(hù)細(xì)分)商業(yè)需求::客戶(hù)細(xì)分?jǐn)?shù)據(jù)理解:根據(jù)用戶(hù)基本信息(實(shí)際上還包括客戶(hù)消費(fèi)行為,人口統(tǒng)計(jì)信息等,本示例為簡(jiǎn)單起見(jiàn),只在這個(gè)表的數(shù)據(jù)基礎(chǔ)上進(jìn)行挖掘)進(jìn)行客戶(hù)細(xì)分?jǐn)?shù)據(jù)準(zhǔn)備:建模:選擇挖掘模型(比如是分群,還是分類(lèi))確定模型輸入,需要做的處理,結(jié)果分析選擇模型輸入字段:挖掘模型選擇:神經(jīng)分群發(fā)掘函數(shù)使用了一個(gè)Kohonen特征映射神經(jīng)網(wǎng)絡(luò)。Kohonen特征映射使用一個(gè)稱(chēng)作自組織的進(jìn)程來(lái)將相似的輸入記錄組合在一起。您可以指定群集的數(shù)目和遍數(shù)。這些參數(shù)控制進(jìn)程時(shí)間和將數(shù)據(jù)記錄分配到群集時(shí)使用的粒度程度。分群的主任務(wù)是為每個(gè)群集查找中心。此中心也稱(chēng)為稱(chēng)為原型。對(duì)于每個(gè)在輸入數(shù)據(jù)中的每個(gè)記錄,神經(jīng)分群發(fā)掘函數(shù)計(jì)算和記錄計(jì)分最近的群集原型。每個(gè)數(shù)據(jù)記錄的計(jì)分是用到群集原型的歐幾里得距離表示的。計(jì)分越靠近0,與群集原型的相似性程度就越高。計(jì)分越高,記錄與群集原型就越不相似。輸入數(shù)據(jù)的每個(gè)遍歷,中心被調(diào)整來(lái)達(dá)到更好的整個(gè)分群模型質(zhì)量。在發(fā)掘函數(shù)運(yùn)行時(shí),進(jìn)度指示器顯示每次遍歷的質(zhì)量改進(jìn)狀況。4,建模:選擇模型:指定輸入數(shù)據(jù):

選擇分群方式:分群模型設(shè)置概要:5.運(yùn)行模型:點(diǎn)擊藍(lán)色按鈕運(yùn)行模型,運(yùn)行模型進(jìn)程:6.模型結(jié)果分析:運(yùn)行結(jié)果(群):customeiclusterPAYEDMONEY=UNPAYFEEAVGPAYEDMONEY運(yùn)行結(jié)果,統(tǒng)計(jì):參考字段特征(對(duì)于所有字段類(lèi)型),,三.世土土[]=樸充,沽=類(lèi)別,:D=連歐伯,面=布地?cái)恐担?:'It;Mi!!-林i「W-SJ?:'It;Mi!!-】們3朋弱2]0.0169.22998212269.276IEICLS4:■,23]QQ.DD]2593]]2.5皿44n2.537.7D.2100,001LACC_LDBfiAMD.IDCOnSUHE.LEVELGEWDEREREi3IOn_ODDE6OMLinEZDURATICi^?PA'fEIi-ftOIffiY3WAT_FEEg_P£TEDJKWT;三字[省可計(jì),:??、."一虹訥言切」:標(biāo)詛景小值雖大值平均值標(biāo)誰(shuí)IS左2ERAm:i_ID22S2L.LS332.575D33COJflS亟LEVEL16隊(duì)3259LL633624REHDER0I0.L&160-3959126O1ILinE_DURATI0rfi706L0L294HO.3577PATED_ff:;'IiETU550艮27922,6533BUnFAT_FEE□L443.D23.824192T.6099!:AKPAYED船NEYU0UJ從上面兩個(gè)圖中我們可以看出一些有意義的分群,根據(jù)consume_level和online_duration分群有一定意義。而比如用gender進(jìn)行的分群我們可以直接觀察出來(lái),意義不大,只有兩個(gè)大類(lèi),可以直觀地看出男女比例:consume_level(消費(fèi)層次)的群特征信息:可以看出在第2、3類(lèi)消費(fèi)層次占的比重較大。

群集字段特征(僅對(duì)于雌_字段):3COtlSUfE^LETEL132.3269折淮曜0.6B362字段詳細(xì)侑息:三段巨:二工花一二-二愁九."K*.?*L[草T匚":5兀:SCC00.380D2座,270DL?^::6DC.\:a00.HOD19.660D19.66D000.D00000.000D407.3100[7.3:::x.:XCx.nt:在線(xiàn)通話(huà)時(shí)長(zhǎng)的一點(diǎn)分析:-上葬-上葬D0:].:)[::K:)[D煩偵5工心工I5JIXl][13.250D頊〔55可W:項(xiàng)X:::.!)[::J:X-■?:)[上如二臼[:碩:J:X頊:H二頹DUffl15*〕〔:].:]0[::.[:][■ft:頃二以件:頒從上面圖中可以看出,大部分客戶(hù)每一個(gè)月消費(fèi)是50元以下的。50-200各區(qū)間逐步遞減;而一個(gè)月消費(fèi)300以上的,也從3%,8%,12%逐漸遞增的態(tài)勢(shì)。挖掘的這些消費(fèi)分群信息,對(duì)有針對(duì)性的營(yíng)銷(xiāo),提前對(duì)客戶(hù)進(jìn)行細(xì)分是很有意義的。6.保存調(diào)出模型:客戶(hù)分類(lèi)挖掘示例(待續(xù)):采用一樣的數(shù)據(jù),對(duì)客戶(hù)消費(fèi)水平進(jìn)行分類(lèi)預(yù)測(cè)(consume_level)混淆矩陣:分類(lèi)百分率:現(xiàn)23混淆矩陣:分類(lèi)百分率:現(xiàn)23412579?1134003理115531550420122588013270005028&0600110SASEnterpriseMiner一、綜述:SAS完仝以統(tǒng)計(jì)理論為基礎(chǔ),功能強(qiáng)大,有完備的數(shù)據(jù)探索功能。但難以掌握,要求是高級(jí)統(tǒng)計(jì)分析專(zhuān)業(yè)人員.結(jié)果難以理解。價(jià)格也極其昂貴,而且是租賃模式。二、基本內(nèi)容:支持SAS統(tǒng)計(jì)模塊,使之具有杰出的力量和影響,它還通過(guò)大量數(shù)據(jù)挖掘算法增強(qiáng)了那些模塊。SAS使用它的SEMMA方法學(xué)以提供一個(gè)能支持包括關(guān)聯(lián)、聚類(lèi)、決策樹(shù)、神經(jīng)元網(wǎng)絡(luò)和統(tǒng)計(jì)回歸在內(nèi)的廣闊范圍的模型數(shù)據(jù)挖掘工具。SASEntelpriseMiner設(shè)計(jì)為被初學(xué)者和有經(jīng)驗(yàn)的用戶(hù)使用。它的GUI界面是數(shù)據(jù)流驅(qū)動(dòng)的,且它易于理解和使用。它允許一個(gè)分析者通過(guò)構(gòu)造一個(gè)使用鏈接連接數(shù)據(jù)結(jié)點(diǎn)和處理結(jié)點(diǎn)的可視數(shù)據(jù)流圖建造一個(gè)模型。另外,此界面允許把處理結(jié)點(diǎn)直接插入到數(shù)據(jù)流中。由于支持多種模型,所以EnterpriseMiner允許用戶(hù)比較(評(píng)估)不同模型并利用評(píng)估結(jié)點(diǎn)選擇最適合的。另外,EnterpriseMiner提供了一個(gè)能產(chǎn)生被任何SAS應(yīng)用程序所訪(fǎng)問(wèn)的評(píng)分模型的評(píng)分結(jié)點(diǎn)。三、用戶(hù)配置:SASEnterpriseMiner能運(yùn)行在客戶(hù)/服務(wù)器上或(計(jì)算機(jī)的外圍設(shè)備)能獨(dú)立運(yùn)行的配置上。此外,在客戶(hù)/服務(wù)器模式下,EnterpriseMiner允許把服務(wù)器配置成一個(gè)數(shù)據(jù)服務(wù)器、計(jì)算服務(wù)器或兩者的綜合。EntepnseMiner被設(shè)計(jì)成能在所有SAS支持的平臺(tái)上運(yùn)行。該結(jié)構(gòu)支持胖客戶(hù)機(jī)配置(要求客戶(hù)機(jī)上的完全SAS許可證)以及瘦客戶(hù)機(jī)(瀏覽器)版本。四、數(shù)據(jù)挖掘技術(shù)、算法和應(yīng)用程序:SASEntelpriseMiner支持關(guān)聯(lián)、聚類(lèi)、決策樹(shù)、神經(jīng)元網(wǎng)絡(luò)和經(jīng)典的統(tǒng)計(jì)回歸技術(shù)。五、前景:它在統(tǒng)計(jì)分析軟件上的豐富經(jīng)驗(yàn),所以SAS開(kāi)發(fā)出了一個(gè)全功能、易于使用、可靠和易于管理的系統(tǒng)。模型選項(xiàng)和算法所覆蓋的廣闊范圍、設(shè)計(jì)良好的用戶(hù)界面、現(xiàn)存數(shù)據(jù)商店的能力和在統(tǒng)計(jì)分析市場(chǎng)所占的巨大份額(允許一個(gè)公司獲得一個(gè)增加的SAS部件而不是一個(gè)新的工具)都可能使SAS在數(shù)據(jù)挖掘市場(chǎng)上取得領(lǐng)先位置。由于它最近剛投放市場(chǎng),所以在寫(xiě)此書(shū)時(shí)只能獲得少數(shù)公布的用戶(hù)基推測(cè)試。這些結(jié)果表明EnterpriseMiner在可伸縮性、預(yù)測(cè)準(zhǔn)確性和處理時(shí)間上都表現(xiàn)得很好。總的來(lái)說(shuō),此工具適合于企業(yè)在數(shù)據(jù)挖掘方面的應(yīng)用以及CBM的全部決策支持應(yīng)用。六、案例:

SAS軟件成就安利(中國(guó))高效物流安利(中國(guó))透過(guò)庫(kù)存優(yōu)化系統(tǒng)提升服務(wù)效率20%,客戶(hù)滿(mǎn)意率指標(biāo)達(dá)到97%安利是國(guó)際上知名的直銷(xiāo)企業(yè),1992年進(jìn)入中國(guó)市場(chǎng)。目前,中國(guó)是安利在全球最大的市場(chǎng),安利(中國(guó))2008年的銷(xiāo)售業(yè)績(jī)達(dá)179億元人民幣,占安利全球收入的1/3強(qiáng),并且保持著強(qiáng)勁的增長(zhǎng)勢(shì)頭。目前,安利(中國(guó))擁有1000多種產(chǎn)品,全國(guó)共有229間店鋪、29個(gè)配送中心、22個(gè)外倉(cāng)和1個(gè)4萬(wàn)平方米的物流中心,倉(cāng)庫(kù)總面積達(dá)10萬(wàn)平方米,存儲(chǔ)量達(dá)5.6萬(wàn)個(gè)卡板,每年的運(yùn)輸里程1,396萬(wàn)公里,相當(dāng)于繞地球349圈。安利(中國(guó))特有的“店鋪+直銷(xiāo)+經(jīng)銷(xiāo)”的多元化營(yíng)銷(xiāo)模式和頻繁而快速的的市場(chǎng)促銷(xiāo)活動(dòng),加大了庫(kù)存管理的難度,要求運(yùn)營(yíng)流程和相關(guān)人員具有更高的靈活應(yīng)變能力。為了更好地配合安利業(yè)務(wù)的高速發(fā)展,使得信息流的發(fā)展能夠與未來(lái)企業(yè)供應(yīng)鏈的飛速發(fā)展相適應(yīng)并具有一定的前瞻性,安利(中國(guó))管理層決定進(jìn)一步深化當(dāng)前的商業(yè)分析應(yīng)用,在供應(yīng)鏈管理方面引入SAS技術(shù),建立“庫(kù)存優(yōu)化系統(tǒng)(InventoryOptimizationSystem,縮寫(xiě)IOS)”,統(tǒng)籌考慮各種相互約束的條件,將“正確的產(chǎn)品”以“正確的成本”在“正確的時(shí)間”送達(dá)“正確的地點(diǎn)二實(shí)現(xiàn)對(duì)復(fù)雜市場(chǎng)環(huán)境的快速反應(yīng),從而進(jìn)一步提高企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力。A4庫(kù)存優(yōu)化系統(tǒng),—庫(kù)存優(yōu)化系統(tǒng)(IOS)的主要功能IOSA4庫(kù)存優(yōu)化系統(tǒng),—多層次的產(chǎn)品需求預(yù)測(cè)通過(guò)業(yè)內(nèi)領(lǐng)先的SAS時(shí)間序列分析技術(shù),根據(jù)過(guò)往歷史上的相關(guān)銷(xiāo)售數(shù)據(jù),對(duì)不同層次的商品、地區(qū)進(jìn)行自動(dòng)診斷、建模、執(zhí)行以及調(diào)整預(yù)測(cè),可以精密到具體產(chǎn)品、店鋪級(jí)別的需求數(shù)據(jù),預(yù)測(cè)未來(lái)的客戶(hù)需求量°IOS采集了安利(中國(guó))歷史三年、超過(guò)7千萬(wàn)張訂單的數(shù)據(jù)進(jìn)行分析。預(yù)測(cè)的結(jié)果由于考慮了需求的變動(dòng)趨勢(shì)、季節(jié)性波動(dòng)、產(chǎn)品促銷(xiāo)、產(chǎn)品屬性等因素,并基于最為健壯的模型庫(kù),因此生成的預(yù)測(cè)數(shù)據(jù)更為準(zhǔn)確。并且具有高可擴(kuò)展性、靈活變動(dòng)等特點(diǎn)??紤]全面的智能排車(chē)系統(tǒng)根據(jù)預(yù)測(cè)的需求量,運(yùn)用優(yōu)化模型計(jì)算出每個(gè)地區(qū)的補(bǔ)貨頻率。同時(shí),結(jié)合車(chē)型、運(yùn)載量、運(yùn)輸成本等相關(guān)運(yùn)輸數(shù)據(jù),計(jì)算出未來(lái)一周最優(yōu)的排車(chē)計(jì)劃。排車(chē)計(jì)劃會(huì)結(jié)合各補(bǔ)貨計(jì)劃人員負(fù)責(zé)的區(qū)域,以均衡各人的工作安排,及更妥善的人力分配。系統(tǒng)中直觀、清晰地展現(xiàn)出當(dāng)前的排車(chē)計(jì)劃、車(chē)輛信息等。排車(chē)計(jì)劃由于受到公司策略安排、產(chǎn)品促銷(xiāo)、庫(kù)存調(diào)配、人手安排等因素的影響,具有一定的變動(dòng)性。計(jì)劃人員可以靈活方便地對(duì)其進(jìn)行變動(dòng),而這些變動(dòng)又被系統(tǒng)紀(jì)錄起來(lái),并區(qū)分成計(jì)劃調(diào)整和臨時(shí)變動(dòng)兩種狀態(tài),以作為日后排車(chē)的依據(jù)和對(duì)排車(chē)效果分析的數(shù)據(jù)源。最優(yōu)化的庫(kù)存補(bǔ)貨策略庫(kù)存補(bǔ)貨策略首先要基于多層次的補(bǔ)貨網(wǎng)絡(luò),從成品生產(chǎn)的工廠到物流中心到外倉(cāng),從外倉(cāng)到店鋪。綜合考慮各個(gè)產(chǎn)品的預(yù)測(cè)需求量和需求的變動(dòng)性、運(yùn)輸時(shí)間、包裝規(guī)格、庫(kù)存成本、運(yùn)輸成本、運(yùn)輸頻率、客戶(hù)服務(wù)水平、庫(kù)存策略、最小訂貨量等影響因素后,更精細(xì)地動(dòng)態(tài)制定庫(kù)存補(bǔ)貨策略,包括重訂購(gòu)水平以及訂購(gòu)至水平。這些補(bǔ)貨策略能細(xì)致到具體每個(gè)倉(cāng)庫(kù)、每間店鋪中的每個(gè)產(chǎn)品,而且能隨著時(shí)間的推移動(dòng)態(tài)適應(yīng)市場(chǎng)變化,并進(jìn)行相應(yīng)的調(diào)整。InventoryOptimizationNewmethodvs.oldmethodOptimized指標(biāo)分析和預(yù)警功能此功能為整個(gè)庫(kù)存管理提供日常所需的KPI(KeyPerformanceIndication)報(bào)表和緊急狀態(tài)預(yù)警。包括庫(kù)存水平分析、采購(gòu)建議分析、存貨預(yù)警、暫時(shí)缺貨EAS(EmergingAlert

System)分析、運(yùn)輸空載率、產(chǎn)品銷(xiāo)售監(jiān)控等一系列分析數(shù)據(jù)和報(bào)表。采購(gòu)建設(shè)分析報(bào)表1D皿20IW金輯基浦割3KM55S頗陌6婉1狷芭瞬弟自】400158*3?灌觥沏構(gòu)1D取財(cái)IE5D0CS昭1?MM6itCentreIf?iFO#lal^KX月密功觀port1D皿20IW金輯基浦割3KM55S頗陌6婉1狷芭瞬弟自】400158*3?灌觥沏構(gòu)1D取財(cái)IE5D0CS昭1?MM6itCentreIf?iFO#lal^KX月密功觀port拍tf#KA?*4國(guó)芯gm議*rtr樣SPSS是世界上最早采用圖形菜單驅(qū)動(dòng)界面的統(tǒng)計(jì)軟件,該軟件應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會(huì)科學(xué)的各個(gè)領(lǐng)域,世界上許多有影響的報(bào)刊雜志紛紛就SPSS的自動(dòng)統(tǒng)計(jì)繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評(píng)價(jià)與稱(chēng)贊。迄今SPSS軟件已有30余年的成長(zhǎng)歷史。全球約有25萬(wàn)家產(chǎn)品用戶(hù),它們分布于通訊、醫(yī)療、銀行、證券、保險(xiǎn)、制造、商業(yè)、市場(chǎng)研究、科研教育等多個(gè)領(lǐng)域和行業(yè),是世界上應(yīng)用最廣泛的專(zhuān)業(yè)統(tǒng)計(jì)軟件。二、特點(diǎn):它最突出的特點(diǎn)就是操作界面極為友好,輸出結(jié)果美觀漂亮。它將幾乎所有的功能都以統(tǒng)一、規(guī)范的界面展現(xiàn)出來(lái),使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)方法的功能,對(duì)話(huà)框展示出各種功能選擇項(xiàng)。用戶(hù)只要掌握一定的Windows操作技能,粗通統(tǒng)計(jì)分析原理,就可以使用該軟件為特定的科研工作服務(wù)。SPSS采用類(lèi)似EXCEL表格的方式輸入與管理數(shù)據(jù),數(shù)據(jù)接口較為通用,能方便的從其他數(shù)據(jù)庫(kù)中讀入數(shù)據(jù)。其統(tǒng)計(jì)過(guò)程包括了常用的、較為成熟的統(tǒng)計(jì)過(guò)程,完全可以滿(mǎn)足非統(tǒng)計(jì)專(zhuān)業(yè)人士的工作需要。輸出結(jié)果十分美觀,存儲(chǔ)時(shí)則是專(zhuān)用的SPO格式,可以轉(zhuǎn)存為HTML格式和文本格式。對(duì)于熟悉老版本編程運(yùn)行方式的用戶(hù)。SPSS還特別設(shè)計(jì)了語(yǔ)法生成窗口,用戶(hù)只需在菜單中選好各個(gè)選項(xiàng),然后按“粘貼”按鈕就可以自動(dòng)生成標(biāo)準(zhǔn)的SPSS程序。極大的方便了中、高級(jí)用戶(hù)。SPSS輸出結(jié)果雖然漂亮,但不能為WORD等常用文字處理軟件直接打開(kāi),只能采用拷貝、粘貼的方式加以交互。這可以說(shuō)是SPSS軟件的缺陷。三、功能:增強(qiáng)的數(shù)據(jù)管理功能。完善的結(jié)果報(bào)告功能。從10版起,對(duì)數(shù)據(jù)和結(jié)果的圖表呈現(xiàn)功能一直是SPSS改進(jìn)的重點(diǎn)。ComplexSamples模塊增加統(tǒng)計(jì)建模功能。ComplexSamples是12版中新增的模塊,用于實(shí)現(xiàn)復(fù)雜抽樣的設(shè)計(jì)方案,以及對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行描述。一般線(xiàn)形模型將會(huì)被完整地引入復(fù)雜抽樣模塊中,以實(shí)現(xiàn)對(duì)復(fù)雜抽樣研究中各種連續(xù)性變量的建模預(yù)測(cè)功能。ClassificationTree模塊。這個(gè)模塊實(shí)際上就是將以前單獨(dú)發(fā)行的SPSSAnswerTree軟件整合進(jìn)了SPSS平臺(tái)。ClassificationTree模塊基于數(shù)據(jù)挖掘中發(fā)展起來(lái)的樹(shù)結(jié)構(gòu)模型對(duì)分類(lèi)變量或連續(xù)變量進(jìn)行預(yù)測(cè),可以方便、快速的對(duì)樣本進(jìn)行細(xì)分,不需要用戶(hù)有太多統(tǒng)計(jì)專(zhuān)業(yè)知識(shí)。更好的SPSS系列產(chǎn)品兼容。能夠針對(duì)市場(chǎng)細(xì)分工作提供更為完整的方法體系。四、前景:通過(guò)對(duì)SPSS在質(zhì)量信息管理中的應(yīng)用進(jìn)行了初步探討,不難發(fā)現(xiàn)盡管SPSS是一種通用的社會(huì)科學(xué)統(tǒng)計(jì)軟件,但非常適用于質(zhì)量數(shù)據(jù)的處理和分析,廣大質(zhì)量工作者可以逐步探索SPSS在質(zhì)量管理中的新用途,大幅度改善質(zhì)量管理的效率和效果,幫助管理者做出最優(yōu)決策,最大限度地提高產(chǎn)品和服務(wù)質(zhì)量。它的前景十分可觀。五、案例:機(jī)械設(shè)備維護(hù)保障預(yù)測(cè)性分析一Sikorsky航空公司公司介紹:位于Stratford,Conn,是一家世界領(lǐng)先的直升機(jī)設(shè)計(jì)、制造和服務(wù)公司。該公司的直升機(jī)業(yè)務(wù)涵蓋了商業(yè)、工業(yè)及軍事等行業(yè),美國(guó)空軍所有5個(gè)分支機(jī)構(gòu)、世界上40多個(gè)國(guó)家的軍事及商業(yè)機(jī)構(gòu)均選擇采購(gòu)使用Sikorsky公司的直升機(jī)。該公司的愿景反映了其對(duì)安全和創(chuàng)新的長(zhǎng)期承諾:“我們先進(jìn)的飛機(jī)及技術(shù)把任何時(shí)間任何地點(diǎn)的人們安全地送回家?!弊詮?944年全世界第一起直升機(jī)營(yíng)救事例起,Sikorsky的直升機(jī)估計(jì)已經(jīng)拯救了200多萬(wàn)條生命。Sikorsky公司是位于Hartford,Conn的美國(guó)聯(lián)合技術(shù)集團(tuán)的下屬公司之一。美國(guó)聯(lián)合技術(shù)

集團(tuán)是一家為航天航空及建筑系統(tǒng)行業(yè)提供高技術(shù)產(chǎn)品和支持服務(wù)的集團(tuán)。面臨的問(wèn)題如何預(yù)測(cè)機(jī)器零件損耗并及時(shí)更新以保證安全生產(chǎn)如何管理機(jī)器設(shè)備庫(kù)存以保證及時(shí)供貨的同時(shí)又使管理成本降到最低如何降低機(jī)器設(shè)備的損耗,延長(zhǎng)機(jī)器設(shè)備使用壽命的同時(shí)又保證安全生產(chǎn)如何摸清機(jī)器設(shè)備使用的各種成本,進(jìn)行成本管理并直接降低成本如何充分分析挖掘企業(yè)現(xiàn)有所有數(shù)據(jù)源,包括結(jié)構(gòu)性數(shù)據(jù)及非結(jié)構(gòu)性數(shù)據(jù)(文本數(shù)據(jù)),并進(jìn)行預(yù)測(cè)性分析產(chǎn)品選擇Sikorsky提供客戶(hù)各種各樣的維護(hù)保障項(xiàng)目幫助客戶(hù)以可知的成本運(yùn)營(yíng)飛機(jī)及提高飛機(jī)的可利用性。其中的全面保障項(xiàng)目(TAP),涵蓋了飛機(jī)相關(guān)零件及服務(wù)中98%的成本費(fèi)用。Sikorsky公司尋求一種軟件及解決方案幫助直升機(jī)客戶(hù)識(shí)別和預(yù)測(cè)飛機(jī)設(shè)備的維護(hù)保障并最終提高客戶(hù)的滿(mǎn)意度。Sikorsky航空公司已選擇了使用SPSS公司市場(chǎng)領(lǐng)先的預(yù)測(cè)性分析軟件及解決方案,該軟件通過(guò)積極主動(dòng)地預(yù)測(cè)直升機(jī)客戶(hù)的預(yù)期需求極大地提高了客戶(hù)的忠誠(chéng)度。應(yīng)用產(chǎn)品:SPSS統(tǒng)計(jì)分析產(chǎn)品;Clementine數(shù)據(jù)挖掘產(chǎn)品(包括數(shù)據(jù)挖掘和文本挖掘);SPSS企業(yè)級(jí)預(yù)測(cè)平臺(tái)PES;解決方案:項(xiàng)目的解決方案按照行業(yè)內(nèi)公認(rèn)的方法論一CRISP-DM分為六個(gè)步驟:業(yè)務(wù)理解,數(shù)據(jù)理解,數(shù)據(jù)準(zhǔn)備,建模,評(píng)估以及部署。商業(yè)理解預(yù)測(cè)飛機(jī)零部件損耗并及時(shí)更新零部件保證安全飛行管理飛機(jī)零部件庫(kù)存,降低庫(kù)存成本,但保證及時(shí)供貨摸清飛機(jī)設(shè)備成本,成本管理,降低成本規(guī)范飛行員的駕駛操作降低零部件損耗并保證安全飛行整合各種資源,提高飛機(jī)的可利用性數(shù)據(jù)理解及數(shù)據(jù)準(zhǔn)備正常飛行時(shí)飛機(jī)監(jiān)測(cè)系統(tǒng)所收集到的數(shù)據(jù)飛行員駕駛操作日志記錄,包括錯(cuò)誤操作記錄及正確操作記錄機(jī)務(wù)人員操作日志記錄,包括錯(cuò)誤操作記錄及正確操作記錄飛機(jī)零部件損耗數(shù)據(jù)飛機(jī)各零部件成本飛行器維護(hù)保障數(shù)據(jù)根據(jù)數(shù)據(jù)的結(jié)構(gòu)化程度可分為結(jié)構(gòu)性數(shù)據(jù)如每架直升機(jī)的歷史數(shù)據(jù)和現(xiàn)今數(shù)據(jù),非結(jié)構(gòu)性數(shù)據(jù)包括飛行日志和機(jī)務(wù)人員錯(cuò)誤日志記錄數(shù)據(jù)顆粒度:日、月、季、年總之,從所有數(shù)據(jù)源收集信息,并通過(guò)Clementine進(jìn)行數(shù)據(jù)清理及數(shù)據(jù)審核,分析缺失值并填補(bǔ)之,形成可供建模的清潔完整數(shù)據(jù)。數(shù)據(jù)審核及缺失值填補(bǔ)界面數(shù)據(jù)的標(biāo)準(zhǔn)化及轉(zhuǎn)換界面

H-D用仙H■ruIF—:£m£瞄Fy?%一MSL5=L二rmAhnTi上r,盤(pán)ii>“*一匚■l?n信H-wf數(shù)據(jù)審核及缺失值填補(bǔ)界面數(shù)據(jù)的標(biāo)準(zhǔn)化及轉(zhuǎn)換界面H-D用仙H■ruIF—:£m£瞄Fy?%一MSL5=L二rmAhnTi上r,盤(pán)ii>“*一匚■l?n信H-wfTranr—i["mm-rwi^rlhjiofil^.iL':..if..Jb?.j!""??。 觥笇ぁ甭?tīng)nfl口二…IJL-U.J—I■』5FillI■■.I^SIIMBJILCKVliMt■■miMita.LIIH-■■OV..■■■■■IVIVid*AM|!uiiaL..1L刀低2]^—I"IIIUJAMMUlaAM.唔?!>—■>■!,-!???fejsuczm一1TWIT*?■■^KT-Ifl'MH?—?三,[tzm田unnit岬isriMMri■rwi-awiHavriiiii*ibmivnk■■nmaii■fiIeI■HumIlmira'■FAJfa—r-MHGEE|RHi-?rrHTran?foim聚類(lèi)與分類(lèi):零部件運(yùn)營(yíng)狀態(tài)細(xì)分,飛機(jī)維護(hù)保障狀態(tài)細(xì)分等。時(shí)間序列分析圖和關(guān)聯(lián)規(guī)則分析圖模型評(píng)估及發(fā)布:結(jié)合飛機(jī)業(yè)務(wù)知識(shí)及商業(yè)知識(shí),使用SPSS企業(yè)級(jí)預(yù)測(cè)平臺(tái)PES進(jìn)行模型評(píng)估及發(fā)布。

評(píng)估模型:使用累積圖或準(zhǔn)確性;多個(gè)模型使用競(jìng)爭(zhēng)方式評(píng)估;自動(dòng)報(bào)表發(fā)布結(jié)果部署實(shí)施效果及結(jié)果反饋:通過(guò)SPSS預(yù)測(cè)性分析軟件和解決方案,Sikorsky飛機(jī)預(yù)先性地保障了客戶(hù)飛機(jī)的安全,降低了零部件的損耗,合理地控制了成本,提高了飛機(jī)的可利用性,提高了客戶(hù)的滿(mǎn)意度和忠誠(chéng)度,達(dá)到了可觀的社會(huì)效益和經(jīng)濟(jì)效益。馬克威分析系統(tǒng)(單機(jī)版V5.0)一、綜述:上海天律信息技術(shù)有限公司產(chǎn)品品牌,旗下產(chǎn)品包括馬克威分析系統(tǒng)單機(jī)版、網(wǎng)絡(luò)版,馬克威決策支持平臺(tái)。馬克威分析系統(tǒng)(單機(jī)版V5.0)馬克威分析系統(tǒng)單機(jī)版V5.0是一套集分析、挖掘、預(yù)測(cè)、決策支持及展現(xiàn)于一體的知識(shí)發(fā)現(xiàn)工具,通過(guò)構(gòu)建工作流方式對(duì)海量數(shù)據(jù)進(jìn)行分析和挖掘,建立概念模型,從海量信息和數(shù)據(jù)中尋找規(guī)律和知識(shí),并通過(guò)新穎、獨(dú)特的展現(xiàn)方式為決策者提供科學(xué)有效的數(shù)據(jù)參考。它適用于企業(yè)、政府、科研教育、軍隊(duì)等單位和機(jī)構(gòu)。馬克威分析系統(tǒng)是中國(guó)信息化過(guò)程中不可缺少的工具。馬克威分析系統(tǒng)5.0(單機(jī)版)是馬克威分析系統(tǒng)系列產(chǎn)品中全新的一代企業(yè)級(jí)統(tǒng)計(jì)分析和數(shù)據(jù)挖掘產(chǎn)品,也是全球第一套準(zhǔn)三維操作環(huán)境的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘軟件產(chǎn)品。它融合了先進(jìn)的軟件開(kāi)發(fā)技術(shù)和強(qiáng)大的算法庫(kù),能使用戶(hù)更為輕松、高效、準(zhǔn)確地對(duì)數(shù)據(jù)進(jìn)行處理和分析。二、特點(diǎn):全球第一套準(zhǔn)三維操作環(huán)境的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘軟件產(chǎn)品完全基于工作流的軟件應(yīng)用高度圖形化的操作方式,無(wú)需任何編程基礎(chǔ)高性能運(yùn)行,支持海量數(shù)據(jù)和多種數(shù)據(jù)源,突破傳統(tǒng)Java速度限制個(gè)性化動(dòng)態(tài)報(bào)表和新穎的展示可重復(fù)性使用的分析流程,圖形化的批量處理模式跨平臺(tái)運(yùn)行支持多國(guó)語(yǔ)言1.全球第一套以工作流模式在準(zhǔn)三維操作環(huán)境下運(yùn)作的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘系統(tǒng)產(chǎn)品完全基于工作流的軟件應(yīng)用高度圖形化的操作方式,無(wú)需任何編程基礎(chǔ)高性能運(yùn)行,支持海量數(shù)據(jù)和多種數(shù)據(jù)源,突破傳統(tǒng)Java速度限制個(gè)性化動(dòng)態(tài)報(bào)表和新穎的展示可重復(fù)性使用的分析流程,圖形化的批量處理模式跨平臺(tái)運(yùn)行8、支持多國(guó)語(yǔ)言三、功能特點(diǎn):企業(yè)指標(biāo)分析、定制和管理模型構(gòu)建和管理體系預(yù)警預(yù)測(cè)數(shù)據(jù)分析和挖掘平臺(tái)經(jīng)營(yíng)管控、績(jī)效分析、管理駕駛艙平臺(tái)展現(xiàn)平臺(tái)(包括定制報(bào)表、報(bào)表展現(xiàn),圖表及OLAP展現(xiàn)等)系統(tǒng)權(quán)限管理企業(yè)數(shù)據(jù)倉(cāng)庫(kù)建設(shè)和管理四、案例:上海市外貿(mào)出口時(shí)間序列分析外貿(mào)出口是上海市經(jīng)濟(jì)發(fā)展的一個(gè)很重要的方面,尤其是近年來(lái)江浙一帶出口加工貿(mào)易的蓬勃發(fā)展,使得上海市外貿(mào)出口呈現(xiàn)出快速變化的特點(diǎn),為了分析上海市外貿(mào)出口額的變化規(guī)律,并進(jìn)行預(yù)測(cè),可以選用馬克威分析系統(tǒng)的時(shí)間序列分析模塊,進(jìn)行建模和預(yù)測(cè)。使用馬克威分析系統(tǒng)進(jìn)行建模的步驟為:模型識(shí)別:描繪數(shù)據(jù)圖形,對(duì)數(shù)據(jù)進(jìn)行變換、檢驗(yàn)平穩(wěn)性。計(jì)算基本序列的自相關(guān)關(guān)系,以決定是否要進(jìn)行差分。利用自相關(guān)和偏相關(guān)系數(shù)進(jìn)行數(shù)據(jù)的調(diào)整和模型的定階。使用時(shí)間序列算法(ARIMA等)估計(jì)模型參數(shù)和相關(guān)統(tǒng)計(jì)量。對(duì)模型進(jìn)行檢驗(yàn)。利用模型進(jìn)行預(yù)測(cè)。使用時(shí)間序列模型對(duì)上海市外貿(mào)出口額進(jìn)行預(yù)測(cè)的效果為:yIIMjli■HM1pi-m-■I1EiJU-snurnoEmad9UDwoi4iGDM(博通數(shù)據(jù)挖掘分析系統(tǒng))一、簡(jiǎn)述:GDM,是天才博通科技有限公司自主研發(fā)的一款基于B/S架構(gòu)的、分布式數(shù)據(jù)挖掘系統(tǒng),采用了較之“數(shù)據(jù)挖掘交叉行業(yè)標(biāo)準(zhǔn)過(guò)程”CRISP-DM(Cross-IndustryStandardProcessforDataMining)更為科學(xué)的分析流程,并提供了易用的圖形化用戶(hù)界面和強(qiáng)大的圖形可視化技術(shù)。GDM使分析人員能夠快速構(gòu)建各類(lèi)數(shù)據(jù)挖掘模型,并以WebService形式進(jìn)行發(fā)布,方便其它企業(yè)級(jí)應(yīng)用系統(tǒng)中快速調(diào)用模型,并進(jìn)行靈活封裝。該系統(tǒng)目前最新版本GDM4.2包含21種經(jīng)典的數(shù)據(jù)挖掘方法、14種統(tǒng)計(jì)分析方法。二、特點(diǎn):(1)B/S架構(gòu)一便捷、高效、低成本、高集成性(2)閉環(huán)分析流程一一降低分析流程各角色的協(xié)調(diào)成本,縮短模型部署周期,強(qiáng)化模型的自學(xué)習(xí)能力,確保模型的可持續(xù)性使用(3)完善的分析方法一包含特征壓縮、分類(lèi)預(yù)測(cè)、回歸預(yù)測(cè)、聚類(lèi)分析、關(guān)聯(lián)分析、時(shí)間序列6大類(lèi)20多種數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論