商務(wù)智能課件:第12章 商務(wù)智能系統(tǒng)_第1頁
商務(wù)智能課件:第12章 商務(wù)智能系統(tǒng)_第2頁
商務(wù)智能課件:第12章 商務(wù)智能系統(tǒng)_第3頁
商務(wù)智能課件:第12章 商務(wù)智能系統(tǒng)_第4頁
商務(wù)智能課件:第12章 商務(wù)智能系統(tǒng)_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第12章商務(wù)智能系統(tǒng)Lecture12:Business

Intelligence

Systems主要內(nèi)容12.1開源數(shù)據(jù)挖掘軟件12.1.1概述12.1.2Weka12.2

商品化的商務(wù)智能系統(tǒng)12.1.1開源數(shù)據(jù)挖掘軟件概述常用的開源數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)軟件有:WekaR軟件RapidMinerOrangeKNIMETanagra…等Weka新西蘭懷卡托(Waikato)大學(xué)開發(fā)的系統(tǒng),是WaikatoEnvironmentforKnowledgeAnalysis的縮寫。該系統(tǒng)用Java語言開發(fā)。在windows、Linux以及Macintosh操作系統(tǒng)上都可以運(yùn)行??梢詮膆ttp://www.cs.waikato.ac.nz/ml/weka免費(fèi)下載。它有四種使用方式:Explorer、KnowledgeFlow、Experimenter和命令行。Explorer的具體使用方法我們將在12.1.2節(jié)介紹。R軟件提供眾多的分析功能以及圖形繪制功能。數(shù)據(jù)挖掘功能包括分類、聚類、關(guān)聯(lián)規(guī)則、回歸分析以及時(shí)間序列分析等。還提供統(tǒng)計(jì)分析功能。該軟件可從網(wǎng)站/下載。R的內(nèi)核是用C語言實(shí)現(xiàn)的,但是要開發(fā)新的挖掘算法使用R提供的腳本語言,即R語言,開發(fā)更靈活、快速。RapidMiner較早的版本稱為YALE(YetAnotherLearningEnvironment)??梢詮南螺d。用Java開發(fā)的,可以調(diào)用Weka中的挖掘算法等組件。使用樹狀結(jié)構(gòu)來組織各種分析組件。其用戶遍及40多個(gè)國家??梢酝ㄟ^圖形化界面、命令行方式以及JavaAPI的方式使用其豐富的數(shù)據(jù)處理、分析及可視化功能??梢栽L問眾多的數(shù)據(jù)源。KNIME(KonstanzInformationMiner)可從下載,在windows、Linux以及Macintosh操作系統(tǒng)上都可以運(yùn)行。用Java開發(fā),可以調(diào)用Weka中的挖掘算法。使用方式類似于Weka中的KnowledgeFlow,可以很方便地通過可視化的方式創(chuàng)建數(shù)據(jù)分析的整個(gè)流程。該軟件的使用方式也與一些商品化的數(shù)據(jù)挖掘軟件,如IBMSPSS和SASEnterpriseMiner相似。Orange網(wǎng)站為http://www.ailab.si/orange。與KNIME類似,也是一種基于組件的數(shù)據(jù)挖掘開源軟件,通過各種控件設(shè)置挖掘步驟,組成挖掘流程。其底層核心由C++開發(fā),用戶可以使用腳本語言Python進(jìn)行擴(kuò)展開發(fā)。在windows、Linux以及Macintosh操作系統(tǒng)上都可以運(yùn)行。提供了100多個(gè)控件(widget),覆蓋了絕大多數(shù)數(shù)據(jù)分析功能,使用簡單。提供豐富的可視化功能。Tanagra可從網(wǎng)站http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html下載,可運(yùn)行于Windows操作系統(tǒng)。其前身是SIPINA,主要實(shí)現(xiàn)是有監(jiān)督的學(xué)習(xí)算法,如決策樹。在此之上,Tanagra增加了無監(jiān)督的許多學(xué)習(xí)方法,如聚類、關(guān)聯(lián)分析等。統(tǒng)計(jì)分析功能很強(qiáng),提供了很多的統(tǒng)計(jì)檢驗(yàn)、特征選取與構(gòu)造以及回歸分析、因子分析等功能??梢暬芰^弱。12.1.2Weka主要介紹Explorer方式下Weka的使用方法。先介紹可輸入的數(shù)據(jù)格式然后分別以一種典型方法為例說明Weka實(shí)現(xiàn)數(shù)據(jù)預(yù)處理、關(guān)聯(lián)分析、分類、聚類、回歸分析以及特征提取等主要技術(shù)的使用方法。WekaExplorer的主界面主界面數(shù)據(jù)文件Weka可識(shí)別的文件格式有多種,包括ARFF、C4.5、CSV等。其中ARFF是其獨(dú)有的文件格式。Weka自帶了多個(gè)ARFF格式的數(shù)據(jù)文件,如weather、CPU、iris等。如右圖可在寫字板中打開weather數(shù)據(jù)集。打開數(shù)據(jù)文件后的Weka界面界面的左下部分顯示的是所有屬性數(shù)據(jù)預(yù)處理要對(duì)weather數(shù)據(jù)集進(jìn)行關(guān)聯(lián)分析,需要將其中的兩個(gè)連續(xù)類型的屬性先進(jìn)行離散化處理。單擊上圖中位于屏幕上半部的choose按鈕,在unsupervised類型下的attribute下選擇Discretize,如右圖所示。選擇無監(jiān)督離散化功能離散化參數(shù)設(shè)置設(shè)置離散化為10個(gè)等間隔離散化后的weather數(shù)據(jù)集關(guān)聯(lián)分析關(guān)聯(lián)規(guī)則的參數(shù)設(shè)置輸出結(jié)果右邊為類別的關(guān)聯(lián)規(guī)則的部分輸出結(jié)果FPGrowth算法利用FPGrowth算法發(fā)現(xiàn)的關(guān)聯(lián)規(guī)則分類Weka中提供的分類算法列表輸出結(jié)果決策樹分類器的部分輸出結(jié)果可視化顯示可視化決策樹數(shù)據(jù)規(guī)范化與聚類規(guī)范化方法的選擇聚類Weka提供的聚類方法列表回歸分析CPU數(shù)據(jù)集的多元線性回歸

(SimpleLinearRegression)結(jié)果特征提取主成分分析的參數(shù)設(shè)置結(jié)果顯示Iris數(shù)據(jù)集的主成分分析的結(jié)果12.2

商品化的商務(wù)智能系統(tǒng)國外有IBM、甲骨文(Oracle)、SAP、賽仕(SAS)、微策略(MicroStrategy)、Teradata以及微軟(Microsoft)等。國內(nèi)有用友華表(http://www.cellsoft.cc/)、浪潮(/)、金蝶(/)、久其(/)、奧威智動(dòng)(/)等。這些商務(wù)智能的產(chǎn)品涉及查詢、報(bào)表、數(shù)據(jù)倉庫、在線分析處理、數(shù)據(jù)挖掘、文本挖掘及業(yè)務(wù)可視化工具等。數(shù)據(jù)倉庫主要供應(yīng)商、產(chǎn)品和網(wǎng)址供應(yīng)商產(chǎn)品網(wǎng)址Oracle數(shù)據(jù)倉庫

OracleDataIntegrator/TeradataEnterpriseDataWarehousing/enterprise-data-warehousing/SASEnterpriseDataIntegrationServer/software/data-management/entdiserver/index.htmlIBMInfoSphereWarehouse/software/products/cn/zh/category/SWM00MicrosoftSQLServer/china/OLAP主要供應(yīng)商、產(chǎn)品和網(wǎng)址供應(yīng)商產(chǎn)品網(wǎng)址IBMCognosBI/software/analytics/cognos/OracleESSBASE/MicrosoftSQLServerOLAPservices/china/SASOLAP服務(wù)器/technologies/bi/index.htmlSAPBusinessObjectsAnalysis/SAPNetweaverBW/MicroStrategy/數(shù)據(jù)挖掘主要供應(yīng)商、產(chǎn)品和網(wǎng)址供應(yīng)商產(chǎn)品網(wǎng)址IBMSPSSmodeler/software/analytics/SASEnterpriseMiner/dataminingSASTextMiner/text-analytics/text-miner/index.htmlIBM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論