版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、. 1,Rapidminer教程,2,Rapidminer的介紹,Rapidminer的功能都是通過連接各種運算符(operataor )形成進(jìn)程來實現(xiàn)的。 整個流程可視為工廠的生產(chǎn)線,輸入原始數(shù)據(jù),輸入模型結(jié)果。 運營商可被視為執(zhí)行特定功能的函數(shù),輸入/輸出特性因運營商而異。3,界面介紹,4,界面介紹,5,建模的一般流程是,把新的存儲器選擇所必要的操作員放入主程序中,設(shè)定操作員相關(guān)參數(shù),進(jìn)行操作員連接執(zhí)行流程,得到結(jié)果.6, 第一步驟:導(dǎo)入數(shù)據(jù)(方法1 )要導(dǎo)入數(shù)據(jù),請在工具欄上選擇導(dǎo)入數(shù)據(jù)集,通過運算符加載數(shù)據(jù)集,導(dǎo)入數(shù)據(jù),導(dǎo)入數(shù)據(jù),以及導(dǎo)入數(shù)據(jù)導(dǎo)入數(shù)據(jù)的方法、導(dǎo)入數(shù)據(jù)的方法、導(dǎo)入數(shù)據(jù)的方
2、法、導(dǎo)入數(shù)據(jù)的方法、導(dǎo)入數(shù)據(jù)的方法、導(dǎo)入數(shù)據(jù)的方法、導(dǎo)入數(shù)據(jù)的方法、導(dǎo)入數(shù)據(jù)的方法和數(shù)據(jù)導(dǎo)入數(shù)據(jù)的方法,導(dǎo)入數(shù)據(jù)的方法,12,導(dǎo)入數(shù)據(jù),13,導(dǎo)入數(shù)據(jù)(方法2 ),第二種方法是使用read運算符加載CSV文件,導(dǎo)入、合并數(shù)據(jù)集,然后執(zhí)行,將數(shù)據(jù)導(dǎo)入到結(jié)果中用這種方法導(dǎo)入的數(shù)據(jù)可以隨時變更數(shù)據(jù)類型和數(shù)據(jù)的種類。14、數(shù)據(jù)導(dǎo)入、15、兩種方法的對比,在用第一種方法導(dǎo)入數(shù)據(jù)后,數(shù)據(jù)的類型和數(shù)量無法更改,只能通過增加操作員的方法更改數(shù)據(jù)的類型。 第二種方法是在導(dǎo)入數(shù)據(jù)后再次更改數(shù)據(jù)的類型和量。 相對地,第二種方法可能比較好。16、兩種方法的比較,第二種方法無法成功導(dǎo)入數(shù)據(jù),導(dǎo)入結(jié)果成功,但無法得到值,
3、總是顯示為unknown。17、第二步:選擇操作員,將剛才導(dǎo)入的數(shù)據(jù)拖到主進(jìn)程工作區(qū),以框形式表現(xiàn),不同的顏色暗示不同的函數(shù)功能。 框的左側(cè)是輸入接口,與輸入類型的縮寫相對應(yīng)。 右側(cè)對應(yīng)于輸出接口和對應(yīng)的縮寫。 左下角有三種顏色的狀態(tài)燈,紅色表示該操作員的設(shè)定錯誤,黃色表示設(shè)定正常但還沒有執(zhí)行,綠色表示設(shè)定正常執(zhí)行。 由于選擇了.18、運算符,且數(shù)據(jù)量大,因此在此選擇數(shù)據(jù)量,并通過運算符選擇sample運算符進(jìn)行選擇后,就可以應(yīng)用搜索功能來直接搜索。 可以設(shè)定.19、與操作員相關(guān)的參數(shù),并在界面右側(cè)的parameters標(biāo)簽中設(shè)定操作員的具體參數(shù)。 在此,作為例子選擇100個數(shù)據(jù)。 以samp
4、le為例,exa是參數(shù)化后的新數(shù)據(jù)(下圖),ori是原始數(shù)據(jù),每個運算符可以選擇多個數(shù)據(jù)源,21,第3步驟:運算,可以選擇運算符右側(cè)的不同輸出,選擇不同的數(shù)據(jù)源如果能通過就變成綠色。 為了選擇mod模式,exa模式獲取表。 “XML”標(biāo)簽顯示了相應(yīng)的代碼。 在執(zhí)行、22、連接運營商、23所獲得的結(jié)果是不同的運營商,顯示的結(jié)果有多種不同的顯示方式,以神經(jīng)網(wǎng)絡(luò)為例,顯示方式有以下三種。 與第一圖表顯示方式相比,第二顯示方式更像用數(shù)字更直觀地顯示數(shù)據(jù)的方式。25,結(jié)果的保存,context標(biāo)簽,process output中,可以選擇用location保存數(shù)據(jù)的地方。26、結(jié)果的存儲、27、外部測試
5、集評價模型在建模時,將樣本數(shù)據(jù)分成兩部分,將一半作為訓(xùn)練樣本,另一半作為檢驗樣本將數(shù)據(jù)分成兩等分,有些數(shù)據(jù)連接神經(jīng)網(wǎng)絡(luò)用于建模以.28、交叉核對、十重交叉核對為例,把所有數(shù)據(jù)隨機(jī)分成等量的十部分,其中9部分作為訓(xùn)練數(shù)據(jù),剩下的一部分作為檢查數(shù)據(jù)來評價模型。 然后,交換其中的一部分?jǐn)?shù)據(jù),重復(fù)實驗。 這樣得到10組不同的評價指標(biāo),最后綜合評價模型的表現(xiàn)。 rapidminer需要通過X-Validation操作符實現(xiàn)該功能。29、交叉檢查、Valadition可以雙擊打開,繼續(xù)編輯。 30、將Rapidminer與clementine進(jìn)行比較,這里比較的是兩個軟件在同一數(shù)據(jù)上的時間性和正確性。 在
6、rapidminer中,選擇與clementine相同的福特公司的數(shù)據(jù)集,對TrialId、ObsNum、P8、V7、V9這5個字段進(jìn)行過濾,數(shù)據(jù)量為30000左右。31、神經(jīng)網(wǎng)絡(luò)SVM、神經(jīng)網(wǎng)絡(luò)SVM、11日晚上,發(fā)現(xiàn)兩個軟件在數(shù)據(jù)上有很大的差異,無法在神經(jīng)網(wǎng)絡(luò)和SVM的clementine上出現(xiàn)數(shù)據(jù)量rapidminer,30000 clementine只需幾分鐘,就能輸出6000條數(shù)據(jù)約兩分鐘。 只有決策樹出來,只比較決策樹。 32、決策樹、流程圖Rapidminer執(zhí)行時間:2min30s Clementine執(zhí)行時間: 21s、33,決策樹,執(zhí)行結(jié)果太大,以下為縮略圖、34、決策樹、
7、評價時間、35、決策樹、Rapidminer正確性: clemen Rapidminer三種算法的比較,流程圖示例:三個模型看起來大致相同,只有選定的模型不同。 選擇的數(shù)據(jù)取0.01,相當(dāng)于6043條數(shù)據(jù)。37、Rapidminer三種算法的比較、決策樹神經(jīng)網(wǎng)絡(luò)SVM、38、結(jié)論和Rapidminer三種算法相互比較,神經(jīng)網(wǎng)絡(luò)精度更高的Rapidminer與clementine比較兩個軟件得到的結(jié)果有一定的差異。 我們還沒有發(fā)現(xiàn)快速挖掘的優(yōu)點。 Rapidminer可能和計算機(jī)的性能有很大關(guān)系,只要8G內(nèi)存的計算機(jī)跑6000條數(shù)據(jù),就28s,39,心得,這個軟件沒有詳細(xì)的教程和使用說明,我們在這里提出強(qiáng)烈的譴責(zé)和抗議,教程??! 端午節(jié)期間大家都回家,不能一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026河南永錦能源招聘210人考試備考題庫及答案解析
- 2026內(nèi)蒙古包頭鐵道職業(yè)技術(shù)學(xué)院赴鐵路院校招聘急需專業(yè)教師16人考試備考試題及答案解析
- 2026年淮南經(jīng)濟(jì)技術(shù)開發(fā)區(qū)公益性崗位征集考試備考題庫及答案解析
- 2026廣東深圳市眼科醫(yī)院招聘工作人員招聘11人考試參考試題及答案解析
- 2026天津市津南創(chuàng)騰經(jīng)濟(jì)開發(fā)有限公司招聘8人考試備考試題及答案解析
- 文庫發(fā)布:exo介紹教學(xué)
- 2026日照銀行見習(xí)人員招聘10人考試參考題庫及答案解析
- 2026安徽亳州市蒙城縣商業(yè)綜合體招聘勞務(wù)派遣人員(四次)考試參考題庫及答案解析
- 2026年西安市鄠邑區(qū)就業(yè)見習(xí)基地見習(xí)招聘(163人)考試參考試題及答案解析
- 2026年合肥幼教集團(tuán)光明之家幼兒園門衛(wèi)招聘考試參考題庫及答案解析
- 普外科科室護(hù)理年終總結(jié)
- 溫室氣體 產(chǎn)品碳足跡量化方法與要求 房間空調(diào)器 編制說明
- 山東省菏澤市菏澤經(jīng)開區(qū)2024-2025學(xué)年八年級(上)期末物理試卷(含解析)
- 改非申請書范文
- 2025年度光伏發(fā)電站智能監(jiān)控系統(tǒng)設(shè)計與實施合同
- 《老年康復(fù)照護(hù)》高職全套教學(xué)課件
- office辦公軟件應(yīng)用教學(xué)教案150
- 高級會計師評審專業(yè)技術(shù)工作業(yè)績報告
- 土地承包合同(2篇)
- 零首付買房合同范本
- 新人教版數(shù)學(xué)六年級下冊全冊課本練習(xí)題可編輯可打印
評論
0/150
提交評論