版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第7章集成學習《機器學習》胡曉目錄7.1集成學習理論依據(jù)7.2集成學習機制7.3決策樹7.4隨機森林7.5自適應助推7.1集成學習理論依據(jù)
7.2集成學習機制裝袋法(Bagging)
:每次被選取的樣本賦予相同權(quán)重,所有模型有相同投票權(quán);采用某種組合策略確定最終結(jié)果。助推法(Boosting)采用級聯(lián)方式,前級基學習指導后級基學習,后級基學習重視前級的錯分樣本,并給予錯分樣本
7.3決策樹
在樹形結(jié)構(gòu)圖中,只有輸出沒有輸入的節(jié)點稱為是根結(jié)點,位于樹的頂端;既有輸入又有輸出的結(jié)點稱為中間結(jié)點;只有輸入沒有輸出的結(jié)點稱為葉結(jié)點,葉結(jié)點代表了對樣本數(shù)據(jù)的決策類別,即決策結(jié)果。7.3決策樹7.3.2ID3和C4.5第3代迭代二叉樹(IterativeDichotomiser3,ID3)C4.5算法與ID3整體結(jié)構(gòu)基本一樣,都采用自頂向下的貪婪搜索遍歷所有可能的決策樹空間;不同的是:在劃分分支選擇最優(yōu)屬性時,ID3選擇信息增益最高的屬性,而C4.5采用信息增益比最高的屬性。
信息增益比,
7.3決策樹7.3.2ID3和C4.5
7.3決策樹
7.3決策樹7.3.3分類回歸樹
從表7.1中有放回的隨機抽取15個樣本構(gòu)成數(shù)據(jù)集
7.3決策樹
7.3決策樹7.3.4剪枝理想情況下,所有樣本都能被決策樹精確預測,即生成決策樹葉結(jié)點都有確定類型。但實際上決策樹可能存在過多結(jié)點,導致過度擬合。常見原因:樣本中存在噪聲和樣本不具代表性。因此,實際中常常進行枝葉裁剪。預剪枝后剪枝7.4隨機森林隨機森林是(RadomForest)裝袋學習機制的一種進階。在隨機森林中,每個基映射函數(shù)都是一棵決策樹,然后將多棵決策樹集成一個強映射函數(shù),可實現(xiàn)分類也可實現(xiàn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 全員素質(zhì)提升和職業(yè)發(fā)展承諾書(3篇)
- 無人機航拍安全保障承諾書(6篇)
- 感動心靈的情感抒情作文(15篇)
- 美術(shù)集訓室制度規(guī)范要求
- 臨床護理文書規(guī)范制度
- 中小學生午餐制度規(guī)范
- 醫(yī)院制度書寫格式規(guī)范
- 公司軟件使用規(guī)范制度
- 規(guī)范操辦婚喜慶事宜制度
- 規(guī)范化環(huán)境管理制度匯編
- 2026屆湖南雅禮中學高一上數(shù)學期末聯(lián)考模擬試題含解析
- (2025年)電網(wǎng)調(diào)度自動化廠站端調(diào)試檢修員??荚囶}(含答案)
- 陜西交控集團2026校園招聘考試備考題庫附答案
- 生活委員培訓
- 聯(lián)營餐廳合作協(xié)議
- 2023年重慶市公安局招聘輔警筆試真題
- 高速公路項目竣工決算審計服務投標方案(技術(shù)方案)
- DB34∕T 3469-2019 高延性混凝土應用技術(shù)規(guī)程
- 地面清潔劑產(chǎn)品市場環(huán)境與對策分析
- 混凝土外加劑試驗原始記錄
- 甄嬛傳電子版劇本第01-10集
評論
0/150
提交評論