下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第Python機器學習應(yīng)用之基于決策樹算法的分類預測篇目錄一、決策樹的特點1.優(yōu)點2.缺點二、決策樹的適用場景三、demo
一、決策樹的特點
1.優(yōu)點
具有很好的解釋性,模型可以生成可以理解的規(guī)則??梢园l(fā)現(xiàn)特征的重要程度。模型的計算復雜度較低。
2.缺點
模型容易過擬合,需要采用減枝技術(shù)處理。不能很好利用連續(xù)型特征。預測能力有限,無法達到其他強監(jiān)督模型效果。方差較高,數(shù)據(jù)分布的輕微改變很容易造成樹結(jié)構(gòu)完全不同。
二、決策樹的適用場景
決策樹模型多用于處理自變量與因變量是非線性的關(guān)系。梯度提升樹(GBDT),XGBoost以及LightGBM等先進的集成模型均采用決策樹作為基模型。(多粒度聯(lián)森林模型)決策樹在一些明確需要可解釋性或者提取分類規(guī)則的場景中被廣泛應(yīng)用。在醫(yī)療輔助系統(tǒng)中為了方便專業(yè)人員發(fā)現(xiàn)錯誤,常常將決策樹算法用于輔助病癥檢測。
三、demo
#%%demo
##基礎(chǔ)函數(shù)庫導入
importnumpyasnp
##導入畫圖庫
importmatplotlib.pyplotasplt
importseabornassns
##導入決策樹模型函數(shù)
fromsklearn.treeimportDecisionTreeClassifier
fromsklearnimporttree
importpydotplus
fromIPython.displayimportImage
##Demo演示DecisionTree分類
##構(gòu)造數(shù)據(jù)集
x_fearures=np.array([[-1,-2],[-2,-1],[-3,-2],[1,3],[2,1],[3,2]])
y_label=np.array([0,1,0,1,0,1])
##調(diào)用決策樹回歸模型
tree_clf=DecisionTreeClassifier()
##調(diào)用決策樹模型擬合構(gòu)造的數(shù)據(jù)集
tree_clf=tree_clf.fit(x_fearures,y_label)
##可視化構(gòu)造的數(shù)據(jù)樣本點
plt.figure()
plt.scatter(x_fearures[:,0],x_fearures[:,1],c=y_label,s=50,cmap='viridis')
plt.title('Dataset')
plt.show()
##可視化決策樹
importgraphviz
dot_data=tree.export_graphviz(tree_clf,out_file=None)
graph=pydotplus.graph_from_dot_data(dot_data)
graph.write_pdf("D:\Python\ML\DecisionTree.pdf")
#模型預測
##創(chuàng)建新樣本
x_fearures_new1=np.array([[0,-1]])
x_fearures_new2=np.array([[2,1]])
##在訓練集和測試集上分布利用訓練好的模型進行預測
y_label_new1_predict=tree_clf.predict(x_fearures_new1)
y_label_new2_predict=tree_clf.predict(x_fearures_new2)
print('TheNewpoint1predictclass:\n',y_label_new1_predict)
print('TheNewpoint2predictclass:\n',y_label_ne
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 前端開發(fā)技術(shù)規(guī)范解析
- 2026年電力工程師電力安全知識與技能考核試題及答案
- 2026年資產(chǎn)評估實務(wù)操作題庫及答案詳解
- 2026年醫(yī)學專業(yè)進階測試疾病診斷判斷力考驗
- 2026年環(huán)境科學研究題目氣候變化與環(huán)境影響評估
- 2026年高分子材料測試技術(shù)人員資格測試理論與試題庫
- 2026年軟件測試工程師預測模擬題集
- 2026年C編程進階試題與解答詳解
- 2026年法律實務(wù)案例分析初級題目
- 2026年阿里巴巴校招筆試題目大全
- 2026云南昭通市搬遷安置局招聘公益性崗位人員3人備考題庫及答案詳解(考點梳理)
- 標書財務(wù)制度
- 四川發(fā)展控股有限責任公司會計崗筆試題
- 2026中國電信四川公用信息產(chǎn)業(yè)有限責任公司社會成熟人才招聘備考題庫及一套答案詳解
- 2025-2030心理健康行業(yè)市場發(fā)展分析及趨勢前景與投資戰(zhàn)略研究報告
- 技術(shù)副總年終總結(jié)
- 《馬年馬上有錢》少兒美術(shù)教育繪畫課件創(chuàng)意教程教案
- 天津市專升本高等數(shù)學歷年真題(2016-2025)
- 2025山西焦煤集團所屬華晉焦煤井下操作技能崗退役軍人招聘50人筆試參考題庫帶答案解析
- 兒童骨科主任論兒童骨科
- 三力測試題70歲以上老人換領(lǐng)駕照
評論
0/150
提交評論