十張圖解釋機(jī)器學(xué)習(xí)_第1頁
十張圖解釋機(jī)器學(xué)習(xí)_第2頁
十張圖解釋機(jī)器學(xué)習(xí)_第3頁
十張圖解釋機(jī)器學(xué)習(xí)_第4頁
十張圖解釋機(jī)器學(xué)習(xí)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

十張圖解釋機(jī)器學(xué)習(xí)的基本概念2014/07/27·

\o"查看IT技術(shù)中的全部文章"IT技術(shù)

·

1評論

·

機(jī)器學(xué)習(xí)分享到:59\o"Shell典型應(yīng)用之主控腳本實(shí)現(xiàn)"Shell典型應(yīng)用之主控腳本實(shí)現(xiàn)\o"Zbrush生物角色高級雕刻"Zbrush生物角色高級雕刻\o"數(shù)據(jù)結(jié)構(gòu)探險—隊(duì)列篇"數(shù)據(jù)結(jié)構(gòu)探險—隊(duì)列篇\o"Android-Widget桌面小組件"Android-Widget桌面小組件本文由

伯樂在線

-

Boat

翻譯。未經(jīng)許可,禁止轉(zhuǎn)載!

英文出處:DenizYuret。歡迎加入翻譯組。在解釋機(jī)器學(xué)習(xí)的基本概念的時候,我發(fā)現(xiàn)自己總是回到有限的幾幅圖中。以下是我認(rèn)為最有啟發(fā)性的條目列表。1.Testandtrainingerror:

為什么低訓(xùn)練誤差并不總是一件好的事情呢:ESL

圖2.11.以模型復(fù)雜度為變量的測試及訓(xùn)練錯誤函數(shù)。2.Underandoverfitting:

低度擬合或者過度擬合的例子。PRML

圖1.4.多項(xiàng)式曲線有各種各樣的命令M,以紅色曲線表示,由綠色曲線適應(yīng)數(shù)據(jù)集后生成。3.Occam’srazorITILA

圖28.3.為什么貝葉斯推理可以具體化奧卡姆剃刀原理。這張圖給了為什么復(fù)雜模型原來是小概率事件這個問題一個基本的直觀的解釋。水平軸代表了可能的數(shù)據(jù)集D空間。貝葉斯定理以他們預(yù)測的數(shù)據(jù)出現(xiàn)的程度成比例地反饋模型。這些預(yù)測被數(shù)據(jù)D上歸一化概率分布量化。數(shù)據(jù)的概率給出了一種模型Hi,P(D|Hi)被稱作支持Hi模型的證據(jù)。一個簡單的模型H1僅可以做到一種有限預(yù)測,以P(D|H1)展示;一個更加強(qiáng)大的模型H2,舉例來說,可以比模型H1擁有更加自由的參數(shù),可以預(yù)測更多種類的數(shù)據(jù)集。這也表明,無論如何,H2在C1域中對數(shù)據(jù)集的預(yù)測做不到像H1那樣強(qiáng)大。假設(shè)相等的先驗(yàn)概率被分配給這兩種模型,之后數(shù)據(jù)集落在C1區(qū)域,不那么強(qiáng)大的模型H1將會是更加合適的模型。4.Featurecombinations:(1)為什么集體相關(guān)的特征單獨(dú)來看時無關(guān)緊要,這也是(2)線性方法可能會失敗的原因。從IsabelleGuyon特征提取的幻燈片來看。5.Irrelevantfeatures:為什么無關(guān)緊要的特征會損害KNN,聚類,以及其它以相似點(diǎn)聚集的方法。左右的圖展示了兩類數(shù)據(jù)很好地被分離在縱軸上。右圖添加了一條不切題的橫軸,它破壞了分組,并且使得許多點(diǎn)成為相反類的近鄰。6.Basisfunctions非線性的基礎(chǔ)函數(shù)是如何使一個低維度的非線性邊界的分類問題,轉(zhuǎn)變?yōu)橐粋€高維度的線性邊界問題。AndrewMoore的支持向量機(jī)SVM(SupportVectorMachine)教程幻燈片中有:一個單維度的非線性帶有輸入x的分類問題轉(zhuǎn)化為一個2維的線性可分的z=(x,x^2)問題。7.Discriminativevs.Generative:為什么判別式學(xué)習(xí)比產(chǎn)生式更加簡單:PRML

圖1.27.這兩類方法的分類條件的密度舉例,有一個單一的輸入變量x(左圖),連同相應(yīng)的后驗(yàn)概率(右圖)。注意到左側(cè)的分類條件密度p(x|C1)的模式,在左圖中以藍(lán)色線條表示,對后驗(yàn)概率沒有影響。右圖中垂直的綠線展示了x中的決策邊界,它給出了最小的誤判率。8.Lossfunctions:學(xué)習(xí)算法可以被視作優(yōu)化不同的損失函數(shù):PRML

圖7.5.應(yīng)用于支持向量機(jī)中的“鉸鏈”錯誤函數(shù)圖形,以藍(lán)色線條表示,為了邏輯回歸,隨著錯誤函數(shù)被因子1/ln(2)重新調(diào)整,它通過點(diǎn)(0,1),以紅色線條表示。黑色線條表示誤分,均方誤差以綠色線條表示。9.Geometryofleastsquares:ESL

圖3.2.帶有兩個預(yù)測的最小二乘回歸的N維幾何圖形。結(jié)果向量y正交投影到被輸入向量x1和x2所跨越的超平面。投影y^代表了最小二乘預(yù)測的向量。10.Sparsity:為什么Lasso算法(L1正規(guī)化或者拉普拉斯先驗(yàn))給出了稀疏的解決方案(比如:帶更多0的加權(quán)向量):HYPERLINK"/~tibs/ElemStatL

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論