下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、極大似然估計(jì)與貝葉斯估計(jì)原理、區(qū)別及應(yīng)用1極大似然估計(jì)極大似然估計(jì)是以概率為基礎(chǔ)的,并不會(huì)考慮先驗(yàn)知識(shí)。其代表頻率派, 認(rèn)為參數(shù)是客觀存在的,只是未知而矣。因此,頻率派最關(guān)心是通過(guò)極大似 然函數(shù),求參數(shù),然后根據(jù)參數(shù),在給定自變量X時(shí),確定Y。參數(shù)解法: 根據(jù)已知,列出關(guān)于參數(shù)的似然方程,令似然方程取得最大值,從而解得參 數(shù)值。例1.我們得到一個(gè)中國(guó)人口的樣本,個(gè)數(shù)為1000,男女比例為3:2,現(xiàn) 在讓你估計(jì)全國(guó)人口的真實(shí)比例,你肯定不會(huì)估計(jì)為男:女=1:0。因?yàn)槿绻?是1:0,不可能得到3:2的樣本。我們大多很容易也估計(jì)為3:2。本例子中所 要估計(jì)的是男:女=3:2。因?yàn)樵谠摫壤?,我們所?/p>
2、到的樣本男:女=3:2.這 種情況才最容易出現(xiàn)。該例子與上面所講用樣本頻率來(lái)估計(jì)整體的思想是一 樣的。上面例子用極大似然思想求解過(guò)程:我們要估計(jì)的變量是:男(或者女)在總?cè)丝谥兴嫉谋壤?。設(shè)為p.目標(biāo)使得樣本所獲得的男:女=3:2,該結(jié)論盡可能可能實(shí)現(xiàn)。設(shè)為L(zhǎng)。貝貝L=P(y1,y2.yn)=pA600(1-p)M00最大。此方程也被稱(chēng)為似然方程。 其中yi表示第i詞抽樣的結(jié)果。對(duì)上述方程求導(dǎo):600*PA599*(1-P)A400-PA600*400*(1-P)A399=0.解方程可得:P=0.6.例2.極大似然估計(jì)在樸素貝葉斯算法中的應(yīng)用一對(duì)先驗(yàn)概率和條件概率的估 計(jì)。上述思想一般情況解釋
3、:我們已有一些數(shù)據(jù)。二心旻小上面例子中男女比例), 我們的目的是在給定數(shù)據(jù)D的條件下,找到一個(gè)參數(shù)0使得概率最大。即:arg inaxpf 例呻*) p = FF根據(jù)貝葉斯定理有:(2)我們假設(shè)6是不變的(概率派認(rèn)為此概率固定不變),另外D是已知條件。所以求(1)就變?yōu)榍螅篴rgmaxp(W)-(3)因?yàn)槲覀兗僭O(shè)條件相互獨(dú)立。則;n= p儀胛). :(4)貝葉斯估計(jì)不同于頻率派認(rèn)為參數(shù)固定不變的,而是服從一定的概率分布。所以貝葉斯 估計(jì)不再采用這樣的策略:首先計(jì)算出參數(shù),然后根據(jù)參數(shù)和輸入x計(jì)算得y。 模型推導(dǎo):同樣的,目的是在給定數(shù)據(jù)D的條件下,找到一個(gè)參數(shù)。使得概率最大。 因?yàn)橛蓞?shù)不是一
4、個(gè)固定值,而是滿足一定的概率分布。由全概率公式得:(5)將(4),(5)帶入(2)得:咐功=皿如冏渺)ni W*(6)由于6是滿足一定概率分布的變量,所以在計(jì)算得時(shí)候需要將考慮所有6取 值的情況,以致在計(jì)算過(guò)程中不可避免的高復(fù)雜度。所以計(jì)算時(shí)候并不把所有的后 驗(yàn)概率p(e |D)都找出來(lái),而是仍然采用類(lèi)似于極大似然估計(jì)的思想,來(lái)極大后驗(yàn)概率(Maximum A Posterior)得到這種簡(jiǎn)單有效的叫做MAP (極大化后驗(yàn)概率)。極大化后驗(yàn)概率采用了一種近似的方法求后驗(yàn)概率,這就是最大后驗(yàn)概率。首先我們認(rèn)為最大 化后驗(yàn)概率的分母僅僅是一個(gè)歸一化因子,并不是0的函數(shù)(對(duì)0求積分的結(jié)果不 含0)。
5、所以最大化后驗(yàn)概率就是最大化分子,即:TI&禰=3Tgmax Y1 跳明冏g。);1 最大后驗(yàn)概率和極大似然估計(jì)很像,只是多了一項(xiàng)先驗(yàn)分布,它體現(xiàn)了貝葉斯 認(rèn)為參數(shù)也是隨機(jī)變量的觀點(diǎn)。其中等式右邊條件概率的求值按照極大似然估計(jì)法。 通過(guò)上式可以發(fā)現(xiàn),在估計(jì)參數(shù)中,一個(gè)考慮了先驗(yàn)一個(gè)沒(méi)有考慮先驗(yàn)。樸素貝葉斯算法中參數(shù)估計(jì)使用極大似然估計(jì)法估計(jì)先驗(yàn)概率和條件概率推到過(guò)程同例一。結(jié)論為:先驗(yàn)概率:條件概率:j(丫二匕)P(X( j)=a | Y=c)= P( * 七 丫二匕) jl k1Li(x(j)=a ,Y=c ) ILl(Y =c )i jl i ki k=/ Hl(x(j)=a ,Y=c )
6、i jl i k=-r=il(Y=c )i k i=1s.t. j = 1,2,3N;l = 1,2,3.Sj;k=1,2,3-K其中,N為總樣本數(shù),j為樣本的第j個(gè)特征。l為第j個(gè)特征可能取的第l個(gè)值,Sj為第j個(gè)特征所有可以取的值的個(gè)數(shù)。K為Y可取值的個(gè)數(shù)。即x,(j)表示第i個(gè)樣本的第j個(gè)特征。aj表示第j個(gè)特征取的第I個(gè)值。使用貝葉斯估計(jì)法估計(jì)先驗(yàn)概率和條件概率(這里使用的貝葉斯估計(jì)采用極大后驗(yàn)概率的思想)由極大似然估計(jì)可得到條件概率約束為:考慮先驗(yàn)概率:假設(shè)先驗(yàn)概率為均勻概率即:p=1/k;則:pk-1=0(9)進(jìn)行(9)*入+(8)二0(此公式的由來(lái)是極大化后驗(yàn)概率等價(jià)于結(jié)構(gòu)風(fēng)險(xiǎn)最
7、小化,(9)*入 可以認(rèn)為是先驗(yàn)概率做正則項(xiàng),(8)為似然函數(shù)。具體證明見(jiàn)文章“幾個(gè)證明”中的 第二證明題)。計(jì)算,有:1) pN -= q) = 0 i=l所以:其中,入為參數(shù),K為Y可取值的個(gè)數(shù)。在實(shí)際計(jì)算過(guò)程中,一般取入為1,做拉普拉斯平滑。同理得:條件概率的貝葉斯估計(jì)為:(X( j) =a I Y=c)= P( X(j)七 Yf)jlk(Y=c )jlHN + XkSjX + lLl(x(j) =a , Y=c ) X + Hi(Y =c ) i jl i ki k/N + XkXS +1Li(Y=c )/-N + X SkX + 1Li(x (j) =a , Y =c ) i jl
8、i k riN + XkSJ(入)=0,可以隨便取值)=X + 1Li(x (j) =a ,Y=c )/XS +藝I(Y =c ) i jl i kji ki=1i=1其中,N為總樣本數(shù),j為樣本的第j個(gè)特征。l為第j個(gè)特征可能取的第l個(gè)值,Sj 為第j個(gè)特征所有可以取的值的個(gè)數(shù)。K為Y可取值的個(gè)數(shù)。即x,(j表示第i個(gè)樣本 的第j個(gè)特征。a j,表示第j個(gè)特征取的第l個(gè)值。上述計(jì)算過(guò)程參考博客:5.結(jié)論極大似然估計(jì)提供了一種給定觀察數(shù)據(jù)來(lái)評(píng)估模型參數(shù)的方法,即:“模型已定, 參數(shù)未知”。即在頻率學(xué)派中,參數(shù)固定了,預(yù)測(cè)值也就固定了。最大后驗(yàn)概率 是貝葉斯學(xué)派在完全貝葉斯不一定可行后采用的一種近似手。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年濮陽(yáng)石油化工職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫(kù)含詳細(xì)答案解析
- 2026湖南張家界市經(jīng)濟(jì)發(fā)展投資集團(tuán)有限公司招聘職業(yè)經(jīng)理人1人考試重點(diǎn)試題及答案解析
- 2026湖北交通投資集團(tuán)有限公司招聘14人考試重點(diǎn)題庫(kù)及答案解析
- 2026年內(nèi)蒙古交通職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考題庫(kù)含詳細(xì)答案解析
- 2026年畢節(jié)幼兒師范高等專(zhuān)科學(xué)校高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026南平武發(fā)房產(chǎn)集團(tuán)有限公司職業(yè)經(jīng)理人招聘1人考試重點(diǎn)題庫(kù)及答案解析
- 2026廣東第二師范學(xué)院基礎(chǔ)教育集團(tuán)選聘1人考試重點(diǎn)題庫(kù)及答案解析
- 2026年江蘇農(nóng)牧科技職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫(kù)含詳細(xì)答案解析
- 2026年內(nèi)蒙古商貿(mào)職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026上半年安徽事業(yè)單位聯(lián)考銅陵市招聘108人參考考試試題及答案解析
- 海南省醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)量基本情況數(shù)據(jù)分析報(bào)告2025版
- 電影院消防安全制度范本
- 酒店工程維修合同協(xié)議書(shū)
- 2025年版?zhèn)€人與公司居間合同范例
- 電子商務(wù)平臺(tái)項(xiàng)目運(yùn)營(yíng)合作協(xié)議書(shū)范本
- 動(dòng)設(shè)備監(jiān)測(cè)課件 振動(dòng)狀態(tài)監(jiān)測(cè)技術(shù)基礎(chǔ)知識(shí)
- 第六講-女性文學(xué)的第二次崛起-80年代女性文學(xué)
- 專(zhuān)題15平面解析幾何(選擇填空題)(第一部分)(解析版) - 大數(shù)據(jù)之十年高考真題(2014-2025)與優(yōu) 質(zhì)模擬題(新高考卷與全國(guó)理科卷)
- 部門(mén)考核方案
- 苗木種子采購(gòu)合同范本
- 檢測(cè)費(fèi)合同范本
評(píng)論
0/150
提交評(píng)論