機(jī)器學(xué)習(xí)實(shí)戰(zhàn):貝葉斯垃圾郵件判斷APP_第1頁(yè)
機(jī)器學(xué)習(xí)實(shí)戰(zhàn):貝葉斯垃圾郵件判斷APP_第2頁(yè)
機(jī)器學(xué)習(xí)實(shí)戰(zhàn):貝葉斯垃圾郵件判斷APP_第3頁(yè)
機(jī)器學(xué)習(xí)實(shí)戰(zhàn):貝葉斯垃圾郵件判斷APP_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、機(jī)器學(xué)習(xí)實(shí)戰(zhàn):貝葉斯垃圾郵件判斷APP、,、刖百在數(shù)據(jù)大爆炸的時(shí)代每個(gè)人每天都會(huì)收到大量的垃圾郵件,由于用傳統(tǒng)的判斷方式不好辨別,而通過(guò)使用貝葉斯可以準(zhǔn)確的辨別垃圾郵件。貝葉斯公式噸=刀K爲(wèi)爲(wèi))貝葉斯公式其中B1,B2,.,Bn為完備事件組P(A)表示:事件A發(fā)生概率P(B)表示:事件B發(fā)生概率P(AAB)表示:事件A與事件B同時(shí)發(fā)生的概率P(A|B)表示:在事件B發(fā)生的情況下,事件A發(fā)生概率貝葉斯公式推導(dǎo)因?yàn)闂l件概率公式所以變換一下因此P(AB)P(B)=P(BA)P(A)再變換一下所以最后變換一下貝葉斯推斷p(n小變換一下的貝葉斯公式先驗(yàn)概率:事件B發(fā)生之前,對(duì)事件A的一個(gè)判斷后驗(yàn)概率:事

2、件B發(fā)生之后,對(duì)事件A的重新評(píng)估可能性函數(shù):調(diào)整因子,使得預(yù)估概率更接近真實(shí)概率后驗(yàn)概率=先驗(yàn)概率X調(diào)整因子這就是貝葉斯推斷的含義。我們先預(yù)估一個(gè)先驗(yàn)概率,然后加入實(shí)驗(yàn)結(jié)果,看這個(gè)實(shí)驗(yàn)到底是增強(qiáng)還是消弱了先驗(yàn)概率,由此得到更接近事實(shí)的后驗(yàn)概率。辨別垃圾郵件假設(shè)事件A1:為垃圾郵件事件事件A2:為正常郵件事件事件B:為郵件中包含發(fā)票這個(gè)詞的事件待求包含發(fā)票這個(gè)詞的郵件是垃圾郵件的概率即P(A1|B)包含發(fā)票這個(gè)詞的郵件是正常郵件的概率即P(A2|B)結(jié)論如果P(A1|B)-P(A2|B)0表示包含發(fā)票這個(gè)詞的郵件是垃圾郵件的概率比正常郵件大因此判斷它為垃圾郵件,反之為正常郵件。因?yàn)镻(A1|B)

3、-P(A2|B)等價(jià)于P(B|A1)P(A1)-P(B|A2)P(A2)所以通過(guò)求P(B|A1)P(A1)-P(B|A2)P(A2)就可判斷當(dāng)前郵件是不是垃圾郵件其中P(A1):為垃圾郵件概率P(A2):為正常郵件概率P(B|A1):為垃圾郵件中包含發(fā)票的概率P(B|A2):為正常郵件中包含發(fā)票的概率貝葉斯應(yīng)用P(BA)P(A)P(B)核心公式其中P(A1):為垃圾郵件概率P(A2):為正常郵件概率P(B|A1):為垃圾郵件中包含發(fā)票的概率P(B|A2):為正常郵件中包含發(fā)票的概率為什么要用貝葉斯P(A1|B):包含發(fā)票的郵件是垃圾郵件的概率(無(wú)法統(tǒng)計(jì))P(B|A1):垃圾郵件中包含發(fā)票這個(gè)詞的概率(可以統(tǒng)計(jì))通過(guò)貝葉斯我們可以把不可統(tǒng)計(jì)的P(A1|B)轉(zhuǎn)換成可統(tǒng)計(jì)的P(B|A1),這就是貝葉斯的強(qiáng)大之處運(yùn)行結(jié)果項(xiàng)目介紹因?yàn)楸救吮容^

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論