版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
機(jī)器翻譯與寫作Python自然語(yǔ)言處理第十一章CONTENT目錄
01機(jī)器翻譯02機(jī)器寫作課前回顧詞嵌入算法訓(xùn)練詞向量實(shí)踐循環(huán)神經(jīng)網(wǎng)絡(luò)Seq2Seq模型與實(shí)戰(zhàn)01機(jī)器翻譯機(jī)器翻譯的意義經(jīng)典的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型機(jī)器翻譯譯文質(zhì)量評(píng)價(jià)機(jī)器翻譯面臨的挑戰(zhàn)機(jī)器翻譯的意義克服人類交流的語(yǔ)言障礙機(jī)器翻譯能夠幫助不同語(yǔ)言的人自由地交流有意義的研究課題機(jī)器翻譯推動(dòng)自然語(yǔ)言處理的發(fā)展01機(jī)器翻譯機(jī)器翻譯的意義經(jīng)典的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型機(jī)器翻譯譯文質(zhì)量評(píng)價(jià)機(jī)器翻譯面臨的挑戰(zhàn)經(jīng)典的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型01-基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯02-從卷積序列到序列模型03-基于自注意力機(jī)制的Transformer模型01-基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯編碼器解碼器模型端到端模型基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型大致可分為端到端模型和編碼器解碼器模型翻譯模型-端到端模型端到端模型模型輸入“A"、”B"、“C",在輸入條件下依次生成輸出”W"、“X"、”Y"、“Z",其中”\<EOS>“為人為加入的句子結(jié)束標(biāo)志01-基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯翻譯模型-編碼器解碼器模型編碼器解碼器模型
01-基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯翻譯模型-編碼器解碼器模型編碼器解碼器模型優(yōu)勢(shì):解碼器在生成目標(biāo)語(yǔ)言的詞語(yǔ)時(shí),不僅考慮了源語(yǔ)言中的詞語(yǔ)的全局信息,還考慮了已經(jīng)生成的部分譯文。
01-基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯01-基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯基于循環(huán)神經(jīng)網(wǎng)絡(luò)的編碼器-解碼器框架基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯優(yōu)點(diǎn):
由于引入了長(zhǎng)短期記憶,神經(jīng)機(jī)器翻譯的性能獲得了大幅度提升,取得了與傳統(tǒng)統(tǒng)計(jì)機(jī)器翻譯相當(dāng)甚至更好的準(zhǔn)確率。不足: 1、不管是較長(zhǎng)的源語(yǔ)言句子,還是較短的源語(yǔ)言句子,編碼器都需將其映射成一個(gè)維度固定的向量,這對(duì)實(shí)現(xiàn)準(zhǔn)確的編碼提出了極大的挑戰(zhàn)。 2、對(duì)于較短的源語(yǔ)言句子,維數(shù)設(shè)置過(guò)大會(huì)浪費(fèi)存儲(chǔ)空間和訓(xùn)練時(shí)間;對(duì)于較長(zhǎng)的源語(yǔ)句子,維數(shù)設(shè)置過(guò)小會(huì)造成語(yǔ)義細(xì)節(jié)信息丟失的問(wèn)題?;谘h(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的優(yōu)缺點(diǎn)基于循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯基于注意力機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型基于注意力的神經(jīng)機(jī)器翻譯將源語(yǔ)言句子編碼為向量序列,而不是一個(gè)固定向量,在生成目標(biāo)語(yǔ)言詞語(yǔ)時(shí),能夠利用與生成該詞相關(guān)的源語(yǔ)言詞語(yǔ)信息,所對(duì)應(yīng)詞語(yǔ)在源語(yǔ)言中可以連續(xù)存在,也可以離散分布。從卷積序列到序列模型ConvS2S模型的架構(gòu)2017年5月,F(xiàn)acebookAI實(shí)驗(yàn)室提出將卷積神經(jīng)網(wǎng)絡(luò)引入序列到序列的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型,這樣既可以處理序列變長(zhǎng)的問(wèn)題,又可以實(shí)現(xiàn)在序列不同位置的并行計(jì)算。卷積序列到序列(ConvS2S)模型的結(jié)構(gòu)如右圖RNN的缺陷:由于下一個(gè)時(shí)刻的輸出要依賴于上一個(gè)時(shí)刻的輸出,從而導(dǎo)致無(wú)法在整個(gè)序列上進(jìn)行并行處理,引起訓(xùn)練時(shí)間過(guò)長(zhǎng)。從卷積序列到序列模型ConvS2S模型的架構(gòu)上左部分是編碼器,通過(guò)層疊的卷積抽取輸入序列的特征,通過(guò)門控線性單元的非線性變換得到相應(yīng)的隱層表示。下左部分是解碼器,采用與編碼器相同的層疊卷積運(yùn)算抽取輸出序列的特征,經(jīng)過(guò)門控線性單元激活做為編碼器的輸出。中間部分是注意力部分,把編碼器和解碼器的輸出做點(diǎn)乘運(yùn)算,作為輸入序列中每個(gè)詞的權(quán)重。中右部分是殘差連接部分,把注意力部分計(jì)算的權(quán)重與輸入序列相乘,然后加入到解碼器的輸出中得到最終的輸出序列。從卷積序列到序列模型ConvS2S模型的架構(gòu)該模型的編碼器和解碼器之間采用的是多步注意機(jī)制,即每個(gè)卷積層都進(jìn)行注意力建模,并且將上層卷積的輸出作為下一層的輸入,經(jīng)過(guò)層層堆疊得到最終的輸出?;谧宰⒁饬C(jī)制的Transformer模型RNN相關(guān)算法的限制:t時(shí)刻的計(jì)算依賴t-1時(shí)刻的計(jì)算結(jié)果,限制了模型的并行能力。順序計(jì)算的過(guò)程中信息會(huì)丟失,盡管LSTM等門機(jī)制的結(jié)構(gòu)在一定程度上緩解了長(zhǎng)期依賴的問(wèn)題,但對(duì)于特別長(zhǎng)期的依賴現(xiàn)象,LSTM等仍舊無(wú)能為力。基于自注意力機(jī)制的Transformer模型Transformer模型架構(gòu)
為了解決上述問(wèn)題,Google于2017提出了transformer模型。該模型采用注意力機(jī)制代替了RNN搭建整個(gè)模型框架。
提出了多重自注意力機(jī)制,在編碼器和解碼器中大量使用了多重自注意力機(jī)制?;谧宰⒁饬C(jī)制的Transformer模型
多重自注意力機(jī)制基于自注意力機(jī)制的Transformer模型
01機(jī)器翻譯機(jī)器翻譯的意義經(jīng)典的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型機(jī)器翻譯譯文質(zhì)量評(píng)價(jià)機(jī)器翻譯面臨的挑戰(zhàn)機(jī)器翻譯譯文質(zhì)量評(píng)價(jià)BLEUNISTMETEOR國(guó)際上用于評(píng)判機(jī)器翻譯系統(tǒng)好壞有3種指標(biāo):BLEU采用N-gram匹配規(guī)則比較并統(tǒng)計(jì)共同出現(xiàn)的元詞的個(gè)數(shù),即統(tǒng)計(jì)同時(shí)出現(xiàn)在系統(tǒng)譯文和參考譯文中的元詞的個(gè)數(shù),最后將匹配到的元詞的個(gè)數(shù)除以系統(tǒng)譯文的單詞數(shù)目,以此作為評(píng)測(cè)結(jié)果。不足之處:1、僅考慮了元詞的匹配度,沒有考慮語(yǔ)法上的準(zhǔn)確性。2、評(píng)測(cè)精度極易受到常用詞的干擾。3、對(duì)翻譯短句的評(píng)價(jià)存在偏差,有時(shí)短譯句的評(píng)測(cè)精度會(huì)偏高。4、沒有考慮到同義詞或相似表達(dá)的情況,因此在個(gè)別語(yǔ)句上可能表現(xiàn)不好。BLEU機(jī)器翻譯譯文質(zhì)量評(píng)價(jià)機(jī)器翻譯譯文質(zhì)量評(píng)價(jià)NIST方法是利用信息量公式求出每個(gè)元詞的信息量,對(duì)于在參考譯文中出現(xiàn)次數(shù)更少的元詞會(huì)賦予更高的權(quán)重來(lái)體現(xiàn)其所包含的信息量,然后累加起來(lái)再除以整個(gè)譯文的元詞片段數(shù)據(jù)。NIST對(duì)BLEU進(jìn)行了改進(jìn),采用算術(shù)平均來(lái)代替BLEU中的幾何平均,從而加大一元詞的共現(xiàn)次數(shù)對(duì)于評(píng)分結(jié)果的影響,同時(shí)還改進(jìn)了BLEU中的懲罰因子,減少了譯文長(zhǎng)度對(duì)評(píng)分結(jié)果的影響。特點(diǎn):NIST和BLEU一樣,都不是真正給出了系統(tǒng)的譯文與原文的相似度,而是利用已有的多個(gè)參考譯文對(duì)系統(tǒng)譯文進(jìn)行打分,因此原文并不會(huì)影響翻譯系統(tǒng)的得分。但是參考譯文的數(shù)量和質(zhì)量卻是影響翻譯系統(tǒng)評(píng)測(cè)的關(guān)鍵因素。NISTMETEOR方法是一種基于單精度的加權(quán)調(diào)和平均數(shù)和單字召回率的方法。特點(diǎn): 它不希望生成塊狀的譯文,如參考譯文是“ABCD”,而模型給出的譯文是“BADC”,雖然每一個(gè)一元詞都對(duì)上了,但這個(gè)模型仍會(huì)受到很重的懲罰,METEOR是考慮了基于整個(gè)語(yǔ)料庫(kù)的準(zhǔn)確率和召回率而最終得出分值。METEOR機(jī)器翻譯譯文質(zhì)量評(píng)價(jià)01機(jī)器翻譯機(jī)器翻譯的意義經(jīng)典的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型機(jī)器翻譯譯文質(zhì)量評(píng)價(jià)機(jī)器翻譯面臨的挑戰(zhàn)機(jī)器翻譯面臨的挑戰(zhàn)挑戰(zhàn)模型的可解釋性先驗(yàn)知識(shí)的使用深層次語(yǔ)言知識(shí)的應(yīng)用多語(yǔ)言機(jī)器翻譯多模態(tài)翻譯低資源語(yǔ)言的翻譯機(jī)器翻譯面臨的挑戰(zhàn)模型的可解釋性基于編碼器解碼器結(jié)構(gòu)的神經(jīng)機(jī)器翻譯,實(shí)現(xiàn)了源語(yǔ)言到目標(biāo)語(yǔ)言的直接翻譯,但相比統(tǒng)計(jì)機(jī)器翻譯,神經(jīng)機(jī)器翻譯過(guò)程更類似在黑盒中運(yùn)行,難以從語(yǔ)言學(xué)的角度對(duì)翻譯過(guò)程進(jìn)行解釋。先驗(yàn)知識(shí)的使用以離散符號(hào)表示的外部資源,如句法標(biāo)注、詞性標(biāo)注、雙語(yǔ)詞典等是非常重要的先驗(yàn)知識(shí),在神經(jīng)機(jī)器翻譯中難以得到充分的利用。深層次語(yǔ)言知識(shí)的應(yīng)用自然語(yǔ)言具有歧義性,需要背景知識(shí)的支持才能完成消歧任務(wù)。神經(jīng)機(jī)器翻譯大多是詞語(yǔ)級(jí)的序列到序列的模型,對(duì)語(yǔ)言知識(shí)的應(yīng)用不夠全面,層次不夠深入。機(jī)器翻譯面臨的挑戰(zhàn)多語(yǔ)言機(jī)器翻譯在多語(yǔ)平行語(yǔ)料,或者多語(yǔ)可比語(yǔ)料基礎(chǔ)上研究基于神經(jīng)網(wǎng)絡(luò)的多語(yǔ)言機(jī)器翻譯,不僅具有學(xué)術(shù)價(jià)值同樣具有很高的實(shí)用價(jià)值,也是未來(lái)重要的發(fā)展方向。多模態(tài)翻譯傳統(tǒng)神經(jīng)機(jī)器翻譯過(guò)程中,文本翻譯過(guò)程與翻譯場(chǎng)景等信息是相互獨(dú)立的,因此,導(dǎo)致神經(jīng)機(jī)器翻譯的結(jié)果往往不夠智能,不能自適應(yīng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 急腹癥護(hù)理未來(lái)趨勢(shì)視頻
- 產(chǎn)科護(hù)理中的健康教育
- 2025年別墅裝修合同
- 2025年白內(nèi)障術(shù)后藥物治療合同協(xié)議
- 2026 年人民幣匯率展望:2026 年人民幣匯率大概率穩(wěn)步升值
- 多模態(tài)交互在視覺設(shè)計(jì)中的融合
- 聯(lián)考數(shù)學(xué)推理題庫(kù)及答案
- 2026 年中職酒店管理(酒店管理理論)試題及答案
- 會(huì)計(jì)個(gè)人考試題庫(kù)及答案
- 辦公設(shè)備回收服務(wù)合同(2025環(huán)??蚣軈f(xié)議)
- 2025年植物標(biāo)本采集合同協(xié)議
- 2025天津市第二批次工會(huì)社會(huì)工作者招聘41人考試筆試參考題庫(kù)及答案解析
- 膽管重復(fù)畸形健康宣教
- 2025秋人教精通版英語(yǔ)小學(xué)五年級(jí)上冊(cè)知識(shí)點(diǎn)及期末測(cè)試卷及答案
- 校園反恐防暴2025年培訓(xùn)課件
- 2026年安徽城市管理職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試模擬測(cè)試卷附答案
- 2025甘肅省水務(wù)投資集團(tuán)有限公司招聘企業(yè)管理人員筆試備考題庫(kù)附答案解析
- 2025山東壹通無(wú)人機(jī)系統(tǒng)有限公司暨三航無(wú)人系統(tǒng)技術(shù)(煙臺(tái))有限公司社會(huì)招聘筆試現(xiàn)場(chǎng)及筆試歷年參考題庫(kù)附帶答案詳解
- 2025年秋季學(xué)期國(guó)家開放大學(xué)《人文英語(yǔ)4》期末機(jī)考精準(zhǔn)復(fù)習(xí)題庫(kù)
- 神經(jīng)內(nèi)科三基考試題庫(kù)及答案
- 6秒鐘情商讓你遠(yuǎn)離情緒綁架
評(píng)論
0/150
提交評(píng)論