第二組《勒曼談機器翻譯》外12.11 李佩 趙思雨_第1頁
第二組《勒曼談機器翻譯》外12.11 李佩 趙思雨_第2頁
第二組《勒曼談機器翻譯》外12.11 李佩 趙思雨_第3頁
第二組《勒曼談機器翻譯》外12.11 李佩 趙思雨_第4頁
第二組《勒曼談機器翻譯》外12.11 李佩 趙思雨_第5頁
已閱讀5頁,還剩35頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

外12級11班李佩1204021134趙思雨1204021130從《勒曼談機器翻譯》出發(fā)談機器翻譯機器翻譯的概念機器翻譯的發(fā)展道路

機器翻譯方法簡介

機器翻譯存在的問題關于機器翻譯的幾點思考目錄(一)概念理解機器翻譯(machinetranslation),又稱為自動翻譯,是利用計算機把一種自然源語言轉變?yōu)榱硪环N自然語言的過程,一般指自然語言之間句子和全文的翻譯。機器翻譯的概念自然語言處理機器翻譯計算機語言學自然語言理解分支(四)工作原理機器翻譯的原理簡單地說就是讓機器模擬人的翻譯過程。----《中國的機器翻譯》在存儲器中存儲機器詞典和機器語法查詞典選擇所需要意義明確各個詞間的關系組成譯文翻譯時翻譯前(三)可實現(xiàn)性·機器翻譯之可能實現(xiàn),還在于語言的可譯性和翻譯工作的可模擬性。----《中國的機器翻譯》·一種語言有許多句子可以很容易地作為整個單位譯成另一種語言。----《勒曼談機器翻譯》機器翻譯的概念機器翻譯是語言學、數(shù)學、計算機技術、自動化等科學部門共同研究的對象。----《中國的機器翻譯》(五)涉及領域提供詞典和語法規(guī)則研制便于翻譯的計算機解決外部設備問題語言學工作者自動化工作者將材料代碼化和程序化機器翻譯的概念數(shù)學工作者計算機工作者研究價值(六)研究價值機器翻譯的概念·不同國家的人無論是面對面交流,還是通過互聯(lián)網(wǎng)交流,都需要機器翻譯的幫助。·國際會議時產生大量的多語言文本,要人工逐一翻譯這些文本既費時又費力,使用機器翻譯則可以減少人量的人力資本消耗,使翻譯工作省時省力?!膶W術角度看,機器翻譯也是一個非常有意義的研究課題。機器翻譯的研究具有重大的社會意義和經濟價值。產生·很久以來,人們就夢想著有朝一日,能造出一種設備,清除人類交流過程中的“語言障礙”,使得使用不同語言的人能自由地相互交流?!ぴ诋敶畔⑸鐣?語言障礙問題更加突出。大量的政府文件、商業(yè)以及科技資料都需要在短時期內得到翻譯,互聯(lián)網(wǎng)的問世更是擴大了翻譯需求。機器翻譯應運而生。機器翻譯的發(fā)展道路開創(chuàng)期(1947-1964)受挫期(1964-1975)恢復期(1975-1989)新時期(1990至今)發(fā)展道路1954年,美國喬治敦大學在IBM公司協(xié)同下,用IBM-701計算機首次完成了英俄機器翻譯試驗,拉開機器翻譯研究的序幕?!?964年,美國科學院成立了語言自動處理咨詢委員會?!?966年11月,該委員會公布了一個題為《語言與機器》的報告,建議停止對機器翻譯項目的資金支持。開創(chuàng)期(1947-1964)受挫期(1964-1975)恢復期(1975-1989)新時期(1990至今)發(fā)展道路·國與國之間的語言障礙顯得更為嚴重,傳統(tǒng)的人工作業(yè)方式已經遠遠不能滿足需求。·計算機科學、語言學研究的發(fā)展,從技術層面推動了機器翻譯研究的復蘇,機器翻譯項目又開始發(fā)展起來?!と藗儗τ跈C器翻譯的需求空前增長,機器翻譯迎來了一個新的發(fā)展機遇,國際性的關于機器翻譯研究的會議頻繁召開?!ぴ谑袌鲂枨蟮耐苿酉?,商用機器翻譯系統(tǒng)邁入了實用化階段,走進了市場,來到了用戶面前。機器翻譯的發(fā)展道路《勒曼談機器翻譯》機器翻譯設想

語言模式和理論程序編制機器翻譯方法分類基于規(guī)則的機器翻譯基于統(tǒng)計的機器翻譯

基于實例的機器翻譯機器翻譯的方法簡介勒曼(Winfred.Lehman):

美國德克薩斯州奧斯丁市德克薩斯大學語言學主任,兼政府主辦的機器翻譯和發(fā)展語言學計算機系統(tǒng)研究計劃的主要審查人。在他談機器翻譯的文章發(fā)表后,在近十多年來,機器翻譯的理論雖有進展,但本文仍不失為重要的參考資料之一?!独章剻C器翻譯》《勒曼談機器翻譯》語言的語法和詞典是能夠規(guī)范得十分完善使計算機能夠利用它們的。一、機器翻譯設想語言學家必須精確地規(guī)定計算機所遵循的程序和它處理的語言材料的程序必須制定一種語言模式和理論所涉及語言的語法所涉及語言的詞典《勒曼談機器翻譯》二、語言的模式和理論語言的主要困難也許就是以一系列不同平面或層次形式出現(xiàn)的語言結構,語言學家常把這種結構稱作層次結構。例1.逐詞譯法源語言(德語)目標語(英語)DiesekurzegemeinsameüberlegungisteineArtExperientmitunsselbstgewesen.Thisshortjointreflectionhasbeenakindofexperimentwithourselves.Thisshortjointreflectionhasakindofjointexperimentwithourselvesbeen.(逐詞譯法)例2.《勒曼談機器翻譯》/s/與/z/在語言不同部分的作用1)在語音系統(tǒng)中2)在語法系統(tǒng)中zip/s//z/sipprice/s/prize/z/可數(shù)名詞復數(shù):dogs/z/cats/s/第三人稱單數(shù):Hetakes/s/BusNo.4toschool.Hebuys/z/asinglenewshirteachmonth./s/和/z/是不同的項目/s/和/z/在某些情況下是等值的語言的不同部分中同一項的作用是有差別的例3.《勒曼談機器翻譯》動詞go的意義2)He’sgoingtomorrow.3)He’sgoingsteady.1)He’sgoingtotown.Heisbeinginlove.走,離開為了簡單的說明意義上的差別,可以比照語音層次和語法層次,設置語義層次和語法層次?!独章剻C器翻譯》美國德克薩斯大學語言研究中心的分析系統(tǒng)和程序編制系統(tǒng),就是把語言看做層次體系的。詞匯層次語義層次句法層次處理語言的單詞把形式單位聚合在一起把單詞彼此加以聯(lián)系例4.美國德克薩斯大學語言研究中心三、程序編制《勒曼談機器翻譯》裝置一裝置二裝置四裝置三處理計算機所提出的要求(接收器)處理要加工的語言材料處理計算機所產生和存儲的語言把對材料的分析與第二種語言所期望的分析相匹配聽進語言材料同語言知識相匹配程序的兩個目的:1)對材料按詞匯、句法和語義等不同層次加以分析2)把這種分析通第二種語言所期望的分析相匹配目的一目的二《勒曼談機器翻譯》小結·《勒曼談機器翻譯》一文談到了機器翻譯的可實現(xiàn)性及其在文學作品翻譯方面的局限性?!の恼掠煤啙嵣鷦拥恼Z言介紹了機器翻譯的設想依據(jù)、機器翻譯對語言的要求、程序的編制等問題。·但文章對機器翻譯方法的分類和技術處理等具體問題的介紹仍有不足之處。機器翻譯方法分類基于統(tǒng)計的方法(SBMT)基于實例的方法(EBMT)基于規(guī)則的方法(RBMT)基于語料庫方法(CBMT)機器翻譯的方法(MachineTranslation/MT)機器翻譯方法分類--RBMT·基于規(guī)則的機器翻譯方法把翻譯過程看作是一個在語言學知識引導下的符號變換過程。

--《機器翻譯與語言研究》一、基于規(guī)則的方法·基于規(guī)則的機器翻譯方法,主要是依靠語言學家總結歸納的語言翻譯規(guī)則庫,對源語言的句子進行語法、句法和詞法詞性分析,然后按照相應的語法規(guī)則進行判斷和推導,最后生成等價的目標語言語句,得出翻譯結果。--《基于實例機器翻譯方法_EBMT_的分析與探究》(一)概念理解機器翻譯方法分類(二)RBMT翻譯過程機器翻譯方法分類--RBMT源語言的分析轉換目標語的生成(三)實例分析1)源語言的詞法分析2)源語言詞串的句法分析3)源語言到目標語言的句法結構轉換4)目標語言結構的調整5)源語言文本單詞的譯詞選擇6)目標語言詞串的生成以把“她把一束花放在桌上?!弊g為英語為例分析轉換生成機器翻譯方法分類--RBMT1)源語言的詞法分析這一階段利用源語言詞匯層面的知識,識別出源語言文本字符串中的單詞,并從詞典中獲得每個單詞的句法語義知識,以備在后續(xù)處理中使用。她把一束花放在桌上。rpmqnvpngfw代詞介詞數(shù)詞量詞名詞動詞介詞名詞性語系方位詞標點符號機器翻譯方法分類--RBMT2)源語言詞串的句法分析為得到句法結構以及跟結構相關的特征結構,這一階段的處理需要運用句法層面的知識,指明短語的組成關系。她把一束花放在桌上。rpmqnvpngfwspvpppnpmpnpppvpnpdjzj機器翻譯方法分類--RBMT3)源語言到目標語言的句法結構轉換結構轉換主要利用源語言結構和目標語言結構之間的對應關系進行,通過一組轉換規(guī)則的指導把源語言的句法樹轉換成目標語言的句法樹。機器翻譯方法分類--RBMT4)目標語言結構的調整通常經過結構轉換得到的句法結構還保留著源語言結構的諸多痕跡,尚需根據(jù)目標語言的句法知識對該結構進行調整。源語言目標語5)源語言文本單詞的譯詞選擇譯詞選擇主要利用兩種語言之間的詞匯對譯知識進行如何選擇正確的譯詞不僅要依賴于雙語對照詞典,同時還要綜合考慮該單詞的上下文語境。機器翻譯方法分類--RBMT她放一束花上桌。She

putabunchflowerontable.她放一束花上桌。She

putabunchflowerontable.6)目標語言詞串的生成利用得到的目標語言句法結構以及經過譯詞選擇得到的目標詞語生成目標語言詞串.機器翻譯方法分類--RBMTsofs機器翻譯方法分類--RBMT(三)RBMT的優(yōu)點和缺點1.規(guī)則的主觀性強,規(guī)則的一致性難以保障;2.知識獲取難、工作量大;3.不利于系統(tǒng)擴充,尤其對非規(guī)范的特殊語言現(xiàn)象缺乏相應的處理能力。1.不同語種在語法上的依存度很低、處理能力較強;2.具有對知識表達的抽象程度高、代表性強的特點;3.對文法結構具有很強的保持能力。

機器翻譯方法分類--SBMT二、基于統(tǒng)計的方法(一)概念理解·SBMT是一種間接地使用語料庫的機器翻譯方法,將語料庫作為獲取翻譯規(guī)則信息的依據(jù),通過相關概率的計算,使用純數(shù)學的方法對待譯文本進行“翻譯”(轉換)。

----《基于實例英漢翻譯系統(tǒng)研究與實現(xiàn)》·思想萌芽——Weaver發(fā)表的以《翻譯》為題的備忘錄中就提出:“當我閱讀一篇用俄語寫的文章的時候,我可以說,這篇文章實際上是用英語寫的,只不過它是用另外一種奇怪的符號編了碼而已,當我在閱讀時,我是在進行解碼?!睓C器翻譯方法分類--SBMT(二)SBMT分類基于統(tǒng)計的機器翻譯方法大體上分為以下三類基于平行概率語法的統(tǒng)計機器翻譯方法基于信源信道模型的統(tǒng)計機器翻譯方法基于最大熵的統(tǒng)計機器翻譯方法·一種語言中的任何一個句子都有可能是另外一種語言中某個句子的譯文,只不過可能性大小不同,而取可能性最大的那個譯文應該是風險最小的?!痘谡Z義語言機器翻譯系統(tǒng)的若干問題的研究》機器翻譯方法分類--RBMT基本思想是——把機器翻譯看成是一個信息傳輸?shù)倪^程,用一種信源信道模型對機器翻譯進行解釋。(二)基于信源信道模型的統(tǒng)計機器翻譯方法S噪聲信道T源語言目標語言輸入輸出機器翻譯方法分類--SBMT(三)SBMT的優(yōu)點和缺點1.資源豐富,易于實現(xiàn);2.良好的統(tǒng)計翻譯模型能夠融合更多的句法結構和語義、語法信息;3.統(tǒng)計機器翻譯的翻譯性能可通過大規(guī)模語料訓練進行改善。1.系統(tǒng)運行消耗的資源巨大,需要大規(guī)模雙語平行語料庫進行訓練學習,語料的選擇和處理工程量也很巨大。2.有些詞出現(xiàn)頻率低、用法不常見,統(tǒng)計模型就無法準確判斷詞義和詞的位置。機器翻譯方法分類--EBMT二、基于實例的方法·思想萌芽——長尾真指出:“人類在翻譯一個簡單句子的時候,并不會作深層次的語法分析,而是首先將源語句適當?shù)胤譃槿舾啥陶Z片段然后再把這些短語翻譯成目標語言,最后把翻譯好的短語片段恰當?shù)亟M合成為一個句子。而對每一個短語片段則是用相應的例子作為參考,通過類推原則進行翻譯的?!蹦7氯祟惙g外語過程中的基本模式將源語句分解為短語片段并在一個實例庫的基礎上對其進行匹配確定這些短語片段所對應的目標語言的短語片段將翻譯好的目標語言的短語片段進行適當重組,構成一個完整的目標語言句子(一)概念理解匹配對齊重組機器翻譯方法分類--EBMT(二)基本原理·EBMT在譯文轉換時,從實例庫中搜索出一個與輸入句最相似的例句,并仿照實例庫中例句的翻譯方式進行輸入句的翻譯。源語言S最相似句S’模擬S’的譯語T’構成S的譯語T例將“WearestudyingChinese.”譯成中文源語言SWearestudyingChinese.最相似句S’WearestudyingEnglish.我們正在學習英語。WeareresearchingChinese.我們正在研究漢語。模擬S’的譯語T’構成S的譯語T我們正在學習漢語。機器翻譯方法分類--EBMT(三)EBMT的優(yōu)點和缺點1.相似度計算困難;2.大規(guī)模獲取語言知識的代價非常大,對于詞法、語法和語義規(guī)則的概括難以全面。1、不需要編寫規(guī)則;2、系統(tǒng)容易維護;3、容易產生高質量譯文;4、需要的相關語言知識少。3.覆蓋率低4.存在匹配錯誤和對齊問題機器翻譯方法分類--小結小結·基于規(guī)則和基于語料庫的機器翻譯方法優(yōu)缺點各異,使用不同方法研制的機器翻譯系統(tǒng)的性能表現(xiàn)也不盡相同,對譯文質量的保障程度深淺不一,翻譯精度也還不盡如人意?!と绾瓮ㄟ^規(guī)則和語料庫方法的有機結合,實現(xiàn)相互取長補短的新理論和新方法,是機器翻譯研究人員普遍關注的研究熱點。(一)回顧

一般機器翻譯的方法因語法、詞匯、句法發(fā)生變化或不規(guī)則,出現(xiàn)錯誤在所難免機器翻譯存在的問題

翻譯質量還還不夠高(二)機器翻譯存在問題機器翻譯存在的問題1.誤差難免例1.《大話西游》中:“給我一個殺你的理由,”先狀語后置Givemeareasontokillyou,first.機譯結果:

翻譯的結果還不夠可信正確結果:Firstly,givemeareasont

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論