【畢業(yè)學(xué)位論文】虛詞用法自動識別及其在依存句法分析中的應(yīng)用研究-信息工程_第1頁
【畢業(yè)學(xué)位論文】虛詞用法自動識別及其在依存句法分析中的應(yīng)用研究-信息工程_第2頁
【畢業(yè)學(xué)位論文】虛詞用法自動識別及其在依存句法分析中的應(yīng)用研究-信息工程_第3頁
【畢業(yè)學(xué)位論文】虛詞用法自動識別及其在依存句法分析中的應(yīng)用研究-信息工程_第4頁
【畢業(yè)學(xué)位論文】虛詞用法自動識別及其在依存句法分析中的應(yīng)用研究-信息工程_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

【畢業(yè)學(xué)位論文】虛詞用法自動識別及其在依存句法分析中的應(yīng)用研究-信息工程.pdf 免費下載

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

學(xué) 校 代 碼 10459 學(xué)號或申請?zhí)?201012171872 密 級 碩 士 學(xué) 位 論 文 虛詞用法 自動識別及其 在依存句法分析中的應(yīng)用 研究 作 者 姓 名:張靜杰 導(dǎo) 師 姓 名:昝紅英 教授 學(xué) 科 門 類:工 學(xué) 專 業(yè) 名 稱: 計算機軟件與理論 培 養(yǎng) 院 系:信息工程學(xué)院 完 成 時 間: 2013年 5 月 A y 013 摘要 I 摘 要 現(xiàn)代漢語中詞語 主要分為 實詞和虛詞 兩大類,其中虛詞包含副詞、介詞、連詞、語氣詞、方位詞、助詞等 。虛詞不能充當(dāng)句法成分, 但 用法比較復(fù)雜 多樣 。同一個虛詞在不同的上下文中詞性不同,即使詞性相同,在不同 語境中 的用法也可能不同。因此需要對虛詞的各種用法進行具體的分析和研究,為文本的理解提供方便,也有利于現(xiàn)代漢語的深入研究。 本文在構(gòu)建的 “ 三位一體 ” 虛詞用法知識庫的基礎(chǔ)上, 以副詞為例, 分別采用了基于規(guī)則 和基于統(tǒng)計的方法對現(xiàn)代漢語 副 詞用法進行自動識別的研究,其中在基于統(tǒng)計的方法中分別使用了條件隨機場模型、最大熵模 型和支持向量機模型進行研究分析。實驗結(jié)果表明,基于統(tǒng)計的 副 詞 用法自動識別的效果在總體上要優(yōu)于基于規(guī)則的方法,而且三種統(tǒng)計模型中以支持向量機模型的效果最好,但從單個用法的識別角度分析,一些用法在基于規(guī)則的方法上識別的效果較好。因此,本文結(jié)合基于規(guī)則和基于統(tǒng)計兩種方法的優(yōu)點,提出了規(guī)則和統(tǒng)計相結(jié)合的思想。實驗結(jié)果表明,采用規(guī)則和統(tǒng)計相結(jié)合的方法在 副詞 用法自動識別研究中取得較好的效果。 在虛詞用法自動識別研究的基礎(chǔ)上,本文分析了其在漢語依存句法分析中的應(yīng)用。對漢語依存句法進行分析時,采用哈爾濱工業(yè)大學(xué)的 庫以及語言技術(shù)平臺 共有 24 種 依存關(guān)系 。 通過 對 依存句法分析的功能進行詳細分析,發(fā)現(xiàn)其中的并列關(guān)系識別效果較差。本文對并列關(guān)系中的標注情況進行了分類總結(jié),根據(jù)連詞用法識別出句子中的并列結(jié)構(gòu)短語,根據(jù)識別結(jié)果對依存句法分析的結(jié)果進行處理,從而提高漢語依存句法分析中并列關(guān)系的識別效果。實驗結(jié)果表明,采用并列結(jié)構(gòu)信息后,并列關(guān)系的識別 效果明顯提高 。 關(guān)鍵詞: 虛詞用法 自動識別 規(guī)則與統(tǒng)計結(jié)合 并列關(guān)系 依存句法分析I of as of in if of it is to on of it of of In it of On is in in of is on to of of in on On of it TP 4 It of is up of II of of be to of is 錄 錄 摘 要 . I . 表目錄 . 引言 .究意義 .究的背景 .文研究工作 .文結(jié)構(gòu)框架 . 相關(guān)研究 .代漢語虛詞用法知識庫 . 現(xiàn)代漢語虛詞用法詞典 . 7 代漢語虛詞用法規(guī)則庫 . 9 代漢語虛詞用法語料庫 . 10 存句法分析 . 11 存句法分析的研究 . 12 語依存句法分析的研究現(xiàn)狀 . 14 章小結(jié) . 現(xiàn)代漢語虛詞用法自動識別 .于規(guī)則的虛詞用法自動識別研究 .于統(tǒng)計的虛詞用法自動識別研究 .錄 V 件隨機場模型 . 22 大熵模型 . 24 持向量機模型 . 26 則與統(tǒng)計相結(jié)合的虛詞用法自動識別研究 .章小結(jié) . 虛詞用法識別在依存句法分析中的應(yīng)用 .的依存句法分析 .詞結(jié)構(gòu)短語在依存句法分析中的應(yīng)用 . 并列關(guān)系的識別情況 . 34 詞用法在并列關(guān)系識別中的應(yīng)用 . 36 他虛詞的用法在依存句法分析中的應(yīng)用 .章小結(jié) . 結(jié)論與展望 .論 .望 .考文獻 .人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文及研究成果 .人簡歷 .學(xué)期間發(fā)表的學(xué)術(shù)論文 .謝 .錄 圖表目錄 圖目錄 圖 1. 1 例句( 1)的依存句法分析結(jié)果 . 1 圖 1. 2 例句( 2)的依存句法分析結(jié)果 . 2 圖 1. 3 例句( 3)的依存句法分析結(jié)果 . 3 圖 1. 4 例句( 4)的依存句法分析結(jié)果 . 3 圖 1. 5 例句( 5)的依存句法分析結(jié)果 . 3 圖 2. 1 例句( 1)的句法分析結(jié)果 . 12 圖 3. 1 虛詞用法自動標注系統(tǒng)流程圖 . 17 圖 3. 2 三種統(tǒng)計模型結(jié)果對比 . 27 圖 3. 3 規(guī)則與統(tǒng)計相結(jié)合方法的流程圖 . 28 圖 3. 4 規(guī)則、統(tǒng)計以及相結(jié)合實驗結(jié)果對比 . 30 圖 4. 1 例句( 1)的句法分析結(jié)果 . 33 圖 4. 2 例句( 2)的句法分析結(jié)果 . 35 圖 4. 3 例句( 3)的句法分析結(jié)果 . 35 圖 4. 4 例句( 4)的依存句法分析結(jié)果 . 36 圖 4. 5 例句( 5)標準依存分析圖 . 37 圖 4. 6 例句( 5) 存分析圖 . 39 圖 4. 7 例句( 5)優(yōu)化后的依存分析圖 . 40 圖 4. 8 例句( 6)的句法分析結(jié)果 . 42 圖 4. 9 例句( 7)的句法分析結(jié)果 . 42 表 目錄 表 2. 1 副詞“都”部分屬性用法詞典樣例 . 8 表 3. 1 副詞“都”的用法分布 . 19 表 3. 2 基于規(guī)則的副詞“都”的用法自動識別 . 20 表 3. 3 基于規(guī)則方法的副詞用法自動識別 . 20 表 3. 4 型中副詞“都”的數(shù)據(jù)轉(zhuǎn)換示例 . 23 表 3. 5 基于 型不同窗口的實驗結(jié)果 . 23 表 3. 6 基于 副詞“都”各用法識別情況 . 24 表 3. 7 基于 法的副詞用法識別情況 . 24 表 3. 8 基于 法的副詞用法識別情況 . 25 表 3. 9 基于 法的副詞用法識別情況 . 26 表 3. 10 規(guī)則與統(tǒng)計相結(jié)合的副詞“都”用法自動識別 . 29 表 3. 11 規(guī) 則與統(tǒng)計相結(jié)合的副詞用法識別情況 . 30 目錄 4. 1 24 種依存關(guān)系的識別情況 . 32 表 4. 2 并列關(guān)系識別錯誤分類 . 34 表 4. 3 加入連詞用法前后 識別結(jié)果對比 . 41 1 引言 1 1 引言 究意義 漢語中的詞語分為實詞和虛詞兩大類別,實詞主要包括形容詞 、 名詞、動詞等,虛詞一般由連詞、副詞、介詞、語氣詞、方位詞、助詞等組成。從功能的角度分析,實詞含有實際的意義,可以在句子中充當(dāng)主語、謂語、賓語 等 句子成分,而虛詞不能充當(dāng)任何句法成分。從意義上來看,實詞表示時間、事 物 、動作、處所等內(nèi)容,虛詞只有語法意義,表示某些邏輯概念或者起到一些語法作用。 虛詞在漢語中有著非常重要 的地位, 中文的句法手段主要是詞序和虛詞 1。漢語既沒有蒙語、日語等語言里的黏附形式,也沒有英語、俄語、法語等語言中的形態(tài)標志和屈折變化 2。因此,在漢語中無法通過語言的黏附形式、形態(tài)標志、屈折變化等信息表達的語義和語法任務(wù),常常由虛詞來完成。從這個角度分析,對現(xiàn)代漢語中的虛詞進行研究,對中文的語言處理和語言理解有重要作用。 本文 中廣義虛詞主要包含連詞、副詞、介詞、語氣詞、方位詞、助詞等。同一虛詞在不同 的上下文中可以顯示不同的詞性,在句子中的語法意義不同,所表達的意思自然也不同,如以下例句: ( 1)他們組建了自己的運輸公司、營銷隊伍, 和 市場直接接軌。 ( 2)貴州南部、江南、華南西部 和 華北將有小到中雨。 圖 1. 1 例句( 1)的依存句法分析結(jié)果 例句( 1)的依存句法分析結(jié)果如圖 示,句子中的“和”為介詞,表示與某種事物有聯(lián)系,介詞“和”與名詞“市場”構(gòu)成介賓關(guān)系 后與動詞“接軌”構(gòu)成狀中結(jié)構(gòu) 句( 2)的依存句法分析結(jié)果如圖 示,句 他們 建 了 自己 的 運輸 公司 、 營銷 隊伍 E 市場 直接 接軌 r v u r u v n v n p n a v 引言 2 子中的“和”為連詞,用于連接結(jié)構(gòu)或者類別相同(或者相近)的并列成分,表示平等的聯(lián)合關(guān)系,將句子中的“貴州南部”、“江南”、“華南西部”、“華北”等成分聯(lián)系起來組成并列關(guān)系,充當(dāng)句子的主語。 圖 1. 2 例句( 2)的依存句法分析結(jié)果 同一虛詞 在 詞性上的不同可以通過分詞和詞性標注進行區(qū)分,而且目前關(guān)于分詞和詞性標注的研究已經(jīng)相對成熟,可以解決一些因詞性不同而導(dǎo)致的語義理解上的問題。在語料中將上述例句中的“和”分別標注為“和 /p”和“和 /c”,再次對句子進行理解分析時,便可以 對 “和”的 兩個詞 性 進行區(qū)分 。 同一虛詞的同一詞性可能因為上下文語境的不同而表達不同的意思,即用法不同,如下述例句: ( 3) 在 草地的中間有一個水池。 ( 4)我 在 學(xué)習(xí)上很努力。 ( 5)我 在 他的幫助下完成了工作。 這 三個例句中的“在”均為介詞, 但用法各不相同。 例句( 3)中介詞“在”用在形容詞、動詞或者主語前,表示事物存在或者動作發(fā)生的處所;例句( 4)中的介詞“在”也用在形容詞、動詞或者主語前,表示范圍;例句( 5)中的介詞“在”用在動詞或者主語前,表示條件。 由 介詞“在”構(gòu)成 的 介詞結(jié)構(gòu) 在三個例句中 作狀語等成分 修飾句子的核心詞,例句( 3)的介詞結(jié)構(gòu)為“在草地的中間”(圖 ,表示處所;例句( 4)的介詞結(jié)構(gòu)為“在學(xué)習(xí)上”(圖 表范圍;例句( 5)的介詞結(jié)構(gòu)為“在他的幫助下”(圖 表示條件。如果可以識別出這些介詞結(jié)構(gòu),對句 子 的理解 有很大的幫助。 即使將三個例句中的介詞“在”都加上詞性標注信息,即“在 /p”,也不能表達出例句意思和意義上的不同 ,因為介詞結(jié)構(gòu)的不同是因介詞用法的不同而 貴州 部 、 江南 、 華南 西部 和 華北 有 小到中雨 AD c d v i 引言 3 體現(xiàn)出來的。由此 ,僅僅依靠分詞和詞性標注信息并不能解決此類問題。 圖 1. 3 例句( 3)的依存句法分析結(jié)果 圖 1. 4 例句( 4)的依存句法分析結(jié)果 圖 1. 5 例句( 5)的依存句法分析結(jié)果 為了解決上述問題,需要將虛詞在詞性標注的基礎(chǔ)上,再進行細節(jié)上的劃分,即為虛詞標注上用法信息。這需要對語料進行大規(guī)模的分析,對其中的虛詞進行細致全面的研究,總結(jié)出一定的規(guī)則,結(jié)合人工和機器學(xué)習(xí)兩者共同的作用對虛詞用法進行自動識別的研究,并分 析虛詞用法在句法分析中的應(yīng)用。 究的背景 鄭州大學(xué)自然語言處理實驗室 于 2010 年 承擔(dān)了國家自然科學(xué)基金項目( 60970083) “ 規(guī)則與統(tǒng)計相結(jié)合的現(xiàn)代漢語虛詞用法自動識別研究 ” , 在此之前 ,鄭州大學(xué)已經(jīng)完成了北京大學(xué)計算語言學(xué)教育部重點實驗室開放課題基金資助項目( “ 現(xiàn)代漢語虛詞知識庫研究及大規(guī)模虛詞用法標注語料庫的構(gòu)建 ” ,國家 973 項目 “ 文本內(nèi)容理解的數(shù)據(jù)基礎(chǔ) ” ( 2004子任務(wù) “ 現(xiàn)代漢語虛詞用法標注語料庫的校對與擴充 ” ,以及河南省科技創(chuàng)新人才 在 地 的 中間 有 一個 水池 TT p n u v m n UN r p v d a 在 習(xí) 上 我 很 努力 E 我 在 他 的 幫助 下 完成 了 工作 T OB r p r u v v u v 引言 4 杰出青年基金項目 ( 104100510026) “ 面向文本內(nèi)容理解的現(xiàn)代漢語虛詞知識庫研究 ” 。 本文中關(guān)于虛詞用法自動識別的研究就是上述工作的一部分,關(guān)于虛詞用法在依存句法分析中的應(yīng)用研究是中科院自動化所模式識別國家重點實驗室開放課題基金項目 “ 虛詞用法在文本理解中的應(yīng)用研究 ” 的 相關(guān) 內(nèi)容 。 漢語中的詞分為實詞和虛詞兩大類,兩者在對漢語句子篇章的理解上都有非常重要的作用。而 目前 國內(nèi)外的研究學(xué)者對漢語的研究主要針對實詞,針對虛詞的研究大多停留在面向人用的詞典之類的非計算機領(lǐng)域,涉及到虛詞語言處理的技術(shù)和研究很少。 針對這種情況,俞士汶 、朱學(xué)鋒等 3提出“三位一體”建設(shè)現(xiàn)代漢語廣義虛詞知識庫的想法和思路,其中的廣義虛詞包括連詞、語氣詞、副詞、助詞、介詞和方位詞 等等 。昝紅英等 4對現(xiàn)代漢語虛詞的用法進行了大量的分析和研究。在這些思想和研究的基礎(chǔ)上,劉銳 5采用基于規(guī)則的方法對副詞用法進行了自動識別的研究, 張軍琿 6等采用了基于統(tǒng)計的方法對常用漢語副詞進行了用法自動識別研究, 袁應(yīng)成等 7對現(xiàn)代漢語的介詞短語邊界識別進行了研究,韓英杰等 8采用了基于規(guī)則的方法對現(xiàn)代漢語的常用助詞進行了用法自動識別研究,周溢輝 9針對現(xiàn)代漢語虛詞中 的語氣詞進行了用法自動識別研究,周麗娟 10研究了 連詞用法以及 連詞結(jié)構(gòu)短語的自動識別。 本文在以上研究的基礎(chǔ)之上,完善了現(xiàn)代漢語 虛詞 中副詞的 用法規(guī)則庫、用法詞典以及用法語料庫, 以 基于規(guī)則與基于統(tǒng)計方法 的副詞用法自動識別 11為基礎(chǔ) , 分析兩種方法的優(yōu)點 和不足,將兩者的優(yōu)點進行結(jié)合, 提出 采用 規(guī)則和統(tǒng)計相結(jié)合的 方法 對 副 詞 的用法進行自動識別。最后,在虛詞用法自動識別 研究的基礎(chǔ)上, 分析 了 虛詞用法 在 依存句法分析 中的應(yīng)用 , 其中 主要針對 依存關(guān)系中與虛詞關(guān)系比較密切的 并列關(guān)系進行分析。 文研究工作 本文在已經(jīng)構(gòu) 建的現(xiàn)代漢語虛詞知識庫的基礎(chǔ)上, 對虛詞用法 進行了自動識別研究,并對虛詞用法知識庫 的應(yīng)用 進行了 分析探討 ,即將其應(yīng)用到依存句法分析中。 本文的主要研究工作包括: ( 1)根據(jù)現(xiàn)代漢語 虛詞 用法規(guī)則以及現(xiàn)代漢語 虛詞 用法詞典對 虛詞進 行基于1 引言 5 規(guī)則的用法自動識別研究。首先采用 袁應(yīng)成 已經(jīng)開發(fā)的規(guī)則標注系統(tǒng) 12對 北京大學(xué)計算語言學(xué)研究所提供的 人民日報 2000 年 1 月到 6 月分詞和詞性標注后的語料 13進行用法標注,然后對標注的結(jié)果進行人工校對,完善虛詞用法語料庫,之后對比校對前后的語料,分析規(guī)則標注錯誤的部分,對規(guī)則進行優(yōu) 化,使其更能全面的表達虛詞的用法,完善虛詞用法的規(guī)則庫。 ( 2)根據(jù)完善后的虛詞用法語料庫對 虛 詞進行基于統(tǒng)計的用法自動識別研究。本文采用了三種統(tǒng)計模型進行實驗,主要對在序列標注方面占優(yōu)勢的條件隨機場模型進行詳細的分析,并將其與基于規(guī)則的方法進行對比,分析各自的優(yōu)點和不足。 ( 3)在基于規(guī)則和基于統(tǒng)計兩種方法的分析研究后, 結(jié)合 各自的優(yōu)點提出了規(guī)則和統(tǒng)計相結(jié)合的方法,并對其進行了實驗研究分析,改善虛詞用法的識別效果。 ( 4)對虛詞用法的應(yīng)用進行探討。 將 由虛詞用法識別出的連詞結(jié)構(gòu)短語應(yīng)用到依存句法分析中,以提高并 列關(guān)系的識別情況。 首先對哈爾濱工業(yè)大學(xué)提供的語言技術(shù)平臺 的依存句法分 析模塊進行了詳細的分析,總結(jié)出并列關(guān)系的標注情況;然后將語料中 表并列 關(guān)系 的連詞進行用法標注和并列結(jié)構(gòu)短語標注;最后利用并列結(jié)構(gòu)標注信息對句法分析的結(jié)果進行 優(yōu)化 ,提高依存句法分析中并列關(guān)系的識別效果。 文結(jié)構(gòu)框架 根據(jù)本文的主要研究內(nèi)容,本文主要將其分為五章進行闡述。各個章節(jié)的具體安排如下: 第 1 章,引言。簡單介紹了本文的研究背景和意義,主要的研究工作以及論文的結(jié)構(gòu)框架。 第 2 章,相關(guān)研究。主要介紹了“三位一體”的現(xiàn)代漢語虛 詞用法知識庫的構(gòu)建,包括現(xiàn)代漢語虛詞用法詞典、現(xiàn)代漢語虛詞用法規(guī)則庫以 及虛詞用法語料庫。介紹 依存句法分析的研究方法以及漢語依存句法分析的研究現(xiàn)狀。 第 3 章,現(xiàn)代漢語虛詞用法自動識別。 以虛詞中的副詞為例, 首先介紹了基于規(guī)則的 副 詞用法自動識別,并詳細分析了規(guī)則的優(yōu)化過程以及實驗情況;然后介紹了基于統(tǒng)計的 副 詞用法自動識別,分別采用了條件隨機場 4、最大1 引言 6 熵 5、支持向量機 6三種統(tǒng)計模型,并對每種模型進行了實驗 分析 ;最后根據(jù)對基于規(guī)則和基于統(tǒng)計方法的分析,提出了規(guī)則和統(tǒng)計相結(jié)合的思想,并 進行了實驗 分析 。 第 4 章,虛詞用法識別在依存句法分析中的應(yīng)用。 將由虛詞用法識別出的連詞結(jié)構(gòu)短語應(yīng)用到依存句法分析中,以提高并列關(guān)系的識別情況。 第 5 章,結(jié)論和展望。對本文的研究工作進行總結(jié),并提出下一步的研究思路和方向。2 相關(guān)研究 7 2 相關(guān)研究 代漢語虛詞用法知識庫 虛詞在句子中不能單獨充當(dāng)句法成分,有連接或者依附于各類實詞的語法意義。根據(jù)虛詞在句子中的語法意義以及與實詞的搭配情況,可以將虛詞分為語氣詞、副詞、連詞、介詞、助詞等等。 漢語是虛詞特別豐富的語言,這主要由漢語本身的特性所決定。 現(xiàn)代漢語中虛 詞的數(shù)量雖然很少,但是總體上來說,虛詞的重要性并不亞于實詞,對于一些意義紛雜的虛詞來說,其重要性甚至超過實詞。因為虛詞在應(yīng)用中往往影響著整個句子的結(jié)構(gòu),進而影響我們對整個句子 甚至 整個段落的理解。 如果虛詞運用的精準,不僅可以提高我們對虛詞所在句子的理解效果,而且常常會幫助我們理解整個段落甚至整篇文字。 因此,對現(xiàn)代漢語虛詞進行研究非常必要。 同 一虛詞可能顯示不同的詞性,同 一 虛詞的同一詞性也可以有不用的用法,表達不同的意思。 在對虛詞研究的很長一段時間里,研究的成果大部分都是面向人用的,對虛詞的個性描寫很難直接應(yīng)用 到自然語言處理的研究中,在一定程度上影響了機器對文本的理解,限制了自然語言處理領(lǐng)域的研究和發(fā)展。 為了解決上述問題,實現(xiàn)面向機器的虛詞研究問題,昝紅英等從計算語言學(xué)的理論觀點出發(fā),在對真實的語料進行虛詞用法規(guī)律考察的基礎(chǔ)上,構(gòu)建了面向機器的現(xiàn)代漢語虛詞用法信息詞典和虛詞用法規(guī)則庫 17,并對人民日報分詞和詞性標注語料中的虛詞用法進行了研究考察,構(gòu)建了面向自然語言處理的現(xiàn)代漢語廣義虛詞 語料 庫,實現(xiàn)了俞士汶等提出的“三位一體”構(gòu)建現(xiàn)代漢語廣義虛詞知識庫的思想 18。 代漢語虛詞用法詞典 昝紅英等構(gòu)建的現(xiàn)代漢語虛詞用法知識庫中包含所有的廣義虛詞,即 介詞、連詞、 方位詞、副詞、助詞、語氣詞等。其中方位詞可以說是名詞的一個附類,主要跟在介詞的后面 共同 組成介詞 短語 結(jié)構(gòu),也可以附著在名詞后表示處所或時間;副詞能夠修飾動詞或者形容詞,但是不能修飾名詞; 介詞不能在句子中2 相關(guān)研究 8 單獨充當(dāng)謂語,常常與代詞、動詞、名詞等搭配組成介詞短語結(jié)構(gòu); 連詞主要將語義相關(guān)的語言單位連接在一起 ,反應(yīng)事物之間的關(guān)系;語氣詞主要用于句子末尾,表達各種語氣。 虛詞的用法和作用各不相同,這就使得必須對每個虛詞的每種用法進行詳細的分析 和 研究。 表 2. 1 副詞“都”部分屬性用法詞典樣例 義 用法 示總括全部。 除問話以外,所總括的對象必須放在 “都 ”前。也可以說 “全都 ”,總括的意思更明顯。 示總括全部。 所總括的對象可以用表示任指的疑問指代詞。 示總括全部。 所總括的對象前可以用連詞 “ 不論、不管、無論、凡是、只要 ” 。 示總括全部。 問話時總括的對象(疑問代 詞)放在 “ 都 ” 后。 示總括全部。與 “ 是 ”搭配。說明原因,有責(zé)備的意思。 與 “ 是 ” 搭配。 至。 “ 都 ” 輕讀。 修飾動詞或動詞短語。 至。 “ 都 ” 輕讀。與“ 連 ” 字同用,有強調(diào)語氣的作用。 與 “ 連 ” 字同用。 至。 “ 都 ” 輕讀。 “ 都 ” 前后用同一個動詞(前肯定,后否定)。A(不 |沒 |沒有 |未 | 或 AA(不 |沒 |沒有 |未| 至。 “ 都 ” 輕讀。 一 +量詞 +.+動詞(否定式)。 至。 “ 都 ” 輕讀。 用于表示讓步的小句,引出表示主要意思的小句。 經(jīng)。 句末常用 “ 了 ” 。 根據(jù)張斌的現(xiàn)代漢語虛詞詞典 ( ) 、呂叔湘的現(xiàn)代漢語八百詞 ( ) 、現(xiàn)代漢語詞典(第五版) ( ) 、 1998 年 1 月人民日報的分詞和詞性標注語料庫的統(tǒng)計分布 ( ) 以及其他的語法學(xué)家相關(guān)論著 ( ) ( “ FMLRNE F | |n|v|a| M | |n|v|a| L | |n|v|a| R | |n|v|a| N | |n|v|a| E | |n|v|a| 其中規(guī)則元語言“”意思是 “ 定義為 ” ,中括號“ ”中表示的是可選內(nèi)容,“ |”表 或運算。根據(jù) 這種規(guī)則描述方法, 表 副詞“都”的用法描述 對應(yīng)的 用法規(guī)則 可以表 述為: $都 N N v|a M M 誰 |哪里 |什么 |怎么 |哪兒 |哪 | 2 相關(guān)研究 10 M M (不論 |不管 |無論 |雖然 |盡管 |凡是 |只要 )*, N 誰 |哪里 |什么 |怎么 |哪兒 |哪 | E ? F R 是 N N v M M 連 |甚至 AA(不 |沒 |沒有 |未 |) A v A(不 |沒 |沒有 |未 |)*A A v M 一 q N 不 |沒 |沒有 |未 | N N , *(不 |沒 |) E E 了 , 代漢語虛詞用法語料庫 在現(xiàn)代漢語虛詞用法詞典和用法規(guī)則庫的基礎(chǔ)上,對 初始語料進行用法標注,形成現(xiàn)代漢語虛詞用法語料庫,為虛詞用法的研究提供平臺和依據(jù)。這里的初始語料是北京大學(xué)計算語言學(xué)研究所提供的 2000 年 1 月至 6 月人民日報分詞和詞性標注語料 13, 用法標注前后的語料對比如下: 用法標注前的語料: 保留 /v 軍隊 /n , /領(lǐng)導(dǎo)人 /n 可以 /參加 /v 國家 /n 的 /管理/; /在 /p 一個 /中國 /的 /原則 /n 下 /f , /什么 /問題 /n 都 /d 可以 /談 /v 等 /u , /符合 /v 臺灣 /人民 /n 求 /v 穩(wěn)定 /a 、 /求 /v 和平 /a 、 /求 /v 發(fā)展 /v 的 /期望 /, /也/d 符合 /v 臺灣 /人民 /n 的 /心愿 /n 。 / 用法標注后的語料: 保留 /v 軍隊 /n , /領(lǐng)導(dǎo)人 /n 可以 /參加 /v 國家 /n 的 /管理/; /在 /p 一個 /中國 /的 /原則 /n 下 /f , /什么 /問題 /n 都 /d 可以 /談 /v 等 /u , /符合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論