版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、現(xiàn)代漢語詞量與分級(jí),思考,一、現(xiàn)代漢語的詞量有多大? 二、包括哪些詞語? 三、分幾“級(jí)”合適?每級(jí)界限在哪? 四、詞級(jí)劃分依據(jù)的標(biāo)準(zhǔn)和方法?,當(dāng)代最具影響力的兩個(gè)常用詞表: 現(xiàn)代漢語頻率詞典,8548條 對(duì)外漢語教學(xué)詞匯大綱,8822條,“語法、語音是有系統(tǒng)的,詞匯是一盤散沙。” 最初實(shí)踐,對(duì)現(xiàn)代漢語詞典的計(jì)量研究,近幾年的實(shí)踐: 現(xiàn)代漢語常用詞表,商務(wù)印書館,2008年11月 “對(duì)外漢語1500常用詞”,見中國語言生活狀況報(bào)告2006,王鐵琨主編,商務(wù)印書館,2007年8月。(收入國家漢辦主編國際漢語通用課程教學(xué)大綱外語教學(xué)與研究出版社,2008年4月) “基礎(chǔ)教育3000基本詞”,見中國語
2、言生活狀況報(bào)告2007,王鐵琨主編,商務(wù)印書館,2008年11月。,一、現(xiàn)代漢語的詞匯量有多大?,對(duì)詞典的考察 對(duì)詞表的考察 對(duì)大規(guī)模真實(shí)語料的考察,從詞典來考察“詞匯量”,1.現(xiàn)代漢語詞典的詞匯 規(guī)范型詞典全面反映語言的詞匯體系,就要對(duì)詞語作全面收錄,不因某些詞語無需查檢而不收。 規(guī)范型詞典對(duì)民族共同語詞匯的記錄是全面的,但不是窮盡的(在理論上和實(shí)踐上都是不可能的)?,F(xiàn)漢是一部中型詞典,它在收詞上既是全面的,又有較強(qiáng)的選擇性。選詞的依據(jù),主要不是看查考的需要,而是看詞語在語言使用中出現(xiàn)的頻率。 晁繼周、單耀海、韓敬體:關(guān)于規(guī)范型詞典的收詞問題,見現(xiàn)代漢語詞典學(xué)術(shù)研討會(huì)論文集,商務(wù)印書館,19
3、96年版,第70、72頁。,現(xiàn)漢詞條61000: -單字條10700(4000) -方言詞2600 -科技術(shù)語60000*0.2=12000 -書語詞3800 =31900 從嚴(yán)計(jì)算,32000-40000之間。,在現(xiàn)漢的語文詞周圍存在一條寬闊的接壤詞匯帶: 1.方言詞:現(xiàn)代漢語方言大詞典共41卷,收41個(gè)方言點(diǎn)的詞匯,平均每個(gè)點(diǎn)收詞8000條,其總數(shù)達(dá)30萬條以上。漢語方言大詞典20萬條 2.術(shù)語詞、行業(yè)詞:數(shù)十個(gè)學(xué)科、行業(yè),以每個(gè)2000計(jì),有數(shù)十萬條。 3.新詞語:近30年間,30000余條,每年約1000條。 4.文言詞:辭源10萬條,漢語大詞典非現(xiàn)代詞。,方言詞與普通話詞語的區(qū)分:
4、拇指 大拇指 大拇哥,行業(yè)詞與普通話詞語的區(qū)分: 招標(biāo)、投標(biāo)、競(jìng)標(biāo)、發(fā)標(biāo)、中標(biāo)、得標(biāo) 開標(biāo)、唱標(biāo)、流標(biāo)、跑標(biāo)、串標(biāo)、圍標(biāo) 接聽 主叫、被叫,新詞語與普通話詞語的區(qū)分 裸露、裸照、裸奔、裸泳、裸尸 裸戲、裸曬、裸聊、裸背、裸肩 /裸機(jī)、裸眼 / 裸捐、裸退、裸官,書語詞與古語詞的區(qū)分:,從詞表來考察“詞匯量”,從大規(guī)模真實(shí)語料來考察“詞匯量”,結(jié)論: 從對(duì)詞典的考察來看,屬普通話詞匯的語文詞詞量約6萬左右。 從對(duì)詞表和大規(guī)模真實(shí)語料來看,大概在8-10萬左右。 確定詞量的關(guān)鍵在普通話詞匯與接壤詞匯之間如何劃界。,二、現(xiàn)代漢語詞匯包括哪些詞種,那么在6-8萬的普通話詞匯范圍中,包括了哪些詞語?試以
5、下面三種為例: 現(xiàn)代漢語詞典(63000/58000) 現(xiàn)代漢語語義分類詞典(83000條/77000) 現(xiàn)代漢語常用詞表(56008/55600),交集比較:,交集比較:,結(jié)論: 沒有一種詞匯集具有完全的“認(rèn)同度” ;沒有完整地包含它集或被它集所包含。 不同規(guī)模、不同性質(zhì)、不同用途的詞匯集都有著自己“獨(dú)收子”。 參與比較的詞匯集愈多,交集愈小,交集的“普遍性”愈突出。,三、劃多少“級(jí)”合適?,擬建構(gòu)“基本詞集”: 第一級(jí):3000條 第二級(jí):8000條 第三級(jí):30000條 第四級(jí):60000 - 80000條 另有若干附屬的專集,詞級(jí)劃分的參考因素:,分布-分布率: 使用-頻率-覆蓋率:
6、基礎(chǔ)、重要的語義成分: 服務(wù)對(duì)象、使用范圍: 作用與功能,結(jié)論: 廣分布的詞,并不等于高頻詞;高頻率使用詞,不等于廣分布的詞 母語學(xué)習(xí)者與第二語言學(xué)習(xí)者的不同; 基礎(chǔ)教育學(xué)習(xí)者與社會(huì)使用者的不同;,普遍存在的詞不等于使用中的高頻詞,普遍存在的詞不等于使用中的高頻詞,四、詞級(jí)劃分依據(jù)的標(biāo)準(zhǔn)和方法,頻次法 分布法 頻級(jí)法 使用率 使用度 語義分布,分布法與頻率法的對(duì)比,四套教材詞語狀況:,分布法與頻次分的對(duì)比分析,思考一: 頻次統(tǒng)計(jì)法有相當(dāng)?shù)恼`導(dǎo)性。頻統(tǒng)計(jì)法只有在具有大致相當(dāng)?shù)姆植记闆r下才具有較好的參考性。,思考二: 使用度統(tǒng)計(jì)法能在一定程度上沖淡頻次信息的片面性,但它只適用于頻次與分布差別不大的
7、現(xiàn)象適用。對(duì)頻次高分布窄的詞語不能起到足夠的校正作用,因?yàn)轭l次畸高的因素仍會(huì)嚴(yán)重影響到綜合數(shù)值。,思考三: 詞語的分布信息比頻次信息有更好的參考價(jià)值。 分布統(tǒng)計(jì)法能更準(zhǔn)確地顯示詞語的通用性、基礎(chǔ)性、大眾性。,頻級(jí)法的使用,頻級(jí):在調(diào)查對(duì)象中相同頻次的為一個(gè)頻級(jí)。 頻級(jí)統(tǒng)計(jì)法:根據(jù)頻級(jí)調(diào)查詞語常用度的一種調(diào)查方法。適用于大規(guī)模語料調(diào)查。特別是對(duì)于立足于特性不一、容量差異明顯的多個(gè)語料庫之間比較的大規(guī)模詞匯統(tǒng)計(jì)。通常有升序,降序等。,現(xiàn)代漢語常用詞表的詞頻序號(hào)使用的是頻級(jí)法,由于詞語的來源面比較寬,各種語料都有自己的覆蓋面與構(gòu)成特點(diǎn),詞表中的詞語不能在每種語料中都得到全部顯現(xiàn)。同一個(gè)詞語在不同語料庫中的頻次也可能相差較大,因而不同語料庫中的具體頻次之間缺乏嚴(yán)格的可比性。用頻級(jí)統(tǒng)計(jì)則能較客觀地顯示每個(gè)詞語的使用情況。頻級(jí)就是同一語料庫中的所有詞語按頻次數(shù)量的多少排列時(shí)體現(xiàn)出來的排位順序。相同頻次的為一個(gè)頻級(jí)。,頻級(jí)統(tǒng)計(jì)分兩步施行。 第一步形成不同類型語料的頻級(jí):檢測(cè)語料有“通用語料庫”、“人民日?qǐng)?bào)”、“文學(xué)作品”三種,這樣每一個(gè)詞語就有了三個(gè)不同的原始頻級(jí)。 第二步形成總語料的頻級(jí),就是將每個(gè)詞語的三種語料的頻級(jí)之和除以三。 相同頻級(jí)的詞語,根據(jù)總頻次的多少由高到低排序,相同頻次的根據(jù)讀音的字母升序排列。,頻級(jí):相同頻次
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國河流生態(tài)系統(tǒng)保護(hù)行業(yè)市場(chǎng)供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國核電設(shè)備行業(yè)技術(shù)革新市場(chǎng)分析評(píng)估報(bào)告
- 2025-2030中國果汁混合設(shè)備市場(chǎng)供需分析及投資發(fā)展前景研究方向分析報(bào)告
- 互聯(lián)網(wǎng)廣告投放效果評(píng)估報(bào)告模板
- 釣場(chǎng)股東協(xié)議書
- 拆遷還房協(xié)議書
- 車庫停車協(xié)議書
- 拆廠房合同范本
- 拆模承包協(xié)議書
- 敷設(shè)管道協(xié)議書
- 葦町煤業(yè)井田開拓開采及通風(fēng)設(shè)計(jì)
- 《水電工程水生生態(tài)調(diào)查與評(píng)價(jià)技術(shù)規(guī)范》(NB-T 10079-2018)
- 英語專四專八大綱詞匯表
- 個(gè)體診所藥品清單模板
- 動(dòng)態(tài)心電圖出科小結(jié)
- 2023年廣州市自來水公司招考專業(yè)技術(shù)人員筆試參考題庫(共500題)答案詳解版
- 閔福德的中譯英歷程和譯介理念
- 南方科技大學(xué)校聘能力測(cè)評(píng)英語測(cè)評(píng)
- 2023高效制冷機(jī)房系統(tǒng)應(yīng)用技術(shù)規(guī)程
- 化工基礎(chǔ)安全知識(shí)培訓(xùn)資料全人力資源
- 【超星爾雅學(xué)習(xí)通】中國傳統(tǒng)玉文化與美玉鑒賞網(wǎng)課章節(jié)答案
評(píng)論
0/150
提交評(píng)論