大學(xué)英語四級(jí)試題語料庫的思考_第1頁
大學(xué)英語四級(jí)試題語料庫的思考_第2頁
大學(xué)英語四級(jí)試題語料庫的思考_第3頁
大學(xué)英語四級(jí)試題語料庫的思考_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大學(xué)英語四級(jí)試題語料庫的思考

一、語料庫平臺(tái)搭建實(shí)踐的留意事項(xiàng)

目前搭建語料庫所使用的軟件較為豐富。由于所搭建的是一個(gè)微型語料庫,所以在軟件使用上就比擬敏捷,我們使用的是北外的免費(fèi)軟件。另外,由于四級(jí)試題語料庫需要用最新的語料,才能獲得最具說服力的核心詞匯和例句,所以我們在制作四級(jí)試題語料庫的時(shí)候,使用的是近五年的試題。

(-)掃描版本盡量清楚大學(xué)英語四級(jí)的試題相比照較簡單搜集,網(wǎng)絡(luò)有許多的資源,因此有許多現(xiàn)成的電子版文檔可以進(jìn)展校對使用。但是依舊是有一些試題不好搜尋,尤其是聽力原文,因此還是需要我們用紙質(zhì)資料進(jìn)展掃描。需要非常留意的是,掃描的版本越清楚,轉(zhuǎn)化為word文檔的錯(cuò)誤就會(huì)相對越少,因此在可操作的范圍內(nèi)盡可能的讓掃描版本清楚,這樣可以削減后期校對的時(shí)間。

(二)word文檔校對在轉(zhuǎn)化為word文檔之后的校對工作是特別費(fèi)時(shí)費(fèi)勁的,需要特殊細(xì)致仔細(xì)的進(jìn)展這項(xiàng)工作。在校對時(shí),要非常留意空格、標(biāo)點(diǎn)、全角半角、原有網(wǎng)絡(luò)格式、段落劃分等因素。這些因素會(huì)影響之后轉(zhuǎn)化為txt文檔的質(zhì)量,假如校對不細(xì)致就很有可能在下一步消失問題,進(jìn)而消失返工的狀況。需要非常說明一點(diǎn),尤其是段落劃分這個(gè)因素,在校對時(shí)要留意中英文兩個(gè)版本是否閃配,以免在對齊環(huán)節(jié)消失問題。

(三)做好標(biāo)注標(biāo)注是語料庫生成之后進(jìn)展檢索的重要信息,具體的標(biāo)注可以幫忙語料庫使用者獲得盡可能多的關(guān)于語料的具體信息。為了便利語言討論和語言教學(xué),標(biāo)注應(yīng)當(dāng)盡可能的具體。對于大學(xué)英語四級(jí)試題來說,具體的信息包括考題的年份;月份,試題的題型,最終生成txt文本的語言類型。因此在做標(biāo)注的時(shí)候要留意把以上信息都包括進(jìn)去,便利后期進(jìn)展語料的收集和有可能進(jìn)展的語料比擬。

(四)對齊時(shí)留意亂碼之前提到了,由于有些文件是從網(wǎng)絡(luò)上找到的,因此有些網(wǎng)絡(luò)格式在校對時(shí)很難發(fā)覺。等放到txt文件中再進(jìn)展標(biāo)注對齊的時(shí)候,這些網(wǎng)絡(luò)格式所產(chǎn)生的亂碼就消失了。但是假如不逐行認(rèn)真觀看,這些亂碼有可能就不會(huì)被發(fā)覺,就會(huì)影響語料的搜尋和使用。所以在對齊的時(shí)候,留意亂碼很重要。另外,在這個(gè)步驟中還要留意檢查是否每一段都對齊的很工整,段落數(shù)量是否匹配,斷句是否中英文對應(yīng)等等。

(五)保存中英文txt文檔在對齊工作完成以后就可以保存為兩個(gè)最終的潔凈文本。在保存的時(shí)候要根據(jù)語言類型分別保存為兩個(gè)文檔,即中英文分別保存。

二、預(yù)期效果

在語料庫生成之后,會(huì)依據(jù)在近五年的試題中消失單詞的頻率凹凸做出一個(gè)詞匯表。固然這個(gè)詞匯表并不是最終的版本,.由于會(huì)產(chǎn)生許多沒有價(jià)值的單詞,而且消失頻次特別高,比方“I”,“is“等等,所以需要教師手動(dòng)篩選四級(jí)詞匯。

篩選完成后就可以制作詞匯冊,把四級(jí)的高頻詞列出來,附上在考試題中消失的相應(yīng)例句便利學(xué)生學(xué)習(xí)記憶。這樣學(xué)生得到的詞匯積存是比擬系統(tǒng)和科學(xué)的,既可以清晰地知道哪些單詞是高頻核心,又可以對于這些詞的用法和搭配一目了然,能夠大大幫忙學(xué)生們的學(xué)習(xí)。在小范圍的課堂試點(diǎn)中,學(xué)生對于這種單詞冊的興趣遠(yuǎn)遠(yuǎn)大于課本單詞,他們認(rèn)為這樣的做法比擬符合他們的需要,背起來會(huì)更有動(dòng)力,而且結(jié)合例句的學(xué)習(xí),能夠更強(qiáng)化對單詞的記憶,還能夠了解詞和句的搭配。另外,通過這個(gè)語料庫平臺(tái)的搭建,學(xué)生還可以實(shí)現(xiàn)檢索的目的。假如學(xué)生遇到了比擬生疏的單詞,不清晰這個(gè)詞的用法,可以用語料庫進(jìn)展檢索,便可以清楚的看到四級(jí)題庫中這個(gè)單詞消失的例句,一目了然。這個(gè)功能還可以實(shí)現(xiàn)漢譯英的功能,遇到翻譯中不會(huì)表達(dá)的漢語詞匯,也可以通過檢索的功能進(jìn)展查閱,學(xué)生只要依據(jù)例句的表達(dá),就可以選出自己滿足的詞匯。

因此,大學(xué)英語四級(jí)試題語料庫的搭建,可以在多方面提高學(xué)生的英語力量。假如運(yùn)用得當(dāng),聽力、閱讀、翻譯、寫作等力量都能夠得到很大程度的提高。而且,使用這個(gè)平臺(tái)會(huì)在很大程度上削減教師的負(fù)擔(dān),原來都需要教師去輔導(dǎo)的內(nèi)容,學(xué)生自己進(jìn)展搜尋就可以得到,把教師從繁重的語法教學(xué)和搭配教學(xué)中解放出來。再者,這個(gè)平臺(tái)對于學(xué)生自學(xué)力量的培育也是特別有幫忙的,教師反復(fù)講解的用法和搭配,學(xué)生只需要搜尋就能看到,增加學(xué)習(xí)興趣的同時(shí),也能夠做到自學(xué)。

三、結(jié)語

大學(xué)英語四六級(jí)考試只是學(xué)生們大學(xué)階段的一個(gè)根底性的考試,在很大程度上依靠于學(xué)生詞匯量的累積和使用,而雙語語料庫最擅長的就是檢索詞匯。因此,這兩者的結(jié)合將會(huì)對學(xué)生詞匯的學(xué)習(xí)和使用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論