自然語(yǔ)言處理技術(shù)與應(yīng)用 試題A卷_第1頁(yè)
自然語(yǔ)言處理技術(shù)與應(yīng)用 試題A卷_第2頁(yè)
自然語(yǔ)言處理技術(shù)與應(yīng)用 試題A卷_第3頁(yè)
自然語(yǔ)言處理技術(shù)與應(yīng)用 試題A卷_第4頁(yè)
自然語(yǔ)言處理技術(shù)與應(yīng)用 試題A卷_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1頁(yè)共4頁(yè)期末考試試題A卷(開(kāi)卷)適用班級(jí):人工智能2001/2002專業(yè):人工智能技術(shù)服務(wù)考試時(shí)長(zhǎng):120分鐘得分閱卷人一、選擇得分閱卷人1.自然語(yǔ)言處理中的句子級(jí)別的分析技術(shù),可以大致分為()、句法分析、語(yǔ)義分析三個(gè)層面。A.詞法分析B.文法分析C.分詞D.語(yǔ)言分析2.相對(duì)于其他的編程語(yǔ)言,Python具有以下哪些優(yōu)勢(shì)()A.Python提供了大量的自然語(yǔ)言處理庫(kù)B.編程語(yǔ)法較復(fù)雜C..編程語(yǔ)法相對(duì)簡(jiǎn)單D.具有很多數(shù)學(xué)科學(xué)相關(guān)的庫(kù)3.詞法分析,主要包括()、和詞性標(biāo)注、命名實(shí)體識(shí)別三部分。A.英語(yǔ)分詞B.分詞技術(shù)C.漢語(yǔ)分詞D.語(yǔ)言分詞4.目前,中文分詞的難點(diǎn)不包括()A.分詞歧義消解B.錯(cuò)別字、諧音字規(guī)范化C.未登錄詞的識(shí)別D.分詞問(wèn)題5.采用jieba精確模式對(duì)“南京市長(zhǎng)江大橋”進(jìn)行分詞,得到的結(jié)果為:()A.南京\市長(zhǎng)江大橋B.南京市/長(zhǎng)江大橋C.南京/南京市/京市/市長(zhǎng)/長(zhǎng)江/長(zhǎng)江大橋/大橋D.南京/京市/南京市/長(zhǎng)江/大橋/長(zhǎng)江大橋6.下面哪項(xiàng)不屬于LTP的主要模型:()A.SentenceSplitterB.SegmentorC.n元模型D.Postagger7.依存關(guān)系可以細(xì)分為不同的類型,表示兩個(gè)詞之間的具體句法關(guān)系。依存句法分析標(biāo)注關(guān)系,以下關(guān)系類型和它的標(biāo)注不正確的是()前置賓語(yǔ)(FOB)動(dòng)補(bǔ)結(jié)構(gòu)(CMP)介賓關(guān)系(POB)定中關(guān)系(ATD)以下有關(guān)計(jì)算機(jī)視覺(jué)的步驟中,哪個(gè)不屬于傳統(tǒng)方法()。A.圖像預(yù)處理B.特征提取C.特征篩選D.神經(jīng)卷積9.以下哪一個(gè)是不屬于三大特征抽取器()。A.CNNB.RNNC.HMMD.transformer類型10.以下那部分代碼是正確引用gensim模塊的()。A.fromgensimimportcorporaB.importnumpyasnpC.importgenismasgeD.importgensim11.下列哪種關(guān)于無(wú)監(jiān)督關(guān)鍵詞提取的說(shuō)法是正確的()。A.基于詞的文檔位置的特征量化是屬于關(guān)鍵詞提取中有監(jiān)督算法的B.基于詞圖模型的關(guān)鍵詞抽取不用構(gòu)建文檔的語(yǔ)言網(wǎng)絡(luò)圖C.基于文本統(tǒng)計(jì)特征方法是利用文檔中詞語(yǔ)的統(tǒng)計(jì)信息抽取文檔的關(guān)鍵詞D.基于主題模型認(rèn)為,詞與文檔之間有直接的聯(lián)系12.關(guān)于TF-IDF算法說(shuō)法不正確的是()。A.TF算法和IDF算法可以單獨(dú)使用B.IDF的大小與詞語(yǔ)的常見(jiàn)程度成正比C.TF算法權(quán)衡詞出現(xiàn)的頻率,不考慮詞語(yǔ)對(duì)文檔的區(qū)分能力D.TF-IDF算法,從詞頻、逆文檔頻率兩個(gè)角度對(duì)詞語(yǔ)的重要性進(jìn)行衡量13.下列關(guān)于說(shuō)法不正確的是()。A.DF值廣泛應(yīng)用于大規(guī)模語(yǔ)料的特征降維B.計(jì)算出每個(gè)特征的信息增益后,就可以移除那些信息量較低的特征C.互信息是指根據(jù)特征與類別的關(guān)聯(lián)程度來(lái)計(jì)算特征與類別的相關(guān)度D.當(dāng)對(duì)梁樣本平均數(shù)進(jìn)行比較時(shí),可以采用卡方檢驗(yàn)14.基于機(jī)器學(xué)習(xí)的情感分析方法本質(zhì)是一個(gè)分類問(wèn)題,該方法使用的經(jīng)典分類模型不包括()。支持向量機(jī)樸素貝葉斯卡爾曼濾波最大熵模型15.自然語(yǔ)言理解的簡(jiǎn)稱是什么?()。A.NLPB.ANNC.NLUD.APL得分閱卷人二、判斷題(對(duì)的打‘√’,錯(cuò)的打‘×’得分閱卷人1.句法分析的主要任務(wù)是:識(shí)別出句子所包含的句法成分,以及這些成分之間的關(guān)系。()2.使用jieba進(jìn)行分詞,需要導(dǎo)入jieba工具包。()3.Stanfordparser的底層是由python實(shí)現(xiàn)的。()4.re.match嘗試從字符串的起始位置匹配一個(gè)模式,如果起始位置匹配不成功的話,就返回none。()5.自然語(yǔ)言處理有兩個(gè)核心任務(wù),一個(gè)是自然語(yǔ)言理解,另外一個(gè)是自然語(yǔ)言生成。()6.自然語(yǔ)言處理(NaturalLanguageProcessing,NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域以及大數(shù)據(jù)領(lǐng)域的一個(gè)重要的研究方向。()7.基于規(guī)則的分詞方法是最早興起的分詞方法,主要是通過(guò)設(shè)立詞庫(kù)和規(guī)則,然后使用匹配的方法進(jìn)行分詞。()8.命名實(shí)體識(shí)別(NER)的目的在于識(shí)別語(yǔ)料中人名、地名、組織機(jī)構(gòu)名等命名實(shí)體。()9.條件隨機(jī)場(chǎng)(CRF)也是一種基于馬爾科夫思想的統(tǒng)計(jì)模型。之前的模型都假設(shè)每個(gè)狀態(tài)均只與它前面的狀態(tài)有關(guān)。()10.jieba分詞工具提供了詞性標(biāo)注功能。jieba分詞是結(jié)合規(guī)則和統(tǒng)計(jì)的方式,也就是說(shuō)同時(shí)使用詞典匹配和HMM。()得分閱卷人三、填空得分閱卷人1.自然語(yǔ)言處理的三個(gè)層面有:和、語(yǔ)義分析。2.根據(jù)句法結(jié)構(gòu)的表示形式不同,最常見(jiàn)的句法分析任務(wù)可以分為以下三種:、依存句法分析以及深層文法句法分析。3.基于規(guī)則的分詞方法有:正向最大匹配法、和雙向最大匹配法。4..LTP是基于C++開(kāi)發(fā)的,但是也提供了Python的封裝包——Pyltp。Pyltp的安裝直接使用pip進(jìn)行安裝,在命令行輸入。5.句法分析的數(shù)據(jù)集是樹(shù)形標(biāo)注結(jié)構(gòu),稱為。6.的結(jié)構(gòu)沒(méi)有非終結(jié)點(diǎn),詞與詞之間直接發(fā)生依存關(guān)系。7.卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括:、和。8.Word2vec主要包含兩個(gè)淺層的神經(jīng)網(wǎng)絡(luò)模型,分別是和。9.在使用TF-IDF算法提取關(guān)鍵詞時(shí),為使候選詞標(biāo)準(zhǔn)化,TF值=,候選詞的IDF=,候選詞的TF-IDF=。10.PageRank在計(jì)算句子給它鏈接句的貢獻(xiàn)時(shí),是通過(guò)計(jì)算來(lái)分配。11.特征工程一般包括、、三個(gè)部分。12..目前情感分析的方法主要分為三類,分別為、、。13.神經(jīng)網(wǎng)絡(luò)模型的復(fù)興使得深度學(xué)習(xí)在語(yǔ)音、圖像、文本處理得到了廣泛的應(yīng)用,講深度學(xué)習(xí)應(yīng)用在情感分析中,一般采用和結(jié)合的方法和。得分閱卷人四、綜合應(yīng)用得分閱卷人(1)將以下內(nèi)容轉(zhuǎn)為txt文本:Icouldimaginehisgivingafriendalittlepinchofthelatestvegetablealkaloid,notoutofmalevolence,youunderstand,butsimplyoutofaspiritofinquiryinordertohaveanaccurateideaoftheeffects.(2分)對(duì)內(nèi)容進(jìn)行分詞,統(tǒng)計(jì)文本中的所有詞語(yǔ),進(jìn)行獨(dú)熱編碼,得到每個(gè)詞的one-hot向量表示.(2分)(3)將句子進(jìn)行文本向量化。(1分)得分閱卷人得分閱卷人使用TF-IDF算法完成對(duì)以下內(nèi)容實(shí)現(xiàn)關(guān)鍵詞的提?。赫雇?035年,我國(guó)將基本實(shí)現(xiàn)社會(huì)主義現(xiàn)代化。經(jīng)濟(jì)實(shí)力、科技實(shí)力、綜合國(guó)力將大幅躍升,經(jīng)濟(jì)總量和城鄉(xiāng)居民人均收入將再邁上新的大臺(tái)階,關(guān)鍵核心技術(shù)實(shí)現(xiàn)重大突破,進(jìn)入創(chuàng)新型國(guó)家前列。基本實(shí)現(xiàn)新型工業(yè)化、信息化、城鎮(zhèn)化、農(nóng)業(yè)現(xiàn)代化,建成現(xiàn)代化經(jīng)濟(jì)體系?;緦?shí)現(xiàn)國(guó)家治理體系和治理能力現(xiàn)代化,人民平等參與、平等發(fā)展權(quán)利得到充分保障,基本建成法治國(guó)家、法治政府、法治社會(huì)。建成文化強(qiáng)國(guó)、教育強(qiáng)國(guó)、人才強(qiáng)國(guó)、體育強(qiáng)國(guó)、健康中國(guó),國(guó)民素質(zhì)和社會(huì)文明程度達(dá)到新高度,國(guó)家文化軟實(shí)力顯著增強(qiáng)。廣泛形成綠色生產(chǎn)生活方式,碳排放達(dá)峰后穩(wěn)中有降,生態(tài)環(huán)境根本好轉(zhuǎn),美麗中國(guó)建設(shè)目標(biāo)基本實(shí)現(xiàn)。形成對(duì)外開(kāi)放新格局,參與國(guó)際經(jīng)濟(jì)合作和競(jìng)爭(zhēng)新優(yōu)勢(shì)明顯增強(qiáng)。人均國(guó)內(nèi)生產(chǎn)總值達(dá)到中等發(fā)達(dá)國(guó)家水平,中等收入群體顯著擴(kuò)大,基本公共服務(wù)實(shí)現(xiàn)均等化,城鄉(xiāng)區(qū)域發(fā)展差距和居民生活水平差距顯著縮小。平安中國(guó)建設(shè)達(dá)到更高水平,基本實(shí)現(xiàn)國(guó)防和軍隊(duì)現(xiàn)代化。人民生活更加美好,人的全面發(fā)展、全體人民共同富裕取得更為明顯的實(shí)質(zhì)性進(jìn)展。經(jīng)濟(jì)發(fā)展取得新成效。發(fā)展是解決我國(guó)一切問(wèn)題的基礎(chǔ)和關(guān)鍵,發(fā)展必須堅(jiān)持新發(fā)展理念,在質(zhì)量效益明顯提升的基礎(chǔ)上實(shí)現(xiàn)經(jīng)濟(jì)持續(xù)健康發(fā)展,增長(zhǎng)潛力充分發(fā)揮,國(guó)內(nèi)生產(chǎn)總值年均增長(zhǎng)保持在合理區(qū)間、各年度視情提出,全員勞動(dòng)生產(chǎn)率增長(zhǎng)高于國(guó)內(nèi)生產(chǎn)總值增長(zhǎng),國(guó)內(nèi)市場(chǎng)更加強(qiáng)大,經(jīng)濟(jì)結(jié)構(gòu)更加優(yōu)化,創(chuàng)新能力顯著提升,全社會(huì)研發(fā)經(jīng)費(fèi)投入年均增長(zhǎng)7%以上、力爭(zhēng)投入強(qiáng)度高于“十三五”時(shí)期實(shí)際,產(chǎn)業(yè)基礎(chǔ)高級(jí)化、產(chǎn)業(yè)鏈現(xiàn)代化水平明顯提高,農(nóng)業(yè)基礎(chǔ)更加穩(wěn)固,城鄉(xiāng)區(qū)域發(fā)展協(xié)調(diào)性明顯增強(qiáng),常住人口城鎮(zhèn)化率提高到65%,現(xiàn)代化經(jīng)濟(jì)體系建設(shè)取得重大進(jìn)展。得分閱卷人六、綜合應(yīng)用題三得分閱卷人自定義函數(shù)get_content(),分別讀取data文件夾下neg和pos文件夾中的文件。《Python文本與語(yǔ)音應(yīng)用設(shè)計(jì)》期末考試試題A卷答題紙適用班級(jí):人工智能

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論