下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
詞向量模型概述1.1Word2vec模型Word2vec作為一種詞嵌入方法嘗嘗被用于自然語言處理任務(wù)中,它是Mikolov等人ADDINEN.CITE<EndNote><Cite><Author>Mikolov</Author><Year>2013</Year><RecNum>122</RecNum><DisplayText><styleface="superscript">[52]</style></DisplayText><record><rec-number>122</rec-number><foreign-keys><keyapp="EN"db-id="xxp5f09arwdtx3e2907vv2rwtxzpxpx2ezat"timestamp="1647622056">122</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Mikolov,Tomas</author><author>Sutskever,Ilya</author><author>Chen,Kai</author><author>Corrado,GregS</author><author>Dean,Jeff</author></authors></contributors><titles><title>Distributedrepresentationsofwordsandphrasesandtheircompositionality</title><secondary-title>Advancesinneuralinformationprocessingsystems</secondary-title></titles><periodical><full-title>Advancesinneuralinformationprocessingsystems</full-title></periodical><volume>26</volume><dates><year>2013</year></dates><urls></urls></record></Cite></EndNote>[52]對(duì)詞匯信息進(jìn)行研究時(shí)得出的,該方法可以通過詞匯共現(xiàn)信息從給定的大量無標(biāo)注語料數(shù)據(jù)中將詞匯匯編成為詞的向量形式,經(jīng)訓(xùn)練完成之后,它們可以用來反應(yīng)詞與詞之間存在的語義關(guān)系。Word2vec模型可以分為兩類,一類是跳字模型(Skip-gram),另一類是連續(xù)詞袋模型(ContinuousBagofwords,CBOW),它們都可在詞向量訓(xùn)練時(shí)進(jìn)行使用。將其結(jié)構(gòu)圖進(jìn)行描繪,具體樣式如圖2-3所示:圖2-3Word2vec模型結(jié)構(gòu)圖在上述兩種模型中,都具備相同的三層結(jié)構(gòu),分別是輸入層、投影層和輸出層,但兩種模型之間的原理并不相同。CBOW模型可以計(jì)算詞出現(xiàn)的可能性,具體的計(jì)算過程需要聯(lián)合上下文中的詞語來進(jìn)行,將其形式化: (2-12)在公式(2-12)中,代表某一位置的詞匯,而和則代表以這一詞匯為基準(zhǔn)的上下文詞匯。Skip-gram模型與前者存在很大的反差,它是文本內(nèi)容中通過詞的位置來反向?qū)η昂笤~匯和的預(yù)測(cè),將其形式化: (2-13)在大多數(shù)的實(shí)驗(yàn)中,Skip-gram模型一般訓(xùn)練用時(shí)比BOWM模型訓(xùn)練用時(shí)要長(zhǎng),且預(yù)測(cè)結(jié)果的準(zhǔn)確度也相對(duì)較高。1.2BERT模型自然語言處理技術(shù)中還有一種是Devlin等人ADDINEN.CITE<EndNote><Cite><Author>Devlin</Author><Year>2018</Year><RecNum>45</RecNum><DisplayText><styleface="superscript">[53]</style></DisplayText><record><rec-number>45</rec-number><foreign-keys><keyapp="EN"db-id="xxp5f09arwdtx3e2907vv2rwtxzpxpx2ezat"timestamp="1635953909">45</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Devlin,Jacob</author><author>Chang,Ming-Wei</author><author>Lee,Kenton</author><author>Toutanova,Kristina</author></authors></contributors><titles><title>Bert:Pre-trainingofdeepbidirectionaltransformersforlanguageunderstanding</title><secondary-title>arXivpreprintarXiv:1810.04805</secondary-title></titles><periodical><full-title>arXivpreprintarXiv:1810.04805</full-title></periodical><dates><year>2018</year></dates><urls></urls></record></Cite></EndNote>[53]提出的BERT模型,因?yàn)楝F(xiàn)存的一些語言訓(xùn)練模型大多數(shù)都是單向的,沒有充分考慮方向?qū)τ谡Z義的影響,只是單方向的依賴關(guān)系并非最佳選擇,因此可用的與訓(xùn)練模型都存在一些限制。BERT模型主要采用了遷移學(xué)習(xí),先從大量無標(biāo)注語料數(shù)據(jù)中學(xué)習(xí)得到語言知識(shí),然后將語言知識(shí)遷移到下游任務(wù)。簡(jiǎn)單來說,就是在借助無監(jiān)督的情況下完成一個(gè)雙向語言模型的學(xué)習(xí),再將學(xué)習(xí)得到的文本內(nèi)的語義信息經(jīng)由下游任務(wù)的數(shù)據(jù)集來進(jìn)行模型參數(shù)微調(diào),實(shí)現(xiàn)遷移學(xué)習(xí)的目的。一個(gè)BERT預(yù)訓(xùn)練模型的基礎(chǔ)結(jié)構(gòu)是標(biāo)準(zhǔn)的transformer結(jié)構(gòu)內(nèi)的encoder部分,而BERT的核心結(jié)構(gòu)雙向的transformer,BERT的網(wǎng)絡(luò)結(jié)構(gòu)具體展示如下:圖2-4BERT網(wǎng)絡(luò)結(jié)構(gòu)圖網(wǎng)絡(luò)結(jié)構(gòu)具體包括三層,第一層是輸入層,中間的一層是transformer編碼層,最后一層為輸出層,我們只需要把以上三個(gè)部分實(shí)現(xiàn)再實(shí)現(xiàn)預(yù)訓(xùn)練任務(wù)的代碼,BERT就算完成了。其中核心部
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 我國(guó)上市公司定向增發(fā)及其股價(jià)效應(yīng)的深度剖析與實(shí)證研究
- 老年糖尿病合并衰弱的疼痛管理方案
- 鋼水罐準(zhǔn)備工崗前品牌建設(shè)考核試卷含答案
- 運(yùn)動(dòng)場(chǎng)草坪管理師崗前技能綜合實(shí)踐考核試卷含答案
- 耐火材料模具工道德能力考核試卷含答案
- 快件派送員安全實(shí)踐測(cè)試考核試卷含答案
- 老年神經(jīng)系統(tǒng)疾病尿失禁預(yù)防性護(hù)理方案
- 鐵路系統(tǒng)職業(yè)發(fā)展路徑
- 老年焦慮抑郁共病的藥物經(jīng)濟(jì)學(xué)評(píng)價(jià)
- 2026吉林大學(xué)第二醫(yī)院勞務(wù)派遣制病案管理崗位招聘20人備考題庫(kù)及答案詳解參考
- 全國(guó)物業(yè)管理法律法規(guī)及案例解析
- 2025年度黨委黨建工作總結(jié)
- 抖音來客本地生活服務(wù)酒旅酒店民宿旅游景區(qū)商家代運(yùn)營(yíng)策劃方案
- 新質(zhì)生產(chǎn)力在體育產(chǎn)業(yè)高質(zhì)量發(fā)展中的路徑探索
- 2025年公民素質(zhì)養(yǎng)成知識(shí)考察試題及答案解析
- 北侖區(qū)打包箱房施工方案
- 老年人營(yíng)養(yǎng)和飲食
- 車載光通信技術(shù)發(fā)展及無源網(wǎng)絡(luò)應(yīng)用前景
- 2026屆上海市金山區(qū)物理八年級(jí)第一學(xué)期期末調(diào)研試題含解析
- DB62-T 5101-2025 公路綠化技術(shù)規(guī)范
- 《關(guān)鍵軟硬件自主可控產(chǎn)品名錄》
評(píng)論
0/150
提交評(píng)論