數(shù)據(jù)標(biāo)注工程課件數(shù)據(jù)標(biāo)注分類_第1頁(yè)
數(shù)據(jù)標(biāo)注工程課件數(shù)據(jù)標(biāo)注分類_第2頁(yè)
數(shù)據(jù)標(biāo)注工程課件數(shù)據(jù)標(biāo)注分類_第3頁(yè)
數(shù)據(jù)標(biāo)注工程課件數(shù)據(jù)標(biāo)注分類_第4頁(yè)
數(shù)據(jù)標(biāo)注工程課件數(shù)據(jù)標(biāo)注分類_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章

數(shù)據(jù)標(biāo)注分類3.2

語(yǔ)音標(biāo)注3.3

文本標(biāo)注3.4

作業(yè)與練習(xí)3.1

圖像標(biāo)注3.1

圖像標(biāo)注

第三章數(shù)據(jù)標(biāo)注分類3.1.1什么是圖像標(biāo)注

圖像標(biāo)注問(wèn)題的本質(zhì)是視覺到語(yǔ)言的問(wèn)題,用通俗的話來(lái)說(shuō),就是“看圖說(shuō)話”。這就好比我們小時(shí)候在做看圖說(shuō)話題目一樣,同理,我們也希望算法能夠根據(jù)圖像得出描述其內(nèi)容含義的自然語(yǔ)句和自然語(yǔ)言。但是,這對(duì)于小朋友來(lái)說(shuō)小事一樁的小兒科級(jí)工作,對(duì)于計(jì)算機(jī)視覺領(lǐng)域來(lái)說(shuō),卻是一個(gè)不小的挑戰(zhàn)。因?yàn)閳D像標(biāo)注問(wèn)題需要在兩種不同形式的圖像信息到文本信息之間進(jìn)行“翻譯”才行。3.1

圖像標(biāo)注

第三章數(shù)據(jù)標(biāo)注分類3.1.2圖像標(biāo)注應(yīng)用領(lǐng)域

我們把一副18×18像素的圖片當(dāng)成一串324個(gè)數(shù)字的數(shù)列。為了更好地操控我們輸入的數(shù)據(jù),我們不妨把神經(jīng)網(wǎng)絡(luò)擴(kuò)大到324個(gè)輸入節(jié)點(diǎn)。第一個(gè)輸出預(yù)測(cè)圖片是“6”的概率,第二個(gè)則輸出預(yù)測(cè)不是“6”的概率。也就是說(shuō),這樣我們就可以依據(jù)多種不同的輸出,應(yīng)用神經(jīng)網(wǎng)絡(luò)把要識(shí)別的物品進(jìn)行分組。先對(duì)大批的“6”和非“6”圖片進(jìn)行標(biāo)注,相當(dāng)于我們明確告訴它我們判定為“6”的圖片是“6”的概率是100%,不是“6”的圖片其概率為0;對(duì)應(yīng)的非“6”的圖片,我們明確告訴它我們輸入的圖片是“6”的概率為0,不是“6”的概率是100%。我們可以利用計(jì)算機(jī)用幾分鐘的時(shí)間來(lái)訓(xùn)練這種神經(jīng)網(wǎng)絡(luò)。完成之后,我們便可以得到一個(gè)有著很高的“6”圖片識(shí)別率的神經(jīng)網(wǎng)絡(luò)。3.1圖像標(biāo)注

第三章數(shù)據(jù)標(biāo)注分類圖像標(biāo)注應(yīng)用領(lǐng)域劃分拉框標(biāo)注;切割標(biāo)注AI車牌識(shí)別云服務(wù)智慧路燈伴侶云平臺(tái)人臉關(guān)鍵點(diǎn)的標(biāo)注;240個(gè)點(diǎn)的人臉關(guān)鍵點(diǎn)位標(biāo)注模糊人臉識(shí)別分析+精確人像對(duì)比二合一應(yīng)用車輛車牌標(biāo)注人像識(shí)別標(biāo)注醫(yī)療影像技術(shù)發(fā)展還不夠成熟,進(jìn)入門檻較高AI前列腺癌診斷尺寸標(biāo)注;表面粗糙度標(biāo)注研發(fā)智能化的服務(wù)機(jī)器人醫(yī)療影像標(biāo)注機(jī)械影像標(biāo)注第三章

數(shù)據(jù)標(biāo)注分類3.1

圖像標(biāo)注3.3

文本標(biāo)注3.4

作業(yè)與練習(xí)3.2

語(yǔ)音標(biāo)注3.2

語(yǔ)音標(biāo)注

第三章數(shù)據(jù)標(biāo)注分類3.2.1什么是語(yǔ)音標(biāo)注

一般來(lái)說(shuō),語(yǔ)音標(biāo)注與我們生活的眾多方面都是息息相關(guān)的。比如,我們?cè)谑褂梦⑿艜r(shí),語(yǔ)音可以轉(zhuǎn)換成文字,在使用百度地圖APP上的小麥克風(fēng)功能,或者京東客服里的直接說(shuō)出問(wèn)題,JIMI對(duì)應(yīng)解決等功能。這些都需要前期大量的人工去標(biāo)記這些“說(shuō)出的話”所對(duì)應(yīng)的“文字”,采用人工的方式一點(diǎn)點(diǎn)去修正語(yǔ)音和文字間的誤差。這就是語(yǔ)音標(biāo)注。3.2

語(yǔ)音標(biāo)注

第三章數(shù)據(jù)標(biāo)注分類3.2.2

客服錄音數(shù)據(jù)標(biāo)注規(guī)范142563確定是否包含有效語(yǔ)音確定語(yǔ)音的噪聲情況確定說(shuō)話人數(shù)量語(yǔ)音內(nèi)容方面確定是否包含口音確定說(shuō)話人性別第三章

數(shù)據(jù)標(biāo)注分類3.1

圖像標(biāo)注3.2語(yǔ)音標(biāo)注3.4

作業(yè)與練習(xí)3.3

文本標(biāo)注3.3

文本標(biāo)注

第三章數(shù)據(jù)標(biāo)注分類

文本標(biāo)注其實(shí)是一個(gè)監(jiān)督學(xué)習(xí)問(wèn)題。我們可以把標(biāo)注問(wèn)題看作是分類問(wèn)題的一種推廣方式,同時(shí),標(biāo)注問(wèn)題也是更復(fù)雜的結(jié)構(gòu)預(yù)測(cè)問(wèn)題的簡(jiǎn)單形式。標(biāo)注問(wèn)題,其輸入是一個(gè)觀測(cè)序列,其輸出是一個(gè)標(biāo)記序列護(hù)著狀態(tài)序列。標(biāo)注問(wèn)題的目的是學(xué)習(xí)模型,使該模型能夠?qū)τ^測(cè)序列給出標(biāo)記序列作為預(yù)測(cè)。需要注意的是,標(biāo)記個(gè)數(shù)是有限的,但其組合縮成的標(biāo)記序列的個(gè)數(shù)是依照序列長(zhǎng)度呈指數(shù)級(jí)增長(zhǎng)的。作為最常見的數(shù)據(jù)標(biāo)注類型之一,文本標(biāo)注是指,將文字、符號(hào)在內(nèi)的文本進(jìn)行標(biāo)注,讓計(jì)算機(jī)能夠讀懂識(shí)別,從而應(yīng)用于人類的生產(chǎn)生活領(lǐng)域。3.3.1什么是文本標(biāo)注3.3文本標(biāo)注

第三章數(shù)據(jù)標(biāo)注分類3.3.2文本標(biāo)注應(yīng)用領(lǐng)域客服行業(yè)。主要集中在場(chǎng)景識(shí)別和應(yīng)答識(shí)別。以不少電商平臺(tái)的智能客服機(jī)器人為例,當(dāng)用戶在購(gòu)物遇到問(wèn)題,人工智能將根據(jù)用戶的咨詢內(nèi)容切入到對(duì)應(yīng)的場(chǎng)景里,根據(jù)用戶的具體問(wèn)題,給出對(duì)應(yīng)的回答。金融行業(yè)。線上平臺(tái)標(biāo)注和線下表格標(biāo)注,是金融行業(yè)文本標(biāo)注主要的標(biāo)注形式。一般,出現(xiàn)錯(cuò)誤的情況,被稱作“badcase”。打個(gè)比方,當(dāng)用戶問(wèn)信用卡怎么辦理的時(shí)候,機(jī)器人回復(fù)的卻是儲(chǔ)蓄卡的辦理流程,這就是出現(xiàn)了badcase”。醫(yī)療行業(yè)。對(duì)自然語(yǔ)言進(jìn)行標(biāo)記處理,需要專門的醫(yī)學(xué)人才才能進(jìn)行。首先明確每個(gè)詞的屬性,即每個(gè)詞在這種語(yǔ)境下面具備怎樣的屬性。然后標(biāo)注每個(gè)詞在句子中的作用。舉個(gè)例子,患者主訴為:腰痛2年,伴左下肢放射痛10日余。第三章

數(shù)據(jù)標(biāo)注分類3.1

圖像標(biāo)注3.3

文本標(biāo)注3.2

語(yǔ)音標(biāo)注3.4

作業(yè)與練習(xí)1.?dāng)?shù)據(jù)標(biāo)注有哪些分類?請(qǐng)簡(jiǎn)要概括。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論