版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章
數(shù)據(jù)標(biāo)注分類3.2
語(yǔ)音標(biāo)注3.3
文本標(biāo)注3.4
作業(yè)與練習(xí)3.1
圖像標(biāo)注3.1
圖像標(biāo)注
第三章數(shù)據(jù)標(biāo)注分類3.1.1什么是圖像標(biāo)注
圖像標(biāo)注問(wèn)題的本質(zhì)是視覺到語(yǔ)言的問(wèn)題,用通俗的話來(lái)說(shuō),就是“看圖說(shuō)話”。這就好比我們小時(shí)候在做看圖說(shuō)話題目一樣,同理,我們也希望算法能夠根據(jù)圖像得出描述其內(nèi)容含義的自然語(yǔ)句和自然語(yǔ)言。但是,這對(duì)于小朋友來(lái)說(shuō)小事一樁的小兒科級(jí)工作,對(duì)于計(jì)算機(jī)視覺領(lǐng)域來(lái)說(shuō),卻是一個(gè)不小的挑戰(zhàn)。因?yàn)閳D像標(biāo)注問(wèn)題需要在兩種不同形式的圖像信息到文本信息之間進(jìn)行“翻譯”才行。3.1
圖像標(biāo)注
第三章數(shù)據(jù)標(biāo)注分類3.1.2圖像標(biāo)注應(yīng)用領(lǐng)域
我們把一副18×18像素的圖片當(dāng)成一串324個(gè)數(shù)字的數(shù)列。為了更好地操控我們輸入的數(shù)據(jù),我們不妨把神經(jīng)網(wǎng)絡(luò)擴(kuò)大到324個(gè)輸入節(jié)點(diǎn)。第一個(gè)輸出預(yù)測(cè)圖片是“6”的概率,第二個(gè)則輸出預(yù)測(cè)不是“6”的概率。也就是說(shuō),這樣我們就可以依據(jù)多種不同的輸出,應(yīng)用神經(jīng)網(wǎng)絡(luò)把要識(shí)別的物品進(jìn)行分組。先對(duì)大批的“6”和非“6”圖片進(jìn)行標(biāo)注,相當(dāng)于我們明確告訴它我們判定為“6”的圖片是“6”的概率是100%,不是“6”的圖片其概率為0;對(duì)應(yīng)的非“6”的圖片,我們明確告訴它我們輸入的圖片是“6”的概率為0,不是“6”的概率是100%。我們可以利用計(jì)算機(jī)用幾分鐘的時(shí)間來(lái)訓(xùn)練這種神經(jīng)網(wǎng)絡(luò)。完成之后,我們便可以得到一個(gè)有著很高的“6”圖片識(shí)別率的神經(jīng)網(wǎng)絡(luò)。3.1圖像標(biāo)注
第三章數(shù)據(jù)標(biāo)注分類圖像標(biāo)注應(yīng)用領(lǐng)域劃分拉框標(biāo)注;切割標(biāo)注AI車牌識(shí)別云服務(wù)智慧路燈伴侶云平臺(tái)人臉關(guān)鍵點(diǎn)的標(biāo)注;240個(gè)點(diǎn)的人臉關(guān)鍵點(diǎn)位標(biāo)注模糊人臉識(shí)別分析+精確人像對(duì)比二合一應(yīng)用車輛車牌標(biāo)注人像識(shí)別標(biāo)注醫(yī)療影像技術(shù)發(fā)展還不夠成熟,進(jìn)入門檻較高AI前列腺癌診斷尺寸標(biāo)注;表面粗糙度標(biāo)注研發(fā)智能化的服務(wù)機(jī)器人醫(yī)療影像標(biāo)注機(jī)械影像標(biāo)注第三章
數(shù)據(jù)標(biāo)注分類3.1
圖像標(biāo)注3.3
文本標(biāo)注3.4
作業(yè)與練習(xí)3.2
語(yǔ)音標(biāo)注3.2
語(yǔ)音標(biāo)注
第三章數(shù)據(jù)標(biāo)注分類3.2.1什么是語(yǔ)音標(biāo)注
一般來(lái)說(shuō),語(yǔ)音標(biāo)注與我們生活的眾多方面都是息息相關(guān)的。比如,我們?cè)谑褂梦⑿艜r(shí),語(yǔ)音可以轉(zhuǎn)換成文字,在使用百度地圖APP上的小麥克風(fēng)功能,或者京東客服里的直接說(shuō)出問(wèn)題,JIMI對(duì)應(yīng)解決等功能。這些都需要前期大量的人工去標(biāo)記這些“說(shuō)出的話”所對(duì)應(yīng)的“文字”,采用人工的方式一點(diǎn)點(diǎn)去修正語(yǔ)音和文字間的誤差。這就是語(yǔ)音標(biāo)注。3.2
語(yǔ)音標(biāo)注
第三章數(shù)據(jù)標(biāo)注分類3.2.2
客服錄音數(shù)據(jù)標(biāo)注規(guī)范142563確定是否包含有效語(yǔ)音確定語(yǔ)音的噪聲情況確定說(shuō)話人數(shù)量語(yǔ)音內(nèi)容方面確定是否包含口音確定說(shuō)話人性別第三章
數(shù)據(jù)標(biāo)注分類3.1
圖像標(biāo)注3.2語(yǔ)音標(biāo)注3.4
作業(yè)與練習(xí)3.3
文本標(biāo)注3.3
文本標(biāo)注
第三章數(shù)據(jù)標(biāo)注分類
文本標(biāo)注其實(shí)是一個(gè)監(jiān)督學(xué)習(xí)問(wèn)題。我們可以把標(biāo)注問(wèn)題看作是分類問(wèn)題的一種推廣方式,同時(shí),標(biāo)注問(wèn)題也是更復(fù)雜的結(jié)構(gòu)預(yù)測(cè)問(wèn)題的簡(jiǎn)單形式。標(biāo)注問(wèn)題,其輸入是一個(gè)觀測(cè)序列,其輸出是一個(gè)標(biāo)記序列護(hù)著狀態(tài)序列。標(biāo)注問(wèn)題的目的是學(xué)習(xí)模型,使該模型能夠?qū)τ^測(cè)序列給出標(biāo)記序列作為預(yù)測(cè)。需要注意的是,標(biāo)記個(gè)數(shù)是有限的,但其組合縮成的標(biāo)記序列的個(gè)數(shù)是依照序列長(zhǎng)度呈指數(shù)級(jí)增長(zhǎng)的。作為最常見的數(shù)據(jù)標(biāo)注類型之一,文本標(biāo)注是指,將文字、符號(hào)在內(nèi)的文本進(jìn)行標(biāo)注,讓計(jì)算機(jī)能夠讀懂識(shí)別,從而應(yīng)用于人類的生產(chǎn)生活領(lǐng)域。3.3.1什么是文本標(biāo)注3.3文本標(biāo)注
第三章數(shù)據(jù)標(biāo)注分類3.3.2文本標(biāo)注應(yīng)用領(lǐng)域客服行業(yè)。主要集中在場(chǎng)景識(shí)別和應(yīng)答識(shí)別。以不少電商平臺(tái)的智能客服機(jī)器人為例,當(dāng)用戶在購(gòu)物遇到問(wèn)題,人工智能將根據(jù)用戶的咨詢內(nèi)容切入到對(duì)應(yīng)的場(chǎng)景里,根據(jù)用戶的具體問(wèn)題,給出對(duì)應(yīng)的回答。金融行業(yè)。線上平臺(tái)標(biāo)注和線下表格標(biāo)注,是金融行業(yè)文本標(biāo)注主要的標(biāo)注形式。一般,出現(xiàn)錯(cuò)誤的情況,被稱作“badcase”。打個(gè)比方,當(dāng)用戶問(wèn)信用卡怎么辦理的時(shí)候,機(jī)器人回復(fù)的卻是儲(chǔ)蓄卡的辦理流程,這就是出現(xiàn)了badcase”。醫(yī)療行業(yè)。對(duì)自然語(yǔ)言進(jìn)行標(biāo)記處理,需要專門的醫(yī)學(xué)人才才能進(jìn)行。首先明確每個(gè)詞的屬性,即每個(gè)詞在這種語(yǔ)境下面具備怎樣的屬性。然后標(biāo)注每個(gè)詞在句子中的作用。舉個(gè)例子,患者主訴為:腰痛2年,伴左下肢放射痛10日余。第三章
數(shù)據(jù)標(biāo)注分類3.1
圖像標(biāo)注3.3
文本標(biāo)注3.2
語(yǔ)音標(biāo)注3.4
作業(yè)與練習(xí)1.?dāng)?shù)據(jù)標(biāo)注有哪些分類?請(qǐng)簡(jiǎn)要概括。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 店面管理制度
- 預(yù)制件生產(chǎn)規(guī)章制度
- 保質(zhì)期及日常管理制度
- 貨車生產(chǎn)管理制度
- 安全生產(chǎn)監(jiān)督檢車制度
- 安全生產(chǎn)承諾制度
- 桁車安全生產(chǎn)管理制度
- 柏拉圖生產(chǎn)制度
- 計(jì)生產(chǎn)品經(jīng)營(yíng)管理制度
- 嗶哩嗶哩全生產(chǎn)制度
- 4S店總經(jīng)理績(jī)效考核方案
- 復(fù)方蒲公英注射液對(duì)心血管系統(tǒng)作用研究
- 2024年華能山東發(fā)電有限公司招聘筆試參考題庫(kù)含答案解析
- 高三英語(yǔ)定語(yǔ)從句公開課課件
- 學(xué)前教育-幼兒園戶外建構(gòu)游戲安全與對(duì)策的研究論文
- 門急診病歷質(zhì)控檢查評(píng)分標(biāo)準(zhǔn)
- 04S519小型排水構(gòu)筑物1
- 光纖激光打標(biāo)機(jī)說(shuō)明書
- 勞動(dòng)者個(gè)人職業(yè)健康監(jiān)護(hù)檔案
- 《兩角和與差的正弦、余弦、正切公式》示范公開課教學(xué)PPT課件【高中數(shù)學(xué)人教版】
- GB/T 28920-2012教學(xué)實(shí)驗(yàn)用危險(xiǎn)固體、液體的使用與保管
評(píng)論
0/150
提交評(píng)論