版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能領(lǐng)域數(shù)據(jù)處理解決方案質(zhì)的數(shù)據(jù)深度加工鏈|數(shù)據(jù)眾包百度數(shù)據(jù)眾包-AI基礎(chǔ)數(shù)據(jù)提供商數(shù)據(jù)之于人工智能高質(zhì)量的數(shù)據(jù)為訓(xùn)練人工智能提供了原材料能技術(shù)的實(shí)現(xiàn)和人工智能應(yīng)用的落地提供基礎(chǔ)的后臺(tái)保障!用層:身份識(shí)別、無(wú)人車、機(jī)器人等場(chǎng)景應(yīng)用:機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、語(yǔ)音識(shí)別、圖像識(shí)別、人臉:大數(shù)據(jù)、云計(jì)算、神經(jīng)網(wǎng)絡(luò)芯片等計(jì)算商方言語(yǔ)音數(shù)據(jù)場(chǎng)景語(yǔ)音數(shù)據(jù)語(yǔ)音文本數(shù)據(jù)社交網(wǎng)絡(luò)文本數(shù)據(jù)新聞媒體輿情數(shù)據(jù)社區(qū)、論壇知識(shí)數(shù)據(jù)多語(yǔ)種文本數(shù)據(jù)細(xì)粒度語(yǔ)義標(biāo)注數(shù)據(jù)人臉圖像數(shù)據(jù)字符圖像數(shù)據(jù)物體圖像數(shù)據(jù)物體屬性數(shù)據(jù)物體行為數(shù)據(jù)不同領(lǐng)域的詞性及關(guān)系數(shù)據(jù)數(shù)據(jù)處理的困境數(shù)據(jù)加工提取分類清洗評(píng)估據(jù),人工智能基礎(chǔ)數(shù)據(jù)的兩大難題數(shù)據(jù)加工提取分類清洗評(píng)估始數(shù)據(jù)數(shù)據(jù)獲取數(shù)據(jù)獲取本采集音采集頻采集統(tǒng)一的采集標(biāo)準(zhǔn)廣,需要外包人時(shí)間、經(jīng)濟(jì)成本大視視頻網(wǎng)頁(yè)文本圖片語(yǔ)音構(gòu)化的數(shù)據(jù)量量精準(zhǔn)識(shí)別數(shù)據(jù)一標(biāo)準(zhǔn),方法不一致,投入頸數(shù)據(jù)處理眾包海量采集(一般場(chǎng)景、非專業(yè)設(shè)備)包用戶數(shù)據(jù)處理眾包海量采集(一般場(chǎng)景、非專業(yè)設(shè)備)包用戶取采集APP網(wǎng)頁(yè)初檢、場(chǎng)地培訓(xùn)據(jù)取上傳模擬現(xiàn)場(chǎng)采集(需要特殊專業(yè)設(shè)備、特殊場(chǎng)景的項(xiàng)目)戶數(shù)據(jù)需求案專家需求定義任務(wù)設(shè)計(jì)與拆分場(chǎng)片文本語(yǔ)音視頻O片文本語(yǔ)音視頻P戶端9海量眾包近場(chǎng)采集練數(shù)據(jù)集的樣本數(shù)據(jù)用于礎(chǔ)訓(xùn)練,盡可能多各類人群?jiǎn)拘言~采集海量眾包近場(chǎng)采集練數(shù)據(jù)集的樣本數(shù)據(jù)用于礎(chǔ)訓(xùn)練,盡可能多各類人群?jiǎn)拘言~采集型使用人群在真實(shí)場(chǎng)遠(yuǎn) 表采集試集近場(chǎng)數(shù)據(jù):采集能力:累計(jì)完成超過(guò)5000小時(shí),覆蓋10w人近場(chǎng)數(shù)據(jù):。項(xiàng)目執(zhí)行方案:預(yù)處理審核標(biāo)注注級(jí)審核評(píng)估清洗提取其他析致力于數(shù)據(jù)處理規(guī)則的標(biāo)準(zhǔn)化與工具化注OCR審核預(yù)處理預(yù)處理審核標(biāo)注注級(jí)審核評(píng)估清洗提取其他析致力于數(shù)據(jù)處理規(guī)則的標(biāo)準(zhǔn)化與工具化注OCR審核預(yù)處理注道包包級(jí)審核戶需求需求據(jù)需求2、智能加眾包標(biāo)注:AIAI實(shí)現(xiàn)日均百萬(wàn)的數(shù)據(jù)吞AIAI3、多級(jí)質(zhì)量管控:道突破準(zhǔn)確率瓶頸道?不完整數(shù)據(jù)?錯(cuò)誤數(shù)據(jù)?冗余數(shù)據(jù)?數(shù)據(jù)標(biāo)簽化?垂類數(shù)據(jù)?關(guān)鍵詞提取?網(wǎng)頁(yè)內(nèi)容提取?圖片內(nèi)容提取(OCR體識(shí)別等)數(shù)據(jù)清洗數(shù)據(jù)清洗33數(shù)據(jù)內(nèi)容獲取數(shù)據(jù)評(píng)估數(shù)據(jù)評(píng)估244殊信息?相關(guān)性評(píng)估?時(shí)效性評(píng)估?競(jìng)品評(píng)估?電子商務(wù)評(píng)論?地圖信息制作?語(yǔ)音轉(zhuǎn)寫?其他數(shù)據(jù)標(biāo)注—通用圖片檢測(cè)通用圖片檢測(cè)類型涵蓋商品、動(dòng)物、植物、菜品、服裝搭配、黃反、暴恐、建筑、素材等多種垂類。1.多圖vs.單圖;2.圖+參考文字/參考圖/搜索頁(yè)面/參考鏈接/預(yù)識(shí)別結(jié)果/特定內(nèi)部參考頁(yè)面;3.多題vs.單題;4.題目類型:?jiǎn)芜x/多選/多級(jí)菜單選擇/填寫框選類能力涵蓋:普通矩形、分類矩形、普通多邊形、分類多邊形、區(qū)域填色、多級(jí)屬性多邊形、Parsing、點(diǎn)+線+區(qū)域復(fù)合檢測(cè)分類矩形普通矩形框普分類矩形普通矩形框點(diǎn)+線+區(qū)域復(fù)合分類多邊形區(qū)域點(diǎn)+線+區(qū)域復(fù)合分類多邊形對(duì)“興趣偏好“屬性進(jìn)行策略優(yōu)化,通過(guò)第三方人工標(biāo)注,通過(guò)用戶人工貢獻(xiàn)評(píng)價(jià),評(píng)估策略優(yōu)化后的標(biāo)簽準(zhǔn)確率令要素提取依據(jù)客戶要求對(duì)文字內(nèi)容或槽位進(jìn)行提取并定位具體屬性。標(biāo)注工具——圖片&語(yǔ)音轉(zhuǎn)寫言O(shè)CR文字轉(zhuǎn)寫2.進(jìn)行多種口音的語(yǔ)音文字轉(zhuǎn)寫17標(biāo)注標(biāo)注類助標(biāo)注眾包用戶核心用戶團(tuán)隊(duì)標(biāo)注員作業(yè)項(xiàng)目助理 標(biāo)注員作業(yè)項(xiàng)目助理 標(biāo)準(zhǔn)自學(xué)統(tǒng)一培訓(xùn)習(xí)考試 檢 (實(shí)時(shí))產(chǎn)品線 )收檢戶?以“公會(huì)”聚集的小組(生產(chǎn)單元)?工作量、質(zhì)量考核?公會(huì)獎(jiǎng)懲、升降級(jí)中前后19案例:人臉識(shí)別基礎(chǔ)數(shù)據(jù)服務(wù)使使用場(chǎng)景:身份識(shí)別,攝像監(jiān)視系統(tǒng),支付系統(tǒng),門禁系統(tǒng)?采?一人多照人臉圖片:多表情、多姿態(tài)?跨年齡段人臉圖片:70-00后全年齡段?多光照條件、?多遮擋條件?標(biāo)?人臉檢測(cè)標(biāo)注:人臉位置框選?人臉關(guān)鍵點(diǎn)標(biāo)注:人臉5點(diǎn)-72點(diǎn)標(biāo)注?驗(yàn)收通過(guò)率100%20例:語(yǔ)音識(shí)別基礎(chǔ)數(shù)據(jù)服務(wù)使使用場(chǎng)景:音識(shí)別,智能機(jī)器人?采?采集指定地區(qū)的漢語(yǔ)方言數(shù)據(jù)?通過(guò)手機(jī)自帶麥克錄制?四川話/上海話/湖南話等8種方言?安靜/吵鬧環(huán)境錄制?標(biāo)?語(yǔ)音數(shù)據(jù)轉(zhuǎn)寫?中文方言、普通話?轉(zhuǎn)寫準(zhǔn)確率98%,業(yè)內(nèi)第一人像識(shí)別語(yǔ)音識(shí)別跨年齡段人像識(shí)別語(yǔ)音識(shí)別跨年齡段暗光人臉家福臉打點(diǎn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河北省公需課學(xué)習(xí)-基本養(yǎng)老保險(xiǎn)制度改革方案
- 2025年期中試卷講評(píng)模板及答案
- 印章培訓(xùn)考試題庫(kù)及答案
- 文科考研高分試卷及答案
- 宜賓特崗語(yǔ)文真題及答案
- 長(zhǎng)期定向采購(gòu)合同范本
- 跳舞人身意外合同范本
- 買賣燒鴨合同范本
- 農(nóng)村拆遷贈(zèng)予合同范本
- 臀部護(hù)理的飲食建議
- 股權(quán)抵押分紅協(xié)議書
- 《數(shù)字化測(cè)圖》實(shí)訓(xùn)指導(dǎo)書
- 電影監(jiān)制的合同范本
- 2025年高級(jí)農(nóng)藝工考試題及答案
- 鐵路工務(wù)安全管理存在的問(wèn)題及對(duì)策
- 2026-2031年中國(guó)文化旅游行業(yè)市場(chǎng)未來(lái)發(fā)展趨勢(shì)研究報(bào)告
- (16)普通高中體育與健康課程標(biāo)準(zhǔn)日常修訂版(2017年版2025年修訂)
- 2025廣東茂名市高州市市屬國(guó)有企業(yè)招聘企業(yè)人員總及筆試歷年參考題庫(kù)附帶答案詳解
- 2023年考研歷史學(xué)模擬試卷及答案 古代希臘文明
- 獸藥營(yíng)銷方案
- 2025年廣西繼續(xù)教育公需科目真題及答案
評(píng)論
0/150
提交評(píng)論