2025年人工智能訓練師(中級)考點速記150題核心必背(含答案)_第1頁
2025年人工智能訓練師(中級)考點速記150題核心必背(含答案)_第2頁
2025年人工智能訓練師(中級)考點速記150題核心必背(含答案)_第3頁
2025年人工智能訓練師(中級)考點速記150題核心必背(含答案)_第4頁
2025年人工智能訓練師(中級)考點速記150題核心必背(含答案)_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE1一、單選題1.對于答疑的目的,以下說法正確的是A、提高質(zhì)檢人員的置信度B、解決標注人員的疑問C、優(yōu)化項目標準D、縮短項目周期答案:B2.智能平臺完成功能優(yōu)化更新后,標注員需要提供優(yōu)化結果反饋,其中包含()A、數(shù)據(jù)標注結果B、標注準確率C、功能優(yōu)化的收益(節(jié)約工時/提效)D、以上三種均是答案:C3.在單標注框質(zhì)檢過程中,返修后提交的標注框輪廓是什么顏色?A、白色B、綠色C、紅色D、黃色答案:D4.關于采集需求中數(shù)據(jù)交付周期規(guī)定說法錯誤的是()A、數(shù)據(jù)交付周期是指數(shù)據(jù)交付的時間點,采集需求中會明確數(shù)據(jù)交付的時間B、交付周期和人力估算是采集需求中一定會有的內(nèi)容C、采集需求中一般不會明確延期的后果D、采集需求中的交付周期是估算值,一般需要留有余地,避免打回造成的延期答案:B5.以下屬于文本類數(shù)據(jù)采集的應用場景的是()A、設計圖采集B、小語種OCR采集C、3D建模實勘采集D、自動駕駛地圖采集答案:B6.在停車位和交通標志圖像采集中,以下采集到的數(shù)據(jù)符合要求的是()A、帶有紅綠燈的十字路口B、清晰的人臉C、模糊的指示牌D、被樹葉遮擋的車位答案:C7.以下屬于智能數(shù)據(jù)平臺基礎維護動作的有()A、定期檢驗平臺基礎設置是否正確B、定期備份平臺內(nèi)重要數(shù)據(jù)C、定期清理智能平臺緩存D、以上三種均可答案:D8.以下哪個問題不是智能平臺的常見使用問題()A、模型訓練不符合預期B、登錄頁面白屏C、標注數(shù)據(jù)不顯示D、標注準確率不達標答案:D9.需要采集論壇微博類的數(shù)據(jù),同時最大化節(jié)約采集成本可以使用以下哪種采集工具()A、直接購買B、網(wǎng)絡爬蟲C、第三方合作D、眾包采集答案:B10.以下哪項屬于ASR項目中常見的錯誤類型()A、截取片段內(nèi)轉寫內(nèi)容和音頻不完全不一致B、轉寫內(nèi)容里的數(shù)字未正則化C、截取的片段前后靜音時長超過標準規(guī)定D、以上都是答案:D11.以下哪種風險可以通過定期備份數(shù)據(jù)避免()A、標注速度過慢導致延期交付B、規(guī)則不明晰導致標注質(zhì)量不達標C、系統(tǒng)崩潰導致數(shù)據(jù)丟失D、以上三種均可答案:C12.數(shù)據(jù)標注質(zhì)量的衡量尺是()A、數(shù)據(jù)標記B、數(shù)據(jù)規(guī)約C、數(shù)據(jù)標注規(guī)則D、數(shù)據(jù)集合答案:C13.刪除重復項并保留唯一值的公式是()A、COUNTB、SUMIFC、VLOOKUPD、UNIQUE答案:D14.在智能平臺進行質(zhì)檢操作時,發(fā)現(xiàn)系統(tǒng)不穩(wěn)定,經(jīng)常出現(xiàn)卡頓,應該()A、減少質(zhì)檢數(shù)量,降低人效B、向平臺進行反饋C、頻繁點擊提交D、休息等待,知道不再卡頓答案:B15.視頻采集的方式不包括()A、拍攝B、剪輯C、后期D、測評答案:D16.以下對數(shù)據(jù)清洗的描述中,有誤的是()A、數(shù)據(jù)清洗是對原始數(shù)據(jù)重新審查和校驗的過程B、數(shù)據(jù)清洗的目的是刪除重復信息與糾正錯誤C、數(shù)據(jù)清洗不會涉及數(shù)據(jù)的分解和重組D、數(shù)據(jù)清洗為了使數(shù)據(jù)保持精確、完整、一致、有效答案:C17.質(zhì)檢文本項目時,不需要質(zhì)檢以下哪些方面()A、修改錯別字B、修改標點符號C、修改段落分段D、修改截取區(qū)間答案:D18.在智能平臺中,待質(zhì)檢的數(shù)據(jù)可以在哪個頁面中找到()A、個人信息B、系統(tǒng)消息C、審批待辦D、我的任務答案:D19.作為人工智能訓練師,在為模型訓練提供數(shù)據(jù)標注的過程中應了解()A、標注的正例/負例結果對模型收益的影響B(tài)、模型訓練集和測試集的基本概念C、標注的正例/負例結果對模型準召率的影響D、以上三種均是答案:D20.修改標準一般由以下哪個角色來執(zhí)行A、撰寫標準的人B、標注人員C、質(zhì)檢人員D、對標準提出建議的人答案:A21.數(shù)據(jù)采集中會涉及到數(shù)據(jù)分析報告,采集數(shù)據(jù)的分析報告不需要包括()A、數(shù)據(jù)類型占比B、采集人員家庭信息C、數(shù)據(jù)總量D、數(shù)據(jù)采集周期答案:B22.音頻采集中,以下采集數(shù)據(jù)具有有效性的是()A、語音段中有很強的背景噪聲B、整段語音沒有說話人的語音,只有噪音或靜音C、說話人聲音極小導致聽不清說話內(nèi)容D、采集的語音與文本完全一致答案:D23.對智能平臺優(yōu)化提出需求時,應該()A、吐槽抱怨自己對平臺不足的感受B、提出模糊建議C、不限定優(yōu)化完成時間D、清晰地描述問題的具體情況答案:D24.可以將數(shù)據(jù)轉化為可視化的圖表和圖形,使數(shù)據(jù)更加直觀和易于理解的數(shù)據(jù)驗收方式是()A、數(shù)據(jù)驗收報告B、用戶反饋C、數(shù)據(jù)質(zhì)量評估工具D、數(shù)據(jù)可視化工具答案:D25.數(shù)據(jù)標注項目中,質(zhì)檢二次抽檢結果不合格,可能的原因是()A、質(zhì)檢員質(zhì)檢過程不細心B、二次抽檢比例過低C、二次抽檢的數(shù)據(jù)不全面D、以上都是答案:D26.用戶思維,簡單來說就是"以用戶為中心",針對用戶的各種個性化、細分化需求,提供各種針對性的產(chǎn)品和服務,真正做到"用戶至上";以下哪項不屬于用戶思維的三大法則()A、你的搜索用戶有多少人B、你的搜索用戶是誰C、搜索用戶要什么D、怎樣滿足搜索用戶的需求答案:A27.處理申訴正確的做法是()A、什么時候處理申訴都可以不用太著急B、需要判斷是否通過申訴,并且填寫質(zhì)檢回復C、質(zhì)檢員只需要進行數(shù)據(jù)質(zhì)檢,不需要對申訴問題進行答疑。D、處理申訴可以慢慢處理,不用考慮處理耗時答案:B28.以下哪個場景會出現(xiàn)在項目標準培訓中()A、標注人員對項目標準的質(zhì)疑B、承接項目需求C、交付項目數(shù)據(jù)D、完成數(shù)據(jù)清洗答案:A29.以下選項中,需求流轉流程正確的是()A、需求發(fā)起-需求評估-需求承接-需求運營-需求交付B、需求發(fā)起-需求承接-需求評估-需求運營-需求交付C、需求評估-需求發(fā)起-需求承接-需求運營-需求交付D、需求評估-需求承接-需求發(fā)起-需求運營-需求交付答案:A30.語義標注自檢不包括以下哪種場景A、針對文本出現(xiàn)的地方進行檢查B、針對單獨詞語或語句進行檢查C、針對上下文的情景環(huán)境進行檢查D、針對語音數(shù)據(jù)中的語音語調(diào)進行檢查答案:A31.采集數(shù)據(jù)質(zhì)量控制的方法不包括()A、多人驗證B、采集人員狀態(tài)驗證C、人效驗證D、機器驗證答案:C32.以下哪項會導致質(zhì)檢答疑效率較低()A、標注對規(guī)則理解存在問題B、質(zhì)檢對規(guī)則理解存在問題C、標注量增加D、質(zhì)檢量增加答案:B33.在數(shù)據(jù)標注中,以下哪項不屬于情感判斷的維度()A、情感極性分類,包括正面、負面、中性B、三是情感分類,是按范疇、維度或語言學理論進行分類C、四是細致觀點劃分,可分為實體、情感、觀點持有者等D、按情感表述文本的長短,可分為長句型和短句型等答案:D34.在文本仿寫數(shù)據(jù)標注項目的質(zhì)檢作業(yè)中,質(zhì)檢員不需要關注()A、仿寫數(shù)據(jù)存在雷同B、仿寫數(shù)據(jù)的字數(shù)與原文嚴格一致C、仿寫數(shù)據(jù)存在錯別字D、仿寫數(shù)據(jù)存在語法錯誤答案:B35.關于項目風險管理說法錯誤的是()A、需要提前管控B、及時溝通協(xié)調(diào)C、發(fā)生概率低的不需管理D、對無法挽回的錯誤要及時止損答案:C36.北京烤鴨的一級,二級,三級品類分別是()A、美食;地方菜;北京菜B、美食;北京菜;地方菜C、北京菜;地方菜;美食D、地方菜;北京菜;美食答案:A37.采集項目開始前,主要溝通信息不包括()A、考勤制度B、預估周期C、規(guī)則確認D、數(shù)據(jù)量級答案:A38.某數(shù)據(jù)標注項目有A、B、C三名人員進行標注,內(nèi)容是對每一條數(shù)據(jù)判斷“是”或“否”,想統(tǒng)計三位人員每天的工作量,需要用到的函數(shù)是()A、COUNTB、COUNTIFSC、SUMD、SUMIF答案:B39.數(shù)據(jù)標注場景中存在抽檢、盲審、全檢等質(zhì)檢方式,以下對盲審的描述錯誤的是()A、若初審和盲審的審核結果不一致時,這個任務才會進入第三輪質(zhì)檢B、同一個任務在一個隊列里可能會被不同的審核人審核C、若初審和盲審的審核結果不一致,這個任務不會進入第三輪D、盲審里的初審是第一輪標注的人員答案:C40.關于項目交付期,以下哪項是正確的A、如果需要二次標注,需要問詢二次標注想要達到的效果,有利于清晰大家的標注思路B、已標注過的數(shù)據(jù)即過去式,無需再次總結以免擾亂后期思路C、積累細分領域通用數(shù)據(jù)易造成工作效率的降低D、內(nèi)部質(zhì)檢合規(guī)后,就完全不需要外部甲方質(zhì)檢了答案:A41."一班的張林同學學習很不錯二班的王強強同學今年第一三班的王蒙同學被警告處理四班的邵杰同學退學了"針對以上數(shù)據(jù)如何提取班級信息A、RIGHTB、LEFTC、FINDD、TRIM答案:B42.申訴通過率過高,意味著()A、標注人員的準確率較低B、質(zhì)檢人員的置信度不足C、項目難度較高D、項目周期越短答案:B43.為了保障智能平臺安全運行可以安裝以下哪種軟件?A、MicrosoftExcelB、MicrosoftOutlookC、360安全衛(wèi)士D、Chrome瀏覽器答案:C44.以下不屬于文本采集項目工具的是()A、ExcelB、WordC、PowerpointD、Txt答案:C45.智能平臺質(zhì)檢結束怎么計算正確率()A、質(zhì)檢過程中記錄所有錯題,手動計算B、從任務搜索界面查詢導出數(shù)據(jù)統(tǒng)計C、線下匯總標注員的個人計算結果D、以上都不對答案:B46.智能健康手環(huán)的健康數(shù)據(jù)報告體現(xiàn)了哪一類數(shù)據(jù)采集技術()A、統(tǒng)計報表B、網(wǎng)絡爬蟲C、API接口D、傳感器答案:A47.()是對客觀事物記錄下來的、可以鑒別的符號A、數(shù)字B、數(shù)據(jù)C、字符D、圖形答案:B48.以下質(zhì)檢工作流程正確的是()A、質(zhì)檢點確認-質(zhì)檢人員培訓-輸出批次數(shù)據(jù)質(zhì)量報告-項目質(zhì)量總結報告B、質(zhì)檢人員培訓-標注人員培訓-項目質(zhì)量總結報告-輸出批次數(shù)據(jù)質(zhì)量報告C、輸出批次數(shù)據(jù)質(zhì)量報告-質(zhì)檢人員培訓-項目質(zhì)量總結報告-質(zhì)檢點確認D、以上說法均不正確答案:A49.智能系統(tǒng)需要進行維護記錄的理由不包括()A、便于跟蹤系統(tǒng)的維護歷史和問題解決情況B、便于管理和協(xié)調(diào)維護工作C、提升標注準確率D、便于評估維護工作的效果和成本答案:C50.項目質(zhì)量不達標時,在答疑方面,可能會表現(xiàn)為哪種現(xiàn)象A、答疑量級較高B、沒有填寫提問的問題類型C、質(zhì)檢人員人力不足D、沒有填寫答疑人的姓名答案:A51.在數(shù)據(jù)標注項目中,以下屬于語音類數(shù)據(jù)格式的是()A、MP3B、AVIC、rarD、RMVB答案:A52.傳統(tǒng)搜索思維的誤區(qū)包括()A、query的來源是使用產(chǎn)品的用戶而不是需求方B、用戶思維,就是"以用戶為中心",換位思考C、競品平臺是輔助判斷需求,雖占較重要位置,但不能百分百完全依賴于競品平臺D、用戶思維是為了針對用戶的各種個性化、細分化需求,提供各種針對性的產(chǎn)品和服務答案:A53.以下哪個選項不屬于計算機安全軟件()A、第三方殺毒軟件B、官方系統(tǒng)內(nèi)置防火墻C、企業(yè)定制殺毒軟件D、多媒體軟件答案:D54.數(shù)據(jù)分析過程中存在一個比較基礎且重要的環(huán)節(jié),它決定了元數(shù)據(jù)是否優(yōu)質(zhì),這個環(huán)節(jié)是()A、數(shù)據(jù)整理B、數(shù)據(jù)采集C、預估數(shù)據(jù)量D、確定數(shù)據(jù)量級及場景答案:B55.以下哪些屬于智能系統(tǒng)平臺使用過程中可能出現(xiàn)的問題()A、系統(tǒng)卡頓B、操作人員失誤誤觸選項C、數(shù)據(jù)量過大致使數(shù)據(jù)質(zhì)量降低D、人效不達標答案:A56.可以在AIDP的哪個板塊查看個人的押后題目()A、我的任務B、任務統(tǒng)計C、團隊管理D、以上都是答案:A57.以下內(nèi)容能確保智能平臺安全運行的是()A、安裝第三方官方殺毒軟件B、打開設備防火墻C、瀏覽正規(guī)網(wǎng)站獲取數(shù)據(jù)信息D、以上都是答案:D58.以下哪種質(zhì)檢模式容易發(fā)生作弊()A、盲審B、全檢C、30%抽檢D、70%抽檢答案:A59.以下不屬于模型訓練流程中關鍵節(jié)點的選項是()A、標注數(shù)據(jù)獲取B、模型訓練C、標注流程優(yōu)化D、數(shù)據(jù)送標答案:C60.智能平臺作為標注工具使用時,應具備()A、數(shù)據(jù)查詢功能B、數(shù)據(jù)導出功能C、數(shù)據(jù)質(zhì)檢功能D、以上都是答案:D61.下列項目與質(zhì)檢模式匹配較合理的是()A、項目預算緊張——全檢B、項目較簡單,預算有限——抽檢20%C、項目沒有標準答案,需要了解大眾偏好——抽檢50%D、項目標簽維度很多,準確率要求90%——雙審答案:B62.在AIDP平臺中,播放當前音頻的快捷鍵是()A、1B、2C、shiftD、空格答案:A63.以下哪一項不是常見的質(zhì)量報告的輸出形式()A、在線表格B、在線文檔C、PPTD、小視頻答案:D64.為驗證模型訓練的效果,可以關注哪個指標()A、質(zhì)檢量B、召回率C、標注量D、存疑數(shù)據(jù)答案:B65.在項目進行中,質(zhì)檢員不需要做以下哪項()A、計算準確率B、不同質(zhì)檢員的答疑要保持一致C、給標注人員私下傳授項目技巧D、定期總結主觀性題目,進行分類總結答案:C66.以下內(nèi)容不屬于AIDP數(shù)據(jù)導出的基本操作流程的是()A、在“個人信息”界面查詢隊列B、單擊“任務結果”,篩選數(shù)據(jù),單擊“導出結果”C、訪問平臺鏈接D、在管理-;>;任務管理”頁面,單擊“查看”,進入任務詳情頁面答案:A67.在飛書表格中,A1,B1,C1,D1的內(nèi)容分別為1,2,3,4函數(shù)COUNT(A1,D1)的結果是A、10B、2C、5D、4答案:B68.在數(shù)據(jù)清洗中,以下哪項不屬于噪聲數(shù)據(jù)的常見處理方法()A、分箱B、回歸C、均值插補D、離群點分析答案:C69.關于數(shù)據(jù)標注流程,以下正確的是()A、數(shù)據(jù)預處理-數(shù)據(jù)標注-數(shù)據(jù)質(zhì)檢-數(shù)據(jù)回掃-數(shù)據(jù)交付B、數(shù)據(jù)預處理-數(shù)據(jù)標注-數(shù)據(jù)回掃-數(shù)據(jù)質(zhì)檢-數(shù)據(jù)交付C、數(shù)據(jù)標注-數(shù)據(jù)預處理-數(shù)據(jù)質(zhì)檢-數(shù)據(jù)回掃-數(shù)據(jù)交付D、數(shù)據(jù)標注-數(shù)據(jù)質(zhì)檢-數(shù)據(jù)回掃-數(shù)據(jù)預處理-數(shù)據(jù)交付答案:A70.關于標注質(zhì)量評估,以下哪項是正確的()A、質(zhì)量評估的唯一判斷標準是準確率B、質(zhì)量評估并不單一只看準確率C、質(zhì)量評估的判斷標準因人而異D、質(zhì)量評估的判斷標準根據(jù)組員的不同而不同答案:B71.優(yōu)化智能平臺需要提供()A、問題背景B、現(xiàn)階段卡點C、優(yōu)化方案實現(xiàn)路徑D、以上三種均是答案:D72.智能系統(tǒng)平臺使用的規(guī)范檢查主要指()A、使用平臺操作時是否合規(guī)B、平臺用戶數(shù)量C、平臺使用功能的易用性D、平臺數(shù)據(jù)質(zhì)量答案:A73.更新用戶界面可以有效提升平臺的()A、易用性B、性能C、安全性D、可靠性答案:A74.數(shù)據(jù)標注完成后,一般以下哪種渠道不能了解驗收結果()A、其他標注員B、質(zhì)檢人員反饋C、項目數(shù)據(jù)看板D、項目數(shù)據(jù)周報答案:A75.常用的計數(shù)函數(shù)是下列哪個A、SUMIFB、COUNTIFC、VLOOKUPD、UNIQUE答案:B76.以下不屬于智能平臺更新優(yōu)化動作的是()A、數(shù)據(jù)監(jiān)控B、新增功能C、性能優(yōu)化D、漏洞修復答案:A77.質(zhì)檢完數(shù)據(jù),在后臺下載到diff,以下哪項說法錯誤()A、diff數(shù)據(jù)可以放上“標注人員”字段,讓大家方便查找各自的錯誤B、diff數(shù)據(jù)分析起來很費時間,直接發(fā)送給標注人員就可C、應梳理出主要的錯誤原因,同步到標注人員D、應對主要錯誤進行復盤,防止再犯答案:B78.以下對于規(guī)則的說法錯誤的有A、規(guī)則不會影響質(zhì)檢對標注結果的判斷B、規(guī)則會出現(xiàn)多次修改的情況C、標注人員可以參與對規(guī)則的優(yōu)化D、規(guī)則理解可以提高標注的準確率答案:A79.以下哪個選項不能滿足搜索用戶的需求()A、將需求方所提供的廣告多推送B、用戶所查詢的query意圖C、搜索返回結果的精準度D、所推薦內(nèi)容為優(yōu)質(zhì)內(nèi)容答案:A80.對于智能平臺中的重要數(shù)據(jù),以下哪項可以避免數(shù)據(jù)丟失或損壞()A、數(shù)據(jù)監(jiān)控B、用戶培訓C、調(diào)試系統(tǒng)D、數(shù)據(jù)備份答案:D81.模糊的數(shù)據(jù)標注項目規(guī)則可能是指以下哪個方面()A、規(guī)則的敘述結構B、規(guī)則的概念詞理解C、規(guī)則的撰寫人D、規(guī)則未覆蓋的內(nèi)容答案:B82.以下對語義類異常數(shù)據(jù)的描述有誤的是()A、無效的元組是指某些元組沒有對應客觀世界的有效實體B、數(shù)據(jù)中存在重復值是指兩個或者兩個以上的元組表示同一實體C、違反完整性約束規(guī)則不屬于語義類異常D、數(shù)據(jù)中出現(xiàn)矛盾是指元組的取值違反這些取值的依賴關系答案:C83.以下哪項不屬于各類數(shù)據(jù)采集作業(yè)中的常見的問題()A、音頻采集數(shù)據(jù)噪音過大B、視頻采集數(shù)據(jù)噪點過大C、圖片采集數(shù)據(jù)重復較多D、文本采集數(shù)據(jù)字段齊全答案:D84.標注數(shù)據(jù)質(zhì)檢結果的置信度越高,直接意味著()A、標注人員的人效越高B、項目的質(zhì)量真實度越高C、項目的交付周期越短D、項目規(guī)則的培訓效果越好答案:B85.下列有關智能平臺質(zhì)檢的操作流程說法錯誤的是()A、判定質(zhì)檢結果合格時,可直接按空格B、進行質(zhì)檢前的平臺頁面操作是“任務管理-我的任務-質(zhì)檢”C、需要先點擊平臺鏈接進入D、判定質(zhì)檢結果不合格時可直接按空格答案:D86.以下哪些類型項目可以在智能平臺進行標注?A、音頻類型數(shù)據(jù)B、視頻/圖片類型數(shù)據(jù)C、文本類型數(shù)據(jù)D、以上三種均可答案:D87.標注完成后以下能了解項目數(shù)據(jù)質(zhì)量的渠道是()A、質(zhì)檢人員反饋B、項目數(shù)據(jù)看板C、項目周報D、以上都是答案:D88.以下不符合智能平臺優(yōu)化需求提需規(guī)范的是()A、清晰地描述問題的具體情況B、要求平臺在第二天完成優(yōu)化動作C、明確提出優(yōu)化的目標和期望效果D、提出具體的方案建議答案:B89.質(zhì)檢人員的質(zhì)檢尺度不會影響哪些內(nèi)容()A、標注人員的準確率B、規(guī)則撰寫的方向C、質(zhì)檢人員的置信度D、項目的準入速度答案:B90.數(shù)據(jù)采集需求中必須包含的內(nèi)容是()A、數(shù)據(jù)量級B、數(shù)據(jù)指標要求C、數(shù)據(jù)完成周期D、以上都是答案:D91.數(shù)據(jù)采集完成后,不能采取以下哪種方式將采集數(shù)據(jù)規(guī)范化()A、采集數(shù)據(jù)命名規(guī)范統(tǒng)一B、數(shù)據(jù)采集日期統(tǒng)一C、采集數(shù)據(jù)格式統(tǒng)一D、采集規(guī)格統(tǒng)一答案:B92.智能標注平臺不可以適配以下哪個項目()A、人臉表情采集B、2D車道線標注C、3D點云標注D、4D車道線標注答案:A93.以下關于智能平臺系統(tǒng)的使用順序正確的是()A、安裝-維護-調(diào)試B、安裝-調(diào)試-維護C、維護-調(diào)試-安裝D、維護-安裝-調(diào)試答案:B94.數(shù)據(jù)標注工程也叫工程化數(shù)據(jù)標注,可以劃分為五大流程,以下哪個流程是數(shù)據(jù)標注前需要做的()A、數(shù)據(jù)驗收B、數(shù)據(jù)回掃C、數(shù)據(jù)采集與清洗D、數(shù)據(jù)質(zhì)檢答案:C95.在文本標注項目中,query(搜索詞)為“平果抖音”;甲同學:我認為這個就是商品意圖,用戶想搜索水果蘋果或者手機蘋果;乙同學:不,我知道有個地方叫平果,所以他不是在找蘋果,而是在找平果市這個地點;丙同學:我認為都有可能;關于文本意圖的判斷,哪個人的理解最正確()A、甲對B、乙對C、丙對D、都不全面答案:D96.關于準確率計算公式,以下錯誤的是()A、全檢準確率=合格數(shù)/總數(shù)×100%B、抽檢準確率=準確率=合格數(shù)/(合格數(shù)+不合格數(shù))×100%C、盲審準確率=(盲審數(shù)-誤判數(shù))/盲審數(shù)×100%D、雙審準確率=(盲審數(shù)+誤判數(shù))/盲審數(shù)×100%答案:D97.“召回率”指模型對目標內(nèi)容召回的比例。測試集中的正例集用來測召回率,如-準備100條色情正例,在色情模型測試,如果模型命中了20條,則召回率為()A、80%B、20%C、50%D、0%答案:B98.以下關于采集項目的規(guī)則培訓,說法錯誤的是()A、培訓前收集好項目的問題B、由質(zhì)檢側發(fā)起培訓,對規(guī)則進行講解C、培訓過程中的疑問不用提出,自我消化即可D、培訓結束后核驗疑問是否解答完畢答案:C99.以下哪條是對于模型訓練中“數(shù)據(jù)集”的描述()A、指模型學習的樣本,包含正例集與負例集,正例集用來訓練模型“什么是”,負例集用來訓練模型“什么不是”B、指模型訓練完畢后,測試訓練效果的樣本,包含正例集與隨機集。正例集用來測召回率,隨機集用來測進審率及準確率C、相當于授課,需要灌輸給模型需要學習的信息(數(shù)據(jù)集),并通過調(diào)整參數(shù)、學習率等方式,嘗試通過適合的方式,使其學習的效果更好D、主要用來衡量模型召回內(nèi)容的準確性,如-準備100條隨便內(nèi)容,在色情模型測試,模型命中10條,其中2條是色情,其余8條不是色情,則模型準確率為20%答案:B100.項目中期驗收準確率不合格,質(zhì)檢同學想進行一次內(nèi)部復盤,不用準備哪項資料()A、錯誤標注結果匯總B、員工打卡記錄C、疑難case收集表D、申訴、答疑表格答案:B三、判斷題1.項目培訓時可以換位思考的方式進行A、正確B、錯誤答案:A2.在數(shù)據(jù)采集的需求確定階段,不需要明確項目質(zhì)量要求和進行項目難度判定A、正確B、錯誤答案:B3.只要通過標準培訓,就可以通過試標準入。A、正確B、錯誤答案:B4.申訴量過大時,可以不申訴,等項目交付之后再處理()A、正確B、錯誤答案:B5.“任務統(tǒng)計界面”可以在智能平臺中進入質(zhì)檢端查看A、正確B、錯誤答案:A6.質(zhì)檢語音項目時,不需要修改原語音數(shù)據(jù),只需修改轉寫結果。A、正確B、錯誤答案:A7.只能通過多優(yōu)化模型算法來優(yōu)化模型運行效果。A、正確B、錯誤答案:B8.在電商行業(yè)中,無論是產(chǎn)品、渠道、價格還是顧客,每項工作都與數(shù)據(jù)采集有很大的關系。A、正確B、錯誤答案:A9.智能平臺優(yōu)化提需關鍵字只有“痛點描述”和“影響”。A、正確B、錯誤答案:B10.質(zhì)量要求95%的項目,實際質(zhì)檢結果達成95%,驗收質(zhì)檢數(shù)據(jù)結果為92%,說明項目此時能交付A、正確B、錯誤答案:B11.A項目質(zhì)量要求90%,抽檢比例10%,某標注人員標注120條,質(zhì)檢錯誤6條,該人員質(zhì)量可達標。A、正確B、錯誤答案:B12.當問題反饋并解決后,標注員不需要對問題進行驗證A、正確B、錯誤答案:B13.答疑不及時可能會造成標注數(shù)據(jù)的押后。A、正確B、錯誤答案:B14.AIDP不能對7天前的歷史數(shù)據(jù)進行導出。A、正確B、錯誤答案:B15.小D作為一名質(zhì)檢員,發(fā)現(xiàn)某個標注員的準確率一直不達標,于是他進行了原因分析,并制定了相應的改善對策和階段性目標。A、正確B、錯誤答案:A16.返修時如果修改了合格標注框和未質(zhì)檢標注框,標注框顏色不變。A、正確B、錯誤答案:A17.某ASR轉寫類項目,計算產(chǎn)出是按照題目時長。如果語音材料存在大量空白,小A同學在操作時不截出,故意用空白時長填充有效時長,他的做法A、正確B、錯誤答案:B18.人效是衡量采集進度的重要指標之一()A、正確B、錯誤答案:A19.數(shù)據(jù)標注項目內(nèi)盲審一致率高,代表項目的真實質(zhì)量一定好。A、正確B、錯誤答案:B20.當有驗收數(shù)據(jù)打回時,質(zhì)檢人員不需要及時查看并修改數(shù)據(jù)。A、正確B、錯誤答案:B21.數(shù)據(jù)采集培訓環(huán)節(jié)需要進行數(shù)據(jù)合規(guī)性與安全性培訓,避免產(chǎn)生安全合規(guī)事故A、正確B、錯誤答案:A22.數(shù)據(jù)的異??梢苑譃檎Z法類異常、語義類異常、覆蓋類異常。A、正確B、錯誤答案:A23.培訓過程中不會存在溝通障礙A、正確B、錯誤答案:B24.在盲審中,針對盲審不一致數(shù)據(jù),需要有質(zhì)檢同學進行再確認,以判定不一致數(shù)據(jù)的正確選項。A、正確B、錯誤答案:A25.全檢模式下,個人準確率=1-(個人錯誤數(shù)/個人任務總量)*100%。A、正確B、錯誤答案:A26.質(zhì)檢是數(shù)據(jù)采集規(guī)則培訓中的關鍵環(huán)節(jié)()A、正確B、錯誤答案:B27.標注員可以學習一些算法和編程的相關知識,使用praat軟件遇到操作問題時,可以積極運用相關知識進行解決。A、正確B、錯誤答案:A28.小A在下班后復習規(guī)則,并整理回顧錯題,她的做法()A、正確B、錯誤答案:A29.安全的網(wǎng)絡環(huán)境是能夠確保智能平臺安全運行的必要條件。A、正確B、錯誤答案:A30.在AIDP抽檢模式下,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論