版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)處理技術(shù)基礎(chǔ)第一章數(shù)據(jù)標(biāo)注實(shí)訓(xùn)【ch01】數(shù)據(jù)處理技術(shù)基礎(chǔ)【ch02】項(xiàng)目管理進(jìn)階【ch03】問句復(fù)述標(biāo)注【ch04】3D點(diǎn)云標(biāo)注【ch05】語音合成——拼音停頓標(biāo)注【ch06】數(shù)據(jù)處理實(shí)戰(zhàn)全套可編輯PPT課件
本課件是可編輯的正常PPT課件01數(shù)據(jù)清洗PARTONE本課件是可編輯的正常PPT課件01不完整數(shù)據(jù)數(shù)據(jù)在采集或標(biāo)注的過程中均會(huì)出現(xiàn)不同情況的數(shù)據(jù)缺失,這就是不完整數(shù)據(jù),其常見的處理方法包括以下兩種。(1)填補(bǔ)數(shù)據(jù):總體數(shù)據(jù)量不大,但缺失的數(shù)據(jù)很重要,需要重新填補(bǔ)數(shù)據(jù)。(2)刪除數(shù)據(jù):當(dāng)遇到數(shù)據(jù)規(guī)模很大,數(shù)據(jù)缺失部分占比很小,或者缺失的數(shù)據(jù)無法填補(bǔ)等情況時(shí),需要根據(jù)實(shí)際情況對(duì)缺失的數(shù)據(jù)進(jìn)行整體刪除。需要注意的是,針對(duì)數(shù)據(jù)不完整問題,優(yōu)先考慮的是填補(bǔ)數(shù)據(jù),減少對(duì)采集數(shù)據(jù)量的影響。數(shù)據(jù)清洗的常見操作02噪聲數(shù)據(jù)噪聲數(shù)據(jù)常見于各種數(shù)據(jù)中,其對(duì)模型的影響要根據(jù)實(shí)際情況進(jìn)行分析。在數(shù)據(jù)標(biāo)注領(lǐng)域中,噪聲數(shù)據(jù)主要集中在異常值的處理中。異常值是指超過明確取值范圍的值。我們可以通過簡(jiǎn)單的規(guī)則來檢查噪聲數(shù)據(jù),或者使用不同屬性間的約束、外部數(shù)據(jù)來檢查和清洗噪聲數(shù)據(jù)。本課件是可編輯的正常PPT課件01重復(fù)的數(shù)據(jù)在進(jìn)行數(shù)據(jù)標(biāo)注前,數(shù)據(jù)重復(fù)會(huì)產(chǎn)生重復(fù)的標(biāo)注動(dòng)作,造成標(biāo)注資源的浪費(fèi)。數(shù)據(jù)去重操作一般在其他數(shù)據(jù)清洗操作之后,原因在于清洗其他數(shù)據(jù)仍然會(huì)造成小概率出現(xiàn)重復(fù)數(shù)據(jù)的可能性。03格式不合規(guī)的數(shù)據(jù)項(xiàng)目需求格式與原始數(shù)據(jù)不一致,當(dāng)出現(xiàn)偏差較大時(shí)也需要清洗數(shù)據(jù)。02錯(cuò)誤數(shù)據(jù)一些數(shù)據(jù)自身存在客觀性錯(cuò)誤,如錯(cuò)別字、多余字符、知識(shí)性錯(cuò)誤等。一般處理方式為更改其錯(cuò)誤或刪除該條數(shù)據(jù)。數(shù)據(jù)清洗的常見操作本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解非結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)一般指不完整、不規(guī)則、沒有結(jié)構(gòu)層級(jí)的數(shù)據(jù)。采集到的原始數(shù)據(jù)大多數(shù)為非結(jié)構(gòu)化數(shù)據(jù)。與結(jié)構(gòu)化數(shù)據(jù)相比,非結(jié)構(gòu)化數(shù)據(jù)的來源非常廣泛,生產(chǎn)速度更快,因此其清洗更為困難。在數(shù)據(jù)標(biāo)注領(lǐng)域中,非結(jié)構(gòu)化數(shù)據(jù)常見于數(shù)據(jù)標(biāo)注之前。通過對(duì)非結(jié)構(gòu)化數(shù)據(jù)的標(biāo)注,生產(chǎn)出包含原始數(shù)據(jù)信息及標(biāo)注信息的結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù),以便在后續(xù)的數(shù)據(jù)分析及模型訓(xùn)練時(shí)使用。常見的非結(jié)構(gòu)化數(shù)據(jù)包括文本、圖片、音頻、視頻、網(wǎng)頁及各種傳感器數(shù)據(jù)等。本課件是可編輯的正常PPT課件1)文本數(shù)據(jù)清洗任何數(shù)據(jù)的清洗都要根據(jù)項(xiàng)目需求進(jìn)行具體分析。如果是針對(duì)中文文本的自然語言處理項(xiàng)目,則要根據(jù)項(xiàng)目需求與數(shù)據(jù)量級(jí),處理文本中出現(xiàn)的不相關(guān)英文字符、特殊符號(hào)及無意義的數(shù)值。圖1-2所示為未經(jīng)清洗的文本數(shù)據(jù)。數(shù)據(jù)清洗操作詳解本課件是可編輯的正常PPT課件在進(jìn)行數(shù)據(jù)標(biāo)注前,需要清洗與需求數(shù)據(jù)不相關(guān)的文本數(shù)據(jù),可以讓數(shù)據(jù)更整潔,使標(biāo)注任務(wù)更明確。這里使用的工具是文本編輯器,還可以自行選擇軟件工具,這里不做更多介紹。那么如何對(duì)該文本數(shù)據(jù)進(jìn)行清洗,這里介紹一種強(qiáng)大的文本處理方法——正則表達(dá)式。正則表達(dá)式是由普通字符和特殊字符(特殊字符也被稱為“元字符”)組成的。例如,a到z之間的字母、0到9之間的數(shù)字或任意漢字都被稱為“普通字符”。元字符具有特殊含義,用來表示一些特定的匹配規(guī)則。常見的元字符如表1-1所示。數(shù)據(jù)清洗操作詳解本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解本課件是可編輯的正常PPT課件表1-1中列舉了一些常見的元字符。要特別注意的是,“[abc]”主要強(qiáng)調(diào)的是“[]”,其中可以自行輸入想要匹配的字符,但是僅匹配其中的一個(gè)字符。例如,“[abc]”表示匹配a、b、c中的任意一個(gè)字母;“[a-z]”表示匹配任意小寫字母,“[A-Z]”表示匹配任意大寫字母,“[0-9]”表示匹配任意數(shù)字;“[^abc]”表示匹配除a、b、c外的任意字符?!癧\u4e00-\u9fa5]”表示中文全部范圍的Unicode編碼用來匹配任意漢字。除了表中的元字符,還有一些其他元字符,如換頁符、制表符等。普通字符與元字符能夠匹配任意的單一字符,但當(dāng)某個(gè)字符重復(fù)出現(xiàn)多次或特定次數(shù)時(shí),可以通過組合限定符進(jìn)行匹配。數(shù)據(jù)清洗操作詳解本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解此外,還有分組、選擇及轉(zhuǎn)義。(1)分組是指用圓括號(hào)“()”把一個(gè)子模式括起來,表示這個(gè)子模式作為一個(gè)整體進(jìn)行匹配。(2)選擇是指用豎線“|”把兩個(gè)子模式分開,表示匹配這兩個(gè)子模式中的任意一個(gè)。(3)轉(zhuǎn)義是指在一個(gè)特殊含義的字符前面加上反斜杠“\”,表示取消這個(gè)字符原本的含義,按照字面值進(jìn)行匹配。下面用實(shí)例說明。利用正則表達(dá)式匹配書名,首先打開“查找與替換”對(duì)話框,選中“正則表達(dá)式”單選按鈕。這里通過字符《.*?》匹配了文本中的5個(gè)書名。其中,“.”為正則表達(dá)式的普通字符,表示匹配除換行符外的任何字符;“*”為正則表達(dá)式中的限定符,表示匹配零次或多次前面的子表達(dá)式;“?”也是正則表達(dá)式中的限定符,表示匹配零次或一次前面的子表達(dá)式,這樣就匹配了書名號(hào)中的任意字符,如圖1-3所示。本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解如果去掉“?”限定符,則會(huì)匹配更多長(zhǎng)度的字符,造成匹配不當(dāng),如圖1-4所示。同樣可以通過“查找與替換”對(duì)話框?qū)ξ谋具M(jìn)行清洗,如圖1-5所示,先通過“\r\n”匹配回車符和換行符,大部分工具都可以顯示回車符和換行符。本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解如圖1-6所示,通過“[0-9]{5};”匹配文本中固定模式的字符,將其全部替換為空值。本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解如圖1-7所示,特殊字符集網(wǎng)址等其他特殊字符均可通過匹配替換的方式清除,但是這里要注意的是數(shù)據(jù)清洗的成本。數(shù)據(jù)清洗不僅要考慮數(shù)據(jù)質(zhì)量,也要考慮數(shù)據(jù)清洗的成本,對(duì)于圖1-6這種出現(xiàn)極少的情況可以選擇不清洗,在數(shù)據(jù)標(biāo)注過程中手動(dòng)刪除即可。數(shù)據(jù)清洗的方法靈活多樣,正則表達(dá)式的使用方法同樣靈活,這里無法詳細(xì)介紹正則表達(dá)式的全部?jī)?nèi)容,僅展示正則表達(dá)式的強(qiáng)大效果。正則表達(dá)式支持諸多工具,用戶可以進(jìn)行有效實(shí)踐,具體內(nèi)容還需要通過閱讀相關(guān)資料繼續(xù)深入了解。本課件是可編輯的正常PPT課件2)圖片、音頻、視頻等數(shù)據(jù)清洗針對(duì)圖片、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù),常見的數(shù)據(jù)清洗操作為去重或去除固定條件下的內(nèi)容。重復(fù)數(shù)據(jù)會(huì)給標(biāo)注任務(wù)帶來負(fù)擔(dān),固定條件外的數(shù)據(jù)(如大小不足要求的數(shù)據(jù))同樣會(huì)造成標(biāo)注資源的浪費(fèi)。圖片、音頻、視頻等數(shù)據(jù)在計(jì)算機(jī)中是二進(jìn)制編碼,可以通過腳本語言進(jìn)行清洗操作。針對(duì)常見的數(shù)據(jù)去重等清洗操作,可以使用去重工具進(jìn)行。這里使用的去重工具為DuplicateCleanerPro,如圖1-8所示。數(shù)據(jù)清洗操作詳解本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解通過設(shè)置搜索規(guī)則完成對(duì)重復(fù)圖片的搜索,如圖1-9、圖1-10所示,選擇要處理的文件,如圖1-11所示,最終完成對(duì)數(shù)據(jù)的清洗。類似的數(shù)據(jù)清洗工具還有很多,用戶可以根據(jù)實(shí)際情況選擇使用。本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解2.結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)也被稱為“行數(shù)據(jù)”,即以二維表結(jié)構(gòu)來邏輯表達(dá)和實(shí)現(xiàn)的數(shù)據(jù)。與非結(jié)構(gòu)化數(shù)據(jù)相比,結(jié)構(gòu)化數(shù)據(jù)更易于查看與搜索,但是也有更嚴(yán)格的數(shù)據(jù)格式要求。因此,對(duì)二維表的數(shù)據(jù)清洗更為復(fù)雜,如圖1-13(a)所示,這里使用Excel進(jìn)行數(shù)據(jù)清洗,Excel適用于小規(guī)模數(shù)據(jù)、數(shù)據(jù)屬性較多的情況;還可以使用腳本語言等進(jìn)行更為精細(xì)的處理,最終達(dá)到如圖1-13(b)所示的效果,具體操作方法不再詳述。本課件是可編輯的正常PPT課件02數(shù)據(jù)安全PARTTWO本課件是可編輯的正常PPT課件數(shù)據(jù)安全的概念數(shù)據(jù)安全是指通過采取必要措施,確保數(shù)據(jù)處于有效保護(hù)和合法利用的狀態(tài),以及具備保障持續(xù)安全狀態(tài)的能力。目前,隨著信息技術(shù)的飛速發(fā)展,對(duì)數(shù)據(jù)的要求及數(shù)據(jù)的價(jià)值都在逐漸增加。因此,保障信息資產(chǎn)將會(huì)變得愈發(fā)重要。一個(gè)完善的數(shù)據(jù)安全體系本身就具有寶貴的價(jià)值,不但可以降低數(shù)據(jù)安全風(fēng)險(xiǎn),還可以提升產(chǎn)品的競(jìng)爭(zhēng)優(yōu)勢(shì)。數(shù)據(jù)具有多樣性,不同數(shù)據(jù)的保密要求及實(shí)施辦法也不盡相同。從數(shù)據(jù)安全角度考慮,這里將數(shù)據(jù)分為以下幾類。(1)個(gè)人及企業(yè)數(shù)據(jù):如個(gè)人隱私、肖像及企業(yè)財(cái)務(wù)敏感數(shù)據(jù)等。(2)業(yè)務(wù)數(shù)據(jù):?jiǎn)挝粡氖赂黜?xiàng)業(yè)務(wù)產(chǎn)生的有價(jià)值的數(shù)據(jù)。(3)重要數(shù)據(jù):涉及公共生命安全、國(guó)家安全的機(jī)密數(shù)據(jù)。這里僅按照數(shù)據(jù)安全受限的等級(jí)進(jìn)行一個(gè)簡(jiǎn)要分類,其保密等級(jí)要根據(jù)業(yè)務(wù)需求進(jìn)行具體劃分。數(shù)據(jù)安全流程包括安全策略的規(guī)劃、構(gòu)建與執(zhí)行,為訪問數(shù)據(jù)提供身份驗(yàn)證、授權(quán)等操作,以及對(duì)過程的監(jiān)管與治理等。目前尚且無法對(duì)所有的隱私和保密要求提出一套通用的數(shù)據(jù)安全實(shí)施辦法。本課件是可編輯的正常PPT課件010302業(yè)務(wù)需求數(shù)據(jù)標(biāo)注領(lǐng)域中涉及的數(shù)據(jù)眾多,其中不乏一些隱私或機(jī)密數(shù)據(jù)。針對(duì)不同的標(biāo)注項(xiàng)目,要全面分析對(duì)數(shù)據(jù)安全的業(yè)務(wù)需求。通過對(duì)業(yè)務(wù)需求的分析及工作流程,針對(duì)可能出現(xiàn)的安全風(fēng)險(xiǎn)環(huán)節(jié)提出安全保證措施。監(jiān)管需求在考慮業(yè)務(wù)需求的同時(shí),還要實(shí)時(shí)關(guān)注政府的監(jiān)管需求。明確政府制定的法律法規(guī),完善業(yè)務(wù)需求之外的安全控制。監(jiān)管需求適用于任何數(shù)據(jù),可以在業(yè)務(wù)需求之前完善。評(píng)估當(dāng)前風(fēng)險(xiǎn)在明確各個(gè)項(xiàng)目安全需求的同時(shí),還要評(píng)估當(dāng)前風(fēng)險(xiǎn),不同的安全需求可能需要不同的保護(hù)措施。也就是要評(píng)估現(xiàn)有的安全保護(hù)措施能否支持當(dāng)前項(xiàng)目的安全需求,并以此進(jìn)行改進(jìn),降低安全風(fēng)險(xiǎn)。數(shù)據(jù)安全措施的制定流程1.分析數(shù)據(jù)安全需求本課件是可編輯的正常PPT課件010302制定數(shù)據(jù)安全制度在制定數(shù)據(jù)安全制度時(shí)要基于業(yè)務(wù)規(guī)范和法律法規(guī)要求,如因未遵守公司制度導(dǎo)致數(shù)據(jù)泄露可能要承擔(dān)相應(yīng)的法律責(zé)任。常見的數(shù)據(jù)安全制度包括簽訂保密協(xié)議、數(shù)據(jù)存儲(chǔ)介質(zhì)的管理等。細(xì)化數(shù)據(jù)保密等級(jí)根據(jù)業(yè)務(wù)需求和監(jiān)管需求對(duì)保密等級(jí)提出分級(jí)方案,一般可以細(xì)化為從外部公開到絕密的一系列保密等級(jí)。數(shù)據(jù)標(biāo)注領(lǐng)域中的數(shù)據(jù)來源廣泛,提出一個(gè)簡(jiǎn)單明確的分級(jí)方案尤為重要。需要注意的是,數(shù)據(jù)聚合會(huì)導(dǎo)致數(shù)據(jù)敏感性的變化,因此要明確數(shù)據(jù)聚合帶來的保密等級(jí)影響。定義角色權(quán)限數(shù)據(jù)訪問權(quán)限要根據(jù)角色進(jìn)行定義,如用戶、管理員或數(shù)據(jù)專員等。數(shù)據(jù)標(biāo)注領(lǐng)域涉及的角色會(huì)比其他領(lǐng)域涉及的角色更多,因此要根據(jù)不同角色進(jìn)行細(xì)化的權(quán)限分配。此外,還要額外考慮信任環(huán)境,因?yàn)樾湃苇h(huán)境會(huì)發(fā)生變化數(shù)據(jù)安全措施的制定流程2.制定數(shù)據(jù)安全標(biāo)準(zhǔn)本課件是可編輯的正常PPT課件0102密級(jí)的分配與管理根據(jù)保密等級(jí)分級(jí)方案,對(duì)角色進(jìn)行密級(jí)分配。要考慮角色權(quán)限變更或角色終止訪問權(quán)限、監(jiān)控權(quán)限級(jí)別等方面;還要根據(jù)密級(jí)等級(jí)對(duì)數(shù)據(jù)進(jìn)行分類,針對(duì)安全漏洞的檢測(cè)及如何處理檢測(cè)到的數(shù)據(jù)泄露做好管控。數(shù)據(jù)安全制度的實(shí)施在制定完數(shù)據(jù)安全制度后,要根據(jù)數(shù)據(jù)安全制度,追蹤整個(gè)數(shù)據(jù)安全流程,衡量其中管理法規(guī)是否符合規(guī)定,當(dāng)發(fā)現(xiàn)潛在不符合規(guī)定的問題時(shí)要及時(shí)上報(bào)并妥善修正。在發(fā)布新的管理法規(guī)或現(xiàn)有管理法規(guī)變更后,要對(duì)數(shù)據(jù)安全流程進(jìn)行重新評(píng)估。數(shù)據(jù)安全措施的制定流程3.實(shí)施數(shù)據(jù)安全管控本課件是可編輯的正常PPT課件1.系統(tǒng)手段在數(shù)據(jù)標(biāo)注領(lǐng)域中,標(biāo)注系統(tǒng)是在線管理角色的主要方式,包括對(duì)角色進(jìn)行有效的密級(jí)分配、訪問控制及監(jiān)控異常日志等。系統(tǒng)管理一般由專業(yè)人員進(jìn)行構(gòu)建及監(jiān)控,需要確保系統(tǒng)不會(huì)出現(xiàn)安全漏洞,包括及時(shí)檢測(cè)并修復(fù)出現(xiàn)的安全漏洞,通常采用的手段為構(gòu)建防火墻或安裝入侵監(jiān)測(cè)軟件。2.?dāng)?shù)據(jù)手段在數(shù)據(jù)標(biāo)注領(lǐng)域中,數(shù)據(jù)的移動(dòng)過程有很多,如任務(wù)試標(biāo)、任務(wù)派發(fā)及質(zhì)檢打回等。根據(jù)項(xiàng)目需求,也并非都是在線任務(wù),離線任務(wù)占比也相對(duì)較高。通過對(duì)敏感信息脫敏與數(shù)據(jù)加密,可以有效地降低數(shù)據(jù)移動(dòng)過程中的安全風(fēng)險(xiǎn)。常用的數(shù)據(jù)手段如下。保證數(shù)據(jù)安全的手段本課件是可編輯的正常PPT課件01數(shù)據(jù)脫敏數(shù)據(jù)脫敏是指在保證數(shù)據(jù)原有特征及與其他數(shù)據(jù)關(guān)聯(lián)性的原則下,對(duì)數(shù)據(jù)中的姓名、電話及身份證號(hào)等敏感信息,通過掩碼、刪除、替換等方法進(jìn)行變更,從而在隱去敏感信息的同時(shí)不會(huì)影響數(shù)據(jù)的測(cè)試及應(yīng)用。03數(shù)字水印數(shù)字水印是指在音頻、視頻或圖片數(shù)據(jù)這類的噪聲耐受信號(hào)中隱蔽地嵌入包含版權(quán)、標(biāo)識(shí)及身份等信息的特殊標(biāo)記,通常用于數(shù)據(jù)源追蹤、版權(quán)保護(hù)及篡改檢測(cè)等。02數(shù)據(jù)加密數(shù)據(jù)加密是指通過特定的密鑰及算法將數(shù)據(jù)轉(zhuǎn)換為復(fù)雜代碼以保障數(shù)據(jù)安全。與數(shù)據(jù)脫敏相比,數(shù)據(jù)加密會(huì)失去數(shù)據(jù)的原有特征,需要通過密鑰及算法進(jìn)行解密才可以使用。此外,數(shù)據(jù)脫敏還會(huì)更改原始數(shù)據(jù),其過程一般不可逆,而數(shù)據(jù)加密、解密過程通常是可逆過程。常用的加密方法如下。保證數(shù)據(jù)安全的手段本課件是可編輯的正常PPT課件1)設(shè)備管理筆記本電腦、移動(dòng)硬盤、平板電腦及智能手機(jī)等移動(dòng)設(shè)備由于人為原因可
能會(huì)造成數(shù)據(jù)丟失、被盜及黑客入侵等情況,極大地提高了數(shù)據(jù)安全風(fēng)險(xiǎn);因此要盡可能使用移動(dòng)設(shè)備遠(yuǎn)程連接數(shù)據(jù)源,數(shù)據(jù)要盡可能存儲(chǔ)在安全的環(huán)境中,并且要對(duì)移動(dòng)設(shè)備中的重要數(shù)據(jù)進(jìn)行及時(shí)清理。此外,安裝安全軟件和加密軟件,對(duì)重要數(shù)據(jù)進(jìn)行加密可以有效防止黑客攻擊造成的數(shù)據(jù)泄露。保證數(shù)據(jù)安全的手段3.管理手段本課件是可編輯的正常PPT課件保證數(shù)據(jù)安全的手段3.管理手段本課件是可編輯的正常PPT課件2)人員管理幾乎不可能保證數(shù)據(jù)的絕對(duì)安全,但是如果具有較強(qiáng)的數(shù)據(jù)安全意識(shí)并且結(jié)合安全管理手段,就可以極大限度地降低數(shù)據(jù)安全風(fēng)險(xiǎn)。因此增強(qiáng)數(shù)據(jù)安全意識(shí)是人員管理的首要工作。用戶可以通過線上測(cè)試、線下培訓(xùn)及經(jīng)驗(yàn)分享等方式增強(qiáng)數(shù)據(jù)安全意識(shí),并且要求具有持續(xù)性;此外,還要強(qiáng)調(diào)安全法規(guī)要求及事故復(fù)盤等操作。數(shù)據(jù)安全管理的成功取決于管理的主動(dòng)性及協(xié)同合作能力。根據(jù)安全需求的動(dòng)態(tài)變化,各部門要相互協(xié)調(diào),能夠做到能及時(shí)應(yīng)對(duì),主動(dòng)發(fā)現(xiàn)各個(gè)階段潛在的安全漏洞并及時(shí)修正。此外,還要明確界定角色和職責(zé),應(yīng)該仔細(xì)監(jiān)管各環(huán)節(jié)中的數(shù)據(jù),確保在出現(xiàn)問題時(shí)能夠準(zhǔn)確定位。保證數(shù)據(jù)安全的手段3.管理手段3)流程管理本課件是可編輯的正常PPT課件感謝觀看數(shù)據(jù)標(biāo)注實(shí)訓(xùn)高等院校公共課系列精品教材本課件是可編輯的正常PPT課件項(xiàng)目管理進(jìn)階第二章數(shù)據(jù)標(biāo)注實(shí)訓(xùn)高等院校公共課系列精品教材本課件是可編輯的正常PPT課件01項(xiàng)目規(guī)劃設(shè)計(jì)PARTONE本課件是可編輯的正常PPT課件何為項(xiàng)目規(guī)劃對(duì)于項(xiàng)目規(guī)劃來說,項(xiàng)目是落腳點(diǎn),也是基礎(chǔ)。關(guān)于項(xiàng)目的概念,不同的人會(huì)有不同的理解。在美國(guó)項(xiàng)目管理協(xié)會(huì)出版的《項(xiàng)目管理知識(shí)體系指南》一書中,對(duì)于“項(xiàng)目”一詞有這樣一條定義,即項(xiàng)目是為創(chuàng)造獨(dú)特的產(chǎn)品、服務(wù)或成果而進(jìn)行的體系化的工作。在這一定義中,“體系化”一詞尤其值得注意。體系就是一個(gè)龐大的系統(tǒng),這個(gè)系統(tǒng)中包含了一些小的系統(tǒng),并各自形成具有某種功能的結(jié)構(gòu)。與人體相似,人體有消化系統(tǒng)、呼吸系統(tǒng)等,而消化系統(tǒng)和呼吸系統(tǒng)又都有各自的身體器官。體系化是項(xiàng)目最突出的特征,在項(xiàng)目體系中會(huì)涉及一系列工作,如項(xiàng)目預(yù)算、組織人員、調(diào)配資源、監(jiān)督管理等。此外,項(xiàng)目還有一個(gè)最基本的特征,即以實(shí)現(xiàn)特定目標(biāo)為目的。因此,也可以說,項(xiàng)目是為了實(shí)現(xiàn)特定目標(biāo)而開展的一系列工作任務(wù)。我們可以將游戲公司研發(fā)或運(yùn)營(yíng)一款游戲看作一個(gè)項(xiàng)目,可以將企業(yè)策劃的一次產(chǎn)品展銷活動(dòng)看作一個(gè)項(xiàng)目,還可以將本書中提到的每一次標(biāo)注服務(wù)都看作一個(gè)項(xiàng)目。本課件是可編輯的正常PPT課件何為項(xiàng)目規(guī)劃項(xiàng)目規(guī)劃可以理解為項(xiàng)目設(shè)計(jì),是指從實(shí)際情況出發(fā)進(jìn)行思考和謀劃,實(shí)現(xiàn)項(xiàng)目目標(biāo)所必需的各種活動(dòng)和工作成果。完美的項(xiàng)目規(guī)劃是項(xiàng)目成功落地的前提,它可以從宏觀角度對(duì)項(xiàng)目所涉及的要素和活動(dòng)進(jìn)行部署,為項(xiàng)目開展提供依據(jù),從而有效地減少因情況突變帶來的不利影響,并且可以對(duì)項(xiàng)目資源進(jìn)行評(píng)估和調(diào)配,力求以最低成本實(shí)現(xiàn)項(xiàng)目目標(biāo)。最重要的是,項(xiàng)目規(guī)劃能夠提前確定項(xiàng)目目標(biāo),為所有與項(xiàng)目相關(guān)的人員指明共同努力的方向,從而保質(zhì)、保量地完成項(xiàng)目。本課件是可編輯的正常PPT課件2.規(guī)劃準(zhǔn)備階段規(guī)劃準(zhǔn)備階段的主要工作為項(xiàng)目背景分析與項(xiàng)目需求分析。從字面意義來理解,項(xiàng)目背景就是項(xiàng)目背后的情況。4.規(guī)劃收尾階段規(guī)劃收尾階段主要是指各管理部門或領(lǐng)導(dǎo)對(duì)項(xiàng)目規(guī)劃進(jìn)行審核,規(guī)劃編制人員或部門對(duì)項(xiàng)目規(guī)劃進(jìn)行更新和調(diào)整,直至形成最終版項(xiàng)目規(guī)劃。1.規(guī)劃啟動(dòng)階段規(guī)劃啟動(dòng)階段相當(dāng)于項(xiàng)目規(guī)劃工作啟動(dòng)前的一個(gè)啟動(dòng)儀式。在規(guī)劃啟動(dòng)階段會(huì)通過啟動(dòng)會(huì)等形式針對(duì)項(xiàng)目規(guī)劃進(jìn)行消息同步,對(duì)項(xiàng)目規(guī)劃的目的、背景、要求進(jìn)行充分討論,并初步確定項(xiàng)目規(guī)劃的內(nèi)容及參與人員。3.規(guī)劃編制階段規(guī)劃編制階段是項(xiàng)目規(guī)劃的主要環(huán)節(jié),項(xiàng)目規(guī)劃的大部分工作都需要在這一階段完成。項(xiàng)目規(guī)劃的流程本課件是可編輯的正常PPT課件01項(xiàng)目目標(biāo)項(xiàng)目目標(biāo)是指項(xiàng)目要達(dá)到怎樣的總體目標(biāo)、預(yù)計(jì)要支出多少成本完成項(xiàng)目目標(biāo)、項(xiàng)目目標(biāo)是否要分階段實(shí)現(xiàn)及每個(gè)階段的目標(biāo)是什么。項(xiàng)目目標(biāo)的確定有助于統(tǒng)一項(xiàng)目相關(guān)人員方向,也為項(xiàng)目后續(xù)的分解和設(shè)置提供了依據(jù)。03項(xiàng)目規(guī)則項(xiàng)目規(guī)則是指項(xiàng)目實(shí)施過程中必須遵守的規(guī)則。該規(guī)則可以是整體的運(yùn)行規(guī)則,也可以是系列活動(dòng)的內(nèi)部操作規(guī)范。項(xiàng)目規(guī)則是對(duì)項(xiàng)目需求的最直接體現(xiàn),也是確保實(shí)現(xiàn)項(xiàng)目目標(biāo)的法寶,更是判斷參與者操作是否準(zhǔn)確的有效依據(jù)。02項(xiàng)目范圍項(xiàng)目范圍是指項(xiàng)目實(shí)施所涉及的范圍是怎樣的。項(xiàng)目范圍包括可參與的人員范圍、項(xiàng)目可用的原始材料范圍及項(xiàng)目活動(dòng)范圍。項(xiàng)目相關(guān)人員通過項(xiàng)目范圍的界定能夠了解滿足什么條件的人可以參與項(xiàng)目,也可以了解哪些原始材料能夠加入項(xiàng)目中。項(xiàng)目規(guī)劃的內(nèi)容本課件是可編輯的正常PPT課件04行動(dòng)方向行動(dòng)方向是指基于對(duì)項(xiàng)目目標(biāo)的理解提出可行的行動(dòng)建議。這些建議一般是基于既有事實(shí)或案例給出的,包括建議的行動(dòng)起點(diǎn)、建議的落實(shí)方式、建議的行動(dòng)步驟或流程等。行動(dòng)方向能夠幫助項(xiàng)目相關(guān)人員及時(shí)鎖定有效的行動(dòng)方式,縮短調(diào)研、討論等所消耗的時(shí)間,從而快速制定行動(dòng)方案。06時(shí)間節(jié)點(diǎn)時(shí)間節(jié)點(diǎn)是指完成項(xiàng)目各階段目標(biāo)的規(guī)定時(shí)間期限。在項(xiàng)目規(guī)劃過程中,目標(biāo)完成的時(shí)間節(jié)點(diǎn)能夠使項(xiàng)目相關(guān)人員的內(nèi)心產(chǎn)生明確的時(shí)間概念和緊迫感,這樣既有助于項(xiàng)目推進(jìn),又能為項(xiàng)目進(jìn)度的安排提供參考。05衡量指標(biāo)衡量指標(biāo)是指項(xiàng)目各階段目標(biāo)所對(duì)應(yīng)的結(jié)果或指標(biāo)要求,如合格率、準(zhǔn)確率、通過率、購買人數(shù)等。項(xiàng)目在每個(gè)階段都應(yīng)該有明確且可衡量的考核指標(biāo),這樣不僅有利于項(xiàng)目管理者進(jìn)行監(jiān)督、評(píng)價(jià)和考核,還有利于他們直觀地了解項(xiàng)目目標(biāo)的實(shí)現(xiàn)進(jìn)度,從而為后續(xù)項(xiàng)目設(shè)置做準(zhǔn)備。項(xiàng)目規(guī)劃的內(nèi)容本課件是可編輯的正常PPT課件2)定位提出發(fā)起標(biāo)注項(xiàng)目規(guī)劃的原因,即說明標(biāo)注項(xiàng)目要解決哪些難題,其應(yīng)用場(chǎng)景是怎樣的。4)定綱根據(jù)當(dāng)前場(chǎng)景及情況進(jìn)行分析,確定項(xiàng)目規(guī)劃需要做哪些工作,重點(diǎn)工作有哪些。1)動(dòng)員向項(xiàng)目規(guī)劃的相關(guān)人員宣告規(guī)劃工作啟動(dòng)。3)定調(diào)初步確定項(xiàng)目規(guī)劃基本原則的動(dòng)作,包括規(guī)模、成本、目標(biāo)等。例如,質(zhì)量、價(jià)格、數(shù)據(jù)量等優(yōu)先級(jí)別的確定或團(tuán)隊(duì)可承擔(dān)多大規(guī)模的成本等。標(biāo)注項(xiàng)目規(guī)劃1.規(guī)劃啟動(dòng)階段本課件是可編輯的正常PPT課件5)定責(zé)確定參與項(xiàng)目規(guī)劃的人員及每個(gè)人的職責(zé)。例如,小張負(fù)責(zé)收集資料、小李負(fù)責(zé)撰寫文件、小趙負(fù)責(zé)需求分析等。6)定時(shí)根據(jù)規(guī)劃內(nèi)容商討項(xiàng)目規(guī)劃進(jìn)度,如第一周完成調(diào)研、第二周完成目標(biāo)規(guī)劃,以此類推。標(biāo)注項(xiàng)目規(guī)劃1.規(guī)劃啟動(dòng)階段本課件是可編輯的正常PPT課件010302調(diào)研對(duì)標(biāo)注項(xiàng)目所涉及的問題及應(yīng)用場(chǎng)景、目前的研究情況、技術(shù)問題、行業(yè)普遍做法等進(jìn)行資料搜集和整理,從而確定標(biāo)注項(xiàng)目當(dāng)前可用的參考資料及資源,為下一步需求分析做準(zhǔn)備。需求分析根據(jù)標(biāo)注項(xiàng)目應(yīng)用場(chǎng)景、問題及可用資源進(jìn)行綜合分析,得出標(biāo)注項(xiàng)目具體的需求。數(shù)據(jù)模擬根據(jù)初步的需求分析,對(duì)標(biāo)注項(xiàng)目所涉及的關(guān)鍵問題逐一進(jìn)行確認(rèn)。標(biāo)注項(xiàng)目規(guī)劃2.規(guī)劃準(zhǔn)備階段本課件是可編輯的正常PPT課件1)標(biāo)注目標(biāo)規(guī)劃根據(jù)準(zhǔn)備階段的數(shù)據(jù)模擬情況制定標(biāo)注項(xiàng)目的具體目標(biāo)。一是標(biāo)注數(shù)據(jù)量二是帶標(biāo)數(shù)據(jù)應(yīng)用效果2)項(xiàng)目范圍規(guī)劃標(biāo)注項(xiàng)目各項(xiàng)活動(dòng)所涉及的范圍。3)標(biāo)注體系規(guī)劃標(biāo)注體系簡(jiǎn)單來說就是標(biāo)注過程中所采用的知識(shí)體系。4)標(biāo)注方式規(guī)劃標(biāo)注活動(dòng)的主要實(shí)施方式,人工參與程度。任務(wù)重復(fù)方式。標(biāo)注實(shí)現(xiàn)手段。標(biāo)注流程規(guī)劃評(píng)估手段規(guī)劃。標(biāo)注周期規(guī)劃。標(biāo)注項(xiàng)目規(guī)劃3.規(guī)劃編制階段本課件是可編輯的正常PPT課件4.規(guī)劃收尾階段通過對(duì)初始規(guī)劃內(nèi)容的校驗(yàn)和修改,項(xiàng)目的整體規(guī)劃已相對(duì)完整,與規(guī)劃相關(guān)的各項(xiàng)文件也已經(jīng)基本完成,此時(shí)可以說項(xiàng)目的規(guī)劃編制階段已經(jīng)結(jié)束。在規(guī)劃編制階段完成后,已形成的規(guī)劃成果還需要經(jīng)過相關(guān)負(fù)責(zé)人審批,以證明項(xiàng)目規(guī)劃已經(jīng)完備,項(xiàng)目也具備了落地的基本條件,從而為后續(xù)的項(xiàng)目動(dòng)員和實(shí)施提供指南。項(xiàng)目規(guī)劃是一個(gè)需要規(guī)劃者極度靈活的過程,并且各項(xiàng)規(guī)劃工作并沒有絕對(duì)的標(biāo)準(zhǔn),唯一可以遵循的原則就是著眼于自身資源、項(xiàng)目目標(biāo)等情況靈活設(shè)計(jì)。因此,在對(duì)標(biāo)注項(xiàng)目進(jìn)行規(guī)劃時(shí),我們要做到充分了解自己并發(fā)揮自身優(yōu)勢(shì),時(shí)刻關(guān)注項(xiàng)目實(shí)施過程,以項(xiàng)目目標(biāo)為導(dǎo)向,盡量規(guī)避風(fēng)險(xiǎn),從而使標(biāo)注項(xiàng)目過程更加順暢。標(biāo)注項(xiàng)目規(guī)劃本課件是可編輯的正常PPT課件02PARTTWO標(biāo)注項(xiàng)目需求分析本課件是可編輯的正常PPT課件眾所周知,需求分析是為了分析并得出需求。需求是一個(gè)常被掛在嘴邊的詞,這個(gè)詞在不同的語境下也會(huì)有不同的含義。在經(jīng)濟(jì)學(xué)領(lǐng)域中,需求是指在一定的時(shí)期,在每個(gè)價(jià)格水平下,消費(fèi)者愿意并且能夠購買的商品數(shù)量;在軟件開發(fā)領(lǐng)域中,需求是指系統(tǒng)初始并不具備客戶需要的內(nèi)容。IEEE軟件工程標(biāo)準(zhǔn)從軟件工程的角度給出了需求的3方面定義??蛻艚鉀Q問題或達(dá)到目標(biāo)所需的條件或權(quán)能。系統(tǒng)或系統(tǒng)部件要滿足合同、標(biāo)準(zhǔn)、規(guī)范或其他正式規(guī)定文檔所需的條件或權(quán)能。一種反映上述條件或權(quán)能的文檔說明。這些理解都從不同角度體現(xiàn)了需求的本質(zhì)。需求本課件是可編輯的正常PPT課件首先,需求源于需要,此為動(dòng)機(jī)。其次,需求著眼于客戶,即以客戶為中心。再次,需求的核心是提出要求,即客戶提出希望可以達(dá)到的標(biāo)準(zhǔn)。最后,需求會(huì)以不同的形式來呈現(xiàn)。例如,在炎熱的夏天,需求可能是一瓶冰水;在喧鬧的都市生活中,需求可能是少有的寧靜片刻;而在本書中,需求則是一次完美的標(biāo)注服務(wù)。
正因?yàn)槊總€(gè)領(lǐng)域?qū)τ谛枨蟮睦斫飧鞑幌嗤陨驳靥子萌魏我粋€(gè)領(lǐng)域中的需求定義都是沒有意義的。如果非要給出一個(gè)普適的概念,則大致可以基于以上分析給出這樣一個(gè)定義,即需求是因客戶需要而產(chǎn)生的各種要求和標(biāo)準(zhǔn)。本書中的標(biāo)注需求與這一概念相似,是指為了解決客戶的某些應(yīng)用問題而產(chǎn)生的數(shù)據(jù)標(biāo)注要求和標(biāo)準(zhǔn)。由于所處領(lǐng)域不同,人們對(duì)于需求的分類方式也不同,各領(lǐng)域也有自己的需求分類方式。例如,在軟件開發(fā)領(lǐng)域中,需求可以分為功能性需求和非功能性需求;按照需求層次分類,需求還包括業(yè)務(wù)需求、客戶需求和系統(tǒng)需求。在經(jīng)濟(jì)學(xué)領(lǐng)域中,需求可以按照顯露程度分為顯性需求和隱性需求。需求的分類依據(jù)還有很多,對(duì)于標(biāo)注服務(wù)來說,需求可以按照規(guī)模大小分為大型需求和小型需求;按照緊急程度可以分為緊急需求和非緊急需求;按照重要性可以分為重要需求和非重要需求;按照需求來源可以分為內(nèi)部需求和外部需求等。需求本課件是可編輯的正常PPT課件需求分析這個(gè)詞是每個(gè)行業(yè)都會(huì)經(jīng)常出現(xiàn)的詞。需求分析主要是指理解客戶需求,實(shí)施的工作和標(biāo)準(zhǔn)與客戶達(dá)成一致,并形成規(guī)則說明或需求文檔的過程。它是項(xiàng)目實(shí)施過程中非常重要的一項(xiàng)工作,因?yàn)樾枨蠓治鍪钦麄€(gè)項(xiàng)目的指南針,關(guān)于項(xiàng)目實(shí)施過程中的所有決策都是基于需求分析進(jìn)行的。有利的需求分析不僅能夠有效地避免項(xiàng)目修改和返工,還能夠體現(xiàn)團(tuán)隊(duì)的專業(yè)性和價(jià)值,從而促進(jìn)項(xiàng)目合作。對(duì)于需求分析,曾有文章這樣描述:項(xiàng)目需求就像神秘人一樣,不知道是什么、不知道從哪兒來、不知道想干啥,弄清項(xiàng)目需求簡(jiǎn)直像一場(chǎng)讀心術(shù)。這句話雖然很幽默,卻將需求分析所涉及的幾個(gè)關(guān)鍵問題展現(xiàn)得淋漓盡致。從描述中,我們可以總結(jié)出幾個(gè)關(guān)于需求分析的關(guān)鍵要點(diǎn)。需求分析本課件是可編輯的正常PPT課件項(xiàng)目需求很神秘,需要分析者深入挖掘并使其可見,保證需求完整準(zhǔn)確是需求分析的根本價(jià)值所在。需求分析要知道需求是什么,需要分析者具備專業(yè)知識(shí),能夠充分理解業(yè)務(wù)背景及邏輯是做好需求分析的基礎(chǔ)。需求分析要了解需求從哪里來,需要了解需求提出背后的原因,以客戶為中心并關(guān)注需求背后是需求分析的基本原則和前提,也是需求分析的出發(fā)點(diǎn)。需求分析要弄清楚需要做什么,需要明確滿足需求的具體任務(wù)和做法,這是需求分析的基本標(biāo)準(zhǔn)和最終目的。對(duì)于需求分析,值得強(qiáng)調(diào)的是,了解需求來源極其重要。一般來說,需求來源可以指需求的表面來源,即需求由誰提出或通過何種途徑獲取。通常,需求的表面來源大概有以下4種。客戶,即項(xiàng)目的服務(wù)對(duì)象。對(duì)于大部分項(xiàng)目來說,客戶是需求的主要來源,所以與客戶溝通是確定需求的最有效方式。市場(chǎng),即市場(chǎng)調(diào)研。市場(chǎng)調(diào)研有多種方式,可以是基本的信息檢索,也可以是試用或問卷調(diào)查等。市場(chǎng)調(diào)研往往是需求分析的必要步驟,能夠?yàn)樾枨蠓治鎏峁﹨⒖家罁?jù)和方向。競(jìng)品,即競(jìng)品分析,是指對(duì)同類項(xiàng)目或案例進(jìn)行研究,從中找出契合之處,從而發(fā)現(xiàn)項(xiàng)目的突破口與待改進(jìn)之處。需求分析本課件是可編輯的正常PPT課件內(nèi)部,即團(tuán)隊(duì)內(nèi)部。團(tuán)隊(duì)內(nèi)部提出的需求主要是基于已有經(jīng)驗(yàn)所做的補(bǔ)充或基于專業(yè)背景知識(shí)提出的一些參考建議,是為了更全面地考慮項(xiàng)目需求及具體情況,為客戶最終確定需求提供參考。在需求分析中,了解需求的表面來源主要是為深挖項(xiàng)目需求提供基礎(chǔ)的。事實(shí)上,需求來源還有更深層的含義,即需求是怎么來的,也就是為什么要提出這樣的需求,我們可以稱為“深層來源”要知道,任何需求的提出都有其背后的道理,要么是為了擺脫某些因素造成的影響或約束,要么是為了解決某一個(gè)問題。前者的影響因素通常包括項(xiàng)目預(yù)算、人員等客觀條件限制,后者的問題主要來源于特定的應(yīng)用場(chǎng)景。在需求分析的過程中,只有了解了這些,才能真正做到以客戶為中心,從而捕捉到準(zhǔn)確的客戶需求。需求分析是一個(gè)比較復(fù)雜的過程,不同領(lǐng)域?qū)α鞒痰慕缍ㄒ膊槐M相同,大致可以分為以下4個(gè)階段。需求分析本課件是可編輯的正常PPT課件2.分析與綜合階段分析與綜合階段包括兩部分,一部分是需求拆解和分析,即結(jié)合行業(yè)經(jīng)驗(yàn)和應(yīng)用場(chǎng)景等既有信息,通過反推等方式對(duì)需求進(jìn)行剖析,并對(duì)現(xiàn)有經(jīng)驗(yàn)和可用信息進(jìn)行分析,從而得出項(xiàng)目的細(xì)化需求點(diǎn)。4.需求驗(yàn)證階段需求驗(yàn)證階段主要的工作是驗(yàn)證,即根據(jù)整理出來的需求文檔對(duì)需求進(jìn)行評(píng)估和驗(yàn)證,從而確定需求的適用性和有效性,為后續(xù)項(xiàng)目實(shí)施做準(zhǔn)備。1.問題識(shí)別階段問題識(shí)別階段的工作主要有兩方面:一方面是與需求方進(jìn)行對(duì)接。另一方面,問題識(shí)別階段還需要針對(duì)初步需求進(jìn)行必要的市場(chǎng)調(diào)研。3.需求梳理階段需求梳理階段也被稱為“規(guī)格說明書制定階段”,主要工作是對(duì)需求進(jìn)行整理和記錄,從而形成項(xiàng)目需求文檔或說明書。需求分析本課件是可編輯的正常PPT課件對(duì)于標(biāo)注項(xiàng)目來說,需求分析是一項(xiàng)重要的工作,也是一項(xiàng)難度很大的工作。因?yàn)橐胱龊脴?biāo)注項(xiàng)目的需求分析,需要同時(shí)具備以下3方面條件。首先,標(biāo)注項(xiàng)目需求分析要建立在對(duì)結(jié)果數(shù)據(jù)的應(yīng)用場(chǎng)景有深刻了解的基礎(chǔ)上。這里的結(jié)果數(shù)據(jù)是指標(biāo)注結(jié)果。結(jié)果數(shù)據(jù)的應(yīng)用場(chǎng)景是指最終的標(biāo)注結(jié)果應(yīng)用在什么領(lǐng)域,用來解決什么樣的實(shí)際問題。因?yàn)樾枨蠓綄?duì)于需求的表述難免出現(xiàn)偏差或遺漏,特別是在需求模糊時(shí),需求分析要做“剝洋蔥”,要根據(jù)實(shí)際問題將需求層層剝離出來。因此,了解應(yīng)用場(chǎng)景是深刻理解標(biāo)注項(xiàng)目需求的前提,也是與需求方達(dá)成共識(shí)的關(guān)鍵一步。標(biāo)注項(xiàng)目需求分析詳解對(duì)于標(biāo)注項(xiàng)目來說,做好需求分析并非易事,因?yàn)檫@個(gè)過程會(huì)涉及諸多分析。從實(shí)現(xiàn)的目的來說,做好一個(gè)標(biāo)注項(xiàng)目的需求分析至少要弄清以下問題。標(biāo)注任務(wù)類型。標(biāo)注規(guī)則體系。標(biāo)注需求量。標(biāo)注節(jié)奏。結(jié)果數(shù)據(jù)形式。本課件是可編輯的正常PPT課件標(biāo)注項(xiàng)目需求分析詳解數(shù)據(jù)安全是指通過采取必要措施,確保數(shù)據(jù)處于有效保護(hù)和合法利用的狀態(tài),以及具備保障持續(xù)安全狀態(tài)的能力。目前,隨著信息技術(shù)的飛速發(fā)展,對(duì)數(shù)據(jù)的要求及數(shù)據(jù)的價(jià)值都在逐漸增加。因此,保障信息資產(chǎn)將會(huì)變得愈發(fā)重要。一個(gè)完善的數(shù)據(jù)安全體系本身就具有寶貴的價(jià)值,不但可以降低數(shù)據(jù)安全風(fēng)險(xiǎn),還可以提升產(chǎn)品的競(jìng)爭(zhēng)優(yōu)勢(shì)。數(shù)據(jù)具有多樣性,不同數(shù)據(jù)的保密要求及實(shí)施辦法也不盡相同。從數(shù)據(jù)安全角度考慮,這里將數(shù)據(jù)分為以下幾類。(1)個(gè)人及企業(yè)數(shù)據(jù):如個(gè)人隱私、肖像及企業(yè)財(cái)務(wù)敏感數(shù)據(jù)等。(2)業(yè)務(wù)數(shù)據(jù):?jiǎn)挝粡氖赂黜?xiàng)業(yè)務(wù)產(chǎn)生的有價(jià)值的數(shù)據(jù)。(3)重要數(shù)據(jù):涉及公共生命安全、國(guó)家安全的機(jī)密數(shù)據(jù)。這里僅按照數(shù)據(jù)安全受限的等級(jí)進(jìn)行一個(gè)簡(jiǎn)要分類,其保密等級(jí)要根據(jù)業(yè)務(wù)需求進(jìn)行具體劃分。數(shù)據(jù)安全流程包括安全策略的規(guī)劃、構(gòu)建與執(zhí)行,為訪問數(shù)據(jù)提供身份驗(yàn)證、授權(quán)等操作,以及對(duì)過程的監(jiān)管與治理等。目前尚且無法對(duì)所有的隱私和保密要求提出一套通用的數(shù)據(jù)安全實(shí)施辦法。本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解1.初步需求對(duì)接初步需求對(duì)接是指與需求方進(jìn)行的首次需求對(duì)接。初步需求對(duì)接的目的是確定標(biāo)注項(xiàng)目的基本情況,識(shí)別標(biāo)注項(xiàng)目要解決的核心應(yīng)用問題,從而為項(xiàng)目評(píng)估及后續(xù)工作的開展做準(zhǔn)備。在初步需求對(duì)接時(shí),一般重點(diǎn)關(guān)注以下幾個(gè)問題。(1)標(biāo)注項(xiàng)目的基本情況如何?例如,預(yù)期標(biāo)注需求量、項(xiàng)目預(yù)算、預(yù)計(jì)周期、人員要求等。(2)標(biāo)注項(xiàng)目的應(yīng)用場(chǎng)景是怎樣的?(3)標(biāo)注項(xiàng)目已有的基礎(chǔ)和背景如何?即任務(wù)類型是否已確定,是否已有待驗(yàn)證的標(biāo)注規(guī)則體系,該標(biāo)注項(xiàng)目之前做過哪些嘗試,實(shí)施情況如何等。(4)目前,標(biāo)注項(xiàng)目重點(diǎn)關(guān)注的問題是什么?需要如何配合?(5)對(duì)于標(biāo)注項(xiàng)目實(shí)施經(jīng)驗(yàn)來說,標(biāo)注項(xiàng)目設(shè)置可能會(huì)存在某些問題,對(duì)于這些問題是否已有考慮?以上列出的問題是在做具體需求分析之前必須明確的問題,這幾個(gè)問題直接決定了后續(xù)需求分析的工作量、工作方式和流程。本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解2.調(diào)研分析調(diào)研分析是指根據(jù)獲取的信息,以核心場(chǎng)景問題為焦點(diǎn),通過各種方式獲取同類場(chǎng)景或項(xiàng)目已有做法的信息,并對(duì)其進(jìn)行分析總結(jié),從而為整理并確定項(xiàng)目需求提供依據(jù)。在調(diào)研分析階段,獲取信息的途徑有很多,比較容易實(shí)現(xiàn)的途徑有以下兩種。(1)網(wǎng)絡(luò)檢索。網(wǎng)絡(luò)檢索是調(diào)研分析常用的方式,在很多情況下,網(wǎng)絡(luò)中的權(quán)威文獻(xiàn)等能為調(diào)研者提供很多有價(jià)值的信息。(2)專家咨詢。專家咨詢是指針對(duì)領(lǐng)域難點(diǎn)征求專家意見。它是針對(duì)領(lǐng)域問題尋找解決方案和建議的最佳方式。除了通過上述途徑,我們還可以通過調(diào)查問卷、實(shí)地考察等方式獲取大量的有效信息,在需求分析過程中,可視具體情況使用。本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解3.需求拆解分析標(biāo)注項(xiàng)目的需求分析過程也是對(duì)根本問題進(jìn)行逐步反推和拆解分析的過程。對(duì)于標(biāo)注項(xiàng)目來說,其反推和拆解的順序大致為應(yīng)用領(lǐng)域→應(yīng)用場(chǎng)景→需要解決的問題→標(biāo)注任務(wù)類型→標(biāo)注規(guī)則體系。在對(duì)需求進(jìn)行拆解后,還需要根據(jù)已有信息進(jìn)行綜合分析。在分析過程中,可能包括以下參考信息。(1)已有項(xiàng)目案例。已有項(xiàng)目案例一般能為標(biāo)注項(xiàng)目需求分析提供意想不到的靈感。(2)專家意見和行業(yè)標(biāo)準(zhǔn)。制定標(biāo)注規(guī)則體系要以適用行業(yè)標(biāo)準(zhǔn)為前提,因此要高度重視專家意見和行業(yè)標(biāo)準(zhǔn)。(3)標(biāo)注經(jīng)驗(yàn)。標(biāo)注規(guī)則體系的制定,特別是各個(gè)知識(shí)點(diǎn)及知識(shí)體系規(guī)模的定義,除了要參考行業(yè)標(biāo)準(zhǔn),還要考慮標(biāo)注項(xiàng)目實(shí)施的可行性。(4)需求方的想法。標(biāo)注項(xiàng)目需求分析最終要滿足需求方的要求,因此應(yīng)該將需求方的想法放在首位。在進(jìn)行需求分析時(shí),應(yīng)該充分考慮需求方的現(xiàn)實(shí)問題,并深入體會(huì)真實(shí)需求,從而確保需求分析的準(zhǔn)確性和實(shí)用性。本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解4.需求文檔整理需求文檔整理主要是指對(duì)需求分析過程中形成的結(jié)論和結(jié)果進(jìn)行歸納整理,從而將標(biāo)注項(xiàng)目需求完整準(zhǔn)確地落到紙面上。對(duì)于標(biāo)注項(xiàng)目來說,需要整理的需求文檔主要有以下3個(gè)。(1)基本需求文檔?;拘枨笪臋n主要記錄標(biāo)注項(xiàng)目的基本事實(shí)要求,內(nèi)容包括但不限于標(biāo)注項(xiàng)目背景、標(biāo)注任務(wù)類型、標(biāo)注人員要求、預(yù)定標(biāo)注工期、標(biāo)注項(xiàng)目實(shí)施的基本節(jié)奏、標(biāo)注量、標(biāo)注實(shí)施方式、標(biāo)注系統(tǒng)需求等。(2)標(biāo)注規(guī)則體系文檔。標(biāo)注規(guī)則體系文檔是需求文檔的核心部分,主要記錄了標(biāo)注項(xiàng)目所依據(jù)的知識(shí)體系及對(duì)體系中具體事項(xiàng)的說明,在標(biāo)注項(xiàng)目中通常被稱為“標(biāo)注規(guī)范”。其中,要明確的事項(xiàng)包括標(biāo)注任務(wù)目標(biāo)、標(biāo)注范圍、標(biāo)注原則、標(biāo)注體系、注意事項(xiàng)等。(3)結(jié)果格式文檔。結(jié)果格式文檔主要記錄最終提交結(jié)果數(shù)據(jù)的格式,相當(dāng)于給出了最終結(jié)果數(shù)據(jù)的格式模板。由于不同的標(biāo)注項(xiàng)目之間會(huì)有差別,需求文檔也會(huì)隨之發(fā)生變化,因此需求文檔的數(shù)量也是可以靈活掌握的。例如,對(duì)于小型項(xiàng)目來說,需求文檔可能只有一個(gè),而對(duì)于大型復(fù)雜項(xiàng)目來說,需求文檔的數(shù)量也可能會(huì)有所增加。具體選用多少個(gè)需求文檔,以能夠準(zhǔn)確表達(dá)項(xiàng)目需求為準(zhǔn)本課件是可編輯的正常PPT課件數(shù)據(jù)清洗操作詳解5.需求驗(yàn)證標(biāo)注項(xiàng)目同時(shí)涉及需求方的需求、專業(yè)知識(shí)和標(biāo)注經(jīng)驗(yàn)3方面的融合,因此,進(jìn)行需求驗(yàn)證和完善是繞不開的一環(huán)。對(duì)于標(biāo)注項(xiàng)目來說,需求驗(yàn)證主要是通過項(xiàng)目模擬的方式進(jìn)行的,以便在實(shí)施過程中及時(shí)發(fā)現(xiàn)需求分析中存在的漏洞和問題。在需求驗(yàn)證過程中,需要驗(yàn)證以下內(nèi)容。(1)標(biāo)注規(guī)則體系。(2)標(biāo)注工期。(3)標(biāo)注效果。6.需求最終確認(rèn)需求最終確認(rèn)是指標(biāo)注項(xiàng)目相關(guān)各方對(duì)終版需求進(jìn)行確認(rèn)并備案的過程。這個(gè)過程完成即可表示標(biāo)注項(xiàng)目需求已符合需求方要求,不會(huì)再出現(xiàn)大幅度的修改,隨后可以開始標(biāo)注項(xiàng)目的實(shí)施。需求最終確認(rèn)是標(biāo)注項(xiàng)目各方最終統(tǒng)一思想的過程,也是對(duì)標(biāo)注項(xiàng)目各方高度負(fù)責(zé)的做法。因?yàn)橐坏┥婕靶枨笞兏?,就表示?biāo)注項(xiàng)目各方都需要有額外的投入。當(dāng)然,從以客戶為中心的角度來說,需求最終確認(rèn)已結(jié)束并不能代表標(biāo)注項(xiàng)目需求不能進(jìn)行修改,當(dāng)涉及需求修改時(shí),標(biāo)注項(xiàng)目各方應(yīng)該友好協(xié)商,共同確定各方可接受的修改方案。1)標(biāo)注項(xiàng)目需求分析的痛點(diǎn)2)標(biāo)注項(xiàng)目需求分析的注意事項(xiàng)本課件是可編輯的正常PPT課件03PARTTHREE標(biāo)注流程設(shè)計(jì)本課件是可編輯的正常PPT課件標(biāo)注流程1.基本項(xiàng)目流程基本項(xiàng)目流程是指標(biāo)注項(xiàng)目從獲取原始數(shù)據(jù)開始到標(biāo)注結(jié)束所經(jīng)歷的關(guān)鍵環(huán)節(jié)。行業(yè)內(nèi)普遍認(rèn)為,數(shù)據(jù)標(biāo)注有以下4個(gè)基本流程。(1)數(shù)據(jù)采集。對(duì)于數(shù)據(jù)標(biāo)注來說,用于標(biāo)注的數(shù)據(jù)通常被稱為“原始數(shù)據(jù)”,這些原始數(shù)據(jù)相當(dāng)于標(biāo)注的原材料,而數(shù)據(jù)采集就是為數(shù)據(jù)標(biāo)注提供原材料的過程。數(shù)據(jù)采集環(huán)節(jié)要在數(shù)據(jù)標(biāo)注之前完成,通過多樣化的方式和手段采集足夠多的原始數(shù)據(jù)。在數(shù)據(jù)采集過程中,獲取原始數(shù)據(jù)的途徑可以有多種,常見的有網(wǎng)絡(luò)爬取、人工生成及通過特定途徑購買。獲取的原始數(shù)據(jù)形式也是多種多樣的,如圖片、視頻、語音、文本等。本課件是可編輯的正常PPT課件標(biāo)注流程(2)數(shù)據(jù)清洗。數(shù)據(jù)清洗是指對(duì)采集后的原始數(shù)據(jù)進(jìn)行校驗(yàn)和篩選,以便將“臟數(shù)據(jù)”去除清洗,讓數(shù)據(jù)變得整潔可用,從而從源頭上確保數(shù)據(jù)標(biāo)注過程順利有效。一般來說,在對(duì)標(biāo)注數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗時(shí),需要關(guān)注以下“臟數(shù)據(jù)”。不完整數(shù)據(jù),如有些值丟失或有遺漏。錯(cuò)誤數(shù)據(jù),如錯(cuò)別字、知識(shí)性錯(cuò)誤、多余字符等。重復(fù)或多余的數(shù)據(jù),避免反復(fù)標(biāo)注,做無用功。噪聲數(shù)據(jù),不適合標(biāo)注或標(biāo)注后無意義的數(shù)據(jù)。矛盾數(shù)據(jù),描述同一問題的多條數(shù)據(jù)之間彼此矛盾,需要驗(yàn)證后保留正確數(shù)據(jù)或全部去除。格式不合規(guī)的數(shù)據(jù),當(dāng)數(shù)據(jù)格式與要求格式偏差較大時(shí)將無法修正,需要清洗。數(shù)據(jù)清洗不僅能讓標(biāo)注項(xiàng)目進(jìn)行得更加順利,也能直接影響標(biāo)注結(jié)果的最終效果。沒有前期的數(shù)據(jù)清洗,后續(xù)的標(biāo)注、訓(xùn)練等工作都將無從下手,即使強(qiáng)行進(jìn)行,也得不到準(zhǔn)確的標(biāo)注結(jié)果。本課件是可編輯的正常PPT課件標(biāo)注流程(3)數(shù)據(jù)標(biāo)注。對(duì)于標(biāo)注項(xiàng)目來說,數(shù)據(jù)標(biāo)注是核心環(huán)節(jié)。針對(duì)原始數(shù)據(jù)進(jìn)行的所有加工和標(biāo)注工作都將在此階段進(jìn)行。數(shù)據(jù)標(biāo)注環(huán)節(jié)并非想象那樣只有數(shù)據(jù)標(biāo)注這一項(xiàng)工作要做,也會(huì)涉及標(biāo)注項(xiàng)目實(shí)施前后的諸多環(huán)節(jié),如需求理解、培訓(xùn)、標(biāo)注等,這里不再詳述。(4)數(shù)據(jù)質(zhì)檢。數(shù)據(jù)質(zhì)檢是保證標(biāo)注準(zhǔn)確率的重要環(huán)節(jié),因?yàn)槿斯?biāo)注無法保證完全準(zhǔn)確,只有最終通過質(zhì)檢環(huán)節(jié)的數(shù)據(jù)才能在一定意義上被稱為“可靠數(shù)據(jù)”。在實(shí)際標(biāo)注項(xiàng)目中,數(shù)據(jù)質(zhì)檢的工作性質(zhì)可以依據(jù)標(biāo)注實(shí)施過程及主體的變化而發(fā)生變化。具體來說,當(dāng)需求方與實(shí)施方為同一主體時(shí),數(shù)據(jù)質(zhì)檢的工作性質(zhì)更傾向于標(biāo)注質(zhì)量的保證,但當(dāng)需求方與實(shí)施方為不同的主體時(shí),數(shù)據(jù)質(zhì)檢的工作性質(zhì)更傾向于標(biāo)注結(jié)果數(shù)據(jù)的審核或驗(yàn)收。因此,數(shù)據(jù)質(zhì)檢環(huán)節(jié)具體如何實(shí)施,還需要結(jié)合現(xiàn)實(shí)情況來定。本課件是可編輯的正常PPT課件數(shù)據(jù)安全的概念2.標(biāo)注實(shí)施流程標(biāo)注實(shí)施流程是指從實(shí)施方接收到標(biāo)注項(xiàng)目需求開始到標(biāo)注項(xiàng)目結(jié)束為止,這段時(shí)期內(nèi)的一系列活動(dòng)。嚴(yán)格來說,該流程是對(duì)基本項(xiàng)目流程中數(shù)據(jù)標(biāo)注環(huán)節(jié)的細(xì)化,是標(biāo)注項(xiàng)目中最核心的流程,對(duì)保證標(biāo)注項(xiàng)目的效果起著決定性作用。具體來說,標(biāo)注實(shí)施流程中可能會(huì)涉及以下環(huán)節(jié)。(1)需求對(duì)接。需求對(duì)接是指在需求方將需求給到實(shí)施方之后,實(shí)施方與需求方之間針對(duì)需求進(jìn)行溝通確認(rèn)的過程。在此過程中,實(shí)施方需要做兩件事情。研究并理解需求,對(duì)不清晰之處進(jìn)行確認(rèn),從而對(duì)齊標(biāo)注的原則和標(biāo)準(zhǔn)。在理解需求的過程中對(duì)需求進(jìn)行驗(yàn)證,及時(shí)發(fā)現(xiàn)需求中的矛盾點(diǎn)、不足等,確保需求可支撐標(biāo)注過程。本課件是可編輯的正常PPT課件數(shù)據(jù)安全的概念(2)標(biāo)準(zhǔn)樣例制作。在需求確認(rèn)完成后,需要針對(duì)標(biāo)注活動(dòng)制定標(biāo)準(zhǔn)樣例。制作標(biāo)準(zhǔn)樣例的目的有兩點(diǎn):一是為標(biāo)注提供可視化的參考標(biāo)準(zhǔn),使標(biāo)注人員更好地理解需求和任務(wù)目標(biāo);二是通過實(shí)際樣例來確定實(shí)施方與需求方是否對(duì)需求理解一致,且標(biāo)注結(jié)果滿足需求方的要求。標(biāo)準(zhǔn)樣例的格式并無限制,一般以需求方的要求為準(zhǔn)。(3)標(biāo)注實(shí)施準(zhǔn)備。當(dāng)需求確定及樣例制作完成后就可以進(jìn)一步開展標(biāo)注活動(dòng)。在標(biāo)注環(huán)節(jié)開始之前,需要針對(duì)標(biāo)注實(shí)施做一些準(zhǔn)備活動(dòng),包括但不限于原始數(shù)據(jù)分析、數(shù)據(jù)處理、系統(tǒng)準(zhǔn)備、項(xiàng)目工具及人員配置、培訓(xùn)測(cè)試文件及視頻準(zhǔn)備、標(biāo)注行動(dòng)方案制定等。(4)標(biāo)注實(shí)施。標(biāo)注實(shí)施的起點(diǎn)是準(zhǔn)備工作結(jié)束,終點(diǎn)是所有數(shù)據(jù)標(biāo)注完成。所有的標(biāo)注結(jié)果產(chǎn)出都集中在這一環(huán)節(jié),但該環(huán)節(jié)并非只有標(biāo)注這項(xiàng)工作要做,還涉及很多其他工作。例如,標(biāo)注人員培訓(xùn)、規(guī)范確認(rèn)及更新、標(biāo)注人員管理、結(jié)果反饋、流程完善等。這些工作都是標(biāo)注實(shí)施過程中必須做的工作,也是標(biāo)注流程設(shè)計(jì)中必須予以考慮的因素。本課件是可編輯的正常PPT課件數(shù)據(jù)安全的概念(5)質(zhì)檢實(shí)施。質(zhì)檢實(shí)施是指在數(shù)據(jù)標(biāo)注完成后,由質(zhì)檢人員對(duì)初始標(biāo)注結(jié)果進(jìn)行檢查、反饋、修改的過程。與標(biāo)注實(shí)施環(huán)節(jié)一樣,質(zhì)檢實(shí)施環(huán)節(jié)除了需要完成質(zhì)檢,也有一系列工作需要完成。(6)結(jié)果反饋。結(jié)果反饋是標(biāo)注實(shí)施和質(zhì)檢實(shí)施過程中的一個(gè)伴隨過程,是指在標(biāo)注并質(zhì)檢完成一部分任務(wù)后,先將部分結(jié)果交給需求方進(jìn)行確認(rèn),以確保標(biāo)注結(jié)果滿足要求,并及時(shí)發(fā)現(xiàn)標(biāo)注結(jié)果中的不足予以改進(jìn)。(7)結(jié)果交付。結(jié)果交付是指將標(biāo)注結(jié)果提交給需求方進(jìn)行檢查、驗(yàn)收的過程。一般在結(jié)果交付時(shí)可能會(huì)涉及兩件事:一是結(jié)果格式處理,二是結(jié)果提交。(8)收尾環(huán)節(jié)。收尾環(huán)節(jié)是指在標(biāo)注結(jié)果交付完成后,對(duì)標(biāo)注過程中的未盡事宜進(jìn)行處理的過程。一般收尾環(huán)節(jié)的工作涉及結(jié)果驗(yàn)收配合、數(shù)據(jù)結(jié)果完善、過程數(shù)據(jù)整理等。本課件是可編輯的正常PPT課件0103021.標(biāo)注流程設(shè)計(jì)要將項(xiàng)目特點(diǎn)作為第一考慮因素項(xiàng)目特點(diǎn)是指項(xiàng)目所涉及的要素呈現(xiàn)出來的規(guī)律或特性。對(duì)于標(biāo)注項(xiàng)目來說,影響其流程設(shè)計(jì)的元素有很多,如標(biāo)注需求、原始數(shù)據(jù)、項(xiàng)目目標(biāo)等。2.標(biāo)注流程設(shè)計(jì)要充分結(jié)合標(biāo)注工具現(xiàn)狀隨著行業(yè)發(fā)展,標(biāo)注工具已經(jīng)成為標(biāo)注項(xiàng)目實(shí)施過程中必備的元素。將工具的作用發(fā)揮到極致是標(biāo)注流程設(shè)計(jì)的基本要求。3.標(biāo)注流程設(shè)計(jì)要與實(shí)施組織條件相匹配實(shí)施組織條件是指實(shí)施方所具備的資源條件,如人員條件、系統(tǒng)條件、技術(shù)條件等。標(biāo)注流程設(shè)計(jì)與實(shí)施組織條件相匹配是指標(biāo)注流程設(shè)計(jì)要依據(jù)實(shí)際資源條件進(jìn)行,不可過于保守,也不可過于冒進(jìn)。標(biāo)注流程設(shè)計(jì)原則本課件是可編輯的正常PPT課件4.標(biāo)注流程設(shè)計(jì)要考慮風(fēng)險(xiǎn)預(yù)防和異常處理完美的標(biāo)注項(xiàng)目流程不僅能夠確保在正常狀態(tài)下按時(shí)保質(zhì)地完成標(biāo)注項(xiàng)目,還要能在異常情況下確保萬無一失。5.標(biāo)注流程設(shè)計(jì)要以目標(biāo)為導(dǎo)向,主脈絡(luò)要清晰標(biāo)注流程涉及很多環(huán)節(jié),并且每個(gè)環(huán)節(jié)還會(huì)涉及多個(gè)子流程,所以其子流程也會(huì)比較復(fù)雜。6.標(biāo)注流程設(shè)計(jì)要充分考慮管理的有效性和可行性設(shè)計(jì)標(biāo)注流程的目的是便于統(tǒng)一管理,從而使標(biāo)注項(xiàng)目順利進(jìn)行,因此標(biāo)注流程設(shè)計(jì)最重要的是要考慮每個(gè)環(huán)節(jié)對(duì)于項(xiàng)目管理的有效性。7.標(biāo)注流程設(shè)計(jì)要靈活,注意留出可調(diào)整空間任何標(biāo)注項(xiàng)目都不可能依靠一個(gè)一成不變的流程順利完成,在實(shí)施過程中偶爾會(huì)有一些不符合預(yù)期之處。標(biāo)注流程設(shè)計(jì)原則本課件是可編輯的正常PPT課件1.?dāng)?shù)據(jù)采集數(shù)據(jù)采集的目的是為后續(xù)的數(shù)據(jù)標(biāo)注提供原材料,所以數(shù)據(jù)采集的質(zhì)量和進(jìn)度也決定了標(biāo)注過程的執(zhí)行難度及標(biāo)注結(jié)果的豐滿度。數(shù)據(jù)采集環(huán)節(jié)的設(shè)計(jì)需要重點(diǎn)考慮以下問題。(1)數(shù)據(jù)采集的范圍,采集哪個(gè)領(lǐng)域及什么內(nèi)容范圍的數(shù)據(jù)?(2)數(shù)據(jù)采集的方式,是人工采集還是傳感器采集,是系統(tǒng)日志采集還是網(wǎng)絡(luò)爬蟲采集?(3)數(shù)據(jù)采集的來源,從哪些人、哪些設(shè)備或系統(tǒng)及哪些網(wǎng)站采集數(shù)據(jù)?(4)數(shù)據(jù)采集的數(shù)量,采集多大量級(jí)的數(shù)據(jù)才能滿足標(biāo)注需求?(5)數(shù)據(jù)的存儲(chǔ)方式,采集的數(shù)據(jù)以什么方式存儲(chǔ),存儲(chǔ)到哪里?厘清了上述問題,才可以開始實(shí)施數(shù)據(jù)采集,同時(shí)基于以上關(guān)注的問題,我們也可以推斷出數(shù)據(jù)采集的基本流程,即采集需求分析→尋源→采集軟硬件條件準(zhǔn)備→采集→數(shù)據(jù)整理→數(shù)據(jù)存儲(chǔ)。標(biāo)注流程中常見環(huán)節(jié)關(guān)注點(diǎn)及其設(shè)計(jì)本課件是可編輯的正常PPT課件2.?dāng)?shù)據(jù)清洗數(shù)據(jù)清洗是對(duì)標(biāo)注數(shù)據(jù)進(jìn)行凈化處理的過程,是確保標(biāo)注活動(dòng)順利進(jìn)行的前提。數(shù)據(jù)清洗環(huán)節(jié)需要重點(diǎn)關(guān)注的問題如下。(1)數(shù)據(jù)中需要清洗的“污點(diǎn)”都有哪些?(2)數(shù)據(jù)清洗的策略,是使用人工清洗還是使用程序自動(dòng)清洗,是根據(jù)概率統(tǒng)計(jì)檢測(cè)修改還是利用相關(guān)算法檢測(cè)修改?各類“污點(diǎn)”的清洗順序及側(cè)重點(diǎn)是怎樣的?是否需要使用多種方式混合清洗?(3)“臟數(shù)據(jù)”的標(biāo)準(zhǔn),即什么程度的數(shù)據(jù)“污點(diǎn)”需要清洗,什么程度的數(shù)據(jù)“污點(diǎn)”是可以接受的?(4)數(shù)據(jù)“污點(diǎn)”由誰來修正,是使用人工修正還是使用程序修正?哪些“污點(diǎn)”必須使用人工修正?(5)清洗后的數(shù)據(jù)以什么方式存儲(chǔ),存儲(chǔ)在哪里?基于以上分析可知,數(shù)據(jù)清洗的基本流程為數(shù)據(jù)“污點(diǎn)”分析→清洗策略制定→清洗標(biāo)準(zhǔn)制定→篩選數(shù)據(jù)“污點(diǎn)”→數(shù)據(jù)“污點(diǎn)”修正→干凈數(shù)據(jù)整合及存儲(chǔ)。標(biāo)注流程中常見環(huán)節(jié)關(guān)注點(diǎn)及其設(shè)計(jì)本課件是可編輯的正常PPT課件3.需求對(duì)接驗(yàn)證數(shù)據(jù)清洗是對(duì)標(biāo)注數(shù)據(jù)進(jìn)行凈化處理的過程,是確保標(biāo)注活動(dòng)順利進(jìn)行的前提。數(shù)據(jù)清洗環(huán)節(jié)需要重點(diǎn)關(guān)注的問題如下。(1)數(shù)據(jù)中需要清洗的“污點(diǎn)”都有哪些?(2)數(shù)據(jù)清洗的策略,是使用人工清洗還是使用程序自動(dòng)清洗,是根據(jù)概率統(tǒng)計(jì)檢測(cè)修改還是利用相關(guān)算法檢測(cè)修改?各類“污點(diǎn)”的清洗順序及側(cè)重點(diǎn)是怎樣的?是否需要使用多種方式混合清洗?(3)“臟數(shù)據(jù)”的標(biāo)準(zhǔn),即什么程度的數(shù)據(jù)“污點(diǎn)”需要清洗,什么程度的數(shù)據(jù)“污點(diǎn)”是可以接受的?(4)數(shù)據(jù)“污點(diǎn)”由誰來修正,是使用人工修正還是使用程序修正?哪些“污點(diǎn)”必須使用人工修正?(5)清洗后的數(shù)據(jù)以什么方式存儲(chǔ),存儲(chǔ)在哪里?基于以上分析可知,數(shù)據(jù)清洗的基本流程為數(shù)據(jù)“污點(diǎn)”分析→清洗策略制定→清洗標(biāo)準(zhǔn)制定→篩選數(shù)據(jù)“污點(diǎn)”→數(shù)據(jù)“污點(diǎn)”修正→干凈數(shù)據(jù)整合及存儲(chǔ)。標(biāo)注流程中常見環(huán)節(jié)關(guān)注點(diǎn)及其設(shè)計(jì)本課件是可編輯的正常PPT課件4.標(biāo)注準(zhǔn)備標(biāo)注準(zhǔn)備階段的目的是給標(biāo)注實(shí)施提供必要的條件。該過程并無明顯的哪項(xiàng)工作在先的說法,如人員條件具備可同步進(jìn)行。在標(biāo)注準(zhǔn)備階段,需要關(guān)注以下準(zhǔn)備工作。(1)材料準(zhǔn)備,標(biāo)注項(xiàng)目實(shí)施需要準(zhǔn)備哪些材料?由誰來準(zhǔn)備?時(shí)間節(jié)點(diǎn)是怎樣的?材料準(zhǔn)備的要求是怎樣的?(2)人員準(zhǔn)備,標(biāo)注項(xiàng)目實(shí)施需要哪些人員?人員來源于哪里?對(duì)人員有什么要求?需要多少人?(3)系統(tǒng)準(zhǔn)備,采用什么樣的標(biāo)注系統(tǒng)?系統(tǒng)詳細(xì)配置如何?系統(tǒng)中還有哪些功能可以為標(biāo)注實(shí)施提供方便?(4)數(shù)據(jù)準(zhǔn)備,數(shù)據(jù)處理成何種格式?需要對(duì)數(shù)據(jù)做哪些分析和處理?需要注意的是,需求方與實(shí)施方在標(biāo)注準(zhǔn)備環(huán)節(jié)中工作量的多少取決于雙方是否為同一主體。一般來說,如果需求方與實(shí)施方不是同一主體,則需求方對(duì)標(biāo)注準(zhǔn)備環(huán)節(jié)的工作投入遠(yuǎn)低于實(shí)施方。標(biāo)注流程中常見環(huán)節(jié)關(guān)注點(diǎn)及其設(shè)計(jì)本課件是可編輯的正常PPT課件5.標(biāo)注實(shí)施標(biāo)注實(shí)施是整個(gè)標(biāo)注項(xiàng)目的核心環(huán)節(jié),也是檢驗(yàn)整個(gè)標(biāo)注流程設(shè)計(jì)是否成功的重要步驟。由于標(biāo)注環(huán)節(jié)與質(zhì)檢環(huán)節(jié)在很多情況下是相伴進(jìn)行且頻繁聯(lián)動(dòng)的,因此,我們將標(biāo)注環(huán)節(jié)和質(zhì)檢環(huán)節(jié)均納入標(biāo)注實(shí)施環(huán)節(jié)。在標(biāo)注實(shí)施環(huán)節(jié)的設(shè)計(jì)中,需要重點(diǎn)關(guān)注以下問題。(1)人員培訓(xùn)測(cè)試方式,人員培訓(xùn)測(cè)試通過何種方式進(jìn)行,是使用系統(tǒng)測(cè)試還是使用人工測(cè)試?(2)人員培訓(xùn)測(cè)試的策略,培訓(xùn)測(cè)試按照怎樣的原則進(jìn)行?是否需要重新學(xué)習(xí)?重新學(xué)習(xí)的觸發(fā)條件是什么?重新學(xué)習(xí)的流程是怎樣的?通過測(cè)試的標(biāo)準(zhǔn)是怎樣的?(3)基本指標(biāo)要求,對(duì)標(biāo)注環(huán)節(jié)和質(zhì)檢環(huán)節(jié)的任務(wù)量及質(zhì)量有什么指標(biāo)要求?(4)過程控制,標(biāo)注過程中需要加入哪些過程管理手段?(5)規(guī)范變更管理,當(dāng)標(biāo)注規(guī)范變更時(shí)如何進(jìn)行培訓(xùn)和管理?(6)質(zhì)檢人員的選用,質(zhì)檢人員的選用方式是怎樣的?標(biāo)注人員與質(zhì)檢人員之間的配比是怎樣的?
(7)環(huán)節(jié)聯(lián)動(dòng),標(biāo)注環(huán)節(jié)如何與質(zhì)檢、審核、反饋、培訓(xùn)等環(huán)節(jié)聯(lián)動(dòng)?(8)人員淘汰機(jī)制,標(biāo)注人員和質(zhì)檢人員達(dá)到什么程度會(huì)被淘汰?人員淘汰后的人力補(bǔ)給如何進(jìn)行?標(biāo)注實(shí)施環(huán)節(jié)的設(shè)計(jì)是整個(gè)標(biāo)注流程中最難的部分,因?yàn)樵趯?shí)施過程中會(huì)涉及標(biāo)注、質(zhì)檢、審核、培訓(xùn)、淘汰等多個(gè)環(huán)節(jié)異常情況的處理和反復(fù)循環(huán)??梢哉f,數(shù)據(jù)標(biāo)注是一個(gè)反反復(fù)復(fù)的過程,其原因也就在此。標(biāo)注流程中常見環(huán)節(jié)關(guān)注點(diǎn)及其設(shè)計(jì)本課件是可編輯的正常PPT課件標(biāo)注流程中常見環(huán)節(jié)關(guān)注點(diǎn)及其設(shè)計(jì)本課件是可編輯的正常PPT課件6.結(jié)果反饋結(jié)果反饋是指在部分標(biāo)注結(jié)果實(shí)施完成后,將其反饋給需求方,從而進(jìn)一步確認(rèn)標(biāo)注質(zhì)量。在結(jié)果反饋環(huán)節(jié)設(shè)計(jì)中,主要考慮以下幾點(diǎn)內(nèi)容。(1)反饋節(jié)奏,結(jié)果反饋的頻率是怎樣的?何時(shí)反饋第一批結(jié)果數(shù)據(jù)?(2)反饋流程,反饋確認(rèn)的流程是怎樣的?(3)后續(xù)培訓(xùn),反饋環(huán)節(jié)結(jié)束后項(xiàng)目人員的培訓(xùn)如何進(jìn)行?(4)結(jié)果優(yōu)化,是否需要根據(jù)新的標(biāo)準(zhǔn)重新優(yōu)化結(jié)果?如何優(yōu)化結(jié)果?結(jié)果反饋環(huán)節(jié)也是一個(gè)循環(huán)往復(fù)的反饋確認(rèn)過程,其流程圖如圖2-5所示。標(biāo)注流程中常見環(huán)節(jié)關(guān)注點(diǎn)及其設(shè)計(jì)本課件是可編輯的正常PPT課件
7.收尾階段收尾階段是指在整個(gè)項(xiàng)目的標(biāo)注結(jié)果提交后,針對(duì)項(xiàng)目的后續(xù)整理和配合等工作。收尾階段針對(duì)各個(gè)環(huán)節(jié)進(jìn)行設(shè)計(jì)的關(guān)注點(diǎn)如下。(1)結(jié)果驗(yàn)收,需要準(zhǔn)備哪些驗(yàn)收材料?驗(yàn)收流程如何?驗(yàn)收過程中是否存在問題?如果需要修改標(biāo)注結(jié)果,則該如何實(shí)施?(2)項(xiàng)目整理,需要整理哪些過程數(shù)據(jù)及材料?整理材料的人員分工原則是怎樣的?對(duì)于整理的材料有哪些要求?(3)項(xiàng)目復(fù)盤,項(xiàng)目實(shí)施有哪些優(yōu)缺點(diǎn)?項(xiàng)目過程中發(fā)現(xiàn)了哪些可改進(jìn)點(diǎn)?項(xiàng)目在人員、成本等方面的執(zhí)行情況如何?(4)數(shù)據(jù)銷毀,是否需要數(shù)據(jù)銷毀?數(shù)據(jù)何時(shí)銷毀?由誰進(jìn)行數(shù)據(jù)銷毀?需要注意的是,收尾階段的工作流程對(duì)于操作順序沒有絕對(duì)要求。實(shí)施方根據(jù)實(shí)際情況整理即可。標(biāo)注流程中常見環(huán)節(jié)關(guān)注點(diǎn)及其設(shè)計(jì)本課件是可編輯的正常PPT課件01模型輔助模型輔助是指先利用模型來實(shí)現(xiàn)自動(dòng)標(biāo)注,再由標(biāo)注人員在模型運(yùn)行結(jié)果的基礎(chǔ)上進(jìn)行查漏補(bǔ)缺。一般來說,有效的模型確實(shí)能夠解決大部分標(biāo)注問題,從而大幅度提高標(biāo)注的效率和質(zhì)量實(shí)現(xiàn),也能明顯節(jié)約標(biāo)注的人工成本。03埋雷埋雷是標(biāo)注項(xiàng)目管理中的常用手段,主要能在標(biāo)注系統(tǒng)中發(fā)揮作用。在對(duì)應(yīng)的標(biāo)注項(xiàng)目中配置預(yù)先標(biāo)注好的地雷文件,以此來檢驗(yàn)標(biāo)注人員的標(biāo)注狀態(tài)、標(biāo)注質(zhì)量等。02數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理是從數(shù)據(jù)處理層面對(duì)標(biāo)注實(shí)施的另一種輔助,其原理與模型輔助類似,目的也是減少數(shù)據(jù)標(biāo)注中的人工工作量,提高標(biāo)注質(zhì)量和一致性。標(biāo)注流程中的“技術(shù)賦能”操作本課件是可編輯的正常PPT課件1.標(biāo)注流程中的環(huán)節(jié)越多證明流程越完善很多設(shè)計(jì)者認(rèn)為,標(biāo)注流程是一個(gè)復(fù)雜的過程,要想考慮周到就必須設(shè)計(jì)很多環(huán)節(jié),否則便無法詳細(xì)地展示自己的設(shè)計(jì)。殊不知,流程設(shè)計(jì)完善不等于環(huán)節(jié)多。好的標(biāo)注流程會(huì)讓人感覺“設(shè)計(jì)剛好簡(jiǎn)潔,我剛好能理解”,這種“一切剛剛好”的狀態(tài)才是標(biāo)注流程設(shè)計(jì)的最高境界。2.標(biāo)注流程中設(shè)計(jì)的所有環(huán)節(jié)都必須照做不誤很多人認(rèn)為,標(biāo)注流程的目的是給標(biāo)注實(shí)施起到指導(dǎo)作用,所以標(biāo)注人員要對(duì)標(biāo)注流程中設(shè)計(jì)的環(huán)節(jié)必須照做不誤。這種生搬硬套的做法是不可取的。因?yàn)闃?biāo)注流程設(shè)計(jì)即使再完美,也難免會(huì)出現(xiàn)瑕疵。在了解某一環(huán)節(jié)存在缺陷的情況下,應(yīng)該給予標(biāo)注人員一定的靈活度,允許其根據(jù)實(shí)際情況對(duì)標(biāo)注流程做出取舍或補(bǔ)充。標(biāo)注流程設(shè)計(jì)中的誤區(qū)本課件是可編輯的正常PPT課件3.標(biāo)注流程設(shè)計(jì)已經(jīng)成熟,無限復(fù)制即可在標(biāo)注流程設(shè)計(jì)者行列中,不乏經(jīng)驗(yàn)豐富者。也許設(shè)計(jì)過很多標(biāo)注流程,因此在設(shè)計(jì)過程中常會(huì)步入經(jīng)驗(yàn)至上的誤區(qū),經(jīng)常認(rèn)為即有的標(biāo)注流程設(shè)計(jì)是成熟的流程,適用于所有項(xiàng)目,無限復(fù)制即可。在標(biāo)注流程設(shè)計(jì)中能夠穩(wěn)定且不隨項(xiàng)目特點(diǎn)變化的環(huán)節(jié)只是一部分,而其他部分需要根據(jù)項(xiàng)目特點(diǎn)進(jìn)行靈活調(diào)整。4.標(biāo)注流程設(shè)計(jì)已確定,按照步驟實(shí)施完成項(xiàng)目即可交付這是設(shè)計(jì)者對(duì)標(biāo)注流程設(shè)計(jì)的錯(cuò)誤定義,也是對(duì)標(biāo)注流程設(shè)計(jì)理解不透徹的表現(xiàn)。標(biāo)注流程設(shè)計(jì)是為了使標(biāo)注順利完成,好的流程也能起到?jīng)Q定性作用,但要建立在落實(shí)到位的基礎(chǔ)上。確保標(biāo)注流程有效一方面在于設(shè)計(jì),另一方面在于落實(shí)到位。在標(biāo)注流程的落實(shí)過程中,同樣需要對(duì)落實(shí)情況進(jìn)行跟蹤,只有確保落實(shí)到位,才能順利交付項(xiàng)目。標(biāo)注流程設(shè)計(jì)中的誤區(qū)本課件是可編輯的正常PPT課件04PARTFOUR標(biāo)注規(guī)范設(shè)計(jì)本課件是可編輯的正常PPT課件1.標(biāo)注規(guī)范是綱,是標(biāo)注活動(dòng)的根本依據(jù)眾所周知,標(biāo)注規(guī)范的核心作用是對(duì)標(biāo)注任務(wù)的做法進(jìn)行說明,因此它是標(biāo)注活動(dòng)的基本綱領(lǐng)和行動(dòng)依據(jù),對(duì)標(biāo)注項(xiàng)目的實(shí)施具有指導(dǎo)作用。有了標(biāo)注規(guī)范,標(biāo)注行動(dòng)才有方向,實(shí)施方才能知道如何標(biāo)注。此外,只有按照標(biāo)注規(guī)范實(shí)施標(biāo)注后,得出的標(biāo)注結(jié)果對(duì)解決相關(guān)的問題才有意義,如果不按照標(biāo)注規(guī)范實(shí)施,得到再多的數(shù)據(jù)也只是一堆毫無意義的數(shù)據(jù)。標(biāo)注規(guī)范除了具有指導(dǎo)作用,也具有一定的約束作用。它為參與標(biāo)注任務(wù)的標(biāo)注人員提供了統(tǒng)一的標(biāo)準(zhǔn),從而確保所有標(biāo)注人員按照統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行標(biāo)注,以此保證由不同標(biāo)注人員實(shí)施的結(jié)果也能達(dá)到一致效果。為什么要設(shè)計(jì)標(biāo)注規(guī)范2.標(biāo)注規(guī)范是確保標(biāo)注活動(dòng)一致的重要手段本課件是可編輯的正常PPT課件3.標(biāo)注規(guī)范是衡量標(biāo)注結(jié)果是否符合要求的準(zhǔn)繩標(biāo)注規(guī)范的另一個(gè)作用是構(gòu)成供需雙方統(tǒng)一需求及標(biāo)注標(biāo)準(zhǔn)的依據(jù)。標(biāo)注規(guī)范中對(duì)每個(gè)知識(shí)點(diǎn)的標(biāo)注說明都是經(jīng)過供需雙方統(tǒng)一認(rèn)可的,無論是在實(shí)施方內(nèi)審還是在需求方驗(yàn)收時(shí),都需要以標(biāo)注規(guī)范為依據(jù)來判斷結(jié)果是否符合要求或是否存在需求變更。因此,標(biāo)注規(guī)范的準(zhǔn)繩作用是不容忽視的。除了標(biāo)注規(guī)范本身,設(shè)計(jì)標(biāo)注規(guī)范這項(xiàng)工作本身也意義重大。換句話說,對(duì)標(biāo)注規(guī)范進(jìn)行設(shè)計(jì)也是有意義的,這種意義可以從實(shí)施方、需求方兩個(gè)角度來理解。首先,從實(shí)施方角度來理解。其次,從需求方角度來理解。為什么要設(shè)計(jì)標(biāo)注規(guī)范本課件是可編輯的正常PPT課件010302內(nèi)容要具有實(shí)用性標(biāo)注規(guī)范內(nèi)容的實(shí)用性體現(xiàn)在兩方面:一方面是標(biāo)注規(guī)范所使用的標(biāo)注知識(shí)體系對(duì)解決實(shí)際問題是有效的,這種有效性可以通過實(shí)際應(yīng)用得到驗(yàn)證;另一方面是標(biāo)注規(guī)范中的內(nèi)容設(shè)置能夠?yàn)闃?biāo)注項(xiàng)目提供明確全面的參考,從而確保標(biāo)注項(xiàng)目順利實(shí)施。語言要通俗易懂在標(biāo)注項(xiàng)目中,標(biāo)注規(guī)范的設(shè)計(jì)者與實(shí)施方通常不是同一人,因此在需求理解過程中必然會(huì)出現(xiàn)因知識(shí)背景不同而導(dǎo)致的理解差異。知識(shí)體系要符合常識(shí)和科學(xué)規(guī)律任何問題的解決都要依據(jù)事物的客觀發(fā)展規(guī)律及科學(xué)知識(shí)來進(jìn)行,數(shù)據(jù)標(biāo)注也不例外。標(biāo)注規(guī)范設(shè)計(jì)原則本課件是可編輯的正常PPT課件0405結(jié)構(gòu)邏輯要清晰,突出重點(diǎn)這里的結(jié)構(gòu)主要是指標(biāo)注規(guī)范中各部分內(nèi)容的排列次序及重要程度。在標(biāo)注規(guī)范中,各部分內(nèi)容并不是隨意排列的。每個(gè)人在理解一件事的過程中,其思維都具有一定的邏輯規(guī)律,因此標(biāo)注規(guī)范的內(nèi)容排列也要遵循這個(gè)規(guī)律。處理原則要統(tǒng)一明確一個(gè)標(biāo)注人員真正理解標(biāo)注任務(wù)最直接的表現(xiàn)就是能夠根據(jù)標(biāo)注知識(shí)點(diǎn)總結(jié)出任務(wù)的基本處理原則,此時(shí),標(biāo)注人員與需求方之間才能針對(duì)某一標(biāo)注問題的處理達(dá)成一致意見。所以,在設(shè)計(jì)標(biāo)注規(guī)范的過程中,給出明確統(tǒng)一的處理原則往往能夠縮短標(biāo)注理解的介入期并加快標(biāo)注的進(jìn)程。標(biāo)注規(guī)范設(shè)計(jì)原則本課件是可編輯的正常PPT課件1.標(biāo)注規(guī)范內(nèi)容設(shè)計(jì)標(biāo)注規(guī)范內(nèi)容可以分為兩類:一類是必備內(nèi)容,標(biāo)注規(guī)范中必須設(shè)置的內(nèi)容;另一類是可選內(nèi)容,根據(jù)實(shí)際情況有選擇性地設(shè)置內(nèi)容。一般來說,要想將某個(gè)標(biāo)注任務(wù)講清楚,標(biāo)注規(guī)范中至少應(yīng)包括以下幾項(xiàng)內(nèi)容。(1)標(biāo)注任務(wù)背景,標(biāo)注任務(wù)的用途,標(biāo)注任務(wù)要重點(diǎn)解決什么樣的問題。(2)標(biāo)注目標(biāo),標(biāo)注任務(wù)需要標(biāo)注人員做哪些事情,哪些需要標(biāo)注,哪些不需要標(biāo)注。(3)基本原則,標(biāo)注任務(wù)要遵循的整體原則及沖突情況下的優(yōu)先級(jí)順序。(4)知識(shí)體系,對(duì)標(biāo)注規(guī)則的詳細(xì)解說及知識(shí)點(diǎn)解讀。(5)注意事項(xiàng),在標(biāo)注任務(wù)過程中需要特別注意的要點(diǎn)。這些要點(diǎn)可以是總結(jié)出來的易錯(cuò)點(diǎn),也可以是特殊案例,還可以是對(duì)主要規(guī)則的補(bǔ)充或校正的關(guān)鍵點(diǎn)。(6)標(biāo)注系統(tǒng)操作說明,對(duì)標(biāo)注任務(wù)所依賴的標(biāo)注系統(tǒng)的使用說明。標(biāo)注規(guī)范的設(shè)計(jì)本課件是可編輯的正常PPT課件1.標(biāo)注規(guī)范內(nèi)容設(shè)計(jì)(7)標(biāo)注結(jié)果樣例,其目的是給標(biāo)注人員提供參考,使標(biāo)注人員能夠直觀地看到什么樣的結(jié)果是合格的標(biāo)注結(jié)果。除了上述必備的內(nèi)容,在標(biāo)注規(guī)范中還可以有選擇性地設(shè)置以下內(nèi)容。(1)背景知識(shí),是指與標(biāo)注知識(shí)體系相關(guān)的專業(yè)知識(shí),如什么是實(shí)體等。(2)修訂記錄,對(duì)當(dāng)前標(biāo)注規(guī)范歷史版本的修訂記錄,通常說明每次都更新了哪些內(nèi)容。(3)混淆點(diǎn)解析,對(duì)標(biāo)注人員在標(biāo)注過程中容易混淆的點(diǎn)進(jìn)行辨析,以幫助他們分清相似情況的區(qū)別,從而避免產(chǎn)生混淆。以上為標(biāo)注規(guī)范中的常見內(nèi)容,這些內(nèi)容基本能夠涵蓋標(biāo)注活動(dòng)中可能出現(xiàn)的情況。在實(shí)際制定標(biāo)注規(guī)范的過程中,可以根據(jù)實(shí)際標(biāo)注任務(wù)情況及標(biāo)注人員情況對(duì)內(nèi)容進(jìn)行排序和增、刪、改,從而使標(biāo)注規(guī)范更適用于標(biāo)注任務(wù)。標(biāo)注規(guī)范的設(shè)計(jì)本課件是可編輯的正常PPT課件2.標(biāo)注規(guī)范用語設(shè)計(jì)標(biāo)注規(guī)范用語設(shè)計(jì)主要是對(duì)標(biāo)注規(guī)范中的表述和用詞進(jìn)行控制,從而確保標(biāo)注規(guī)范便于理解。在標(biāo)注規(guī)范行文中,應(yīng)該注意以下設(shè)計(jì)。(1)語言風(fēng)格。標(biāo)注規(guī)范的語言表述要簡(jiǎn)練,用盡量簡(jiǎn)短的語言告訴標(biāo)注人員需要做什么,怎么做,避免長(zhǎng)篇大論,晦澀難懂。(2)用詞習(xí)慣。在標(biāo)注規(guī)范行文中,要盡量使用與標(biāo)注人員文化素質(zhì)相匹配的詞語,避免過多地使用專業(yè)術(shù)語,因?yàn)闃?biāo)注人員在很多情況下并不一定具備相應(yīng)領(lǐng)域的專業(yè)知識(shí),過多的專業(yè)術(shù)語可能會(huì)造成標(biāo)注人員的理解障礙。如果必須使用專業(yè)術(shù)語,則建議在相應(yīng)專業(yè)術(shù)語的后面添加注釋。標(biāo)注規(guī)范的設(shè)計(jì)本課件是可編輯的正常PPT課件3.知識(shí)體系設(shè)計(jì)這里的知識(shí)體系是指標(biāo)注項(xiàng)目所依賴的核心標(biāo)注規(guī)則。知識(shí)體系的設(shè)計(jì)是一項(xiàng)很難的工作。因?yàn)槊總€(gè)標(biāo)注任務(wù)所涉及的領(lǐng)域不同,需要設(shè)計(jì)者具備的專業(yè)背景知識(shí)也不同。(1)需要確定標(biāo)注任務(wù)所屬的專業(yè)領(lǐng)域和應(yīng)用背景。確定專業(yè)領(lǐng)域和應(yīng)用背景是設(shè)計(jì)知識(shí)體系的第一步,它相當(dāng)于給知識(shí)體系設(shè)計(jì)指明了方向。只有先了解了領(lǐng)域和應(yīng)用背景,才能以這些為基礎(chǔ)將知識(shí)點(diǎn)逐層剝離出來。(2)需要基于專業(yè)領(lǐng)域和應(yīng)用背景將知識(shí)點(diǎn)逐層剝離。對(duì)專業(yè)領(lǐng)域和應(yīng)用背景進(jìn)行剖析的過程并不是隨便可以完成的,需要精通領(lǐng)域應(yīng)用知識(shí)的專家介入。這樣一方面可以保證知識(shí)體系的準(zhǔn)確性,另一方面也能確保知識(shí)體系的實(shí)用性。至于專家的具體介入方式,可以依據(jù)具體情況而定。(3)需要做好知識(shí)體系的整理工作。在將知識(shí)點(diǎn)剝離出來后,需要按照劃分的體系進(jìn)行整理,從而使其形成體系化的知識(shí)。(4)需要做好知識(shí)驗(yàn)證和修改更新工作。標(biāo)注任務(wù)中的知識(shí)體系并不是整理完成即可,還需要通過標(biāo)注和應(yīng)用過程進(jìn)行驗(yàn)證,并對(duì)存在的缺陷和不足進(jìn)行修改,直至確認(rèn)該知識(shí)體系適用為止。標(biāo)注規(guī)范的設(shè)計(jì)本課件是可編輯的正常PPT課件4.標(biāo)注規(guī)范結(jié)構(gòu)設(shè)計(jì)標(biāo)注規(guī)范結(jié)構(gòu)設(shè)計(jì)是指標(biāo)注規(guī)范中內(nèi)容順序及標(biāo)注規(guī)范脈絡(luò)的設(shè)計(jì)。標(biāo)注規(guī)范結(jié)構(gòu)設(shè)計(jì)主要是遵循標(biāo)注任務(wù)的邏輯順序。在通常情況下,標(biāo)注任務(wù)的邏輯順序如下。第1,標(biāo)注任務(wù)是什么。即需要做什么。第2,標(biāo)注任務(wù)背后的原因或背景。即為什么要做這個(gè)標(biāo)注任務(wù)。第3,標(biāo)注任務(wù)做法。即標(biāo)注任務(wù)怎么做。第4,標(biāo)注任務(wù)所依賴的工具和實(shí)施過程是怎樣的。第5,整體處理原則。即標(biāo)注任務(wù)沖突的整體處理原則和優(yōu)先順序。第6,標(biāo)注任務(wù)實(shí)施過程中的注意事項(xiàng)。即什么情況會(huì)導(dǎo)致錯(cuò)誤。第7,標(biāo)注任務(wù)合格的標(biāo)準(zhǔn)。即標(biāo)注任務(wù)做成什么樣是符合要求的?;谝陨线壿嬳樞颍梢钥偨Y(jié)出的標(biāo)注規(guī)范結(jié)構(gòu)設(shè)計(jì)的邏輯順序?yàn)闃?biāo)注目標(biāo)→標(biāo)注任務(wù)背景→知識(shí)體系→標(biāo)注系統(tǒng)操作說明→基本原則→注意事項(xiàng)→標(biāo)注樣例。需要注意的是,該脈絡(luò)結(jié)構(gòu)為標(biāo)注規(guī)范的常見結(jié)構(gòu),在實(shí)際標(biāo)注任務(wù)過程中,也可以隨著內(nèi)容模塊的增減及目標(biāo)對(duì)象的思維習(xí)慣而改變。標(biāo)注規(guī)范的設(shè)計(jì)本課件是可編輯的正常PPT課件
5.標(biāo)注規(guī)范處理原則設(shè)計(jì)標(biāo)注規(guī)范處理原則設(shè)計(jì)是指確定標(biāo)注任務(wù)的整體處理原則,即確定標(biāo)注中各種情況下的取舍原則或標(biāo)注考慮的優(yōu)先順序等。標(biāo)注規(guī)范處理原則的確定可能與以下因素有關(guān)。(1)實(shí)際應(yīng)用問題解決過程中的側(cè)重點(diǎn)。在實(shí)際應(yīng)用過程中,如果某方面呈現(xiàn)出的性能較弱,則可能在標(biāo)注過程中重點(diǎn)強(qiáng)調(diào)或優(yōu)先考慮。例如,設(shè)置標(biāo)簽優(yōu)先級(jí)、優(yōu)先保證多樣性或要求將所有指代還原等。(2)結(jié)果數(shù)據(jù)的長(zhǎng)遠(yuǎn)應(yīng)用。有些標(biāo)注項(xiàng)目并非專門針對(duì)某一個(gè)標(biāo)注任務(wù)而設(shè)計(jì),標(biāo)注出來的結(jié)果數(shù)據(jù)也可能會(huì)供后續(xù)使用。此時(shí),通常會(huì)設(shè)置非常細(xì)致的標(biāo)注原則,以備后續(xù)擴(kuò)充數(shù)據(jù)使用。(3)標(biāo)注成本。有些標(biāo)注項(xiàng)目從0開始標(biāo)注成本極高,但如果使用現(xiàn)有可用數(shù)據(jù)進(jìn)行篩選并結(jié)合小幅度修改,則可以大幅度降低標(biāo)注成本,所以此時(shí)通常會(huì)設(shè)定篩選大于修改的原則。影響處理原則的因素還有很多,在實(shí)際標(biāo)注任務(wù)中,可以依據(jù)標(biāo)注項(xiàng)目本身的側(cè)重點(diǎn)和其他特點(diǎn)設(shè)計(jì)不同的處理原則。此外,標(biāo)注規(guī)范中需要設(shè)計(jì)的方面也不僅有這些,我們需要在實(shí)際過程中不斷分析和發(fā)現(xiàn),從而使標(biāo)注規(guī)范設(shè)計(jì)更加合理、完善。標(biāo)注規(guī)范的設(shè)計(jì)本課件是可編輯的正常PPT課件01設(shè)計(jì)標(biāo)注規(guī)范只需設(shè)計(jì)知識(shí)體系標(biāo)注行業(yè)的很多人都會(huì)將標(biāo)注規(guī)范等同于標(biāo)注知識(shí)體系。但實(shí)際上,這兩者并不相同,主要在于兩者側(cè)重點(diǎn)不同。03標(biāo)注規(guī)范設(shè)計(jì)得越復(fù)雜,證明標(biāo)注規(guī)范越全面標(biāo)注規(guī)范設(shè)計(jì)的全面性固然重要,但是也要考慮受眾程度及各部分內(nèi)容的必要性。02標(biāo)注規(guī)范在整個(gè)標(biāo)注過程中是一勞永逸的標(biāo)注規(guī)范的重點(diǎn)是體現(xiàn)標(biāo)注任務(wù)需求,因此會(huì)隨著標(biāo)注任務(wù)不同時(shí)期的需求定義變化而變化。標(biāo)注規(guī)范設(shè)計(jì)應(yīng)該是一個(gè)動(dòng)態(tài)變化的過程,并非一成不變。標(biāo)注規(guī)范設(shè)計(jì)中的誤區(qū)本課件是可編輯的正常PPT課件05PARTFIVE標(biāo)注系統(tǒng)設(shè)計(jì)本課件是可編輯的正常PPT課件為什么要設(shè)計(jì)標(biāo)注系統(tǒng)1.為標(biāo)注工作提供直觀的實(shí)施界面第2章隨著行業(yè)的發(fā)展,現(xiàn)如今的數(shù)據(jù)標(biāo)注無論是從要求上還是從難度上都已經(jīng)遠(yuǎn)超最初的標(biāo)準(zhǔn)。如此高質(zhì)量、高要求的標(biāo)注任務(wù)沒有標(biāo)注系統(tǒng)的支持是無法完成的。標(biāo)注系統(tǒng)對(duì)于標(biāo)注任務(wù)來說,最直接的作用就是為標(biāo)注工作提供了直觀可視的實(shí)施界面,同時(shí)通過標(biāo)注系統(tǒng)替代一部分人工勞動(dòng),從操作層面降低標(biāo)注的難度,使高標(biāo)準(zhǔn)、高難度、操作煩瑣的標(biāo)注任務(wù)實(shí)施成為可能。2.便于標(biāo)注項(xiàng)目實(shí)施過程的管理、記錄和監(jiān)控標(biāo)注系統(tǒng)中的各項(xiàng)數(shù)據(jù)的統(tǒng)計(jì)功能能夠使管理者及時(shí)管理、記錄和監(jiān)控標(biāo)注項(xiàng)目的實(shí)施進(jìn)度、質(zhì)量、異常等情況,從而便于管理者根據(jù)實(shí)際情況對(duì)標(biāo)注項(xiàng)目所涉及的人員、工具、數(shù)據(jù)等因素進(jìn)行及時(shí)增、刪、改、啟用、禁用等操作,同時(shí)減少了管理者在管理、記錄和監(jiān)控方面的投入。本課件是可編輯的正常PPT課件為什么要設(shè)計(jì)標(biāo)注系統(tǒng)3.有效提高標(biāo)注效率對(duì)于標(biāo)注任務(wù)來說,標(biāo)注系統(tǒng)起到的不僅是降低標(biāo)注項(xiàng)目難度的作用,還有簡(jiǎn)化操作、智能標(biāo)注等作用,這些都能從根本上減少標(biāo)注中的人工操作強(qiáng)度,從而極大地提高標(biāo)注效率,降低標(biāo)注成本。4.切實(shí)保證數(shù)據(jù)安全標(biāo)注系統(tǒng)中的數(shù)據(jù)管理權(quán)限設(shè)置相當(dāng)于對(duì)數(shù)據(jù)的入口和出口進(jìn)行了統(tǒng)一,這樣能夠有效地避免數(shù)據(jù)外流,從而保證數(shù)據(jù)安全。5.有利于保證標(biāo)注質(zhì)量和一致性標(biāo)注系統(tǒng)對(duì)標(biāo)注質(zhì)量和一致性的保證主要包括兩方面:一方面是完善的流程設(shè)計(jì);另一方面是技術(shù)手段的加持。6.提高標(biāo)注項(xiàng)目溝通效率、降低溝通成本標(biāo)注系統(tǒng)中的消息通知、反饋、批注等功能的精心設(shè)計(jì)不僅能夠?qū)⑿枰嬷獦?biāo)注人員的事項(xiàng)及時(shí)地傳達(dá)給標(biāo)注人員,還能夠保證傳達(dá)效果。本課件是可編輯的正常PPT課件
1.靈活性原則靈活性原則是指標(biāo)注系統(tǒng)設(shè)計(jì)要在合理的情況下盡量減少對(duì)用戶的限制,讓用戶在標(biāo)注系統(tǒng)中能實(shí)現(xiàn)多元化的操作。對(duì)于標(biāo)注系統(tǒng)來說,設(shè)計(jì)的靈活性主要體現(xiàn)在以下幾點(diǎn)。(1)功能配置靈活。標(biāo)注系統(tǒng)中的菜單、按鈕、標(biāo)注工具等功能能讓用戶根據(jù)自身喜好或項(xiàng)目情況等進(jìn)行靈活設(shè)置和控制。(2)用戶操作靈活。對(duì)同一功能或界面的控制允許用戶通過多種途徑或方式實(shí)現(xiàn)。例如,在與某一功能相關(guān)聯(lián)的界面提供快捷入口。(3)管理操作靈活。標(biāo)注系統(tǒng)對(duì)用戶角色、權(quán)限、人員配置、項(xiàng)目設(shè)置、異常處理等的管理操作非常靈活,能夠根據(jù)實(shí)際需要進(jìn)行靈活設(shè)置。標(biāo)注系統(tǒng)設(shè)計(jì)原則本課件是可編輯的正常PPT課件標(biāo)注系統(tǒng)設(shè)計(jì)原則2.一致性原則
一致性原則是指標(biāo)注系統(tǒng)中對(duì)界面、流程、邏輯等設(shè)計(jì)要保持一致。標(biāo)注系統(tǒng)的一致性主要體現(xiàn)在以下幾點(diǎn)。(1)界面設(shè)置一致。標(biāo)注系統(tǒng)中各界面的風(fēng)格、色彩、同類用途界面的基本功能、圖標(biāo)位置等設(shè)置要保持一致,只有界面設(shè)置一致才能讓整個(gè)標(biāo)注系統(tǒng)形成一個(gè)整體。(2)任務(wù)流轉(zhuǎn)一致。標(biāo)注系統(tǒng)針對(duì)所有任務(wù)要有統(tǒng)一的流轉(zhuǎn)規(guī)則和流程,對(duì)異常情況的處理也要有統(tǒng)一的處理機(jī)制和規(guī)則。任務(wù)流轉(zhuǎn)一致是保證標(biāo)注實(shí)施流程形成良性循環(huán)的前提。(3)操作邏輯一致。標(biāo)注系統(tǒng)對(duì)同一功能的操作順序及實(shí)現(xiàn)方式要保持一致。例如,對(duì)于標(biāo)注系統(tǒng)中所有多級(jí)標(biāo)簽的選擇,可以全部采用級(jí)聯(lián)方式,也可以全部不采用級(jí)聯(lián)方式。需要注意的是,不可以采用部分級(jí)聯(lián)、部分不級(jí)聯(lián)的方式。本課件是可編輯的正常PPT課件3.容錯(cuò)性原則允許用戶在使用標(biāo)注系統(tǒng)的過程中誤操作并使其擁有更正的機(jī)會(huì)。容錯(cuò)是標(biāo)注系統(tǒng)設(shè)計(jì)的最基本要求。標(biāo)注系統(tǒng)設(shè)計(jì)的容錯(cuò)性主要體現(xiàn)在以下幾點(diǎn)。(1)動(dòng)作可逆性。在用戶出現(xiàn)錯(cuò)誤操作時(shí)允許進(jìn)行撤銷、回退、修改等操作。(2)留存歷史操作。當(dāng)用戶有流程未走完的操作時(shí),幫助保存歷史操作記錄,以便在用戶重新進(jìn)入后能夠找到該操作任務(wù),從而進(jìn)一步完成編輯操作。(3)錯(cuò)誤操作提示。當(dāng)用戶進(jìn)行刪除、退出等可能造成不可逆后果的操作時(shí),標(biāo)注系統(tǒng)給予必要的提示,從而提醒用戶使其有補(bǔ)救的機(jī)會(huì)。標(biāo)注系統(tǒng)設(shè)計(jì)原則本課件是可編輯的正常PPT課件標(biāo)注系統(tǒng)設(shè)計(jì)原則4.易用性原則易用比較容易理解,是指標(biāo)注系統(tǒng)使用起來方便。標(biāo)注系統(tǒng)的易用性主要體現(xiàn)在以下幾點(diǎn)。(1)符合操作習(xí)慣。標(biāo)注系統(tǒng)的操作順序及功能設(shè)置要符合用戶的正常操作習(xí)慣。以標(biāo)注任務(wù)實(shí)施頁面為例,用戶的操作習(xí)慣通常是從上到下、從左到右的。(2)操作界面設(shè)置簡(jiǎn)潔。操作界面不花哨,主要功能排列有序且重點(diǎn)突出,能讓用戶很容易地找到所需要的功能。(3)減少操作頻率。標(biāo)注系統(tǒng)設(shè)計(jì)要盡量減少用戶的手動(dòng)操作頻率,因?yàn)閷?duì)于標(biāo)注任務(wù)來說,標(biāo)注人員每節(jié)省一步操作不僅能提高工作效率和產(chǎn)能
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年社區(qū)團(tuán)購團(tuán)長(zhǎng)五年市場(chǎng)競(jìng)爭(zhēng)與差異化策略報(bào)告
- 國(guó)家智慧教育云平臺(tái)在教育資源均衡配置中的實(shí)踐與啟示研究教學(xué)研究課題報(bào)告
- 2024年江西農(nóng)業(yè)大學(xué)南昌商學(xué)院馬克思主義基本原理概論期末考試模擬試卷
- 2024年云南司法警官職業(yè)學(xué)院馬克思主義基本原理概論期末考試筆試題庫
- 2024年青海大學(xué)馬克思主義基本原理概論期末考試模擬試卷
- 2025年江西管理職業(yè)學(xué)院馬克思主義基本原理概論期末考試參考題庫
- 2024年烏海職業(yè)技術(shù)學(xué)院馬克思主義基本原理概論期末考試真題匯編
- 2024年石家莊鐵路職業(yè)技術(shù)學(xué)院馬克思主義基本原理概論期末考試真題匯編
- 2024年哈爾濱劍橋?qū)W院馬克思主義基本原理概論期末考試筆試題庫
- 2024年首鋼工學(xué)院馬克思主義基本原理概論期末考試筆試真題匯編
- 2025年中華人民共和國(guó)食品安全法培訓(xùn)考試試題及答案
- 潛孔錘鉆進(jìn)技術(shù)施工方案
- 藥廠管理人員述職
- (12)普通高中技術(shù)與工程課程標(biāo)準(zhǔn)日常修訂版(2017年版2025年修訂)
- 【正版授權(quán)】 ISO 11154:2023/Amd 1:2025 EN Road vehicles - Roof load carriers - Amendment 1
- 鐵路保密知識(shí)培訓(xùn)講義課件
- 海南國(guó)際商業(yè)航天發(fā)射有限公司筆試題
- 2025上海市自強(qiáng)社會(huì)服務(wù)總社招聘禁毒社會(huì)工作者7人考試參考題庫及答案解析
- GB/T 46161.1-2025道路車輛氣壓制動(dòng)系第1部分:管、端面密封外螺紋接頭和螺紋孔
- 福建省漳州市2024-2025學(xué)年七年級(jí)上學(xué)期期末考試英語試題(A)
- 《數(shù)據(jù)標(biāo)注工程-語言知識(shí)與應(yīng)用》中職數(shù)據(jù)標(biāo)注全套教學(xué)課件
評(píng)論
0/150
提交評(píng)論