T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標注技術(shù)要求 第2部分:紋樣標注_第1頁
T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標注技術(shù)要求 第2部分:紋樣標注_第2頁
T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標注技術(shù)要求 第2部分:紋樣標注_第3頁
T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標注技術(shù)要求 第2部分:紋樣標注_第4頁
T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標注技術(shù)要求 第2部分:紋樣標注_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

ICS35.240.01CCSL70T/CPRA200.2—2024文化資源數(shù)據(jù)與數(shù)字內(nèi)容標注技術(shù)要求第2部分:紋樣標注TechnicalrequirementsforculturalresourcesdataanddigitalcontentannotationPart2:Patternannotation中國公共關(guān)系協(xié)會文化大數(shù)據(jù)產(chǎn)業(yè)委員會發(fā)布I 2規(guī)范性引用文件 3術(shù)語和定義 3.1文化元素 3.2文化數(shù)字內(nèi)容 3.3文化資源數(shù)據(jù) 3.4紋樣 3.5標注 3.6紋樣標注 4紋樣分類 5紋樣標注流程 6標注預(yù)處理 46.1預(yù)處理輸入數(shù)據(jù)要求 46.2預(yù)處理方法 47紋樣數(shù)據(jù)標注 47.1紋樣數(shù)據(jù)標注算法要求 7.2紋樣數(shù)據(jù)標注功能要求 8標注結(jié)果評價 8.1紋樣標注結(jié)果質(zhì)量要求 8.2主觀評價方法 8.3客觀評價方法 本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔識別專利的責任。本文件由中國公共關(guān)系協(xié)會文化大數(shù)據(jù)產(chǎn)業(yè)委員會提出并歸口。本文件起草單位:北京郵電大學、北京玖揚科技有限公司、伏羲云(北京)文化科技有限公本文件主要起草人:徐坤、高凱、趙海英、薛曉鵬、侯小剛、尹暉、周月、徐鵬舉、王梓舟、于振明、崔義娜、陳磊、劉志軍、李媛媛。1文化資源數(shù)據(jù)與數(shù)字內(nèi)容標注技術(shù)要求第2部分:紋樣標注本文件規(guī)定了國家文化大數(shù)據(jù)體系中文化資源數(shù)據(jù)與數(shù)字內(nèi)容紋樣標注的技術(shù)要求,包括紋樣分類、紋樣標注流程、標注預(yù)處理、紋樣數(shù)據(jù)標注和標注結(jié)果評價等技術(shù)要求。本文件適用于國家文化大數(shù)據(jù)體系中文化資源數(shù)據(jù)與數(shù)字內(nèi)容紋樣標注工具的設(shè)計和研發(fā)。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T1.1—2020標準化工作導則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則T/CPRA1—2021國家文化大數(shù)據(jù)標準體系T/CPRA300—2023文化數(shù)字內(nèi)容分類與代碼T/CPRA301—2023文化資源數(shù)據(jù)分類與代碼3術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1文化元素culturalelement是組成文化的最小功能單元,具有獨特的文化內(nèi)涵,例如,一只茶杯、一張弓、一個動作和一個符號等都是文化元素。由于最小功能單元的確定是相對的,故文化元素亦有可組合性、多樣性、不確定性等特征。在國家文化大數(shù)據(jù)體系下,文化元素特指文化資源數(shù)據(jù)和文化數(shù)字內(nèi)容等的最小數(shù)字化功能單元,體現(xiàn)了數(shù)字文化作品中組成內(nèi)容的獨特性,一般采用技法將文字、線稿、色彩、形態(tài)、聲音等文化要素進行組合的方式存在,且意蘊深遠,具有極強的符號性特征,它們不僅是傳統(tǒng)文化的象征,也是文化精神的凝聚。文化元素不僅能體現(xiàn)文化本體價值,更能展現(xiàn)文化元素發(fā)展演化規(guī)律。通過對文化數(shù)據(jù)重構(gòu),可提取這些凝結(jié)在文化中共性的、具有很強識別性的、能引起目標群體感知和想象的視覺符號。各種文化元素之間經(jīng)過關(guān)聯(lián)、標注、重構(gòu)等加工,可進一步提升文化元素價值。[來源:T/CPRA3100.1—2022定義3.1.1]3.2文化數(shù)字內(nèi)容culturaldigitalcontent以數(shù)字形式存在的文化產(chǎn)品,一般以文字、圖片、音頻、視頻、多媒體和其他形式表現(xiàn)。通常包括傳統(tǒng)文化產(chǎn)品的數(shù)字化以及以數(shù)字形式存在的文化產(chǎn)品。國家文化大數(shù)據(jù)體系下文化數(shù)字2內(nèi)容主要涵蓋中華優(yōu)秀傳統(tǒng)文化、革命文化和社會主義先進文化等。文化數(shù)字內(nèi)容作為數(shù)字化文化生產(chǎn)線的產(chǎn)出,由文化大數(shù)據(jù)服務(wù)平臺管理與分發(fā),并通過文化體驗設(shè)施和設(shè)備消費。通常情況下,文化數(shù)字內(nèi)容又稱為文化數(shù)字產(chǎn)品、文化數(shù)字內(nèi)容產(chǎn)品等。[來源:T/CPRA300—2023定義3.1.1]3.3文化資源數(shù)據(jù)culturalresourcesdata對人類文化中傳承下來并可以傳播利用的文化(包括物質(zhì)的和非物質(zhì)的)進行數(shù)字化采集后,所得到的用于識別和展現(xiàn)文化的圖像、文字、聲音、動畫、影片、三維全景、三維模型等數(shù)據(jù)。國家文化大數(shù)據(jù)體系下文化資源數(shù)據(jù)主要包括中國文化遺產(chǎn)標本庫、中華民族文化基因庫、中華文化素材庫中的數(shù)據(jù)。[來源:T/CPRA301—2023定義3.1.1]3.4紋樣pattern紋樣是文化元素的子類,指主要被用作服飾、建筑、器皿等物體的裝飾,并具有語義、寓意、歷史發(fā)展軌跡、地域特點、民族特色的花紋、形狀等。[來源:T/CPRA3101.1—2022定義3.1.4]3.5標注annotation對不同文化元素、文化要素標示注記,不僅僅包括紋樣、色彩、構(gòu)型、風格的標注,還包括深層次的語義信息的打標。在國家文化大數(shù)據(jù)標準體系中,標注將實現(xiàn)數(shù)據(jù)底層的工作,并與采集、關(guān)聯(lián)、解構(gòu)、重構(gòu)等關(guān)鍵技術(shù)共同服務(wù)于上層應(yīng)用。3.6紋樣標注patternannotation是對文化元素中的紋樣元素、紋樣要素或紋樣基因進行標注的過程。結(jié)合現(xiàn)代科技,克服手動標注的弊端,實現(xiàn)紋樣標簽的自動標注,不僅僅實現(xiàn)對紋樣本身的標注,也要對其語義等信息進行打標。4紋樣分類紋樣分類如下表所示:表1紋樣分類表序號類名描述1動物紋是一種以各種動物形象為基礎(chǔ),經(jīng)過藝術(shù)加工和變形而形成的裝飾性紋樣,常被運用在陶瓷、織物、雕刻等傳統(tǒng)藝術(shù)形式中,反映了人們對動物的觀察與想象,以及對美好生活的向往和寄托。2人物紋以人物的形象和活動為主題,運用細膩且傳神的線條刻畫人物的姿態(tài)、神情與動作。33幾何紋幾何紋樣是一種以點、線、面等幾何元素為基本構(gòu)成單位,通過有規(guī)律或富有創(chuàng)意的組合、排列、變化而形成的裝飾性圖案。4植物紋是一種以各類植物的形態(tài)、花朵、枝葉等為創(chuàng)作素材,經(jīng)過藝術(shù)提煉和設(shè)計,展現(xiàn)出植物的自然美與象征意義,廣泛用于傳統(tǒng)裝飾藝術(shù)彰顯生機與美好的紋樣。5敘事紋是一種以敘述故事、情節(jié)或事件為主要內(nèi)容,通過生動的圖案和形象組合展現(xiàn)完整敘事過程,常傳遞特定文化內(nèi)涵和價值觀念,常見于傳統(tǒng)裝飾藝術(shù)承載歷史與文化記憶的紋樣。6是一種取材于自然界中的各種元素,如山石、水流、日月星辰、風云雷電等,經(jīng)過藝術(shù)加工和構(gòu)思,展現(xiàn)大自然的神奇與魅力,常出現(xiàn)在傳統(tǒng)裝飾藝術(shù)中體現(xiàn)對自然敬畏與熱愛的紋樣。7器物紋是一種以各類傳統(tǒng)器物的形態(tài)和特征為靈感來源,經(jīng)過藝術(shù)加工和變形,展現(xiàn)獨特美感和文化內(nèi)涵,廣泛應(yīng)用于傳統(tǒng)裝飾藝術(shù)領(lǐng)域的紋樣。5紋樣標注流程如圖1所示,紋樣標注流程包括標注預(yù)處理、紋樣數(shù)據(jù)標注、標注結(jié)果評價3個環(huán)節(jié)。各環(huán)節(jié)具體要求及相互關(guān)系如下:圖1紋樣標注流程a)標注預(yù)處理:該環(huán)節(jié)針對輸入圖像使用數(shù)字化、幾何變換、歸一化、平滑、復原、增強等方法,消除圖像中無關(guān)的信息,恢復有用的真實信息,增強有關(guān)信息的可檢測性,最大限度地簡化數(shù)據(jù),增強標注的可靠性。b)數(shù)據(jù)標注:對處理后的數(shù)據(jù),選擇適當?shù)臉俗⒎椒ㄟM行標注,輸出帶有標注信息的紋樣c)紋樣標注結(jié)果評價:對已標注的紋樣圖像結(jié)果,采用主觀評價、客觀評價方法對其質(zhì)量4進行定性、定量分析,根據(jù)評價結(jié)果優(yōu)化標注方法。6標注預(yù)處理6.1預(yù)處理輸入數(shù)據(jù)要求輸入紋樣圖像數(shù)據(jù)應(yīng)滿足以下要求:a)宜使用TIF、JPG或PNG格式圖片;b)圖像分辨率應(yīng)大于256*256;c)應(yīng)使用RGB色彩模式存儲的數(shù)據(jù);d)應(yīng)大于8位或16位色彩存儲;e)圖像應(yīng)完整記錄紋樣完整面貌、造型、結(jié)構(gòu);f)圖像清晰,色彩均衡,文化元素透視無畸變;g)應(yīng)具備基本的元數(shù)據(jù);h)應(yīng)保持原紋樣的完整性。6.2預(yù)處理方法6.2.1二維圖像噪聲去除二維圖像噪聲去除的主要功能包括:a)分析二維圖像噪聲源并進行噪聲去除;b)支持各種類型圖像的噪聲去除,并且盡可能不對原始圖像內(nèi)容做改變;c)去除噪聲后二維圖像可以還原成原圖像。6.2.2二維圖像光照平衡二維圖像光照平衡應(yīng)符合以下技術(shù)要求:a)支持各種類型圖像的縮放,并且盡可能不對原始圖像內(nèi)容做改變;b)盡可能從原圖中消除光照不均勻的影響;c)光照均衡后的圖像能夠滿足各類測評指標。6.2.3預(yù)處理結(jié)果數(shù)據(jù)要求預(yù)處理結(jié)果應(yīng)符合以下技術(shù)要求:a)光照平衡,宜采用能自適應(yīng)多種類別圖像的算法進行處理;b)圖像清晰,宜采用圖像自適應(yīng)超分算法進行預(yù)處理;c)信噪比SNR>20;d)峰值信噪比PSNR>30;e)均方誤差MSE<400。7紋樣數(shù)據(jù)標注57.1紋樣數(shù)據(jù)標注算法要求紋樣數(shù)據(jù)標注算法具體應(yīng)符合以下技術(shù)要求:a)宜準確地對每一個圖像紋樣元素名稱進行標注;b)宜進一步對紋樣的文本特征(如紋樣周圍文本內(nèi)容)以及深層次的語義信息(如寓意)等進行標注;c)對于需要定位區(qū)域的標注方法,定位區(qū)域應(yīng)在合理的位置,標注內(nèi)容無冗余、無重疊;d)對于手工標注數(shù)據(jù),專業(yè)人士標注每張圖像所需時間應(yīng)≤5min;e)對于自動標注數(shù)據(jù),每張圖像所需時間應(yīng)≤100ms;f)對于不屬于原始數(shù)據(jù)集類別的紋樣種類或者非紋樣數(shù)據(jù),宜給出相應(yīng)的提示信息;g)標注詞應(yīng)不少于5個;h)標注類別應(yīng)不少于3類;i)對于訓練數(shù)據(jù)集不足的情況,宜采用數(shù)據(jù)增強的方法。7.2紋樣數(shù)據(jù)標注功能要求紋樣數(shù)據(jù)標注工具應(yīng)符合以下功能要求:a)標注應(yīng)具有可視化界面;b)應(yīng)支持自動標注、半自動標注,宜對標注結(jié)果進行人工評判,并且能對自動標注結(jié)果與人工參與部分進行區(qū)分;c)宜具有數(shù)據(jù)統(tǒng)計功能,支持對未標注和已標注數(shù)據(jù)的統(tǒng)計結(jié)果進行圖表顯示,包括柱狀圖顯示、餅圖顯示等;d)標注工具宜具有日志記錄功能;e)應(yīng)具備安全功能,譬如加密存儲數(shù)據(jù)、對用戶標識并進行相應(yīng)的訪問控制。8標注結(jié)果評價8.1紋樣標注結(jié)果質(zhì)量要求紋樣標注后的結(jié)果應(yīng)滿足以下要求:a)紋樣標注的內(nèi)容應(yīng)與實際內(nèi)容相一致;b)同一個算法對同一張紋樣圖像執(zhí)行相同操作之后得到的結(jié)果應(yīng)一致;c)圖像若發(fā)生變化,輸出的結(jié)果應(yīng)與未變化時保持一致。圖像內(nèi)容發(fā)生實質(zhì)變化的情況除d)對于單標簽圖像的紋樣標注,準確率(Accuracy)應(yīng)>=90%;e)對于多標簽圖像的紋樣標注,平均準確率(AveragePrecision)應(yīng)>=75%。8.2主觀評價方法以人的主觀感知來評價二維圖像標注結(jié)果,宜采用以下指標:a)內(nèi)容準確性:以人的主觀判斷來感知紋樣標注內(nèi)容正確與否,為簡單起見,僅關(guān)注所標注紋樣的名稱是否正確;6b)方法穩(wěn)定性:同一張紋樣圖像經(jīng)過同一種標注方法前后兩次所得到的結(jié)果應(yīng)一致,不能出現(xiàn)兩次標注結(jié)果不同的情況。譬如文件名稱發(fā)生變化等,輸出的結(jié)果不應(yīng)發(fā)生變化。紋樣圖像發(fā)生實質(zhì)性變化(如某個紋樣被剔除、增加了某種紋樣等)的情況除外;c)交互體驗性:用戶的體驗對于系統(tǒng)的設(shè)計和開發(fā)至關(guān)重要,一個紋樣標注系統(tǒng)除了依托標注算法實現(xiàn)最基本的功能以外,必須考慮用戶在使用過程中的體驗感受。以紋樣數(shù)據(jù)標注算法和標注功能要求為主,考察系統(tǒng)的交互體驗性,進行分級量化打分;d)系統(tǒng)持久性:經(jīng)過標注算法標注的紋樣數(shù)據(jù)應(yīng)持久化的保存,標注之后的結(jié)果應(yīng)契合持久化的需求。持久化模塊可作為標注系統(tǒng)的重要組成部分,在主觀評價中可作為加分項。主觀評價方法采用人工打分表的方式,對一幅圖像標注的結(jié)果進行打分,打分后,首先依據(jù)表2計算加權(quán)值,去掉最低分和最高分,最后按照平均值排序(權(quán)重根據(jù)標注需求取值0-1之間)。表2紋樣標注效果指標表描述詞內(nèi)容準確性30方法穩(wěn)定性30交互體驗性20系統(tǒng)持久性208.3客觀評價方法客觀評估使用數(shù)學模型給出紋樣標注質(zhì)量的量化值。客觀評價作為評判標注模型性能的主要工具,其中很多指標并非人眼能夠直接的觀察得到,在這里通過量化指標來計算出算法的優(yōu)劣,并作為反饋,用于進一步優(yōu)化算法模型。對于單標簽的紋樣標注,宜采用準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1分數(shù)(F1score)等作為評價方法;對于多標簽的紋樣標注,采用基于樣本的排序指標:平均精度(AveragePrecision)、1-錯誤率(One-Error)、覆蓋率(Coverage)、排序損失(Ranki等作為評價方法。具體指標計算要求如下:a)準確率(Accuracy):正確分類的樣本個數(shù)占總樣本個數(shù),值越大越好。TP+TNTP+FN+FP+TNAccuracyTP+FN+FP+TN其中,TP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論