DB15∕T 2021.1-2020 草原大數(shù)據(jù) 第1部分:基礎數(shù)據(jù)_第1頁
DB15∕T 2021.1-2020 草原大數(shù)據(jù) 第1部分:基礎數(shù)據(jù)_第2頁
DB15∕T 2021.1-2020 草原大數(shù)據(jù) 第1部分:基礎數(shù)據(jù)_第3頁
DB15∕T 2021.1-2020 草原大數(shù)據(jù) 第1部分:基礎數(shù)據(jù)_第4頁
DB15∕T 2021.1-2020 草原大數(shù)據(jù) 第1部分:基礎數(shù)據(jù)_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

ICS35.240CCSL70DB15內(nèi)蒙古自治區(qū)市場監(jiān)督管理局IDB15/T2021.1—2020前言 12規(guī)范性引用文件 13術語和定義 14總則 65草原大數(shù)據(jù)標準體系基本框架 76草原大數(shù)據(jù)元數(shù)據(jù)屬性的描述方法 97草原大數(shù)據(jù)標識類屬性 98草原大數(shù)據(jù)技術 9數(shù)據(jù)質(zhì)量評估流程與評價方法 10草原大數(shù)據(jù)安全 11平臺及工具類標準 參考文獻 DB15/T2021.1—2020本部分按照GB/T1.1-2020《標準化工作導則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。DB15/T2021《草原大數(shù)據(jù)》的結(jié)構(gòu)分為4個部分:——第1部分:基礎數(shù)據(jù);——第2部分:數(shù)據(jù)分類與編碼;——第3部分:數(shù)據(jù)元;——第4部分:代碼集。本部分為DB15/T2021的第1部分。本部分由內(nèi)蒙古自治區(qū)農(nóng)牧廳提出并歸口。本部分起草單位:內(nèi)蒙古自治區(qū)農(nóng)牧業(yè)信息中心、內(nèi)蒙古云利科技有限公司、內(nèi)蒙古草原工作站、內(nèi)蒙古草原監(jiān)督管理局、內(nèi)蒙古草原勘察規(guī)劃院、內(nèi)蒙古飼料草種監(jiān)督檢驗站、內(nèi)蒙古農(nóng)業(yè)大學、鄂托克前旗數(shù)字林草信息中心。本部分主要起草人:劉永志、馬超、付學良、王曉峰、張巧燕、朝格敖其爾、王伊拉圖、趙于東、李雪東、朱玉成、李慧旻、李宏慧、董改芳、王云利、劉愛軍、高文淵、常炳文、鞏韶飛。DB15/T2021.1—20201草原大數(shù)據(jù)第1部分:基礎數(shù)據(jù)本部分規(guī)定了草原大數(shù)據(jù)的數(shù)據(jù)采集、處理技術、平臺及工具和信息安全等技術及管理要求。本部分適用于內(nèi)蒙古草原信息的共享、交換、評價與服務。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T19710-2005地理信息元數(shù)據(jù)GB/T20157信息技術軟件維護GB/T20531-2006移動數(shù)據(jù)庫應用編程接口規(guī)范GB/T22080信息技術安全技術信息安全管理體系要求GB/T24450社會經(jīng)濟目標分類與代碼GB/Z28828信息安全技術公共及商用服務信息系統(tǒng)個人信息保護指南GB/T29262信息技術面向服務的體系結(jié)構(gòu)(SOA)術語GB/T29263信息技術面向服務的體系結(jié)構(gòu)(SOA)應用的總體技術要求GB/T31495.1-2015信息安全技術信息安全保障指標體系及評價方法第1部分概念和模型GB/T31495.2-2015信息安全技術信息安全保障指標體系及評價方法第2部分指標體系范圍GB/T31495.3-2015信息安全技術信息安全保障指標體系及評價方法第3部分實施指南GB/T32908非結(jié)構(gòu)化數(shù)據(jù)訪問接口規(guī)范GB/T34949實時數(shù)據(jù)庫C語言接口規(guī)范GB/T34960.5信息技術服務治理第5部分:數(shù)據(jù)治理規(guī)范GB/T36073數(shù)據(jù)管理能力成熟度評估模型GB/T34978信息安全技術移動智能終端個人信息保護技術要求GB/T37721信息技術大數(shù)據(jù)分析系統(tǒng)功能要求GB/T37722信息技術大數(shù)據(jù)存儲與處理系統(tǒng)功能要求標準LY/T2930-2017林業(yè)數(shù)據(jù)采集規(guī)范LY/T2181濕地信息分類與代碼LY/T2182荒漠化信息分類與編碼LY/T1814自然保護區(qū)生物多樣性調(diào)查規(guī)范LY/T2179野生動植物保護信息分類與編碼QX/T102氣象資料分類與編碼DL/T1456電力系統(tǒng)數(shù)據(jù)庫通用訪問接口規(guī)范DB15/T2021.1—202023術語和定義GB/T19710界定的以及下列術語和定義適用于本文件。為了便于使用,以下重復列出GB/T19710中的一些術語和定義。3.1大數(shù)據(jù)bigdata具有體量巨大、來源多樣、生成極快、且多變等特征并且難以用傳統(tǒng)數(shù)據(jù)體系結(jié)構(gòu)有效處理的包含大量數(shù)據(jù)集的數(shù)據(jù)。3.2草原大數(shù)據(jù)grasslandbigdata通過大數(shù)據(jù)技術將草原相關的數(shù)據(jù)整合起來應用在草原管理相關的業(yè)務領域,賦能政府機構(gòu),提升政務實施效能的數(shù)據(jù)。這些數(shù)據(jù)包含了政府開展工作產(chǎn)生、采集以及因服務需求而采集的外部大數(shù)據(jù),以及為政府自有和面向政府的大數(shù)據(jù)。3.3元數(shù)據(jù)metadata關于數(shù)據(jù)的數(shù)據(jù)。[來源:GB/T19710-2005,定義4.5]3.4元數(shù)據(jù)元素metadataelement元數(shù)據(jù)的基本單元。[來源:GB/T19710-2005,定義4.6]3.5元數(shù)據(jù)實體metadataentity一組說明數(shù)據(jù)相同特性的元數(shù)據(jù)元素。DB15/T2021.1—20203[來源:GB/T19710-2005,定義4.7]3.6核心元數(shù)據(jù)coremetadata描述草原大數(shù)據(jù)最基本信息的元數(shù)據(jù)最小集合。3.7數(shù)據(jù)源datasource數(shù)據(jù)的來源是提供某種所需要數(shù)據(jù)的器件或原始媒體。在數(shù)據(jù)源中存儲了所有建立數(shù)據(jù)庫連接的信息。草原大數(shù)據(jù)的數(shù)據(jù)源必需可靠且具備更新能力,常用的數(shù)據(jù)源有:a)觀測數(shù)據(jù):現(xiàn)場獲取的實測數(shù)據(jù),它們包括野外實地勘測量算數(shù)據(jù)、臺站的觀測記錄數(shù)據(jù)、遙測數(shù)據(jù)等;b)分析測定數(shù)據(jù):利用物理和化學方法分析測定的數(shù)據(jù);c)圖形數(shù)據(jù):各種地形圖和專題地圖等;d)統(tǒng)計調(diào)查數(shù)據(jù):各種類型的統(tǒng)計報表、社會調(diào)查數(shù)據(jù)等;e)遙感數(shù)據(jù):由地面、航空或航天遙感獲得的數(shù)據(jù)。3.8結(jié)構(gòu)化數(shù)據(jù)structureddata可以組織成行列結(jié)構(gòu),可識別的數(shù)據(jù)。這類數(shù)據(jù)通常是一條記錄,或者一個文件,或者是被正確標記過的數(shù)據(jù)中的某一個字段,并且可以被精確地定位。3.9半結(jié)構(gòu)化數(shù)據(jù)semi-structureddata半結(jié)構(gòu)化數(shù)據(jù)不具有結(jié)構(gòu)化數(shù)據(jù)嚴格的存儲結(jié)構(gòu),但它可以使用標簽或其他形式的標記方式以保證數(shù)據(jù)的層次結(jié)構(gòu)。3.10非結(jié)構(gòu)化數(shù)據(jù)un-structureddata非結(jié)構(gòu)化數(shù)據(jù)一般被認為是大量純文本數(shù)據(jù),其中還可能包含日期,數(shù)字和實例。3.11復雜結(jié)構(gòu)的數(shù)據(jù)complexstructureddata由兩個或多個相互關聯(lián)部分組成的數(shù)據(jù),這類數(shù)據(jù)不能簡單地由結(jié)構(gòu)化查詢語言(SQL)或工具解DB15/T2021.1—202043.12云計算cloudcomputing構(gòu)建在網(wǎng)絡上的分布式計算系統(tǒng),數(shù)據(jù)是存儲于機房外的(即云端)。3.13聚類分析clusteringanalysis將相似的對象聚合在一起,每類相似的對象組合成一個聚類(或簇)的過程。這種分析方法的目的在于分析數(shù)據(jù)間的差異和相似性。3.14數(shù)據(jù)聚合工具dataaggregationtools將分散于眾多數(shù)據(jù)源的數(shù)據(jù)轉(zhuǎn)化成一個全新數(shù)據(jù)源的過程。3.15數(shù)據(jù)虛擬化datavirtualization數(shù)據(jù)整合的過程,以此獲得更多的數(shù)據(jù)信息,這個過程通常會引入其他技術,例如數(shù)據(jù)庫、應用程序、文件系統(tǒng)、網(wǎng)頁技術、大數(shù)據(jù)技術等等。3.16去身份識別de-identification也稱為匿名化(anonymization),確保個人信息不會通過數(shù)據(jù)被識別。3.17文件存貯數(shù)據(jù)庫documentstoredatabases也稱為文檔數(shù)據(jù)庫(document-orienteddatabase),為存儲、管理、恢復文檔數(shù)據(jù)而專門設計的數(shù)據(jù)庫,這類文檔數(shù)據(jù)也稱為半結(jié)構(gòu)化數(shù)據(jù)。3.18數(shù)據(jù)抽取、轉(zhuǎn)換及裝載Extract,TransformandLoad,ETL是一種用于數(shù)據(jù)庫或者數(shù)據(jù)倉庫的處理過程。即從各種不同的數(shù)據(jù)源提取(E)數(shù)據(jù),并轉(zhuǎn)換(T)成能滿足業(yè)務需要的數(shù)據(jù),最后將其加載(L)到數(shù)據(jù)庫。3.19Hadoop數(shù)據(jù)庫(HBase)一個開源的、非關系型、分布式數(shù)據(jù)庫,與Hadoop框架共同使用。DB15/T2021.1—202053.20Hadoop分布式文件系統(tǒng)Hadoopdistributedfilesystem是一個被設計成適合運行在通用硬件(commodityhardware)上的分布式文件系統(tǒng)。3.21內(nèi)存數(shù)據(jù)庫in-memorydatabase一種數(shù)據(jù)庫管理系統(tǒng),與普通數(shù)據(jù)庫管理系統(tǒng)不同之處在于,它用主存來存儲數(shù)據(jù),而非硬盤。其特點在于能高速地進行數(shù)據(jù)的處理和存取。3.22物聯(lián)網(wǎng)InternetofThings在普通的設備中裝上傳感器,使這些設備能夠在任何時間任何地點與網(wǎng)絡相連。3.23法律上的數(shù)據(jù)一致性juridicaldatacompliance存儲在云上的數(shù)據(jù)要符合當?shù)氐姆伞@?,當用云存儲?shù)據(jù)涉及到的有關數(shù)據(jù)開放共享原則、個人隱私信息等在不同國家有不同的法律定義,該數(shù)據(jù)應該符合當?shù)財?shù)據(jù)存放的法律。3.24M2M數(shù)據(jù)machinetomachinedata兩臺或多臺機器間交流與傳輸?shù)膬?nèi)容。3.25機器數(shù)據(jù)machinedata由傳感器或算法在機器上產(chǎn)生的數(shù)據(jù)。3.26機器學習machinelearning機器學習是人工智能的一部分,指的是機器能夠從它們所完成的任務中進行自我學習,通過長期的累積實現(xiàn)自我改進。3.27多維數(shù)據(jù)庫multi-dimensionaldatabase用于優(yōu)化數(shù)據(jù)聯(lián)機分析處理(OLAP)程序,優(yōu)化數(shù)據(jù)倉庫的一種數(shù)據(jù)庫。3.28多值數(shù)據(jù)庫multiValuedatabaseDB15/T2021.1—20206和XML中的字串。3.29NoSQL數(shù)據(jù)庫NoSQLdatabase不使用SQL的數(shù)據(jù)庫。這類數(shù)據(jù)庫泛指傳統(tǒng)關系型數(shù)據(jù)庫以外的其他類型的數(shù)據(jù)庫。這類數(shù)據(jù)庫有更強的一致性,能處理超大規(guī)模和高并發(fā)的數(shù)據(jù)。3.30再識別re-identification將多個數(shù)據(jù)集合并在一起,從匿名化的數(shù)據(jù)中識別出個人信息。3.31無線射頻識別radioFrequencyIdentification自動識別技術的一種,通過無線射頻方式進行非接觸雙向數(shù)據(jù)通信,利用無線射頻方式對記錄媒體(電子標簽或射頻卡)進行讀寫,從而達到識別目標和數(shù)據(jù)交換的目的。這種識別技術使用一種無線非接觸式射頻電磁場傳感器來傳輸數(shù)據(jù)。射頻識別技術依據(jù)其標簽的供電方式可分為三類,即無源RFID,有源RFID,與半有源RFID。3.32實時數(shù)據(jù)real-timedata在幾毫秒內(nèi)被創(chuàng)建、處理、存儲、分析并顯示的數(shù)據(jù)。3.33主數(shù)據(jù)masterdata滿足跨部門業(yè)務協(xié)同需要的、反映業(yè)務實體狀態(tài)屬性的主體對象核心信息。3.34主數(shù)據(jù)管理masterdatamanagement一整套用于生成和維護主數(shù)據(jù)的規(guī)范、技術和方案,以保證主數(shù)據(jù)的完整性、一致性和準確性。3.35交換switching部門間通過信息資源交換體系技術支撐環(huán)境實現(xiàn)草原大數(shù)據(jù)信息資源在線傳送的過程。3.36交換節(jié)點Switchingnode在跨政務部門業(yè)務系統(tǒng)中,實現(xiàn)信息資源傳送和處理的系統(tǒng)單元。DB15/T2021.1—202074總則4.1數(shù)據(jù)類型格式4.1.1本標準中數(shù)據(jù)元值的類型長度的表示格式:a)a=字母字符;b)n=數(shù)字字符;c)an=字母數(shù)字字符;d)m(m為自然數(shù))=定長m個字符(字符集默認為GB/T2312e)..ul=長度不確定的文本;..p,q(p,q均為自然數(shù))=最長p個數(shù)字字符,小數(shù)點后q位;f)YYYYMMDDhhmmss=“YYYY”表示年份,“MM”表示月份,“DD”表示日期,“hh”表示小時,“mm”表示分鐘,“ss”表示秒,可以根據(jù)具體情況組合使用。4.1.2本標準中的其它數(shù)據(jù)類型:a)n..7(aaannnn)表示最長7個字符,前3個字符為字母字符,后4個字符為數(shù)字字b)..15,3表示最長15個數(shù)字字符,小數(shù)點后3位;c)n2..6表示最大長度為6,最小長度為2的不定長的字母數(shù)字字符。4.2內(nèi)部標識符編碼規(guī)則草原大數(shù)據(jù)內(nèi)部標識符編碼規(guī)則采用四段式編碼規(guī)則,編碼結(jié)構(gòu)見圖1所示:a)第一段:1~2位,數(shù)據(jù)元英文名稱DataElement的縮寫,用大寫字母“DE”表示;“大類編碼”;“小類編碼”;第二段與第三段間用“.”分隔;d)第四段:7~9位,數(shù)據(jù)元的順序碼,用三位阿拉伯數(shù)字表示,第三段與第四段間用“.”分DEXX.XX.XXX第四段:7-9位,數(shù)據(jù)元順序碼第三段:5-6位,數(shù)據(jù)元小類編碼第二段:3-4位,數(shù)據(jù)元大類編碼第一段:1-2位,數(shù)據(jù)元英文名稱圖1內(nèi)部標示符編碼結(jié)構(gòu)圖5草原大數(shù)據(jù)標準體系基本框架DB15/T2021.1—202085.1體系基本框架包含草原大數(shù)據(jù)基礎、草原大數(shù)據(jù)技術、草原大數(shù)據(jù)安全、草原大數(shù)據(jù)平臺及工具以及草原大數(shù)據(jù)管理等5個模塊,見圖2所示。圖2草原大數(shù)據(jù)標準體系基本框架5.2草原大數(shù)據(jù)基礎數(shù)據(jù)基礎標準為整個標準體系提供包括總則、參考架構(gòu)、草原大數(shù)據(jù)元數(shù)據(jù)等通用的基礎性標準。5.3草原大數(shù)據(jù)技術包括:數(shù)據(jù)質(zhì)量標準、數(shù)據(jù)處理與分析關鍵技術標準、數(shù)據(jù)質(zhì)量評估與監(jiān)測技術標準等。其中數(shù)據(jù)質(zhì)量標準分類參考ISO8000系列標準,并根據(jù)當前內(nèi)蒙古自治區(qū)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展需求,等同或修改后采用國際標準;數(shù)據(jù)處理與分析關鍵技術標準主要是針對數(shù)據(jù)從收集到使用過程中的關鍵技術進行規(guī)范;數(shù)據(jù)質(zhì)量評估與監(jiān)測技術主要是針對草原大數(shù)據(jù)質(zhì)量進行評估和監(jiān)測。5.4草原大數(shù)據(jù)安全安全類標準主要是針對通用的安全和行業(yè)安全,其中通用要求基于信息安全技術的系列標準;行業(yè)安全重點針對人工智能、電子政務、工業(yè)互聯(lián)網(wǎng)等各行業(yè)與信息主體利益密切相關的隱私數(shù)據(jù)。5.5草原大數(shù)據(jù)平臺及工具包括系統(tǒng)類工具和應用類工具;系統(tǒng)類工具標準細分為平臺基礎設施、存儲類工具、數(shù)據(jù)庫、平臺管理類工具等。DB15/T2021.1—202095.6草原大數(shù)據(jù)管理包括草原大數(shù)據(jù)運維和數(shù)據(jù)治理,其中數(shù)據(jù)運維包括數(shù)據(jù)庫維護、運行維護、運行安全及大數(shù)據(jù)系統(tǒng)及相關工具等方面的運維及服務標準;數(shù)據(jù)治理包括數(shù)據(jù)資產(chǎn)管理、大數(shù)據(jù)解決方案設計、數(shù)據(jù)管理能力成熟度評價等。6草原大數(shù)據(jù)元數(shù)據(jù)屬性的描述方法6.1名稱賦予元數(shù)據(jù)屬性的標記。名稱是唯一的,以字符串形式表示。6.2定義屬性的描述,可使一種屬性與其他屬性清晰地區(qū)別開來。定義以字符串形式表示。6.3約束顯示一個屬性是始終還是有時出現(xiàn)的描述符。該描述符可以有兩個取值:必選或可選,前者表示該屬性必須出現(xiàn),后者表示該屬性可以出現(xiàn),也可以不出現(xiàn)。6.4出現(xiàn)次數(shù)顯示一個屬性出現(xiàn)多少次的描述符。該描述符有以下四種情況:0:1(表示不出現(xiàn)或出現(xiàn)1次6.5類型6.6備注與屬性應用有關的注釋。7草原大數(shù)據(jù)標識類屬性7.1中文名稱7.1.1定義賦予元數(shù)據(jù)的單個或多個中文字詞的稱謂。7.1.2約束必選。7.1.3出現(xiàn)次數(shù)7.1.4類型字符串。DB15/T2021.1—20207.1.5說明命名應明確的表達數(shù)據(jù)元的含義,盡量減少冗余,增加精確度;在同一環(huán)境下的所有名稱應該是唯一的。7.2同義名稱7.2.1定義一個元數(shù)據(jù)在應用環(huán)境下的不同稱謂。如國家安全生產(chǎn)監(jiān)督管理總局的同義名為國家安全監(jiān)管總局。7.2.2約束可選。7.2.3出現(xiàn)次數(shù)7.2.4類型字符串。7.2.5說明一個元數(shù)據(jù)可以有多個同義詞,第一個同義詞應該是統(tǒng)一的約定名稱。7.3表示符號7.3.1定義元數(shù)據(jù)的含義的描述,表達一個元數(shù)據(jù)的本質(zhì)特性并使其區(qū)別于所有其他元數(shù)據(jù)的陳述(特別7.3.2約束可選。7.3.3出現(xiàn)次數(shù)7.3.4類型字符串。7.4數(shù)據(jù)類型7.4.1定義表示數(shù)據(jù)元值的不同值的集合。7.4.2約束必選。DB15/T2021.1—20207.4.3出現(xiàn)次數(shù)7.4.4類型字符串。7.4.5說明可能的實例為“字符”、“序數(shù)”、“實數(shù)”、“比例數(shù)”、“二進制數(shù)”、“有理數(shù)”。7.5表示格式7.5.1定義從應用的角度規(guī)定的數(shù)據(jù)元值的格式需求,包括所允許的最大或最小字符長度,數(shù)據(jù)元值的類型和表示格式等。7.5.2約束必選。7.5.3出現(xiàn)次數(shù)7.5.4類型:字符串。數(shù)據(jù)格式的表示見數(shù)據(jù)格式的表示見1ccaannnn..9,2dd年用4位數(shù)字表示,月、日、時、分、秒各用2位數(shù)bb規(guī)則來規(guī)DB15/T2021.1—20207.6值域范圍7.6.1定義根據(jù)相應屬性中所規(guī)定的表示形式、格式、數(shù)據(jù)類型和最大與最小長度而決定的數(shù)據(jù)元的允許實例表示的可以根據(jù)名實例表達的據(jù)實例生成7.6.2約束可選。7.6.3出現(xiàn)次數(shù)7.6.4類型字符串。7.6.5說明當值域范圍是編碼表示的枚舉形式時,每一個數(shù)據(jù)元值及其實例都應當成對表示。DB15/T2021.1—20207.7交換約束7.7.1定義根據(jù)對象的來源特性,在數(shù)據(jù)采集時,從應用角度規(guī)定該數(shù)據(jù)元是否為必選或可選。7.7.2約束必選。7.7.3出現(xiàn)次數(shù)7.7.4類型字符串。7.8字段名稱7.8.1定義在提供的共享數(shù)據(jù)中對應的字段名稱。7.8.2約束可選。7.8.3出現(xiàn)次數(shù)0:1。7.8.4類型字符串。7.9標識符7.9.1定義由注冊機構(gòu)分配的、與語言無關的元數(shù)據(jù)的唯一標識符。7.9.2約束必選。7.9.3出現(xiàn)次數(shù)7.9.4類型數(shù)字。7.10蒙文名稱DB15/T2021.1—20207.10.1定義中文名稱對應的蒙文。7.10.2約束可選。7.10.3出現(xiàn)次數(shù)0:1。7.10.4類型字符串。a)每個定義應區(qū)別于目錄中的任何其他定義,以保證專一性。定義中所表述的一個或多個特性必須使被定義的概念與其他概念相區(qū)別;b)用描述性的短語或句子闡述,闡述必須簡練、準確而不含糊,避免跟其他元數(shù)據(jù)定義互相依存;c)定義中僅可使用人們普遍理解的縮略語;d)所有簡稱在第一次出現(xiàn)時,應予以說明。8草原大數(shù)據(jù)技術8.1草原大數(shù)據(jù)質(zhì)量8.1.1草原大數(shù)據(jù)生命周期草原大數(shù)據(jù)一般要經(jīng)歷四個不同的階段:數(shù)據(jù)生成、數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析。其中,數(shù)據(jù)生成階段,是數(shù)據(jù)被創(chuàng)建的階段,包括創(chuàng)建的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);數(shù)據(jù)采集階段,由數(shù)據(jù)收集、數(shù)據(jù)傳輸和數(shù)據(jù)預處理組成;數(shù)據(jù)存儲階段,結(jié)合分布式、云計算技術,達到低成本、低能耗及高可靠性的目標;數(shù)據(jù)分析階段,結(jié)合降雨、氣溫、土壤狀況與歷年草原動植物產(chǎn)量等相關數(shù)據(jù),運用大數(shù)據(jù)挖掘技術,預測草原未來的生態(tài)環(huán)境發(fā)展狀況。8.1.2草原大數(shù)據(jù)的質(zhì)量框架8.1.2.1草原大數(shù)據(jù)指標草原大數(shù)據(jù)指標(簡稱“指標”)指用于衡量草原資源和環(huán)境情況的單位或方法。通過幾個關鍵指標來衡量草原資源和環(huán)境情況的好壞。包括植被、土壤、氣象、總?cè)丝跀?shù)以及草原經(jīng)濟指標等。指標需要經(jīng)過加和、平均等匯總計算方式得到,并且是需要在一定的前提條件進行匯總計算,如時間、地點、范圍,也就是我們常說的統(tǒng)計口徑與范圍。指標可以分為絕對數(shù)指標和相對數(shù)指標,絕對數(shù)指標反映的是規(guī)模大小的指標,如人口數(shù)、植被、收入、用戶數(shù)、土壤,而相對數(shù)指標主要用來反映質(zhì)量好壞的指標。DB15/T2021.1—20208.1.2.2草原大數(shù)據(jù)質(zhì)量元素描述草原大數(shù)據(jù)質(zhì)量的信息項,包括位置精度、屬性精度、邏輯一致性、完整性、趨勢性和數(shù)據(jù)說明。在數(shù)據(jù)分析和數(shù)據(jù)倉庫領域,草原大數(shù)據(jù)質(zhì)量由草原大數(shù)據(jù)質(zhì)量元素來描述。草原大數(shù)據(jù)質(zhì)量元素分為兩類,即定量元素和非定量元素。定量元素,用于描述數(shù)據(jù)集滿足預先設定的質(zhì)量標準及指標的程度,并提供定量的質(zhì)量信息。非定量元素提供綜述性的、非定量的質(zhì)量信息。8.1.2.3草原大數(shù)據(jù)的質(zhì)量維度草原大數(shù)據(jù)的質(zhì)量維度包含5個維度,分別是可得性、可用性、可靠性、相關性、外觀質(zhì)量等。每一個維度有包含1~3個要素:a)可得性。可得性包含可訪問性和實效性兩個要素,其中數(shù)據(jù)的可訪問性應明確數(shù)據(jù)提供訪問的標準接口、數(shù)據(jù)使用權限等;數(shù)據(jù)的實效性應明確數(shù)據(jù)準確接收的時間、數(shù)據(jù)更新時間以及數(shù)據(jù)收集和過程解釋的時間間隔等;b)可用性。數(shù)據(jù)的可用性包含可靠性良好的數(shù)據(jù)源、數(shù)據(jù)規(guī)范化、數(shù)據(jù)產(chǎn)生的時間等三個要c)可靠性??煽啃园瑪?shù)據(jù)的準確性、數(shù)據(jù)一致性以及數(shù)據(jù)完整性等三個要素,其中數(shù)據(jù)準確性應明確得到的數(shù)據(jù)與真實數(shù)據(jù)之間的誤差,包括數(shù)據(jù)數(shù)據(jù)源的準確性、數(shù)據(jù)源的真實狀態(tài)以及數(shù)據(jù)表示的標準化等;數(shù)據(jù)的一致性應明確數(shù)據(jù)經(jīng)過處理之后,它們的概念、值域或格式與處理前的數(shù)據(jù)匹程度、在一定時間內(nèi)數(shù)據(jù)保持一致并且可以驗證以及數(shù)據(jù)和其他數(shù)據(jù)源的數(shù)據(jù)可驗證性;數(shù)據(jù)的完整性應確保數(shù)據(jù)在內(nèi)容上,應包括數(shù)據(jù)使用者所需的全部項目,做到?jīng)]有殘缺和疏漏,包括數(shù)據(jù)格式是清晰的并且滿足標準、數(shù)據(jù)與結(jié)構(gòu)完整性以及數(shù)據(jù)與內(nèi)容完整性是一致的;d)相關性。相關性表示數(shù)據(jù)在多大程度上適合當前工作,包括收集的數(shù)據(jù)闡述的內(nèi)容、大多數(shù)檢索的數(shù)據(jù)集是在檢索主題用戶需要以及信息主題提供與用戶檢索主題的匹配等;e)外觀質(zhì)量。外觀質(zhì)量表示根據(jù)已知或定義良好的術語、屬性、單位、代碼、縮寫或其他信息,來正確解釋數(shù)據(jù)內(nèi)容的能力,應包括明確數(shù)據(jù)的內(nèi)容、格式等是清晰的并且是可理解的、可以很容易地判斷提供的數(shù)據(jù)滿足要求以及數(shù)據(jù)描述、分類和編碼內(nèi)容滿足規(guī)范并且很容易理解。8.2數(shù)據(jù)處理與分析關鍵技術8.2.1采集的內(nèi)容草原大數(shù)據(jù)依據(jù)性質(zhì)及使用目的不同,主要包括公共基礎數(shù)據(jù)、草原基礎數(shù)據(jù)、專題數(shù)據(jù)、綜合數(shù)據(jù)和元數(shù)據(jù)等:a)公共基礎數(shù)據(jù),包括基礎地理信息數(shù)據(jù)、遙感影像數(shù)據(jù)、社會經(jīng)濟和氣象數(shù)據(jù)等,用于輔助草原大數(shù)據(jù)處理分析;b)草原基礎數(shù)據(jù),包括草原資源數(shù)據(jù)、濕地資源數(shù)據(jù)、三化資源數(shù)據(jù)、生物多樣性資源數(shù)據(jù)等,提供草原業(yè)務基礎數(shù)據(jù);c)專題數(shù)據(jù),包括草原資源管理數(shù)據(jù)、草原保護及生態(tài)工程建設數(shù)據(jù)、災害監(jiān)控與應急數(shù)據(jù)、草原產(chǎn)業(yè)數(shù)據(jù)、草原科技等數(shù)據(jù);d)綜合數(shù)據(jù),包括草原社會經(jīng)濟數(shù)據(jù)、草原文獻資料數(shù)據(jù)、草原政策法規(guī)數(shù)據(jù)、草原教育培訓數(shù)據(jù)等數(shù)據(jù),輔助草原清查及統(tǒng)計分析;DB15/T2021.1—2020e)元數(shù)據(jù),包括草原數(shù)據(jù)標識信息、數(shù)據(jù)時間序列信息、數(shù)據(jù)質(zhì)量信息、數(shù)據(jù)共享信息、空間參照信息等;f)其他數(shù)據(jù),不分屬于以上類別的草原數(shù)據(jù)資料。8.2.2采集的流程8.2.2.1采集前期準備草原數(shù)據(jù)采集前期準備工作,包括組織準備、技術準備和其他準備:a)組織準備:組織草原數(shù)據(jù)采集隊伍,明確隊伍責任分工等;b)技術準備:制定數(shù)據(jù)采集工作方案、技術方案和操作細則等;c)其他準備:明確數(shù)據(jù)采集目標,確定數(shù)據(jù)采集對象,整理歷史數(shù)據(jù),收集調(diào)查工具等。8.2.2.2數(shù)據(jù)采集見本標準的8.2.1。8.2.2.3數(shù)據(jù)后期處理對采集數(shù)據(jù)按照LY/T2930-2017中的4.2.3條進行處理,包括數(shù)據(jù)分析、數(shù)據(jù)處理、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)入庫等操作。8.2.3采集的途徑草原數(shù)據(jù)采集途徑包含實地調(diào)查數(shù)據(jù)采集、遙感影像數(shù)據(jù)采集、傳感網(wǎng)絡數(shù)據(jù)采集、問卷調(diào)查及訪談法數(shù)據(jù)采集、互聯(lián)網(wǎng)數(shù)據(jù)采集以及元數(shù)據(jù)采集等6種途徑:a)實地調(diào)查數(shù)據(jù)采集。手段包括手工記錄方式和基于移動設備的自動數(shù)據(jù)采集方式:1)手工記錄方式:通過隨身攜帶或預先布設在外的儀器設備獲取草原相關信息,以手工記錄的方式進行收集;2)基于移動設備的自動數(shù)據(jù)采集方式:通過移動終端設備及專業(yè)數(shù)據(jù)采集軟件,實時收集、上報草原信息數(shù)據(jù)。b)草原遙感影像數(shù)據(jù)采集。依據(jù)影像數(shù)據(jù)采集方式不同,分為衛(wèi)星遙感影像數(shù)據(jù)采集、航空遙感影像數(shù)據(jù)采集:1)衛(wèi)星遙感影像數(shù)據(jù)采集,通過國內(nèi)外衛(wèi)星遙感技術獲取草原影像數(shù)據(jù),包括全色影像多光譜影像及高光譜影像;2)航空遙感影像數(shù)據(jù)采集,通過飛機、飛艇等航拍設備獲取草原數(shù)據(jù),如利用無人機搭載多光譜成像儀、數(shù)碼相機、紅外掃描儀等設備,實現(xiàn)草原數(shù)據(jù)的采集。c)傳感器網(wǎng)絡數(shù)據(jù)采集通過光照傳感器、溫度傳感器、濕度傳感器、氣體感應器、紅外感應器、攝像頭等信息傳感設備,可將數(shù)據(jù)實時傳回指揮或管理中心,實現(xiàn)對草原資源的智能化識別、監(jiān)測和管理等,主要用于草原防火煙火智能識別、生物多樣性動態(tài)監(jiān)測、草原有害生物監(jiān)測預警、生態(tài)監(jiān)測等;d)問卷調(diào)查與訪談法數(shù)據(jù)采集:1)問卷調(diào)查:通過既定的問題來收集草原專項數(shù)據(jù);2)訪談法:結(jié)合實地考察等,以談話、會議等形式收集草原數(shù)據(jù)資源材料。DB15/T2021.1—2020e)互聯(lián)網(wǎng)數(shù)據(jù)采集在手持移動終端、便攜式計算機、臺式計算機等互聯(lián)網(wǎng)應用設備中抓取草原相關網(wǎng)絡輿情信息數(shù)據(jù),以及草原業(yè)務系統(tǒng)應用中的痕跡數(shù)據(jù);f)元數(shù)據(jù)采集元數(shù)據(jù)貫穿草原數(shù)據(jù)資源建設的全過程,主要包括草原業(yè)務元數(shù)據(jù)、技術元數(shù)據(jù)和管理元數(shù)據(jù)等。8.3草原大數(shù)據(jù)采集規(guī)定8.3.1公共基礎數(shù)據(jù)規(guī)定公共基礎數(shù)據(jù)采集規(guī)定,主要包括對基礎地理信息數(shù)據(jù)、基礎測繪成果數(shù)據(jù)、遙感影像數(shù)據(jù)和社會經(jīng)濟氣象數(shù)據(jù)等相關業(yè)務部門數(shù)據(jù)的規(guī)定:a)基礎地理信息數(shù)據(jù),包括各種比例尺數(shù)字化地形圖、DEM數(shù)據(jù)、省、市、縣多級比例尺的行政區(qū)劃圖、交通道路、水系、城鎮(zhèn)居民點、獨立建筑物等數(shù)據(jù)、多級比例尺的土壤數(shù)據(jù)等。按照GB/T13923中的規(guī)定采集;b)基礎測繪成果數(shù)據(jù),按照《基礎測繪成果提供使用管理暫行辦法》(國測法字(2006)13號向國家和地方測繪地理信息局申請使用基礎測繪成果數(shù)據(jù);c)遙感影像數(shù)據(jù),包括多源、多時相、多分辨率海量遙感數(shù)據(jù);根據(jù)林草局部門不同業(yè)務要求采集數(shù)據(jù);d)社會經(jīng)濟和氣象數(shù)據(jù)等相關業(yè)務部門數(shù)據(jù),社會經(jīng)濟數(shù)據(jù)包括人口、經(jīng)濟產(chǎn)值等數(shù)據(jù),其中社會經(jīng)濟數(shù)據(jù)按照GB/T24450中的規(guī)定采集;氣象數(shù)據(jù)包括氣溫、降水量、極端最高、最低溫度、年積溫等數(shù)據(jù),氣象數(shù)據(jù)按照QX/T102中的規(guī)定采集。8.3.2草原基礎數(shù)據(jù)規(guī)定草原基礎數(shù)據(jù)采集規(guī)定,主要包括對草原資源數(shù)據(jù)、濕地數(shù)據(jù)、三化草原數(shù)據(jù)和生物多樣性等數(shù)據(jù)的規(guī)定:a)資源數(shù)據(jù),包括草原資源清查數(shù)據(jù)、資源規(guī)劃設計調(diào)查數(shù)據(jù)、作業(yè)設計調(diào)查數(shù)據(jù)、年度核查數(shù)據(jù)、草原確權數(shù)據(jù)、資源利用數(shù)據(jù)、草原自然保護區(qū)數(shù)據(jù)以及涉及以上草原其他標準、文檔、技術規(guī)程數(shù)據(jù)等;b)濕地數(shù)據(jù),包括濕地調(diào)查和監(jiān)測、濕地標準、濕地履約數(shù)據(jù)等,信息采集目標是查清濕地資源現(xiàn)狀和動態(tài)變化。采取方法包括全國范圍采取宏觀遙感調(diào)查、典型野外樣地調(diào)查、踏查和數(shù)據(jù)收集。專項野外調(diào)查,按照LY/T2181中的規(guī)定采集;c)三化草原數(shù)據(jù),包括全國三化草原氣候類型數(shù)據(jù)、全國沙塵暴監(jiān)測數(shù)據(jù)以及其他標準、文檔、技術規(guī)程數(shù)據(jù)等,按照LY/T2182中的規(guī)定采集;d)生物多樣性數(shù)據(jù),包括保護區(qū)數(shù)據(jù)、重點工程、專項調(diào)查、野生動植物、全國自然保護區(qū)分布以及其他標準、文檔、技術規(guī)程數(shù)據(jù)等,按照LY/T1814中的規(guī)定采集;e)野生動植物數(shù)據(jù),按照LY/T2179中的規(guī)定采集。8.3.3草原專題數(shù)據(jù)規(guī)定分為草原資源管理、草原培育及生態(tài)工程建設、災害監(jiān)控與應急、草原產(chǎn)業(yè)數(shù)據(jù)、草原科技等數(shù)據(jù):a)草原資源管理數(shù)據(jù),包括草場作業(yè)設計數(shù)據(jù)、草原執(zhí)法檢查數(shù)據(jù)、草原生態(tài)管護數(shù)據(jù)等;DB15/T2021.1—2020b)草原培育及生態(tài)工程建設數(shù)據(jù),包括工程作業(yè)設計數(shù)據(jù)、草場實績綜合核查數(shù)據(jù)、天然草原資源保護工程數(shù)據(jù)、退耕還草數(shù)據(jù)、牧草種質(zhì)資源數(shù)據(jù)等;c)災害監(jiān)控與應急數(shù)據(jù),包括草原防災數(shù)據(jù)、草原有害生物數(shù)據(jù)等;d)草原產(chǎn)業(yè)數(shù)據(jù),包括草業(yè)市場數(shù)據(jù)、草原產(chǎn)品交易數(shù)據(jù)、價值行情數(shù)據(jù)等;e)草原科技數(shù)據(jù),包括草原科技成果數(shù)據(jù)、草原實用技術數(shù)據(jù)、草業(yè)專家數(shù)據(jù)等。8.3.4草原綜合數(shù)據(jù)采集依據(jù)草原綜合數(shù)據(jù)性質(zhì)不同,獲取方式不同,草原綜合數(shù)據(jù)采集,主要包括對草原社會經(jīng)濟數(shù)據(jù)、草原文獻資料數(shù)據(jù)、草原政策法規(guī)數(shù)據(jù)和草原報告數(shù)據(jù)等的規(guī)定:a)社會經(jīng)濟數(shù)據(jù),各級草業(yè)部門上報和互聯(lián)網(wǎng)絡平臺獲取草原行業(yè)相關的經(jīng)濟數(shù)據(jù);b)文獻資料數(shù)據(jù),包括草原資料和草原相關綜述等材料;c)政策法規(guī)數(shù)據(jù),各級草原管理相關部門按照權限發(fā)布的政策法規(guī)等,并且逐級上報;草原管理站報告數(shù)據(jù),由草原技術及管理部門、縣級、市(縣)級、?。▍^(qū))級、國家級逐級上報數(shù)據(jù),并統(tǒng)計分析。8.3.5元數(shù)據(jù)采集元數(shù)據(jù)需標識草原數(shù)據(jù)資源數(shù)據(jù)基本屬性,包括標識信息、數(shù)據(jù)質(zhì)量信息、空間數(shù)據(jù)標識信息、空間參照信息、數(shù)據(jù)集內(nèi)容描述、數(shù)據(jù)發(fā)行信息、引用信息、時間序列信息、聯(lián)系信息。9數(shù)據(jù)質(zhì)量評估流程與評價方法9.1數(shù)據(jù)質(zhì)量評估流程制定了草原大數(shù)據(jù)質(zhì)量完整的評估流程,見圖3所示。DB15/T2021.1—2020數(shù)據(jù)質(zhì)量評價基準數(shù)據(jù)收集數(shù)據(jù)清洗數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)聚合數(shù)據(jù)加載數(shù)據(jù)質(zhì)量評價否 滿足基準?否是數(shù)據(jù)輸出生成數(shù)據(jù)質(zhì)量報告數(shù)據(jù)輸出生成數(shù)據(jù)質(zhì)量報告數(shù)據(jù)分析與挖掘圖3數(shù)據(jù)質(zhì)量評估流程9.2數(shù)據(jù)質(zhì)量評價方法數(shù)據(jù)質(zhì)量評價的核心是如何評價每個維度。目前,數(shù)據(jù)質(zhì)量評估有定性和定量兩種方法:a)定性評價方法。定性評價方法是依據(jù)一定的評價標準和要求,根據(jù)評估的目的和用戶需求,從定性分析的角度,來描述和評估數(shù)據(jù)資源。定性分析應由學科專家或?qū)I(yè)人士執(zhí)行;b)定量評價方法。定量的方法是一個正式的、客觀的、系統(tǒng)的過程,利用數(shù)值的數(shù)據(jù)來獲得信息。10草原大數(shù)據(jù)安全DB15/T2021.1—202010.1通用安全符合GB/T31495和GB/T34987的要求。10.2行業(yè)安全符合GB/T22080和GB/Z28828的要求。11平臺及工具類標準11.1系統(tǒng)類工具11.1.1基礎設施符合GB/T37721、GB/T29262、GB/T29263的要求。11.1.2存儲類工具符合GB/T37722的要求。11.1.3數(shù)據(jù)庫符合GB/T32908、GB/T34949、DL/T1456的要求。11.1.4平臺管理類工具符合GB/T37721的要求。11.2應用類工具11.2.1SQL操作函數(shù)符合GB/T20531的要求。11.2.2同步連接級11.2.2.1SYNCOpena)語法INTEGERSYNCOpen(HANDLESyncHandle,MDBSYNCINFOSyncParam,MDBCOM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論