(正式版)DB12∕T 1303-2024 《地方志數字化加工技術規(guī)范》_第1頁
(正式版)DB12∕T 1303-2024 《地方志數字化加工技術規(guī)范》_第2頁
(正式版)DB12∕T 1303-2024 《地方志數字化加工技術規(guī)范》_第3頁
(正式版)DB12∕T 1303-2024 《地方志數字化加工技術規(guī)范》_第4頁
(正式版)DB12∕T 1303-2024 《地方志數字化加工技術規(guī)范》_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

地方志數字化加工技術規(guī)范2024-03-19實施2024-03-19實施I本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結構和起草規(guī)則》的規(guī)定起草。本文件由天津市地方志編修委員會辦公室提出并歸口。本文件起草單位:天津市地方志編修委員會辦公室、天津市地方志館。本文件主要起草人:莫洪勝、仇偉海、郝登奎、梁娜、鞏志彬、朱曉飛、朱雅晶、鄭佳、張迪、李慶福、王靚、鄧瀅、柳楊。地方志數字化加工技術規(guī)范僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本GB/T22373—2008標準文獻元數據GB/T31219.2—2014圖書館館藏資源數字化加工規(guī)范第2部分:文本資源[DA/T31—2017,定義3.1]3.6文本文件中正確識別的字符數與總字符數之比,即準確率=(正確識別字符數/總字符數)×100%。2電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,用3.8[GB/T22373—2008,定義3.3]3.94.1基本要求4.1.1完整性4.1.2規(guī)范性4.1.3有效性碼混亂、圖像失真等無法使用的錯誤。4.1.4準確性4.1.5合規(guī)性4.2加工流程3目錄數據庫數據規(guī)則的制定應符合附錄C的要求,包括數據名稱、字段類型、取值范圍等。地方志數字資源命名要求應符合本文件4.7的要求。4.4掃描紙質文獻4.4.1加工范圍包括封面、版權頁、目錄、正文、附錄、插頁、封底等從封面到封底的全部頁面。4.4.2加工格式地方志數字資源在形成過程中可采用通用格式,在歸檔時要轉為版式文件,版式文件格式應與國家允許的格式一致,目前可采用雙層OFD、雙層PDF或矢量PDF格式。雙層OFD、雙層PDF文件圖像所使用的圖像格式為JPG;矢量PDF文件文字使用矢量字庫,圖像采用高質量方式。4.4.3加工要求4.4.3.1頁面要求頁面中圖像層和文字層的文字對位要準確,頁面完整,無缺頁、重頁,頁碼順序顛倒等情況發(fā)生。文字簡繁體參照原書處理。4.4.3.2圖像要求4.4.3.2.1圖像精度不少于300dpi,如原件質量較差或字體很小,字跡密集,可適當提高分辨率。4.4.3.2.2圖像放大到200%的時候,字跡清晰,筆畫連續(xù),無斷裂、缺塊的現象,傾斜度不能超過0.5°。4.4.3.2.3含彩色插圖的頁面為彩色圖像;含灰度插圖的頁面為灰度圖像;其他頁面,為黑白圖像。4.5OCR識別使用OCR相關軟件對地方志文獻進行文字識別。OCR文字識別完成后需進行內容校對,采用人工檢驗或計算機程序輔助檢驗的方法對地方志數字資源中的文本、圖片、表格等進行抽樣檢測。文本、圖片準確率應在99%以上,表格準確率應在95%以上。4.6制作書簽需包含與原書一致的書簽。在出版物的封面、封面后的折頁、第一次出現書名的地方、版權頁、封底前的折頁、封底,添加書簽“封面、前折頁、書名頁、版權頁、后折頁、封底”,其他出現與章節(jié)平級的(如序,前言,后記等)內容,必須在版式文件出現的地方按原書內容添加書簽。所有書簽均按原書實際順序,書簽能準確跳轉到其對應的位置。4.7命名要求地方志數字資源以其具有的唯一標識符命名,編碼由15位組成。前2位代表地方志數字資源類型,其中“ZS”代表志書,“NJ”代表年鑒,“QK”代表地方志期刊,“FS”代表地方史。第3位代表地方志資源內容所屬類別,編碼規(guī)則按照中國圖書館分類法,其中A~X為專業(yè)性地方志資源(包括專門年鑒和專門志書)的類別編碼,Z為綜合型地方志資源(包括綜合年鑒和綜合志書)的類別編碼。第4~9位共6位為地方志資源所屬地行政區(qū)劃代碼,應符合GB/T2260—2007中華人民共和國行政區(qū)劃代碼的要求。第10~13位共4位為地方志記事下限的年份。第14~15位為卷次編號,代表地方志資源在該年份該區(qū)劃的卷次,00代表只有唯一一卷,若有多卷,則01代表第一卷、02代表第二卷,依次類推。4志鑒元數據.xml——保存志鑒的全部元數據信息志鑒版式文件——可采用OFD或PDF志鑒元數據.xml——保存志鑒的全部元數據信息志鑒版式文件——可采用OFD或PDF55.2.1元數據從概念層次上區(qū)分為為描述元數據和管理元數據。5.2.2描述元數據由基本元素組成,包括題名、責任者等信息。5.2.3管理元數據由實體書的來源信息、館藏信息和數字化加工元素組成,包括數字化加工機構、數數據元素范圍的定義或說明,描述信息對象的一段文字。描述數據元素的必要性和作用。數據元素的可重復性屬性。數據元素所涉及的取值范圍。對數據元素的進一步說明。元數據索引見表1。題名6責任者描述信息編輯說明/凡例日期纂修日期出版日期資源類型圖書分類號語種出版信息出版編號出版單位印刷單位印數管理元數據數字加工信息數字化加工機構數字化加工交付時間來源信息收藏單位名稱典藏號7(規(guī)范性)各單位向同級地方志館移交地方志數字資源應填寫《地方志數字資源移交登記表》,應符合表A.1?!鯎碛邪鏅嗫谔峁┌鏅嗨姓呤跈嗦暶鳌跗渌闆r說明移交介質□光盤□U盤□移動硬盤□其他:(簽字)(簽字)(蓋章)(蓋章)8(規(guī)范性)元數據的Schema定義<xs:elementname="descname="title"type="xs:strname="creator"type="xs:striname="dominantAgency"type="xs:strname="sponsor"type="xs:striname="otherCreator"type="xs:string"minOccuname="region"type="xs:striname="descriptionInformatname="abstract"type="xs:strname="usual"type="xs:striname="tableOfContents"type="xs:stname="created"type="xs:dateTname="issued"type="xs:dateT<xs:elementname="identifie<xs:elementname="resourceType"type="xs:<xs:elementname="booksNumber"type="xs:string"/><xs:elementname="areaNumber"type="xs:string"/><xs:elementname="lowerLimit"type="xs<xs:elementname="volNumber"type="xs<xs:elementname="copyright"type="xs:string"/><xs:elementname="language"type="xs<xs:elementname="relation"type="xs:string"minOccurs="0"maxOccurs="unbounded"/><xs:elementname="publishingInformation"><xs:elementname="publicationNumber"type="xs:string"/><xs:elementname="publisher"type="xs:string"minOccurs="0"/><xs:elementname="PrintingUnit"type="xs:string"minOccurs="0"/><xs:elementname="bookSize"type="xs:string"minOccurs="0"/><xs:elementname="printNumber"type="xs:string"minOccurs="0"/><xs:elementname="wordNumber"type="xs:string"minOccu<xs:elementname="pageCount"type="xs:string"minOccurs="0"/><xs:elementname="price"type="xs:string"minOccurs="0"/><xs:elementname="digitialInfo”minOccurs="0"><xs:elementname="digitalSource"type="xs:string"minOccur9name="digitialUnit"type="xs:string"minOccurname="leadDate"type="xs:string"minOccurname="standardOfExecution"type="xs:string"minOccur<xs:elementname="sourceInfo”minOccurs="0"><xs:elementname="sourceType"type="xs:string"minOccurs="0"/><xs:elementname="sourceFrom"type="xs:string"minOccurs="<xs:elementname="collectInfo"minO<xs:elementname="collectorName"type="xs:string"minOccurs="0"/><xs:elementname="repositoryNumber"type="xs:string"minOccurs="0"/><xs:elementname="shelfCode"type="xs:string"minOccurs="0"/><xs:elementname="collectDate"type="xs:string"minOccurs="0"/><xs:elementname="collectPeriod"type="xs:string"minOccurs="0"/><xs:elementname="preserveStatus"minOccname="integrity"type="xs:string"minOccursname="integrityLevel"type="xs:string"minOccur(規(guī)范性)元數據的具體描述見表C.1。中文名稱題名定義說明描述地方志資源的中心內容,提供檢索元素類型簡單型數據類型取值范圍一-中文名稱責任者定義說明描述地方志資源的唯一責任者,提供檢索元素類型簡單型數據類型取值范圍一中文名稱定義說明描述地方志資源的主管單位或編纂委員會,提供檢索元素類型簡單型數據類型取值范圍一一中文名稱定義說明描述地方志資源的主辦單位或編纂單位,提供檢索元素類型簡單型數據類型取值范圍一編號中文名稱定義說明描述除主要責任者之外的其他責任者,提供檢索元素類型簡單型數據類型取值范圍-多個人名以分號隔開中文名稱定義說明描述地方志資源所在地域,提供檢索元素類型簡單型數據類型取值范圍一-中文名稱描述信息定義說明提供地方志資源的描述信息,提供檢索元素類型容器型數據類型取值范圍-一中文名稱定義說明元素類型簡單型數據類型取值范圍一-中文名稱編輯說明/凡例定義說明地方志資源的編輯說明/凡例對地方志資源的編寫情況、背景、體例進行說明元素類型簡單型數據類型取值范圍--中文名稱定義說明元素類型簡單型數據類型取值范圍--中文名稱日期定義說明與地方志資源生命周期的一個事件相關的時刻或一段時間明確地方志資源纂修、出版時間,提供檢索元素類型容器型數據類型日期取值范圍編號中文名稱纂修日期定義說明明確地方志資源纂修日期,提供檢索元素類型簡單型數據類型日期取值范圍--中文名稱出版日期定義說明明確地方志資源出版時間,提供檢索元素類型簡單型數據類型日期取值范圍-中文名稱定義說明地方志資源的唯一標識符/文件命名,由資源類型、圖書分類號每一份地方志資源均設置唯一標識,便于保存和利用元素類型復合型數據類型取值范圍編號中文名稱資源類型定義說明明確地方志資源的類型,提供檢索元素類型簡單型數據類型取值范圍志書、年鑒、期刊、地方史-中文名稱圖書分類號定義說明元素類型簡單型數據類型取值范圍--中文名稱定義說明明確地方志資源所屬地區(qū)的行政區(qū)劃代碼元素類型簡單型數據類型取值范圍--中文名稱定義說明地方志資源所表述的截止時間描述地方志資源所表述的截止時間元素類型簡單型數據類型取值范圍--編號中文名稱卷次編號定義說明元素類型簡單型數據類型取值范圍一中文名稱定義說明元素類型簡單型數據類型取值范圍--中文名稱語種定義說明地方志資源的語種元素類型簡單型數據類型取值范圍--中文名稱定義說明元素類型簡單型數據類型取值范圍--中文名稱出版信息定義說明地方志資源的出版信息元素類型容器型數據類型取值范圍-中文名稱出版編號定義說明元素類型簡單型數據類型取值范圍一-中文名稱出版單位定義說明元素類型簡單型數據類型取值范圍--中文名稱印刷單位定義說明元素類型簡單型數據類型取值范圍-中文名稱定義說明地方志資源幅面的規(guī)格大小記錄地方志資源幅面的規(guī)格大小元素類型簡單型數據類型取值范圍-中文名稱印數定義說明元素類型簡單型數據類型取值范圍一-中文名稱定義說明元素類型簡單型數據類型取值范圍中文名稱定義說明元素類型簡單型數據類型取值范圍--中文名稱定義說明元素類型簡單型數據類型取值范圍--中文名稱數字加工信息定義說明有關數字化加工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論