古籍?dāng)?shù)字化加工技術(shù)解決方案_第1頁(yè)
古籍?dāng)?shù)字化加工技術(shù)解決方案_第2頁(yè)
古籍?dāng)?shù)字化加工技術(shù)解決方案_第3頁(yè)
古籍?dāng)?shù)字化加工技術(shù)解決方案_第4頁(yè)
古籍?dāng)?shù)字化加工技術(shù)解決方案_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

附件:地方資料數(shù)字化加工處理招標(biāo)及技術(shù)要求一.投標(biāo)供應(yīng)商資質(zhì)要求投標(biāo)供應(yīng)商注冊(cè)資金在50萬元以上。投標(biāo)供應(yīng)商應(yīng)提供至少兩個(gè)從業(yè)人員資格證明文件。二.地方資料數(shù)字化加工技術(shù)解決方案通過對(duì)項(xiàng)目加工要求的仔細(xì)分析,本次地方資料數(shù)字化加工的內(nèi)容主要為地方資料圖書進(jìn)行掃描加工,完成的數(shù)據(jù)應(yīng)用于數(shù)字圖書館平臺(tái)發(fā)布,具體詳細(xì)實(shí)施方案如下:生產(chǎn)流程對(duì)圖書館地方資料進(jìn)行數(shù)字化加工,其加工流程如下:□□□□□□□□□□□□□□□□□工程規(guī)劃和預(yù)處理一、分析理解加工要求二、配置流水工藝三、制定加工環(huán)節(jié)質(zhì)量控制標(biāo)準(zhǔn)四、建立數(shù)據(jù)規(guī)范配置標(biāo)引數(shù)據(jù)庫(kù)過程管理一、項(xiàng)目進(jìn)度管理二、信息安全管理三、過程改進(jìn)和工藝配置四、數(shù)據(jù)核算管理五、項(xiàng)目通報(bào)數(shù)據(jù)驗(yàn)收和交付一、數(shù)據(jù)內(nèi)部驗(yàn)收二、數(shù)據(jù)備份三、數(shù)據(jù)交付和驗(yàn)收四、資料歸還和移交五、備份移交工程后期服務(wù)一、項(xiàng)目總結(jié)和報(bào)告二、各類文檔提交三、方案建議四、服務(wù)和維護(hù)階段古籍整理掃描一、清單核對(duì)二、掃描加工三、圖像質(zhì)量檢測(cè)四、加工分類五、交接信息記錄圖像處理一、去污二、糾斜三、清晰度四、尺寸圖像版面分析一、文字圖像版面分析一二、插圖版面分析三、紋飾版面分析數(shù)據(jù)調(diào)整一、規(guī)范性和完整性檢查二、文字質(zhì)量檢查,文字差錯(cuò)率低于萬分之三成品數(shù)據(jù)提交一、圖像文件二、造字列表三、單層矢量工程規(guī)劃和預(yù)處理一、分析理解加工要求二、配置流水工藝三、制定加工環(huán)節(jié)質(zhì)量控制標(biāo)準(zhǔn)四、建立數(shù)據(jù)規(guī)范配置標(biāo)引數(shù)據(jù)庫(kù)過程管理一、項(xiàng)目進(jìn)度管理二、信息安全管理三、過程改進(jìn)和工藝配置四、數(shù)據(jù)核算管理五、項(xiàng)目通報(bào)數(shù)據(jù)驗(yàn)收和交付一、數(shù)據(jù)內(nèi)部驗(yàn)收二、數(shù)據(jù)備份三、數(shù)據(jù)交付和驗(yàn)收四、資料歸還和移交五、備份移交工程后期服務(wù)一、項(xiàng)目總結(jié)和報(bào)告二、各類文檔提交三、方案建議四、服務(wù)和維護(hù)階段古籍整理掃描一、清單核對(duì)二、掃描加工三、圖像質(zhì)量檢測(cè)四、加工分類五、交接信息記錄圖像處理一、去污二、糾斜三、清晰度四、尺寸圖像版面分析一、文字圖像版面分析一二、插圖版面分析三、紋飾版面分析數(shù)據(jù)調(diào)整一、規(guī)范性和完整性檢查二、文字質(zhì)量檢查,文字差錯(cuò)率低于萬分之三成品數(shù)據(jù)提交一、圖像文件二、造字列表三、單層矢量PDF古籍生產(chǎn)平臺(tái)XML制作單層矢量PDF合成打版四、XML文件五、IDS描述文件六、古籍清單七、認(rèn)同字列表單頁(yè)圖像TIFF文件插圖TIFF文件全文識(shí)別和編改一、圖表信息處理二、標(biāo)引信息著錄三、認(rèn)同字記錄四、IDS信息描述五、貼圖處理—地方資料數(shù)據(jù)加工工藝流程根據(jù)地方資料文件全文轉(zhuǎn)換及版式還原的技術(shù)要求和工作特點(diǎn)制定如下工作流程:

地方資料數(shù)字化加工數(shù)據(jù)標(biāo)準(zhǔn)1.2.1圖像序號(hào)制作標(biāo)準(zhǔn)1全部頁(yè)面掃描成300DPI的彩色TIF圖像2圖像清晰,版心居中,無視覺傾斜,無污點(diǎn),無顏色失真現(xiàn)象。3圖像版心大小統(tǒng)一,圖像尺寸相同,圖像完整無缺損。4圖片分頁(yè)問題按實(shí)際頁(yè)展現(xiàn)。MARC文件包含有元數(shù)據(jù)項(xiàng)目的圖書索引信息,正確率須達(dá)到100%。PDF文件序號(hào)制作標(biāo)準(zhǔn)1在PDF還原過程中,對(duì)原書版式進(jìn)行一定的統(tǒng)一和規(guī)范處理,包括對(duì)魚尾、版框、版心和書口的處理按照原書還原。2所有版面文字均用宋體字還原,文字的顏色一律為黑色。文字的位置按原書還原。雙行小字和多行小字按原書版式和比例還原。3版面插圖、牌記、印章、草書和行草序按照?qǐng)D片處理,信息必須在XML文件中體現(xiàn)。4貼字圖均為二值圖像,按原書位置做貼圖處理,PDF文件采用100%顯示比例時(shí),貼字圖與其他文字大小相當(dāng),對(duì)貼字圖中的文字進(jìn)行IDS描述。5PDF要完整,保證無缺頁(yè)、重頁(yè),頁(yè)碼順序顛倒的情況發(fā)生。6生成的電子文檔格式是版式重構(gòu)PDF,每頁(yè)文件的大小不超過100K,圖像清晰。7PDF文檔保持原紙質(zhì)文檔簡(jiǎn)繁體屬性。8PDF文檔要符合相關(guān)的國(guó)際、國(guó)內(nèi)、行業(yè)標(biāo)準(zhǔn),文字錯(cuò)誤率低于萬分之三,生成版式重構(gòu)的單層PDF。必須加上采購(gòu)人版權(quán)水印。技術(shù)元數(shù)據(jù)標(biāo)準(zhǔn)針對(duì)需進(jìn)行加工的紙質(zhì)地方資料原始資料,建立基本屬性對(duì)應(yīng)的著錄項(xiàng)目,并生成基本地方資料附屬信息、目次信息等規(guī)范數(shù)據(jù),同時(shí)為規(guī)范數(shù)據(jù)建立相應(yīng)的代碼識(shí)別體系,該代碼識(shí)別體系將貫穿整個(gè)工程的信息交換和數(shù)據(jù)交換,避免出現(xiàn)信息和數(shù)據(jù)不一致的情況。結(jié)合計(jì)算元數(shù)據(jù)標(biāo)準(zhǔn)并通過智能檢測(cè)模塊可以有效的避免在數(shù)字化過程中可能出現(xiàn)的漏掃、重掃等情況。針對(duì)需進(jìn)行加工的地方資料,建立基本屬性對(duì)應(yīng)的著錄項(xiàng)目,并生成規(guī)范數(shù)據(jù),為各規(guī)范數(shù)據(jù)建立相應(yīng)的代碼識(shí)別體系,同時(shí)建立輔助信息標(biāo)引庫(kù)。本次加工的地方資料圖書所需著錄的字段如下表:圖書必備檢索字段A、書名B、責(zé)任者C、版本類型D、出版責(zé)任E、出版時(shí)間F、版本形式G、所屬叢書H、卷數(shù)I、卷次工程信息庫(kù)通過對(duì)地方資料紙質(zhì)資料和文檔進(jìn)行歸類整理,在技術(shù)元數(shù)據(jù)標(biāo)準(zhǔn)基礎(chǔ)上,根據(jù)工程各環(huán)節(jié)所需要公用的基礎(chǔ)信息,將地方資料的基礎(chǔ)著錄項(xiàng)目抽取成為資料內(nèi)部特征,建立信息標(biāo)引配置數(shù)據(jù)庫(kù)和相關(guān)流水線工藝文檔,制定項(xiàng)目評(píng)價(jià)標(biāo)準(zhǔn)和環(huán)節(jié)控制標(biāo)準(zhǔn)等。工程信息庫(kù)與方正業(yè)務(wù)流程管理系統(tǒng)掛接,工程信息庫(kù)在整個(gè)工程實(shí)施中會(huì)圍繞基礎(chǔ)信息,隨著數(shù)據(jù)流轉(zhuǎn)不斷增加相關(guān)的信息,通過方正業(yè)務(wù)流程管理系統(tǒng),可以實(shí)時(shí)的掌握每一批次、每本地方資料的生產(chǎn)進(jìn)展和所處的生產(chǎn)環(huán)節(jié),也能掌握到數(shù)據(jù)的狀態(tài)、收發(fā)時(shí)間、生產(chǎn)責(zé)任人等相關(guān)信息。管理元數(shù)據(jù)標(biāo)準(zhǔn)序號(hào)管理兀數(shù)據(jù)標(biāo)準(zhǔn)1每本地方資料建立一個(gè)文件夾(示例:SZFZ2908),按照地方資料卷的順序建立子文件夾(例如:00000001卷),該卷的圖片文件、PDF文件和XML文件都存放在此文件夾中按照流水累加編號(hào)(示例:SZFZ2908-00000001-00000001)。文件夾命名須包含圖書的完整編號(hào)和子文件夾流水號(hào)。2集外字表命名取每本地方資料后四位編號(hào)(示例:2098(國(guó)圖外字表))。3字頻統(tǒng)計(jì)列表名取每本地方資料后四位編號(hào)(示例:2098(字頻統(tǒng)計(jì)))4總PDF文件與總XML文件與地方資料文件同名(示例:SZFZ2908(總PDF)、SZFZ2908(總XML文件))5地方資料子冊(cè)PDF文件命名示例:SZFZ2908-00000001(第一冊(cè)子PDF)SZFZ2908-00000002(第二冊(cè)子PDF)1.3數(shù)字化工程管理、資料管理和工程信息預(yù)處理為保障地方資料數(shù)字化加工過程的有效性,成立工程管理部門。該部門按照地方資料數(shù)字化工程的需求,全面負(fù)責(zé)具體工程的實(shí)施,包括生產(chǎn)工藝調(diào)整,工程調(diào)度,組織具體的數(shù)字化及標(biāo)引著錄等生產(chǎn)工作,進(jìn)行環(huán)節(jié)控制,數(shù)據(jù)合成和測(cè)試,以及最終數(shù)據(jù)的提交。全面負(fù)責(zé)工程進(jìn)度和質(zhì)量、考核和評(píng)價(jià)環(huán)節(jié)銜接、協(xié)調(diào)銜接問題,幫助環(huán)節(jié)內(nèi)部整理影響進(jìn)度和質(zhì)量的因素,并出具各種進(jìn)度和質(zhì)量報(bào)告。建立整體工程的信息庫(kù),為整個(gè)生產(chǎn)流水線提供生產(chǎn)任務(wù)規(guī)劃。在工程完畢之后,負(fù)責(zé)回收原始資料并進(jìn)行整理歸還。對(duì)原始資料進(jìn)行歸類整理,并按圖書地方資料的書名、書號(hào)、作者、版別、出版時(shí)間、版次、頁(yè)數(shù)、加工后文件夾名等著錄項(xiàng)目的要求抽取資料內(nèi)部特征建立信息標(biāo)引配置數(shù)據(jù)庫(kù)和相關(guān)流水線工藝文檔,制定項(xiàng)目評(píng)價(jià)標(biāo)準(zhǔn)和環(huán)節(jié)控制標(biāo)準(zhǔn)等。加工前的準(zhǔn)備:1.3.1地方資料整理由方正項(xiàng)目經(jīng)理和用戶方指定人員進(jìn)行地方資料/卷的領(lǐng)用、歸還交接工作。地方資料實(shí)體出庫(kù)時(shí)應(yīng)由用戶方人員填寫“領(lǐng)用交接單”注明地方資料/卷類型、卷號(hào)、數(shù)量等具體信息。由我方接收人員清點(diǎn)后簽字確認(rèn)。最終歸還時(shí)以領(lǐng)用時(shí)的交接單作為標(biāo)準(zhǔn)核查無誤后才準(zhǔn)入庫(kù)。領(lǐng)用完畢后根據(jù)用戶方提供的工作單核對(duì)目錄,檢查地方資料質(zhì)量、保存狀況、缺失情況等等信息進(jìn)行登記反饋。1.3.2拆卷處理地方資料部分原則上一般不進(jìn)行拆卷處理,若因?yàn)樘厥馇闆r需要拆卷,在獲得用戶同意下,通過專業(yè)人員指導(dǎo)進(jìn)行。在拆卷過程中,如發(fā)現(xiàn)原案卷整理有問題的,比如文件順序明顯錯(cuò)誤、裝訂漏頁(yè)、裝訂壓字而右邊較寬等,經(jīng)請(qǐng)示用戶同意后我們會(huì)予以糾正。整個(gè)加工過程中不傷及頁(yè)面、損壞原文、不丟頁(yè)、混頁(yè)。地方資料頁(yè)面修整對(duì)地方資料頁(yè)面的褶皺、折角、折痕進(jìn)行平整處理,對(duì)于破損部分進(jìn)行裱糊處理,以防止在掃描工序中對(duì)紙張?jiān)斐啥蝹?。地方資料整理登記制作并填寫地方資料數(shù)字化加工過程交接登記表單,詳細(xì)記錄地方資料整理后每份資料的起始頁(yè)號(hào)和頁(yè)數(shù),登記信息隨著原始文件一起流轉(zhuǎn)保障地方資料在下一環(huán)節(jié)掃描過程中不出現(xiàn)漏掃和重掃的現(xiàn)象。1.4圖像掃描和預(yù)處理工作內(nèi)容假設(shè)加工周期為6個(gè)月,我們計(jì)劃安裝3臺(tái)零邊距掃描儀進(jìn)場(chǎng)進(jìn)行地方資料數(shù)字化的掃描工作,掃描儀選用虹光掃描儀,其特點(diǎn)是A3大幅面,結(jié)構(gòu)簡(jiǎn)潔而操作方便,600X1200dpi高光學(xué)分辨率,A3大幅面超快速掃描,并保證影像掃描的品質(zhì)與速度同時(shí)并具。專利設(shè)計(jì)的掃描儀正面端書刊零邊距放置全幅無損完美掃描方式,可以實(shí)現(xiàn)A3幅面書刊無損完整掃描。同時(shí)具有良好的產(chǎn)品性能,高可靠性,結(jié)實(shí)耐用,非常適合大量圖書、地方資料期刊等的不拆裝無損掃描數(shù)據(jù)加工。其指標(biāo)如下:按照地方資料標(biāo)明的順序掃描。對(duì)于附著在主頁(yè)上的小紙片作為另頁(yè)掃描,另頁(yè)掃描的命名時(shí)放在主頁(yè)之前。對(duì)于同一份地方資料中有批注存在的,以地方資料主要部分的清晰為準(zhǔn),需進(jìn)行灰度補(bǔ)償處理。掃描時(shí)為了保證地方資料資料的載體安全應(yīng)根據(jù)紙張情況選用合適的掃描生產(chǎn)線,對(duì)于紙張較薄或較脆容易破損的要使用平板掃描。4)使用300dpi掃描成彩色TIF圖像,作為原始的數(shù)字館藏形態(tài)(館藏圖像),在后續(xù)加工過程中根據(jù)實(shí)際情況在館藏圖像基礎(chǔ)上進(jìn)行抽線處理(抽線圖像)。特殊紙張或地方資料原件清晰度不高的,可通過增加分辨率,調(diào)整亮度、對(duì)比度等技術(shù)參數(shù),直至掃描圖像清晰為止。對(duì)于同一份地方資料筒子頁(yè),清晰度不同,特別是批注存在的,以文件主要部分的清晰為準(zhǔn)。保持上下左右四邊尺寸合理,邊距過寬的進(jìn)行裁邊,邊距過窄的進(jìn)行加寬;對(duì)于紙質(zhì)發(fā)黃,很多還沾有各種污漬,且地方資料信息中包含了諸如毛筆等多種類型的字跡,還有印鑒、插圖等圖形,通過手動(dòng)修整、調(diào)整閾值、調(diào)節(jié)色彩和對(duì)比度等處理,提高地方資料圖像的清晰度和美觀度,達(dá)到能清晰閱讀;對(duì)于珍槧善本可以采用地方資料專用的無接觸掃描儀進(jìn)行掃描或使用專用數(shù)碼相機(jī)進(jìn)行拍照獲取圖像。若原書有殘缺、污損等影響閱讀的情況,若掃描處理無法解決時(shí),在相應(yīng)版面處添加說明,同時(shí)在readme.txt文件中記錄說明,并及時(shí)與用戶聯(lián)系協(xié)商處理辦法。1.4.2特殊情況處理保護(hù)措施使用零邊距掃描儀,破損嚴(yán)重的地方資料使用拍照的方法數(shù)據(jù)備份出于對(duì)地方資料保護(hù)的需要,將地方資料資料掃描一套300DPI彩色TIF圖供用戶備份;可以滿足按需印刷的需求。同時(shí)生成一套300DPI的JPG文件做加工處理特殊頁(yè)掃描筒子頁(yè)中存在透紙的現(xiàn)象,可以在筒子頁(yè)中間插入白紙(最好用宣紙)后進(jìn)行掃描破損嚴(yán)重頁(yè)面采用無閃光燈拍照或者非接觸性掃描儀1.4.3影像監(jiān)控及存儲(chǔ)本項(xiàng)目中需數(shù)字化的地方資料主要是紙張,數(shù)字化工作人員可通過本系統(tǒng)直接進(jìn)行地方資料掃描,生成TIFF影像存儲(chǔ)。地方資料掃描平臺(tái)主要完成紙張文檔的掃描錄入,形成標(biāo)準(zhǔn)壓縮格式的電子影像文件。同時(shí),地方資料掃描平臺(tái)具有豐富的圖像處理功能,能監(jiān)控掃描質(zhì)量,如發(fā)現(xiàn)存在清晰度不夠、缺損、偏斜、缺頁(yè)等情況,能靈活地對(duì)重新掃描、補(bǔ)掃等進(jìn)行控制,同時(shí)系統(tǒng)具備輔助糾偏及圖像拼接功能,大大提高了掃描圖像的品質(zhì)與生產(chǎn)效率。館藏地方資料具有重要的史料價(jià)值和很高文化價(jià)值,是不可再生的寶貴財(cái)富,由于年代久遠(yuǎn),紙張極易風(fēng)化粉碎、殘破、變形、霉變,或不能進(jìn)行拆頁(yè),這類地方資料不能使用中高速掃描儀進(jìn)行掃描,可采用平板掃描儀進(jìn)行掃描,也可使用數(shù)碼相機(jī)進(jìn)行影像拍攝。對(duì)于幅面較大、超出掃描儀掃描范圍的地方資料,系統(tǒng)提供影像無縫拼接功能,即可將大幅面地方資料分成幾部分進(jìn)行掃描,最后使用軟件進(jìn)行拼接處理,形成完整的圖像。由于系統(tǒng)使用先進(jìn)的圖像處理及優(yōu)化技術(shù),拼接的圖像效果與完整掃描的圖像效果相近。推薦圖像格式:?jiǎn)雾?yè)的TIF影像捕獲軟件提供了很多已經(jīng)定義好的應(yīng)用設(shè)置,屏蔽實(shí)際硬件操作的控制。使系統(tǒng)支持TWAIN標(biāo)準(zhǔn)或者兼容ISIS接口標(biāo)準(zhǔn)的掃描儀(注:現(xiàn)在大部分掃描儀均遵循這兩種標(biāo)準(zhǔn)中的一種),因此本系統(tǒng)可以說支持現(xiàn)在市面上幾乎所有的高中低端掃描儀。影像捕獲軟件是一款32位的應(yīng)用程序,能夠充分利用操作系統(tǒng)如MicrosoftWindows和PC機(jī)的特性。同時(shí),基于圖標(biāo)的工具條,上下文敏感的菜單和在線的幫助的軟件操作的學(xué)習(xí)和培訓(xùn)變得更加簡(jiǎn)單。1.5影像處理工作內(nèi)容對(duì)地方資料圖像文件按照加工標(biāo)準(zhǔn)進(jìn)行圖像處理包括:去污、版心調(diào)整、糾斜和尺寸調(diào)整等等為后期版面分析和全文識(shí)別提供滿足要求的圖像文件。制作標(biāo)準(zhǔn)分類標(biāo)準(zhǔn)頁(yè)面尺寸同一本書的每一頁(yè)圖像版心大小統(tǒng)一,圖像尺寸相同圖像歪斜采用自動(dòng)或手動(dòng)糾偏功能,調(diào)整圖像角度。圖像偏斜度不超過1度,對(duì)方向不正確的圖像應(yīng)進(jìn)行旋轉(zhuǎn)還原,以符合閱讀習(xí)慣圖像清晰度圖像臟點(diǎn)、臟斑:對(duì)圖像頁(yè)面中出現(xiàn)的影響圖像質(zhì)量的雜點(diǎn)如黑點(diǎn)、墨線、黑框、黑邊等應(yīng)進(jìn)行去污處理。處理過程中應(yīng)遵循保持圖書原貌的原則。為了節(jié)省存儲(chǔ)空間,應(yīng)對(duì)圖像進(jìn)行裁邊處理,去除多余白邊字跡洇透采用字跡銳化的功能,清晰字跡筆畫圖像深淺不一采用平衡功能,調(diào)整圖像深淺一致大幅圖像處理圖像拼接處信息要完整,不能缺少信息圖像完整性圖像做到完整無缺實(shí)現(xiàn)方法影像處理軟件的多頁(yè)顯示功能最多可以在屏幕上一次顯示8個(gè)影像,便于在同時(shí)顯示多個(gè)影像和進(jìn)行質(zhì)量檢查。影像調(diào)整:在每個(gè)窗口中動(dòng)態(tài)地調(diào)整影像的大小。去除黑邊:去除影像周圍的黑邊,在掃描混合紙張的時(shí)候不用調(diào)整掃描的參數(shù)。糾偏:掃描過程中將歪斜的影像糾正,減少掃描后的處理?;译A補(bǔ)償:把二值圖像進(jìn)行256階的灰級(jí)化,從而進(jìn)行圖像縮小時(shí)利用象素點(diǎn)周圍的值進(jìn)行增強(qiáng),達(dá)到視覺上對(duì)內(nèi)容的識(shí)別。旋轉(zhuǎn):(90°,180°,270°)支持橫向掃描,使產(chǎn)量最大化。影像調(diào)整和編輯工具:擁有旋轉(zhuǎn),順序調(diào)整,刪除等操作。正反面合并:將正面和反面的單個(gè)影像合并成單個(gè)影像。劃分正反面:將一個(gè)長(zhǎng)文檔的引線劃分成效影像。例如,軟件可以將一張A3的紙張自動(dòng)分成兩張A4的紙張.同時(shí)效果也可以在屏幕上立刻顯示出來。用戶設(shè)置可以控制特殊應(yīng)用的存取和影像采集軟件的各種屬性。自動(dòng)識(shí)別掃描儀的SCSIID使得影像采集軟件能夠即插即用。特殊情況處理圖像拼接我公司自主研發(fā)的圖像拼接軟件,可以實(shí)現(xiàn)每個(gè)筒子頁(yè)的拼接圖像處理地方資料圖像一般只調(diào)整對(duì)比度、底色版面分析地方資料排版的字與字之間連接很緊密不利于識(shí)別,因此在版面分析中需要將每個(gè)字畫框隔離輸出數(shù)據(jù)通過精細(xì)加工和處理后生成和原始圖命名和存放規(guī)則一致的TIFF圖像。1.6版面分析和基礎(chǔ)信息提取工作內(nèi)容對(duì)圖像處理完成的圖像文件進(jìn)行版面分析和信息提取工作,主要標(biāo)注地方資料版面文字塊、圖像塊、頁(yè)面塊、紋飾塊和顏色信息等等版面信息,為后期版面識(shí)別和版面重構(gòu)提供數(shù)據(jù)基礎(chǔ)。制作標(biāo)準(zhǔn)分類標(biāo)準(zhǔn)版面畫框根據(jù)文字區(qū)域、插圖區(qū)域和紋飾區(qū)域進(jìn)行畫框批注、印章標(biāo)注對(duì)于版面中的批注、印章按照要求標(biāo)注為貼圖手寫“點(diǎn)”標(biāo)注對(duì)于版面中的后批注的“點(diǎn)”按照文字進(jìn)行標(biāo)注處理圖像屬性標(biāo)注標(biāo)注圖像的精度、圖像模式(黑白、灰度和彩色)地方資料書目數(shù)據(jù)著錄工作內(nèi)容對(duì)本項(xiàng)目承接的全部地方資料圖書按照地方資料冊(cè)為單位制作每本地方資料的書目清單以EXCEL格式文件輸出。圖書地方資料按照書名、書號(hào)、作者、版別、出版時(shí)間、版次、頁(yè)數(shù)、加工后文件夾名等著錄項(xiàng)目,要求信息準(zhǔn)確,無差錯(cuò)。制作標(biāo)準(zhǔn)分類標(biāo)準(zhǔn)書目數(shù)據(jù)格式地方資料制作完成后提供書目信息,采用EXCEL格式數(shù)據(jù)項(xiàng)按照書名、書號(hào)、作者、版別、出版時(shí)間、版次、頁(yè)數(shù)、加工后文件夾名等著錄文字正確率要求信息準(zhǔn)確,無差錯(cuò)使用方正元數(shù)據(jù)標(biāo)引模塊是對(duì)地方資料的元數(shù)據(jù)進(jìn)行標(biāo)引的工具制作完成后導(dǎo)出EXCEL格式文件。特殊情況處理標(biāo)準(zhǔn):?出版時(shí)間出現(xiàn)多次,以最近一次出版時(shí)間為著錄內(nèi)容?地方資料作者出現(xiàn)多人,需全部著錄數(shù)據(jù)整合與測(cè)試對(duì)每道工序進(jìn)行嚴(yán)格的測(cè)試,全面進(jìn)行工程質(zhì)量考核,評(píng)價(jià)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論