版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 PAGE PAGE 80房產(chǎn)檔案案數(shù)字化化清理方案案西安必特特思維軟軟件有限限公司二一一一年七月月目錄TOC o 1-3 h z u HYPERLINK l _Toc297818498 1 需求求 PAGEREF _Toc297818498 h 1 HYPERLINK l _Toc297818499 1.1 政策需需求 PAGEREF _Toc297818499 h 1 HYPERLINK l _Toc297818500 1.2 現(xiàn)實需需求 PAGEREF _Toc297818500 h 2 HYPERLINK l _Toc297818501 1.2.1 貴貴單位檔檔案現(xiàn)狀狀 PAGEREF
2、 _Toc297818501 h 2 HYPERLINK l _Toc297818502 1.2.2 檔檔案現(xiàn)存存問題 PAGEREF _Toc297818502 h 22 HYPERLINK l _Toc297818503 1.3 項目實實施效益益 PAGEREF _Toc297818503 h 3 HYPERLINK l _Toc297818504 2 分析析 PAGEREF _Toc297818504 h 4 HYPERLINK l _Toc297818505 2.1 我們對對數(shù)據(jù)清清理的理理解 PAGEREF _Toc297818505 h 4 HYPERLINK l _Toc2978
3、18506 2.1.1 數(shù)數(shù)據(jù)清理理的定義義 PAGEREF _Toc297818506 h 4 HYPERLINK l _Toc297818507 2.1.2 數(shù)數(shù)據(jù)清理理的實現(xiàn)現(xiàn)方式 PAGEREF _Toc297818507 h 66 HYPERLINK l _Toc297818508 2.1.3 數(shù)數(shù)據(jù)清理理與檔案案數(shù)字化化加工的的區(qū)別 PAGEREF _Toc297818508 h 77 HYPERLINK l _Toc297818509 2.1.4 技技術路線線 PAGEREF _Toc297818509 h 8 HYPERLINK l _Toc297818510 2.2 數(shù)據(jù)清清
4、理重點點和難點點 PAGEREF _Toc297818510 h 9 HYPERLINK l _Toc297818511 2.2.1 數(shù)數(shù)據(jù)清理理重點 PAGEREF _Toc297818511 h 99 HYPERLINK l _Toc297818512 2.2.2 數(shù)數(shù)據(jù)清理理難點 PAGEREF _Toc297818512 h 110 HYPERLINK l _Toc297818513 2.3 數(shù)據(jù)清清理關鍵鍵技術應應用 PAGEREF _Toc297818513 h 111 HYPERLINK l _Toc297818514 2.3.1 人人工智能能 PAGEREF _Toc29781
5、8514 h 11 HYPERLINK l _Toc297818515 2.3.2 語語義分析析 PAGEREF _Toc297818515 h 13 HYPERLINK l _Toc297818516 2.3.3檔案案分形 PAGEREF _Toc297818516 h 13 HYPERLINK l _Toc297818517 3 總體體設計 PAGEREF _Toc297818517 h 117 HYPERLINK l _Toc297818518 3.1 總體架架構 PAGEREF _Toc297818518 h 188 HYPERLINK l _Toc297818519 3.2 技術特特
6、點 PAGEREF _Toc297818519 h 21 HYPERLINK l _Toc297818520 3.3 性能指指標 PAGEREF _Toc297818520 h 211 HYPERLINK l _Toc297818521 4 技術術方案 PAGEREF _Toc297818521 h 222 HYPERLINK l _Toc297818522 4.1 檔案數(shù)數(shù)字化加加工 PAGEREF _Toc297818522 h 222 HYPERLINK l _Toc297818523 4.1.1 檔檔案整理理 PAGEREF _Toc297818523 h 22 HYPERLINK l
7、 _Toc297818524 4.1.2 檔檔案掃描描 PAGEREF _Toc297818524 h 23 HYPERLINK l _Toc297818525 4.1.3 數(shù)數(shù)據(jù)錄入入 PAGEREF _Toc297818525 h 24 HYPERLINK l _Toc297818526 4.2 建立邏邏輯幢PAGEREF _Toc297818526 h 339 HYPERLINK l _Toc297818527 4.2.1 數(shù)數(shù)據(jù)移植植 PAGEREF _Toc297818527 h 40 HYPERLINK l _Toc297818528 4.2.2 分分詞處理理 PAGEREF _T
8、oc297818528 h 41 HYPERLINK l _Toc297818529 4.2.3 分分形處理 PAGEREF _Toc297818529 h 44 HYPERLINK l _Toc297818530 4.2.4 分分形后處處理 PAGEREF _Toc297818530 h 466 HYPERLINK l _Toc297818531 4.3 建立自自然幢及及房屋落落地 PAGEREF _Toc297818531 h 500 HYPERLINK l _Toc297818532 4.3.1 分分幅編幢幢 PAGEREF _Toc297818532 h 51 HYPERLINK l
9、_Toc297818533 4.3.2 外外業(yè)調查查 PAGEREF _Toc297818533 h 55 HYPERLINK l _Toc297818534 4.3.3 自自然幢錄錄入 PAGEREF _Toc297818534 h 666 HYPERLINK l _Toc297818535 4.3.4 關關聯(lián)落地地 PAGEREF _Toc297818535 h 73 HYPERLINK l _Toc297818536 4.4 成果利利用 PAGEREF _Toc297818536 h 788 HYPERLINK l _Toc297818537 4.4.1 質質量檢查查 PAGEREF _
10、Toc297818537 h 78 HYPERLINK l _Toc297818538 4.4.2 生生成登記記簿 PAGEREF _Toc297818538 h 788 HYPERLINK l _Toc297818539 4.4.3 數(shù)數(shù)據(jù)利用用 PAGEREF _Toc297818539 h 78 HYPERLINK l _Toc297818540 5 項目目實施方方案 PAGEREF _Toc297818540 h 799 HYPERLINK l _Toc297818541 5.1 項目實實施計劃劃 PAGEREF _Toc297818541 h 79 HYPERLINK l _Toc2
11、97818542 5.2 項目管管理計劃劃 PAGEREF _Toc297818542 h 81 HYPERLINK l _Toc297818543 5.3 項目成成果移交交 PAGEREF _Toc297818543 h 82 HYPERLINK l _Toc297818544 5.4 項目管管理 PAGEREF _Toc297818544 h 822 HYPERLINK l _Toc297818545 5.4.1 項項目整合合管理 PAGEREF _Toc297818545 h 882 HYPERLINK l _Toc297818546 5.4.2 項項目范圍圍管理 PAGEREF _To
12、c297818546 h 883 HYPERLINK l _Toc297818547 5.4.3 項項目時間間管理 PAGEREF _Toc297818547 h 883 HYPERLINK l _Toc297818548 5.4.4 項項目進度度控制計計劃 PAGEREF _Toc297818548 h 844 HYPERLINK l _Toc297818549 5.4.5 項項目成本本管理 PAGEREF _Toc297818549 h 885 HYPERLINK l _Toc297818550 5.4.6 項項目質量量管理 PAGEREF _Toc297818550 h 885 HYPE
13、RLINK l _Toc297818551 5.4.7 質質量控制制的難點點及重點點 PAGEREF _Toc297818551 h 86 HYPERLINK l _Toc297818552 5.4.8 項項目小組組人員配配備 PAGEREF _Toc297818552 h 877 HYPERLINK l _Toc297818553 5.4.9 項項目設備備的組織織 PAGEREF _Toc297818553 h 88 HYPERLINK l _Toc297818554 5.4.10 項目安安全管理理 PAGEREF _Toc297818554 h 90需求政策需求求隨著我國國城鎮(zhèn)住住房制度度
14、改革的的深化、住房建建設步伐伐的加快快和住房房消費的的有效啟啟動,我我國房地地產(chǎn)行業(yè)業(yè)得到了了飛速發(fā)發(fā)展,在在國民經(jīng)經(jīng)濟建設設中發(fā)揮揮著巨大大的帶動動作用,并并已成為為了我國國的重要要支柱行行業(yè)。房房屋權屬屬登記檔檔案是房房地產(chǎn)行行政管理理部門在在房產(chǎn)登登記、調調查、測測繪、產(chǎn)產(chǎn)權轉移移、房屋屋變更等等房產(chǎn)權權屬管理理工作中中直接形形成的,有有保存價價值的文文字、圖圖表等不不同形式式的歷史史記錄,是是房屋權權屬登記記管理工工作的真真實記載載和重要要依據(jù)。記載房房屋物權權歸屬和和內容的的權屬檔檔案,具具有法律律效力,是是房地產(chǎn)產(chǎn)管理部部門和人人民法院院確認房房屋產(chǎn)權權、處理理房屋糾糾紛的重重要依
15、據(jù)據(jù)。20077年100月1日日,對房房地產(chǎn)權權屬登記記行為、登記信信息系統(tǒng)統(tǒng)都影響響深遠的的中華華人民共共和國物物權法(后后簡稱物物權法)正正式執(zhí)行行,其中中,第十十八條規(guī)規(guī)定權利利人、利利害關系系人可以以申請查查詢、復復制登記記資料,登登記機構構應當提提供。20088年,為為了貫徹徹落實物物權法,規(guī)規(guī)范房屋屋登記行行為,建建設部下下發(fā)了房房屋登記記辦法(建建設部令令第1668號),指指出“縣級以以上人民民政府建建設(房房地產(chǎn))主主管部門門應當加加強房屋屋登記信信息系統(tǒng)統(tǒng)建設,逐逐步實現(xiàn)現(xiàn)全國房房屋登記記簿信息息共享和和異地查查詢?!?為房房屋權籍籍檔案的的利用提提出了新新的要求求。為抑制過
16、過快上漲漲的房價價,國務務院再出出房地產(chǎn)產(chǎn)調控重重拳,220099年122月144日,溫家寶寶總理主主持召開開國務院院常務會會議上,就就促進房房地產(chǎn)市市場健康康發(fā)展提提出增加加供給、抑制投投機、加加強監(jiān)管管、推進進保障房房建設等等四大舉舉措,簡簡稱“國四條條”。20110年44月177日,國國務院關關于堅決決遏制部部分城市市房價過過快上漲漲的通知知(國發(fā)20110110號,簡稱“新新國十條條”)出出臺。在在重申加加強房地地產(chǎn)市場場監(jiān)管、維護正正常房地地產(chǎn)市場場秩序等等要求的的同時,首首次提出出了要根根據(jù)購房房人家庭庭當前擁擁有房屋屋套數(shù),執(zhí)執(zhí)行差別別化的信信貸政策策要求,并并在通知知中提出出“
17、加快個個人住房房信息系系統(tǒng)的建建設”。20100年6月月24日日,在“加快推推進全國國個人住住房信息息系統(tǒng)建建設”會議上上,齊驥驥副部長長發(fā)表的的講話中中提出“要充分分認識加加快個人人住房信信息系統(tǒng)統(tǒng)建設的的重要性性和緊迫迫性,并并且要理理清工作作思路,明明確工作作目標和和任務,狠狠抓落實實,扎實實推進個個人住房房信息系系統(tǒng)的建建設?!眰€人住住房信息息系統(tǒng)建建設的數(shù)數(shù)據(jù)基礎礎就是各各城市通通過數(shù)字字化清理理形成的的業(yè)務歷歷史數(shù)據(jù)據(jù)庫,因因此,進進行房產(chǎn)產(chǎn)檔案數(shù)數(shù)字化清清理也是是建設個個人住房房信息系系統(tǒng)的需需要。現(xiàn)實需求求貴單位檔檔案現(xiàn)狀狀目前貴單單位現(xiàn)存存紙質檔檔案萬卷,約約萬宗宗。其中中萬
18、宗宗檔案進進行了掃掃描;檔檔案數(shù)據(jù)據(jù)存儲在在系統(tǒng)統(tǒng)中,約約萬。檔案現(xiàn)存存問題檔案系統(tǒng)統(tǒng)信息不不完整由于在當當時辦理理業(yè)務時時,沒有有嚴謹?shù)牡匿浫胍?guī)規(guī)范,導導致檔案案系統(tǒng)中中很多信信息沒有有錄入,致致使信息息并不完完整。檔案系統(tǒng)統(tǒng)記載與與實際不不符在檔案系系統(tǒng)中,存存在有些些信息與與紙質檔檔案信息息不一樣樣的情況況。檔案系統(tǒng)統(tǒng)數(shù)據(jù)錄錄入不規(guī)規(guī)范同樣由于于業(yè)務辦辦理時沒沒有統(tǒng)一一嚴格的的錄入規(guī)規(guī)范,致致使檔案案系統(tǒng)中中的數(shù)據(jù)據(jù)相當?shù)牡牟灰?guī)范范。檔案系統(tǒng)統(tǒng)數(shù)據(jù)前前后不一一致在檔案系系統(tǒng)中,同同樣存在在數(shù)據(jù)前前后不一一致的情情況,如如同樣一一套房子子,前一一手和后后一手在在辦理業(yè)業(yè)務時錄錄入的信信息不
19、完完全一致致。檔案本身身記載信信息有誤誤上面介紹紹的都是是檔案系系統(tǒng)信息息的缺失失、不完完整、不不一致等等問題。其實除除了檔案案信息系系統(tǒng)的問問題以外外,檔案案本身也也存在著著很多問問題。由于檔案案是業(yè)務務辦理的的結果,每每個時期期業(yè)務辦辦理的規(guī)規(guī)則也不不盡相同同。而且且早時期期都采用用的手工工辦案方方式,因因此難免免會產(chǎn)生生一些錯錯誤。如此種種種,在手手工辦案案時代,由由于房產(chǎn)產(chǎn)權屬業(yè)業(yè)務的復復雜性,導導致檔案案本身發(fā)發(fā)生錯誤誤的情況況屢見不不鮮。項目實施施效益有利于貫貫徹落實實“個人住住房信息息系統(tǒng)”的建立立;有利于個個人所得得稅、房房產(chǎn)稅的的征收;有利于解解決歷史史遺留問問題掌握握現(xiàn)實狀
20、狀況;有利于貫貫徹房房屋登記記辦法和和建立房房屋登記記簿;有利于貫貫徹宏觀觀調控政政策;有利于提提高工作作效率;有利于降降低登記記風險;有利于加加強規(guī)范范化管理理;有利于協(xié)協(xié)助房屋屋普查工工作;有利于方方便群眾眾、服務務社會;有利于與與金融部部門協(xié)同同工作。分析我們對數(shù)數(shù)據(jù)清理理的理解解數(shù)據(jù)清理理的定義隨著計算算機技術術的飛速速發(fā)展和和信息技技術的深深入應用用,信息息量急劇劇膨脹,用戶積累了大量的電子數(shù)據(jù),這些數(shù)據(jù)記錄了用戶的工作成果,非常珍貴。由于錄入錯誤、部門合并以及業(yè)務規(guī)則隨著時間的推移而改變等因素,都會影響數(shù)據(jù)的質量。根據(jù)“垃圾進,垃圾出”的原理,為了支持正確的分析決策,就要求原始數(shù)據(jù)
21、完整準確。數(shù)據(jù)清理就是為了解決數(shù)據(jù)質量問題而提出的。數(shù)據(jù)清理在不同應用領域的要求不完全相同,很難有一致的定義,但總的來說,數(shù)據(jù)清理的目的是檢測數(shù)據(jù)中存在的錯誤和不一致,剔除或者改正它們,以提高數(shù)據(jù)的質量。在通常的的信息系系統(tǒng)開發(fā)發(fā)項目中中,數(shù)據(jù)據(jù)質量往往往只被被理解為為控制錯錯誤數(shù)據(jù)據(jù)的輸入入,即在在數(shù)據(jù)輸輸入程序序程序中中加入檢檢查和防防范機制制,保證證進入系系統(tǒng)的輸輸入都是是合法的的數(shù)據(jù)值值。但數(shù)數(shù)據(jù)質量量的真正正含義遠遠不止此此。從語義義角度而而言,數(shù)數(shù)據(jù)是事事實及意意義的結結合體,數(shù)數(shù)據(jù)質量量可以通通過正確確性、準準確性、不矛盾盾性、一一致性、完整性性、集成成性等幾幾個元素素來描述述。
22、按照照廣義的的數(shù)據(jù)質質量定義義,高質質量的數(shù)數(shù)據(jù)就是是指那些些適合于于用戶使使用的數(shù)數(shù)據(jù)。常常見有質質量問題題的數(shù)據(jù)據(jù)主要包包括不完完整數(shù)據(jù)據(jù)、錯誤誤數(shù)據(jù)和和重復數(shù)數(shù)據(jù)三類類。不完完整數(shù)據(jù)據(jù)的特征征是一些些應有的的信息缺缺失,如如產(chǎn)權人人身份證證號空缺缺等。錯錯誤數(shù)據(jù)據(jù)產(chǎn)生的的原因是是業(yè)務系系統(tǒng)不夠夠健全,在在接收輸輸入后沒沒有進行行判斷而而直接寫寫入后臺臺數(shù)據(jù)庫庫。錯誤誤值包括括輸入錯錯誤和錯錯誤數(shù)據(jù)據(jù),輸入入錯誤是是由原始始數(shù)據(jù)錄錄入人員員疏忽而而造成的的,而錯錯誤數(shù)據(jù)據(jù)大多是是由一些些客觀原原因引起起的,例例如業(yè)務務類型定定義不規(guī)規(guī)范等。異常數(shù)數(shù)據(jù)是指指所有記記錄中如如果一個個或幾個個字
23、段間間絕大部部分遵循循某種模模式,其其它不遵遵循該模模式的記記錄,如如身份證證字段輸輸入信息息位數(shù)不足足或超出出規(guī)定的的長度等等。重復復數(shù)據(jù)也也就是“相似重重復記錄錄”,指同同一個現(xiàn)現(xiàn)實實體體在數(shù)據(jù)據(jù)庫集合合中用多多條不完完全相同同的記錄錄來表示示,由于于它們在在格式、拼寫上上的差異異,導致致數(shù)據(jù)庫庫系統(tǒng)不不能正確確識別。從狹義義的角度度看,如如果兩條條記錄在在某些字字段的值值相等或或足夠相相似,則則認為這這兩條記記錄互為為相似重重復。數(shù)數(shù)據(jù)質量量的問題題并不會會突然之之間顯現(xiàn)現(xiàn)出來,很很多是歷歷史遺留留問題,加加上一些些主觀或或客觀因因素所造造成的,諸諸如系統(tǒng)統(tǒng)平臺的的不一致致,缺乏乏規(guī)范的
24、的操作流流程和標標準,數(shù)數(shù)據(jù)處理理人員水水平的差差異,組組織缺乏乏數(shù)據(jù)質質量監(jiān)督督管理措措施等?;谝陨仙细拍钗覀儌兛梢越o給出廣義義的數(shù)據(jù)據(jù)清理的的定義:利用相關信息技術術如數(shù)理理統(tǒng)計、人工智智能、數(shù)數(shù)據(jù)分形形等預定定義清理理規(guī)則,對數(shù)據(jù)源進行處理,補充完整缺失數(shù)據(jù),規(guī)范不一致數(shù)據(jù),清除錯誤數(shù)據(jù)和重復數(shù)據(jù),從而提高數(shù)據(jù)的質量。具體到房房產(chǎn)檔案案數(shù)據(jù)清清理,包包括檔案案數(shù)字化化、輸入入、處理理和輸出出三部分分。檔案數(shù)字字化:房房屋登記記和交易易的紙質質檔案通通過整理理、掃描描、錄入入的方式式,生成成電子圖圖片、非非結構化化數(shù)據(jù),并并為后續(xù)續(xù)清理工工作提供供基礎數(shù)數(shù)據(jù)。輸入:把把檔案數(shù)數(shù)字化生生成
25、的數(shù)數(shù)據(jù)移植植到中間間庫;處理:11、在中中間庫,采采用智能能算法(分分詞、分分形等)生生成樓盤盤表和基基于樓盤盤表的案案例上下下手關系系、權利利人和物物權(所所有權、抵押權權、用益益權和限限制權);2、采采用地理理信息技技術(GGIS)對照檔案數(shù)據(jù)到現(xiàn)場進行實地勘察,實現(xiàn)樓棟落地。輸出:把把樓盤表表、樓盤盤表和宗宗地的關關系導出出到業(yè)務務庫和檔案案庫。數(shù)據(jù)清理理的實現(xiàn)現(xiàn)方式數(shù)據(jù)清理理的實現(xiàn)現(xiàn)方式通通常有以以下幾種種:手工實現(xiàn)現(xiàn)通過人工工檢查,理理論上只只要投入入足夠的的人力、物力、財力和和時間,也也能發(fā)現(xiàn)現(xiàn)所有錯錯誤,但但效率低低下。尤尤其在大大數(shù)據(jù)量量的情況況下,幾幾乎是不不可能的的。定制
26、開發(fā)發(fā)專用的的數(shù)據(jù)清清理軟件件目前,國國內外針針對數(shù)據(jù)據(jù)清理已已提出了了一些有有效的清清理算法法,或根根據(jù)某種種算法針針對特定定應用領領域開發(fā)發(fā)出一些些專門的的清理軟軟件。但但是,由由于數(shù)據(jù)據(jù)清理的的復雜性性,對不不同的數(shù)數(shù)據(jù)源,要要求數(shù)據(jù)據(jù)清理適適應不同同的數(shù)據(jù)據(jù)類型、數(shù)據(jù)數(shù)數(shù)量及具具體業(yè)務務。這種種方法能能解決某某個特定定的問題題,但不不夠靈活活,特別別是清理理過程需需要反復復進行多多次(一一般來說說,數(shù)據(jù)據(jù)清理一一遍就達達到要求求的很少少),導導致程序序復雜。清理過過程變化化時,工工作量大大,而且且這種方方法也沒沒有充分分利用目目前數(shù)據(jù)據(jù)庫提供供的強大大數(shù)據(jù)處處理能力力?;陂_放放式框架
27、架的數(shù)據(jù)據(jù)清理平平臺如何把數(shù)數(shù)據(jù)質量量問題與與用戶業(yè)業(yè)務領域域知識結結合起來來,設計計一個能能夠把數(shù)數(shù)據(jù)清理理與特定定業(yè)務領領域知識識結合起起來的模模型框架架已勢在在必行,人人工智能能的發(fā)展展則給這這個領域域帶來了了新的生生機。必特思維維基于長達達二十年年的房地地產(chǎn)管理理信息系系統(tǒng)開發(fā)發(fā)經(jīng)驗和和取自數(shù)數(shù)百家用用戶的房房地產(chǎn)管管理專業(yè)業(yè)知識,集集合人工工智能、語義分分析、檔檔案分形形等國際際最前沿沿的ITT技術,創(chuàng)創(chuàng)新性的的開發(fā)出出了國內內第一個個專門針針對房地地產(chǎn)管理理領域的的開放式式的數(shù)據(jù)據(jù)清理平平臺。該該平臺利利用專家家系統(tǒng)的的外殼,便便于規(guī)則則的表示示和利用用,規(guī)則則庫和算算法庫是是其核
28、心心。在對對數(shù)據(jù)源源進行數(shù)數(shù)據(jù)處理理之前,通通過預定定義清理理規(guī)則和和選擇合合適的算算法,使使平臺具具有較強強的通用用性和適適應性。在數(shù)據(jù)據(jù)清理過過程中,由由于很多多錯誤不不可預料料,不可可能所有有錯誤都都被自動動清理,人人工交互互是必要要的。當當數(shù)據(jù)清清理過程程中出現(xiàn)現(xiàn)異常錯錯誤時,系系統(tǒng)會給給出相應應的警告告信息,提提示用戶戶手工處處理。另另外,基基于開放放式框架架的數(shù)據(jù)據(jù)清理平平臺還具具有開放放的規(guī)則則庫和算算法庫,可可不斷擴擴充新的的數(shù)據(jù)清清理算法法,并可可根據(jù)具具體業(yè)務務定義所所需的清清理規(guī)則則,能夠夠大大提提高數(shù)據(jù)據(jù)清理的的工作效效率。數(shù)據(jù)清理理與檔案案數(shù)字化化加工的區(qū)區(qū)別綜上所述
29、述,數(shù)據(jù)據(jù)清理是是一項復復雜的系系統(tǒng)工程程,它的的專業(yè)性性和技術術性要求求不言而而喻,然而在在實際工工作中并并沒有得得到足夠夠的重視視。有些人人認為數(shù)數(shù)據(jù)清理理是一個個需要大大量勞動動力的過過程,往往往容易易將它與與檔案數(shù)數(shù)字化加加工這一一勞動密密集型工工作混淆淆起來,而而忽視了了其中所所蘊含的的技術含含量。其其實不然然,檔案案數(shù)字化化加工的主主要目的的是通過過掃描、錄入等等方式將將用戶的的紙質檔檔案轉化化為電子子影像檔檔案,方方便查詢詢。雖然然在這一一過程中中也會借借助于一一些簡單單的軟件件工具來來進行數(shù)數(shù)據(jù)輸入入輸出處處理,但但數(shù)據(jù)質質量基本本上還是是靠人工工檢查而而不是依依托嚴密密的邏輯
30、輯校驗算算法。與與之相反反,數(shù)據(jù)據(jù)清理的的原則則則是最大大限度的的發(fā)揮計計算機的的數(shù)據(jù)處處理能力力,減少少人工的的工作量量。簡單單地說,檔檔案數(shù)字字化加工工是人工工為主,軟軟件為輔輔;數(shù)據(jù)據(jù)清理則則是軟件件為主,人人工為輔輔。因此此,數(shù)據(jù)據(jù)清理與與檔案數(shù)數(shù)字化加加工在形形式上雖雖有相似似之處,但但其本質質上是完完全不同同的。技術路線線具體工作作分為三三大部分分,分別別是:檔檔案數(shù)字字化加工工,建立邏邏輯幢,建建立自然然幢及房房屋落地地。檔案數(shù)字字化包括檔案案整理和和檔案掃掃描和檔檔案錄入入三個部部分,將將對登記記和交易易的紙質質檔案拆拆分后進進行掃描描,形成成電子圖圖片。再再按照數(shù)數(shù)據(jù)清理理要
31、求和和數(shù)據(jù)錄錄入規(guī)范范,對紙紙質檔案案數(shù)據(jù)進進行錄入入。建立邏輯輯幢建立邏輯輯幢包括括以下內內容:(1)數(shù)數(shù)據(jù)移植植將錄入的的檔案數(shù)數(shù)據(jù)移植植到數(shù)據(jù)據(jù)清理數(shù)數(shù)據(jù)庫。(2)房房屋組棟棟通過分詞詞、分形形等軟件件智能算算法,自自動建立立邏輯幢幢。(3)登登記關系系清理以組建的的邏輯幢幢樓盤表表為基礎礎,對存存在于數(shù)數(shù)據(jù)庫的的登記數(shù)數(shù)據(jù)按照照登記的的前后手手順序進進行清理理,建立立起房屋屋與登記記業(yè)務之之間的唯唯一對應應關系。建立自然然幢及房房屋落地地建立自然然幢及房房屋落地地工作包包含以下下內容:(1)建建立自然然幢通過開展展外業(yè)調調查,組組建自然然幢樓盤盤表。(2)房房屋落地地將組建的的自然幢幢
32、樓盤表表與地籍籍圖上的的建筑物物圖元進進行關聯(lián)聯(lián)。數(shù)據(jù)清理理重點和和難點數(shù)據(jù)清理理重點數(shù)據(jù)的完完整性此次數(shù)據(jù)據(jù)清理形形成的房房產(chǎn)基礎礎數(shù)據(jù),是是業(yè)務系系統(tǒng)運行行的基礎礎。數(shù)據(jù)據(jù)錄入的的完整性性、準確確性直接接影響到到數(shù)據(jù)清清理的成成敗和業(yè)業(yè)務系統(tǒng)統(tǒng)運行的的效果。尤其房房屋信息息、土地地信息、權利人人基本信信息等,它們們是房屋屋登記薄薄生成的的基本要要求,因因此,必必須盡可可能地全全面采集集這些信息息,才能能確保數(shù)數(shù)據(jù)清理理達到預預期的目目的。數(shù)數(shù)據(jù)清理理將完善善和統(tǒng)一一基礎數(shù)數(shù)據(jù),使使基礎數(shù)數(shù)據(jù)更加加真實和和準確,為為下一步步新業(yè)務務系統(tǒng)順順利實施施奠定基基礎。因此本項項目的重重點之一一是數(shù)據(jù)
33、的完完整性。數(shù)據(jù)的規(guī)規(guī)范化按照數(shù)據(jù)據(jù)大集中中、應用用大集中中的設計計思想,房產(chǎn)數(shù)據(jù)信息系統(tǒng)所有數(shù)據(jù)要統(tǒng)一規(guī)劃、統(tǒng)一標準。在本項目實施過程中需要通過一定的技術手段將現(xiàn)有系統(tǒng)中不規(guī)范、不統(tǒng)一的數(shù)據(jù),按事先制定的房產(chǎn)數(shù)據(jù)標準進行規(guī)范。因此,本本項目的的重點之之二是數(shù)據(jù)據(jù)的規(guī)范范化。數(shù)據(jù)的安安全性房產(chǎn)檔案案數(shù)據(jù)安全全的重要要性,如如何強調調都不為為過。數(shù)據(jù)安全全關系到到業(yè)務活活動正常常開展,關關系權利利人的切切身利益益、關系系到社會會的穩(wěn)定定,在數(shù)數(shù)據(jù)清理理過程中中數(shù)據(jù)的的安全性性必須得得到保證證。因此,本本項目的的重點之之三就是保保證數(shù)據(jù)據(jù)的安全全性。數(shù)據(jù)清理理難點項目的質質量保障障保證數(shù)據(jù)據(jù)質量是
34、是數(shù)據(jù)清清理工作作開展的的前提,對于海量的檔案數(shù)據(jù),上千萬個的字段記錄,以及大量的圖片,案例與案例,案例與房,房和樓,樓和樓的關系的質檢,必須依托于計算機的邏輯檢驗并輔以人工的重點檢查。 如何利用用技術手手段和管管理機制制保證數(shù)數(shù)據(jù)清理理的質量量是本項項目首先先要解決決的難點點。項目的進進度控制制數(shù)據(jù)清理理項目工工作量大大,要想想在合理理的時間間內完成成,必須須最大限限度的發(fā)發(fā)揮計算算機的數(shù)數(shù)據(jù)處理理優(yōu)勢,盡盡量減少少人工處處理的工工作內容容,這也也是本項項目需要要解決的的一個難難點。項目管理理與協(xié)調調數(shù)據(jù)清理理涉及用用戶的多多個業(yè)務務部門,涉涉及面廣廣,參與與人員眾眾多,尤其還還涉及到到外業(yè)
35、測測繪調查查,需要要大量協(xié)協(xié)調和配配合工作作,任何何一個環(huán)環(huán)節(jié)協(xié)調調不好配配合不積積極都會會影響項項目的整整體推進進,影響響數(shù)據(jù)清理的的質量和和進度。因此本項項目的難難點之一一是加強強各相關關單位人人員的管管理和協(xié)協(xié)調。清理工具具的開發(fā)發(fā)對于海量量數(shù)據(jù)的的清理,要求實施單位能夠提供性能先進的清理軟件工具,清理工具的開發(fā)除了要有扎實的房地產(chǎn)管理專業(yè)知識和成熟的智能算法外,還要對用戶現(xiàn)有的業(yè)務系統(tǒng)非常的熟悉和了解,才能有針對性的研發(fā)出合適的清理工具,實現(xiàn)數(shù)據(jù)的順利移植和輸出。此外,還需具有測繪能力,而想達到這一點,絕大部分公司是難以做到的,這也是此次項目的難點之一。清理設備備的組織織清理設備備在房
36、產(chǎn)產(chǎn)檔案數(shù)數(shù)據(jù)清理理整合當當中,起起到非常常重要的的作用,如如何在短短時間內內組織大大量的設設備,滿滿足用戶戶的需要要,將是是數(shù)據(jù)清清理工作作需要解解決的又又一大難難點。清理人員員的組織織和清理設設備的組組織類似似,清理理人員的的組織也也是數(shù)據(jù)據(jù)清理工工作面臨臨的又一一大難點點,如何何在短時時間內組組織足夠夠的專業(yè)業(yè)人員,保保證項目目的順利利實施,將將是數(shù)據(jù)據(jù)清理工工作的重重要難點點。上述難點點,我們們將在后后續(xù)的方方案中一一一提出出解決方方法。數(shù)據(jù)清理理關鍵技技術應用用必特思維維開發(fā)的的數(shù)據(jù)清清理平臺臺中采用用了多種種先進的的IT技技術,如如人工智智能、語語義分析析、檔案案分形等,下下面我們
37、們分別介介紹。人工智能能人工智能能(Arrtifficiial Inttellligeencee) ,英英文縮寫寫為AII。它是是研究、開發(fā)用用于模擬擬、延伸伸和擴展展人的智智能的理理論、方方法、技技術及應應用系統(tǒng)統(tǒng)的一門門新的技技術科學學。 人人工智能能是計算算機科學學的一個個分支,它它企圖了了解智能能的實質質,并生生產(chǎn)出一一種新的的能以人人類智能能相似的的方式做做出反應應的智能能機器,該該領域的的研究包包括機器器人、語語言識別別、圖像像識別、自然語語言處理理和專家家系統(tǒng)等等。人工智能能在計算算機上實實現(xiàn)時有有2種不不同的方方式。一一種是采采用傳統(tǒng)統(tǒng)的編程程技術,使使系統(tǒng)呈呈現(xiàn)智能能的效果果
38、,而不不考慮所所用方法法是否與與人或動動物機體體所用的的方法相相同。這這種方法法叫工程程學方法法(Ennginneerringg appprooachh),它它已在一一些領域域內作出出了成果果,如文文字識別別、電腦腦下棋等等。另一一種是模模擬法(MModeelinng aapprroacch),它它不僅要要看效果果,還要要求實現(xiàn)現(xiàn)方法也也和人類類或生物物機體所所用的方方法相同同或相類類似。人工智能能的定義義可以分分為兩部部分,即即“人工”和“智能”?!叭斯ぁ北容^好好理解,爭爭議性也也不大。有時我我們會要要考慮什什么是人人力所能能及制造造的,或或者人自自身的智智能程度度有沒有有高到可可以創(chuàng)造造人
39、工智智能的地地步,等等等。但但總的來來說,“人工系系統(tǒng)”就是通通常意義義下的人人工系統(tǒng)統(tǒng)。 關于什么么是“智智能”,就就問題多多多了。這涉及及到其它它諸如意意識(cconsscioousnnesss)、自自我(sselff)、思思維(mmindd)(包包括無意意識的思思維(uuncoonscciouus_mmindd)等等等問題。人唯一一了解的的智能是是人本身身的智能能,這是是普遍認認同的觀觀點。但但是我們們對我們們自身智智能的理理解都非非常有限限,對構構成人的的智能的的必要元元素也了了解有限限,所以以就很難難定義什什么是“人人工”制制造的“智智能”了了。因此此人工智智能的研研究往往往涉及對對
40、人的智智能本身身的研究究。其它它關于動動物或其其它人造造系統(tǒng)的的智能也也普遍被被認為是是人工智智能相關關的研究究課題。 人工智能能目前在在計算機機領域內內,得到到了愈加加廣泛的的重視。在數(shù)據(jù)據(jù)清理過過程中,我我們可以以利用人人工智能能技術實實現(xiàn)如圖圖像自動動更名等等一些自自動化處處理,提提高數(shù)據(jù)據(jù)錄入的的效率。語義分析析語義分析析(Seemannticc Annalyysiss )是語言分分析的一一個分支支,目的的是根據(jù)據(jù)上下文文辨識一一個多義義詞在指指定句子子中的確確切意義義,以及及根據(jù)一一個句子子的句法法結構和和其中各各詞項的的詞義推推導出這這個句子子的句義義表達式式。在自自然語言言理解和
41、和機器翻翻譯中,用用來表達達句義的的方式很很多,常常見的有有:一階階謂詞邏邏輯,語語義網(wǎng)絡絡,格框框架等等等。語義義分析的的方法也也會因采采用的語語義學理理論和句句義表達達方式的的不同而而不同。語義分析析的應用用之一是是進行自自動分類類。例如如,在數(shù)數(shù)據(jù)清理理中我們們可以利利用語義義分析技技術對房房屋的坐坐落信息息進行自自動分類類以輔助助建立樓樓盤表,如如海棠路路1號院院1-22-3-4,我我們可以以理解為為1號樓樓2單元元3層44號,也也可以理理解為11號樓22層3單單元4號號,諸如如此類的的坐落組組合最多多可達3325種種。利用語語義分析析中的分詞詞技術,我我們可以以找出最最合理的的幾種組
42、組合,縮縮小范圍圍,減少少人工判判斷的工工作量。檔案分形形“分形” FRRACTTAL一一詞是美美籍法國國數(shù)學家家曼德爾爾布羅特特(B.B.MManddelbbrott)教授授于19975年年首先提提出的。分形理論論是200世紀770年代代科學上上的三大大發(fā)現(xiàn)(耗散結結構,混混沌和分形論)之一,它它與混沌沌可以看看成是繼繼相對論論和量子子力學之之后的本本世紀物物理學的的第三次次革命。 分形是一一種具有有自相似似特性的的現(xiàn)象、圖象或或者物理理過程。也就是是說,在在分形中,每每一“組成部部分”都在特特征上和和“整體”相似,只只僅僅是是變小了了一些而而已。讓我們來來看下面面的一個個例子。下圖是是一棵
43、厥厥類植物物,仔細細觀察,你你會發(fā)現(xiàn)現(xiàn),它的的每個枝枝杈都在在外形上上和整體體相同,僅僅僅在尺尺寸上小小了一些些。而枝枝杈的枝枝杈也和和整體相相同,只只是變得得更加小小了。那那么,枝枝杈的枝枝杈的枝枝杈呢?自不必必贅言。 目前分形形理論已已成為一一門重要要的新學學科,已已被廣泛泛應用到到自然科科學和社社會科學學的幾乎乎所有領領域。上圖看似似簡單的的外表下下隱藏著著復雜的的水晶體體北京京SOHHO尚都承襲襲了建筑筑師和后后現(xiàn)代建建筑卓越越的詮釋釋者查爾爾斯詹克斯斯所稱之之“復雜的的分形結構構建筑”理念。 用潘潘石屹的的話說,就就是“墻壁、天花板板、窗戶戶、樓梯梯,這里里面沒有有一條線線是直的的”
44、。同樣,在在房地產(chǎn)產(chǎn)管理領領域也存存在著分分形理論論的應用用基礎。物權:權利人+物+權利內容權利人+物+權利內容所有權:權利人+物+權利內容擔保權:權利人+物+權利內容權利人+物+權利內容用益權:權利人+物+權利內容權利人+物+權利內容權利抵押權:權利人+物+權利內容典權:權利人+物+權利內容地役權:權利人+物+權利內容權利人+物+權利內容地上權:權利人+物+權利內容如上圖所所示,每每一種物物權的部部分和它它的整體體一樣,都都由三部部分構成成。這就就是我們們采用分分形方法法的依據(jù)據(jù)和秘密密。那么什么么是檔案案分形呢?首先,我我們來描描述五個個基本概概念:檔檔案、房房地產(chǎn)權權屬檔案案、案例例、資
45、源源和權利利。檔案:是是指過去去和現(xiàn)在在的國家家機構、社會組組織以及及個人從從事政治治、軍事事、經(jīng)濟濟、科學學、技術術、文化化、宗教教、等活活動直接接形成的的對國家家和社會會有保存存價值的的各種文文字、圖圖表、聲聲像等不不同形式式的“歷史記記錄”。(中中華人民民共和國國檔案法法)。房地產(chǎn)權權屬檔案案(以下下簡稱,房房地產(chǎn)檔檔案):是城市市房地產(chǎn)產(chǎn)行政管管理部門門在房地地產(chǎn)權屬屬登記、調查、測繪、權屬轉轉移、變變更等房房地產(chǎn)權權屬管理理工作中中直接形形成的有有保存價價值的文文字、圖圖表、聲聲像等不不同形式式的歷史史記錄,是是城市房房地產(chǎn)權權屬登記記管理工工作的真真實記錄錄和重要要依據(jù)。(城城市房
46、地地產(chǎn)權屬屬檔案管管理辦法法)。案例:即即業(yè)務。其單位位是宗,即即一手業(yè)業(yè)務。例例如,初初始登記記。資源:是是指房地地產(chǎn)權利利人(人人);稅稅費價格格(財);樓盤、證書(物物);辦辦理時間間(時間間);房房屋座落落(空間間)。例例如,老老王,西西大街222號樓樓1單元元5011室。權利:是是指從權權利人的的角度看看,權利利人與其其他資源源的關系系。例如如,小張張對西大大街222號樓11單元5501室室具備所所有權。有了上述述五個概概念,就就可以對對檔案分分形進行行定義了了。檔案分形形:是指指通過一一定的算算法,對對房地產(chǎn)產(chǎn)檔案數(shù)數(shù)據(jù)進行行處理,最最終建立立:正確確的案例例上下手手關系、統(tǒng)一的的
47、資源(權權利人、樓盤等等)、明明晰的權權利(物物權所有權權、擔保保權和用用益權),最最終形成成“房屋登登記簿”的過程程??傮w設計計經(jīng)過上述述分析,房產(chǎn)檔檔案數(shù)字字化清理理整合具體體工作內內容可分分為檔案案數(shù)字化化加工、建立邏邏輯幢(包包括數(shù)據(jù)據(jù)移植、數(shù)據(jù)錄錄入、分分詞處理理、檔案案分形)、建立自自然幢及及房屋落落地(包包括分幅幅編幢、外業(yè)調調查、自自然幢錄錄入、房房屋落地地、數(shù)據(jù)據(jù)關聯(lián)),并并且清理理完成的的房產(chǎn)檔案案數(shù)據(jù),能夠在后續(xù)的成果利用中滿足業(yè)務系統(tǒng)運行的需要。檔案數(shù)字字化清理理整合流程程示意圖圖必特思維維基于長長達二十十年的房房地產(chǎn)管管理信息息系統(tǒng)開開發(fā)經(jīng)驗驗和取自自數(shù)百家家用戶的的
48、房地產(chǎn)產(chǎn)管理專專業(yè)知識識,集合合人工智智能、語語義分析析、檔案案分形等等國際最最前沿的的IT技技術,創(chuàng)創(chuàng)新性的的開發(fā)出出了國內內第一個個專門針針對房地地產(chǎn)管理理領域的的開放式式的數(shù)據(jù)據(jù)清理平平臺。該該平臺主主要包括括建立邏邏輯幢、建立自自然幢、關聯(lián)和和房屋落落地等功功能,能夠滿足足數(shù)據(jù)清清理工作作中相關關的各個環(huán)節(jié)節(jié)的工作作需要。下面以該該平臺為為基礎,來來介紹房房產(chǎn)檔案案數(shù)字化化清理整合合工作方方案。總體架構構數(shù)據(jù)清理理總體架架構圖如如下:總體架構構圖一圖 軟件件總體架架構(二二)技術特點點系統(tǒng)的技技術路線線包括:1、以標標準協(xié)議議和規(guī)范范為基礎礎,通過過適應性性服務組組件體系系結構保保證系
49、統(tǒng)統(tǒng)在分布布、異構構的多數(shù)數(shù)據(jù)庫和和操作系系統(tǒng)環(huán)境境下集成成運行。2、基于于面向服服務架構構應用系系統(tǒng),將將業(yè)務服服務作為為協(xié)調應應用系統(tǒng)統(tǒng)與用戶戶需求的的關鍵組組織原則則,3、提供供具有高高度靈活活性、伸伸縮性的的服務組組件平臺臺,包括括一系列列根據(jù)標標準協(xié)議議封裝、既可獨獨立提供供服務,也也可協(xié)同同工作的的各種服務務組件,達達到不需需要重新新編寫代代碼就可可以快速速實現(xiàn)各各類業(yè)務務的優(yōu)化化和流程程的再造造。4、基于于目前業(yè)業(yè)界公認認成熟、完善的的.NEET企業(yè)業(yè)級應用用開發(fā)框框架,采采用B/S三層層架構模模式,將將業(yè)務應應用邏輯輯抽取形形成服務務對象,單單獨存放放于應用用服務器器,客戶戶端
50、僅僅僅作為瀏瀏覽界面面,避免免了客戶戶機數(shù)目目的增加加和處理理負荷的的變動對對系統(tǒng)的的影響,提提高系統(tǒng)統(tǒng)可用性性和可擴擴展性。5、提供供基于數(shù)數(shù)字證書書的身份份認證、數(shù)字簽簽章安全全技術。性能指標標1、高效效性,系系統(tǒng)的響響應時間間非常迅迅速,保保證系統(tǒng)統(tǒng)使用具具有高效效性。2、可用用性,系系統(tǒng)所提提供的各各項功能能可實現(xiàn)現(xiàn)所要求求業(yè)務功功能的需需要,并并具有可可恢復性性操作的的功能。3、簡便便可操作作性,系系統(tǒng)界面面簡單美美觀,按按鈕符號號易辨認認。4、開放放性,開開放的數(shù)數(shù)據(jù)結構構設計。系統(tǒng)結結構設計計靈活、開放。對數(shù)據(jù)據(jù)實行標標準化管管理,規(guī)規(guī)范化存存儲,為為相關行行業(yè)的應應用提供供擴展
51、的的可能,另另一方面面,數(shù)據(jù)據(jù)庫設計計合理、規(guī)范。系統(tǒng)為為其他軟軟件開發(fā)發(fā)提供開開放的數(shù)數(shù)據(jù)接口口,滿足足數(shù)據(jù)的的共享和和交換要要求。5、可靠靠性,系系統(tǒng)提供供724小小時的連連續(xù)運行行,平均均年故障障時間少少于5天天;具有有較強的的災難恢恢復能力力,平均均故障修修復時間間少于224小時時。6、可擴擴展性,系系統(tǒng)具備備良好的的可擴展展性,可可靈活根根據(jù)業(yè)務務的需要要進行擴擴展。7、部署署方便性性,系統(tǒng)統(tǒng)采用BB/S架架構,具具有很好好的部署署方便性性。8、安全全性,系系統(tǒng)通過過注冊、身份驗驗證、權權限管理理、日志志管理、數(shù)字簽簽章等手手段,自自動記錄錄用戶的的訪問情情況和操操作記錄錄,保障障系
52、統(tǒng)安安全可靠靠。技術方案案必特思維維的檔案案數(shù)字化化清理整整合平臺臺,包括括檔案數(shù)數(shù)字化、邏輯幢幢建立、自然幢幢建立、邏輯幢幢與自然然幢關聯(lián)聯(lián)、自然然幢落地地等功能能,最終終實現(xiàn)房房產(chǎn)檔案案數(shù)據(jù)清清理整合合和檔案案清理成成果利用用。檔案數(shù)字字化加工工包括檔案案整理、檔案掃掃描、檔檔案錄入入三個部部分,對對登記和和交易的的紙質檔檔案拆分分后進行行掃描、裝訂、換封皮皮、增加加條碼,形形成電子子圖片。再按照照數(shù)據(jù)清清理標準準和數(shù)據(jù)據(jù)錄入規(guī)規(guī)范,對對紙質檔檔案數(shù)據(jù)據(jù)進行錄錄入。此環(huán)節(jié)屬屬于勞動動密集型型的工作作,以人人工為主主,軟件件為輔,技技術含量量較低。檔案整理理歷史檔案案可能存存在尚未未歸集或或
53、整理狀狀況達不不到檔案案管理要要求的情情況,所所以在進進行檔案案數(shù)字化化工作之之前,需需要按照照相關檔檔案管理理規(guī)范和和要求,對對歷史檔檔案進行行規(guī)范化化整理,主主要包含含:各類房地地產(chǎn)檔案案進行歸歸集清點點;對殘破、模糊、散落的的檔案進進行識別別修補并并裝訂成成冊;清理、修修正重建建檔、插插(并)錯檔的的資料,確確保資料料完整;編寫和標標注檔案案頁碼;按照科學學的方法法對房地地產(chǎn)檔案案進行立立卷、編編目、擺擺放。檔案掃描描功能定義義應用高速速掃描儀儀軟件,對對權屬檔檔案進行行掃描。系統(tǒng)通通過各種種參數(shù)的的設定,靈靈活調整整掃描方方式、圖圖片大小小、圖片片格式、存儲路路徑、命命名規(guī)則則、壓縮縮
54、模式等等,保障障掃描的的效率以以及質量量。工作界面面圖 掃描描格式的的設置圖 掃描描方式的的設置數(shù)據(jù)錄入入如果用戶戶沒有結結構化的的歷史檔檔案數(shù)據(jù)據(jù)庫,需需要進行行完整的的檔案數(shù)數(shù)據(jù)錄入入。如果用用戶已有有錄入到到數(shù)據(jù)庫庫的檔案案數(shù)據(jù),則則可以先先通過數(shù)數(shù)據(jù)移植植,將現(xiàn)現(xiàn)有檔案案數(shù)據(jù)導導入到清清理庫,再再根據(jù)統(tǒng)統(tǒng)一的數(shù)數(shù)據(jù)標準準進行數(shù)數(shù)據(jù)補錄錄。我公司利利用軟件件將掃描描的圖片片自動識識別后與與錄入字字段相關關聯(lián),實實現(xiàn)每個個字段與與圖片上上相應內內容對應應,極大大提高了了錄入的的質量和和效率。具體步驟驟如下:更名功能定義義本系統(tǒng)主主要完成成對掃描描檔案圖圖片的自自動更名名。通過建立立識別圖圖
55、片的參參照標準準、建立立圖片比比對作業(yè)業(yè),由系系統(tǒng)按照照參照標標準自動動比對后后,將圖圖片更名名為參照照標準中中的圖片片命名,生生成比對對結果。具體功能能如下:圖 圖像像處理用用例圖功能列表表一級功能能二級功能能定義參照標準準新建操作建立識別別頁的參參照標準準。一審對參照標標準進行行第一次次審核。二審對參照標標準進行行第二次次審核。三審對參照標標準進行行第三次次審核。反饋參照標準準注銷操作注銷識別別頁的參參照標準準。識別別頁的注注銷前提提是,識識別頁有有效,且且沒有與與識別頁頁相關的的宗圖像像一審對參照標標準進行行第一次次審核。二審對參照標標準進行行第二次次審核。三審對參照標標準進行行第三次次
56、審核。反饋參照標準準變更操作變更識別別頁的參參照標準準。識別別頁的變變更前提提是,識識別頁有有效,且且沒有與與識別頁頁相關的的宗圖像像一審對參照標標準進行行第一次次審核。二審對參照標標準進行行第二次次審核。三審對參照標標準進行行第三次次審核。反饋分宗更名名編頁新新建新建一共4步步操作:1、將將圖片從從磁盤復復制到數(shù)數(shù)據(jù)庫中中保存為為宗圖像像;2、識別”分宗紙紙“圖像,每每遇到一一頁分宗宗紙,建建立一個個宗序號號,并把把宗序號號與此宗宗下的圖圖像與宗宗號建立立一對多多的關系系。識別別分卷圖圖像和卷卷圖像中中的條碼碼,每遇遇到一頁頁分卷紙紙,與已已用于打打印輸出出的卷序序號進行行核對,把把卷序號號
57、與每卷卷下的宗宗及其圖圖像建立立一對多多的關系系。宗序序號為系系統(tǒng)自動動生成, 3、根根據(jù)定義義的參照照標準對對所有未未匹配的的圖像進進行匹配配然后更更名,更更名實質質上是建建立名稱稱(參照照標準)和和圖像數(shù)數(shù)據(jù)的對對應關系系;4、對于更更名后的的圖像,編編此圖像像在整宗宗內的頁頁碼;一審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第一次審審核。二審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第二次審審核。三審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第三次審審核。反饋分宗更名名編頁注注銷注銷注銷已有有卷或宗宗下的圖圖像。當當一卷或或一宗下下的圖像像都被注注銷,那那么該卷卷或該宗宗也隨之之被注銷銷
58、一審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第一次審審核。二審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第二次審審核。三審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第三次審審核。反饋分宗更名名編頁變變更變更變更已有有卷或宗宗下的圖圖像。包包括其與與名稱的的對應關關系、頁頁碼等屬屬性一審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第一次審審核。二審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第二次審審核。三審對卷號、宗號、圖像、頁名稱稱、頁碼碼進行第第三次審審核。反饋查詢統(tǒng)計工作界面面圖 參照照標準新新建界面面圖 參照照標準圖圖片上傳傳界面圖 分宗宗更名編編頁新建建界面【注解:系統(tǒng)根根據(jù)參照照標準
59、自自動分卷卷、分宗宗、進行行圖像更更名和頁頁碼排序序,未成成功識別別的圖像像可手工工更名?!繄D 分宗宗更名編編頁詳細細界面圖 圖像像手工更更名標注功能定義義在掃描圖圖像上標標注活動動、主體體、客體體、權利利內容等等信息,并并對標注注信息進進行三審審檢查。系統(tǒng)提供供在掃描描圖片上上對每手手登記案案例信息息的活動動信息、主體信信息、客客體信息息和權利利內容信信息用帶帶顏色(如如紅色)的的圓圈、方框等等圖形著著重標示示出應錄錄入或核核對的字字段,后后續(xù)錄入入或審核核工作人人員在錄錄入數(shù)據(jù)據(jù)或審查查數(shù)據(jù)時時,可方方便進行行對應,提提高工作作效率和和數(shù)據(jù)錄錄入的準準確性。系統(tǒng)支持持圓框、方框、矩形框框等
60、多種種圖形對對圖片上上某個需需要錄入入的信息息點(即即字段)進進行著重重標注。標注后后,再次次查詢掃掃描圖片片時,將將同時顯顯示掃描描圖片和和圖片上上的標注注信息;支持對標標注框的的顏色、線條粗粗細進行行設置;支持對掃掃描圖片片上的標標注框進進行刪除除的功能能;系統(tǒng)采用用工作流流平臺實實現(xiàn)了流流程化管管理模式式,從標標注、一一審、二二審直至至三審進進行全過過程的量量化管理理,每一一步都可可填寫意意見,如如果發(fā)現(xiàn)現(xiàn)問題可可回退上上一步驟驟,業(yè)務務流程可可隨時根根據(jù)需要要任意調調整,所所有操作作均記錄錄在業(yè)務務日志和和系統(tǒng)日日志中,便便于明晰晰責任。工作界面面圖 圖像像標注錄入功能定義義系統(tǒng)提供供
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院入住老人財務收支審計制度
- 企業(yè)內部培訓與外部合作制度
- 公共交通線路規(guī)劃管理制度
- 2026年金融從業(yè)資格模擬測試題庫
- 2026年財務成本控制與管理試題集
- 2026年營養(yǎng)師職業(yè)技能等級認定筆試題集
- 2026年教育心理學應用教師考核試題及答案
- 2026年攝影培訓協(xié)議(人像風光·實操版)
- 2026年冷鏈運輸協(xié)議(醫(yī)藥·GSP合規(guī)版)
- 2024年那坡縣幼兒園教師招教考試備考題庫帶答案解析(奪冠)
- DB21-T 4279-2025 黑果腺肋花楸農(nóng)業(yè)氣象服務技術規(guī)程
- 2026廣東廣州市海珠區(qū)住房和建設局招聘雇員7人考試參考試題及答案解析
- 2026新疆伊犁州新源縣總工會面向社會招聘工會社會工作者3人考試備考題庫及答案解析
- 廣東省汕頭市2025-2026學年高三上學期期末語文試題(含答案)(含解析)
- 110接處警課件培訓
- DB15∕T 385-2025 行業(yè)用水定額
- 火箭軍教學課件
- 新媒體運營專員筆試考試題集含答案
- 護理不良事件之血標本采集錯誤分析與防控
- 心臟電生理檢查操作標準流程
- 盾構構造與操作維護課件 2 盾構構造與操作維護課件-盾構刀盤刀具及回轉中心
評論
0/150
提交評論