版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
6月,2019公安行業(yè)標(biāo)準(zhǔn)地址庫建設(shè)方案01項(xiàng)目概述030204目錄CONTENT關(guān)鍵技術(shù)解決方案成功案例PART.01項(xiàng)目概述
項(xiàng)目概述—建設(shè)必要性公安行業(yè)背景4缺乏地址的標(biāo)準(zhǔn)化規(guī)范管理手段各業(yè)務(wù)系統(tǒng)的地址數(shù)據(jù)沒有統(tǒng)一標(biāo)準(zhǔn)化管理,缺失標(biāo)準(zhǔn)化規(guī)范的制定,導(dǎo)致各地址隨意組合錄入,形成了大量的冗余數(shù)據(jù)。Step01Step03Step02Step04地址數(shù)據(jù)分散在不同應(yīng)用系統(tǒng)、不同網(wǎng)絡(luò)環(huán)境中數(shù)據(jù)利用價(jià)值低警綜平臺(tái)、一標(biāo)三實(shí)、人口、旅館、網(wǎng)吧等數(shù)據(jù)散落在各應(yīng)用系統(tǒng)中,缺少大數(shù)據(jù)融合平臺(tái)將數(shù)據(jù)價(jià)值充分挖掘出來。需要結(jié)合GIS平臺(tái)實(shí)現(xiàn)可視化大量地址數(shù)據(jù)屬于非標(biāo)準(zhǔn)地址,缺少坐標(biāo)屬性,大數(shù)據(jù)量的地址數(shù)據(jù)根本無法實(shí)際在業(yè)務(wù)中應(yīng)用,結(jié)合GIS平臺(tái)可以把地址轉(zhuǎn)換成坐標(biāo)。地址應(yīng)用服務(wù)尚需完善公安行業(yè)的地址集中在戶籍地址,缺少與互聯(lián)網(wǎng)數(shù)據(jù)結(jié)合,來發(fā)揮其更大的價(jià)值。對(duì)于公眾應(yīng)用的服務(wù)缺少數(shù)據(jù)源,地址應(yīng)用服務(wù)有待整合優(yōu)化。地址管理的痛點(diǎn)5數(shù)據(jù)資源的紐帶是各類業(yè)務(wù)數(shù)據(jù)關(guān)聯(lián)要素之一是數(shù)據(jù)分析、挖掘的必要支撐……城市管理的抓手城市管理的依托基礎(chǔ)人、事件、單位等各類管理的重要輔助信息……社會(huì)服務(wù)的利劍社會(huì)服務(wù)的依托公眾生活的必須品……大數(shù)據(jù)的核心資源地址描述的是客觀存在的實(shí)體,而實(shí)體是大數(shù)據(jù)最重要的描述對(duì)象之一……時(shí)空大數(shù)據(jù)的必備條件空間定位的基礎(chǔ)時(shí)空分析的前提……
項(xiàng)目概述—建設(shè)必要性地址管理必要條件6政務(wù)業(yè)務(wù)定位服務(wù)智慧城市云計(jì)算、大數(shù)據(jù)地址地址數(shù)據(jù)是公安部門的核心數(shù)據(jù)資源。是關(guān)系到日常社會(huì)、民生的數(shù)據(jù),是政府、企業(yè)和公眾迫切需要的基礎(chǔ)信息資源。對(duì)于國家和社會(huì)發(fā)展具有重要的戰(zhàn)略意義。
項(xiàng)目概述—建設(shè)必要性地址管理戰(zhàn)略意義7PART.02解決方案9系統(tǒng)架構(gòu)設(shè)計(jì)10系統(tǒng)應(yīng)用服務(wù)11標(biāo)準(zhǔn)地址示范建設(shè)任務(wù)更新完善地圖數(shù)據(jù)1建設(shè)系統(tǒng)運(yùn)行環(huán)境3建設(shè)標(biāo)準(zhǔn)地址數(shù)據(jù)庫4建立標(biāo)準(zhǔn)地址規(guī)范2基于地址的業(yè)務(wù)應(yīng)用5標(biāo)準(zhǔn)地址數(shù)據(jù)上報(bào)61、示范建設(shè)任務(wù)有哪些0.5米以上分辨率影像地圖全市域覆蓋若城郊、鄉(xiāng)鎮(zhèn)、農(nóng)村地區(qū)矢量地圖獲取困難有人員生活和居住的區(qū)域更新完善地圖數(shù)據(jù)1更新完善地圖數(shù)據(jù)1:2000以上矢量電子地圖1213建立標(biāo)準(zhǔn)地址規(guī)范建立標(biāo)準(zhǔn)地址規(guī)范214建設(shè)系統(tǒng)運(yùn)行環(huán)境建設(shè)系統(tǒng)運(yùn)行環(huán)境3增配至少4臺(tái)以上服務(wù)器用于構(gòu)建運(yùn)行環(huán)境省級(jí)、州市考慮用戶訪問量以及地址數(shù)據(jù)量情況構(gòu)建環(huán)境15建設(shè)標(biāo)準(zhǔn)地址數(shù)據(jù)庫建設(shè)標(biāo)準(zhǔn)地址數(shù)據(jù)庫4現(xiàn)有地址整理改造互聯(lián)網(wǎng)+公安地址數(shù)據(jù)融合兩庫建設(shè)更新機(jī)制16基于地址的業(yè)務(wù)應(yīng)用基于地址的業(yè)務(wù)應(yīng)用5地址檢索服務(wù)地址結(jié)構(gòu)化服務(wù)地址定位服務(wù)。。。。。。。實(shí)戰(zhàn)應(yīng)用拓展與深化社會(huì)化共享和服務(wù)17標(biāo)準(zhǔn)地址數(shù)據(jù)上報(bào)部市省標(biāo)準(zhǔn)地址數(shù)據(jù)上報(bào)61、如何充分利用現(xiàn)有的各類地址數(shù)據(jù)現(xiàn)有地址數(shù)據(jù)新一代地址庫標(biāo)準(zhǔn)升級(jí)相關(guān)業(yè)務(wù)系統(tǒng)中已有地址是否可以重復(fù)利用是否需要重新組織開展標(biāo)準(zhǔn)地址采集現(xiàn)有地址數(shù)據(jù)分析186、如何建立全局統(tǒng)一的地址數(shù)據(jù)采集體系問題地址來源涉及到多個(gè)不同警種的業(yè)務(wù)系統(tǒng)時(shí),如何實(shí)現(xiàn)統(tǒng)一采集?戶籍地址戶籍地址案件地址報(bào)警地址標(biāo)準(zhǔn)地址庫一標(biāo)三實(shí)系統(tǒng)PGIS系統(tǒng)案件系統(tǒng)警綜平臺(tái)統(tǒng)一采集保留改造廢除新建現(xiàn)有地址數(shù)據(jù)分析196、如何建立全局統(tǒng)一的地址數(shù)據(jù)采集體系問題戶籍地址戶籍地址案件地址報(bào)警地址一標(biāo)三實(shí)系統(tǒng)PGIS系統(tǒng)案件系統(tǒng)警綜平臺(tái)統(tǒng)一線下處理保留改造廢除新建處理原則標(biāo)準(zhǔn)地址庫統(tǒng)一庫體源頭確認(rèn)現(xiàn)有地址數(shù)據(jù)處理原則202、現(xiàn)有地址抽取轉(zhuǎn)換入庫問題抽取轉(zhuǎn)換標(biāo)準(zhǔn)地址庫地址元素地址對(duì)象層次結(jié)構(gòu)遵循現(xiàn)有規(guī)范的標(biāo)準(zhǔn)地址抽取轉(zhuǎn)換工具符合規(guī)范的標(biāo)準(zhǔn)地址地址入庫標(biāo)準(zhǔn)211、如何充分利用現(xiàn)有的各類地址數(shù)據(jù)標(biāo)準(zhǔn)地址采集地址采集頁面級(jí)服務(wù),嵌入各系統(tǒng)采集221、如何充分利用現(xiàn)有的各類地址數(shù)據(jù)標(biāo)準(zhǔn)地址校驗(yàn)235、下發(fā)的行政區(qū)劃數(shù)據(jù)與各地實(shí)際情況不一致數(shù)據(jù)與實(shí)際情況不一致下發(fā)數(shù)據(jù)參考《中華人民共和國行政區(qū)劃代碼》(GB/T2260)標(biāo)準(zhǔn),城市具體到街道級(jí)別代碼,農(nóng)村具體到鄉(xiāng)鎮(zhèn)級(jí)別代碼確保所有錄入地址的行政區(qū)劃代碼一致5級(jí)行政區(qū)劃、機(jī)構(gòu)單位要求統(tǒng)一規(guī)范管理,保證地址數(shù)據(jù)的生命周期管理。24標(biāo)準(zhǔn)地址規(guī)范管理標(biāo)準(zhǔn)地址庫系統(tǒng)是信息化基礎(chǔ)設(shè)施,其維護(hù)工作應(yīng)基于業(yè)務(wù)系統(tǒng)納入到民警日常工作考核中去,以保證數(shù)據(jù)的準(zhǔn)確性與鮮活性。各地需要結(jié)合本地區(qū)實(shí)際,選擇確定統(tǒng)一的地址數(shù)據(jù)生命周期維護(hù)入口(包含行政區(qū)劃、地址元素、機(jī)構(gòu)、警務(wù)責(zé)任區(qū)等),并協(xié)調(diào)相關(guān)業(yè)務(wù)部門及承建單位對(duì)相應(yīng)的入口系統(tǒng)進(jìn)行改造。1、標(biāo)準(zhǔn)地址管理與維護(hù)的唯一性問題涉及多個(gè)業(yè)務(wù)系統(tǒng),如何確保標(biāo)準(zhǔn)地址管理與維護(hù)入口的唯一性?標(biāo)準(zhǔn)地址生命周期管理25地址結(jié)構(gòu)的規(guī)范性,如何來計(jì)算?地址結(jié)構(gòu)化可以給出最低一級(jí)的地址元素等級(jí),如果地址元素沒有到達(dá)最精細(xì)一級(jí),通過條件過濾下發(fā)民警實(shí)地核實(shí)。12、任務(wù)書中的規(guī)定的門樓牌地址采集率達(dá)95%以上如何界定建筑物門樓牌地址的準(zhǔn)確率應(yīng)該達(dá)到百分之多少,如何計(jì)算?地址位置準(zhǔn)確性,如何來計(jì)算?地址轉(zhuǎn)坐標(biāo)可以給出此坐標(biāo)的評(píng)分,如果評(píng)分低于60分的地址,通過條件過濾下發(fā)民警實(shí)地核實(shí)。標(biāo)準(zhǔn)地址準(zhǔn)確性管理261、任務(wù)書中要求的“三個(gè)應(yīng)用”如何界定應(yīng)用機(jī)制地址引用地址關(guān)聯(lián)地址定位圍繞地址定位需求,不斷完善和建立地址定位資源建立以地址引用為主的警用地址應(yīng)用機(jī)制,新建和已建系統(tǒng),均需基于標(biāo)準(zhǔn)地址庫實(shí)現(xiàn)地址錄入功能在公安大數(shù)據(jù)環(huán)境中,為業(yè)務(wù)信息賦予標(biāo)準(zhǔn)地址編碼,實(shí)現(xiàn)以“地”為中心的數(shù)據(jù)精確關(guān)聯(lián)標(biāo)準(zhǔn)地址應(yīng)用機(jī)制27PART.03關(guān)鍵技術(shù)地址處理整體流程29由于最終建立了大量的數(shù)據(jù)字典為了提高查詢識(shí)別效率建立了Double-Array-Trie(DAT)實(shí)現(xiàn)快速查詢DAT快速查詢數(shù)據(jù)結(jié)構(gòu)30BiLSTM(雙向LSTM)同時(shí)考慮了過去的特征(通過前向過程提取)和未來的特征(通過后向過程提?。kp向LSTM相當(dāng)于兩個(gè)LSTM,一個(gè)正向輸入序列,一個(gè)反向輸入序列,再將兩者的輸出結(jié)合起來作為最終的結(jié)果,能夠充分準(zhǔn)確提取地址數(shù)據(jù)中的上下文關(guān)系和組合模式。BiLSTM神經(jīng)網(wǎng)絡(luò)模型31n-gram模型,它基于馬爾科夫模型假設(shè),一個(gè)詞的出現(xiàn)概率僅依賴于該詞的前1個(gè)詞或前幾個(gè)詞,當(dāng)假設(shè)一個(gè)詞的出現(xiàn)僅依賴于前1個(gè)詞,即Bigram(2-gram);當(dāng)假設(shè)一個(gè)詞的出現(xiàn)僅依賴于前2個(gè)詞,即Trigram(3-gram):
n-gram模型通過計(jì)算極大似然估計(jì)(MaximumLikelihoodEstimate)構(gòu)造語言模型,這是對(duì)訓(xùn)練數(shù)據(jù)的最佳估計(jì)使用n-gram語言模型計(jì)算出地址的概率,當(dāng)概率小于指定閾值時(shí),可以將錯(cuò)誤字查找拼音和形近字的候選詞,用n-gram檢查計(jì)算每一個(gè)試糾錯(cuò)的概率,結(jié)合行政區(qū)劃從屬關(guān)系檢查。這就是n-gram模型結(jié)合漢字拼音來做中文文本錯(cuò)別字糾錯(cuò)了。文本糾錯(cuò)和模糊匹配32PART.04成功案例34地址處理統(tǒng)計(jì)表名數(shù)據(jù)來源總數(shù)量標(biāo)準(zhǔn)化正確標(biāo)準(zhǔn)化錯(cuò)誤比例ydz_ywsj1.csv警綜平臺(tái)2399002190075549824773%ydz_ywsj2.csv警綜平臺(tái)2399002168752819894ydz_ywsj3.csv警綜平臺(tái)2767222027329599342621pgis.csvpgis平臺(tái)4610450444108516936593%sqjw.csv社區(qū)警務(wù)248004232319631447355899%表名數(shù)據(jù)來源總數(shù)量有結(jié)果比例ydz_dzsj一標(biāo)三實(shí)237912482098482388.20%ydz_ywsj1.csv警綜平臺(tái)3018308239900279.48%ydz_ywsj2.csv警綜平臺(tái)344870623292188995.46%ydz_ywsj3.csv警綜平臺(tái)289449622767222095.60%地址標(biāo)準(zhǔn)化處理:地址geocoding處理:標(biāo)準(zhǔn)地址庫管理351、標(biāo)準(zhǔn)地址管理與維
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物標(biāo)志物在降糖藥心腎獲益評(píng)估中的應(yīng)用
- 生物材料編程調(diào)控成骨分化的策略
- 生物支架引導(dǎo)的組織再生策略
- 生物打印技術(shù)在脊髓損傷修復(fù)中的遞藥系統(tǒng)
- 生物化學(xué)虛擬仿真與代謝通路分析
- 生物制品穩(wěn)定性試驗(yàn)冷鏈驗(yàn)證要點(diǎn)
- 生物制劑失應(yīng)答的炎癥性腸病發(fā)病機(jī)制新認(rèn)識(shí)
- 生物制劑臨床試驗(yàn)中中心效應(yīng)控制方法
- 網(wǎng)絡(luò)安全防御與滲透測試的保密協(xié)議
- 制造業(yè)生產(chǎn)經(jīng)理面試要點(diǎn)解析及答案
- DB41T 1960.2-2021 公共機(jī)構(gòu)能耗定額 第2部分:醫(yī)療機(jī)構(gòu)
- 成人肥胖食養(yǎng)指南2024年版-國家衛(wèi)健委-202403
- 羅伯特議事規(guī)則
- 醫(yī)院急診科簡介
- 華為企業(yè)社會(huì)責(zé)任報(bào)告
- 幾何模型6.4+“胡不歸”模型(直角三角形模型) 中考數(shù)學(xué)二輪復(fù)習(xí)必會(huì)幾何模型剖析(全國通用)
- 《線性代數(shù)》教案教案整本書全書電子教案
- 機(jī)制砂混凝土配制與施工質(zhì)量控制培訓(xùn)課件
- 第4章 甲殼素和殼聚糖 天然高分子材料
- 茶葉知識(shí)培訓(xùn):茶葉加工
- 紅色影視鑒賞學(xué)習(xí)通超星課后章節(jié)答案期末考試題庫2023年
評(píng)論
0/150
提交評(píng)論