版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 云數(shù)據(jù)平臺(tái)算法模型優(yōu)化方案目 錄 TOC o 1-4 h z u HYPERLINK l _Toc41231237 第1章 整體方案 PAGEREF _Toc41231237 h 4 HYPERLINK l _Toc41231238 1.1 項(xiàng)目需求理解方案 PAGEREF _Toc41231238 h 4 HYPERLINK l _Toc41231239 1.1.1 項(xiàng)目背景 PAGEREF _Toc41231239 h 4 HYPERLINK l _Toc41231240 1.1.2 項(xiàng)目概述 PAGEREF _Toc41231240 h 4 HYPERLINK l _Toc412312
2、41 1.1.2.1 項(xiàng)目現(xiàn)狀 PAGEREF _Toc41231241 h 4 HYPERLINK l _Toc41231242 1.1.2.2 項(xiàng)目目標(biāo) PAGEREF _Toc41231242 h 6 HYPERLINK l _Toc41231243 1.1.2.3 項(xiàng)目?jī)?nèi)容 PAGEREF _Toc41231243 h 7 HYPERLINK l _Toc41231244 1.2 總體設(shè)計(jì)方案 PAGEREF _Toc41231244 h 8 HYPERLINK l _Toc41231245 1.2.1 總體定位及目標(biāo) PAGEREF _Toc41231245 h 8 HYPERLIN
3、K l _Toc41231246 1.2.2 設(shè)計(jì)原則及約束 PAGEREF _Toc41231246 h 9 HYPERLINK l _Toc41231247 1.2.2.1 總體設(shè)計(jì)約束 PAGEREF _Toc41231247 h 9 HYPERLINK l _Toc41231248 1.2.3 總體應(yīng)用架構(gòu)設(shè)計(jì) PAGEREF _Toc41231248 h 10 HYPERLINK l _Toc41231249 1.2.4 總體數(shù)據(jù)架構(gòu)設(shè)計(jì) PAGEREF _Toc41231249 h 12 HYPERLINK l _Toc41231250 1.2.4.1 數(shù)據(jù)框架設(shè)計(jì) PAGEREF
4、 _Toc41231250 h 12 HYPERLINK l _Toc41231251 1.2.4.2 數(shù)據(jù)框架細(xì)化設(shè)計(jì) PAGEREF _Toc41231251 h 13 HYPERLINK l _Toc41231252 1.3 算法模型優(yōu)化方案 PAGEREF _Toc41231252 h 15 HYPERLINK l _Toc41231253 1.3.1 算法概述 PAGEREF _Toc41231253 h 15 HYPERLINK l _Toc41231254 1.3.1.1 算法的特征 PAGEREF _Toc41231254 h 16 HYPERLINK l _Toc412312
5、55 1.3.1.2 算法的要素 PAGEREF _Toc41231255 h 16 HYPERLINK l _Toc41231256 1.3.1.3 算法的判定 PAGEREF _Toc41231256 h 17 HYPERLINK l _Toc41231257 1.3.1.4 算法的描述方式 PAGEREF _Toc41231257 h 18 HYPERLINK l _Toc41231258 1.3.1.5 典型的算法 PAGEREF _Toc41231258 h 18 HYPERLINK l _Toc41231259 1.3.2 算法模型優(yōu)化 PAGEREF _Toc41231259 h
6、 22 HYPERLINK l _Toc41231260 1.3.2.1 算法模型優(yōu)化要點(diǎn) PAGEREF _Toc41231260 h 22 HYPERLINK l _Toc41231261 1.3.2.2 數(shù)據(jù)模型優(yōu)化 PAGEREF _Toc41231261 h 24 HYPERLINK l _Toc41231262 1.3.2.3 數(shù)據(jù)建模工具 PAGEREF _Toc41231262 h 37 HYPERLINK l _Toc41231263 1.3.3 優(yōu)化完善及運(yùn)維的算法模型服務(wù) PAGEREF _Toc41231263 h 38 HYPERLINK l _Toc41231264
7、 1.3.3.1 基礎(chǔ)算法模型設(shè)計(jì) PAGEREF _Toc41231264 h 38 HYPERLINK l _Toc41231265 1.3.3.2 開(kāi)放算法模型服務(wù) PAGEREF _Toc41231265 h 40 HYPERLINK l _Toc41231266 1.3.4 機(jī)構(gòu)改革的算法模型優(yōu)化 PAGEREF _Toc41231266 h 40 HYPERLINK l _Toc41231267 1.3.4.1 算法模型指標(biāo)重新測(cè)算 PAGEREF _Toc41231267 h 40 HYPERLINK l _Toc41231268 1.3.4.2 國(guó)合并影響分析 PAGEREF
8、_Toc41231268 h 41 HYPERLINK l _Toc41231269 1.4 應(yīng)用支撐方案 PAGEREF _Toc41231269 h 41 HYPERLINK l _Toc41231270 1.4.1 應(yīng)用接入規(guī)范制定 PAGEREF _Toc41231270 h 42 HYPERLINK l _Toc41231271 1.4.2 應(yīng)用接入方式 PAGEREF _Toc41231271 h 43 HYPERLINK l _Toc41231272 1.4.3 應(yīng)用接入管控 PAGEREF _Toc41231272 h 44 HYPERLINK l _Toc41231273 1
9、.4.4 應(yīng)用接入服務(wù) PAGEREF _Toc41231273 h 44 HYPERLINK l _Toc41231274 1.4.4.1 平臺(tái)層應(yīng)用接入服務(wù) PAGEREF _Toc41231274 h 44 HYPERLINK l _Toc41231275 1.4.4.2 數(shù)據(jù)層應(yīng)用接入服務(wù) PAGEREF _Toc41231275 h 45 HYPERLINK l _Toc41231276 1.4.4.3 具體應(yīng)用層接入 PAGEREF _Toc41231276 h 46 HYPERLINK l _Toc41231277 1.4.5 應(yīng)用接入聯(lián)調(diào) PAGEREF _Toc4123127
10、7 h 47整體方案項(xiàng)目需求理解方案項(xiàng)目背景云平臺(tái)數(shù)據(jù)管理項(xiàng)目基于大數(shù)據(jù)技術(shù)和理念,以云平臺(tái)為基礎(chǔ),集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需求主體提供更為全面豐富的決策和參考支持,構(gòu)建開(kāi)放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。項(xiàng)目自開(kāi)工建設(shè)以來(lái),始終以“用數(shù)據(jù)服務(wù)征管方式轉(zhuǎn)變”為建設(shè)主線,在大數(shù)據(jù)算法應(yīng)用、海量用戶支持、關(guān)系云圖、風(fēng)險(xiǎn)動(dòng)態(tài)積分、用戶畫(huà)像等方面進(jìn)行了積極探索、實(shí)踐,出色完成了設(shè)定任務(wù),達(dá)到了預(yù)期效果。目前,云平臺(tái)數(shù)據(jù)管理項(xiàng)目已從驗(yàn)證階段轉(zhuǎn)為生產(chǎn)應(yīng)用階段,實(shí)現(xiàn)了以數(shù)據(jù)為中心,以技術(shù)基礎(chǔ)平臺(tái)為依托,以分析類應(yīng)用實(shí)現(xiàn)為目標(biāo),涵蓋數(shù)據(jù)“采、存、通、用”全生命周期的一體化生態(tài)系統(tǒng),是
11、大數(shù)據(jù)、互聯(lián)網(wǎng)、云計(jì)算等理念、方法論、技術(shù)手段和解決方案的集成展現(xiàn)。在云平臺(tái)數(shù)據(jù)管理項(xiàng)目建設(shè)完成的基礎(chǔ)上,總局云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)工作的主要任務(wù)是:以云平臺(tái)數(shù)據(jù)管理項(xiàng)目建設(shè)內(nèi)容為基礎(chǔ),做好現(xiàn)有硬、軟件運(yùn)行維護(hù)與優(yōu)化升級(jí);進(jìn)一步拓寬數(shù)據(jù)集成范圍、拓展數(shù)據(jù)應(yīng)用、深度挖掘數(shù)據(jù)價(jià)值;根據(jù)機(jī)構(gòu)改革后云平臺(tái)數(shù)據(jù)管理工作的新內(nèi)容、新要求,對(duì)數(shù)據(jù)層、應(yīng)用層進(jìn)行調(diào)整、優(yōu)化,保障云平臺(tái)平穩(wěn)運(yùn)行;有力加強(qiáng)數(shù)據(jù)治理、提高數(shù)據(jù)質(zhì)量,滿足當(dāng)前數(shù)據(jù)管理工作需要,支撐各類型數(shù)據(jù)應(yīng)用工作需求,助力推動(dòng)征管模式變革和各項(xiàng)稅收政策改革,最終形成推動(dòng)數(shù)據(jù)管理思維變化,營(yíng)造良好稅收數(shù)據(jù)生態(tài)。項(xiàng)目概述項(xiàng)目現(xiàn)狀云
12、平臺(tái)數(shù)據(jù)管理項(xiàng)目以云平臺(tái)為基礎(chǔ),以云服務(wù)器軟件、負(fù)載均衡軟件SLB、對(duì)象存儲(chǔ)軟件OSS、大數(shù)據(jù)計(jì)算服務(wù)軟件ODPS、數(shù)據(jù)可視化引擎DataV等18款大數(shù)據(jù)產(chǎn)品為依托,構(gòu)建了以數(shù)據(jù)治理為核心、以一體化云平臺(tái)為載體、滿足各類用戶需求的稅收大數(shù)據(jù)平臺(tái)。主要完成平臺(tái)層、數(shù)據(jù)層、應(yīng)用層的建設(shè):1.平臺(tái)層建設(shè)。主要包括計(jì)算存儲(chǔ)和網(wǎng)絡(luò)設(shè)備、系統(tǒng)軟件工具集、安全及運(yùn)維監(jiān)控管理的建設(shè),從硬件和技術(shù)層面有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用需求的矛盾,搭建靈活、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù)云環(huán)境,并構(gòu)建完整的三層服務(wù)模式。通過(guò)建設(shè)IaaS層,為全國(guó)數(shù)據(jù)大集中環(huán)境提供包括CPU、內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)、
13、操作系統(tǒng)等基礎(chǔ)設(shè)施資源,提高資源的利用率,降低采購(gòu)成本;通過(guò)建設(shè)PaaS平臺(tái),基于IaaS提供的能力,以服務(wù)的方式提供計(jì)算平臺(tái)和軟件組合,為最終用戶提供云環(huán)境下的應(yīng)用開(kāi)發(fā)、部署和運(yùn)行平臺(tái),解決應(yīng)用軟件開(kāi)發(fā)的規(guī)范化問(wèn)題,降低系統(tǒng)運(yùn)行維護(hù)成本;通過(guò)建設(shè)SaaS層,全國(guó)數(shù)據(jù)大集中環(huán)境為總局、省局、納稅人、相關(guān)部門(mén)提供個(gè)性化的數(shù)據(jù)服務(wù)。2.數(shù)據(jù)層建設(shè)。通過(guò)構(gòu)建數(shù)據(jù)治理體系和開(kāi)展數(shù)據(jù)分析處理,將云平臺(tái)和工程規(guī)劃范圍內(nèi)的其他數(shù)據(jù)平臺(tái)集于一體,使金三生產(chǎn)系統(tǒng)數(shù)據(jù)、總局保留軟件數(shù)據(jù)和多來(lái)源的外部交換數(shù)據(jù)相互貫通,實(shí)現(xiàn)各類數(shù)據(jù)的集中定義和管理,為建立統(tǒng)一數(shù)據(jù)視圖、數(shù)據(jù)集市、各類分析業(yè)務(wù)的定義、指標(biāo)和規(guī)則定義以及
14、數(shù)據(jù)集成定義提供語(yǔ)義基礎(chǔ),同時(shí)提供對(duì)各類數(shù)據(jù)的審核管理和維護(hù)機(jī)制,維護(hù)數(shù)據(jù)的完整性、準(zhǔn)確性以及一致性,實(shí)現(xiàn)數(shù)據(jù)生命周期管理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)審計(jì)等各項(xiàng)功能。通過(guò)數(shù)據(jù)治理過(guò)程,使得數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)質(zhì)量都能夠得到持續(xù)的提升,保證數(shù)據(jù)資產(chǎn)的長(zhǎng)久價(jià)值。(1)基礎(chǔ)層完成了對(duì)稅務(wù)數(shù)據(jù)、外部數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)三類數(shù)據(jù)的集成,共集成了六千余張表,同時(shí)完成了數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化以及非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)結(jié)構(gòu)化數(shù)據(jù)等操作。(2)中間層完成了四大主題庫(kù)和標(biāo)簽體系的建設(shè)。四大主題庫(kù)分別是:組織庫(kù)(法人和法人分支機(jī)構(gòu)),涉及模型近200個(gè);自然人庫(kù),涉及模型近百個(gè);稅務(wù)機(jī)關(guān)庫(kù),涉及模型近200個(gè);關(guān)系庫(kù)(單位納稅人之間、
15、單位納稅人與自然人之間),涉及模型幾十個(gè)。同時(shí)構(gòu)建了企業(yè)、自然人、稅務(wù)機(jī)關(guān)標(biāo)簽體系,包含:企業(yè)標(biāo)簽(一般納稅人標(biāo)簽、小規(guī)模納稅人標(biāo)簽、千戶集團(tuán)標(biāo)簽)、自然人標(biāo)簽、稅務(wù)機(jī)關(guān)標(biāo)簽。(3)模型層完成了面向應(yīng)用的數(shù)據(jù)模型構(gòu)建。在建設(shè)模型層的過(guò)程中,以構(gòu)建面向應(yīng)用類數(shù)據(jù)模型和構(gòu)建分析挖掘類分析模型為原則,基于稅收動(dòng)態(tài)監(jiān)控、票流分析、關(guān)系云圖、增值稅發(fā)票查詢分析系統(tǒng)等應(yīng)用共設(shè)計(jì)數(shù)百個(gè)數(shù)據(jù)模型,上千個(gè)指標(biāo)口徑。3.應(yīng)用層建設(shè)?;谌珓?wù)數(shù)據(jù),建立多層次、多類型、多渠道的數(shù)據(jù)服務(wù)體系,為總局各司局和省局不同類型用戶提供多維數(shù)據(jù)服務(wù),滿足各級(jí)稅務(wù)機(jī)關(guān)在決策、管理、執(zhí)行、研究等方面的工作需求。應(yīng)用層前期建設(shè)立足于稅
16、收業(yè)務(wù)特點(diǎn)、現(xiàn)狀和需求狀況,重點(diǎn)選取部分應(yīng)用進(jìn)行驗(yàn)證性和示范性開(kāi)發(fā)。已開(kāi)發(fā)用戶畫(huà)像、票流分析、納稅人關(guān)系云圖、納稅人關(guān)系分析、增值稅發(fā)票查詢分析系統(tǒng)、風(fēng)險(xiǎn)情報(bào)系統(tǒng)、單管戶查詢、企業(yè)信息自助查詢、數(shù)據(jù)資源需求管理、數(shù)據(jù)質(zhì)效考核、稅收動(dòng)態(tài)監(jiān)控大屏版、稅收動(dòng)態(tài)監(jiān)控桌面版、云平臺(tái)訪問(wèn)監(jiān)控以及涉稅專業(yè)服務(wù)動(dòng)態(tài)監(jiān)控等應(yīng)用。4. 數(shù)據(jù)治理工作主要從五個(gè)方面開(kāi)展:元數(shù)據(jù)管理、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全管理。在數(shù)據(jù)標(biāo)準(zhǔn)方面繼承了國(guó)家標(biāo)準(zhǔn)化內(nèi)容,把控?cái)?shù)據(jù)建設(shè)標(biāo)準(zhǔn)。同時(shí)結(jié)合業(yè)務(wù)需要積累并整理了核心征管系統(tǒng)業(yè)務(wù)表單和物理表的對(duì)照關(guān)系,形成了包含:核心征管系統(tǒng)、個(gè)稅系統(tǒng)、防偽稅控系統(tǒng)、外部交換系
17、統(tǒng)、出口退稅系統(tǒng)等業(yè)務(wù)系統(tǒng)的數(shù)據(jù)字典。在數(shù)據(jù)質(zhì)量方面制定數(shù)據(jù)質(zhì)量規(guī)則指標(biāo)二百多項(xiàng),推動(dòng)全國(guó)數(shù)據(jù)質(zhì)量持續(xù)優(yōu)化。5.數(shù)據(jù)服務(wù)云平臺(tái)數(shù)據(jù)管理項(xiàng)目運(yùn)行一年以來(lái),為總局多個(gè)業(yè)務(wù)司局提供數(shù)據(jù)加工服務(wù);承接總局稽查局的選案工作;承接納稅服務(wù)司納稅信用等級(jí)評(píng)定指標(biāo)調(diào)整測(cè)算工作,為信用評(píng)價(jià)指標(biāo)調(diào)整提供數(shù)據(jù)依據(jù)等;開(kāi)展新辦企業(yè)預(yù)警模型、非正常戶預(yù)警模型、進(jìn)銷不匹配模型等指標(biāo)設(shè)計(jì)測(cè)算工作。項(xiàng)目目標(biāo)本項(xiàng)目旨在根據(jù)業(yè)務(wù)需求,對(duì)平臺(tái)層、數(shù)據(jù)層、應(yīng)用層實(shí)施有效的運(yùn)行維護(hù),完成云平臺(tái)整體升級(jí)優(yōu)化完善,并根據(jù)機(jī)構(gòu)改革要求及進(jìn)程完成云平臺(tái)調(diào)整優(yōu)化各項(xiàng)工作,保障云平臺(tái)平穩(wěn)運(yùn)行。1.做好云平臺(tái)數(shù)據(jù)管理項(xiàng)目升級(jí)完善工作,包括:基于云平
18、臺(tái)開(kāi)發(fā)、開(kāi)放更多數(shù)據(jù)應(yīng)用,豐富優(yōu)化云平臺(tái)的現(xiàn)有功能應(yīng)用場(chǎng)景,創(chuàng)新應(yīng)用功能,提升云平臺(tái)數(shù)據(jù)管理項(xiàng)目的應(yīng)用價(jià)值和潛能等內(nèi)容。根據(jù)國(guó)家與各省局需要,做好云平臺(tái)應(yīng)用的增加及數(shù)據(jù)開(kāi)放范圍的擴(kuò)大工作。對(duì)各司局的遷移軟件,做好技術(shù)及軟件方面的對(duì)接工作,滿足其數(shù)據(jù)庫(kù)創(chuàng)建、擴(kuò)容、變更等需求。2.做好云平臺(tái)數(shù)據(jù)管理項(xiàng)目的運(yùn)行維護(hù)與數(shù)據(jù)治理工作,包括應(yīng)用系統(tǒng)日常巡檢和監(jiān)控、故障綜合分析及應(yīng)急處理、性能持續(xù)優(yōu)化等服務(wù),以保障云平臺(tái)數(shù)據(jù)管理項(xiàng)目平穩(wěn)運(yùn)行。對(duì)云平臺(tái)的硬件擴(kuò)容提供相應(yīng)的技術(shù)支持,做好對(duì)機(jī)器的版本升級(jí)和應(yīng)用的性能測(cè)試等工作,保障數(shù)據(jù)處理和各類應(yīng)用能夠正常適應(yīng)新的硬件平臺(tái)。按照關(guān)于數(shù)據(jù)治理組織機(jī)構(gòu)、流程制度以及
19、配套支撐工具等要求,做好元數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型,數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全等工作,強(qiáng)化數(shù)據(jù)治理能力,提高數(shù)據(jù)管理水平,確保整體數(shù)據(jù)環(huán)境可靠、高效、安全,有力支撐征管改革和稅制改革。3.做好機(jī)構(gòu)改革涉及云平臺(tái)調(diào)整優(yōu)化工作,根據(jù)國(guó)家制定的國(guó)合并改革方案,在完成金三系統(tǒng)合并、調(diào)整與地方稅費(fèi)全國(guó)集成基礎(chǔ)上,完成云平臺(tái)數(shù)據(jù)層、應(yīng)用層的相應(yīng)調(diào)整優(yōu)化與功能開(kāi)發(fā)工作,以保障數(shù)據(jù)及時(shí)、準(zhǔn)確集成至云平臺(tái),并按照最新的需求展示和供應(yīng)數(shù)據(jù)。項(xiàng)目?jī)?nèi)容云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)工作,重點(diǎn)需要完成對(duì)云平臺(tái)數(shù)據(jù)管理項(xiàng)目的運(yùn)行維護(hù)、對(duì)已有功能的優(yōu)化完善及新增數(shù)據(jù)需求、應(yīng)用功能的處理與設(shè)計(jì)開(kāi)發(fā)以及機(jī)構(gòu)改革涉及
20、云平臺(tái)調(diào)整優(yōu)化有關(guān)工作。重點(diǎn)包括但不限于以下內(nèi)容:云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)項(xiàng)目是在云平臺(tái)數(shù)據(jù)管理項(xiàng)目建設(shè)成果基礎(chǔ)上,做好云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維工作與機(jī)構(gòu)改革涉及云平臺(tái)調(diào)整優(yōu)化工作兩項(xiàng)內(nèi)容:總體設(shè)計(jì)方案總體定位及目標(biāo)云平臺(tái)數(shù)據(jù)管理項(xiàng)目是工程第二階段的重要組成部分,項(xiàng)目基于目前最新的大數(shù)據(jù)處理技術(shù)手段和理念,借助金三全面上線的有利契機(jī),以大數(shù)據(jù)云平臺(tái)為基礎(chǔ),集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需求主體提供更為全面豐富的決策和參考支持,構(gòu)建開(kāi)放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。項(xiàng)目定位集中體現(xiàn)了基礎(chǔ)性、創(chuàng)新性和示范性?;A(chǔ)性。一是構(gòu)建硬件基礎(chǔ),通過(guò)搭建靈活的、
21、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù)云環(huán)境,從硬件和技術(shù)層面有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用需求的矛盾。二是夯實(shí)管理基礎(chǔ),以打造成熟完善的數(shù)據(jù)治理體系為重點(diǎn),為保障數(shù)據(jù)資產(chǎn)質(zhì)量提供支撐。三是提供應(yīng)用基礎(chǔ),為各司局、省局自行開(kāi)發(fā)應(yīng)用項(xiàng)目提供基礎(chǔ)數(shù)據(jù)和工具,鼓勵(lì)多樣性應(yīng)用開(kāi)發(fā)。創(chuàng)新性。一是數(shù)據(jù)利用創(chuàng)新,遵循總體架構(gòu)要求,繼承前期建設(shè)成果,在保持四大應(yīng)用系統(tǒng)總體格局不變的情況下,實(shí)現(xiàn)數(shù)據(jù)全國(guó)大集中。二是管理思維創(chuàng)新,整合數(shù)據(jù)資源和管理資源,以統(tǒng)一平臺(tái)來(lái)解決之前總局各司局?jǐn)?shù)據(jù)利用各自為政、重復(fù)建設(shè)、標(biāo)準(zhǔn)不一致、成果不能共享等問(wèn)題。三是服務(wù)模式創(chuàng)新,體現(xiàn)“眾包協(xié)助”要求,以提供基礎(chǔ)數(shù)據(jù)服
22、務(wù)為主,形成數(shù)據(jù)統(tǒng)一加工和應(yīng)用多樣開(kāi)發(fā)結(jié)合的格局。示范性。為全國(guó)各省局?jǐn)?shù)據(jù)開(kāi)發(fā)利用提供從硬件建設(shè)、數(shù)據(jù)治理和應(yīng)用開(kāi)發(fā)的示范性模板,推進(jìn)全收數(shù)據(jù)利用水平提升。云平臺(tái)數(shù)據(jù)管理項(xiàng)目實(shí)現(xiàn)了稅收征管數(shù)據(jù)的全國(guó)集中和規(guī)范管理,為各級(jí)稅務(wù)機(jī)關(guān)提供了強(qiáng)大計(jì)算處理能力,有機(jī)整合大數(shù)據(jù)技術(shù),全面集成內(nèi)部數(shù)據(jù)、積極拓展外部數(shù)據(jù)、強(qiáng)化數(shù)據(jù)治理能力,實(shí)現(xiàn)了數(shù)據(jù)的過(guò)程監(jiān)控;建立了稅務(wù)數(shù)據(jù)的資產(chǎn)化管理模式,并以用戶為核心提供差異化的數(shù)據(jù)服務(wù),形成了開(kāi)發(fā)協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。同時(shí),加強(qiáng)外部數(shù)據(jù)交換,實(shí)現(xiàn)了稅務(wù)數(shù)據(jù)與外部門(mén)數(shù)據(jù)的有效共享整合,為國(guó)家信息共享化建設(shè)提供了稅務(wù)方案。云平臺(tái)數(shù)據(jù)管理項(xiàng)目升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服
23、務(wù)項(xiàng)目以云平臺(tái)數(shù)據(jù)管理項(xiàng)目的建設(shè)內(nèi)容為基礎(chǔ),根據(jù)的業(yè)務(wù)需求和國(guó)合并工作要求,對(duì)平臺(tái)功能進(jìn)行持續(xù)性升級(jí)完善,集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,提升數(shù)據(jù)治理能力,為各需求主體提供更為全面豐富的決策和參考支持,并提供必要的基礎(chǔ)運(yùn)維,保障云平臺(tái)正常運(yùn)行。設(shè)計(jì)原則及約束總體設(shè)計(jì)約束總體設(shè)計(jì)包括總體架構(gòu)設(shè)計(jì)和數(shù)據(jù)治理機(jī)制設(shè)計(jì)兩個(gè)部分??傮w設(shè)計(jì)要求設(shè)計(jì)目標(biāo)根據(jù)本項(xiàng)目架構(gòu)要求和項(xiàng)目架構(gòu)約束,完成云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)項(xiàng)目的總體設(shè)計(jì)。設(shè)計(jì)要求總體設(shè)計(jì)在現(xiàn)運(yùn)行的云平臺(tái)數(shù)據(jù)管理項(xiàng)目上進(jìn)行優(yōu)化完善,包含應(yīng)用、數(shù)據(jù)、技術(shù)、集成、部署等方面的框架,也包括設(shè)計(jì)管控的體系。一方面,
24、作為框架,總體設(shè)計(jì)要求定義應(yīng)用、數(shù)據(jù)、技術(shù)、集成、部署等架構(gòu)的目標(biāo)藍(lán)圖,還包括相關(guān)模型,及各部分的指南、設(shè)計(jì)準(zhǔn)則,項(xiàng)目需要根據(jù)總體設(shè)計(jì)的約束來(lái)實(shí)現(xiàn)其應(yīng)用;另一方面,作為設(shè)計(jì)管控,它指明了項(xiàng)目在進(jìn)行項(xiàng)目實(shí)施的時(shí)候需要遵守的標(biāo)準(zhǔn)、規(guī)范,可以參考的相關(guān)架構(gòu)資源以及需要遵守的架構(gòu)管控流程,以確保項(xiàng)目的實(shí)施符合云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)項(xiàng)目的總體規(guī)劃。總體設(shè)計(jì)主要由應(yīng)用設(shè)計(jì)、數(shù)據(jù)設(shè)計(jì)、技術(shù)設(shè)計(jì)、集成設(shè)計(jì)、部署設(shè)計(jì)、標(biāo)準(zhǔn)規(guī)范、架構(gòu)管控體系等組成,這些總體設(shè)計(jì)的內(nèi)容將構(gòu)成對(duì)項(xiàng)目設(shè)計(jì)方面的約束,項(xiàng)目需要在這些設(shè)計(jì)的約束下進(jìn)行業(yè)務(wù)需求分析、設(shè)計(jì)以及實(shí)現(xiàn)以完成項(xiàng)目的目標(biāo)。設(shè)計(jì)約束遵循本項(xiàng)目總體
25、設(shè)計(jì)要求和項(xiàng)目設(shè)計(jì)約束。數(shù)據(jù)治理機(jī)制設(shè)計(jì)目標(biāo)根據(jù)數(shù)據(jù)本項(xiàng)目數(shù)據(jù)治理要求與約束,完成國(guó)家數(shù)據(jù)治理機(jī)制建設(shè)。設(shè)計(jì)要求數(shù)據(jù)治理涵蓋了人員,流程和技術(shù),是一系列改變數(shù)據(jù)使用行為的過(guò)程,它從根本上改變業(yè)務(wù)和信息技術(shù)的使用方法。在內(nèi)容上,要求實(shí)現(xiàn)元數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)管理和數(shù)據(jù)質(zhì)量管理三個(gè)方面的機(jī)制和流程建設(shè)。設(shè)計(jì)約束遵循本項(xiàng)目數(shù)據(jù)治理機(jī)制要求和約束。總體應(yīng)用架構(gòu)設(shè)計(jì)根據(jù)招標(biāo)文件中要求,云平臺(tái)數(shù)據(jù)管理項(xiàng)目是以大數(shù)據(jù)云平臺(tái)為基礎(chǔ),集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需求主體提供更為全面豐富的決策和參考支持,構(gòu)建開(kāi)放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。主要包括平臺(tái)層建設(shè)、數(shù)據(jù)層建設(shè)和應(yīng)用層建設(shè)。云計(jì)算
26、支撐平臺(tái):系統(tǒng)搭建靈活、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù)云環(huán)境,并構(gòu)建完整的三層服務(wù)模式,包括計(jì)算存儲(chǔ)和網(wǎng)絡(luò)設(shè)備、系統(tǒng)軟件工具集、安全及運(yùn)維監(jiān)控管理的建設(shè),從硬件和技術(shù)層面有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用需求的矛盾。大數(shù)據(jù)支撐平臺(tái):大數(shù)據(jù)支撐平臺(tái)是用于各項(xiàng)數(shù)據(jù)相關(guān)工作的云計(jì)算產(chǎn)品和大數(shù)據(jù)工具軟件集合,利用現(xiàn)有或者采購(gòu)的相關(guān)軟件產(chǎn)品,構(gòu)建數(shù)據(jù)治理體系和開(kāi)展數(shù)據(jù)分析處理,將大數(shù)據(jù)云平臺(tái)和工程規(guī)劃范圍內(nèi)的其他數(shù)據(jù)平臺(tái)集于一體,使的金三生產(chǎn)系統(tǒng)數(shù)據(jù)、總局保留軟件數(shù)據(jù)和多來(lái)源的外部交換數(shù)據(jù)相互貫通,持續(xù)提升數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)質(zhì)量,實(shí)現(xiàn)數(shù)據(jù)“好用、足用”的目標(biāo)。應(yīng)用平臺(tái)層:在全
27、收數(shù)據(jù)大集中和外部數(shù)據(jù)擴(kuò)展基礎(chǔ)上,為總局和各司局及部分省局提供方式靈活、內(nèi)容豐富的自主應(yīng)用開(kāi)發(fā)的平臺(tái)。本項(xiàng)目實(shí)現(xiàn)主體畫(huà)像、全國(guó)視角的納稅人遵從分析和稅收動(dòng)態(tài)展示3類驗(yàn)證和示范應(yīng)用。 總體數(shù)據(jù)架構(gòu)設(shè)計(jì)根據(jù)總局?jǐn)?shù)據(jù)層平臺(tái)的要求,我們將需求細(xì)分為數(shù)據(jù)集成、數(shù)據(jù)治理、主體匯總、數(shù)據(jù)應(yīng)用等4個(gè)技術(shù)支撐平臺(tái),以承擔(dān)所有數(shù)據(jù)活動(dòng)涉及的數(shù)據(jù)獲取、模型組織、信息加工、質(zhì)量管理、結(jié)果展現(xiàn)等處理功能。數(shù)據(jù)框架設(shè)計(jì)1 數(shù)據(jù)集成負(fù)責(zé)數(shù)據(jù)集成,通過(guò)調(diào)度控制和規(guī)則管理實(shí)現(xiàn)對(duì)數(shù)據(jù)集成的任務(wù)管理,數(shù)據(jù)集成平臺(tái)將源數(shù)據(jù)(核心征管、電子稅務(wù)、出口退稅、外部數(shù)據(jù)等)通過(guò)ETL/數(shù)據(jù)復(fù)制的數(shù)據(jù)加工、清洗、轉(zhuǎn)換,完成從源數(shù)據(jù)數(shù)據(jù)準(zhǔn)備區(qū)統(tǒng)
28、一數(shù)據(jù)視圖。加工中出現(xiàn)的錯(cuò)誤預(yù)警提交給數(shù)據(jù)治理平臺(tái)的數(shù)據(jù)質(zhì)量管理應(yīng)用。2 數(shù)據(jù)匯聚匯聚數(shù)據(jù)是將基礎(chǔ)數(shù)據(jù)區(qū)的數(shù)據(jù)按照納稅人、業(yè)務(wù)日期、業(yè)務(wù)狀態(tài)等維度進(jìn)行的輕度匯總的事實(shí)表和事實(shí)表關(guān)聯(lián)的維度表。3 數(shù)據(jù)應(yīng)用由查詢統(tǒng)計(jì)、征管狀況分析、報(bào)表管理、風(fēng)險(xiǎn)管理、政策評(píng)估、績(jī)效管理、知識(shí)管理、稅收收入核算分析系統(tǒng)、電子檔案管理等部分和日常應(yīng)用管理組成。本包負(fù)責(zé):查詢統(tǒng)計(jì)、征管狀況分析、報(bào)表管理、稅收收入核算分析系統(tǒng)、電子檔案管理的建設(shè)和大數(shù)據(jù)平臺(tái)的日常應(yīng)用管理建設(shè)。4 數(shù)據(jù)治理負(fù)責(zé)環(huán)境的數(shù)據(jù)治理,它是結(jié)合數(shù)據(jù)治理相關(guān)的組織、制度和流程和數(shù)據(jù)標(biāo)準(zhǔn)完成對(duì)數(shù)據(jù)的治理,治理內(nèi)容包括:數(shù)據(jù)質(zhì)量的管理、元數(shù)據(jù)的管理、數(shù)據(jù)
29、生命周期的管理、以及數(shù)據(jù)審計(jì)管理等。數(shù)據(jù)框架細(xì)化設(shè)計(jì)1、基礎(chǔ)數(shù)據(jù)層基于目前總局?jǐn)?shù)據(jù)狀況,數(shù)據(jù)采集的源頭主要包含:各類稅收業(yè)務(wù)系統(tǒng)數(shù)據(jù)、外部交換數(shù)據(jù)、互聯(lián)網(wǎng)開(kāi)放數(shù)據(jù)。稅收業(yè)務(wù)系統(tǒng):稅收業(yè)務(wù)系統(tǒng)是本次數(shù)據(jù)體系中最主要的數(shù)據(jù)源頭,稅務(wù)業(yè)務(wù)相關(guān)的數(shù)據(jù)主要從這些系統(tǒng)中獲取。核心征管系統(tǒng)數(shù)據(jù)覆蓋13個(gè)業(yè)務(wù)域的業(yè)務(wù)數(shù)據(jù),同時(shí)發(fā)票數(shù)據(jù)和出口退稅數(shù)據(jù)雖然系統(tǒng)還沒(méi)有統(tǒng)一,但是會(huì)統(tǒng)一采集到核心征管數(shù)據(jù)體系內(nèi)。交換數(shù)據(jù):交換數(shù)據(jù)分為兩個(gè)部分,總局統(tǒng)一交換數(shù)據(jù)和各省局交換數(shù)據(jù)。在基礎(chǔ)數(shù)據(jù)層會(huì)單獨(dú)規(guī)劃交換數(shù)據(jù)域,統(tǒng)一規(guī)劃數(shù)據(jù)交換模型,將總局交換數(shù)據(jù)中數(shù)據(jù)價(jià)值度高、數(shù)據(jù)質(zhì)量高、數(shù)據(jù)穩(wěn)定性好的數(shù)據(jù)和選取幾個(gè)省局的交換數(shù)據(jù),合
30、并數(shù)據(jù)結(jié)構(gòu),采集到統(tǒng)一的數(shù)據(jù)交換域。互聯(lián)網(wǎng)數(shù)據(jù):互聯(lián)網(wǎng)是一個(gè)開(kāi)放式的數(shù)據(jù)源,在本次數(shù)據(jù)體系和應(yīng)用的建設(shè)中,需要依賴互聯(lián)網(wǎng)的開(kāi)放數(shù)據(jù)作為應(yīng)用的基礎(chǔ)數(shù)據(jù),參與稅務(wù)數(shù)據(jù)價(jià)值挖掘過(guò)程中。互聯(lián)網(wǎng)的數(shù)據(jù)獲取會(huì)利用平臺(tái)的爬蟲(chóng)工具,定向的獲取互聯(lián)網(wǎng)數(shù)據(jù)。本次需要建設(shè)互聯(lián)網(wǎng)爬數(shù)的平臺(tái),能夠滿足甲方不斷增加數(shù)據(jù)源,調(diào)整數(shù)據(jù)爬取深度的要求,滿足爬取數(shù)據(jù)從非結(jié)構(gòu)化到結(jié)構(gòu)化存儲(chǔ)的要求;2、數(shù)據(jù)中間層數(shù)據(jù)中間層的建設(shè)主要的目的是將采集和整理后的基礎(chǔ)數(shù)據(jù),以某個(gè)主體或者關(guān)系,將數(shù)據(jù)聯(lián)系起來(lái)。設(shè)計(jì)擴(kuò)展性強(qiáng)的數(shù)據(jù)模型,隨著原始業(yè)務(wù)數(shù)據(jù)的逐步豐富,不停豐富主體的描述、行為及管理類的數(shù)據(jù)。 數(shù)據(jù)中間層在整個(gè)數(shù)據(jù)體系建設(shè)中起到通的作
31、用,以主體維度聯(lián)通各種來(lái)源數(shù)據(jù)。聯(lián)通后的中間層數(shù)據(jù),將提供給下游模型和挖掘應(yīng)用更豐富、更標(biāo)準(zhǔn)、更易用的生產(chǎn)原料??偩执髷?shù)據(jù)云平臺(tái)將具有強(qiáng)大得數(shù)據(jù)計(jì)算和存儲(chǔ)能力。基于平臺(tái)的能力和互聯(lián)網(wǎng)數(shù)據(jù)建設(shè)的設(shè)計(jì)思路,在數(shù)據(jù)中間層的建設(shè)中不會(huì)做復(fù)雜的業(yè)務(wù)邏輯加工,保留業(yè)務(wù)的事實(shí)明細(xì)數(shù)據(jù)。增強(qiáng)數(shù)據(jù)中間層的擴(kuò)展性和復(fù)用性,業(yè)務(wù)邏輯的加工放在應(yīng)用和挖掘?qū)油瓿伞_@樣會(huì)壓縮整個(gè)數(shù)據(jù)處理的過(guò)程,同時(shí)有利于數(shù)據(jù)口徑的統(tǒng)一和數(shù)據(jù)質(zhì)量的控制。基于目前總局對(duì)于大數(shù)據(jù)應(yīng)用的要求,本次數(shù)據(jù)中間層的建設(shè)將著重三個(gè)主體庫(kù)的建設(shè):企業(yè)庫(kù)、自然人庫(kù)、關(guān)系庫(kù)。3 數(shù)據(jù)挖掘?qū)訑?shù)據(jù)挖掘是指利用打通后的數(shù)據(jù),針對(duì)需要數(shù)據(jù)支撐的業(yè)務(wù),進(jìn)行數(shù)據(jù)模型的建
32、設(shè)和數(shù)據(jù)價(jià)值的挖掘?;诒敬卧破脚_(tái)數(shù)據(jù)管理項(xiàng)目的業(yè)務(wù)需求,數(shù)據(jù)模型和挖掘?qū)鞴芊治瞿P?、企業(yè)風(fēng)險(xiǎn)控制模型、個(gè)人風(fēng)險(xiǎn)控制模型、企業(yè)標(biāo)簽體系模型、自然人標(biāo)簽體系模型。征管分析模型:基于目前總局對(duì)于征管工作所規(guī)劃的指標(biāo)體系,提煉出當(dāng)前業(yè)務(wù)狀態(tài)下最關(guān)鍵和重要的指標(biāo),對(duì)這些指標(biāo)進(jìn)行數(shù)據(jù)建模,每日生產(chǎn)出數(shù)據(jù)指標(biāo)數(shù)據(jù),并持續(xù)跟蹤指標(biāo)的變化情況,為征管工作分析應(yīng)用提供數(shù)據(jù)支撐。 企業(yè)標(biāo)簽體系模型:針對(duì)目前總局對(duì)于企業(yè)征稅管理的需要,設(shè)計(jì)對(duì)企業(yè)進(jìn)行分類、刻畫(huà)的描述標(biāo)簽,制定標(biāo)簽業(yè)務(wù)含義及數(shù)據(jù)算法,通過(guò)對(duì)企業(yè)庫(kù)的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得刻畫(huà)企業(yè)的標(biāo)簽數(shù)據(jù)。自然人標(biāo)簽體系模型:針對(duì)目前總局對(duì)于自然人征稅管理的需要
33、,設(shè)計(jì)對(duì)自然人進(jìn)行分類、刻畫(huà)的描述標(biāo)簽,制定標(biāo)簽業(yè)務(wù)含義及數(shù)據(jù)算法,通過(guò)對(duì)自然人庫(kù)的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得刻畫(huà)自然人的標(biāo)簽數(shù)據(jù)。算法模型優(yōu)化方案算法概述算法(Algorithm)是指解題方案的準(zhǔn)確而完整的描述,是一系列解決問(wèn)題的清晰指令,算法代表著用系統(tǒng)的方法描述解決問(wèn)題的策略機(jī)制。也就是說(shuō),能夠?qū)σ欢ㄒ?guī)范的輸入,在有限時(shí)間內(nèi)獲得所要求的輸出。如果一個(gè)算法有缺陷,或不適合于某個(gè)問(wèn)題,執(zhí)行這個(gè)算法將不會(huì)解決這個(gè)問(wèn)題。不同的算法可能用不同的時(shí)間、空間或效率來(lái)完成同樣的任務(wù)。一個(gè)算法的優(yōu)劣可以用空間復(fù)雜度與時(shí)間復(fù)雜度來(lái)衡量。算法中的指令描述的是一個(gè)計(jì)算,當(dāng)其運(yùn)行時(shí)能從一個(gè)初始狀態(tài)和(可能為空的)初始
34、輸入開(kāi)始,經(jīng)過(guò)一系列有限而清晰定義的狀態(tài),最終產(chǎn)生輸出并停止于一個(gè)終態(tài)。一個(gè)狀態(tài)到另一個(gè)狀態(tài)的轉(zhuǎn)移不一定是確定的。隨機(jī)化算法在內(nèi)的一些算法,包含了一些隨機(jī)輸入。算法的特征一個(gè)算法應(yīng)該具有以下五個(gè)重要的特征:有窮性(Finiteness)算法的有窮性是指算法必須能在執(zhí)行有限個(gè)步驟之后終止;確切性(Definiteness)算法的每一步驟必須有確切的定義;輸入項(xiàng)(Input)一個(gè)算法有0個(gè)或多個(gè)輸入,以刻畫(huà)運(yùn)算對(duì)象的初始情況,所謂0個(gè)輸入是指算法本身定出了初始條件;輸出項(xiàng)(Output)一個(gè)算法有一個(gè)或多個(gè)輸出,以反映對(duì)輸入數(shù)據(jù)加工后的結(jié)果。沒(méi)有輸出的算法是毫無(wú)意義的;可行性(Effectiven
35、ess)算法中執(zhí)行的任何計(jì)算步驟都是可以被分解為基本的可執(zhí)行的操作步,即每個(gè)計(jì)算步都可以在有限時(shí)間內(nèi)完成(也稱之為有效性)。算法的要素一,數(shù)據(jù)對(duì)象的運(yùn)算和操作計(jì)算機(jī)可以執(zhí)行的基本操作是以指令的形式描述的。一個(gè)計(jì)算機(jī)系統(tǒng)能執(zhí)行的所有指令的集合,成為該計(jì)算機(jī)系統(tǒng)的指令系統(tǒng)。一個(gè)計(jì)算機(jī)的基本運(yùn)算和操作有如下四類:1算術(shù)運(yùn)算:加減乘除等運(yùn)算。2邏輯運(yùn)算:或、且、非等運(yùn)算。3關(guān)系運(yùn)算:大于、小于、等于、不等于等運(yùn)算。4數(shù)據(jù)傳輸:輸入、輸出、賦值等運(yùn)算。二,算法的控制結(jié)構(gòu)一個(gè)算法的功能結(jié)構(gòu)不僅取決于所選用的操作,而且還與各操作之間的執(zhí)行順序有關(guān)。算法的判定同一問(wèn)題可用不同算法解決,而一個(gè)算法的質(zhì)量?jī)?yōu)劣將影
36、響到算法乃至程序的效率。算法分析的目的在于選擇合適算法和改進(jìn)算法。一個(gè)算法的評(píng)價(jià)主要從時(shí)間復(fù)雜度和空間復(fù)雜度來(lái)考慮。時(shí)間復(fù)雜度算法的時(shí)間復(fù)雜度是指執(zhí)行算法所需要的計(jì)算工作量。一般來(lái)說(shuō),計(jì)算機(jī)算法是問(wèn)題規(guī)模n 的函數(shù)f(n),算法的時(shí)間復(fù)雜度也因此記做:T(n)=(f(n)因此,問(wèn)題的規(guī)模n 越大,算法執(zhí)行的時(shí)間的增長(zhǎng)率與f(n) 的增長(zhǎng)率正相關(guān),稱作漸進(jìn)時(shí)間復(fù)雜度(Asymptotic Time Complexity)。空間復(fù)雜度算法的空間復(fù)雜度是指算法需要消耗的內(nèi)存空間。其計(jì)算和表示方法與時(shí)間復(fù)雜度類似,一般都用復(fù)雜度的漸近性來(lái)表示。同時(shí)間復(fù)雜度相比,空間復(fù)雜度的分析要簡(jiǎn)單得多。正確性算法的
37、正確性是評(píng)價(jià)一個(gè)算法優(yōu)劣的最重要的標(biāo)準(zhǔn)??勺x性算法的可讀性是指一個(gè)算法可供人們閱讀的容易程度。健壯性健壯性是指一個(gè)算法對(duì)不合理數(shù)據(jù)輸入的反應(yīng)能力和處理能力,也稱為容錯(cuò)性。算法的描述方式描述算法的方法有多種,常用的有自然語(yǔ)言、結(jié)構(gòu)化流程圖、偽代碼和PAD圖等,其中最普遍的是流程圖。典型的算法遞推法遞推是序列計(jì)算機(jī)中的一種常用算法。它是按照一定的規(guī)律來(lái)計(jì)算序列中的每個(gè)項(xiàng),通常是通過(guò)計(jì)算機(jī)前面的一些項(xiàng)來(lái)得出序列中的指定項(xiàng)的值。其思想是把一個(gè)復(fù)雜的龐大的計(jì)算過(guò)程轉(zhuǎn)化為簡(jiǎn)單過(guò)程的多次重復(fù),該算法利用了計(jì)算機(jī)速度快和不知疲倦的特點(diǎn)。遞歸法程序調(diào)用自身的編程技巧稱為遞歸(recursion)。一個(gè)過(guò)程或函數(shù)
38、在其定義或說(shuō)明中有直接或間接調(diào)用自身的一種方法,它通常把一個(gè)大型復(fù)雜的問(wèn)題層層轉(zhuǎn)化為一個(gè)與原問(wèn)題相似的規(guī)模較小的問(wèn)題來(lái)求解,遞歸策略只需少量的程序就可描述出解題過(guò)程所需要的多次重復(fù)計(jì)算,大大地減少了程序的代碼量。遞歸的能力在于用有限的語(yǔ)句來(lái)定義對(duì)象的無(wú)限集合。一般來(lái)說(shuō),遞歸需要有邊界條件、遞歸前進(jìn)段和遞歸返回段。當(dāng)邊界條件不滿足時(shí),遞歸前進(jìn);當(dāng)邊界條件滿足時(shí),遞歸返回。注意:(1)遞歸就是在過(guò)程或函數(shù)里調(diào)用自身;(2)在使用遞歸策略時(shí),必須有一個(gè)明確的遞歸結(jié)束條件,稱為遞歸出口。窮舉法窮舉法,或稱為暴力破解法,其基本思路是:對(duì)于要解決的問(wèn)題,列舉出它的所有可能的情況,逐個(gè)判斷有哪些是符合問(wèn)題所
39、要求的條件,從而得到問(wèn)題的解。它也常用于對(duì)于密碼的破譯,即將密碼進(jìn)行逐個(gè)推算直到找出真正的密碼為止。例如一個(gè)已知是四位并且全部由數(shù)字組成的密碼,其可能共有10000種組合,因此最多嘗試10000次就能找到正確的密碼。理論上利用這種方法可以破解任何一種密碼,問(wèn)題只在于如何縮短試誤時(shí)間。因此有些人運(yùn)用計(jì)算機(jī)來(lái)增加效率,有些人輔以字典來(lái)縮小密碼組合的范圍。貪心算法貪心算法是一種對(duì)某些求最優(yōu)解問(wèn)題的更簡(jiǎn)單、更迅速的設(shè)計(jì)技術(shù)。用貪心法設(shè)計(jì)算法的特點(diǎn)是一步一步地進(jìn)行,常以當(dāng)前情況為基礎(chǔ)根據(jù)某個(gè)優(yōu)化測(cè)度作最優(yōu)選擇,而不考慮各種可能的整體情況,它省去了為找最優(yōu)解要窮盡所有可能而必須耗費(fèi)的大量時(shí)間,它采用自頂向
40、下,以迭代的方法做出相繼的貪心選擇,每做一次貪心選擇就將所求問(wèn)題簡(jiǎn)化為一個(gè)規(guī)模更小的子問(wèn)題,通過(guò)每一步貪心選擇,可得到問(wèn)題的一個(gè)最優(yōu)解,雖然每一步上都要保證能獲得局部最優(yōu)解,但由此產(chǎn)生的全局解有時(shí)不一定是最優(yōu)的,所以貪婪法不要回溯。貪婪算法是一種改進(jìn)了的分級(jí)處理方法,其核心是根據(jù)題意選取一種量度標(biāo)準(zhǔn),然后將這多個(gè)輸入排成這種量度標(biāo)準(zhǔn)所要求的順序,按這種順序一次輸入一個(gè)量,如果這個(gè)輸入和當(dāng)前已構(gòu)成在這種量度意義下的部分最佳解加在一起不能產(chǎn)生一個(gè)可行解,則不把此輸入加到這部分解中。這種能夠得到某種量度意義下最優(yōu)解的分級(jí)處理方法稱為貪婪算法。對(duì)于一個(gè)給定的問(wèn)題,往往可能有好幾種量度標(biāo)準(zhǔn)。初看起來(lái),這
41、些量度標(biāo)準(zhǔn)似乎都是可取的,但實(shí)際上,用其中的大多數(shù)量度標(biāo)準(zhǔn)作貪婪處理所得到該量度意義下的最優(yōu)解并不是問(wèn)題的最優(yōu)解,而是次優(yōu)解。因此,選擇能產(chǎn)生問(wèn)題最優(yōu)解的最優(yōu)量度標(biāo)準(zhǔn)是使用貪婪算法的核心。一般情況下,要選出最優(yōu)量度標(biāo)準(zhǔn)并不是一件容易的事,但對(duì)某問(wèn)題能選擇出最優(yōu)量度標(biāo)準(zhǔn)后,用貪婪算法求解則特別有效。分治法分治法是把一個(gè)復(fù)雜的問(wèn)題分成兩個(gè)或更多的相同或相似的子問(wèn)題,再把子問(wèn)題分成更小的子問(wèn)題直到最后子問(wèn)題可以簡(jiǎn)單的直接求解,原問(wèn)題的解即子問(wèn)題的解的合并。分治法所能解決的問(wèn)題一般具有以下幾個(gè)特征:(1)該問(wèn)題的規(guī)模縮小到一定的程度就可以容易地解決;(2)該問(wèn)題可以分解為若干個(gè)規(guī)模較小的相同問(wèn)題,即該
42、問(wèn)題具有最優(yōu)子結(jié)構(gòu)性質(zhì);(3)利用該問(wèn)題分解出的子問(wèn)題的解可以合并為該問(wèn)題的解;(4)該問(wèn)題所分解出的各個(gè)子問(wèn)題是相互獨(dú)立的,即子問(wèn)題之間不包含公共的子子問(wèn)題。動(dòng)態(tài)規(guī)劃法動(dòng)態(tài)規(guī)劃是一種在數(shù)學(xué)和計(jì)算機(jī)科學(xué)中使用的,用于求解包含重疊子問(wèn)題的最優(yōu)化問(wèn)題的方法。其基本思想是,將原問(wèn)題分解為相似的子問(wèn)題,在求解的過(guò)程中通過(guò)子問(wèn)題的解求出原問(wèn)題的解。動(dòng)態(tài)規(guī)劃的思想是多種算法的基礎(chǔ),被廣泛應(yīng)用于計(jì)算機(jī)科學(xué)和工程領(lǐng)域。動(dòng)態(tài)規(guī)劃程序設(shè)計(jì)是對(duì)解最優(yōu)化問(wèn)題的一種途徑、一種方法,而不是一種特殊算法。不象前面所述的那些搜索或數(shù)值計(jì)算那樣,具有一個(gè)標(biāo)準(zhǔn)的數(shù)學(xué)表達(dá)式和明確清晰的解題方法。動(dòng)態(tài)規(guī)劃程序設(shè)計(jì)往往是針對(duì)一種最優(yōu)化
43、問(wèn)題,由于各種問(wèn)題的性質(zhì)不同,確定最優(yōu)解的條件也互不相同,因而動(dòng)態(tài)規(guī)劃的設(shè)計(jì)方法對(duì)不同的問(wèn)題,有各具特色的解題方法,而不存在一種萬(wàn)能的動(dòng)態(tài)規(guī)劃算法,可以解決各類最優(yōu)化問(wèn)題。因此讀者在學(xué)習(xí)時(shí),除了要對(duì)基本概念和方法正確理解外,必須具體問(wèn)題具體分析處理,以豐富的想象力去建立模型,用創(chuàng)造性的技巧去求解。迭代法迭代法也稱輾轉(zhuǎn)法,是一種不斷用變量的舊值遞推新值的過(guò)程,跟迭代法相對(duì)應(yīng)的是直接法(或者稱為一次解法),即一次性解決問(wèn)題。迭代法又分為精確迭代和近似迭代。“二分法”和“牛頓迭代法”屬于近似迭代法。迭代算法是用計(jì)算機(jī)解決問(wèn)題的一種基本方法。它利用計(jì)算機(jī)運(yùn)算速度快、適合做重復(fù)性操作的特點(diǎn),讓計(jì)算機(jī)對(duì)一
44、組指令(或一定步驟)進(jìn)行重復(fù)執(zhí)行,在每次執(zhí)行這組指令(或這些步驟)時(shí),都從變量的原值推出它的一個(gè)新值。分支界限法分枝界限法是一個(gè)用途十分廣泛的算法,運(yùn)用這種算法的技巧性很強(qiáng),不同類型的問(wèn)題解法也各不相同。分支定界法的基本思想是對(duì)有約束條件的最優(yōu)化問(wèn)題的所有可行解(數(shù)目有限)空間進(jìn)行搜索。該算法在具體執(zhí)行時(shí),把全部可行的解空間不斷分割為越來(lái)越小的子集(稱為分支),并為每個(gè)子集內(nèi)的解的值計(jì)算一個(gè)下界或上界(稱為定界)。在每次分支后,對(duì)凡是界限超出已知可行解值那些子集不再做進(jìn)一步分支,這樣,解的許多子集(即搜索樹(shù)上的許多結(jié)點(diǎn))就可以不予考慮了,從而縮小了搜索范圍。這一過(guò)程一直進(jìn)行到找出可行解為止,該
45、可行解的值不大于任何子集的界限。因此這種算法一般可以求得最優(yōu)解。與貪心算法一樣,這種方法也是用來(lái)為組合優(yōu)化問(wèn)題設(shè)計(jì)求解算法的,所不同的是它在問(wèn)題的整個(gè)可能解空間搜索,所設(shè)計(jì)出來(lái)的算法雖其時(shí)間復(fù)雜度比貪婪算法高,但它的優(yōu)點(diǎn)是與窮舉法類似,都能保證求出問(wèn)題的最佳解,而且這種方法不是盲目的窮舉搜索,而是在搜索過(guò)程中通過(guò)限界,可以中途停止對(duì)某些不可能得到最優(yōu)解的子空間進(jìn)一步搜索(類似于人工智能中的剪枝),故它比窮舉法效率更高。回溯法回溯法(探索與回溯法)是一種選優(yōu)搜索法,按選優(yōu)條件向前搜索,以達(dá)到目標(biāo)。但當(dāng)探索到某一步時(shí),發(fā)現(xiàn)原先選擇并不優(yōu)或達(dá)不到目標(biāo),就退回一步重新選擇,這種走不通就退回再走的技術(shù)為
46、回溯法,而滿足回溯條件的某個(gè)狀態(tài)的點(diǎn)稱為“回溯點(diǎn)”。其基本思想是,在包含問(wèn)題的所有解的解空間樹(shù)中,按照深度優(yōu)先搜索的策略,從根結(jié)點(diǎn)出發(fā)深度探索解空間樹(shù)。當(dāng)探索到某一結(jié)點(diǎn)時(shí),要先判斷該結(jié)點(diǎn)是否包含問(wèn)題的解,如果包含,就從該結(jié)點(diǎn)出發(fā)繼續(xù)探索下去,如果該結(jié)點(diǎn)不包含問(wèn)題的解,則逐層向其祖先結(jié)點(diǎn)回溯。(其實(shí)回溯法就是對(duì)隱式圖的深度優(yōu)先搜索算法)。 若用回溯法求問(wèn)題的所有解時(shí),要回溯到根,且根結(jié)點(diǎn)的所有可行的子樹(shù)都要已被搜索遍才結(jié)束。 而若使用回溯法求任一個(gè)解時(shí),只要搜索到問(wèn)題的一個(gè)解就可以結(jié)束。算法模型優(yōu)化算法模型優(yōu)化要點(diǎn)模型是一類問(wèn)題的解題步驟,亦即一類問(wèn)題的算法。如果問(wèn)題的算法不具有一般性,就沒(méi)有必
47、要為算法建立模型。模型的建立是基于統(tǒng)計(jì)學(xué)和數(shù)據(jù)挖掘理論和工具建立起來(lái)的算法模型,它是口徑、算法及其數(shù)據(jù)的集合。在云平臺(tái)數(shù)據(jù)管理中,數(shù)據(jù)模型建設(shè)是至關(guān)重要的。數(shù)據(jù)模型應(yīng)分成多層進(jìn)行設(shè)計(jì),涵蓋稅務(wù)業(yè)務(wù)內(nèi)涵需完整、全面。具體的優(yōu)化要點(diǎn)如下:1、統(tǒng)一數(shù)據(jù)視圖建模優(yōu)化統(tǒng)一數(shù)據(jù)視圖是一個(gè)面向主題的、集成的、可變的、當(dāng)前的數(shù)據(jù)集合,用于支持對(duì)即時(shí)性的、操作性的、集成的數(shù)據(jù)運(yùn)用需求。統(tǒng)一數(shù)據(jù)視圖可以按照3NF 設(shè)計(jì)成OLTP數(shù)據(jù)庫(kù),以總體架構(gòu)項(xiàng)目規(guī)劃的數(shù)據(jù)模型為基礎(chǔ),優(yōu)化其邏輯訪問(wèn)及物理存儲(chǔ)結(jié)構(gòu),達(dá)到高效查詢的要求。2、數(shù)據(jù)倉(cāng)庫(kù)建模優(yōu)化數(shù)據(jù)倉(cāng)庫(kù)的特征在于面向主題、集成性、穩(wěn)定性和時(shí)變性,用于提供稅收業(yè)務(wù)完整的
48、業(yè)務(wù)視圖,包 稅收業(yè)務(wù)各環(huán)節(jié)的基礎(chǔ)業(yè)務(wù)數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)可以參考3NF、STAR-SCHEMA等建模方法確定數(shù)據(jù)模型,優(yōu)化其邏輯訪問(wèn)及物理存儲(chǔ)結(jié)構(gòu),以便處理大量的數(shù)據(jù)并發(fā)訪問(wèn)。 3、數(shù)據(jù)集市建模優(yōu)化圍繞數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù),面向不同分析主題,進(jìn)行數(shù)據(jù)集市建模,完成數(shù)據(jù)運(yùn)用平臺(tái)和聯(lián)機(jī)分析應(yīng)用。數(shù)據(jù)集市的結(jié)構(gòu)可以是多維數(shù)據(jù)集(如星型、雪花型),也可以是關(guān)系數(shù)據(jù)集。數(shù)據(jù)模型的設(shè)計(jì),包括指標(biāo)體系建立、分析方法選擇、分析主題建立等三項(xiàng)內(nèi)容。1)指標(biāo)體系建立:構(gòu)建稅務(wù)分析指標(biāo)體系,包括報(bào)表類、分析類、評(píng)估類和考核類指標(biāo)等,形成指標(biāo)庫(kù)(如數(shù)據(jù)質(zhì)量指標(biāo)庫(kù)),以支撐核算管理、風(fēng)險(xiǎn)管理、政策評(píng)估、績(jī)效考核等分析應(yīng)用。指標(biāo)體系
49、的構(gòu)建,需要全面反映稅務(wù)數(shù)據(jù)運(yùn)用平臺(tái)支持的需求,具有前瞻性、靈活性、可擴(kuò)展性等特點(diǎn)。2)分析方法選擇:只有綜合地運(yùn)用分析方法才能實(shí)現(xiàn)深入分析的目標(biāo)。數(shù)據(jù)運(yùn)用平臺(tái),應(yīng)從數(shù)據(jù)倉(cāng)庫(kù)中選出數(shù)據(jù)集,在數(shù)據(jù)集上運(yùn)用科學(xué)的分析方法,建立稅務(wù)行業(yè)分析模型。分析方法包括: 80/20 分析、對(duì)比分析、因素分析等常見(jiàn)算法,聚類、關(guān)聯(lián)、分類等高級(jí)算法,以及決策樹(shù)、神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘算法。數(shù)據(jù)模型優(yōu)化征管分析模型征管業(yè)務(wù)流程主體是由登記、認(rèn)定、申報(bào)、征收和計(jì)會(huì)統(tǒng)構(gòu)成的稅收主題。我們針對(duì)該模型的建設(shè)方式也需要圍繞該主題進(jìn)行。企業(yè)標(biāo)簽體系模型企業(yè)標(biāo)簽體系模型,針對(duì)目前總局對(duì)于企業(yè)征稅管理的需要,設(shè)計(jì)對(duì)企業(yè)進(jìn)行分類、刻畫(huà)的
50、描述標(biāo)簽,制定標(biāo)簽業(yè)務(wù)含義及數(shù)據(jù)算法,通過(guò)對(duì)企業(yè)庫(kù)的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得刻畫(huà)企業(yè)的標(biāo)簽數(shù)據(jù)。企業(yè)標(biāo)簽概念模型設(shè)計(jì)其左半部分?jǐn)⑹隽巳齻€(gè)層級(jí)標(biāo)簽的數(shù)量,右半部分則對(duì)標(biāo)簽層級(jí)進(jìn)行舉例說(shuō)明。行為能力挖掘框架設(shè)計(jì)能力標(biāo)簽挖掘,即對(duì)用戶標(biāo)簽體系中的能力標(biāo)簽進(jìn)行挖掘。具體的,在整體用戶能力標(biāo)簽挖掘流程中,首先通過(guò)用戶關(guān)系數(shù)據(jù)(主要是分組,用于體現(xiàn)粉絲對(duì)于用戶能力的認(rèn)可度)、用戶內(nèi)容數(shù)據(jù)(主要是原創(chuàng)博文,用于體現(xiàn)用戶自身的專業(yè)能力)、用戶行為數(shù)據(jù)(主要是轉(zhuǎn)、評(píng)、贊等互動(dòng)信息,用于體現(xiàn)該用戶在相關(guān)領(lǐng)域內(nèi)的影響力)挖掘出用戶的能力標(biāo)簽及其基礎(chǔ)權(quán)重;其次通過(guò)引入用戶的自填信息、認(rèn)證信息作為能力標(biāo)簽權(quán)重的調(diào)權(quán)因子參
51、與計(jì)算;接下來(lái)通過(guò)多個(gè)維度的定向挖掘系統(tǒng)和運(yùn)營(yíng)反饋系統(tǒng)進(jìn)行能力標(biāo)簽的校正和增加能力標(biāo)簽的覆蓋。最后,將挖掘出來(lái)的用戶能力標(biāo)簽及權(quán)重輸出至用戶能力標(biāo)簽庫(kù),供上層業(yè)務(wù)調(diào)用。標(biāo)簽挖掘模型關(guān)鍵點(diǎn)設(shè)計(jì)1 標(biāo)簽匯集分組信息即用戶為關(guān)注對(duì)象打上的標(biāo)簽作為用戶關(guān)系數(shù)據(jù)引入到挖掘過(guò)程中,由于標(biāo)簽屬于UGC,就會(huì)造成同一個(gè)標(biāo)簽主題有多種不同的表達(dá)方式,將多種不同的表達(dá)方式聚合起來(lái),形成一個(gè)標(biāo)簽集,并且映射到我們的標(biāo)簽體系中,可以有效地提升能力標(biāo)簽的準(zhǔn)確率和覆蓋率。首先將分組信息通過(guò)分類模型劃分為強(qiáng)關(guān)系型(稅務(wù)機(jī)關(guān),稅務(wù)活動(dòng)等)和行為型(繳納、金額等)兩類,并將行為型分組信息作為我們的基礎(chǔ)預(yù)料。接下來(lái)通過(guò)聚類、關(guān)聯(lián)
52、等相關(guān)算法進(jìn)行標(biāo)簽詞(分組信息)的聚合;最后將聚合的標(biāo)簽集根據(jù)相關(guān)程度等因子劃分為高相關(guān)和低相關(guān)兩類。如下所示:標(biāo)簽高相關(guān)標(biāo)簽低相關(guān)標(biāo)簽稅務(wù)活動(dòng)征收機(jī)關(guān)、稅種、稅目、征收方式、交款方式、作廢標(biāo)志、入庫(kù)標(biāo)識(shí)等行業(yè)、主管機(jī)關(guān)等2 用戶關(guān)注度用戶關(guān)注度指的是用戶在某個(gè)特定標(biāo)簽下的受關(guān)注程度,因此影響力計(jì)算的邊界是標(biāo)簽對(duì)應(yīng)的興趣用戶群體(包含該標(biāo)簽的能力用戶),即對(duì)該標(biāo)簽所對(duì)應(yīng)的領(lǐng)域有一定了解的用戶群體。具體地,我們將其它用戶對(duì)某個(gè)企業(yè)的行為關(guān)注為作為基礎(chǔ)數(shù)據(jù),利用迭代算法進(jìn)行該用戶關(guān)注度的計(jì)算。3 時(shí)間衰減效益考慮到企業(yè)用戶數(shù)據(jù)的消費(fèi)價(jià)值和計(jì)算代價(jià),對(duì)于用戶內(nèi)容數(shù)據(jù),我們選取了用戶近一段時(shí)期內(nèi)行為活
53、動(dòng)作為基礎(chǔ)參照進(jìn)行計(jì)算。關(guān)于時(shí)間衰減,我們結(jié)合牛頓冷卻定律和微博的業(yè)務(wù)需求推導(dǎo)出相應(yīng)的衰減公式,并通過(guò)衰減效果的對(duì)比,確定了相關(guān)衰減參數(shù)的數(shù)值,最終得出了用戶行為標(biāo)簽內(nèi)容權(quán)重的時(shí)間衰減函數(shù)自然人標(biāo)簽體系模型自然人標(biāo)簽體系模型,針對(duì)目前總局對(duì)于自然人征稅管理的需要,設(shè)計(jì)對(duì)自然人進(jìn)行分類、刻畫(huà)的描述標(biāo)簽,制定標(biāo)簽業(yè)務(wù)含義及數(shù)據(jù)算法,通過(guò)對(duì)自然人庫(kù)的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得刻畫(huà)自然人的標(biāo)簽數(shù)據(jù)。自然人標(biāo)簽體系概念模型比企業(yè)標(biāo)簽?zāi)P驮黾恿岁P(guān)系標(biāo)簽行為能力挖掘框架設(shè)計(jì)短時(shí)動(dòng)態(tài)數(shù)據(jù)建設(shè)短時(shí)動(dòng)態(tài)數(shù)據(jù)建設(shè)為解決總局快速發(fā)現(xiàn)問(wèn)題、快速反應(yīng)業(yè)務(wù)變化的需求提供服務(wù)。采用總局大數(shù)據(jù)云平臺(tái)的流式數(shù)據(jù)處理的能力,能夠準(zhǔn)實(shí)時(shí)
54、的通過(guò)數(shù)據(jù)反應(yīng)業(yè)務(wù)的變化,發(fā)現(xiàn)可能存在的問(wèn)題,并能夠業(yè)務(wù)系統(tǒng)產(chǎn)生聯(lián)動(dòng)。短時(shí)動(dòng)態(tài)數(shù)據(jù)建設(shè)主要基于流式數(shù)據(jù)處理,其過(guò)程基本分為三個(gè)階段:數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)服務(wù)化。數(shù)據(jù)采集:通過(guò)數(shù)據(jù)流采集工具,動(dòng)態(tài)采集業(yè)務(wù)系統(tǒng)中數(shù)據(jù)的變化,并同步到數(shù)據(jù)流式傳輸通道中。數(shù)據(jù)處理:從數(shù)據(jù)流式傳輸通道獲取流式數(shù)據(jù),通過(guò)流式數(shù)據(jù)計(jì)算語(yǔ)言進(jìn)行加工。數(shù)據(jù)服務(wù)化:將數(shù)據(jù)處理的結(jié)果存儲(chǔ)到在線數(shù)據(jù)存儲(chǔ)中,供分析和可視化等應(yīng)用進(jìn)行數(shù)據(jù)展現(xiàn)。流式數(shù)據(jù)處理基于流計(jì)算技術(shù)實(shí)現(xiàn)。要求基于此技術(shù),實(shí)現(xiàn)全國(guó)入庫(kù)情況、申報(bào)情況、稅庫(kù)銀扣款情況、新增開(kāi)業(yè)情況、發(fā)票代開(kāi)情況、在線用戶情況等進(jìn)行實(shí)時(shí)監(jiān)控并利用大屏技術(shù)進(jìn)行綜合展示。流式數(shù)據(jù)設(shè)計(jì)短時(shí)動(dòng)
55、態(tài)數(shù)據(jù)建設(shè)主要基于流式數(shù)據(jù)處理,其過(guò)程基本分為三個(gè)階段:數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)服務(wù)化。數(shù)據(jù)采集流式數(shù)據(jù)處理的支持基礎(chǔ)是實(shí)時(shí)數(shù)據(jù)采集。數(shù)據(jù)處理流式數(shù)據(jù)處理采用簡(jiǎn)易ETL實(shí)現(xiàn),將流式準(zhǔn)備區(qū)中的數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)化、加載后形成可以存儲(chǔ)到數(shù)據(jù)隊(duì)列中。數(shù)據(jù)服務(wù)化數(shù)據(jù)通過(guò)隊(duì)列訂閱獲取流式數(shù)據(jù)隊(duì)列中的數(shù)據(jù),并根據(jù)隊(duì)列輸出數(shù)據(jù)進(jìn)行服務(wù)化轉(zhuǎn)變。企業(yè)風(fēng)險(xiǎn)(信用)模型納稅信用等級(jí)是指稅務(wù)機(jī)關(guān)根據(jù)納稅人履行納稅義務(wù)情況,依據(jù)納稅信用等級(jí)評(píng)定管理試行辦法規(guī)定的標(biāo)準(zhǔn)進(jìn)行評(píng)定的基礎(chǔ)上,就納稅人在一定周期內(nèi)的納稅信用所評(píng)定的等級(jí)。企業(yè)風(fēng)險(xiǎn)(信用)評(píng)定辦法評(píng)定等級(jí)分值比例涉及風(fēng)險(xiǎn)項(xiàng)A分值=95具有涉嫌違反稅收法律、行政法規(guī)行為
56、,至評(píng)定日仍未結(jié)案或已結(jié)案但未按照稅務(wù)機(jī)關(guān)處理決定改正的兩年內(nèi)(指稅務(wù)機(jī)關(guān)確定納稅信用等級(jí)之日起向前推算兩年)新發(fā)生欠繳稅款情形的不能依法報(bào)送財(cái)務(wù)會(huì)計(jì)制度、財(cái)務(wù)會(huì)計(jì)報(bào)表和其他納稅資料的評(píng)定期前兩年有稅務(wù)行政處罰記錄的不能完整、準(zhǔn)確核算應(yīng)納稅款或者不能完整、準(zhǔn)確代扣代繳稅款的B60 =分值 95但至評(píng)定日為止有新發(fā)生欠繳稅款5萬(wàn)元以上的對(duì)辦理稅務(wù)登記不滿兩年的納稅人,不進(jìn)行納稅信用等級(jí)評(píng)定C20=分值 60依法應(yīng)當(dāng)辦理稅務(wù)登記而未辦理稅務(wù)登記的評(píng)定期內(nèi)同時(shí)具備按期納稅申報(bào)率在90%以下,納稅申報(bào)準(zhǔn)確率在70%以下,應(yīng)納稅款按期入庫(kù)率在80%以下,代扣代繳申報(bào)準(zhǔn)確率在80%以下,代扣代繳稅款入庫(kù)率
57、90%以下的兩年內(nèi)(指稅務(wù)機(jī)關(guān)確定納稅信用等級(jí)之日起向前推算兩年)有違反稅收法律、行政法規(guī)的行為,且受到稅務(wù)行政處罰的納入增值稅防偽稅控系統(tǒng)的納稅人,一年內(nèi)兩次不能按期抄報(bào)稅的應(yīng)稅收入、應(yīng)稅所得核算混亂,有關(guān)憑證、賬簿、報(bào)表不完整、不真實(shí)的D分值20具有涉稅犯罪嫌疑,已依法移送公安機(jī)關(guān),尚未結(jié)案的兩年內(nèi)(指稅務(wù)機(jī)關(guān)確定納稅信用等級(jí)之日起向前推算兩年)有偷稅、逃避追繳欠稅、騙取出口退稅、抗稅、虛開(kāi)增值稅專用發(fā)票等涉稅犯罪行為記錄的騙取稅收優(yōu)惠政策、騙取多繳稅款退回的企業(yè)風(fēng)險(xiǎn)(信用)模型設(shè)計(jì)依據(jù)納稅信用等級(jí)評(píng)定管理試行辦法,公司設(shè)計(jì)風(fēng)險(xiǎn)(信用)評(píng)估模型。表名:fx_qyfxpg表描述:企業(yè)風(fēng)險(xiǎn)(信
58、用)評(píng)估表描述企業(yè)風(fēng)險(xiǎn)信用等級(jí)為劃型和稅務(wù)評(píng)估做出參考列名字段類型注釋備注NSRSBHVARCHAR2(30)納稅人識(shí)別碼NSRMCVARCHAR2(75)納稅人名稱FXPGXMLXCHAR(2)風(fēng)險(xiǎn)項(xiàng)目類型PGXMLXFZNUMBER評(píng)估項(xiàng)目類型分值表名:fx_fxpgxmlx表描述:風(fēng)險(xiǎn)(信用)項(xiàng)目評(píng)估類型風(fēng)險(xiǎn)評(píng)定代碼類型表列名字段類型注釋備注fxpgxmlxCHAR2(2)風(fēng)險(xiǎn)(信用)項(xiàng)目評(píng)估類型Fxpgxmlx_mcVARCHAR2(30)風(fēng)險(xiǎn)項(xiàng)目評(píng)估名稱fxpgzcyjChar(6)風(fēng)險(xiǎn)評(píng)定政策依據(jù)LXLRRQDATE風(fēng)險(xiǎn)項(xiàng)目類型列入日期XYBJCHAR(1)選用標(biāo)記表名:fx_ns
59、rfxpdsx表描述:納稅人風(fēng)險(xiǎn)評(píng)定事項(xiàng)風(fēng)險(xiǎn)評(píng)定事項(xiàng)列名字段類型注釋備注nsrsbhVarchar2(30)納稅人識(shí)別碼dqzrnumber檔期收入ljsrnumber累計(jì)收入djrqdate登記日期djzlblnumber登記資料完成比例sssxcsnumber涉稅事項(xiàng)次數(shù)wfajcsnumber違法案件次數(shù)自然人風(fēng)險(xiǎn)(信用)模型自然人風(fēng)險(xiǎn)(信用)模型自然人風(fēng)險(xiǎn)(信用)表模型表名:fx_zrrfxpg表描述:自然人風(fēng)險(xiǎn)(信用)評(píng)估表描述自然人風(fēng)險(xiǎn)信用等級(jí)為劃型和稅務(wù)評(píng)估做出參考列名字段類型注釋備注zrrsfzjxxVARCHAR2(30)自然人身份證件信息zrrmcVARCHAR2(75)自
60、然人名稱FXPGXMLXCHAR(2)風(fēng)險(xiǎn)項(xiàng)目類型PGXMLXFZNUMBER評(píng)估項(xiàng)目類型分值表名:fx_zrrfxpgxmlx表描述:風(fēng)險(xiǎn)(信用)項(xiàng)目評(píng)估類型風(fēng)險(xiǎn)評(píng)定代碼類型表列名字段類型注釋備注fxpgxmlxCHAR2(2)風(fēng)險(xiǎn)(信用)項(xiàng)目評(píng)估類型Fxpgxmlx_mcVARCHAR2(30)風(fēng)險(xiǎn)項(xiàng)目評(píng)估名稱fxpgzcyjChar(6)風(fēng)險(xiǎn)評(píng)定政策依據(jù)LXLRRQDATE風(fēng)險(xiǎn)項(xiàng)目類型列入日期XYBJCHAR(1)選用標(biāo)記表名:fx_zrrfxpdsx表描述:自然人風(fēng)險(xiǎn)評(píng)定事項(xiàng)風(fēng)險(xiǎn)評(píng)定事項(xiàng)列名字段類型注釋備注nsrsbhVarchar2(30)納稅人識(shí)別碼grsrnumber個(gè)人收入lj
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 三級(jí)人力資源題目及答案
- 趣味性筆試題目及答案
- 扶貧政策實(shí)施路徑研究
- 輻射安全和防護(hù)保衛(wèi)制度
- 談企業(yè)的首席評(píng)選制度
- 論公司法中的嚴(yán)格責(zé)任制度
- 行政規(guī)范性文件附帶審查制度
- 2025年河北保定輔警招錄筆試及答案
- 2025年事業(yè)編老師筆試題庫(kù)及答案
- 數(shù)學(xué)必修四知識(shí)點(diǎn)總結(jié)
- 2025-2026學(xué)年北京市朝陽(yáng)區(qū)高一(上期)期末考試英語(yǔ)試卷(含答案)
- 2026湖南衡陽(yáng)耒陽(yáng)市公安局招聘75名警務(wù)輔助人員考試參考題庫(kù)及答案解析
- 電力工程施工方案及規(guī)范
- 2026年1月浙江省高考(首考)英語(yǔ)試題(含答案詳解)+聽(tīng)力音頻+聽(tīng)力材料
- 2026年時(shí)事政治測(cè)試題庫(kù)附完整答案(網(wǎng)校專用)
- 圣都家裝合同范本
- 智慧物流背景下多式聯(lián)運(yùn)的協(xié)同發(fā)展與運(yùn)輸效能提升研究畢業(yè)論文答辯匯報(bào)
- 替人背債合同范本
- 山西省運(yùn)城市小學(xué)一年級(jí)上學(xué)期數(shù)學(xué)期末考試試題
- 如何預(yù)防旅游陷阱
- pms3.0系統(tǒng)全國(guó)視頻培訓(xùn)材料
評(píng)論
0/150
提交評(píng)論