版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
審計(jì)數(shù)據(jù)采集與分析技術(shù)
計(jì)算機(jī)審計(jì)的含義
?計(jì)算機(jī)審計(jì)有3層含義:
一面向數(shù)據(jù)的審計(jì)
一面向現(xiàn)行信息系統(tǒng)的審計(jì)
一對(duì)信息系統(tǒng)生命周期的審計(jì)
面向數(shù)據(jù)的計(jì)算機(jī)審計(jì)流程
?審前調(diào)查:電子數(shù)據(jù)的組織、處理和存儲(chǔ)
?數(shù)據(jù)采集:審計(jì)接口、數(shù)據(jù)庫訪問技術(shù)、數(shù)據(jù)采集技術(shù)
?數(shù)據(jù)清理、轉(zhuǎn)換、驗(yàn)證、建立中間表
?數(shù)據(jù)分析?:數(shù)據(jù)分析技術(shù)、SQL、審計(jì)軟件
?審計(jì)取證
一、審前調(diào)查及電子數(shù)據(jù)的組織、處理和存儲(chǔ)
1.審前調(diào)查的內(nèi)容和方法
?對(duì)組織結(jié)構(gòu)調(diào)查
?對(duì)計(jì)算機(jī)信息系統(tǒng)的調(diào)查
?提出數(shù)據(jù)需求
2.電子數(shù)據(jù)的組織、處理和存儲(chǔ)
電子數(shù)據(jù)處理的特點(diǎn)
?存儲(chǔ)介質(zhì)改變
?基于一定的數(shù)據(jù)處理平臺(tái),有一定的數(shù)據(jù)模型
?數(shù)據(jù)表示編碼化(各種編碼)
?帶來系統(tǒng)控制和數(shù)據(jù)安全性的新問題
?審計(jì)線索改變
如何表示數(shù)據(jù)
?數(shù)據(jù)類型與數(shù)據(jù)取值
一數(shù)據(jù)類型決定了取值范圍與運(yùn)第范圍
?數(shù)據(jù)模型
一數(shù)據(jù)模型是對(duì)現(xiàn)實(shí)世界數(shù)據(jù)特征的抽象
-它提供模型化數(shù)據(jù)和信息的工具
數(shù)據(jù)模型的2個(gè)層次
?概念模型
一E-R模型的要素
?實(shí)體:客觀存在并可以相互區(qū)分的事物,用方框表示
?屬性:實(shí)體的特征或性質(zhì),用橢圓表示
?聯(lián)系:實(shí)體之間的聯(lián)系,用菱形表示
?數(shù)據(jù)模型
-關(guān)系模型
一層次模型
-網(wǎng)狀模型
數(shù)據(jù)模型的3個(gè)要素
?數(shù)據(jù)結(jié)構(gòu)
-描述模型的靜態(tài)特征
-是刻畫數(shù)據(jù)模型最重要的方面
?數(shù)據(jù)操作
-描述模型的動(dòng)態(tài)特性
?數(shù)據(jù)檢索
?數(shù)據(jù)更新(增加、刪除、修改)
?約束條件
-一組完整性規(guī)則的集合
?實(shí)體完整性
?引用(參照)完整性
?用戶定義的完整性
關(guān)系模型
?關(guān)系模型是目前最常用的一-種數(shù)據(jù)模型
?關(guān)系數(shù)據(jù)庫采用關(guān)系模型作為數(shù)據(jù)的組織方式
?關(guān)系模型建立在嚴(yán)格的關(guān)系代數(shù)基礎(chǔ)之上
?關(guān)系模型概念單「用關(guān)系表示實(shí)體以及實(shí)體之間的聯(lián)系
?關(guān)系數(shù)據(jù)庫的標(biāo)準(zhǔn)語言SQL是一種非過程化語言,使用方便
關(guān)系模型的數(shù)據(jù)結(jié)構(gòu)
?關(guān)系
-一張二維表,每一列都不可再分
-表中的行、列次序并不重要
?元組
-二維表中的每一行,相當(dāng)于一條記錄
?屬性
-二維表中的每一列,屬性有名稱與類型。
-屬性不可再分,不允許重復(fù)
?主犍
-由表中的屬性或?qū)傩越M組成,用于唯一確定一條記錄
?域
-屬性的取值范圍
?關(guān)系模式
-記錄結(jié)構(gòu)的描述,對(duì)應(yīng)關(guān)系表的表頭
關(guān)系模型的數(shù)據(jù)運(yùn)算
?傳統(tǒng)的集合運(yùn)算
-并(UNION)
-交(INTERSECTION)
-差(MINUS)
-笛卡兒積
?專門的關(guān)系運(yùn)算
-選擇(SELECTION)
-投影(PROJECT)
-連接(JOIN)
?連接的含義:相容屬性之間的關(guān)系
?連接的類型(內(nèi)連接、外連接、自然連接)
“數(shù)據(jù)文件”的含義
?“數(shù)據(jù)文件''泛指各種用來存儲(chǔ)數(shù)據(jù)的文件。
在數(shù)據(jù)庫技術(shù)誕生之前,它指的是存放數(shù)據(jù)的文件本身。
數(shù)據(jù)庫技術(shù)誕生后,數(shù)據(jù)由DBMS管理,數(shù)據(jù)文件是存放物理數(shù)據(jù)庫的載體。
?不同的DBMS存儲(chǔ)數(shù)據(jù)的方式是不同的。
FoxPro一一個(gè)邏輯上的表對(duì)應(yīng)一個(gè)“庫文件”(dbf)
-Access一所有的數(shù)據(jù)庫對(duì)象放在一個(gè)數(shù)據(jù)庫文件中C.mdb)
-IBMDB2一一張表的數(shù)據(jù)可能分別放在不同的數(shù)據(jù)文件中
?除了DBMS產(chǎn)生和維護(hù)的數(shù)據(jù)文件之外,還有很多應(yīng)用程序管理的數(shù)據(jù)文件,如各種臨時(shí)文
件、數(shù)據(jù)交換文件等。
關(guān)系模型的完整性約束條件
?實(shí)體完整性(EntityIntegrity)
—關(guān)鍵字屬性的組成部分不能為空值
?參照完整性(ReferentialIntegrity)
——參照表中的外關(guān)鍵字要么取空值,要么取被參照表中的某?主關(guān)鍵字的值
?用戶定義完整性(User-DefinedIntegrity)
—具體應(yīng)用環(huán)境的完整性約束,反映了某一具體應(yīng)月所涉及的數(shù)據(jù)應(yīng)滿足的語義要求
關(guān)系模型的特點(diǎn)
?關(guān)系模型的概念單一
-實(shí)體以及實(shí)體之間的聯(lián)系都用關(guān)系來表示。
-關(guān)系之間的聯(lián)系則是通過相容(來自同一個(gè)域)的屬性來表示。
?關(guān)系必須是規(guī)范化的關(guān)系
-最基本的要求是每一個(gè)分量是一個(gè)不可分的數(shù)據(jù)項(xiàng),亦即不允許表中還有表(滿足第一
范式,1NF)
?在關(guān)系模型中,用戶對(duì)數(shù)據(jù)的檢索操作不過是從原來的表中得到一張新的表
生命周期法的6個(gè)階段
?需求分析
?概念結(jié)構(gòu)設(shè)計(jì)
?邏輯結(jié)構(gòu)設(shè)計(jì)
?物理數(shù)據(jù)庫設(shè)計(jì)
?數(shù)據(jù)庫實(shí)施
?運(yùn)行維護(hù)
數(shù)據(jù)庫設(shè)計(jì)方法
(1)面向數(shù)據(jù)的方法,以信息需求為主,兼顧處理需求;
(2)面向過程的方法,以處理需求為主,兼顧信息需求
需求分析
需求分析的重點(diǎn)是獲得兩方面的需求:
(1)信息需求
定義未來信息系統(tǒng)使用的全部信息,了解各項(xiàng)數(shù)據(jù)間的本質(zhì)聯(lián)系,描述數(shù)據(jù)的內(nèi)容和結(jié)構(gòu)以
及它們之間的聯(lián)系等。
(2)處理需求
定義未來信息系統(tǒng)數(shù)據(jù)處理的功能及功能與數(shù)據(jù)之間的聯(lián)系。同時(shí)考慮性能、安全性和完整
性約束。
自頂向下的結(jié)構(gòu)化分析方法
?自頂向下的結(jié)構(gòu)化分析方法是需求分析階段的一種常用方法。它的核心思想是:自頂向下逐
層分解,直到每一項(xiàng)功能都可以被容易地實(shí)現(xiàn)為止。
?SA方法中要用到數(shù)據(jù)流程圖(DataFlowDiagram,DFD)來描述數(shù)據(jù)的處理過程。數(shù)據(jù)流圖
是從“數(shù)據(jù)”和“處理”兩方面來表達(dá)數(shù)據(jù)處理過程的一種國形化的表示方法。
數(shù)據(jù)字典
?數(shù)據(jù)字典是在系統(tǒng)設(shè)計(jì)過程中對(duì)各類基本要素進(jìn)行描述的集合。它是描述系統(tǒng)邏輯模型的重
要工具。數(shù)據(jù)字典的組戊部分:
數(shù)
據(jù)項(xiàng)
數(shù)據(jù)
結(jié)
數(shù)據(jù)
流
數(shù)據(jù)
存
處理
過
?其中數(shù)據(jù)項(xiàng)是數(shù)據(jù)的最小組成單位,若干個(gè)數(shù)據(jù)項(xiàng)可以組成一個(gè)數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)字典通過對(duì)
數(shù)據(jù)項(xiàng)和數(shù)據(jù)結(jié)構(gòu)的定義來描述數(shù)據(jù)流和數(shù)據(jù)存儲(chǔ)的內(nèi)容。
數(shù)據(jù)庫表結(jié)構(gòu)定義
概念結(jié)構(gòu)設(shè)計(jì)的策略
?自頂向下:首先定義全局概念結(jié)構(gòu)的框架,再做逐次細(xì)化。
?自底向上:首先定義每?局部應(yīng)用的概念結(jié)構(gòu),然后按■定的規(guī)則把它們集成起來,得到全
局概念結(jié)構(gòu)。
?由里向外:首先定義最重要的那些核心結(jié)構(gòu),再逐漸向外擴(kuò)充。
?混合策略:把自頂向下和自底向上結(jié)合起來的方法。它先自頂向下設(shè)計(jì)一個(gè)概念結(jié)構(gòu)的框架。
然后以它為骨架再自底網(wǎng)上設(shè)計(jì)局部概念結(jié)構(gòu),并把它們集成起來。
用E-R方法進(jìn)行概念結(jié)構(gòu)設(shè)計(jì)的簡要步驟
?設(shè)計(jì)局部E-R模型
?將局部E-R模型集成為全局E-R模型
-屬性沖突
一命名沖突
-結(jié)構(gòu)沖突
?對(duì)全局E-R模型進(jìn)行優(yōu)化
邏輯結(jié)構(gòu)設(shè)計(jì)的步驟
?形成初始關(guān)系數(shù)據(jù)庫模式
?關(guān)系模式規(guī)范化和優(yōu)化
?外模式設(shè)計(jì)
-提供了數(shù)據(jù)的邏輯獨(dú)立性
-能適應(yīng)用戶對(duì)系統(tǒng)的不同需求
-具有一定的安全保密作用
索引設(shè)計(jì)
聚簇設(shè)計(jì)
二、審計(jì)接口
什么是審計(jì)接口
是從被審計(jì)信息系統(tǒng)向?qū)徲?jì)應(yīng)用系統(tǒng)傳送審計(jì)信息的規(guī)范和程序。
接口包含兩方面內(nèi)容:
-傳送數(shù)據(jù)的格式和規(guī)范
-完成傳送作業(yè)的程序
數(shù)據(jù)傳遞的方式:
-系統(tǒng)內(nèi)部多采用參數(shù)或共享數(shù)據(jù)來完成
系統(tǒng)與系統(tǒng)之間傳遞信息需要開發(fā)專用的數(shù)據(jù)接口
審計(jì)接口的分類
-按接口的用途劃分,可以分為通用接口和專用接口;
-按接口與源系統(tǒng)和目標(biāo)系統(tǒng)的耦合程度劃分,可以分為強(qiáng)耦合接口、弱耦合接口和一般
耦合接口;
-按接口中數(shù)據(jù)傳輸?shù)念l率來劃分,可以分為實(shí)時(shí)接口與周期性接口。
審計(jì)接口的分層模型
接口可以分為3層
一邏輯層:表示信息含義的語言,對(duì)信息的含義進(jìn)行定義和描述;
一傳輸層:載運(yùn)信息語言的方式,選擇最合適的方式完成源系統(tǒng)到目標(biāo)系統(tǒng)的信息傳輸;
-控制層:控制信息交換過程的規(guī)程,保證信息傳輸?shù)倪m時(shí)性、正確性和有效性。
邏輯層
?又稱為接口標(biāo)準(zhǔn)
?描述接口標(biāo)準(zhǔn)的語法必須沒有二義性
傳輸層的實(shí)現(xiàn)形式
?被審計(jì)單位信息系統(tǒng)和審計(jì)系統(tǒng)之間采用數(shù)據(jù)庫連接件通過計(jì)算機(jī)網(wǎng)絡(luò)直接相連。
?被審計(jì)單位信息系統(tǒng)和審計(jì)應(yīng)用系統(tǒng)采用交換文件傳輸數(shù)據(jù)。
控制層一數(shù)據(jù)驗(yàn)證
?核對(duì)總記錄數(shù)、總金額
?檢查借貸是否平衡
?順序碼斷號(hào)、重號(hào)驗(yàn)證
?檢查勾稽關(guān)系
三、審計(jì)數(shù)據(jù)采集
ODBC驅(qū)動(dòng)程序
?基于文件的驅(qū)動(dòng)程序
-既處理ODBC調(diào)用也處理SQL語句
-依據(jù)其訪問數(shù)據(jù)的存取方式還可以分為兩種
?宜接存取數(shù)據(jù)
?采用客戶機(jī)/服務(wù)器模式
?基于DBMS的驅(qū)動(dòng)程序
-只處理ODBC調(diào)用
把SQL語句的處理交給數(shù)據(jù)庫引擎
-通過單獨(dú)的引擎訪問物理數(shù)據(jù)
-既可以和數(shù)據(jù)源存儲(chǔ)在同一個(gè)機(jī)器匕也可以分別存儲(chǔ)在網(wǎng)絡(luò)中的不同機(jī)器匕甚至可
以通過網(wǎng)關(guān)訪問。
ODBC數(shù)據(jù)源
?機(jī)器數(shù)據(jù)源
-存儲(chǔ)在由用戶定義名字的系統(tǒng)上
-可以分為用戶數(shù)據(jù)源和系統(tǒng)數(shù)據(jù)源
?文件數(shù)據(jù)源
-存儲(chǔ)于一個(gè)文件中
-允許連接信息由一個(gè)用戶重復(fù)使用或者由幾個(gè)用戶共享
-驅(qū)動(dòng)程序管理器用.dsn文件中的信息連接數(shù)據(jù)源
-這個(gè)文件可以像其他任何文件一樣操作
-一個(gè)文件數(shù)據(jù)源沒有數(shù)據(jù)源名,并且它不注冊(cè)到任何用戶或機(jī)器上
ODBC的使用
1.創(chuàng)建ODBC數(shù)據(jù)源
不同的駁動(dòng)程序提供的ODBC數(shù)據(jù)源配置界面不同
2.使用ODBC獲取數(shù)據(jù)
-在審計(jì)軟件中使用
-在DBMS中使用
-在Excel等軟件中使用
IDAPI
IDAPI是由Borland公司為首發(fā)布的一個(gè)異構(gòu)數(shù)據(jù)庫訪問接口。它是一個(gè)強(qiáng)大的數(shù)據(jù)庫引擎,
基于驅(qū)動(dòng)程序的體系結(jié)構(gòu)和面向?qū)ο蟮脑O(shè)計(jì)方法為各種數(shù)據(jù)庫的訪問提供了一致的接口,擴(kuò)
展和定制起來很容易。
UDA
Microsoft的UDA為關(guān)系型或非關(guān)系型數(shù)據(jù)訪問提供了一致的訪問接口。這個(gè)一致的接口使
得應(yīng)用程序能夠通過它來訪問各種各樣的數(shù)據(jù)。同時(shí),UDA的多層結(jié)構(gòu)和擴(kuò)展能力使得它具
有極強(qiáng)的生命力。
UDA的層次模型
UDA的兩層軟件接口
?OLEDB
-系統(tǒng)級(jí)的編程接口,定義了一組接口,封裝了各種數(shù)據(jù)系統(tǒng)的訪問操作;
-提供了一組標(biāo)準(zhǔn)的服務(wù)組件,用于提供查詢、緩存、數(shù)據(jù)更新、事務(wù)處理等操作;
-是新的底層接口,采用一種“通用的”數(shù)據(jù)訪問范例,能夠處理任何類型的數(shù)據(jù),不需考
慮格式和存儲(chǔ)方法。
?ADO
-應(yīng)用層的編程接口,以O(shè)LEDB為基礎(chǔ)并對(duì)其進(jìn)行了封裝;
-通過OLEDB提供的接口訪問數(shù)據(jù),適合于各種客戶機(jī)/服務(wù)器應(yīng)用系統(tǒng)和基于Web的應(yīng)
用:
-具有更好的靈活性,使用方便,效率更高。
用文本文件交換數(shù)據(jù)
?優(yōu)點(diǎn):
-靈活方便
-數(shù)據(jù)量大小基本不受限制
?缺點(diǎn);
-占用較大的存儲(chǔ)空間
-較多的傳輸時(shí)間
-需要進(jìn)行類型或字段名稱的重定義
?分類:
-分隔符形式
-固定寬度
?分隔符形式的文本文件
-以回車換行符號(hào)作為記錄間的分隔
-以分隔符作為字段之間的分隔
一第一行可以表示字段名
-可以有文本識(shí)別符號(hào)
?固定寬度的文本文件
-以回車換行符號(hào)作為記錄間的分隔
-以起始位置和寬度來標(biāo)識(shí)字段
-第一行一般不表示字段名
-一般沒有文本識(shí)別符號(hào)
Excel電子表格
采集電子表格中的數(shù)據(jù)
在訪問Excel電子表格中的數(shù)據(jù)時(shí),要特別注意這樣兩個(gè)問題:
-關(guān)系數(shù)據(jù)庫的規(guī)范化問題。應(yīng)該保證每一列只有一個(gè)標(biāo)題,且這個(gè)標(biāo)題是最高層次的標(biāo)
題。
-數(shù)據(jù)類型的一致性問題.Excel工作表中每一個(gè)單元格都可以有不同的數(shù)據(jù)類型,因此每
一列中的數(shù)據(jù)類型可能會(huì)不一致。而關(guān)系數(shù)據(jù)庫要求表中每個(gè)字段的類型是固定的。如
果出現(xiàn)這種情況,需要首先統(tǒng)一Excel工作表中每一列的數(shù)據(jù)類型。否則將不能訪問數(shù)據(jù)。
數(shù)據(jù)采集的工具
?審計(jì)軟件
?DBMS及數(shù)據(jù)倉庫工具
—DBMS,如Access、FoxPro等
-數(shù)據(jù)庫實(shí)用工具,如數(shù)據(jù)庫附加
一數(shù)據(jù)(倉)庫導(dǎo)入/導(dǎo)出工具,如MSDTS等
?一些通用的數(shù)據(jù)分析工具
-基于表格的分析工具EXCEL
?數(shù)據(jù)庫編程工具
-PowerBuilder等
-數(shù)據(jù)庫訪問對(duì)象、方法,如ADO等
數(shù)據(jù)采集的策略
?直接拷貝
-審計(jì)人員具有一定的經(jīng)驗(yàn)
-被審計(jì)系統(tǒng)相對(duì)簡單
一分析工具能夠支持
?使用專門的審計(jì)(數(shù)據(jù))接口
-被審計(jì)單位的信息系統(tǒng)已有專門的數(shù)據(jù)接口
-這個(gè)接口能夠滿足審計(jì)的要求
?實(shí)現(xiàn)臨時(shí)的審計(jì)接口
-被審計(jì)單位的信息系統(tǒng)沒有實(shí)現(xiàn)數(shù)據(jù)接口
-實(shí)現(xiàn)了的數(shù)據(jù)接口不能滿足審計(jì)要求
臨時(shí)審計(jì)接口的兩種實(shí)現(xiàn)方式
?交換文件(文件傳輸)
-被審計(jì)信息系統(tǒng)按照審”?要求,將原木不符合審訂軟件要求的數(shù)據(jù)轉(zhuǎn)換成與審計(jì)軟件要
求相一致的格式提供給審計(jì)人員
?數(shù)據(jù)庫連接
-審計(jì)人員通過ODBC等數(shù)據(jù)庫訪問接口直接訪問被審計(jì)信息系統(tǒng)的數(shù)據(jù),并把數(shù)據(jù)轉(zhuǎn)換
成審計(jì)所需的格式。
數(shù)據(jù)采集的實(shí)現(xiàn)
?使用移動(dòng)存儲(chǔ)介質(zhì)拷貝數(shù)據(jù)文件;
?通過簡單設(shè)備建立審計(jì)人員的計(jì)算機(jī)與被審計(jì)單位的計(jì)算機(jī)之間的連接;
?將審計(jì)人員的計(jì)算機(jī)接入被審計(jì)單位的局域網(wǎng)絡(luò)中;
?通過廣域網(wǎng)絡(luò)遠(yuǎn)程采集數(shù)據(jù)。
四、數(shù)據(jù)清理與轉(zhuǎn)換技術(shù)
數(shù)據(jù)偵量的評(píng)價(jià)指標(biāo)
?準(zhǔn)確性:數(shù)據(jù)值與實(shí)際值的一致程度。
?完整性:需要值的屬性中無值缺失的程度。
?一致性:數(shù)據(jù)對(duì)一組約束的滿足程度。
?唯一性:數(shù)據(jù)記錄(及碼值)的唯一性。
?適時(shí)性:在所要求的或指定的時(shí)間提供一個(gè)或多個(gè)數(shù)據(jù)項(xiàng)的程度。
?有效性:維護(hù)的數(shù)據(jù)足夠嚴(yán)格以滿足分類準(zhǔn)則的接受要求。
為什么要進(jìn)行數(shù)據(jù)清理
?值缺失限制了審計(jì)人員的數(shù)據(jù)分析工作;
?數(shù)據(jù)表中的空值直接影響了數(shù)據(jù)分析結(jié)果的準(zhǔn)確性;
?大量的冗余數(shù)據(jù)降低了數(shù)據(jù)分析的效率;
?數(shù)據(jù)值域定義的不完整性給數(shù)據(jù)審計(jì)工作帶來障礙。
數(shù)據(jù)清理的主要工作
?確認(rèn)輸入數(shù)據(jù)
?消除錯(cuò)誤的空值(NULL)
?保證數(shù)據(jù)值落入定義域
?消除冗余數(shù)據(jù)
?解決數(shù)據(jù)中的沖突(不一致)
數(shù)據(jù)清理的基本技術(shù)
?解決不完整數(shù)據(jù)(即值缺失)的方法:
?錯(cuò)誤值的檢測(cè)及解決方法:用統(tǒng)計(jì)分析的方法識(shí)別可能的錯(cuò)誤值或異常值,如偏差分析、識(shí)
別不遵守分布或回歸方程的值:使用簡單規(guī)則庫(常識(shí)性規(guī)則、'業(yè)務(wù)特定規(guī)則等)檢查數(shù)據(jù)
值;使用不同屬性間的約束;使用外部數(shù)據(jù)飛
-不一致性的檢測(cè)及解決方法:定義完整性約束用于檢測(cè)不一致性:通過分析數(shù)據(jù)發(fā)現(xiàn)聯(lián)系。
值缺失的解決方法
空值的處理
?在SQLServer的查詢分析器(SQLQueryAnalyzer)中執(zhí)行下列SQL語句用“0”替換某些字
段的空值:
-UPDATE清理數(shù)據(jù)表SETzj=0WHEREzjISNULL
-UPDATE清理數(shù)據(jù)表SETkl=0WHEREklISNULL
-UPDATE清理數(shù)據(jù)表SETmj=0WHEREmjISNULL
消除冗余數(shù)據(jù)
?清理憑證數(shù)據(jù)表中科目代碼以“s”開頭的現(xiàn)金流量輔助信息冗余記錄:
-DELETEFROM清理數(shù)據(jù)表WHEREkmdhLIKE's%'
錯(cuò)誤數(shù)據(jù)的處理辦法
?審計(jì)人員采集數(shù)據(jù)后,在下圖所示的固定資產(chǎn)表中發(fā)現(xiàn)資產(chǎn)原值字段存在負(fù)值的情況,這與
會(huì)計(jì)處理的常規(guī)不符。
錯(cuò)誤數(shù)據(jù)的處理辦法
?在確認(rèn)負(fù)的資產(chǎn)原值是錯(cuò)誤數(shù)據(jù)后,審計(jì)人員可以在SQLServer的查詢分析器中執(zhí)行SQL
語句:
-UPDATE固定資產(chǎn)表SET資產(chǎn)原值=人85(資產(chǎn)原值)WHERE資產(chǎn)原值<0
-改正資產(chǎn)原值的錯(cuò)誤取值。
為什么要進(jìn)行數(shù)據(jù)轉(zhuǎn)換
?被審計(jì)單位信息系統(tǒng)的多樣性帶來了數(shù)據(jù)的不一致性:
?被審計(jì)系統(tǒng)的安全性措施給審計(jì)工作帶來障礙;
?審計(jì)目的的不同決定了審計(jì)數(shù)據(jù)的范圍和要求不同;
?數(shù)據(jù)轉(zhuǎn)換是數(shù)據(jù)分析、處理的前提。
數(shù)據(jù)不一致性的表現(xiàn)
?同?字段在不同的應(yīng)用中具有不同的數(shù)據(jù)類型
?同一字段在不同的應(yīng)用中具有不同的名稱
?同名字段,不同含義
?同一信息,在不同的應(yīng)用中有不同的格式
?同一信息,在不同的應(yīng)用中有不同的表達(dá)方式
數(shù)據(jù)轉(zhuǎn)換的內(nèi)容和任務(wù)
1、將被審計(jì)單位的數(shù)據(jù)有效地裝載到審計(jì)軟件所操縱的數(shù)據(jù)庫中:
2、明確地標(biāo)識(shí)出每張表、每個(gè)字段的含義及相互之間的關(guān)系。
數(shù)據(jù)轉(zhuǎn)換的基本類型
1.簡單變換
(1)數(shù)據(jù)類型轉(zhuǎn)換
(2)日期/時(shí)間格式的轉(zhuǎn)換
(3)代碼轉(zhuǎn)換
(4)值域轉(zhuǎn)換
2.清潔和刷洗
(1)有效值檢查
(2)復(fù)雜的重新格式化
簡單變換
?它是數(shù)據(jù)轉(zhuǎn)換中最簡單的形式
?它是所有數(shù)據(jù)轉(zhuǎn)換的基本構(gòu)成單元
?它一次改變一個(gè)字段的屬性
?它不考慮該屬性的背景或與它相關(guān)的其他字段的信息
簡單變換一數(shù)據(jù)類型轉(zhuǎn)換
?最常見的簡單變換是轉(zhuǎn)換一個(gè)數(shù)據(jù)元的類型。它是將一種類型的數(shù)據(jù)轉(zhuǎn)換成另一種類型的數(shù)
據(jù)。
?數(shù)據(jù)轉(zhuǎn)換的前提是類型相容。類型相容指的是一種類型數(shù)據(jù)的值域可以通過常用的轉(zhuǎn)換函數(shù)
映射到另一種類型的值域上。
?這種映射不會(huì)丟失數(shù)據(jù)的精確度。
簡單變換一日期時(shí)間格式轉(zhuǎn)換
簡單變換一代碼轉(zhuǎn)換
簡單變換一一值域轉(zhuǎn)換
?代碼轉(zhuǎn)換可以看成是一類特殊的值域轉(zhuǎn)換。
清潔和刷洗
?清潔和刷洗指的是比簡單變換更更雜的一種數(shù)據(jù)變換。
?在這種變換中,要檢查的是字段或字段組的實(shí)際內(nèi)容而不僅是存儲(chǔ)格式。
?一種清潔和刷洗是檢查數(shù)據(jù)字段中的有效值。這可以通過范圍檢驗(yàn)、枚舉清單和相關(guān)校驗(yàn)來
完成。
數(shù)據(jù)轉(zhuǎn)換的一般方法
?專用工具
?SQL語言
?程序編碼
必須運(yùn)用程序編碼的場(chǎng)合
?對(duì)非關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行轉(zhuǎn)換
?對(duì)復(fù)雜的數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)行轉(zhuǎn)換
?數(shù)據(jù)轉(zhuǎn)換的要求固定而使用頻繁時(shí)
五、審計(jì)數(shù)據(jù)驗(yàn)證
不同階段的數(shù)據(jù)驗(yàn)證
?數(shù)據(jù)采集階段
-檢查被審計(jì)單位提供資料的完整性,保證數(shù)據(jù)采集工作準(zhǔn)確有效地進(jìn)行,同時(shí)對(duì)采集到
的數(shù)據(jù)進(jìn)行確認(rèn),排除遺漏和失誤。
?數(shù)據(jù)清理階段
-確認(rèn)數(shù)據(jù)清理工作沒有損害數(shù)據(jù)整體的完整性和正確性。
?數(shù)據(jù)轉(zhuǎn)換階段
數(shù)據(jù)轉(zhuǎn)換中,審計(jì)人員會(huì)將原始電子數(shù)據(jù)中表名、字段名、記錄值代碼以及表表關(guān)聯(lián)的
經(jīng)濟(jì)含義明確標(biāo)識(shí)出來,這需要進(jìn)行大量的查詢、替換修改、插入數(shù)據(jù)、更新數(shù)據(jù)、刪
除數(shù)據(jù)等操作,每一步轉(zhuǎn)換工作都有可能影響到數(shù)據(jù)的完整性和正確性,所以在這一階
段進(jìn)行數(shù)據(jù)驗(yàn)證確有必要。
數(shù)據(jù)驗(yàn)證的技術(shù)和方法
?數(shù)據(jù)采集階段
一核對(duì)總記錄數(shù)、總金額,檢查借貸是否平衡,順序碼斷號(hào)、重號(hào)驗(yàn)證等。
?數(shù)據(jù)清理階段
一核對(duì)總金額、保持借貸平衡等。
?數(shù)據(jù)轉(zhuǎn)換階段
一核對(duì)總金額、勾稽關(guān)系,數(shù)據(jù)結(jié)構(gòu)確認(rèn)等。
六、審計(jì)數(shù)據(jù)分析
審計(jì)數(shù)據(jù)分析的具體操作
?核對(duì):
?檢查:
?復(fù)算:
?判斷:
分析模型的演變
?隨著用戶對(duì)數(shù)據(jù)分析的深度和靈活程度要求越來越高,數(shù)據(jù)分析漸漸從靜態(tài)數(shù)值的相互比較
轉(zhuǎn)變到從多個(gè)數(shù)據(jù)源中綜合數(shù)據(jù),從多個(gè)角度觀察數(shù)據(jù)的復(fù)雜、動(dòng)態(tài)的分析。
?根據(jù)處理數(shù)據(jù)的范圍、用戶一分析人員的交互需要、多維分析需求及現(xiàn)有工具的支持等因素,
可以將數(shù)據(jù)分析分為4種模型,這4種數(shù)據(jù)分析模型一種比一種深入,從描述基本事實(shí)到尋找
原因,從代入變量值進(jìn)行預(yù)測(cè)到尋找關(guān)鍵變量。
四種數(shù)據(jù)分析模型
?絕對(duì)模型
?解釋模型
?思考模型
?公式模型
絕對(duì)模型(CategoricalModel)
?它屬于靜態(tài)數(shù)據(jù)分析
?它通過比較歷史數(shù)據(jù)值或行為來描述過去發(fā)生的事實(shí)
?瓷詢比較簡單,僅是值的比較
?綜合路徑是原有數(shù)據(jù)庫設(shè)計(jì)時(shí)定義好的,用戶交互少
?支持工具廣泛(包括一般的查詢表格工具)。
解釋模型(ExegeiicalModel)
?主要還是靜態(tài)數(shù)據(jù)分析
?用戶一分析人員利用系統(tǒng)已有的多層次的綜合路徑層層細(xì)化,找出事實(shí)發(fā)生的原因
?如果分析人員感興趣的數(shù)據(jù)不能通過已有路徑進(jìn)行綜合,則需要臨時(shí)建立多維視圖。
思考模型(ContemplativeModel)
?它屬于動(dòng)態(tài)數(shù)據(jù)分析
?它旨在說明在一維或多維上引入?組具體變量或參數(shù)后會(huì)發(fā)生什么
?需要較高層次的數(shù)據(jù)分析人員介入
?分析人員在引入確定的變量或公式關(guān)系時(shí),須創(chuàng)建大量的綜合路徑
?這類模型的支持工具相當(dāng)少,大多只提供單一維上的數(shù)據(jù)子集處理。
公式模型(FormulaicModel)
公式模型是動(dòng)態(tài)性最高的一類模型,用于表示在多個(gè)堆上,需要引入哪些變量或參數(shù),以
及引入后所產(chǎn)生的結(jié)果。
3種類型的數(shù)據(jù)分析方法與工具
-查詢型分析
-驗(yàn)證型分析
-發(fā)掘型分析
查詢型分析(Query)
?主要指用戶對(duì)數(shù)據(jù)庫中的記錄進(jìn)行訪問查詢;
?關(guān)系數(shù)據(jù)庫管理系統(tǒng)是H前數(shù)據(jù)庫管理系統(tǒng)的主流,查詢型分析主要的對(duì)象就是關(guān)系數(shù)據(jù)庫
中的二維表.
?要進(jìn)行查詢型分析,必須先對(duì)目標(biāo)系統(tǒng)的數(shù)據(jù)模型有所了解。
?可以采用SQL等語言來交互描述查詢要求;
?采用SQL可以十分靈活地進(jìn)行交互式查詢,但要求用戶掌握SQL語言,并對(duì)訪問的數(shù)據(jù)庫的
結(jié)構(gòu)有所了解:
查詢型分析中的數(shù)據(jù)建模
?根據(jù)相關(guān)法律法規(guī)建立模型
?根據(jù)系統(tǒng)數(shù)據(jù)之間的勾稽關(guān)系建立模型
?根據(jù)不同系統(tǒng)數(shù)據(jù)之間的關(guān)系建立模型
?根據(jù)審計(jì)業(yè)務(wù)流程建立模型
?根據(jù)以往審計(jì)經(jīng)驗(yàn)建立模型
?根據(jù)自然規(guī)律建立模型
根據(jù)相關(guān)分析指標(biāo)建立模型
驗(yàn)證型分析(Verification)
驗(yàn)證型分析指用戶先提出自己的假設(shè),然后利用各種I:具通過反復(fù)的、遞歸的檢索查詢以驗(yàn)
證或否定自己的假設(shè)。
從用戶的觀點(diǎn)來看,他們是在從數(shù)據(jù)中發(fā)現(xiàn)事實(shí)。
多維分析工具進(jìn)行的就是典型的驗(yàn)證型分析。它通過對(duì)信息的多種可能的觀察角度進(jìn)行快
速,一致和交互性的存取,從而能夠?qū)?shù)據(jù)進(jìn)行深入地分析和觀察。
發(fā)掘型分析(Discovery)
發(fā)掘型分析是指用戶從大量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)模式,預(yù)測(cè)趨勢(shì)和行為的一種數(shù)據(jù)分析方法。
發(fā)掘型數(shù)據(jù)分析工具主要指數(shù)據(jù)挖掘(DataMining)軟件工具。
發(fā)掘型分析能挖掘數(shù)據(jù)間潛在的模式,發(fā)現(xiàn)用戶可能忽略的信息,并為審計(jì)業(yè)務(wù)人員做出前
瞻性的、基于知識(shí)的決策做出貢獻(xiàn)。
三種分析方法的特點(diǎn)比較
?查詢型分析基本上是在已知數(shù)據(jù)結(jié)構(gòu)的情況下對(duì)細(xì)節(jié)信息的存取,數(shù)據(jù)分析的成分很少
?驗(yàn)證型分析處于較淺的層次
?發(fā)掘型分析是較深層次的數(shù)據(jù)分析。
三種分析方法涉及的分析模型
?查詢型分析基本上不涉及數(shù)據(jù)分析模型;
?驗(yàn)證型分析主要實(shí)現(xiàn)了絕對(duì)模型、解釋模型和思考模型;
?發(fā)掘型分析則實(shí)現(xiàn)了公式模型。
操作型處理和分析型處理
?近年來,人們逐漸認(rèn)識(shí)到計(jì)算機(jī)系統(tǒng)中存在著兩類不同的處埋:操作型處理和分析型處埋。
?操作型處理也叫事務(wù)處理,是指對(duì)數(shù)據(jù)庫聯(lián)機(jī)地進(jìn)行日常操作,通常是對(duì)一個(gè)或一組記錄的
查詢和修改,主要是為特定的應(yīng)用服務(wù)。人們關(guān)心的是響應(yīng)時(shí)間、數(shù)據(jù)的安全性和完整性。
分析型需求的產(chǎn)生要求數(shù)據(jù)倉庫技術(shù)作為支撐
?OLTP系統(tǒng)的長期運(yùn)行會(huì)積累大量的原始數(shù)據(jù),有效對(duì)這些原始數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)數(shù)據(jù)中
蘊(yùn)涵的模式和規(guī)律,幫助人們判斷和決策,是一種有別于聯(lián)機(jī)事務(wù)處理的數(shù)據(jù)處理需求,可
以稱之為分析型數(shù)據(jù)處理,或稱為面向決策支持系統(tǒng)(DecisionSupportSyslem,DSS)的數(shù)
據(jù)處理,它用于管理人員的決策分析。
?分析型數(shù)據(jù)處理僅靠傳統(tǒng)的數(shù)據(jù)庫技術(shù)是不夠的,需要有新的數(shù)據(jù)處理技術(shù),數(shù)據(jù)倉庫技術(shù)
就是為解決這一要求應(yīng)運(yùn)而生的。
分析型數(shù)據(jù)處理的技術(shù)
數(shù)據(jù)倉庫技術(shù)包括:
一數(shù)據(jù)倉庫(DataWarehouse)
一聯(lián)機(jī)分析處理(OnlineAnalyticalProcessing,OLAP)
一數(shù)據(jù)挖掘(DataMining)
什么是數(shù)據(jù)倉庫
數(shù)據(jù)倉庫的創(chuàng)始人Inmon對(duì)數(shù)據(jù)倉庫的定義是:
數(shù)據(jù)倉庫就是面向主題的、集成的、穩(wěn)定的、不同時(shí)間的數(shù)據(jù)集合,用以支持經(jīng)營管理中的
決策制定過程。
數(shù)據(jù)倉庫的特征
與聯(lián)機(jī)事務(wù)處理領(lǐng)域的數(shù)據(jù)庫技術(shù)相比,數(shù)據(jù)倉庫具有以下特征:
一數(shù)據(jù)倉庫的數(shù)據(jù)是面向主題的
一數(shù)據(jù)倉庫的數(shù)據(jù)是集成的
一數(shù)據(jù)倉庫的數(shù)據(jù)是穩(wěn)定(不可更新)的
-數(shù)據(jù)倉庫的數(shù)據(jù)是隨時(shí)間變化的
數(shù)據(jù)倉庫的體系結(jié)構(gòu)
數(shù)據(jù)倉庫系統(tǒng)的八個(gè)組成部分
?數(shù)據(jù)源
?數(shù)據(jù)抽取、轉(zhuǎn)換、裝載和刷新工具
?數(shù)據(jù)建模工具
?監(jiān)控和管理工具
?元數(shù)據(jù)倉儲(chǔ)
?數(shù)據(jù)倉庫和數(shù)據(jù)集市的目標(biāo)數(shù)據(jù)庫
?OLAP服務(wù)器
?前端數(shù)據(jù)訪問和分析工具
數(shù)據(jù)倉庫系統(tǒng)的一般應(yīng)用過程
?從業(yè)務(wù)處理信息系統(tǒng)等外部數(shù)據(jù)源獲取數(shù)據(jù),經(jīng)加工整理后進(jìn)入數(shù)據(jù)倉庫
?根據(jù)數(shù)據(jù)分析挖掘的需求特性對(duì)數(shù)據(jù)進(jìn)行建模和組織,用戶利用各種前端數(shù)據(jù)分析和挖掘工
具,通過OLAP服務(wù)器,對(duì)數(shù)據(jù)倉庫中的數(shù)據(jù)作各種查詢、分析、挖掘匚作
數(shù)據(jù)倉庫技術(shù)在數(shù)據(jù)審計(jì)中的應(yīng)用
?審計(jì)數(shù)據(jù)的采集和獲取
?審計(jì)數(shù)據(jù)在審計(jì)數(shù)據(jù)庫中的組織和存儲(chǔ)
?審計(jì)數(shù)據(jù)的訪問和分析
什么是聯(lián)機(jī)分析處理(OLAP)
?OLAP是一類軟件技術(shù),它使用戶能夠從多種角度(維)對(duì)原始數(shù)據(jù)進(jìn)行分析;通過快速、
一致、交互地存取來獲得對(duì)原始數(shù)據(jù)的深入「解。
?OLAP的目標(biāo)是滿足決策支持或多維查詢和報(bào)表的需求,它的技術(shù)核心是“維”這個(gè)概念,因
此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。
?OLTP強(qiáng)調(diào)的是更新數(shù)據(jù)庫——向數(shù)據(jù)庫中添
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 財(cái)務(wù)預(yù)算執(zhí)行與調(diào)整制度
- 濟(jì)南薪酬設(shè)計(jì)培訓(xùn)課件
- 活動(dòng)策劃方案培訓(xùn)
- 2024-2025學(xué)年遼寧省撫順市六校協(xié)作體高二下學(xué)期期中聯(lián)考?xì)v史試題(解析版)
- 2026年金融投資知識(shí)與實(shí)踐能力考試題庫
- 2026年新能源項(xiàng)目風(fēng)險(xiǎn)管理與監(jiān)控策略題
- 2026年金融產(chǎn)品經(jīng)理專業(yè)知識(shí)測(cè)試題目
- 2026年網(wǎng)絡(luò)安全專家級(jí)考試題集與答案詳解
- 2026年商業(yè)分析課程綜合練習(xí)題庫
- 2026年中級(jí)汽車駕駛訓(xùn)練考試題庫公路行車及停車控制技術(shù)要點(diǎn)
- 船舶設(shè)計(jì)合同(標(biāo)準(zhǔn)版)
- 高壓氧艙拆除施工方案
- 產(chǎn)品創(chuàng)新及創(chuàng)意設(shè)計(jì)評(píng)估工作坊方案
- GB/T 42918.3-2025塑料模塑和擠出用熱塑性聚氨酯第3部分:用于區(qū)分聚醚型聚氨酯和聚酯型聚氨酯的測(cè)定方法
- 消防報(bào)警設(shè)備清單及技術(shù)參數(shù)
- 起重機(jī)日常檢查與自檢報(bào)告模板
- 家庭防滑改市場(chǎng)拓展,2025年渠道建設(shè)報(bào)告
- 電梯安全文檔(模板范本)
- 建筑施工現(xiàn)場(chǎng)交通組織方案
- QC/T 262-2025汽車滲碳齒輪金相檢驗(yàn)
- 2025年湖北省武漢市中考物理試卷(含答案)
評(píng)論
0/150
提交評(píng)論