大數(shù)據(jù)審計分析 課件全套 周冬華 第1-9章 大數(shù)據(jù)審計分析概述- 員工舞弊識別-機(jī)器學(xué)習(xí)_第1頁
大數(shù)據(jù)審計分析 課件全套 周冬華 第1-9章 大數(shù)據(jù)審計分析概述- 員工舞弊識別-機(jī)器學(xué)習(xí)_第2頁
大數(shù)據(jù)審計分析 課件全套 周冬華 第1-9章 大數(shù)據(jù)審計分析概述- 員工舞弊識別-機(jī)器學(xué)習(xí)_第3頁
大數(shù)據(jù)審計分析 課件全套 周冬華 第1-9章 大數(shù)據(jù)審計分析概述- 員工舞弊識別-機(jī)器學(xué)習(xí)_第4頁
大數(shù)據(jù)審計分析 課件全套 周冬華 第1-9章 大數(shù)據(jù)審計分析概述- 員工舞弊識別-機(jī)器學(xué)習(xí)_第5頁
已閱讀5頁,還剩253頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一章

大數(shù)據(jù)審計分析概述目錄第一節(jié)

大數(shù)據(jù)審計分析相關(guān)概念第二節(jié)

大數(shù)據(jù)審計分析基本理論CONTENT第一節(jié)大數(shù)據(jù)審計分析的概念與內(nèi)容大數(shù)據(jù)審計分析概念大數(shù)據(jù)大數(shù)據(jù)是指無法在一定時間內(nèi)用常規(guī)計算機(jī)工具進(jìn)行抓取、管理和處理的數(shù)據(jù)集合,而是需要在新模式下才具有更強(qiáng)決策能力、洞察能力、優(yōu)化能力的海量、多樣、高增長的信息資產(chǎn)。大數(shù)據(jù)具有5V性質(zhì),即大規(guī)模(Volume)、高速增長(Velocity)、多樣化(Variety)、低價值密度(Value)、真實(shí)性(Veracity)。審計分析審計分析是指通過對被審計對象相關(guān)資料的數(shù)據(jù)指標(biāo)進(jìn)行邏輯推理、因素分解和綜合判斷,以揭示資料的內(nèi)在本質(zhì)并了解其構(gòu)成要素相互關(guān)系的審計方法。常見的審計分析方法包括比較分析、比率分析、賬戶分析、賬齡分析、平衡分析、因素分析等。大數(shù)據(jù)審計分析大數(shù)據(jù)審計分析是指在審計理論的指導(dǎo)下,將大數(shù)據(jù)思維融入到審計分析中,使用大數(shù)據(jù)技術(shù)對被審計對象數(shù)據(jù)資料進(jìn)行收集、清洗、整合,形成符合要求的審計數(shù)據(jù),并構(gòu)建分析模型對審計數(shù)據(jù)進(jìn)行挖掘,得到相應(yīng)數(shù)據(jù)分析結(jié)果,以幫助審計人員了科學(xué)、準(zhǔn)確做出審計判斷的審計過程。大數(shù)據(jù)審計分析相關(guān)概念審計信息化:是指將信息技術(shù)手段應(yīng)用于審計工作,全面改造審計業(yè)務(wù)流程、建立并完善審計工作方式、提高審計效率,最終取得良好審計質(zhì)量的審計能力提升過程。信息系統(tǒng)審計:是指通過收集和評價相關(guān)審計證據(jù),以確定現(xiàn)有信息系統(tǒng)與相關(guān)資源能否有效地保護(hù)資產(chǎn)、維護(hù)數(shù)據(jù)完整、提供相關(guān)和可靠的信息,從而保證組織資源高效利用、組織目標(biāo)順利實(shí)現(xiàn)等方面做出合理判斷的審計過程。電子數(shù)據(jù)審計:是指利用計算機(jī)技術(shù),對被審計單位的電子數(shù)據(jù)進(jìn)行收集、整理和分析,從而發(fā)現(xiàn)審計線索、獲得審計證據(jù)、得出審計結(jié)論的審計過程。大數(shù)據(jù)審計:是指審計機(jī)構(gòu)遵循大數(shù)據(jù)思維,采用大數(shù)據(jù)技術(shù),利用數(shù)量巨大、來源廣泛、格式多樣的結(jié)構(gòu)或非結(jié)構(gòu)化數(shù)據(jù),對被審計對象開展全方位、多層次、立體化的審計工作。大數(shù)據(jù)審計分析相關(guān)概念審計信息化信息系統(tǒng)審計電子數(shù)據(jù)審計大數(shù)據(jù)大數(shù)據(jù)審計審計分析大數(shù)據(jù)審計分析圖1-1

各概念之間的邏輯關(guān)系大數(shù)據(jù)審計分析主要內(nèi)容大數(shù)據(jù)審計分析是一種全新的審計工作方法,其內(nèi)容貫穿數(shù)據(jù)獲取——程序?qū)嵤C據(jù)分析,具體包括獲取海量化的審計數(shù)據(jù)、實(shí)施自動化的審計程序、進(jìn)行智能化的審計分析。其中海量化的審計數(shù)據(jù)保證了審計證據(jù)具有充分性,自動化的審計程序確保審計流程高效無誤的得到執(zhí)行,智能化的審計分析可以使審計證據(jù)具有恰當(dāng)性,并最終幫助審計人員得出高質(zhì)量的審計結(jié)論。大數(shù)據(jù)審計分析的主要內(nèi)容如圖1-2所示。大數(shù)據(jù)審計分析基本步驟大數(shù)據(jù)審計緊緊圍繞“總體分析、系統(tǒng)研究、發(fā)現(xiàn)疑點(diǎn)、分散核實(shí)、精確定位”的思路展開。具體步驟包括:2、數(shù)據(jù)預(yù)處理4、分散核實(shí)5、審計分析結(jié)論1、數(shù)據(jù)采集 3、總體分析大數(shù)據(jù)審計分析基本類型1、查詢型大數(shù)據(jù)審計分析是指審計人員通過多種方式完成海量審計數(shù)據(jù)的查詢分析工作。常見的查詢型分析場景包括利用SQL語言訪問會計信息系統(tǒng)后臺數(shù)據(jù)庫,并對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行篩選、查找、排序、計算等操作性分析。2、驗(yàn)證型大數(shù)據(jù)審計分析是指審計人員先提出自己的假設(shè),然后利用統(tǒng)計方法從海量審計數(shù)據(jù)中發(fā)現(xiàn)被審計對象“已經(jīng)發(fā)生了什么”或“正在發(fā)生什么”,從而驗(yàn)證或者否定自己的假設(shè)。常見的驗(yàn)證型大數(shù)據(jù)審計分析包括關(guān)鍵指標(biāo)分析、結(jié)構(gòu)分析、趨勢分析、統(tǒng)計分析等。3、挖掘型大數(shù)據(jù)審計分析是指將審計分析作為挖掘過程,利用數(shù)據(jù)挖掘技術(shù)對海量審計數(shù)據(jù)進(jìn)行深度挖掘,并從中凝練審計重點(diǎn)、異常點(diǎn)及數(shù)據(jù)運(yùn)行規(guī)律。常見的挖掘型大數(shù)據(jù)審計分析包括分類、回歸、聚類、異常值檢測等。4、預(yù)測型大數(shù)據(jù)審計分析是指審計人員通過對數(shù)據(jù)進(jìn)行量化建模與參數(shù)優(yōu)化,在一定條件下對數(shù)據(jù)發(fā)展變化趨勢做出科學(xué)合理的判斷,從而預(yù)測被審計對象“未來會發(fā)生什么”。常見的預(yù)測型大數(shù)據(jù)審計分析包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等。5、評價型大數(shù)據(jù)審計分析是指審計人員利用大數(shù)據(jù)分析技術(shù),在監(jiān)督和審查被審計對象的行為是否符合審計規(guī)范、審計倫理的情況外,進(jìn)一步評價被審計對象的行為后果產(chǎn)生了什么樣的效應(yīng),以及這些效應(yīng)的優(yōu)劣等級。也即在進(jìn)行評價型審計分析時,既要保證被審計對象的行為是合法合規(guī)的,也要對被審計對象的行為后果進(jìn)行評價。大數(shù)據(jù)審計分析與傳統(tǒng)審計分析的區(qū)別區(qū)別大數(shù)據(jù)審計分析傳統(tǒng)審計分析數(shù)據(jù)來源被審計單位的內(nèi)部數(shù)據(jù)+被審計單位的外部數(shù)據(jù)主要是被審計單位的內(nèi)部數(shù)據(jù)數(shù)據(jù)類型結(jié)構(gòu)化數(shù)據(jù)+非結(jié)構(gòu)化數(shù)據(jù)+半結(jié)構(gòu)化數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)為主數(shù)據(jù)采集傳統(tǒng)的采集方式+遠(yuǎn)程聯(lián)網(wǎng)、數(shù)據(jù)接口、網(wǎng)絡(luò)爬蟲等方式直接復(fù)制/通過中間文件采集/專用的采集工具數(shù)據(jù)儲存分布式存儲,存儲在云服務(wù)器存儲在個人電腦或本地服務(wù)器數(shù)據(jù)處理結(jié)構(gòu)化數(shù)據(jù),還對半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理只是對結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理數(shù)據(jù)分析多數(shù)據(jù)源綜合分析技術(shù)/智能分析技術(shù)/可視化分析技術(shù)等以賬表分析、數(shù)據(jù)查詢?yōu)橹鳎饕浅R?guī)統(tǒng)計分析審計范圍財務(wù)審計+多種類型的業(yè)務(wù)審計,一般關(guān)注長期數(shù)據(jù),并對特定風(fēng)險進(jìn)行數(shù)據(jù)預(yù)測以財務(wù)審計為主,一般只關(guān)注審計年度近期的已有數(shù)據(jù)。審計方法采用全量審計、數(shù)據(jù)挖掘、SQL查詢、可視化等方法,遵循總體分析、發(fā)現(xiàn)疑點(diǎn)、分散核實(shí)的思路主要采用統(tǒng)計查詢、抽樣審計的方法審計結(jié)論揭示相關(guān)關(guān)系,總結(jié)大量數(shù)據(jù)的趨勢性結(jié)論,提示風(fēng)險揭示因果關(guān)系,一般為精確的、遵循統(tǒng)計學(xué)原理的結(jié)論第二節(jié)大數(shù)據(jù)審計分析基本理論大數(shù)據(jù)審計分析的構(gòu)成要素(1)主體+(2)客體+(3)目標(biāo)+(4)基本假設(shè)+(5)環(huán)境+(6)方法大數(shù)據(jù)審計分析的主體是指審計活動的發(fā)起方。根據(jù)發(fā)大數(shù)據(jù)審計分析的主體一般企業(yè)自身,對應(yīng)的審計類型民間審計、內(nèi)部審計。大數(shù)據(jù)審計分析的客體是指審計即審計對象。一起方性質(zhì)不同,

般來說,大數(shù)據(jù)審計分析的客體包括但不限于財會計師事務(wù)所、

經(jīng)營審計分析、環(huán)境審計分析、則為國家審計、

項(xiàng)目工程審計分析、經(jīng)濟(jì)責(zé)任審計分析等等。是指審計主體基于特定環(huán)境,通活動的針對對象,

過實(shí)施審計活動所得到的最終結(jié)果。無論如何大數(shù)據(jù)審計分析的目標(biāo)均是要服務(wù)可以分為政府、

務(wù)報表審計分析、

于特定審計主體的監(jiān)督需求,通合規(guī)性審計分析、

過發(fā)掘的審計線索來發(fā)現(xiàn)問題、分析問題、解決問題。大數(shù)據(jù)審計分析的基本假設(shè)是指審計人員在面對錯綜復(fù)雜的審計環(huán)境時,對某些無法直接證實(shí)的事項(xiàng)基于某些原則進(jìn)行合理推斷。大數(shù)據(jù)審計分析的環(huán)境是指審計人員在進(jìn)行大數(shù)據(jù)審計分析時面對的內(nèi)部與外部因素以及主觀與客觀條件等周遭情況。大數(shù)據(jù)審計分析的方法是指審計主體獲取審計證據(jù)以確定審計客體是否遵循既定審計規(guī)范的系統(tǒng)過程,是審計人員為了實(shí)現(xiàn)審計目標(biāo)所采取思維、程序、技術(shù)、工具的總稱。大數(shù)據(jù)審計分析的實(shí)施流程0102031

、審計分析規(guī)劃審計分析規(guī)劃階段主要包含事前調(diào)查、制定總體分析策略、制定具體分析計劃三個環(huán)節(jié)3

、審計分析報告該階段主要為審計分析報告的撰寫。報告中的內(nèi)容包括但不限于數(shù)據(jù)收集、清洗、建模的過程,

建模使用的模型,進(jìn)行審計分析所依據(jù)原則,

分析結(jié)論,下一步審計方向等等。2

、審計分析實(shí)施審計分析規(guī)劃階段主要包含事前調(diào)查、制定總體分析策略、制定具體分析計劃三個環(huán)節(jié)大數(shù)據(jù)審計分析的約束機(jī)制(一)審計規(guī)范審計人員在審計工作中執(zhí)行審計程序、進(jìn)行審計分析、做出審計判斷、獲得審計結(jié)論的法律依據(jù)和行為準(zhǔn)則。審計規(guī)范一般以審計法律、審計準(zhǔn)則的形式存在,我國現(xiàn)行主要的審計規(guī)范包括《中華人民共和國審計法》《中華人民共和國審計法實(shí)施條例》《中華人民共和國國家審計準(zhǔn)則》《中國注冊會計師審計準(zhǔn)則》《中國內(nèi)部審計準(zhǔn)則》等。(二)審計倫理如果將審計規(guī)范看成大數(shù)據(jù)審計分析的顯性約束,那么審計倫理則為隱形約束。大數(shù)據(jù)的介入給審計工作帶來了有關(guān)倫理方面的新挑戰(zhàn),這需要引起理論界和實(shí)務(wù)界的廣泛關(guān)注。樹立正確的審計倫理原則對審計工作的長遠(yuǎn)發(fā)展是非常重要的。(三)審計數(shù)據(jù)治理審計數(shù)據(jù)治理需要重點(diǎn)關(guān)注三個方面:數(shù)據(jù)質(zhì)量、數(shù)據(jù)產(chǎn)權(quán)、數(shù)據(jù)隱私。版權(quán)聲明本材料由新道科技股份有限公司編制,版權(quán)歸新道科技股份有限公司所有。本材料僅供特定對象學(xué)習(xí)使用,請不要以任何目的將本材料進(jìn)行任何形式的增刪、復(fù)制、改編、節(jié)選、翻譯、仿制、轉(zhuǎn)發(fā)或披露給其他任何人或直接出版。第二章

大數(shù)據(jù)審計分析的技術(shù)與工具目錄第一節(jié)

大數(shù)據(jù)審計分析技術(shù)概述第二節(jié)

大數(shù)據(jù)審計分析工具概述CONTENT第一節(jié)大數(shù)據(jù)審計分析技術(shù)概述數(shù)據(jù)收集技術(shù)APAPI是應(yīng)用程序接口(Application

Programming

Interface)的簡稱。API是一些功能、定義或者協(xié)議的集合,通過API接口可以實(shí)現(xiàn)計算機(jī)軟件之間的相互通信。API提供應(yīng)用程序或者程序開發(fā)人員基于軟件訪問一組例程的能力,對外封裝完善,調(diào)用時無需學(xué)習(xí)API內(nèi)部源碼,依據(jù)API文檔功能說明書來使用即可。2)爬蟲爬蟲即網(wǎng)絡(luò)爬蟲,是指能夠自動訪問互聯(lián)網(wǎng)并將網(wǎng)站內(nèi)容下載下來的程序。爬蟲會按照一定的規(guī)則自動瀏覽、檢索網(wǎng)頁信息的程序或者腳本,它能夠自動請求網(wǎng)頁,并將所需要的數(shù)據(jù)抓取下來。通過對抓取的數(shù)據(jù)進(jìn)行處理,從而提取出有價值的信息。3)預(yù)定義規(guī)則處理預(yù)定義規(guī)則處理是指把執(zhí)行的語句編譯成計算機(jī)能夠理解的形式,主要過程有數(shù)據(jù)抽取(Extraction),數(shù)據(jù)轉(zhuǎn)換(Transformation)和數(shù)據(jù)加載(Loading),也稱為ETL,這個過程是負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)抽取等到臨時中間層進(jìn)行轉(zhuǎn)換、集成等處理,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中。數(shù)據(jù)清洗技術(shù)(1)結(jié)構(gòu)化結(jié)構(gòu)化是指對采集到的數(shù)據(jù)在分析之前將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過程。大數(shù)據(jù)技術(shù)擅長在一定規(guī)則下對大量有規(guī)律的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行建模處理,如果直接使用半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)分析則難以得到理想效果(2)標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化是指通過一定的數(shù)學(xué)變換方式,將原始數(shù)據(jù)按照一定的比例進(jìn)行轉(zhuǎn)換,使之落入到一個小的特定區(qū)間。數(shù)據(jù)標(biāo)準(zhǔn)化處理主要包括指標(biāo)一致化處理和無量綱化處理兩種類型。前者主要解決的是數(shù)據(jù)之間不同性質(zhì)的問題,后者主要解決數(shù)據(jù)之間可比性的問題。(3)模糊匹配模糊匹配是用于比較兩個或多個記錄并計算它們屬于同一主體的可能性。模糊匹配不是將記錄大致分類為匹配和不匹配,而是輸出一個數(shù)字(通常在0-100之間),用于標(biāo)識這些記錄屬于同一主體的可能性。數(shù)據(jù)分析技術(shù)(1)回歸分析在統(tǒng)計學(xué)中,回歸分析指的是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法在大數(shù)據(jù)分析中,回歸分析是一種預(yù)測性的建模技術(shù),它研究的是因變量(目標(biāo))和自變量(預(yù)測器)之間的關(guān)系。常見的回歸方法包括普通最小二乘回歸、對數(shù)幾率回歸、多元自適應(yīng)回歸、局部散點(diǎn)平滑估計回歸等等。(2)聚類分析聚類分析是指將數(shù)據(jù)對象的集合分組為由類似的對象組成的多個類的分析過程。聚類就是一種尋找數(shù)據(jù)之間內(nèi)在結(jié)構(gòu)的技術(shù),它把全體數(shù)據(jù)實(shí)例組織成一些相似組,而這些相似組被稱作簇。聚類使組內(nèi)樣本差異極小化,組間樣本差異極大化。常見的聚類方法包括K值聚類、層次聚類、模糊聚類、單連鎖聚類、期望最大值聚類、非負(fù)矩陣分解聚類等等。(3)文本分析文本分析是將非結(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)換為有意義的數(shù)據(jù)進(jìn)行分析的過程,以度量客戶意見、產(chǎn)品評論、反饋,提供搜索工具、情感分析和實(shí)體建模,從而支持基于事實(shí)的決策制定。數(shù)據(jù)分析技術(shù)(4)關(guān)聯(lián)規(guī)制學(xué)習(xí)關(guān)聯(lián)規(guī)則學(xué)習(xí)又叫關(guān)聯(lián)分析,即從大規(guī)模數(shù)據(jù)集中尋找物品間隱含的關(guān)系。關(guān)聯(lián)規(guī)則用來描述兩個或多個事物之間的關(guān)聯(lián)性,其通過一件或多件事物來預(yù)測其它事物,可以從大量數(shù)據(jù)中獲取有價值數(shù)據(jù)之間的聯(lián)系。常見的關(guān)聯(lián)規(guī)制學(xué)習(xí)算法包括Apriori算法、Eclat算法、FP-Growth算法等等。(5)降維降維是將高維數(shù)據(jù)集轉(zhuǎn)換為可比較的低維空間的過程,真實(shí)的數(shù)據(jù)集通常有很多冗余特征,降維技術(shù)可用于去除這些冗余特征或?qū)維數(shù)據(jù)集轉(zhuǎn)換為2維或3維進(jìn)行可視化。常見的降維技術(shù)包括主成分分析、因子分析、判別分析、局部線性嵌入、Sammon映射、投影尋蹤等等。(6)集成方法集成方法是指通過將一系列相對較弱的模型以某種恰當(dāng)?shù)姆绞浇M合起來,可以得到比單個模型效果更好的強(qiáng)模型,從而提高模型的性能。集成方法可以很容易地減少過擬合,避免模型在訓(xùn)練時表現(xiàn)更好,而在測試時不能產(chǎn)生良好的結(jié)果。常見的集成方法包括Boosting、自展輸入引導(dǎo)式聚合、Adaboost、堆棧泛化、隨機(jī)森林等等。數(shù)據(jù)分析技術(shù)(7)決策樹決策樹是一種樹形結(jié)構(gòu)(例如二叉樹),其中每個內(nèi)部節(jié)點(diǎn)表示一個屬性上的判斷,每個分支代表一個判斷結(jié)果的輸出,最后每個葉節(jié)點(diǎn)代表一種分類結(jié)果。常見的決策樹算法包括分類回歸數(shù)、迭代二叉樹、卡方自動交互檢測、單層決策樹、條件決策樹等等。(8)貝葉斯貝葉斯是利用概率統(tǒng)計知識進(jìn)行分類的算法統(tǒng)稱。常見的貝葉斯算法包括樸素貝葉斯、高斯樸素貝葉斯、多項(xiàng)式樸素貝葉斯、平均單依賴分類器、貝葉斯信念網(wǎng)絡(luò)、隱馬爾可夫模型、條件隨機(jī)場等等。(9)神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是由大量簡單處理單元按不同方式互相連接構(gòu)成的并行分布式信息處理系統(tǒng),這些處理單元也被稱為神經(jīng)元、神經(jīng)節(jié)點(diǎn)。它模仿人腦神經(jīng)系統(tǒng),通過對預(yù)先提供的一批相互對應(yīng)的輸入輸出信號進(jìn)行學(xué)習(xí)分析,挖掘出兩者之間的潛在規(guī)律,然后根據(jù)這些規(guī)律完成對新輸入信號推算出輸出結(jié)果的處理。常見的神經(jīng)網(wǎng)絡(luò)算法包括自組織映射、感知機(jī)、反向傳播算法、霍普菲爾德神經(jīng)網(wǎng)絡(luò)、徑向機(jī)函數(shù)網(wǎng)絡(luò)、玻爾茲曼機(jī)、受限波爾茲曼機(jī)、Spiking神經(jīng)網(wǎng)絡(luò)、學(xué)習(xí)矢量量化等等。數(shù)據(jù)分析技術(shù)(10)深度學(xué)習(xí)深度學(xué)習(xí)是利用機(jī)器學(xué)習(xí)算法讓模型學(xué)習(xí)數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,通過學(xué)習(xí)過程幫助機(jī)器獲得對諸如文字、圖像、聲音等數(shù)據(jù)的解釋。常見的深度學(xué)習(xí)算法包括深度玻爾茲曼機(jī)、深度信念網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、堆棧式自動編碼器等等。1.

多層感知機(jī)(Multilayer

Perceptron,MLP):一種基本的前饋神經(jīng)網(wǎng)絡(luò)模型,用于解決各種機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù),如分類、回歸和模式識別等。2.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional

Neural

Networks,CNN):主要用于圖像處理和計算機(jī)視覺任務(wù),通過卷積層和池化層來提取圖像中的特征。3.循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent

Neural

Networks,RNN):用于序列數(shù)據(jù)建模,具有循環(huán)連接的結(jié)構(gòu),可以處理時間序列數(shù)據(jù)、自然語言處理等任務(wù)。4.長短時記憶網(wǎng)絡(luò)(LongShort-Term

Memory,LSTM):一種特殊類型的RNN,用于解決傳統(tǒng)RNN中的梯度消失問題,適用于處理長序列。5.門控循環(huán)單元(GatedRecurrent

Unit,GRU):與LSTM類似,但具有更少的門控單元,參數(shù)較少,適用于一些輕量級的序列任務(wù)等等。數(shù)據(jù)可視化技術(shù)(1)直方圖直方圖是一種統(tǒng)計報告圖,用來展示數(shù)據(jù)值分布情況的圖形。一般橫軸表示數(shù)據(jù)區(qū)間,縱軸表示數(shù)據(jù)分布。圖2-2展示了一個反映現(xiàn)金支出分布的直方圖圖例。(2)散點(diǎn)圖散點(diǎn)圖通常用于比較跨類別的聚合數(shù)據(jù),展示數(shù)據(jù)點(diǎn)在直角坐標(biāo)系平面上的分布,判斷變量之間是否存在某種關(guān)聯(lián)或總結(jié)坐標(biāo)點(diǎn)的分布模式。散點(diǎn)圖將序列顯示為一組點(diǎn),值由點(diǎn)在圖表中的位置表示,類別由圖表中的不同標(biāo)記表示。圖2-3展示了一個反映渠道銷售訂單分布的散點(diǎn)圖圖例。圖2-2

直方圖圖例圖2-3

散點(diǎn)圖圖例數(shù)據(jù)可視化技術(shù)(3)K線圖K線圖又叫蠟燭圖。從K線圖中,既可以看到股價的趨勢,也可以了解到每日股價的波動情況,能夠全面透徹地觀察到市場價格的真正變化。K線圖主要顯示值為最高價、最低價、開盤價和收盤價。左圖展示了一個反映股價日趨勢的K線圖圖例。(4)熱力圖熱力圖是指根據(jù)所屬部分的顏色深淺來反映數(shù)值大小的圖形。熱力圖可以直觀地將數(shù)據(jù)分布通過不同顏色區(qū)塊呈現(xiàn)。熱力圖的一種典型應(yīng)用是以地圖的形式展現(xiàn)數(shù)據(jù)分布,同時還可以顯示對應(yīng)地理位置。日期熱力圖也是比較常見的熱力圖應(yīng)用,可以反映不同日期的數(shù)據(jù)量情況,右圖展示了一個年度內(nèi)關(guān)于某上市公司的討論量情況,可以看到在5月、6月年報公布后,討論量有明顯上升趨勢。數(shù)據(jù)可視化技術(shù)(5)詞云圖詞云就是通過形成關(guān)鍵詞云層或關(guān)鍵詞渲染,對文本中出現(xiàn)頻率較高的關(guān)鍵詞在視覺上進(jìn)行突出,關(guān)鍵詞出現(xiàn)頻率越高,面積越大。詞云圖過濾掉大量的低頻低質(zhì)的文本信息,使瀏覽者只有一眼掃過文本就可以領(lǐng)略文本的主旨。圖2-6展示了一個反映股吧股民評論的詞云圖圖例。(6)社會網(wǎng)絡(luò)圖社會網(wǎng)絡(luò)圖是一種基于網(wǎng)絡(luò)(節(jié)點(diǎn)之間的相互連接)的可視化展現(xiàn)形式,可以直觀的看到各個主體在網(wǎng)絡(luò)中的位置和網(wǎng)絡(luò)整體結(jié)構(gòu),用于挖掘分析主體之間的社會網(wǎng)絡(luò)關(guān)系。圖2-6

詞云圖圖例圖2-7

社會網(wǎng)絡(luò)圖圖例第二節(jié)大數(shù)據(jù)審計分析工具概述大數(shù)據(jù)審計分析工具概述考慮到大數(shù)據(jù)審計分析應(yīng)該滿足對被審計單位各部門、各環(huán)節(jié)多種類型全樣本數(shù)據(jù)的使用需求,而不僅僅局限于特點(diǎn)的財務(wù)、業(yè)務(wù)數(shù)據(jù),且對數(shù)據(jù)的使用需要打破時間和空間的限制,滿足隨時隨地進(jìn)行多維度審計的需求。因此結(jié)合配套的實(shí)踐平臺,本書介紹了三個非常常見,且能夠滿足大數(shù)據(jù)審計分析應(yīng)用需求的具體工具。SQL基礎(chǔ)Python基礎(chǔ)RPA基礎(chǔ)SQL基礎(chǔ)SQL簡介SQL(Structured

Query

Language,結(jié)構(gòu)化查詢語言)是一種計算機(jī)標(biāo)準(zhǔn)語言,通過SQL我們可以對數(shù)據(jù)庫執(zhí)行查詢、新增、更新、刪除等操作。SQL是對埃德加·科德的關(guān)系模型的第一個商業(yè)化實(shí)現(xiàn),盡管SQL并非完全按照科德的關(guān)系模型設(shè)計,但其依然成為最為廣泛應(yīng)用的數(shù)據(jù)庫語言。SQL在1986年成為美國國家標(biāo)準(zhǔn)學(xué)會(ANSI)的一項(xiàng)標(biāo)準(zhǔn),在1987年成為國際標(biāo)準(zhǔn)化組織(ISO)標(biāo)準(zhǔn)。SQL語句主要是與關(guān)系數(shù)據(jù)庫管理系統(tǒng)進(jìn)行數(shù)據(jù)交互,常見的關(guān)系數(shù)據(jù)庫管理系統(tǒng)有:MySQL、Oracle、DB2和SQLServer。每個數(shù)據(jù)庫管理系統(tǒng)的SQL語言風(fēng)格略有不同,但他們的操作都很相似,而且都是基于標(biāo)準(zhǔn)SQL規(guī)范的。SQL在大數(shù)據(jù)審計分析中的應(yīng)用隨著經(jīng)濟(jì)的高速發(fā)展,企業(yè)經(jīng)營數(shù)據(jù)暴增,在審計工作中經(jīng)常會遇到數(shù)據(jù)量很大的情況,比如一個工作簿占用的內(nèi)存有30多M,一個工作表里面有30多萬行數(shù)據(jù)。審計人員遇到這種情況,常常感覺自己電腦反應(yīng)很慢,即使高配的電腦也是如此。這個時候,使用SQL就可以進(jìn)行批量化的數(shù)據(jù)操作。SQL基礎(chǔ)(3)SQL基本語法1·不區(qū)分大小寫:SQL語句不區(qū)分大小寫,意思是我們可以使用大寫或者小寫,效果都是一樣的。但是為了便于閱讀和調(diào)試代碼,比較規(guī)范的做法是,SQL的關(guān)鍵字大寫,表名或者字段名小寫。2·多條語句分號分割:對于單條SQL語句來說,在結(jié)尾處加分號或者不加分號都是可以的,但是多條SQL語句必須以分號分隔。3·必須英文標(biāo)點(diǎn)符號:SQL語句中所使用的標(biāo)點(diǎn)符號,需要是英文狀態(tài)的標(biāo)點(diǎn)符號,如果使用中文的標(biāo)點(diǎn)符號會報錯。4·空格會被忽略:在處理SQL語句時,所有的空格都會被忽略,我們可以把一條SQL語句寫在一行上,也可以分開寫在多行上。比較好的習(xí)慣是將SQL語句寫在多行上,這樣使得代碼更容易閱讀和調(diào)試。表2-1

SQL添加注釋規(guī)則如右圖注釋情形示例和SQL語句在同一行:用“-

-”SELECT

prod_name

FROM

products;

-

-這是一條注釋單獨(dú)一行:用“#”#這是一條注釋SELECT

prod_name

FROM

products;多行注釋:用“/* */”/*這是一條注釋這是一條注釋這是一條注釋*/SELECTprod_nameFROM

products;SQL基礎(chǔ)SQL基本語句常用SQL基本語句如表2-2所示。基本語句語句功能基本語句語句功能CREATE

DATABASE創(chuàng)建數(shù)據(jù)庫SHOW顯示(數(shù)據(jù)庫/數(shù)據(jù)表)CREATE

TABLE創(chuàng)建數(shù)據(jù)表USE選擇數(shù)據(jù)庫DROP刪除(數(shù)據(jù)庫/數(shù)據(jù)表)SELECT從數(shù)據(jù)庫中查詢數(shù)據(jù)DELETE刪除數(shù)據(jù)庫中的數(shù)據(jù)SELECT*

FROM...從某表中查詢數(shù)據(jù)DELETE

FROM從某表中刪除數(shù)據(jù)SELECT*FROM...WHERE

...從某表中查詢符合某些條件的數(shù)據(jù)DELETEFROM...WHERE

...從某表中刪除符合某些條件的數(shù)據(jù)SELECT

DISTINCT返回唯一不同的值UPDATE更新數(shù)庫中的數(shù)據(jù)SELECT

*FROM...ORDERBY……DESC從某表中查詢數(shù)據(jù)后按照某個字段進(jìn)行降序排列INSERT

INTO在數(shù)據(jù)庫中插入新的數(shù)據(jù)SELECT

COUNT(*)FROM...查詢某表中的數(shù)據(jù)條數(shù)LOADDATA導(dǎo)入數(shù)據(jù)Group

by以某字段唯一值為匯總依據(jù)匯總數(shù)據(jù)SQL基礎(chǔ)基本語句語句功能基本語句語句功能CREATE

DATABASE創(chuàng)建數(shù)據(jù)庫SHOW顯示(數(shù)據(jù)庫/數(shù)據(jù)表)CREATE

TABLE創(chuàng)建數(shù)據(jù)表USE選擇數(shù)據(jù)庫DROP刪除(數(shù)據(jù)庫/數(shù)據(jù)表)SELECT從數(shù)據(jù)庫中查詢數(shù)據(jù)DELETE刪除數(shù)據(jù)庫中的數(shù)據(jù)SELECT*

FROM...從某表中查詢數(shù)據(jù)DELETE

FROM從某表中刪除數(shù)據(jù)SELECT*FROM...WHERE...從某表中查詢符合某些條件的數(shù)據(jù)DELETEFROM...WHERE

...從某表中刪除符合某些條件的數(shù)據(jù)SELECT

DISTINCT返回唯一不同的值UPDATE更新數(shù)庫中的數(shù)據(jù)SELECT*

FROM...ORDERBY……DESC從某表中查詢數(shù)據(jù)后按照某個字段進(jìn)行降序排列INSERT

INTO在數(shù)據(jù)庫中插入新的數(shù)據(jù)SELECT

COUNT(*)FROM...查詢某表中的數(shù)據(jù)條數(shù)LOAD

DATA導(dǎo)入數(shù)據(jù)Groupby以某字段唯一值為匯總依據(jù)匯總數(shù)據(jù)常用SQL基本語句列表SQL基礎(chǔ)常用SQL基本語句示例如圖表2-3至表2-9所示【增刪數(shù)據(jù)庫】表2-3

SQL基本語句——增刪數(shù)據(jù)庫表2-3

SQL基本語句——增刪數(shù)據(jù)庫語句用法語句示例SHOWDATABASES:列出MySQL數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)庫列表#顯示MySQL中所有的數(shù)據(jù)庫SHOW

databases;CREATE

DATABASE+數(shù)據(jù)庫名:新建數(shù)據(jù)庫#創(chuàng)建名為my_database的數(shù)據(jù)庫CREATE

DATABASEmy_database;DROP

DATABASE+數(shù)據(jù)庫名:刪除數(shù)據(jù)庫#刪除數(shù)據(jù)庫my_databaseDROPDATABASEmy_database;表2-4

SQL基本語句——增刪數(shù)據(jù)表語句用法語句示例SHOWTABLES:顯示指定數(shù)據(jù)庫的所有表。使用該命令前需要使用USE命令來選擇要操作的數(shù)據(jù)庫#顯示py_database數(shù)據(jù)庫中所有的表USE

py_database;SHOWtables;USE+數(shù)據(jù)庫名:選擇數(shù)據(jù)庫CREATE

TABLE+數(shù)據(jù)表名(“字段名”字段定義):新建數(shù)據(jù)表CREATETABLE

table_name(column_namecolumn_type);使用該命令前需要使用USE命令來選擇要操作的數(shù)據(jù)庫#在py_database創(chuàng)建名為my_table的數(shù)據(jù)表USE

py_database;CREATETABLEmy_table(cust_idchar(10)NOTNULL,cust_namechar(50)

NOTNULL);#char(10)以及char(50)指定字段字符的長度#NOTNULL指定字段不能為空值,如不指定,默認(rèn)為NULL,即可以為空值DROP

TABLE+數(shù)據(jù)表名:刪除數(shù)據(jù)表。使用該命令前需要使用USE命令來選擇要操作的數(shù)據(jù)庫。#刪除數(shù)據(jù)表my_tableUSEpy_database;DROPTABLE

my_table;SQL基礎(chǔ)注:使用表2-5所示命令前需要使用USE命令指定數(shù)據(jù)庫?!静樵償?shù)據(jù)】表2-5

SQL基本語句——查詢數(shù)據(jù)語句用法語句示例SELECT+字段名:要查什么#從數(shù)據(jù)庫表products中查詢prod_nameFROM+數(shù)據(jù)表名:從哪里查SELECTprod_name

FROMproducts;DISINCT+字段名:表示數(shù)據(jù)庫只返回該字段不同的值(查詢結(jié)果去重)#從數(shù)據(jù)庫表products中查詢不重復(fù)的prod_name值SELECT

DISTINCTprod_nameFROM

products;查詢多列時,各個列之間以逗號分隔,最后一列的后面不加逗號#從數(shù)據(jù)庫表products中查詢prod_id和vend_idSELECT

prod_id,

vend_idFROM

products;查詢多列均不重復(fù)的值時,同樣使用DISTINCT,其作用于所有的列,不僅僅是跟在其后的一列,也就是所有列值都相同的行才會被去除,并且DISTINCT要放在所有要查詢的列的最前面,不可以放在中間位置#從數(shù)據(jù)庫表products中查詢vend_id和

prod_price均不重復(fù)的數(shù)據(jù)行SELECTDISTINCTvend_idprod_priceFROMproducts查詢所有列時,可以列示所有列名,或者使用*號通配符來實(shí)現(xiàn)#從數(shù)據(jù)庫表

products

中查詢所有列SELECT

*

FROM

products;WHERE語句可以指定查詢條件,可以在WHERE子句中使用的操作符包括:=,>,<,>=,<=,<>,BETWEEN

AND,LIKE等。其中,LIKE操作符,主要在過濾模糊值時使用。一般會與通配符(%、_)結(jié)合使用。%為通配符,表示任何字符出現(xiàn)任意次數(shù)。與%能匹配若干個字符不同,_總是剛好匹配一個字符。通配符查詢只能用于文本字段,非文本數(shù)據(jù)類型字段不能使用通配符搜索。多條件查詢時,可以使用OR、AND操作符將多個條件組合在一起。AND

用來指示查詢滿足所有給定條件的行。OR用來指示查詢滿足任一給定條件的行。SQL基礎(chǔ)【按條件查詢數(shù)據(jù)】語句示例#從products查詢

prod_price為9.49的數(shù)據(jù) SELECTprod_name,prod_priceFROMproductsWHEREprod_price=9.49;#從products查詢

prod_price介于5.99(含)到11.99(含)之間的數(shù)據(jù)

SELECT

prod_name,prod_price

FROMproducts

WHERE

prod_priceBETWEEN5.99AND

11.99;#從products

查詢

vend_id

DLL01

的數(shù)據(jù) SELECTprod_name,prod_price,vend_idFROMproductsWHEREvend_id=

‘DLL01’;#從products

查詢

vend_id

不是

DLL01

的數(shù)據(jù)SELECT

prod_name,

prod_price,

vend_id

FROM

productsWHERE

vend_id

<>

‘DLL01’;#查詢產(chǎn)品名以doll為結(jié)尾的產(chǎn)品

SELECT

prod_id,

prod_price,FROM

productsWHERE

prod_name

LIKE'%doll';#查詢產(chǎn)品名以doll為開頭的產(chǎn)品

SELECT

prod_id,

prod_price,FROM

productsWHERE

prod_name

LIKE'doll%';#從products查詢

prod_name后綴為inch

teddy

bear且前面只有一個字符的數(shù)據(jù)。SELECT

prod_id,

prod_price,prod_name,

prod_idFROMproductsWHEREprod_nameLIKE'_inchteddy

bear';#從products查詢

prod_name后綴為inch

teddy

bear且前面只有兩個字符的數(shù)據(jù)。SELECT

prod_id,

prod_price,prod_name,

prod_idFROMproductsWHEREprod_nameLIKE‘

inchteddybear';#從

products

查詢prod_name中包含“ton”的數(shù)據(jù)。

SELECT

prod_name,

FROM

products

WHERE

prod_name

LIKE’%ton%’;#從products

查詢vend_id

='BRS01'且prod_price<10的數(shù)據(jù)

SELECTprod_id,

prod_price,prod_name,FROMproductsWHERE

vend_id

='BRS01'#從products

查詢vend_id

=‘BRS01’

或prod_price

<

10的數(shù)據(jù)SELECT

prod_id,

FROMproductsWHERE

vend_id

=

'BRS01'ORprod_price<

10;SQL基礎(chǔ)【數(shù)據(jù)匯總/統(tǒng)計】【數(shù)據(jù)排序】語句示例#從products

中查詢prod_name并按照升序排列SELECTprod_nameFROMproductsORDERBY

prod_name;#從products

中查詢prod_name并按照降序排列SELECTprod_nameFROMproductsORDERBYprod_name

DESC;#從products

中查詢prod_price,

prod_name,并依次按照prod_price,prod_name升序排列SELECTprod_price,prod_nameFROMproductsORDERBY

prod_price,prod_name;#從products

中查詢prod_price,

prod_name,并依次按照prod_price降序排列,

prod_name升序排列SELECTprod_price,prod_nameFROMproductsORDERBYprod_priceDESC,

prod_name;表2-7

SQL基本語句——數(shù)據(jù)排序語句用法語句示例Group

by

字段名

#以該字段唯一值為匯總依據(jù)#從products中查詢prod_id,prod_name并返回prod_id唯一值SELECTprod_id,

prod_name

FROMproductsGroupbyprod_idCount(字段名)#對該字段進(jìn)行計數(shù)Count(*)#對所有字段進(jìn)行統(tǒng)計#從products中查詢prod_id,prod_name并返回prod_id唯一值,并分組統(tǒng)計數(shù)據(jù)條數(shù)SELECTprod_id,prod_name,COUNT(*)FROMproductsGroupby

prod_id;Sum(字段名)#對該字段求和#從products中查詢prod_id,prod_name并返回prod_id唯一值,并對prod_quant分組求和SELECTprod_id,prod_name,sum(prod_quant)FROMProductsGroupby

prod_idAvg(字段名)#對該字段求平均值從products中查詢prod_id,prod_name并返回prod_id唯一值,并對prod_price分組求平均值SELECTprod_id,prod_name,AVG(prod_price)FROMproductsGroupby

prod_id;表2-8

SQL基本語句——數(shù)據(jù)匯總/統(tǒng)計SQL基礎(chǔ)表2-9

SQL基本語句——更新/插入/導(dǎo)入/導(dǎo)出數(shù)據(jù)【更新/插入/導(dǎo)入/導(dǎo)出數(shù)據(jù)】語句用法語句示例Update表名Set字段名1=新字段值1,字段名2=新字段值2,……Where設(shè)定更新的條件#更新數(shù)據(jù)(修改數(shù)據(jù))#如果沒有where子句設(shè)定更新的條件,則表中指定字段的所有記錄都會被更新成同樣的新值。Updatemy_tableSetvend_id1=vend_code1,vend_id2=vend_id2Whereprod_price<

10;Insertinto表名(字段名1,字段名2,……)

values(字段值1,字段值2,……)#插入數(shù)據(jù)Insertintomy_table(vend_id1,vend_id2,vend_id3)values(1,2,3)load

datainfile‘文件路徑及文件名’intotable‘表名’#導(dǎo)入數(shù)據(jù)LOAD

DATA

LOCAL

INFILE"D:\price.txt"

INTOTABLEmy_table;SELECT*FROM表名

INTOOUTFILE‘文件路徑及文件名’#導(dǎo)出數(shù)據(jù)SELECT*FROMmy_table

INTOOUTFILE‘"D:\price.txt";Python基礎(chǔ)(1)PYTHON簡介Python是由荷蘭數(shù)學(xué)和計算機(jī)科學(xué)研究學(xué)會的Guido

van

Rossum于1989年底至1990年初設(shè)計的編程語言。作為一門叫做ABC語言的替代品,Python提供了高效的高級數(shù)據(jù)結(jié)構(gòu),還能簡單有效地面向?qū)ο缶幊獭ython語法和動態(tài)類型,以及解釋型語言的本質(zhì),使它成為多數(shù)平臺上寫腳本和快速開發(fā)應(yīng)用的編程語言,隨著版本的不斷更新和語言新功能的添加,逐漸被用于獨(dú)立的、大型項(xiàng)目的開發(fā)。Python解釋器易于擴(kuò)展,可以使用C或C++或者其他可以通過C調(diào)用的語言擴(kuò)展新的功能和數(shù)據(jù)類型。Python也可用于可定制化軟件中的擴(kuò)展程序語言。Python豐富的標(biāo)準(zhǔn)庫,提供了適用于各個主要系統(tǒng)平臺的源碼或機(jī)器碼。(2)PYTHON在大數(shù)據(jù)審計分析中的應(yīng)用基于Python開發(fā)平臺及相關(guān)工具,可以完成數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化等一系列工作,可以輔助審計人員完成信息收集及數(shù)據(jù)分析工作,通過數(shù)據(jù)挖掘與算法幫助審計人員識別潛在風(fēng)險,通過數(shù)據(jù)可視化幫助審計人員快速捕捉審計疑點(diǎn),指引審計人員進(jìn)一步獲得審計證據(jù)。Python基礎(chǔ)(3)PYTHON基本語法1·嚴(yán)格區(qū)分大小寫。Python標(biāo)識符英文字母是嚴(yán)格區(qū)分大小寫的,即同一單詞大小寫不同代表不同的對象。例如:number、Number、NUMBER三個變量名代表著三個完全不同的獨(dú)立的變量。2·必須英文標(biāo)點(diǎn)符號。Python語句所使用的標(biāo)點(diǎn)符號,需是英文狀態(tài)的標(biāo)點(diǎn)符號,不能是中文狀態(tài)的。3·多條語句分號分隔。Python可以在同一行中使用多條語句,語句之間使用分號(;)分割。4·不能混用單雙引號。字符串可以使用單引號或雙引號括起來,但開頭和結(jié)尾不能使用不同的符號,即不能混用單引號和雙引號。5· 嚴(yán)格縮進(jìn)。Python語句需要使用縮進(jìn)來編寫模塊??s進(jìn)的空白數(shù)量是可變的,但是所有代碼塊語句必須包含相同的縮進(jìn)空白數(shù)量,這個必須嚴(yán)格執(zhí)行,否則會報錯。Python基礎(chǔ)(3)PYTHON基本語法6· 多行語句。Python

通常是一行寫完一條語句,但如果語句很長,我們可以使用反斜杠

\

來實(shí)現(xiàn)多行語句。在[

],{

},或(

)中的多行語句,不需要使用反斜杠

\

。7· 空行。函數(shù)之間或類的方法之間用空行分隔,表示一段新的代碼的開始。類和函數(shù)入口之間也用一行空行分隔,以突出函數(shù)入口的開始。空行與代碼縮進(jìn)不同,空行并不是

Python

語法的一部分。書寫時不插入空行,Python

解釋器運(yùn)行也不會出錯。但是空行的作用在于分隔兩段不同功能或含義的代碼,便于日后代碼的維護(hù)或重構(gòu)。需要注意的是,空行也是程序代碼的一部分。8· Python標(biāo)識符。Python標(biāo)識符(變量、函數(shù)、類、模塊及其他對象的名稱)可以由英文字母、下劃線及數(shù)字組成,但是不能以數(shù)字開頭,不能包含空格、@、%、$等特殊字符,不能與Python

關(guān)鍵字(即在Python

中代表一定功能的專用詞)相同。Python基礎(chǔ)9·Python語言中,以下劃線開頭的標(biāo)識符有特殊含義,除非特定場景需要,應(yīng)避免使用以下劃線開頭的標(biāo)識符。例如以單下劃線開頭的標(biāo)識符(如_width),表示不能直接訪問的類屬性,其無法通過from...import*的方式導(dǎo)入;以雙下劃線開頭的標(biāo)識符(如

add)表示類的私有成員;以雙下劃線作為開頭和結(jié)尾的標(biāo)識符(如

init

),是專用標(biāo)識符。添加注釋:如表2-10所示。注釋情形示例和

Python

語句在同一行:用“#”print("Hello,

Python!")#這是一條注釋單獨(dú)一行:用“#”#這是一條注釋print("Hello,Python!")多行注釋:用三個單引號(''')或三個雙引號(""")'''這是一條注釋這是一條注釋這是一條注釋'''print("Hello,Python!")"""這是一條注釋這是一條注釋這是一條注釋"""print("Hello,Python!")表2-10

Python添加注釋規(guī)則如下Python基礎(chǔ)Python的標(biāo)準(zhǔn)數(shù)據(jù)類型包括數(shù)字(Number)、字符串(String)、列表(List)、元組(Tuple)、字典Dictionary、集合(Set)。其中,數(shù)字(Number)又有整型(int)、浮點(diǎn)型(float)、布爾型(bool)、復(fù)數(shù)(complex)四種類型。1· 整型(int)整型即整數(shù),包含正整數(shù),負(fù)整數(shù)和0,整型小數(shù)點(diǎn)后無值。如:-1、-2、0、1、2。2· 浮點(diǎn)型(float)浮點(diǎn)型由小數(shù)部分和整數(shù)部分組成,小數(shù)點(diǎn)后有值,即使是整數(shù),也會以“.0”顯示小數(shù)位。如:

1.23、1.0。3· 布爾型(bool)布爾型即是和否的判斷。在數(shù)字運(yùn)算中,可用

“1”表示True,用“0”

表示False。如

True、False。4·

復(fù)數(shù)(complex)復(fù)數(shù)由實(shí)數(shù)部分和虛數(shù)部分構(gòu)成,可以用a

+

bj,或者complex(a,b)表示,復(fù)數(shù)的實(shí)部a和虛部b都是浮點(diǎn)型。如:

1.1

+

2.2j。5· 字符串(String) 字符串是由一個個字符組成的。指定字符串需要用引號括起來,Python

中單引號

'和雙引號

"

使用完全相同。使用三引號('''

""")可以指定一個多行字符串。如:x

='HELLO!'。Python基礎(chǔ)列表(List)列表是Python

中使用最頻繁的數(shù)據(jù)類型。列表可以完成大多數(shù)集合類的數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)。列表中元素的類型可以不相同,它支持?jǐn)?shù)字,字符串甚至可以包含列表(所謂嵌套)。列表是寫在方括號[

]之間、用逗號分隔開的元素列表。如:list=['abcd',

786

,2.23,‘hello'

,70.2]。元組(Tuple)Python

的元組與列表類似,不同之處在于元組的元素不能修改。元組使用小括號(),列表使用方括號[

]。元組創(chuàng)建很簡單,只需要在括號中添加元素,并使用逗號隔開即可。如:tup1

=

('Google',

‘Baidu',1997,

2000)。字典(Dictionary)字典是另一種可變?nèi)萜髂P停铱纱鎯θ我忸愋蛯ο?。字典的每個鍵值key=>value對,用冒號(

:

)分割,每個對之間用逗號(,

)分割,整個字典包括在大括號{}中。如:d=

{key1:value1,

key2

:value2,

key3

:value3

}。9· 集合(Set)集合是一個無序的不重復(fù)元素序列??梢允褂么罄ㄌ?/p>

{

}

或者set()

函數(shù)創(chuàng)建集合,注意:創(chuàng)建一個空集合必須用

set()

而不是{},因?yàn)?/p>

{}

是用來創(chuàng)建一個空字典。如:parame

={value01,value02,...}

或者set(value)。Python基礎(chǔ)(4)PYTHON基本語句常用Python關(guān)鍵字如下表所示import:用于導(dǎo)入模塊,與

from

結(jié)合使用from:用于導(dǎo)入模塊,與

import

結(jié)合使用as:用于類型轉(zhuǎn)換或命名def:用于定義函數(shù)或方法return:用于從函數(shù)返回計算結(jié)果yield:用于從函數(shù)依次返回值if:條件語句,與

else、elif

結(jié)合使用elif:條件語句,與

if、else

結(jié)合使用else:條件語句,與

if、elif

結(jié)合使用,也可用于異常和循環(huán)語句and:用于表達(dá)式運(yùn)算,邏輯與操作or:用于表達(dá)式運(yùn)算,邏輯或操作not:用于表達(dá)式運(yùn)算,邏輯非操作class:用于定義類is:判斷變量是否為某個類的實(shí)例lambda:定義匿名函數(shù)for:循環(huán)語句break:中斷循環(huán)語句的執(zhí)行continue:跳出本次循環(huán),繼續(xù)執(zhí)行下一次循環(huán)try:包含可能會出現(xiàn)異常的語句,與except、finally

結(jié)合使用except:包含捕獲異常后的操作代碼塊,與

try、finally

結(jié)合使用finally:用于異常語句,出現(xiàn)異常后,始終要執(zhí)行

finally

包含的代碼塊,與

try、except

結(jié)合使用assert:斷言,用于判斷變量或者條件表達(dá)式的值是否為真in:判斷變量是否在序列中while:循環(huán)語句del:刪除變量或序列的值global:定義全局變量nonlocal:用于標(biāo)識外部作用域的變量pass:空的類、方法或函數(shù)的占位符raise:異常拋出操作with:簡化上下文管理(如文件流)等功能True:真(布爾類型的值)False:假(布爾類型的值)None:空注:Python關(guān)鍵字不能用作常數(shù)或變量,或任何其他標(biāo)識符。Python基礎(chǔ)【print輸出】語句用法語句示例輸出結(jié)果print(要輸出的對象)#多個print語句,默認(rèn)是換行輸出的,如果要實(shí)現(xiàn)不換行#輸出“Hello,Python”print("Hello,Python!")Hello,Python!則需將要輸出的內(nèi)容寫在一個print語句中,并在要輸出的多個對象中間用逗號(,)分割#換行輸出print("Hello")print("Python")HelloPython#不換行輸出print("Hello",

"Python")Hello

Python#輸出對象類型:print+typeprint(type

(要輸出類型的對象))#定義變量a,b,c,d,e

=20,5.5,True,4+3j,"hello"#輸出變量“a”、“b”、“c”、“d”“e”的數(shù)據(jù)類型print(type(a),

type(b),type(c),type(d),

type(e))<class'int'>

<class'float'><class

'bool'><class'complex'><class'str'>【數(shù)據(jù)類型轉(zhuǎn)換】語句用法語句示例輸出結(jié)果#Python數(shù)據(jù)類型轉(zhuǎn)換:將數(shù)據(jù)類型作為函數(shù)名即可實(shí)現(xiàn)數(shù)據(jù)類型的轉(zhuǎn)換x=1.25x=int(x)

#將對象x轉(zhuǎn)換為一個整數(shù)print(x)1x=1x=float(x)#將對象x轉(zhuǎn)換為一個浮點(diǎn)數(shù)print(x)1.0x=12345.67x=str(x)#將對象

x

轉(zhuǎn)換為字符串print(x)12345.67Python基礎(chǔ)【字符串處理】【列表處理】語句用法語句示例輸出結(jié)果語句用法語句示例輸出結(jié)果#Python中的字符串有兩種索引方式,從左往右以

0

開始,從右往左以

-1

開始#截取字符串的語法格式如下:變量[頭下標(biāo):尾下標(biāo)],截取出的字符包含“頭下標(biāo)”對應(yīng)的元素,不包含“尾下標(biāo)”對應(yīng)的元素#字符串可以用

+

運(yùn)算符連接在一起,用

*

運(yùn)算符重復(fù)x

=

'HELLO!'print

(x)

#輸出字符串print

(x[0:-1])輸出第一個(含)到倒數(shù)第一個(不含)的所有字符print

(x[0])

輸出字符串的第一個字符print

(x[2:5])

輸出從第三個(含)到第六個(不含)的字符print

(x[2:])輸出從第三個(含)開始以后的所有字符print(x

+

"TEST")

連接字符串print

(x

*

2)

#輸出字符串兩次,也可以寫成

print(2*str)HELLO!HELLOHLLOLLO!HELLO!TESTHELLO!HELLO!#和字符串一樣,列表同樣可以被索引和截取,截取規(guī)則與字符串相同,列表被截取后返回一個包含所需元素的新列表#同樣,加號+是列表連接運(yùn)算符,星號*是重復(fù)操作list=["abcd",786,2.23,"hello",70.2]tinylist=[123,"hello"]print(list)#輸出完整列表print(list[0])#輸出列表第一個元素print(list[1:3])#從第二個開始輸出到第四個(不含)元素print(list[2:])#輸出從第三個元素開始的所有元素print(list+tinylist)#連接列表print(tinylist*2)#輸出兩次列表['abcd',786,2.23,'

hello',

70.2]abcd[786,2.23][2.23,'hello

',70.2]['abcd',786,2.23,

'hello',70.2,123,'

hello'][123,'hello',123,

'hello']Python基礎(chǔ)【導(dǎo)入庫】語句用法語句示例#安裝第三方庫:Python中的標(biāo)準(zhǔn)庫,不需要安裝,可以直接進(jìn)行導(dǎo)入,而第三方庫,則需要先安裝后才能導(dǎo)入。安裝一個新庫時使用install#安裝pyecharts庫pip

installpyecharts

-U#導(dǎo)入庫:在python中用import或者from...import來導(dǎo)入相應(yīng)的庫及功能,用import...as在導(dǎo)入庫及其功能的同時給其命名#導(dǎo)入整個庫,格式為:import

庫名#導(dǎo)入pandas庫并命名為pdimportpandasas

pd【導(dǎo)入功能】語句用法語句示例#從某個庫中導(dǎo)入某個功能,格式為:from

庫名

import

功能名或import

庫名.功能名#導(dǎo)入matplotlib庫中的繪圖功能并命名為pltfrommatplotlibimportpyplotas

plt#第二種寫法importmatplotlib.pyplotas

plt#從某個模塊中導(dǎo)入多個函數(shù),格式為:from

庫名

import

功能1,

功能2,

功能3#將某個庫中的全部功能導(dǎo)入,格式為:from

庫名

import

*#注意盡量少用*,避免冗余#導(dǎo)入pyecharts庫charts包中的折線圖功能、柱形圖功能、餅圖功能frompyecharts.chartsimportLine,Bar,Pie#導(dǎo)入pyecharts庫charts包中的所有功能,注意盡量少用*,避免冗余from

pyecharts.charts

import*Python基礎(chǔ)【導(dǎo)入文件】【可視化】語句用法語句示例語句用法語句示例#導(dǎo)入matplotlib庫中的pyplot功能,繪制折線圖import

pandas

as

pd

#導(dǎo)入pandas庫,用于數(shù)據(jù)處理import

matplotlib.pyplot

asplt

#導(dǎo)入matplotlib庫中的繪圖功能并命名為pltplt.rcParams['font.sans-serif']

=

['SimHei']

#設(shè)置中文字體為黑體,避免中文字符顯示異常df=

pd.read_excel(‘明康生物2021年銷售區(qū)域匯總表.xlsx’)

導(dǎo)入數(shù)據(jù)表y=[“東北”,“華北”,“華東”,“華南”,“華中”,“西北”,“西南”]

定義Y軸plt.plot(df[‘月份’],df[y])

定義X軸、Y軸數(shù)據(jù)內(nèi)容plt.legend(y)

#添加圖例plt.xlabel(‘月份’)

添加X軸標(biāo)簽plt.ylabel(‘銷售金額’)

添加Y軸標(biāo)簽plt.title(‘2021年月度區(qū)域銷售趨勢圖',fontsize=18)

添加標(biāo)題plt.show()

#顯示圖形#導(dǎo)入文件:在

python

中導(dǎo)入外部文件使用read_文件格式,在read前面要指定要讀取文件的庫,并用“.”鏈接#在pd庫中導(dǎo)入excel文件的數(shù)據(jù)df

=pd.read_excel(‘文件名')#導(dǎo)入文件《明康生物2021年銷售區(qū)域匯總表.xlsx

》中的數(shù)據(jù)df

=pd.read_excel('明康生物2021年銷售區(qū)域匯總表.xlsx')知識點(diǎn)牢記?。?!Python基礎(chǔ)【條件語句】語句用法語句示例輸出結(jié)果#Python中的條件語句,主要由if、else、elif

構(gòu)成#當(dāng)判斷條件比較簡單時,只使用if、else即可if判斷條件:(縮進(jìn))當(dāng)符合條件時要執(zhí)行的代碼else:(縮進(jìn))當(dāng)不符合條件時要執(zhí)行的代碼score=

85if

score>=60:

#判斷條件為“score>=60

”print

("及格")

符合條件時輸出“及格”else:print

("不及格")

#不符合條件時輸出“不及格”及格#Python中的條件語句,主要由if、

else、elif

構(gòu)成#有多個判斷條件時,就需要結(jié)合使用if、elif、elseif判斷條件1:(縮進(jìn))當(dāng)符合條件1時要執(zhí)行的代碼elif判斷條件2

:(縮進(jìn))當(dāng)不符合條件1,符合條件2時要執(zhí)行的代碼else:

(縮進(jìn))當(dāng)不符合條件1,也不符合條件2時要執(zhí)行的代碼score=

85if

score>=80:

#

判斷條件1為“score>=80

”print("良好")

#符合條件1時輸出“良好”elif

score>=

60:

#

判斷條件2為“score>=60”print

("及格")

#

不符合條件1,符合條件2時輸出“及格”else:print("不及格")

#不符合條件1,也不符合條件2時輸出“不及格”良好【循環(huán)語句】語句用法語句示例輸出結(jié)果#Python

中的循環(huán)語句有

while和forwhile

判斷條件:(縮進(jìn))當(dāng)符合條件時要執(zhí)行的代碼#重復(fù)執(zhí)行以上腳本,直至不符條件時,停止循序,執(zhí)行后面的代碼a

=

0while

a

<=5:

#判斷條件為“a<=5”a

=

a+1

#當(dāng)符合條件時執(zhí)行的代碼print(a)

#當(dāng)符合條件時執(zhí)行的代碼print("循環(huán)結(jié)束")

#當(dāng)不符合條件時執(zhí)行的代碼123456循環(huán)結(jié)束#for循環(huán)一般和in結(jié)合使用,在in后面寫循環(huán)的范圍for

要循環(huán)的變量in限定的循環(huán)范圍:(縮進(jìn))當(dāng)變量值在循環(huán)范圍內(nèi)時要執(zhí)行的代碼#重復(fù)執(zhí)行以上腳本,直至變量值不在循環(huán)范圍時,停止循序,執(zhí)行后面的代碼#range()函數(shù)可以指定數(shù)字區(qū)間,它是一個左閉右開的區(qū)間,即包含左邊的值,不包含右邊的值range(start,

stop,step)#數(shù)字從start開始,缺省時默認(rèn)為0,到stop結(jié)束,但是不包含stop,step為步長,即數(shù)字間的間隔,缺省時默認(rèn)為1for

a

in

range

(5):

#變量a在0到5之間(包含0,不包含5)print(a)

#對限定范圍內(nèi)所有元素重復(fù)執(zhí)行的代碼print("循環(huán)結(jié)束")

#當(dāng)限制范圍內(nèi)所有元素遍歷完畢后執(zhí)行的代碼01234循環(huán)結(jié)束#Python中for

循環(huán)可以遍歷任何可迭代的對象,如一個列表或者一個字符串x

=

["我們","是","審計","人"]for

ain

x:print(a)print("循環(huán)結(jié)束")我們是審計人循環(huán)結(jié)束Python基礎(chǔ)【SQL數(shù)據(jù)庫操作】語句示例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論