數(shù)據(jù)的處理與分析課件_第1頁
數(shù)據(jù)的處理與分析課件_第2頁
數(shù)據(jù)的處理與分析課件_第3頁
數(shù)據(jù)的處理與分析課件_第4頁
數(shù)據(jù)的處理與分析課件_第5頁
已閱讀5頁,還剩92頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第七章數(shù)據(jù)的處理和分析本章學習目標了解數(shù)據(jù)處理和分析的基本原理掌握數(shù)據(jù)處理和分析的基本方法能運用數(shù)據(jù)處理和分析的基本原理和基本方法解決實際問題本章學習重點和難點

重點數(shù)據(jù)處理和分析的基本原理數(shù)據(jù)處理和分析的基本方法難點數(shù)據(jù)處理和分析原理和方法在實際中的應用本章教學方法

課堂講授案例教學應用教學

1、歷史:關于所研究問題的歷史演變過程、來龍去脈

2、理論與方法:關于所研究問題所固有的理論與方法

3、數(shù)據(jù)處理和分析的理論與方法:關于所研究問題所涉及到的數(shù)據(jù)的處理、分析,用數(shù)據(jù)說話,用模型總結規(guī)律,反過來以更好地支持所研究問題的理論和方法一個較為優(yōu)秀的研究人員應具有的知識結構第一節(jié)

數(shù)據(jù)處理和分析的基本原理一、數(shù)據(jù)處理和分析的基本功能二、數(shù)據(jù)處理和分析的基本內(nèi)容3、解釋用數(shù)據(jù)解釋現(xiàn)象和解釋理論、總結規(guī)律4、推論通過樣本的數(shù)據(jù)模型或特征來推論總體的情況二、數(shù)據(jù)處理和分析的

基本內(nèi)容在數(shù)據(jù)處理和分析中,應用什么數(shù)據(jù)處理和分析方法是由其研究內(nèi)容決定的。不同的研究內(nèi)容有不同的分析方法。從統(tǒng)計學的角度分析,

主要有以下八

方面的內(nèi)容:1、特征分析:即所研究的對象具有怎樣的特征?2、結構分析:即所研究的對象具有怎樣的結構?3、動態(tài)分析:即所研究的對象在時間上的變化是怎樣的?6、規(guī)律分析:即研究對象的運動形式是怎樣的?所表現(xiàn)出的規(guī)律是什么?7、趨勢分析:即研究對象的未來表現(xiàn)如何?將會出現(xiàn)怎樣的發(fā)展趨勢?8、可靠性分析:即在研究中所總結出的某些規(guī)律、對研究對象的未來的預見等,其可靠性究竟怎樣?是否與人們的判斷相一致?等等三、調(diào)查數(shù)據(jù)處理的程序問卷接收編輯和檢查編碼數(shù)據(jù)錄入缺失值處理數(shù)據(jù)分析(一)問卷的接收為了保證問卷的質(zhì)量,對于不同地區(qū)、不同調(diào)查員交來的問卷,應當認真仔細地做好接收、登記與核對工作。首先,要對問卷進行登記與編號;其次,要將無效問卷的進行剔除;最后,還要確定補充調(diào)查。(二)編輯和檢查為了增加準確性,對那些初步接收的問卷還要進一步進行檢查和校訂。主要檢查是否清楚可認,是否完全,是否一致以及是否明確不含糊等。一致性審核及時性審核準確性審核完整性審核

調(diào)查問卷的審核對于檢查出來的不滿意問卷,常用以下方法進行處理:1.退回去重新填寫;2.按缺失數(shù)據(jù)處理;3.丟棄?!獑芜x問題與多選問題的編碼——無結構式(開放式)問題的編碼——編碼說明書及數(shù)據(jù)輸出格式說明書(四)數(shù)據(jù)錄入數(shù)據(jù)錄入要求做到準確無誤??刂其浫胝`差的方法有:重復錄入、預值控制、平衡檢測。數(shù)據(jù)錄入的主要方式:

直接錄入轉錄編碼、錄入挑選工作認真、有責任心、技術熟練的錄入員;

加強對錄入員的監(jiān)督管理;定期檢查錄入員的工作質(zhì)量和工作效率;對錄入的資料進廳抽樣復查一二三四五二次錄入缺失數(shù)據(jù)處理可以使用以下幾種方法:1.用一個樣本統(tǒng)計量去代替;2.用某些統(tǒng)計模型進行推算;3.問卷整體剔除;4.部份排除。(六)調(diào)查資料的分析1.數(shù)據(jù)分析任務書數(shù)據(jù)分析任務書一般應明確列舉以下內(nèi)容:——編制變量標識和變量制標識。

集中趨勢的度量。集中趨勢,是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢也就是要尋找數(shù)據(jù)一般水平的代表值或中心值。統(tǒng)計平均數(shù)就是用來反映總體的一般水平和集中趨勢的指標。離散趨勢的度量。離中趨勢是指一組數(shù)據(jù)中各數(shù)據(jù)值以不同程度的距離偏離其中心(平均數(shù))的趨勢,又稱標志變動度。離中趨勢指標,是用來綜合反映數(shù)據(jù)的離中程度的一類指標。常用的離中趨勢指標有極差、分位差、平均差、方差、標準差、離散系數(shù)等。變量間關系的分析。市場現(xiàn)象之間的關系主要是相關關系。分析相關關系主要有相關表、相關圖、相關系數(shù)等三種方法。第二節(jié)

數(shù)據(jù)分析和處理的基本方法一、由其研究內(nèi)容決定,統(tǒng)計學的分析方法主要有6種:1、描述分析法2、比較分析法3、動態(tài)分析法4、因素分析法5、模型分析法6、預測分析法1、描述分析法主要是運用相關的總量指標、相對指標、平均指標、標志變異指標等進行總結性的說明和分析,以說明某種狀況。所以,從功能上來說,描述分析法主要有三大功能:

第一、敘述功能。即用數(shù)據(jù)敘述某種事實。第二、論據(jù)功能。即用數(shù)據(jù)論證你的某種論點。第三、支持功能。即用數(shù)據(jù)支持你的某種論點。問題:總量指標、相對指標、平均指標、標志變異指標是什么?它們各包括哪些具體指標?

2、比較分析法主要是運用相關的總量指標、相對指標、平均指標來說明和反映研究對象與某一特定的研究對象相比,研究對象所具有的優(yōu)勢、兩者之間所存在的差距和不足。在各種條件相同的情形下,用總量指標進行比較,以說明總量上的差距;用相對指標和平均指標進行比較,以說明兩者之間相對的差異;但如果某些條件并不相同,就不能運用總量指標進行比較說明,而只能運用相對指標和平均指標來進行比較說明。因為,總量指標不具有可比性。3、動態(tài)分析法有兩類:一類是簡單總體的動態(tài)分析;一類是復雜總體的動態(tài)分析。簡單總體,是指某一單一總體或在數(shù)量上可以直接相加的總體。單一總體:只有一個變量的總體如甲產(chǎn)品的產(chǎn)量、價格在數(shù)量上可以直接相加的總體:如甲企業(yè)的產(chǎn)值和乙企業(yè)的產(chǎn)值復雜總體:在數(shù)量上不能直接相加的總體如:不同產(chǎn)品由于計量單位不同,其產(chǎn)量是不能直接相加的簡單總體的動態(tài)分析方法是:速度分析法主要運用發(fā)展速度和增長速度來分析和說明。復雜總體的動態(tài)分析方法是:指數(shù)分析法主要運用綜合指數(shù)、平均指數(shù)和平均指標指數(shù)來分析和說明。4、因素分析法也有兩類:一類是指數(shù)體系分析法一類是組成要素分析法指數(shù)體系分析法是運用指數(shù)體系進行因素分析的方法又分為兩因素分析法和多因素分析法主要從相對數(shù)和絕對數(shù)兩方面進行分析(1).兩因素分析法

銷售額=銷售量×單位產(chǎn)品價格銷售額指數(shù)=銷售量指數(shù)×單位產(chǎn)品價格指數(shù)其指數(shù)體系為:(2).多因素分析法原材料費用總額=總產(chǎn)量×單位產(chǎn)品原材料消耗量×單位原材料價格單位原材料價格指數(shù)原材料費用總額指數(shù)=總產(chǎn)量指數(shù)×單位產(chǎn)品原材料消耗量指數(shù)×組成要素分析法其主要特征是各組成要素之關系表現(xiàn)為“和”的關系。主要做貢獻率內(nèi)容的分析基本模型為:設:A=A1+A2+A3則:A1的貢獻率為:A1/A×100%A2的貢獻率為:A2/A×100%A3的貢獻率為:A3/A×100%5、模型分析法主要是根據(jù)變量之間的關系構建回歸模型。通過模型說明研究對象的運動方式、運行規(guī)律和主要的特征,也可以進行因素分析。最重要的是兩種分析方法:相關分析法回歸分析法6、預測分析法一方面可以運用所構建的回歸模型進行趨勢的預測分析另一方面,可以通過特有的統(tǒng)計預測方法進行趨勢的預測分析,如指數(shù)平滑法等二、應用于營銷調(diào)查的統(tǒng)計分析類型描述分析DescriptiveAnalysis推斷分析InferentialAnalysis差別分析DifferencesAnalysis聯(lián)合分析AssociativeAnalysis預測分析PredictiveAnalysis五種統(tǒng)計分析概述類型功能說明統(tǒng)計概念描述數(shù)據(jù)壓縮均值、中值、眾數(shù)、頻率分布、標準差推理決定總體參數(shù),檢驗假設標準誤差,零假設差別確定組與組之間是否存在差異差別的統(tǒng)計檢驗和方差分析聯(lián)合確定聯(lián)系相關性,交叉表預測以統(tǒng)計模型為基礎進行預測時間序列,回歸分析解讀營銷調(diào)查中的描述統(tǒng)計指標中位數(shù)在營銷調(diào)查中的作用眾數(shù)在營銷調(diào)查中的作用均值在營銷調(diào)查中的作用頻率分布在營銷調(diào)查中的作用標準差在營銷調(diào)查中的作用中位數(shù)在營銷調(diào)查中的的作用中位數(shù)可以確定樣本在某一變量的分布上的位置特征。四分位數(shù)、八分位數(shù)和十六分位數(shù),甚至百分位數(shù)是可以將分布特征刻畫得更細致。例如:八分位數(shù)四分位數(shù)中位數(shù)十六分位數(shù)十六分位數(shù)用人單位對市場營銷專業(yè)人員關于組織能力的重要程度的看法眾數(shù)在營銷調(diào)查中的作用眾數(shù)可以直觀地表達樣本在某變量的集中趨勢均值在營銷調(diào)查中的作用均值可直接反映樣本在某變量下的集中趨勢薪酬在1200-1280之間頻率分布在營銷調(diào)查中的作用

頻率能夠顯示樣本在某變量下的分布狀況標準差在營銷調(diào)查中的作用

標準差能夠反映均值的代表性及樣本在某變量下的分布在EXCLE狀態(tài)與進行描述分析分析步驟——第一步:點擊“工具欄”——第二步:點擊“數(shù)據(jù)分析”——第三步:在菜單中選擇描述分析并選擇計算指標項——第四步:將計算結果存盤注意事項一般不要把結果直接粘到WORD上,經(jīng)過整理后,再沾到WORD上第三節(jié)數(shù)據(jù)處理和分析的

基本工具1、工具之一:統(tǒng)計表2、工具之二:統(tǒng)計圖統(tǒng)計表——表格代替文字描述,便于統(tǒng)計結果的

精確、簡潔的表達和對比分析統(tǒng)計圖——用圖形代替數(shù)據(jù),獲得直觀、形象的效果一、統(tǒng)計表

1.統(tǒng)計表的結構2.統(tǒng)計表的種類3.不良統(tǒng)計表的修改舉例1.統(tǒng)計表的結構統(tǒng)計表由以下幾個部分組成:①標題、②標目、③線條、④數(shù)字、⑤備注1.標題位于表的上方,概括地說明表的主要內(nèi)容。必要時注明時間和地點。若一篇論文中有兩張以上統(tǒng)計表,則每張統(tǒng)計表的標題前應加序號。2.標目根據(jù)其位置與作用可分為橫標目、縱標目和總標目。橫標目位于表的左側,說明各橫行數(shù)字的涵義,一般為研究的事情;縱標目位于表的右側,說明各縱欄數(shù)字的涵義,即研究事物的指標。只有組合表才有總標目,它是對橫標目或縱標目內(nèi)容的概括。

3.線條通常采用三條半線。即頂線、底線,縱標目下的橫隔線及合計上的半線。若是組合表,在總標目與縱標目之間有短橫線隔開4.數(shù)字一律采用阿拉伯數(shù)字。要求完整、準確無誤。同一指標位數(shù)一致,位次對齊。統(tǒng)計表中不能留有空白項目,數(shù)字為零時用“0”填于表中,數(shù)據(jù)不詳時用“…”表示。

5.備注不是表中必備項目。若是表內(nèi)某個數(shù)字或標目需作說明時,可用“*”號標出,寫在底線的下面。

統(tǒng)計表的結構

××.××┋┋×.××××.××縱標目總標目(單位)××.××××××××合計┋┋┋┋┋┋┋┋×.××××××┋××.××××××××橫標目縱標目縱標目縱標目總標目橫標目的總標目備注:表號標題(包括何時、何地、何事)頂線底線分隔線

2.統(tǒng)計表的種類

根據(jù)分組標目的復雜程度,統(tǒng)計表可大致分為簡單表和復合表。

簡單表:只按一個特征或標志分組。

方法觀察人數(shù)近期有效人數(shù)近期有效率%新法321650.0舊法32928.1表2-8有效率復合表:按兩個或兩個以上特征或標志結合起來分組。表2-9某廠2004、2006異常檢出率檢測指標1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)受檢人數(shù)異常人數(shù)檢出率(%)

12345195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75

:TTT(麝香草酚濁度試驗),:GPT(谷丙轉氨酶)。(丁建生等.中國衛(wèi)生統(tǒng)計2006;16(3):166)

3.不良統(tǒng)計表的修改舉例二、統(tǒng)計圖

統(tǒng)計圖是用點、線、面等幾何圖形,直觀形象地表達、描述數(shù)據(jù)或結果。1.統(tǒng)計圖的結構2.

統(tǒng)計圖的種類與繪制注意事項

1.統(tǒng)計圖的結構統(tǒng)計圖由以下幾個部分組成:①標題、②標目、③點線條面、④刻度、⑤圖例

1、標題其作用及要求與統(tǒng)計表的標題相同,但位置是在圖的下方。若同一篇論文中有兩個以上統(tǒng)計圖時,則標題前應有序號。2、標目分為縱標目與橫標目,分別表示縱軸與橫軸數(shù)字刻度的意義,一般有度量衡單位。按中文排版習慣,縱標目由上而下,橫標目由左向右。如果橫軸的分組標志十分明確,也可省略橫標目。3、點線條面4、刻度指在縱軸或橫軸上的坐標。按從小到大的順序,縱軸刻度數(shù)值由下向上排列,橫軸刻度數(shù)值從左到右排列。常用的刻度有算術尺度和對數(shù)尺度兩種。為了圖形美觀,圖形的長寬比例習慣上為7:5或5:7。5、圖例其目的是為了使讀者能區(qū)分統(tǒng)計圖中各種圖形的意義。圖例通常在橫標目與標題之間,如果圖中有較多空間(如線圖),也可放在圖中。2.統(tǒng)計圖的種類與繪制注意事項

⑴條圖⑵圓圖⑶百分條圖⑷線圖⑸直方圖⑹散點圖⑺統(tǒng)計地圖⑻箱圖⑼莖葉圖⑽雷達圖⑾氣泡圖(1)條圖條圖:用直條的長度表示相互獨立的統(tǒng)計指標的大小,可分為:①單式條圖:具有一個統(tǒng)計指標,一個分組標志。②復式條圖:具有一個統(tǒng)計指標,兩個分組因素。③分段條圖

④誤差條圖表2-172000年三大城市四苗接種率(%)地區(qū)接種率(%)卡介苗脊灰炎苗百白破苗麻疹疫苗甲99.7299.2099.2499.12乙93.5098.2098.7098.20丙99.5093.9098.7098.20圖2-172000年三大城市四苗接種率(%)分段條圖:具有兩個統(tǒng)計指標,一個分組因素,且兩個統(tǒng)計指標必須有隸屬關系。如左圖。誤差條圖:用條圖或線圖表示均數(shù)的基礎上,在圖中附上標準差的范圍。如右圖。

圖2-27四種營養(yǎng)素喂養(yǎng)小白鼠三周后所增體重(克)圖2-26老、中、青三代的結核菌素陽性率與強陽性率(%)繪制條圖注意事項

⑴縱軸的刻度必須從“0”開始,否則會改變各對比組間的比例關系。(2)橫軸各直條一般按統(tǒng)計指標由大到小排列,也可按事物本身的自然順序排列。(3)各直條的寬度要一致,各直條應有相等的間隔,其寬度一般與直條的寬度相等或為直條寬度的一半。

(2)圓圖

圓圖:用于表達事物內(nèi)部的百分構成比大小。各個扇形面積(3.6°)的大小反映了各組成部分百分比(1%)的大小。從12點鐘處開始繪制,順時針方向排列。

2002年某醫(yī)院1402例孕婦分娩結果分娩結果例數(shù)構成比(%)過期產(chǎn)211死產(chǎn)211早產(chǎn)21215足月114883總計1402100(3)百分條圖百分條圖的作用與圓圖相同。但更適用于多組百分比的比較。020406080100呼吸系統(tǒng)病腦血管病惡性腫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論