版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第 2章 數(shù)據(jù)的搜集和整理,2.1 數(shù)據(jù)的搜集 2.2 數(shù)據(jù)的整理 2.3 數(shù)據(jù)的描述 2.4 SPSS在描述統(tǒng)計中應(yīng)用-數(shù)據(jù)分布圖示 本章小結(jié),學(xué)習目標,了解統(tǒng)計數(shù)據(jù)的計量尺度和類型 掌握數(shù)據(jù)搜集的方式和方法 了解數(shù)據(jù)整理的意義 掌握次數(shù)分布數(shù)列的編制 掌握統(tǒng)計表和統(tǒng)計圖的使用,2.1.1 數(shù)據(jù) 2.1.2 數(shù)據(jù)搜集概述 2.1.3 統(tǒng)計調(diào)查方案設(shè)計 2.1.4 數(shù)據(jù)搜集組織方式 2.1.5 數(shù)據(jù)搜集基本方法,2.1 數(shù)據(jù)的搜集,2.1.1 數(shù)據(jù),一、數(shù)據(jù)的計量尺度 1、定類尺度:按照客觀現(xiàn)象的某種屬性對其進行平行的分類,不反映各類的優(yōu)劣、量的大小或順序。 2、定序尺度:對客觀現(xiàn)象各類之間的
2、等級差或順序差測度。 3、定距尺度:對現(xiàn)象類別或次序之間間距的測度 4、定比尺度:將兩種相關(guān)的數(shù)加以對比而形成相對數(shù)。,2.1.1數(shù)據(jù),二、數(shù)據(jù)的類型 1、靜態(tài)數(shù)據(jù):又稱為橫截面數(shù)據(jù),指在同一時間在不同單位的數(shù)量表現(xiàn)。 2、動態(tài)數(shù)據(jù):又稱為時間序列數(shù)據(jù),指不同時間對同一總體的數(shù)量表現(xiàn)。 3、平行數(shù)據(jù):動態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)結(jié)合,2.1.1數(shù)據(jù),三、數(shù)據(jù)的表現(xiàn)形式 絕對數(shù)、相對數(shù)、平均數(shù) 1、絕對數(shù):反映現(xiàn)象的規(guī)模、水平。 計量單位,物理單位,價值單位,實物單位,自然單位,標準實物單位,2.1.1數(shù)據(jù),某一特定時點所處的狀態(tài),它是采用間斷登記方式取得資料的,不具有可加性,時點數(shù),時期數(shù),反映現(xiàn)象在一
3、段期間內(nèi)發(fā)展過程的總量,它具有連續(xù)統(tǒng)計和可加性,絕對數(shù),2.1.1數(shù)據(jù),2、相對數(shù):是由兩個絕對數(shù)對比而得到的。 相對數(shù)分類:結(jié)構(gòu)相對數(shù)(例如某地區(qū)三大產(chǎn)業(yè)比重)、動態(tài)相對數(shù)(例如某地區(qū)的國內(nèi)生產(chǎn)總值的發(fā)展速度)、比較相對數(shù)(例如A地區(qū)的人均國內(nèi)生產(chǎn)總值是B類地區(qū)的倍數(shù))、比例相對數(shù)(例如新生兒男女性別比)、強度相對數(shù)(例如某地區(qū)人口密度)、計劃完成相對數(shù)(例如企業(yè)產(chǎn)量計劃完成程度),2.1.1 數(shù)據(jù),相對數(shù)計量:無名數(shù)和有名數(shù) 無名數(shù):百分數(shù)、千分數(shù)、倍數(shù)、系數(shù)等 有名數(shù):復(fù)合計量,如人口密度。,2.1.1 數(shù)據(jù),3、平均數(shù):反映現(xiàn)象總體的一般水平或分布的集中趨勢 。,2.1.2 數(shù)據(jù)搜集概
4、述,統(tǒng)計數(shù)據(jù)的來源:直接獲取數(shù)據(jù)和間接獲取數(shù)據(jù) 1、直接數(shù)據(jù):,統(tǒng)計調(diào)查,科學(xué)實驗,2.1.2數(shù)據(jù)搜集概述,2、間接取得的數(shù)據(jù) 統(tǒng)計部門和政府部門公布的有關(guān)資料,如各類統(tǒng)計年鑒 各類經(jīng)濟信息中心、信息咨詢機構(gòu)、專業(yè)調(diào)查機構(gòu)等提供的數(shù)據(jù) 各類專業(yè)期刊、報紙、書籍所提供的資料 各種會議,如博覽會、展銷會、交易會及專業(yè)性、學(xué)術(shù)性研討會上交流的有關(guān)資料 從互聯(lián)網(wǎng)或圖書館查閱到的相關(guān)資料,2.1.3 統(tǒng)計調(diào)查方案設(shè)計,一個完整的統(tǒng)計調(diào)查方案主要包括以下幾項內(nèi)容: (1)確定調(diào)查目的 (2)確定調(diào)查對象和調(diào)查單位 (3)設(shè)計調(diào)查項目和調(diào)查表 (調(diào)查表一般有兩種 形式,一種是一覽表,另一種是單一表 ) (4
5、)確定調(diào)查時間 (5)調(diào)查方法的選擇 (6)統(tǒng)計調(diào)查的組織實施,2.1.4 數(shù)據(jù)搜集組織方式,按調(diào)查范圍分:全面調(diào)查與非全面調(diào)查 全面調(diào)查:調(diào)查總體中的每個單位。 非全面調(diào)查:調(diào)查總體中的一部分。,普查 (census),1. 為特定目的專門組織的非經(jīng)常性全面調(diào)查 2.通常是一次性或周期性的 3.一般需要規(guī)定統(tǒng)一的標準調(diào)查時間 4.數(shù)據(jù)的規(guī)范化程度較高 5.應(yīng)用范圍比較狹窄,抽樣調(diào)查(sampling survey),1.從總體中隨機抽取一部分單位作為樣本進行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來推斷總體特征的數(shù)據(jù)收集方法,2. 具有經(jīng)濟性、時 效性強、適應(yīng)面廣、準確性高等特點,重點調(diào)查,1、只選擇少數(shù)重
6、點單位進行調(diào)查。 2、重點單位:這些單位在全部單位中只占較少比重,但它們的標志值在所研究現(xiàn)象的標志總量中都占有較大的比重,在總體中具有舉足輕重的作用。 3 通常,當調(diào)查目的只要求掌握總體的基本情況,而少數(shù)單位又能比較集中地反映研究的項目,宜采用重點調(diào)查。,典型調(diào)查,1、根據(jù)調(diào)查目的,在對全部研究對象進行初步分析的基礎(chǔ)上,選擇一個或幾個具有代表性的單位進行詳細深入的調(diào)查。 2、重點調(diào)查和典型調(diào)查都是有針對性地在總體中選擇少數(shù)調(diào)查單位,具有一定的主觀性,不具備隨機抽取調(diào)查單位的特點,因而其調(diào)查結(jié)果難以用于推斷總體。,統(tǒng)計報表,它是依照國家有關(guān)法規(guī),自上而下地統(tǒng)一布置,以一定的原始記錄為依據(jù),按照統(tǒng)
7、一的表式、統(tǒng)一的指標項目、統(tǒng)一的報送時間和報送程序,自下而上地逐級地定期提供統(tǒng)計資料的調(diào)查方式。,2.1.5 數(shù)據(jù)搜集方法,(1)直接觀察法:調(diào)查人員到現(xiàn)場親自對調(diào)查單位進行觀察或計量 (2)訪問法:調(diào)查人員以調(diào)查表或有關(guān)材料為依據(jù),逐項向調(diào)查者詢問 (3)報告法 :按照統(tǒng)一的表格及填報要求 (4)問卷法:以問卷形式提問,由被調(diào)查者自愿回答,2.2.1 統(tǒng)計數(shù)據(jù)的分組 2.2.2 頻數(shù)分布數(shù)列,2.2 數(shù)據(jù)的整理,2.2.1統(tǒng)計數(shù)據(jù)分組,1、分組概念:統(tǒng)計分組是根據(jù)統(tǒng)計研究目的,按某一標志將數(shù)據(jù)分別列入不同的組,使組與組之間有比較明顯的差別,而在同一組內(nèi)的單位具有相對的同質(zhì)性,即同一組內(nèi)各單位
8、之間具有某些共同的特征。 2、分組標志選擇:按品質(zhì)標志分組和按數(shù)量標志分組,2.2.2 頻數(shù)分布數(shù)列,1、分布數(shù)列概念:指在統(tǒng)計分組的基礎(chǔ)上,將總體的所有單位按一定標志分組整理,并按一定順序排列,形成總體單位在各組的分布 。 2、分布數(shù)列兩要素:一是組;二是單位數(shù)(次數(shù)或頻數(shù) ) 3、分布數(shù)列類型:品質(zhì)數(shù)列 和變量數(shù)列,變量數(shù)列,1、變量數(shù)列可以分為單項式和組距式數(shù)列 。 單項式變量數(shù)列。它是指變量數(shù)列中的每個組只用一個變量值表示。通常變量值較少的離散型變量適用于編制單項數(shù)列。 組距式變量數(shù)列。它是指變量數(shù)列的每個組用一定范圍或距離的兩個變量值表示 。 通常變量值較多的離散型變量和連續(xù)型變量適
9、用于編制組距數(shù)列,組距分組 (要點),將變量值的一個區(qū)間作為一組 適合于連續(xù)變量或離散變量 適合于變量值較多的情況 需要遵循“不重不漏”的原則 可采用等距分組,也可采用不等距分組,組距分組(步驟),確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。 確定組距:組距(class width)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即 組距( 最大值 - 最小值) 組數(shù) 統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表,組距分組(幾個概念),1. 下限(low limit) :一個組的最小值 2. 上限(upper limit) :一個組的最大值 3. 組距(cla
10、ss width) :上限與下限之差 4. 組中值(class midpoint) :下限與上限之間的中點值,組距數(shù)列編制例題,【例2.1】某部門有30名職工的月工資如下(單位:百元) 50,55,58,60,61,65,67,70,72,74,75,78,79,80,81,82,85,85,87,88,89,90,91,92,95,96,98,100,108,109,次數(shù)分布表,2.3 數(shù)據(jù)的描述,2.3.1 統(tǒng)計表 2.3.2 統(tǒng)計圖,2.3.1 統(tǒng)計表,1、統(tǒng)計表:統(tǒng)計數(shù)據(jù)的表格化。 2、統(tǒng)計表的形式:由總標題、橫行標題、縱欄標題、統(tǒng)計數(shù)據(jù)所組成。 3、統(tǒng)計表內(nèi)容:由主詞和賓詞兩部分組成
11、。 4、統(tǒng)計表的設(shè)計:統(tǒng)計表上下兩端可以用較粗線繪制,稱為上基線和下基線,其他線一般用細直線。統(tǒng)計表左右兩端不封口。,2.3.1 統(tǒng)計表,2.3.2 統(tǒng)計圖,1、直方圖 2、折線圖 3、曲線圖,直方圖(histogram),用矩形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用矩形的面積來表示各組的頻數(shù)分布 在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖,分組數(shù)據(jù)的圖示(直方圖的繪制),我一眼就看出來了,工資在8090之間的人數(shù)最多!,折線圖(frequency polygon),折線圖也稱頻數(shù)多邊形圖 是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中
12、值)用直線連接起來,再把原來的直方圖抹掉 折線圖的兩個終點要與橫軸相交,具體的做法是 第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸 折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的,分組數(shù)據(jù)的圖示(折線圖的繪制),折線圖與直方圖 下的面積相等!,曲線圖類型,幾種常見的頻數(shù)分布,莖葉圖(stem-and-leaf display),用于顯示未分組的原始數(shù)據(jù)的分布 由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的 以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉 樹葉上只保留一位數(shù)字 莖葉圖類似于橫置的直方圖,但又有區(qū)
13、別 直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值 莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息,莖葉圖(例題分析),箱線圖(box plot),用于顯示未分組的原始數(shù)據(jù)的分布 箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成 箱線圖的繪制方法 首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU) 連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接,分布的形狀與箱線圖,不同分布的箱線圖,洛倫茨曲線,20世紀初美國經(jīng)濟學(xué)家、統(tǒng)計學(xué)家洛倫茨(M.E. Lorentz)根據(jù)意大利經(jīng)濟學(xué)家巴
14、雷特(V. Pareto)提出的收入分配公式繪制而成 描述收入和財富分配性質(zhì) 的曲線分析該國家或地區(qū),累積的人口百分比,累積的收入百分比,絕對公平線,基尼系數(shù),20世紀初意大利經(jīng)濟學(xué)家基尼(G. Gini)根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標 A表示實際收入曲線與絕對平均線之間的面積 B表示實際收入曲線與絕對不平均線之間的面積 如果A=0,則基尼系數(shù)=0,表示收入絕對平均 如果B=0,則基尼系數(shù)=1,表示收入絕對不平均 基尼系數(shù)在0 和1之間取值 一般認為,基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在0.2至0.4之間是比較適當?shù)?,即一個社會既有效率又沒有造成極大的分配不公;基尼系數(shù)
15、在0.4被認為是收入分配不公平的警戒線,超過了0.4應(yīng)該采取措施縮小這一差距。,中國的基尼系數(shù),改革開放以來,我國在經(jīng)濟增長的同時,貧富差距逐步拉大,綜合各類居民收入來看,基尼系數(shù)越過警戒線已是不爭的事實。來自國家統(tǒng)計局的數(shù)據(jù)顯示,自2000年開始,我國的基尼系數(shù)已越過0.4的警戒線,并逐年上升。1978年我國基尼系數(shù)為0.317,2006年則升至0.496。,22個亞洲國家貧富差距基尼系數(shù)中國排第一2009-01-26,貧富差距排名 國家 最高20%人口收入/最低20%人口收入 基尼系數(shù) 中國 11.37倍 0.4725 尼泊爾 9.47倍 0.4730 菲律賓 9.11倍 0.4397 土
16、庫曼斯坦 8.33倍 0.4302 泰國 7.72倍 0.4196 馬來西亞 7.7倍 0.4033 柬埔寨 7.04倍 0.3805 斯里蘭卡 6.83倍 0.4018 越南 6.24倍 0.3708 臺灣 6.05倍 0.3385 阿塞拜疆 5.95倍 0.3650 哈薩克斯坦 5.61倍 0.3383 印度 5.52倍 0.3622 印度尼西亞 5.52倍 0.3430 韓國 5.47倍 0.3155 蒙古 5.44倍 0.3284 老撾 5.4倍 0.3463 塔吉克斯坦 5.14倍 0.3263 亞美尼亞 5.08倍 0.338 文萊 5.03倍 0.3408 巴基斯坦 4.46倍
17、0.3118,使用Excel頻數(shù)函數(shù) (FREQUENCY),Excel的“直方圖”工具的缺陷是:頻數(shù)分布和直方圖沒有與數(shù)據(jù)聯(lián)系起來,這樣,如果你改變?nèi)魏我粋€數(shù)據(jù),頻數(shù)分布表和直方圖不會跟著改變 使用Excel中的統(tǒng)計函數(shù)“FREQUENCY”來創(chuàng)建頻數(shù)分布表和直方圖,可解決這一問題。創(chuàng)建頻數(shù)分布表的步驟是 選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域 選擇統(tǒng)計函數(shù)中的“FREQUENCY”函數(shù) 在對話框Date-array后輸入數(shù)據(jù)區(qū)域,在Bins-array后輸入接受區(qū)域 同時按下ctrl-shift-Enter組合鍵,即得到頻數(shù)分布,統(tǒng)計函數(shù)FREQUENCY,2.4 SP
18、SS 在描述統(tǒng)計中應(yīng)用-數(shù)據(jù)分布圖示,2.4.1莖葉圖和箱線圖的繪制,1.在主菜單中選擇“Analyze”,在下拉菜單中選擇“Descriptive Statistics”,選擇“Explore”,如圖2.8所示。 2.點擊Explore,進入對話框,將變量(工資)選入“Dependent List”,在“Display”下選擇“Plots”;點擊右側(cè)的Plots,在圖形對話框中選擇“Stem-and-leaf”,如圖2.9所示。,2.4.1莖葉圖和箱線圖的繪制,2.4.1莖葉圖和箱線圖的繪制,2.4.1莖葉圖和箱線圖的繪制,2.4.2 直方圖的繪制,1.在主菜單中選擇“Transform”“RecodeintoDifferentVariables”進入主對話框。 2.選擇變量,將變量(工資)移入“NumericVariableOutputVariable”,在“Nane”中輸入存放分組結(jié)果的新變量名(如工資分組),點擊Change確認,點擊OldandNewvalues進入下一對話框。 3.在OldandNewvalues對話框中定義各組組限。在“
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025山西長治市第三人民醫(yī)院第二次招聘聘用制工作人員6人考試歷年真題匯編附答案
- 2025年上半年黑龍江工業(yè)學(xué)院博士(思政類)招聘5人(公共基礎(chǔ)知識)綜合能力測試題附答案
- 2026新余燃氣有限公司工作人員招聘1人筆試備考題庫及答案解析
- 2026云南佰勝企業(yè)管理有限公司招聘筆試備考試題及答案解析
- 醫(yī)療扶貧項目年終義診總結(jié)【演示文檔課件】
- 2025秋人教版道德與法治八年級上冊5.1文明有禮同步練習
- 2026年保山市昌寧縣機關(guān)事務(wù)管理局招聘編外工作人員(1人)筆試參考題庫及答案解析
- 2026西北工業(yè)大學(xué)動力與能源學(xué)院爆震燃燒團隊非事業(yè)編人員招聘1人(陜西)筆試參考題庫及答案解析
- (能力提升)2025-2026學(xué)年下學(xué)期人教統(tǒng)編版小學(xué)語文四年級第七單元練習卷
- 2026遼寧省精神衛(wèi)生中心招聘高層次和急需緊缺人才7人筆試備考題庫及答案解析
- UL1995標準中文版-2018加熱和冷卻設(shè)備UL中文版標準
- 2024至2030年中國家用燃氣具數(shù)據(jù)監(jiān)測研究報告
- 2024版租房合同協(xié)議書下載
- 寶寶喂養(yǎng)記錄表
- 《保健食品標識培訓(xùn)》課件
- 2023年非標自動化機械設(shè)計工程師年度總結(jié)及來年計劃
- 丹鹿通督片治療腰椎疾病所致腰椎狹窄128例
- 股骨頸骨折圍手術(shù)期護理
- 高空作業(yè)車使用說明書
- 保安公司介紹PPT模板
- 醫(yī)療質(zhì)量與安全管理小組活動記錄
評論
0/150
提交評論