版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第3章 統(tǒng)計數(shù)據的整理與顯示,PowerPoint,主要內容,一、統(tǒng)計數(shù)據的整理 二、統(tǒng)計數(shù)據的顯示 三、EXCEL在數(shù)據整理與顯示中的應用,學習目標,1了解統(tǒng)計數(shù)據整理的概念及步驟; 2 掌握統(tǒng)計分組的方法; 3. 熟悉頻數(shù)分布的概念、構成與類型; 4. 運用EXCEL整理與顯示數(shù)據。,通過統(tǒng)計調查可以搜集到大量的統(tǒng)計資料,但是這些資料只是反映總體單位具體情況的分散的、不系統(tǒng)的資料,不能用以反映總體的特征。,統(tǒng)計整理,將統(tǒng)計調查得到的原始資料進行科學的分類和匯總,使之成為系統(tǒng)化、條理化的綜合資料,以反映研究總體特征的過程。,是統(tǒng)計調查的繼續(xù),統(tǒng)計分析的前提和基礎,起著承前啟后的作用。,地位,
2、一、統(tǒng)計數(shù)據的整理,數(shù)據的預處理,數(shù)據的分組,數(shù)據的匯總,分布數(shù)列(頻數(shù)分布),統(tǒng)計數(shù)據整理的一般程序,(一)數(shù)據的預處理,數(shù)據的審核 檢查數(shù)據中的錯誤 數(shù)據的排序 升序和降序 尋找數(shù)據的基本特征 數(shù)據的篩選 找出符合條件的數(shù)據,完整性與及時性審核 檢查應調查的單位或個體是否有遺漏 所有的調查項目或指標是否填寫齊全 檢查填報單位是否按時報送了有關數(shù)據 準確性審核 檢查數(shù)據是否真實反映客觀實際情況,內容是否符合實際 檢查數(shù)據是否有錯誤,計算是否正確等,數(shù)據的審核,審核數(shù)據準確性的常用方法 邏輯檢查 從定性角度,審核數(shù)據是否符合邏輯,內容是否合理,各項目或數(shù)字之間有無相互矛盾的現(xiàn)象 主要用于對分類
3、和順序數(shù)據的審核 計算檢查 檢查調查表中的各項數(shù)據在計算結果和計算方法上有無錯誤 主要用于對數(shù)值型數(shù)據的審核,按一定順序將數(shù)據排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索 排序有助于對數(shù)據檢查糾錯,以及為重新歸類或分組等提供依據 在某些場合,排序本身就是分析的目的之一 排序可借助于計算機完成,數(shù)據的排序,分類數(shù)據的排序 字母型數(shù)據,排序有升序降序之分,但習慣上用升序 漢字型數(shù)據,可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分 數(shù)值型數(shù)據的排序 遞增排序:設一組數(shù)據為x1,x2,xn,遞增排序后可表示為:x(1)x(2)x(n),數(shù)據的篩選,將某些不符合要求的
4、數(shù)據或有明顯錯誤的數(shù)據予以剔除 將符合某種特定條件的數(shù)據篩選出來 Excel的篩選功能有兩種,即自動篩選和高級篩選。,用Excel進行數(shù)據篩選,8名學生的考試成績數(shù)據,(二)統(tǒng)計分組,指根據事物的內在特點和統(tǒng)計研究的目的,按一定的標志將統(tǒng)計總體區(qū)分為若干性質不同的組成部分的統(tǒng)計研究方法,對總體而言,是“分”,即將總體區(qū)分為性質相異的若干部分。,對總體單位而言,是“合”,即將性質相同的個體組合起來,在同一組內則保持著相同的性質。,1.概念,分組前,分組后,25,33,42,(1)劃分現(xiàn)象的類型,例:如:國民經濟按產業(yè)分組農業(yè)分成農、林、牧、漁業(yè)各組;企業(yè)按所有制分組等。,2.作用,(2)揭示現(xiàn)象
5、的內部結構,(3)分析現(xiàn)象之間的依存關系,我國五次人口普查的人口年齡構成表 單位:%,中國農民家庭按收入分組的恩格爾系數(shù),3.原則,互斥性,窮盡性,指各組之間界限明確,總體中的每一個單位,都只應屬于其中的一個組。,指在一個分組方案中擬定的所有組,能夠包容總體的全部單位,不能排斥和遺漏任何一個單位。,4.種類,按分組標志不同,按每組變量值的取值范圍,按分組標志多少及排列方式,品質分組,數(shù)量分組,單項分組,組距分組,平行分組,復合分組,簡單分組,選擇反映事物屬性差異的標志進行的分組。亦即對非數(shù)值型數(shù)據進行分組,包括對分類數(shù)據的分組與對順序數(shù)據的分組。,選擇反映事物數(shù)量的差異的標志進行的分組。亦即對
6、數(shù)值型數(shù)據進行分組。,品質分組,數(shù)量分組,產品按等級可分為一等品、二等品、三等品等組,如飲料按品牌可分為百事可樂、可口可樂、芬達、雪碧、七喜等組,如人口按年齡分組:0-14歲,15-64歲,65歲以上。,單項分組,用一個變量值(數(shù)據)作為一組,適用于分類數(shù)據、順序數(shù)據以及對變動范圍不大、不同變量值個數(shù)不多的離散型數(shù)據進行分組。,如家庭按子女人數(shù)分組:0,1,2,3, 4,。,組距分組,將變量值的一個區(qū)間作為一組,只適用于數(shù)值型數(shù)據。一般用來對連續(xù)型數(shù)據或變動范圍較大、不同變量值個數(shù)較多的離散型數(shù)據進行分組。,如某班學生某學科成績分組:60分以下,6070分,7080分,8090分,90分以上。
7、,組限,上限,下限,每個組的最大值,每個組的最小值,組距,每一組的區(qū)間長度,組距=上限-下限,組中值,每一組中點位置的數(shù)值,組中值=(上限+下限)2,開口組,缺少上限數(shù)值或下限數(shù)值的組,注意,開口組以相鄰組的組距作為該組的組距,確定其下限或上限,再計算組中值。,組距分組中的一些概念,等距分組,異距分組,各組組距相等的分組稱為等距分組。,各組組距不全相等的分組稱為異距分組。,如某班學生某學科成績分組:60分以下,6070分,7080分,8090分,90分以上。,如人口按年齡分組:0-15歲,15-60歲,60歲以上。,進行組距分組需要注意的問題,要處理好組數(shù)與組距問題,組數(shù)的確定主要憑經驗;也可
8、按不同的組數(shù)進行試驗,比較其次數(shù)分布,看哪一個能夠更好地顯示出分組數(shù)據的特征;還可以根據美國學者斯特杰斯(Sturges)創(chuàng)立的經驗公式k=1+3.3lgN(N為總體單位數(shù))來確定。,組數(shù)一旦確定,組距就可以根據全距來確定。組距=全距/組數(shù),宜采用5或10的倍數(shù),對某組數(shù)值型數(shù)據是進行等距分組還是異距分組,這取決于變量值的分布狀況。,對于離散變量,相鄰組組限可以間斷,也可重疊; 對于連續(xù)變量,相鄰組組限必須重疊; 遵循“上限不在內”原則; 首末兩組可使用“以下”及“以上”的開口組。,第二、組限的表示,要處理好組限的問題,第一,最小組的下限應低于最小變量值,而最大組的上限應高于最大變量值;,某班
9、學生數(shù)學成績的分布情況,上組限U,下組限L,組距d=U-L =90-80=10(分),組中值x=(U+L)/2 =(80+90)/2 =85(分),組中值 x=L+d/2 =60-(70-60)/2 =55(分),上限不在內原則,簡單分組,復合分組,只按一個分組標志對所研究的總體進行分組。,按兩個或兩個以上的標志層疊排列對同一總體進行分組。,平行分組,按兩個或兩個以上的標志平行排列對同一總體進行分組。,對教師的分組,按性別分組,男性,女性,按職稱分組,高級,中級,初級,共計5組 2+3,平行分組,按性別分類,按職稱分類,男,女,高級,中級,初級,共計6組23,對教師的分類,復合分組,(三)數(shù)據
10、的匯總,數(shù)據匯總的組織形式,逐級匯總,集中匯總,綜合匯總,按照一定的統(tǒng)計管理體制,自下而上逐級匯總統(tǒng)計數(shù)據的一種組織形式。,將全部調查數(shù)據集中到組織統(tǒng)計調查的最高一級機關進行統(tǒng)一匯總的形式。,將上述兩種組織形式結合使用的匯總形式。,數(shù)據匯總的方法,手工匯總,電子計算機匯總,“條件計算函數(shù)”,“Frequency函數(shù)”, “分類匯總”,“直方圖工具”,“數(shù)據透視表”,數(shù)據匯總的方式,計數(shù)匯總,求和匯總,平均值匯總,(四)頻數(shù)分布,在統(tǒng)計分組基礎上,將總體所有單位按組歸并排列,形成總體中各個單位在各組間的分布,亦稱頻數(shù)分布數(shù)列。,各組變量值(可以是一組一個變量值、也可以是一定范圍的變量值),2.構
11、成要素,頻率,各組單位數(shù)占總體單位總數(shù)的比重,次數(shù),總體單位在各組中出現(xiàn)的次數(shù),亦稱頻數(shù),各組的次數(shù)或頻率,1.概念,累計次數(shù)(頻率),從變量值低的組開始,將各組次數(shù)(頻率)逐次向變量值高的組累計,說明某一組上限以下各組的累計次數(shù)(頻率)。,從變量值高的組開始,將各組次數(shù)(頻率)逐次向變量值低的組累計,說明某一組下限以上各組的累計次數(shù)(頻率)。,某班學生數(shù)學成績的分布情況,=13/50,數(shù)量數(shù)列-數(shù)值型數(shù)據的頻數(shù)分布,品質數(shù)列-分類數(shù)據、順序數(shù)據的頻數(shù)分布,3.種類,某超市某日出售的50瓶飲料品牌的頻數(shù)分布,分類數(shù)據的頻數(shù)分布,品質數(shù)列、單項數(shù)列,某省2009年部分城鎮(zhèn)居民收入高低的頻數(shù)分布,
12、順序數(shù)據的頻數(shù)分布,品質數(shù)列、單項數(shù)列,某車間50名職工的家庭人口分布,數(shù)值型數(shù)據的頻數(shù)分布,數(shù)量數(shù)列、單項數(shù)列,某班學生數(shù)學成績的分布情況,數(shù)值型數(shù)據的頻數(shù)分布,數(shù)量數(shù)列、組距數(shù)列,鐘型分布,型分布,型分布,4.分布類型,二、統(tǒng)計數(shù)據的顯示,作用,1、使統(tǒng)計數(shù)據系統(tǒng)化、條理化、生動化,便于資料的積累和比較分析。,2、清晰地顯示現(xiàn)象的活動過程和現(xiàn)象之間的復雜關系,給人一種一目了然的印象。,總標題,數(shù)字資料,橫行標題,縱欄標題,是統(tǒng)計表表的名稱,放在表格的正上方,是橫行的名稱,通常用來表示各組的名稱,一般放在表格的左邊,是縱欄的名稱,通常為統(tǒng)計指標的名稱 ,一般放在表格的右上方,即指標數(shù)值,排列
13、在各橫行標題與縱欄標題的交叉處,從形式看,(一)統(tǒng)計表,1.統(tǒng)計表的概念與結構,統(tǒng)計表可分為廣義統(tǒng)計表和狹義統(tǒng)計表兩種。人們通常所說的統(tǒng)計表是反映頻數(shù)分布的表格。,主詞,賓詞,統(tǒng)計表所要說明的總體及其組成部分,說明總體及總體各組數(shù)量特征而采用的統(tǒng)計指標,從內容看,2.統(tǒng)計表的種類,常見的統(tǒng)計表主要有以下幾種:,顯示未分組數(shù)據的統(tǒng)計表,顯示分組數(shù)據的統(tǒng)計表,簡單表,簡單分組表,平行分組表,復合分組表,簡單表,顯示未分組數(shù)據的統(tǒng)計表,某地區(qū)2002年鐵礦計劃完成情況,簡單分組表,對總體進行簡單分組的統(tǒng)計表,某地區(qū)2002年各類型企業(yè)總產值表,平行分組表,對總體選擇二個或二個以上標志進行平行分組的統(tǒng)
14、計表。,2009年末某地區(qū)人口統(tǒng)計表,復合分組表,對總體進行復合分組的統(tǒng)計表,2009年末某地區(qū)人口統(tǒng)計表,城鄉(xiāng),性別,2009年末某地區(qū)人口統(tǒng)計表 單位:萬人,(1)總標題內容應滿足3W 要求 (2)合理安排統(tǒng)計表的結構 (3)表中的上下兩條橫線一般用粗線,其他線用細線,通常情況下,統(tǒng)計表的左右兩邊不封口 (4)統(tǒng)計表各縱列若須合計時,一般應將合計列在最后一行,各橫行若須要合計時,可將合計列在最前一欄或最后一欄 (5)數(shù)據計量單位相同時,可放在表的右上角,不同時應放在每個指標后或單列出計量單位欄 (6)表中的數(shù)據一般是右對齊,有小數(shù)點時應以小數(shù)點對齊,而且小數(shù)點的位數(shù)應統(tǒng)一 (7)對于沒有數(shù)
15、字的表格單元,一般用“”表示 (8)必要時可在表的下方加上注釋,3.統(tǒng)計表的設計,(二)統(tǒng)計圖,1.統(tǒng)計圖的概念和結構,統(tǒng)計圖是以圖形形象地表現(xiàn)統(tǒng)計數(shù)據的一種形式。 統(tǒng)計圖一般包括以下幾部分: 標題,一般包括圖表標題、數(shù)值軸(X、Y)標題; 坐標軸和網格線; 圖表區(qū)和繪圖區(qū); 圖例,圖例用來標明圖表中的數(shù)據系列。,2.統(tǒng)計圖的種類,顯示分組數(shù)據的統(tǒng)計圖,顯示未分組數(shù)據的統(tǒng)計圖,箱線圖,莖葉圖,環(huán)形圖,餅 圖,直方圖,條形圖,折線圖,用寬度相同的條形的高度或長短來表示數(shù)據多少的圖形 有單式條形圖、復式條形圖等形式 主要用于反映分類數(shù)據的頻數(shù)分布 繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在
16、橫軸,稱為柱形圖,條形圖,用長方形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用長方形的面積來表示各組的頻率分布 在直角坐標中,用橫軸表示數(shù)據分組,即各組組限,縱軸表示頻數(shù)或頻率,各組組距與相應的頻數(shù)就形成了一個個豎立長方形 直方圖下的總面積等于1 只能用于顯示數(shù)值型數(shù)據的頻數(shù)分布 如果是異距數(shù)列,則通常按頻數(shù)密度(頻數(shù)密度=頻數(shù)組距)繪制直方圖,直方圖,條形圖是用條形的長度表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的 直方圖是用長方形的高度表示每一組的頻數(shù)或頻率,寬度則表示各組的組距,其高度與寬度均有意義 直方圖中的長方形通常是連續(xù)排列,條形圖則是分開排列 條形圖主要用于展示分類數(shù)據,直
17、方圖則主要用于展示數(shù)值型數(shù)據,直方圖與條形圖的區(qū)別:,折線圖也稱頻數(shù)多邊形圖 是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉 也可以根據各組組中值與頻數(shù)求出各組的坐標點,并用折線連接各點而成 折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的,折線圖,折線圖可以用來表示累計頻數(shù)或累計頻率分布,但累計頻數(shù)分布圖的畫法和頻數(shù)分布折線圖畫法有所不同。,在社會經濟統(tǒng)計中,折線圖主要用于顯示時序數(shù)據,反映現(xiàn)象的動態(tài)變化。,中國歷年GDP的折線圖,也稱圓形圖,是用圓形及圓內扇形的角度來表示數(shù)值大小的圖形 主要用于表示總體或樣本中各組成部分所占的比例,
18、對于研究結構性問題十分有用 繪制圓形圖時,總體中各部分所占的百分比用園內的各個扇形角度表示,這些扇形的中心角度,是按各部分數(shù)據百分比占3600的相應比例確定的 餅圖適用于任何分組數(shù)據,但更多地應用于分類數(shù)據和順序數(shù)據。,餅圖,環(huán)形圖中間有一個“空洞”,總體中的每一部分數(shù)據是用環(huán)中的一段來表示 環(huán)形圖與圓形圖類似,但又有區(qū)別 圓形圖只能顯示一個總體各部分所占的比例 環(huán)形圖則可以同時繪制多個總體的數(shù)據系列,每一個總體的數(shù)據系列為一個環(huán) 環(huán)形圖可用于結構比較研究 環(huán)形圖主要用于展示分類和順序數(shù)據,環(huán)形圖,用于顯示未分組的原始數(shù)據的分布 箱線圖由一組數(shù)據的5個特征值繪制而成,它由一個箱子和兩條線段組成
19、 其繪制方法是: 首先找出一組數(shù)據的5個特征值,即最大值、最小值、中位數(shù)Me 和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU) 連接兩個四分位數(shù)畫出箱子,再將兩個極值點與箱子相連接,箱線圖,4,6,8,10,12,簡單箱線圖,中位數(shù),X最小值,X最大值,不同分布的箱線圖,分布的形狀與箱線圖,某市10個學校中考成績的箱線圖,莖葉圖,用于顯示未分組的原始數(shù)據的分布 由“莖”和“葉”兩部分構成,其圖形是由數(shù)字組成的 以該組數(shù)據的高位數(shù)值作樹莖,低位數(shù)字作樹葉 樹葉上只保留一位數(shù)字 適用于小批量數(shù)據 6. 莖葉圖類似于橫置的直方圖,但又有區(qū)別 直方圖可觀察一組數(shù)據的分布狀況,但沒有給出具體的數(shù)值 莖葉
20、圖既能給出數(shù)據的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據的信息,某電腦公司120天日銷售量分布情況,某班學生數(shù)學考試成績分布情況,明確制圖目的,根據統(tǒng)計數(shù)據的性質和特點,突出重點,選擇合適的統(tǒng)計圖形 統(tǒng)計圖的設計和繪制要保持嚴格的科學性與藝術性,簡明扼要,通俗易懂,圖形布局合理 統(tǒng)計圖的坐標與尺度應科學合理,3. 繪制統(tǒng)計圖應注意的事項,三、Excel在數(shù)據整理與顯示中的應用,某公司在職員工檔案,要求:試利用Excel整理并顯示表中的數(shù)據。,(一)數(shù)據整理前的預處理,1.把待整理數(shù)據輸入Excel數(shù)據表中,2.對數(shù)據進行排序,升序,降序,3.對數(shù)據進行篩選,第1步,點擊數(shù)據清單的任一單
21、元格,選擇“數(shù)據”菜單下的“篩選”命令。如果要篩選出給定條件的數(shù)據,可使用“自動篩選”命令,第2步,在下拉菜單方框內選擇要篩選出的數(shù)據,比如要篩選出學歷是碩士的員工,點擊“碩士”,得到如下結果,要想得到符合多個條件的員工數(shù)據,則需要使用“高級篩選”命令。,(二)數(shù)據的整理與顯示,1.品質數(shù)據的整理與顯示“分類匯總”,第1步,必須對要進行分類匯總的變量列(部門)數(shù)據進行排序。,第2步,選擇“數(shù)據”菜單中“分類匯總”,打開“分類匯總”的對話框,選擇“部門”變量為分類字段,選擇“計數(shù)”為匯總方式,在選定匯總項選擇“姓名”。,第3步:單擊“確定”按鈕,可得如下結果,第4步: 單擊分級顯示符號,,,和,可創(chuàng)建匯總報表。這樣可以隱藏明細數(shù)據而只顯示匯總結果。,將前面的匯總結果稍加修飾就可以得到該公司按部門分組的頻數(shù)分布,如下表。,按同樣的方法可以得到反映該公司員工婚姻狀況以及學歷的頻數(shù)分布。,為了能直觀的顯示數(shù)據,可以將統(tǒng)計表中的數(shù)據用統(tǒng)計圖展示出來,2.數(shù)值型數(shù)據的整理與顯示“直方圖”,“直方圖”工具用于在給定工作表中數(shù)據單元格區(qū)域和接收區(qū)間的情況下,計算數(shù)據的個數(shù)和累積頻率。,第1步,用鼠標點擊Excel數(shù)據清單中待整理數(shù)據(工資)所在列的任意單元格,再單擊工具欄中的“升序排序”,第2步,觀察“工資”數(shù)據的分布特征,將工資數(shù)據分為若干組,并將每組的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年及未來5年市場數(shù)據中國建筑石材行業(yè)發(fā)展前景預測及投資方向研究報告
- 2026年及未來5年市場數(shù)據中國電動轉椅行業(yè)發(fā)展前景預測及投資規(guī)劃建議報告
- 2026年及未來5年市場數(shù)據中國玉米育種行業(yè)發(fā)展運行現(xiàn)狀及投資潛力預測報告
- 2026年及未來5年市場數(shù)據中國產業(yè)融合行業(yè)市場發(fā)展數(shù)據監(jiān)測及投資方向研究報告
- 吊籃操作培訓課件
- 2026北京中考:歷史重點基礎知識點
- 合肥英文介紹
- 農業(yè)執(zhí)法考試題及答案
- 2026年白山市事業(yè)單位公開招聘高級人才(1號)備考考試試題及答案解析
- 2026江蘇南通市啟東市王鮑鎮(zhèn)綜合行政執(zhí)法輔助人員招聘7人備考考試題庫及答案解析
- 幼兒園大班社會課件:《我是中國娃》
- 重慶市萬州區(qū)2023-2024學年七年級上學期期末數(shù)學試卷+
- 冰雕雪雕工程投標方案(技術標)
- 內科質控會議管理制度
- 鄭州電力高等??茊握新毮軠y試題
- 竣工圖編制說明-7
- 魯奇加壓氣化爐的開、停車操作課件
- 美國怡口全屋水處置介紹
- 常用實驗室檢查血常規(guī)演示文稿
- 生命第一:員工安全意識手冊
- cimatron紫藤教程系列gpp2運行邏輯及block說明
評論
0/150
提交評論