《管理統(tǒng)計學(xué)》馬慶國著.ppt_第1頁
《管理統(tǒng)計學(xué)》馬慶國著.ppt_第2頁
《管理統(tǒng)計學(xué)》馬慶國著.ppt_第3頁
《管理統(tǒng)計學(xué)》馬慶國著.ppt_第4頁
《管理統(tǒng)計學(xué)》馬慶國著.ppt_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章 樣本數(shù)據(jù)特征的 初步分析,一、整理樣本數(shù)據(jù),信息在被操縱或處理后并沒有超出其原有的格式,原始數(shù)據(jù) -,兩種整理原始數(shù)據(jù)的基本方法,2、整理數(shù)據(jù) -數(shù)據(jù)陣列,保留了數(shù)據(jù)的原值 ,并按數(shù)值的升序或降序顯示數(shù)據(jù)。 易觀察到:, 數(shù)據(jù)集中包含最大觀察值和最小觀察值, 確認(rèn)在某個數(shù)據(jù)集中哪些數(shù)組具有相同的值, 很容易發(fā)現(xiàn)各個值之間的差異,3、樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率,一、一些基本概念 1、頻次(頻數(shù)) 在有限的樣本數(shù)據(jù)集合中,同樣的數(shù)據(jù)值(樣本值)出現(xiàn)的次數(shù) 稱為該樣本值出現(xiàn)的頻次。 2、頻率 該樣本值出現(xiàn)的頻次 / 該數(shù)據(jù)集合的數(shù)據(jù)總數(shù)。 常用表示方法: (1)表 ; (2)餅圖;

2、(3)條形圖;,二、樣本數(shù)據(jù)集合的基本特征的延伸:累積頻率 當(dāng)樣本數(shù)據(jù)的測度在順次級以上時,把樣本值小于等于某個樣本數(shù)據(jù)xi的頻率值累加起來,就得到“小于等于xi”的累積頻率。 注:名義級的樣本數(shù)據(jù)集合,不存在累積頻率問題。 表示法同上。,整理數(shù)據(jù) -頻數(shù)分布,將數(shù)據(jù)值分成幾組,顯示各組中有多少數(shù)值,很容易發(fā)現(xiàn)數(shù)據(jù)的圖形特點,無法保留原始數(shù)據(jù)的值 ,頻數(shù)分布, 定義,某個變量所有可能值的集合 顯示了變量的圖形特點,分布,當(dāng)數(shù)據(jù)集為小型時,數(shù)據(jù)之間的變化特點很容易觀察出來 隨著數(shù)據(jù)集變?yōu)橹行突虼笮停兞康奶匦砸话惚憩F(xiàn)得越來越不明顯,定 義,頻數(shù)分布的類別,頻數(shù)分布,頻數(shù),每一組包含的觀察值數(shù)目,

3、組,組限,每一組的上限和下限,組寬,上限和下限之間的間距,如何將數(shù)據(jù)轉(zhuǎn)換成表格 ? 哪些重要或必要的信息應(yīng)當(dāng)包括在內(nèi) ?, 確定 “組數(shù)”和“組寬 ” 頻數(shù)分布一般包括與每組有關(guān)的頻數(shù)、累積頻數(shù)、相對頻數(shù)和相對累積頻數(shù),頻數(shù)分布,頻數(shù)分布,累積頻數(shù),相對頻數(shù),相對累積頻數(shù),顯示每組范圍內(nèi)或其下有多少觀察值,相對頻數(shù)描述每組范圍內(nèi)觀察值所占的百分比,即每組的頻數(shù)除以觀察值的總數(shù)目,顯示每組范圍內(nèi)或其下觀察值所占的百分比,對于定性變量而言 - 常常根據(jù)變量結(jié)果的種類來選擇組,例如,為了研究本班100名學(xué)生的性別 -,頻數(shù)分布,對于定量變量而言 - 選擇“組數(shù)” 和“組寬 ”是主要問題,頻數(shù)分布,應(yīng)

4、當(dāng)遵循哪些基本原則來確定組 -,1.各個組之間必須是“相互排斥”的,2.各個組必須將“所有數(shù)據(jù)均包括在內(nèi)”,3.組數(shù)K 的經(jīng)驗法則 2K n ,此處n代表觀察值的總數(shù)目,4. 各組之間的寬度最好相等,但這并不是必要條件。當(dāng)組寬相等時, W,頻數(shù)分布,5.應(yīng)當(dāng)盡量避免開口組,6.組寬最好是整數(shù),例如,為了研究某班100名學(xué)生的身高 - 我們確定將整個數(shù)據(jù)分成5組,每組寬度相等,W = 10厘米,頻數(shù)分布,1. 一張整理有序的表格可以使數(shù)據(jù)中隱藏的信息清楚地表現(xiàn)出 來 2. 有助于采用圖形方式來匯總數(shù)據(jù) 數(shù)據(jù)集表格不具有唯一性,頻數(shù)分布,頻數(shù)分布,以下數(shù)據(jù)表示一個當(dāng)?shù)乜Х瑞^進行的30筆交易,舉例,

5、146415347524 816719254857 696241463527 726448517764 515026428338,頻數(shù)分布,首先-確定“組數(shù)” 和“組寬 ”,樣本大小 n =3025 = 32 305 組,最小觀察值 = 14,最大觀察值 = 83 ,最好采用“整數(shù)” W = 15, 組數(shù), 組寬,頻數(shù)分布,莖葉圖形,數(shù)據(jù)必須按照升序排列 為了構(gòu)造圖形,我們將數(shù)值的第一個數(shù)字作為莖 莖葉排列使我們可以通過圖形來了解數(shù)據(jù)的分布,莖葉圖形,例如,我們想將12個數(shù)據(jù)轉(zhuǎn)換成一張莖葉圖形 : 4.4 3.6 4.4 3.7 7.6 3.9 3.6 3.5 3.0 4.5 3.8 2.2,

6、2| 2 3| 0 5 6 6 7 8 9 4| 4 4 5 5| 6| 7| 6,莖葉圖形,用直觀方式顯示定量變量, 三種最常使用的圖形類型 - 直方圖 頻數(shù)多邊形 分布曲線 在構(gòu)造圖形之前,需要用頻數(shù)分布來顯示數(shù)據(jù),用直觀方式顯示定量變量 -直方圖, 應(yīng)當(dāng)將數(shù)據(jù)轉(zhuǎn)換成頻數(shù)分布表 水平軸代表變量的數(shù)值,核對符號代表每一組的中點 垂直軸代表計數(shù)頻數(shù)或百分比頻數(shù) 每個條形圖的高度與每一組的頻數(shù)或百分比相對應(yīng) 每個條形圖的寬度與每一組的寬度相對應(yīng),用直觀方式顯示定量變量 -直方圖,例如,我們在本單元中想通過繪制直方圖來表示100名學(xué)生的身高分布,用直觀方式顯示定量變量 -頻數(shù)多邊形,用線段將各組中

7、點和頻數(shù)(或相對頻數(shù))的交叉點連接起來,就可以得到頻數(shù)多邊形圖形,身高.,190.0,180.0,170.0,160.0,150.0,累積計數(shù)頻數(shù),80,60,40,20,0,140.0,100,用直觀方式顯示定量-分布曲線,圖形顯示了每一組的累積頻數(shù)或相對累積頻數(shù) 它可以用“小于”或“大于”來表示, 定性變量常常用非數(shù)值刻度來測量 對這些變量可以進行分類 可以采用兩種最為常見的圖形來描述定性變量的分布 餅圖 條形圖,用直觀方式顯示定性變量, 餅圖的圓圈代表了所有觀察值的集合 根據(jù)定性變量的類型數(shù)目將餅圖分成幾個部分 餅圖每一部分的大小與每一類型的相對頻數(shù)成正比,用直觀方式顯示定性變量 - 餅

8、圖,例如,我們可以用餅圖來描述某班100名學(xué)生的性別分布狀況,用直觀方式顯示定性變量 - 餅圖,對于定性變量而言,條形圖表示每一類型的百分比或 計數(shù)頻數(shù) 每個條形圖的高度代表每一類型的百分比或比例 條形圖的寬度沒有意義,所有類型的寬度均相同,用直觀方式顯示定性變量 -條形圖,例如,我們用條形圖來顯示某班100名學(xué)生的性別分布狀況,用直觀方式顯示定性變量 -條形圖,SPSS統(tǒng)計軟件給我們的工作帶來了方便,餅圖 : 圖形 餅圖 對各組情形進行總結(jié),條形圖 : 圖形 條形圖 對各組情形進行總結(jié),SPSS統(tǒng)計軟件給我們的工作帶來了方便,直方圖 : 圖形 直方圖 選擇關(guān)心的變量,莖葉圖形 : 分析 描述

9、統(tǒng)計學(xué) 尋找 選擇繪圖選項,集中趨勢測度 -未分組數(shù)據(jù), 定義,所有觀察值 的平均值,均值,所有觀察值中位于最中心位置的那個值,中位數(shù),出現(xiàn)最頻繁的數(shù)據(jù)值,眾數(shù),均值 -,總體均值,樣本均值,集中趨勢測度 -未分組數(shù)據(jù),Kim 測驗的平均成績等于,在此我們可以看到,在匯總Kim的測驗成績時,均值并不能發(fā)揮很好的作用。在大多數(shù)情況下,Kim的測驗成績低于30分,她只在一次測驗中意外地獲得了98的高分,因此她的平均成績被提高到35分。,集中趨勢測度 -未分組數(shù)據(jù),Kim是一名中等學(xué)校的學(xué)生,她上星期進行了5次測驗,成績分別如下 7, 98, 25, 19, 和26,均值對極值表現(xiàn)得非常敏感 如果數(shù)

10、據(jù)中存在極值(或者說數(shù)據(jù)分布有所偏斜),那么均值就不能很好地測度集中趨勢,集中趨勢測度 -未分組數(shù)據(jù),中位數(shù) (Md) -,1.將n個觀察值按升序或降序排列 2.如果觀察值個數(shù)是奇數(shù),則中位數(shù)就是位于最中心位置的那個觀察值,即數(shù)據(jù)集中的第 個觀察值 3.如果觀察值個數(shù)是偶數(shù),則中位數(shù)就是位于正中心兩個觀察值的平均值,即數(shù)據(jù)集中的第 個和第 個觀察值的平均值,集中趨勢測度 -未分組數(shù)據(jù),舉例:有6名工人組成一個樣本,請找出他們每周工資的中位數(shù) 151179163142180195,按升序重新排列每周的工資 142151163179180195 最中心位置的兩個數(shù)值 求這兩個數(shù)值的平均數(shù) 中位數(shù)

11、=,集中趨勢測度 -未分組數(shù)據(jù),Kim的5次測驗成績 又如何呢?,Kim成績的中位數(shù)為25,看來中位數(shù)能更好地測度Kim測驗成績的中心位置 - 中位數(shù)不受“極值”的影響,集中趨勢測度 -未分組數(shù)據(jù),眾數(shù) (Mo) -,并不經(jīng)常用眾數(shù)來測度中心位置 適用于定性變量 眾數(shù)不具有唯一性,集中趨勢測度 -未分組數(shù)據(jù),集中趨勢測度 -未分組數(shù)據(jù),舉例:有6名工人組成一個樣本,請找出他們每周工資的眾數(shù), 151 179 163 142 180 195 不存在 眾數(shù), 151 180 163 142 180 195 180, 142 180 163 142 180 195 142 和180 (雙峰 ),對兩

12、個旅行團的小孩年齡進行了數(shù)據(jù)調(diào)查,以下是調(diào)查結(jié)果: -,A組 年齡 : 14, 17, 11, 10, 11, 14, 9, 12, 8, 10, 9,均值 ,中位數(shù) 11,眾數(shù) 9, 10 , 11 和 14 (有4 個眾數(shù) ),集中趨勢測度 -未分組數(shù)據(jù),B組 age: 9, 14, 8, 10, 13, 7, 9, 11, 16, 10, 12, 9,均值,中位數(shù) 10,眾數(shù) 9,集中趨勢測度 -未分組數(shù)據(jù),均值、中位數(shù)和眾數(shù)之間的關(guān)系 -,1. 對稱分布 (均值 = Md = Mo),均值 = Md = Mo,集中趨勢測度 -未分組數(shù)據(jù),均值、中位數(shù)和眾數(shù)之間的關(guān)系 -,2.傾向左側(cè)

13、(均值 Md Mo),均值,Md,Mo,集中趨勢測度 -未分組數(shù)據(jù),均值、中位數(shù)和眾數(shù)之間的關(guān)系 -,3.傾向右側(cè) (均值 Md Mo),Md,Mo,均值,集中趨勢測度 -未分組數(shù)據(jù),集中趨勢測度 -分組數(shù)據(jù),為了計算分組數(shù)據(jù)的均值 ,計算每一組的中點,假設(shè)觀察值都落在各組的中點上, 總體均值 樣本均值,集中趨勢測度 -分組數(shù)據(jù),舉例:下列頻數(shù)分布顯示了某家公司50名工人的每周工資收入,估計每周工資的平均水平,集中趨勢測度 -分組數(shù)據(jù),每周的平均工資,集中趨勢測度 -分組數(shù)據(jù),為了計算分組數(shù)據(jù)的中位數(shù) ,計算每一組的累積頻數(shù),包括“最中心位置” 觀察值的那一組就是“中位數(shù)組”,LMd :中位數(shù)

14、組的下 限,fMd :中位數(shù)組的頻數(shù),w :中位數(shù)組的寬度,c :位于中位數(shù)組之前那一組的累積頻數(shù),集中趨勢測度 -分組數(shù)據(jù),舉例: 繼續(xù)討論前面的例子,即計算50名工人每周工資收入的中位數(shù),集中趨勢測度 -分組數(shù)據(jù),LMd = 169.5,fMd = 12,w = 10,c = 19,中位數(shù)組 170 179,每周工資收入的中位數(shù),集中趨勢測度 -分組數(shù)據(jù),為了計算分組數(shù)據(jù)的眾數(shù) ,出現(xiàn)最頻繁的那一組就是“眾數(shù)組”,LMo :眾數(shù)組的下限,d1 : 眾數(shù)組的頻數(shù)減去眾數(shù)組之前那一組的頻數(shù),w :眾數(shù)組的寬度,d2 : 眾數(shù)組的頻數(shù)減去眾數(shù)組之后那一組的頻數(shù),集中趨勢測度 -分組數(shù)據(jù),舉例:

15、繼續(xù)討論前面的例子,即計算50名工人每周工資收入的眾數(shù),集中趨勢測度 -分組數(shù)據(jù),LMo = 169.5,w = 10,d1 = 12 9 = 3,眾數(shù)組 170 179,每周工資收入的眾數(shù),d2 = 12 9 = 3,集中趨勢測度,舉例:,A列數(shù)據(jù): 55 56 57 58 59 60 61 62 63 64 65 均值 = Md = Mo = 60,B列數(shù)據(jù): 35 40 45 50 55 60 65 70 75 80 85 均值= Md = Mo = 60,離中趨勢測度 -未分組數(shù)據(jù),測度離中趨勢最常用的三種方法 -,1.全距,2.標(biāo)準(zhǔn)差 (SD),3.變異系數(shù) (CV),離中趨勢測度

16、-未分組數(shù)據(jù),全距 =最大觀察值 最小觀察值,全距有兩個主要缺點 -,1.對數(shù)據(jù)集中的極值顯得非常敏感 2. 忽略了位于最大觀察值與最小觀察值之間的數(shù)據(jù)是如何分布的, 定義,離中趨勢測度 -未分組數(shù)據(jù),離中趨勢測度 -未分組數(shù)據(jù),舉例: 有5名工人組成一個樣本,請找出他們每周工資的全距 151179163142180,X最大值 = 180X最小值 = 142,全距 = 180 142 = 38,標(biāo)準(zhǔn)差可以讓我們大致了解數(shù)據(jù)值距離均值有多遠, 定義,標(biāo)準(zhǔn)差,離中趨勢測度 -未分組數(shù)據(jù),總體標(biāo)準(zhǔn)差 , ,樣本標(biāo)準(zhǔn)差 , s,離中趨勢測度 -未分組數(shù)據(jù),計算標(biāo)準(zhǔn)差的其他公式 ,總體標(biāo)準(zhǔn)差 :,樣本標(biāo)

17、準(zhǔn)差 :,離中趨勢測度 -未分組數(shù)據(jù),舉例:有5名工人組成一個總體,請找出他們每周工資的標(biāo)準(zhǔn)差 151179163142180,X,X,-m,(,X,-m,),2,151,-,12,144,179,16,256,163,0,0,142,-,21,441,180,17,289,S,X = 815,S,(,X,-m,),2,=1130,數(shù)據(jù)分布的經(jīng)驗法則 -,當(dāng)數(shù)據(jù)集接近對稱分布時 ,則大約, 68.3 %的數(shù)據(jù)落在均值的1倍標(biāo)準(zhǔn)差范圍內(nèi) 95.5 %的數(shù)據(jù)落在均值的2倍標(biāo)準(zhǔn)差范圍內(nèi) 99.7 5%的數(shù)據(jù)落在均值的3倍標(biāo)準(zhǔn)差范圍內(nèi),離中趨勢測度 -未分組數(shù)據(jù),測量數(shù)據(jù)相對于均值的離中趨勢, 定義,

18、變異系數(shù) (CV),離中趨勢測度 -未分組數(shù)據(jù),? 什么時候采用變異系數(shù) (CV) 來測度離中趨勢 ?, 比較具有不同單位的數(shù)據(jù)集 比較具有不同幅度的數(shù)據(jù)集,離中趨勢測度 -未分組數(shù)據(jù),舉例:,例如,我們想比較1993年2月至1994年1月期間黃金和鋅塊的價格波動情況,我們收集了價格數(shù)據(jù)并得出如下計算結(jié)果:,黃金:,鋅塊 :,每盎司,每磅,離中趨勢測度 -未分組數(shù)據(jù),CV表示每種商品相對于其自身平均價格的波動幅度 :,黃金:,鋅塊 :,離中趨勢測度 -未分組數(shù)據(jù),離中趨勢測度 -分組數(shù)據(jù),為了計算分組數(shù)據(jù)的標(biāo)準(zhǔn)差 ,計算每一組的中點,假設(shè)觀察值都落在各組的中點上,總體標(biāo)準(zhǔn)差 樣本標(biāo)準(zhǔn)差,離中趨

19、勢測度 -分組數(shù)據(jù),總體標(biāo)準(zhǔn)差,樣本標(biāo)準(zhǔn)差,計算標(biāo)準(zhǔn)差的其他公式,離中趨勢測度 -分組數(shù)據(jù),舉例:計算工人每周工資的總體標(biāo)準(zhǔn)差 -,離中趨勢測度 -分組數(shù)據(jù),每周工資,收入,工人人數(shù),(,f,),中點,(,x,),(x,-m,),(x,-m,),2,f(x,-m,),2,140, 149,4,144.5,-29.8,888.04,3552.16,150,159,6,154.5,-19.8,392.04,2352.24,160,169,9,164.5,- 9.8,96.04,864.36,170,179,12,174.5,-0.2,0.04,0.48,180,189,9,184.5,-10.2,

20、104.04,936.36,190,199,7,19,4.5,20.2,408.05,2856.28,200,209,3,204.5,30.2,912.04,2736.12,N,=,S,f,= 50,S,f (x,-m,),2,= 13298,總體標(biāo)準(zhǔn)差,離中趨勢測度 -分組數(shù)據(jù),舉例: 計算工人每周工資的樣本標(biāo)準(zhǔn)差,離中趨勢測度 -分組數(shù)據(jù),每周工資,收入,工人人數(shù),(,f,),中點,(,x,),(x,-,),(x,-,),2,f(x,-,),2,140, 149,4,144.5,-29.8,888.04,3552.16,150,159,6,154.5,-19.8,392.04,2352.24,160,169,9,164.5,- 9.8,96.04,864.36,170,179,12,174.5,-0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論