版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》第二十四章描述統(tǒng)計(jì)教材內(nèi)容
在描述統(tǒng)計(jì)中,可以通過(guò)統(tǒng)計(jì)量描述數(shù)據(jù)的分布特征。對(duì)于數(shù)據(jù)分布特征的測(cè)
度主要分為三個(gè)方面:一是分布的集中趨勢(shì),反映各數(shù)據(jù)向其中心值靠攏或聚集的
程度;二是分布的離散程度,反映各數(shù)據(jù)之間的差異程度,也能反映中心值對(duì)數(shù)據(jù)
的代表程度;三是分布的偏態(tài),反映數(shù)據(jù)分布的不對(duì)稱性。對(duì)于兩個(gè)定量變量之間
的相關(guān)分析,經(jīng)常采用的描述方法是散點(diǎn)圖和相關(guān)系數(shù)統(tǒng)計(jì)量。
一、集中趨勢(shì)的測(cè)度
集中趨勢(shì)是指一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點(diǎn)的
位置所在。集中趨勢(shì)的測(cè)度也就是尋找數(shù)據(jù)水平的代表值或中心值。
1.均值。均值也叫作平均數(shù),就是數(shù)據(jù)組中所有數(shù)值的總和除以該組數(shù)值的個(gè)
數(shù)。設(shè)一組數(shù)據(jù)為Xi,X2,…,X、平均數(shù)的計(jì)算公式為:
例如,某售貨小組有5名營(yíng)業(yè)員,元旦全天的銷(xiāo)售額分別為520元、600元、
480元、750元和500元,求該日平均銷(xiāo)售額。
計(jì)算結(jié)果表明,元旦5名營(yíng)業(yè)員的平均銷(xiāo)售額為570元。
均值是集中趨勢(shì)最主要的測(cè)度值,它是一組數(shù)據(jù)的重心所在,解釋了一組數(shù)據(jù)
的平均水平。它主要適用于數(shù)值型數(shù)據(jù),但不適用于分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)。此外,
均值容易受到極端值的影響,極端值會(huì)使得均值向極大值或極小值方向傾斜,使得
均值對(duì)數(shù)據(jù)組的代表性減弱。
2.中位數(shù)。把一組數(shù)據(jù)按從小到大或從大到小的順序進(jìn)行排列,位置居中的數(shù)
值叫作中位數(shù),用Me,表示。中位數(shù)將數(shù)據(jù)分成兩部分,其中一半數(shù)據(jù)小于中位數(shù),
另一半數(shù)據(jù)大于中位數(shù)。設(shè)一組數(shù)據(jù)為XI,X2,...,Xn.按從小型吠順序?yàn)閄⑴,X(2),…,X(n),則中位效為:
例如,某地級(jí)市下轄9個(gè)縣,每個(gè)縣的面積如下(單位:平方千米),計(jì)算該市下
轄縣面積的中位數(shù):
14552024912101613521031212810752000
首先,將上面的數(shù)據(jù)排序結(jié)果如下:
91210161031107513521455200020242128
中位數(shù)位置=(9+1計(jì)2=5,中位數(shù)為1352,即Mc=1352(平方千米)
在上例中,由于行政區(qū)劃調(diào)整,鄰市的一個(gè)面積為1000平方千米的縣劃歸該
no行政區(qū)劃調(diào)整后,該市現(xiàn)在下轄10個(gè)縣,該市下轄縣的面積(單位:平方千米)
從小到大依次為:
912100010161031107513521455200020242128
計(jì)算行政區(qū)劃調(diào)整后該市下轄縣面積的中位數(shù):
中位數(shù)位置=(10+1戶2=5.5,中位數(shù)為(平方千米)
中位數(shù)是一個(gè)位置代表值,主要用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),但不適用于分類(lèi)
數(shù)據(jù)。中位數(shù)的優(yōu)點(diǎn)是不受極端值的影響,抗干擾性強(qiáng),尤其適用于收入這類(lèi)偏斜
分布的數(shù)值型數(shù)據(jù)。
3.眾數(shù)。眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)(頻數(shù))最多的變量值。例如,某能源公
司有9個(gè)分公司,每個(gè)分公司的主營(yíng)產(chǎn)品分別是煤制品、有機(jī)化工原料、火電、煤
制品、熱力、電解鋁、火電、煤制品、煤制品,則該能源公司分公司主營(yíng)產(chǎn)品的眾
數(shù)為煤制品。
眾數(shù)適用于描述分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)的集中趨勢(shì)。而在定量數(shù)據(jù)中,可能出現(xiàn)
多眾數(shù)和無(wú)眾數(shù)的情況,因此眾數(shù)不適用于描述定量數(shù)據(jù)的集中位置。
4.均值、中位數(shù)和眾數(shù)的比較及適用范圍。三者的關(guān)系及各自的適用范圍如下。
。均值適用于定量變量。優(yōu)點(diǎn)是能夠充分利用數(shù)據(jù)的全部信息,均值大小受每個(gè)觀
測(cè)值的影響,比較穩(wěn)定;缺點(diǎn)是易受極端值的影響,如果觀測(cè)值中有明顯的極端值,
則均值的代表性較差。②中位數(shù)不適用于分類(lèi)變量,適于順序變量和定量變量,特
別是分布不對(duì)稱的數(shù)據(jù)。優(yōu)點(diǎn)是不受極端值的影響;缺點(diǎn)是沒(méi)有充分利用數(shù)據(jù)的全
部信息,穩(wěn)定性差于均值,優(yōu)于眾數(shù)。③眾數(shù)不適用于定量變量,主要適用于分類(lèi)
和順序變量。優(yōu)點(diǎn)是不受極端值的影響,尤其是分布明顯呈偏態(tài)時(shí),眾數(shù)的代表性
更好;缺點(diǎn)是沒(méi)有充分利用數(shù)據(jù)的全部信息,缺乏穩(wěn)定性,而且可能不唯一。
二、離散程度的測(cè)度
離散程度反映的是數(shù)據(jù)之間的差異程度。集中趨勢(shì)的測(cè)度值是對(duì)數(shù)據(jù)水平的一
人概括性的度量,它對(duì)一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水平。數(shù)據(jù)的
離散程度越大,集中趨勢(shì)的測(cè)度值對(duì)該組數(shù)據(jù)的代表性就越差,離散程度越小,其
代表性就越好。
1.方差。方差是數(shù)據(jù)組中各數(shù)值與其均值離差平方的平均數(shù),它能較好地反映
匕數(shù)據(jù)的離散程度,是實(shí)際中應(yīng)用最廣泛的離散程度測(cè)度值。方差越小,說(shuō)明數(shù)據(jù)
值與均值的平均距離越小,均值的代表性越好。
對(duì)于總體數(shù)據(jù),常用的方差計(jì)算公式有兩種:
前者的分母是總體規(guī)模、后者的分母是總體規(guī)模N減去1。對(duì)于樣本數(shù)據(jù),常
月的方差計(jì)算公式為:
樣本方差s2的分母是樣本規(guī)模n減去1。在有放回的簡(jiǎn)單隨機(jī)抽樣中,樣本方
差s2是總體方差J的無(wú)偏估計(jì)量;而在不放回的簡(jiǎn)單隨機(jī)抽樣中,樣本方差s2是總
體方差S2的無(wú)偏估計(jì)量。
根據(jù)本章前例中5名營(yíng)業(yè)員元旦當(dāng)天的銷(xiāo)售額樣本數(shù)據(jù),計(jì)算日銷(xiāo)售額的樣本
方差。
2.標(biāo)準(zhǔn)差。方差是反映數(shù)據(jù)離散程度的重要測(cè)度指標(biāo),但是其單位是原數(shù)據(jù)單
位的平方,沒(méi)有解釋意義。因此,我們經(jīng)常使用標(biāo)準(zhǔn)差來(lái)測(cè)度數(shù)據(jù)的離散程度,標(biāo)
準(zhǔn)差即方差的平方根。對(duì)于樣本數(shù)據(jù),常用的標(biāo)準(zhǔn)差計(jì)算公式為:
標(biāo)準(zhǔn)差不僅能度量數(shù)值與均值的平均距離,還與原始數(shù)值具有相同的計(jì)量單位。
同樣地,利用5名營(yíng)業(yè)員元旦當(dāng)天的銷(xiāo)售額樣本數(shù)據(jù),計(jì)算日銷(xiāo)售額的標(biāo)準(zhǔn)差。
標(biāo)準(zhǔn)差與方差計(jì)算比較簡(jiǎn)便,又具有比較好的數(shù)學(xué)性質(zhì),是應(yīng)用最廣泛的統(tǒng)計(jì)
離散程度的測(cè)度方法。但是標(biāo)準(zhǔn)差與方差只適用于數(shù)值型數(shù)據(jù)。此外,與均值一樣,
它們對(duì)極端值也很敏感。
3.離散系數(shù)。離散系數(shù)也稱變異系數(shù)或標(biāo)準(zhǔn)差系數(shù),即標(biāo)準(zhǔn)差與均值的比值,
主要用于不同類(lèi)別數(shù)據(jù)離散程度的比較,記為CV。離散系數(shù)計(jì)算公式為:
根據(jù)5名營(yíng)業(yè)員元旦當(dāng)天的銷(xiāo)售額案例數(shù)據(jù),計(jì)算日銷(xiāo)售額的離散系數(shù)。
標(biāo)準(zhǔn)差的大小不僅與數(shù)據(jù)的測(cè)度單位有關(guān),也與觀測(cè)值的均值大小有關(guān),不能
直接用標(biāo)準(zhǔn)差比較不同變量的離散程度。離散系數(shù)消除了測(cè)度單位和觀測(cè)值水平不
同的影響,因而可以直接用來(lái)比較變量的離散程度。
三、分布形態(tài)的測(cè)度
1.偏態(tài)系數(shù)。偏度是指數(shù)據(jù)分布的偏斜方向和程度,描述的是數(shù)據(jù)分布對(duì)稱程
度。測(cè)度數(shù)據(jù)分布偏度的統(tǒng)計(jì)量稱為偏態(tài)系數(shù),其計(jì)算公式為:
偏態(tài)系數(shù)取決于離差三次方的平均數(shù)與標(biāo)準(zhǔn)差三次方的比值。如果偏態(tài)系數(shù)等
于0,說(shuō)明數(shù)據(jù)的分布是對(duì)稱的;如果偏態(tài)系數(shù)為正值,說(shuō)明分布為右偏的,取值在
。和0.5之間說(shuō)明輕度右偏,取值在0.5和1之間說(shuō)明中度右偏,取值大于I說(shuō)明嚴(yán)
重右偏;如果偏態(tài)系數(shù)為負(fù)值,說(shuō)明分布為左偏,取值在0和-0.5之間說(shuō)明輕度左
偏,取值在-0.5和-1之間說(shuō)明中度左偏,取值小于-1說(shuō)明嚴(yán)重左偏。偏態(tài)系數(shù)的絕
對(duì)值越大,說(shuō)明數(shù)據(jù)分布的偏斜程度越大。
2.標(biāo)準(zhǔn)分?jǐn)?shù)。在統(tǒng)計(jì)上,均值和標(biāo)準(zhǔn)差不同時(shí),不同變量的數(shù)值是不能比較的。
比如,在考核A中員工得分的均值為80分,標(biāo)準(zhǔn)差為20分,在考核B中員工得
分的均值為60分,標(biāo)準(zhǔn)差為5分。同樣是80的得分,在考核A中屬于中等水平,
在考核B中可能名列前茅。來(lái)自不同分布的變量值不可比,但是每個(gè)數(shù)值在變量分
布中相對(duì)于均值的相對(duì)位置是可比的,因此可以通過(guò)計(jì)算標(biāo)準(zhǔn)分?jǐn)?shù)來(lái)比較不同變量
的取值。標(biāo)準(zhǔn)分?jǐn)?shù)可以給出數(shù)值距離均值的相對(duì)位置,計(jì)算方法是用數(shù)值減去均值
所得的差除以標(biāo)準(zhǔn)差,計(jì)算公式為:
在上面所說(shuō)的兩次考核得分分布假定下,在考核A中80分轉(zhuǎn)化后的標(biāo)準(zhǔn)分?jǐn)?shù)
為0,在考核B中70分轉(zhuǎn)化后的標(biāo)準(zhǔn)分?jǐn)?shù)為2,說(shuō)明70分在考核B中的相對(duì)排名高于
80分在考核A中的相對(duì)排名。
標(biāo)準(zhǔn)分?jǐn)?shù)也稱為Z分?jǐn)?shù),是統(tǒng)計(jì)上常用的一種標(biāo)準(zhǔn)化方法,轉(zhuǎn)變后的標(biāo)準(zhǔn)分?jǐn)?shù)
并沒(méi)有改變數(shù)值在原分布中的位置,也沒(méi)有改變數(shù)據(jù)原分布的偏度,但是標(biāo)準(zhǔn)分?jǐn)?shù)
的平均數(shù)為0,標(biāo)準(zhǔn)差為lo
在實(shí)際應(yīng)用中,當(dāng)數(shù)據(jù)服從對(duì)稱的鐘形分布時(shí),可以運(yùn)用經(jīng)驗(yàn)法則來(lái)判斷與均
值的距離在特定倍數(shù)標(biāo)準(zhǔn)差之內(nèi)的數(shù)據(jù)項(xiàng)所占比例。經(jīng)驗(yàn)法則表明:約后68%的數(shù)
據(jù)與平均數(shù)的距離在I個(gè)標(biāo)準(zhǔn)差之內(nèi),約有95%的數(shù)據(jù)與平均數(shù)的距離在2個(gè)標(biāo)準(zhǔn)
差之內(nèi),約有99%的數(shù)據(jù)與平均數(shù)的距離在3個(gè)標(biāo)準(zhǔn)差之內(nèi)。也就是說(shuō),對(duì)于服從
對(duì)稱的鐘形分布的標(biāo)準(zhǔn)分?jǐn)?shù),68%的標(biāo)準(zhǔn)分?jǐn)?shù)在口,+1]范圍內(nèi),約有95%的標(biāo)準(zhǔn)分
數(shù)在[-2,+2]范圍之內(nèi),約有99%的標(biāo)準(zhǔn)分?jǐn)?shù)在[-3,+引范圍之內(nèi)。因此,根據(jù)經(jīng)驗(yàn)法
則,如果上面的考核B中的得分服從對(duì)稱鐘形分布,則95%的得分都在50分和70
分之間。
四、變量間的相關(guān)分析
現(xiàn)實(shí)中很多變量之間存在著相關(guān)關(guān)系。比如,一般來(lái)說(shuō),身高越高的人體重也
越重,收入較高的家庭消費(fèi)水平也較高,諸如此類(lèi)的例子不勝枚舉。有的變量間相
關(guān)關(guān)系較強(qiáng),有的變量間相關(guān)關(guān)系較弱,并且變量間相關(guān)的模式也是不盡相同的。
因此,我們需要度量變量間相關(guān)關(guān)系的強(qiáng)弱,并對(duì)不同的相關(guān)關(guān)系進(jìn)行分類(lèi)。
(一)變量間的相關(guān)關(guān)系
客觀現(xiàn)象的相關(guān)關(guān)系可以按不同的標(biāo)準(zhǔn)進(jìn)行分類(lèi)。
1.按相關(guān)的程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)。當(dāng)一個(gè)變量的取值變
化完全由另一個(gè)變量的取值變化所確定時(shí),稱這兩個(gè)變量間的關(guān)系為完全相關(guān)。例
如,在價(jià)格不變的條件下,某種商品的銷(xiāo)售總額由其銷(xiāo)售量決定。當(dāng)兩個(gè)變量的取
值變化彼此互不影響時(shí),稱為不相關(guān)現(xiàn)象。例如,通常認(rèn)為股票價(jià)格的高低與氣溫
的高低是不相關(guān)的。當(dāng)兩個(gè)變量之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完
全相關(guān),一般相關(guān)現(xiàn)象都是指這種不完全相關(guān)。
2.按相關(guān)的方向可分為正相關(guān)和負(fù)相關(guān)。當(dāng)一個(gè)變量的取值由小變大,另一個(gè)
變量的取值也相應(yīng)由小變大,這種相關(guān)稱為正相關(guān)。例如,工人的工資隨著勞動(dòng)生
產(chǎn)率的提高而增加。當(dāng)一個(gè)變量的取值由小變大,而另一個(gè)變量的取值相反地由大
變小,這種相關(guān)稱為負(fù)相關(guān)。例如,商品的銷(xiāo)售量隨著單價(jià)的升高而降低。
3.按相關(guān)的形式可分為線性相關(guān)和非線性相關(guān)。當(dāng)兩個(gè)相關(guān)變量之間的關(guān)系大
致呈現(xiàn)為線性關(guān)系時(shí),稱之為線性相關(guān)。如果兩個(gè)相關(guān)變量之間,并不表現(xiàn)為直線
的關(guān)系,而是近似于某種曲線方程的關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。
需要注意的是,相關(guān)關(guān)系并不等同于因果關(guān)系。例如,夏季我們也許能得到雪
糕的銷(xiāo)售量與遮陽(yáng)傘的銷(xiāo)售量之間呈正相關(guān),但常識(shí)告訴我們它們之間并不存在因
果關(guān)系。
(二)散點(diǎn)圖
兩個(gè)變量間的關(guān)系可以用散點(diǎn)圖來(lái)展示。在散點(diǎn)圖中,每個(gè)點(diǎn)代表一個(gè)觀測(cè)值,
橫縱坐標(biāo)值分別代表兩個(gè)變量相應(yīng)的觀測(cè)值。
圖24-1是一些數(shù)據(jù)的散點(diǎn)圖。橫坐標(biāo)值表示變量X的觀測(cè)值,縱坐標(biāo)值表示
變量Y的觀測(cè)值。圖a的點(diǎn)幾乎無(wú)規(guī)律而言,表示這兩個(gè)變量不相關(guān)。圖b和圖c
口,觀測(cè)點(diǎn)密集在一條直線周?chē)?,表現(xiàn)為較強(qiáng)的線性相關(guān),但相關(guān)的方向不同。圖
b中的兩個(gè)變量為正相關(guān)關(guān)系,圖c中的兩個(gè)變量為負(fù)相關(guān)關(guān)系。圖d中的觀測(cè)點(diǎn)
呈現(xiàn)出曲線模式,這表示兩個(gè)變量為非線性相關(guān)。
圖24-1不同形態(tài)的散點(diǎn)圖
(三)相關(guān)系數(shù)
相關(guān)系數(shù)是度量?jī)蓚€(gè)變量間相關(guān)關(guān)系的統(tǒng)計(jì)量。最常用的相關(guān)系數(shù)是Pearson
相關(guān)系數(shù),它度量的是兩個(gè)變量間的線性相關(guān)關(guān)系。假設(shè)分別可得到兩個(gè)變量X和
Y的n組觀測(cè)值,即Xi,yi,i=l,2,…,n,其中兩組觀測(cè)值之間是---對(duì)應(yīng)的,那么
Pearson相關(guān)系數(shù)r的計(jì)算公式為:
表24-1是2002-2013年的城鎮(zhèn)居民人均可支配收入和人均消費(fèi)支出數(shù)據(jù)。圖
24-2所示為相應(yīng)的散點(diǎn)圖。從圖中可以看出,這兩個(gè)變量呈正線性相關(guān)。
表24-12002—2013年城鎮(zhèn)居民人均可支配收入和人均消費(fèi)支出
資料來(lái)源:《中國(guó)統(tǒng)計(jì)年鑒》
圖24-22002—2013年城鎮(zhèn)居民人均可支配收入和人均消費(fèi)支出的散點(diǎn)圖
用公式進(jìn)行計(jì)算,可得兩變量觀測(cè)值的Pearson相關(guān)系數(shù)r:
可以證明,Pearson相關(guān)系數(shù)的取值范圍在+1和-1之間,即-1W長(zhǎng)1。若0
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件質(zhì)量保證流程
- 工業(yè)智能制造技術(shù)實(shí)踐指南
- 2026年文學(xué)鑒賞與文學(xué)理論考試題集
- 2026年移動(dòng)支付呼叫中心業(yè)務(wù)測(cè)試題
- 2026年行政事業(yè)單位移民業(yè)務(wù)考試題目
- 胃炎患者的日常飲食管理
- 2026年一級(jí)建造師考試實(shí)務(wù)科目試題解析
- 2026年全民健身運(yùn)動(dòng)會(huì)測(cè)試卷身體素質(zhì)鍛煉題型
- 2026年交通運(yùn)輸崗位應(yīng)聘考核題及解答參考
- 2026年國(guó)際關(guān)系專(zhuān)業(yè)綜合知識(shí)模擬題
- 2025大模型安全白皮書(shū)
- 2026國(guó)家國(guó)防科技工業(yè)局所屬事業(yè)單位第一批招聘62人備考題庫(kù)及1套參考答案詳解
- 工程款糾紛專(zhuān)用!建設(shè)工程施工合同糾紛要素式起訴狀模板
- 2026湖北武漢長(zhǎng)江新區(qū)全域土地管理有限公司招聘3人筆試備考題庫(kù)及答案解析
- 110(66)kV~220kV智能變電站設(shè)計(jì)規(guī)范
- (正式版)DB44∕T 2784-2025 《居家老年人整合照護(hù)管理規(guī)范》
- 2025年美國(guó)心臟病協(xié)會(huì)心肺復(fù)蘇和心血管急救指南(中文完整版)
- (2025年)教育博士(EdD)教育領(lǐng)導(dǎo)與管理方向考試真題附答案
- 1、湖南大學(xué)本科生畢業(yè)論文撰寫(xiě)規(guī)范(大文類(lèi))
- 基于多源數(shù)據(jù)融合的深圳市手足口病時(shí)空傳播模擬與風(fēng)險(xiǎn)預(yù)測(cè)模型構(gòu)建及應(yīng)用
- 咯血的急救及護(hù)理
評(píng)論
0/150
提交評(píng)論