《統(tǒng)計學(xué)(第5版)》課件-第三章 變量分布特征的描述_第1頁
《統(tǒng)計學(xué)(第5版)》課件-第三章 變量分布特征的描述_第2頁
《統(tǒng)計學(xué)(第5版)》課件-第三章 變量分布特征的描述_第3頁
《統(tǒng)計學(xué)(第5版)》課件-第三章 變量分布特征的描述_第4頁
《統(tǒng)計學(xué)(第5版)》課件-第三章 變量分布特征的描述_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一節(jié)集中趨勢的描述

第二節(jié)離中趨勢的描述第三節(jié)分布形狀的描述第三章變量分布特征的描述

第一節(jié)集中趨勢的描述

一、集中趨勢與平均指標(biāo)二、數(shù)值平均數(shù)

三、位置平均數(shù)

一、集中趨勢與平均指標(biāo)

集中趨勢亦稱為趨中性,是指變量分布以某一數(shù)值為中心的傾向。作為中心的數(shù)值就稱為中心值,它反映變量分布中心點的位置所在。變量分布的集中趨勢要用平均指標(biāo)來反映。平均指標(biāo)是將變量的各變量值差異抽象化、以反映變量值一般水平或平均水平的指標(biāo),也就是反映變量分布中心值或代表值的指標(biāo)。平均指標(biāo)的具體表現(xiàn)稱為平均數(shù),平均數(shù)因計算方法不同可分為數(shù)值平均數(shù)和位置平均數(shù)兩類。

二、數(shù)值平均數(shù)

(一)算術(shù)平均數(shù)

1.簡單算術(shù)平均數(shù)簡單算術(shù)平均數(shù)是根據(jù)未分組數(shù)據(jù)計算的,即直接將變量的每個變量值相加,除以變量值的個數(shù)。若以表示變量,以表示第個變量值(=1,2,…,n),以表示算術(shù)平均數(shù),以n表示變量值個數(shù),則簡單算術(shù)平均數(shù)的計算公式為:

==(可簡記為)

二、數(shù)值平均數(shù)

(一)算術(shù)平均數(shù)

2.加權(quán)算術(shù)平均數(shù)

加權(quán)算術(shù)平均數(shù)是根據(jù)變量數(shù)列計算的,即以各組變量值(或組中值)乘以相應(yīng)的頻數(shù)求出各組標(biāo)志總量,加總各組標(biāo)志總量得出總體標(biāo)志總量,再用總體標(biāo)志總量除以總頻數(shù)。

若以表示第組的變量值(或組中值)(=1,2,…,k),以表示第i組的頻數(shù)(=1,2,…,k),以k表示分組數(shù),則加權(quán)算術(shù)平均數(shù)的計算公式為:

=(可簡記為)

二、數(shù)值平均數(shù)

3.算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)

各變量值與算術(shù)平均數(shù)的離差之和等于零,即:

=0(對于簡單算術(shù)平均數(shù))

=0(對于加權(quán)算術(shù)平均數(shù))

2)各變量值與算術(shù)平均數(shù)的離差平方之和為最小值,即:

=最小值

只有當(dāng)時,等號成立。4.算術(shù)平均數(shù)的優(yōu)缺點

算術(shù)平均數(shù)具有以下幾個優(yōu)點:

一是可以利用算術(shù)平均數(shù)來推算總體標(biāo)志總量,因為算術(shù)平均數(shù)與變量值個數(shù)之乘積等于總體標(biāo)志總量(變量值總和);

二是由算術(shù)平均數(shù)的兩個數(shù)學(xué)性質(zhì)可知,算術(shù)平均數(shù)在數(shù)理上具有無偏性與有效性(方差最小性)的特點,這使得算術(shù)平均數(shù)在統(tǒng)計推斷中得到了極為廣泛的應(yīng)用。

三是算術(shù)平均數(shù)具有良好的代數(shù)運算功能,即分組算術(shù)平均數(shù)的算術(shù)平均數(shù)等于總體算術(shù)平均數(shù)。

4.算術(shù)平均數(shù)的優(yōu)缺點

算術(shù)平均數(shù)也有其局限性,主要表現(xiàn)在以下兩個方面:

一是算術(shù)平均數(shù)易受特殊值(特大或特小值)的影響,當(dāng)變量存在少數(shù)幾個甚至一個特別大或特別小的變量值時,就會導(dǎo)致算術(shù)平均數(shù)迅速增大或迅速變小,從而影響對變量值一般水平的代表性。

二是根據(jù)組距數(shù)列計算算術(shù)平均數(shù)時,由于組中值具有假定性而使得計算結(jié)果只是一個近似值,尤其是當(dāng)組距數(shù)列存在開口組時,算術(shù)平均數(shù)的準(zhǔn)確性會更差。(二)調(diào)和平均數(shù)

1.簡單調(diào)和平均數(shù)

當(dāng)各組的標(biāo)志總量相等時,所計算的調(diào)和平均數(shù)稱為簡單調(diào)和平均數(shù)。設(shè)總體分為k個組,每個組的標(biāo)志總量都為m,則總體標(biāo)志總量為km。現(xiàn)仍以x表示各組變量值,以H表示調(diào)和平均數(shù),則簡單調(diào)和平均數(shù)的計算公式為:

=(可簡記為)

(二)調(diào)和平均數(shù)

2.加權(quán)調(diào)和平均數(shù)當(dāng)各組的標(biāo)志總量不相等時,所計算的調(diào)和平均數(shù)要以各組的標(biāo)志總量為權(quán)數(shù),其結(jié)果即為加權(quán)調(diào)和平均數(shù)。若以m表示各組標(biāo)志總量,則加權(quán)調(diào)和平均數(shù)的計算公式為:

(可簡記為)

3.由相對數(shù)或平均數(shù)計算平均數(shù)

有時,我們需要根據(jù)相對數(shù)或平均數(shù)來計算平均數(shù)。例如,根據(jù)各零售分店的計劃完成程度來計算全公司的計劃完成程度;根據(jù)各企業(yè)的職工平均工資來計算全公司的職工平均工資等。這時總體平均數(shù)的計算要依所掌握的權(quán)數(shù)資料不同采取不同的方法。

如果所掌握的權(quán)數(shù)資料是相對數(shù)或平均數(shù)的母項數(shù)值,要用加權(quán)算術(shù)平均數(shù);如果所掌握的權(quán)數(shù)資料是相對數(shù)或平均數(shù)的子項數(shù)值,則要用加權(quán)調(diào)和平均數(shù)。需要強調(diào)的是,在以相對數(shù)或平均數(shù)計算平均數(shù)時,不論是用加權(quán)算術(shù)平均數(shù)公式還是用加權(quán)調(diào)和平均數(shù)公式,都要從相對數(shù)或平均數(shù)指標(biāo)本身的經(jīng)濟(jì)含義出發(fā)來計算,這是一個很重要的原則。(三)幾何平均數(shù)

1.簡單幾何平均數(shù)

簡單幾何平均數(shù)就是變量的n個變量值連乘積的n次方根。若以表示變量的第i個變量值(=1,2,3,…,n),以G表示幾何平均數(shù),則簡單幾何平均數(shù)的計算公式為:

(可簡記為)

(三)幾何平均數(shù)

2.加權(quán)幾何平均數(shù)

當(dāng)計算幾何平均數(shù)的各種變量值出現(xiàn)的次數(shù)不等,即數(shù)據(jù)經(jīng)過了統(tǒng)計分組時,則應(yīng)采用加權(quán)幾何平均數(shù)。若以表示第i組的變量值(=1,2,…,),以表示第i組的頻數(shù)(=1,2,…,k),以k表示分組數(shù),則加權(quán)幾何平均數(shù)的計算公式為:

(可簡記為)

(四)算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)的數(shù)學(xué)關(guān)系

從數(shù)學(xué)上看,算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)都是冪平均數(shù)的一種。冪平均數(shù)的定義是:

當(dāng)=1時,冪平均數(shù)就是算術(shù)平均數(shù);當(dāng)=-1時,冪平均數(shù)就是調(diào)和平均數(shù);當(dāng)趨向于0時,冪平均數(shù)的極限形式就是幾何平均數(shù)。由于冪平均函數(shù)是單調(diào)遞增函數(shù),所以值越大冪平均數(shù)就越大,因此單從數(shù)學(xué)意義上看,算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)三者的大小關(guān)系是:(四)算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)的數(shù)學(xué)關(guān)系

從數(shù)學(xué)上看,算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)都是冪平均數(shù)的一種。冪平均數(shù)的定義是:

當(dāng)=1時,冪平均數(shù)就是算術(shù)平均數(shù);當(dāng)=-1時,冪平均數(shù)就是調(diào)和平均數(shù);當(dāng)趨向于0時,冪平均數(shù)的極限形式就是幾何平均數(shù)。由于冪平均函數(shù)是單調(diào)遞增函數(shù),所以值越大冪平均數(shù)就越大,因此單從數(shù)學(xué)意義上看,算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)三者的大小關(guān)系是:三、位置平均數(shù)

(一)中位數(shù)與分位數(shù)

1.中位數(shù)中位數(shù)是變量的所有變量值按定序尺度排序后,處于中間位置的變量值。中位數(shù)既可用以測定定量變量的集中趨勢,也可用以測定定序變量的集中趨勢,但不適用于定類變量。(1)根據(jù)未經(jīng)分組的原始數(shù)據(jù)來確定假設(shè)變量的n個數(shù)據(jù)按大小、強弱等順序排列后的結(jié)果為:,,,…,,以表示中位數(shù),則=(2)根據(jù)變量分布數(shù)列確定中位數(shù)在單項式數(shù)列中,先按(+1)/2來確定中位數(shù)位置,然后對數(shù)列中的各組頻數(shù)進(jìn)行向上累計或向下累計,當(dāng)某一組的累計頻數(shù)大于或等于(+1)/2時,該組的變量值就是中位數(shù)。(3)中位數(shù)的應(yīng)用特點

中位數(shù)具有以下一些優(yōu)點:一是中位數(shù)作為一種位置平均數(shù),概念較為清晰,只要排列數(shù)據(jù)順序,就可比較容易地加以確定;二是中位數(shù)不受變量數(shù)列中特殊值的影響,遇有特大值或特小值時,用中位數(shù)來表示現(xiàn)象的一般水平更具有代表性;三是組距數(shù)列出現(xiàn)開口組時,對中位數(shù)無影響;四是當(dāng)某些變量不能表現(xiàn)為數(shù)值但可以定序時,不能計算數(shù)值平均數(shù)而可以確定中位數(shù)。當(dāng)然中位數(shù)也有局限性,一是中位數(shù)不能如算術(shù)平均數(shù)那樣可以進(jìn)行代數(shù)運算;二是除了變量數(shù)列的中間部分?jǐn)?shù)值外,其他數(shù)值的變化都不對中位數(shù)產(chǎn)生影響,因此中位數(shù)的靈敏度較低。2.分位數(shù)分位數(shù)是將變量的數(shù)值按大小順序排列并等分為若干部分后,處于等分點位置的數(shù)值。常用的分位數(shù)有四分位數(shù)、十分位數(shù)和百分位數(shù),他們分別是將數(shù)值序列4等分、10等分和100等分的3個點、9個點和99個點上的數(shù)值。其中四分位數(shù)第2點的數(shù)值、十分位數(shù)第5個點的數(shù)值和百分位數(shù)第50個點的數(shù)值,就是中位數(shù)。所以,中位數(shù)就是一個特殊的分位數(shù)。以四分位數(shù)為例,設(shè),和分別表示第一個、第二個和第三個四分位數(shù),則他們的位置分別為:,和,根據(jù)位置即可確定各個四分位數(shù)。(二)眾數(shù)

眾數(shù)是變量數(shù)列中出現(xiàn)次數(shù)最多、頻率最高的變量值。在某些場合,眾數(shù)可以用來反映現(xiàn)象的一般水平。眾數(shù)通常用來表示。眾數(shù)可用以測定任何種類變量的集中趨勢,包括定類變量和定序變量。眾數(shù)的確定方法因所掌握的數(shù)據(jù)條件不同而有所不同。根據(jù)單項式數(shù)列確定眾數(shù)比較容易,只要找出出現(xiàn)頻數(shù)最多或出現(xiàn)頻率最高的變量值即可。如果根據(jù)組距式數(shù)列來確定眾數(shù),則先要找出頻數(shù)最多的一組作為眾數(shù)組,然后運用公式來確定眾數(shù)。

(二)眾數(shù)

下限公式為:

(式中為眾數(shù)組頻數(shù)與下一組頻數(shù)之差,為眾數(shù)組頻數(shù)與上一組頻數(shù)之差;L、d的含義與中位數(shù)公式的相同。)上限公式為:

(式中U的含義與中位數(shù)公式的相同。)

(二)中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的關(guān)系

1.在變量分布完全對稱(即正態(tài)分布)時,中位數(shù)、眾數(shù)和算術(shù)平均數(shù)三者完全相等,即2.在變量分布不對稱(即偏態(tài)分布)時,中位數(shù)、眾數(shù)和算術(shù)平均數(shù)三者之間存在著差異。當(dāng)算術(shù)平均數(shù)受極大標(biāo)志值一端的影響較大時,變量分布向右偏,三者之間的關(guān)系為:3.根據(jù)經(jīng)驗,在輕微偏態(tài)時,不論是左偏還是右偏,眾數(shù)與算術(shù)平均數(shù)的距離約等于中位數(shù)與算術(shù)平均數(shù)的3倍:第二節(jié)離中趨勢的描述

一、離中趨勢和離散指標(biāo)二、離散指標(biāo)的測度一、離中趨勢和離散指標(biāo)

所謂離中趨勢,就是變量分布中各變量值背離中心值的傾向。對離中趨勢的描述,就是要反映變量分布中各變量值遠(yuǎn)離中心值或代表值的狀況,以更客觀地反映變量分布的特征。變量分布的離中趨勢要用離散指標(biāo)來反映。離散指標(biāo)就是反映變量值變動范圍和差異程度的指標(biāo),即反映變量分布中各變量值遠(yuǎn)離中心值或代表值程度的指標(biāo),亦稱為變異指標(biāo)或標(biāo)志變動度指標(biāo)。常用的離散指標(biāo)主要有:全距(亦稱極差)、四分位差、異眾比率、平均差、標(biāo)準(zhǔn)差、離散系數(shù)等。二、離散指標(biāo)的測度

(一)全距

全距就是變量的最大值()與最小值()之差,也叫極差,表明變量的最大變動范圍或絕對幅度。全距通常用R表示,即:R=-(二)四分位差

四分位差是四分位數(shù)中第一個四分位數(shù)與第三個四分位數(shù)之差,也稱為內(nèi)距或四分間距,通常用表示,即:(三)異眾比率異眾比率是分布數(shù)列中非眾數(shù)組的頻數(shù)與總頻數(shù)之比,通常用來表示,即:

其中為眾數(shù)組的頻數(shù)。(四)平均差

平均差是變量的各變量值與算術(shù)平均數(shù)離差絕對值的算術(shù)平均數(shù),表明各變量值與算術(shù)平均數(shù)的平均差距,通常用來表示,即:或平均差由于利用了全部數(shù)據(jù)信息,因而比全距、四分位差等更能比較客觀反映變量分布的離散程度。平均差愈大,表示變量分布離散程度愈大;平均差愈小,則變量分布離散程度愈小。(五)方差和標(biāo)準(zhǔn)差

方差是變量的各變量值與其均值的離差平方的算術(shù)平均數(shù),標(biāo)準(zhǔn)差則是方差的平方根。方差的計算公式為:或(五)方差和標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差的計算公式為:或(六)離散系數(shù)

相對離散指標(biāo)也叫離散系數(shù)變異系數(shù)或標(biāo)準(zhǔn)差系數(shù),是變量的標(biāo)準(zhǔn)差與均值之比,通常用來表示,即:

離散系數(shù)越大,說明變量分布的離散程度越強,平均數(shù)的代表性越差;離散系數(shù)越小,說明變量分布的離散程度越弱,平均數(shù)的代表性越好。第三節(jié)分布形狀的描述

一、分布形狀和形狀指標(biāo)二、偏度系數(shù)三、峰度系數(shù)一、分布形狀和形狀指標(biāo)

如前所述,變量分布的形狀是各種各樣的,有J型的、U型的和鐘型的等。為了全面了解變量分布的特征,我們不僅要觀察其集中趨勢和離中趨勢,也要觀察其形狀。

變量分布的形狀要用形狀指標(biāo)來反映。形狀指標(biāo)就是反映變量分布具體形狀,即左右是否對稱、偏斜程度與陡峭程度如何的指標(biāo)。具體來說,變量分布的形狀一般從對稱性和陡峭性兩方面來反映,因此形狀指標(biāo)也有兩個方面:一是反映變量分布偏斜程度的指標(biāo),稱為偏度系數(shù);二是反映變量分布陡峭程度的指標(biāo),稱為峰度系數(shù)。由此可見,形狀指標(biāo)與平均指標(biāo)、離散指標(biāo)一樣,都是變量分布特征的重要體現(xiàn)。二、偏度系數(shù)

偏度的概念首先由統(tǒng)計學(xué)家皮爾遜(Pearson)于1895年提出,是對變量分布對稱性的測度,是指變量分布偏斜的方向及其程度。

偏度的測定是通過計算偏度系數(shù)來實現(xiàn)的,通常用來表示。偏度系數(shù)的計算主要有以下三種方法:(一)利用算術(shù)平均數(shù)與眾數(shù)或中位數(shù)的離差求偏度系數(shù)

用算術(shù)平均數(shù)與眾數(shù)或中位數(shù)的離差求偏度系數(shù)并標(biāo)記為,計算公式為:

=

將-除以標(biāo)準(zhǔn)差,一是為了消除了不同計量單位的影響,二是為了把不可直接比較的絕對數(shù)轉(zhuǎn)化為可相互比較的相對數(shù)。一般情況下,偏度系數(shù)的變動范圍為(-3,3)。當(dāng)﹥時,為正值,變量分布屬于正偏;當(dāng)﹤時,為負(fù)值,變量分布屬于負(fù)偏;當(dāng)=時,為0,變量分布屬于無偏(即對稱分布)。的絕對值越接近于3,表明變量分布的偏斜程度越嚴(yán)重;的絕對值越接近于0,表明變量分布的偏斜程度越輕微。(二)利用四分位數(shù)求偏度系數(shù)

根據(jù)四分位數(shù)的特點可知,如果變量分布對稱、無偏斜,那么第一個四分位數(shù)與第三個四分位數(shù)是關(guān)于中位數(shù)對稱分布的,即-=-,因此我們可以通過-=-這個等式是否成立來判斷變量分布是否對稱,并且可以根據(jù)第一個、第三個四分位數(shù)與中位數(shù)距離的關(guān)系來求偏度系數(shù)并標(biāo)記為,計算公式為:

=偏度系數(shù)的取值范圍為(-1,1)。的絕對值越接近于1,表明變量分布的偏斜程度越嚴(yán)重;的絕對值越接近于0,表明變量分布的偏斜程度越輕微。同理,我們也可以根據(jù)十分位數(shù)、百分位數(shù)來求偏度系數(shù)。(三)利用動差法求偏度系數(shù)

計算偏度系數(shù)最重要的方法是動差法。動差法偏度系數(shù)是以變量數(shù)列的三階中心動差()作為度量偏度的基本依據(jù)。令常數(shù)a為變量分布的中心,則所有變量值與值之差的次方的算術(shù)平均數(shù)就稱為變量x關(guān)于a的t階動差,即:

t階動差=或t階動差=

(三)利用動差法求偏度系數(shù)

當(dāng)a=0時,t階動差稱為t階原點動差,若以表示,則:一階原點動差為:或,即算術(shù)平均數(shù)二階原點動差為:或,即平方的平均數(shù)三階原點動差為:或,即三次方的平均數(shù)……當(dāng)a=時,t階動差稱為t階中心動差,若以表示,則:一階中心動差為:或二階中心動差為:或三階中心動差為:或……

很顯然,一階中心動差=0,偶數(shù)階中心動差恒為正(其中2階中心動差就是方差,即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論