chap4-數(shù)據(jù)分布特征的測(cè)度課件_第1頁(yè)
chap4-數(shù)據(jù)分布特征的測(cè)度課件_第2頁(yè)
chap4-數(shù)據(jù)分布特征的測(cè)度課件_第3頁(yè)
chap4-數(shù)據(jù)分布特征的測(cè)度課件_第4頁(yè)
chap4-數(shù)據(jù)分布特征的測(cè)度課件_第5頁(yè)
已閱讀5頁(yè),還剩128頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 數(shù)據(jù)分布特征的測(cè)度石河子大學(xué)商學(xué)院張銀銀E-mail:Tel四章 數(shù)據(jù)分布特征的測(cè)度第一節(jié) 規(guī)模和比率的度量 第二節(jié) 集中趨勢(shì)的描述第三節(jié) 離散程度的測(cè)度第四節(jié) 分布的偏態(tài)與峰態(tài)數(shù) 據(jù) 分 布 的 特 征集中趨勢(shì) (位置)偏態(tài)和峰態(tài)(形狀)離中趨勢(shì) (分散程度)數(shù)據(jù)分布特征的測(cè)度數(shù)據(jù)特征的測(cè)度分布的形狀集中趨勢(shì)離散程度眾 數(shù)中位數(shù)均 值離散系數(shù)方差和標(biāo)準(zhǔn)差峰 態(tài)四分位差異眾比率偏 態(tài)第一節(jié) 規(guī)模和比率的度量一、規(guī)模與比率二、指標(biāo)計(jì)算與實(shí)例 按反映的時(shí)間狀況不同分為:時(shí)期指標(biāo)時(shí)點(diǎn)指標(biāo)(period indicator)(Time-point indicator)

2、按計(jì)量單位(Unit of meterage)不同分為:實(shí)物指標(biāo)價(jià)值指標(biāo)勞動(dòng)指標(biāo)(physical indicator)(indicator of value)(indicator of labor force)總體標(biāo)志總量總體單位總數(shù)按反映的總體內(nèi)容不同分為:(Amount of population unit)(Amount of indicate)(2)總量指標(biāo)的基本分類(lèi)只有可加總體能夠計(jì)算總體單位總數(shù),不可加總體沒(méi)有總體單位總數(shù);一個(gè)總體中只有一個(gè)單位總數(shù),但可以有多個(gè)標(biāo)志總量,它們由總體單位的數(shù)量標(biāo)志值匯總而來(lái)??傮w單位總數(shù)總體所包含的總體單位的數(shù)量(Amount of popula

3、tion unit)總體標(biāo)志總量總體單位某一數(shù)量標(biāo)志的標(biāo)志值總和(Amount of indicate)總量指標(biāo)按反映的總體內(nèi)容分類(lèi)自然單位度量衡單位標(biāo)準(zhǔn)實(shí)物單位計(jì)量單位多個(gè)單位的結(jié)合運(yùn)用:雙重單位(如:人/平方公里)多重單位(如:艘/噸/千瓦)適用范圍綜合能力差強(qiáng)大小如:臺(tái)、件如:米、平方米如:標(biāo)準(zhǔn)噸如:工日、工時(shí)如:元實(shí)物單位價(jià)值單位勞動(dòng)單位(Unit of labor force)(Physical unit)(Unit of value)復(fù)合單位(如:人次、噸公里)(Unit of complex meterage)拖拉機(jī)混合產(chǎn)量4臺(tái)拖拉機(jī)標(biāo)準(zhǔn)實(shí)物產(chǎn)量5臺(tái)甲企業(yè)乙企業(yè)利潤(rùn)總額資金占用資

4、金利潤(rùn)率500萬(wàn)元 5000萬(wàn)元 3000萬(wàn)元40000萬(wàn)元16.7%12.5%比較兩廠經(jīng)濟(jì)效益不可比不可比可比2、相對(duì)指標(biāo)無(wú)名數(shù)用倍數(shù)、系數(shù)、成數(shù)、等表示有名數(shù)用雙重計(jì)量單位表示的復(fù)名數(shù)相對(duì)指標(biāo)的基本表現(xiàn)形式倍數(shù)與成數(shù)應(yīng)當(dāng)用整數(shù)的形式來(lái)表述5倍、3成、近7成3.25倍、8.6成分母為1分母為1.00分母為10分母為100分母為1000(2)相對(duì)指標(biāo)的種類(lèi)結(jié)構(gòu)相對(duì)數(shù)比例相對(duì)數(shù)比較相對(duì)數(shù)計(jì)劃完成程度相對(duì)數(shù)強(qiáng)度相對(duì)數(shù)動(dòng)態(tài)相對(duì)數(shù)例:我國(guó)某年國(guó)民收入使用額為19715億元,其中消費(fèi)額為12945億元,積累額為6770億元。則(1)結(jié)構(gòu)相對(duì)數(shù)(Relative quantities of structu

5、re)2、相對(duì)指標(biāo)的計(jì)算方法說(shuō)明為無(wú)名數(shù); 同一總體各組的結(jié)構(gòu)相對(duì)數(shù)之和為1;用來(lái)分析現(xiàn)象總體的內(nèi)部構(gòu)成狀況。例:我國(guó)某年國(guó)民收入使用額為19715億元,其中消費(fèi)額為12945億元,積累額為6770億元。則為無(wú)名數(shù),可用百分?jǐn)?shù)或一比幾或幾比幾表示;用來(lái)反映組與組之間的聯(lián)系程度或比例關(guān)系。說(shuō)明(2)比例相對(duì)數(shù)(Relative quantities of proportion)例:某年某地區(qū)甲、乙兩個(gè)公司商品銷(xiāo)售額分別為5.4億元和3.6億元。則為無(wú)名數(shù),一般用倍數(shù)、系數(shù)表示; 用來(lái)說(shuō)明現(xiàn)象發(fā)展的不均衡程度。 說(shuō)明(3)比較相對(duì)數(shù)(Relative quantities of comparati

6、vity) 是同類(lèi)指標(biāo)數(shù)值在不同時(shí)間上的對(duì)比動(dòng)態(tài)相對(duì)數(shù)為無(wú)名數(shù); 用來(lái)反映現(xiàn)象的數(shù)量在時(shí)間上的變動(dòng)程度。說(shuō)明 (4)動(dòng)態(tài)相對(duì)數(shù)(Dynamic Relative quantities )例:某年某地區(qū)年平均人口數(shù)為100萬(wàn)人,在該年度內(nèi)出生的人口數(shù)為8600人。則該地區(qū)一般用、表示。其特點(diǎn)是分子來(lái)源于分母,但分母并不是分子的總體,二者所反映現(xiàn)象數(shù)量的時(shí)間狀況不同。無(wú)名數(shù)的強(qiáng)度相對(duì)數(shù)(5)強(qiáng)度相對(duì)數(shù)(Intensity relative quantities)1)短期計(jì)劃完成情況的檢查 計(jì)劃數(shù)與實(shí)際數(shù)同期時(shí),直接應(yīng)用公式:A.計(jì)劃任務(wù)數(shù)表現(xiàn)為絕對(duì)數(shù)時(shí)(6)計(jì)劃完成相對(duì)數(shù)(Relative qua

7、ntities of fulfillment of plan)例:某企業(yè)2000年計(jì)劃產(chǎn)量為10萬(wàn)件,而實(shí)際至第三季度末已生產(chǎn)了8萬(wàn)件,全年實(shí)際共生產(chǎn)11萬(wàn)件。則 考察計(jì)劃執(zhí)行進(jìn)度情況:年份19961997199819992000合計(jì)投資額(億元)11.411.912.512.813.161.7其中,2000年各月份實(shí)際完成情況為(單位:億元):月份123456789101112投資額1.11.01.21.11.11.11.21.21.31.10.90.8要求計(jì)算:該市“九五”期間固定資產(chǎn)投資計(jì)劃的完成程度;提前完成計(jì)劃的時(shí)間。已累計(jì)完成固定資產(chǎn)投資額60億元例:某市計(jì)劃“九五”期間要完成社會(huì)

8、固定資產(chǎn)投資 總額60億元,計(jì)劃任務(wù)的實(shí)際完成情況為:解:提前完成計(jì)劃時(shí)間:因?yàn)榈?000年10月底已完成固定資產(chǎn)累計(jì)投資額60億元(61.70.80.9=60),即已完成計(jì)劃任務(wù),提前完成計(jì)劃兩個(gè)月。例:某市計(jì)劃“九五”期間要完成社會(huì)固定資產(chǎn)投資總額60億元,計(jì)劃任務(wù)的實(shí)際完成情況為:年份19961997199819992000合計(jì)投資額(億元)11.411.912.512.813.161.7其中,2000年各月份實(shí)際完成情況為(單位:億元):月份123456789101112投資額1.11.01.21.11.11.11.21.21.31.10.90.81.10.8如何確定提前完成計(jì)劃的時(shí)間

9、?思考月份123456789101112投資額1.11.11.21.11.11.11.21.21.31.10.80.8【分析】已累計(jì)完成固定資產(chǎn)投資額60.1億元已累計(jì)完成固定資產(chǎn)投資額59億元可以判斷出,計(jì)劃任務(wù)應(yīng)是在2000年10月份的某一天完成的假定10月份每天都完成相等的投資額59億元60.1億元601億元0.1億元在2000年10月為完成尚差的1.0億元投資額的計(jì)劃任務(wù)需要的天數(shù):【方法一】在2000年10月為完成超額的0.1億元的投資額所用的天數(shù):【方法二】即提前完成任務(wù)兩個(gè)月零兩天。即提前完成任務(wù)兩個(gè)月零兩天。B. 計(jì)劃任務(wù)數(shù)表現(xiàn)為相對(duì)數(shù)時(shí)例:己知某廠2000年的計(jì)劃規(guī)定產(chǎn)品產(chǎn)量

10、要比上年實(shí)際提高5而實(shí)際提高了7。則百分點(diǎn)相當(dāng)于百分?jǐn)?shù)的計(jì)量單位,一個(gè)百分點(diǎn)就指1。上例中,實(shí)際比計(jì)劃多提高的百分點(diǎn)為(7-5)100=2(個(gè)百分點(diǎn))實(shí)際工作中常用,但并不是相對(duì)數(shù)原始數(shù)據(jù)靜態(tài)分布動(dòng)態(tài)趨勢(shì)總量指標(biāo)(絕對(duì)規(guī)模)相對(duì)指標(biāo)(相對(duì)關(guān)系)平均指標(biāo)(集中趨勢(shì))變異指標(biāo)(離散趨勢(shì))分布指標(biāo)(分布狀況)水平指標(biāo)(絕對(duì)規(guī)模)速度指標(biāo)(相對(duì)變化)因素分析(趨勢(shì)預(yù)測(cè))統(tǒng)計(jì)指標(biāo)加工整理總結(jié):原始數(shù)據(jù)統(tǒng)計(jì)指標(biāo)靜態(tài)分布動(dòng)態(tài)趨勢(shì)總量指標(biāo)相對(duì)指標(biāo)平均指標(biāo)變異指標(biāo)分布指標(biāo)水平指標(biāo)速度指標(biāo)因素分析不同年份人口數(shù)人口自然增長(zhǎng)率人口數(shù)量模型人口總數(shù)人口性別比例平均年齡年齡標(biāo)準(zhǔn)差偏度、峰度整理加工加工正確選擇對(duì)比的基礎(chǔ)

11、;指標(biāo)對(duì)比要有可比性;相對(duì)指標(biāo)要與總量指標(biāo)結(jié)合運(yùn)用;多種相對(duì)指標(biāo)結(jié)合運(yùn)用。使用相對(duì)指標(biāo)應(yīng)注意的問(wèn)題結(jié)構(gòu)相對(duì)數(shù)比例相對(duì)數(shù)比較相對(duì)數(shù)動(dòng)態(tài)相對(duì)數(shù)計(jì)劃完成相對(duì)數(shù)強(qiáng)度相對(duì)數(shù)(部分與總體關(guān)系)(部分與部分關(guān)系)(橫向?qū)Ρ汝P(guān)系)(縱向?qū)Ρ汝P(guān)系)(實(shí)際與計(jì)劃關(guān)系)(關(guān)聯(lián)指標(biāo)間關(guān)系)多種相對(duì)指標(biāo)應(yīng)當(dāng)結(jié)合運(yùn)用第二節(jié) 集中趨勢(shì)的描述一、數(shù)值平均數(shù)二、位置平均數(shù)集中趨勢(shì)的現(xiàn)實(shí)意義83名女生的身高分布的集中趨勢(shì)、中心數(shù)值算術(shù)平均數(shù)集中趨勢(shì)的分布涵義集中趨勢(shì) 集中趨勢(shì)(Central Tendency)反映的是一組數(shù)據(jù)向某一中心值靠攏的傾向,在中心附近的數(shù)據(jù)數(shù)目較多,而遠(yuǎn)離中心的較少。對(duì)集中趨勢(shì)進(jìn)行描述就是尋找數(shù)據(jù)一般水

12、平的中心值或代表值。用平均指標(biāo)來(lái)反映。(平均指標(biāo)指同質(zhì)總體中各單位某一數(shù)量標(biāo)志的一般水平,是對(duì)總體單位間數(shù)量差異的抽象化。)可以反映現(xiàn)象總體的客觀規(guī)定性;可以對(duì)比同類(lèi)現(xiàn)象在不同的時(shí)間、地點(diǎn) 和條件下的一般水平;可以分析現(xiàn)象之間的依存關(guān)系。集中趨勢(shì) (位置)測(cè)定集中趨勢(shì)的意義平均指標(biāo)的種類(lèi)數(shù)值平均數(shù)位置平均數(shù)平均數(shù)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)分位數(shù)算術(shù)平均數(shù) 算術(shù)平均數(shù)(Arithmetic mean)是總體中各個(gè)體的某個(gè)數(shù)量標(biāo)志的總和與個(gè)體總數(shù)的比值,一般用符號(hào) 表示。 簡(jiǎn)單算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì) 簡(jiǎn)單算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)權(quán)數(shù)權(quán)數(shù) 次數(shù)f的作用:當(dāng)變量值比

13、較大的次數(shù)多時(shí),平均數(shù)就接近于變量值大的一方;當(dāng)變量值比較小的次數(shù)多時(shí),平均數(shù)就接近于變量值小的一方??梢?jiàn),次數(shù)對(duì)變量值在平均數(shù)中的影響起著某種權(quán)衡輕重的作用,因此被稱(chēng)為權(quán)數(shù)。算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)調(diào)和平均數(shù) 調(diào)和平均數(shù)(Harmonic mean)是各變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。由于它是根據(jù)變量值倒數(shù)計(jì)算的,所以又稱(chēng)作倒數(shù)平均數(shù),通常用 表示。簡(jiǎn)單調(diào)和平均數(shù)加權(quán)調(diào)和平均數(shù)調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形 簡(jiǎn)單調(diào)和平均數(shù)加權(quán)調(diào)和平均數(shù)調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形幾何平均數(shù) 幾何平均數(shù)(Geometric mean)是n個(gè)變量值連乘積的n次方根。幾何平均數(shù)是計(jì)算平均比率和平均速度最適用的一種方法。通

14、常用 表示。應(yīng)用于計(jì)算現(xiàn)象的平均比率或平均速度。簡(jiǎn)單幾何平均數(shù)加權(quán)幾何平均數(shù)簡(jiǎn)單幾何平均數(shù)適用于總體資料未經(jīng)分組整理尚為原始資料的情況加權(quán)幾何平均數(shù)注意:不能直接平均增長(zhǎng)速度適用于總體資料經(jīng)過(guò)分組整理形成變量數(shù)列的情況中 位 數(shù) 中位數(shù)(Median)是一組數(shù)據(jù)按大小順序排列后,處于中間位置的那個(gè)變量值,通常用 表示。其定義表明,中位數(shù)就是將某變量的全部數(shù)據(jù)均等地分為兩半的那個(gè)變量值:一半數(shù)值小于中位數(shù),另一半數(shù)值大于中位數(shù)。中位數(shù)是一個(gè)位置代表值,因此它不受極端變量值的影響。由未分組數(shù)據(jù)確定中位數(shù)由單項(xiàng)數(shù)列確定中位數(shù)由組距數(shù)列確定中位數(shù)由未分組數(shù)據(jù)確定中位數(shù) 對(duì)未分組數(shù)據(jù)資料,需先將各變量值

15、按大小順序排列,并按公式 確定中位數(shù)的位置。當(dāng)一個(gè)序列中的項(xiàng)數(shù)為奇數(shù)時(shí),則處于序列中間位置的變量值就是中位數(shù)。 例: 7、6、8、2、3 當(dāng)一個(gè)序列的項(xiàng)數(shù)是偶數(shù)時(shí),則應(yīng)取中間兩個(gè)數(shù)的中點(diǎn)值作為中位數(shù),即取中間兩個(gè)變量值的平均數(shù)為中位數(shù)。 例: 2、5、7、8、11、12 由單項(xiàng)數(shù)列確定中位數(shù) 先計(jì)算各組的累計(jì)次數(shù),再按公式 確定中位數(shù)的位置,并對(duì)照累計(jì)次數(shù)確定中位數(shù)。由組距數(shù)列確定中位數(shù)下限公式:上限公式:分位數(shù) 三個(gè)數(shù)值可以將變量數(shù)列劃分為項(xiàng)數(shù)相等的四部分,這三個(gè)數(shù)值就定義為四分位數(shù)(Quartiles)。 十分位數(shù)(Dectile)和百分位數(shù)(Percentile)分別是將變量數(shù)列十等分和

16、一百等分的數(shù)值 。四分位數(shù) (位置的確定)未分組數(shù)據(jù):未分組數(shù)據(jù)的四分位數(shù) (9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9未分組數(shù)據(jù)的四分位數(shù) (10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 660 1080 850 960 2000 1250 1630排 序: 660 750 780 850 960 1080 1250 1

17、500 1630 2000位 置: 1 2 3 4 5 6 7 8 9 10 眾 數(shù) 眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)變量值,通常用 表示。由未分組數(shù)據(jù)確定眾數(shù)由單項(xiàng)數(shù)列確定眾數(shù)由組距數(shù)列確定眾數(shù)眾數(shù)的原理及應(yīng)用83名女生身高原始數(shù)據(jù)83名女生身高組距數(shù)列出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200沒(méi)有突出地集中在某個(gè)年份413名學(xué)生出生時(shí)間分布直方圖眾數(shù)的原理及應(yīng)用(無(wú)眾數(shù))192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5

18、168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100413名學(xué)生的身高分布直方圖(雙眾數(shù))當(dāng)數(shù)據(jù)分布呈現(xiàn)出雙眾數(shù)或多眾數(shù)時(shí),可以斷定這些數(shù)據(jù)來(lái)源于不同的總體。出現(xiàn)了兩個(gè)明顯的分布中心當(dāng)數(shù)據(jù)分布存在明顯的集中趨勢(shì),且有顯著的極端值時(shí),適合使用眾數(shù);當(dāng)數(shù)據(jù)分布的集中趨勢(shì)不明顯或存在兩個(gè)以上分布中心時(shí),不適合使用眾數(shù)(前者無(wú)眾數(shù),后者為雙眾數(shù)或多眾數(shù),也等于沒(méi)有眾數(shù))。眾數(shù)的原理及應(yīng)用由未分組數(shù)據(jù)確定眾數(shù)例1: 7、6、8、2、3例2: 7、6、8、2、3 、4、3、2、3例3: 7、6、8、2、3 、4、3、2、3

19、、2由單項(xiàng)數(shù)列確定眾數(shù)由組距數(shù)列確定眾數(shù)下限公式:上限公式:對(duì)比1. 眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系2. 眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的特點(diǎn)與應(yīng)用場(chǎng)合眾數(shù):不受極端值影響,具有不唯一性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù):不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用平均數(shù):易受極端值影響,數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對(duì)稱(chēng)分布或接近對(duì)稱(chēng)分布時(shí)應(yīng)用左偏分布均值 中位數(shù) 眾數(shù)對(duì)稱(chēng)分布 均值= 中位數(shù)= 眾數(shù)右偏分布眾數(shù) 中位數(shù)均值未分組數(shù)據(jù)箱線(xiàn)圖(box plot)用于顯示未分組的原始數(shù)據(jù)的分布箱線(xiàn)圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線(xiàn)段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位

20、數(shù)Me 和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分(位)數(shù)畫(huà)出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接 未分組數(shù)據(jù)單批數(shù)據(jù)箱線(xiàn)圖(箱線(xiàn)圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡(jiǎn)單箱線(xiàn)圖未分組數(shù)據(jù)單批數(shù)據(jù)箱線(xiàn)圖(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140 150 160 170 180 190 200 210 220 230 240某電腦公司銷(xiāo)售量數(shù)據(jù)的箱線(xiàn)圖思考題你是 Prudential-Bache 證券公司的金融分析員。你已經(jīng)收集了新發(fā)行股票的下列收盤(pán)價(jià): 17, 16, 21, 18, 13, 16, 12, 11.

21、試描述股票價(jià)格的集中趨勢(shì)集中趨勢(shì)題解平均數(shù)(Mean)中位數(shù)(Median)原始數(shù)據(jù):1716211813161211排序之后:1112131616171821位置:12345678集中趨勢(shì)題解眾數(shù)(Mode)原始數(shù)據(jù):1716211813161211排序之后:1112131616171821眾數(shù)為:16集中趨勢(shì)題解集中趨勢(shì)題解四分位數(shù)原始數(shù)據(jù):17 16 21 18 13 16 12 11排序之后:11 12 13 16 16 17 18 21 位置: 1 2 3 4 5 6 7 8四分位數(shù)分別為:Q1=12.25; Q2=16; Q3=17.75;一、極差與四分位差二、標(biāo)準(zhǔn)差與方差三、離散

22、系數(shù)第三節(jié) 離散程度的描述 課 程學(xué)生統(tǒng)計(jì)高數(shù)英語(yǔ)總成績(jī)平均成績(jī)甲乙丙606555656565706575195195195656565單位:分某班三名同學(xué)三門(mén)課程的成績(jī)?nèi)缦拢赫?qǐng)比較三名同學(xué)學(xué)習(xí)成績(jī)的差異。離中趨勢(shì)的體現(xiàn)集中趨勢(shì)弱、離散趨勢(shì)強(qiáng)集中趨勢(shì)強(qiáng)、離散趨勢(shì)弱反映統(tǒng)計(jì)數(shù)據(jù)差異程度的綜合指標(biāo),也稱(chēng)為標(biāo)志變動(dòng)度變異指標(biāo)值越大,平均指標(biāo)的代表性越??;反之,平均指標(biāo)的代表性越大指總體中各單位標(biāo)志值背離分布中心的規(guī)?;虺潭?,用標(biāo)志變異指標(biāo)來(lái)反映。離散趨勢(shì)Discrete tendency離散趨勢(shì)的涵義測(cè)定離散趨勢(shì)的意義用來(lái)衡量和比較平均數(shù)代表性的大??;用來(lái)反映社會(huì)經(jīng)濟(jì)活動(dòng)過(guò)程的均衡性和節(jié)奏性;用來(lái)測(cè)

23、定變量數(shù)列次數(shù)分布較正態(tài)分布的偏離程度。 極差與四分位差 極差(Range)也叫全距,是一組數(shù)據(jù)的最大值與最小值之離差,即: 四分位差(Interquartile range)是指第三四分位數(shù)與第一四分位數(shù)之差,也稱(chēng)為內(nèi)距或四分間距又稱(chēng)為伸展中心,用 表示。四分位差的計(jì)算公式為: 優(yōu)點(diǎn):計(jì)算方法簡(jiǎn)單、易懂;缺點(diǎn):易受極端數(shù)值的影響,不能全面反映所有標(biāo)志值差異大小及分布狀況,準(zhǔn)確程度差往往應(yīng)用于生產(chǎn)過(guò)程的質(zhì)量控制中極差的特點(diǎn)四分位差的特點(diǎn)度量數(shù)據(jù)的離散程度Measure of Dispersion此間距包括中間50%的數(shù)據(jù)不受極值影響 平均差 平均差(Mean deviation)也稱(chēng)平均離差,

24、是各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù),通常用 表示。簡(jiǎn)單式平均差加權(quán)式平均差 簡(jiǎn)單式平均差【例】某售貨小組5個(gè)人,某天的銷(xiāo)售額分別為440元、480元、520元、600元、750元,求該售貨小組銷(xiāo)售額的平均差。解:即該售貨小組5個(gè)人銷(xiāo)售額的平均差為93.6元。 加權(quán)式平均差【例】計(jì)算下表中某公司職工月工資的平均差。月工資(元)組中值(元)職工人數(shù) (人)300以下300400400500500600600700700800800900900以上2503504505506507508509502083143824563052377820合計(jì)2000解:即該公司職工月工資的平均差為138.95元

25、。優(yōu)點(diǎn):不易受極端數(shù)值的影響,能綜合反映全部單位標(biāo)志值的實(shí)際差異程度;缺點(diǎn):用絕對(duì)值的形式消除各標(biāo)志值與算術(shù)平均數(shù)離差的正負(fù)值問(wèn)題,不便于作數(shù)學(xué)處理和參與統(tǒng)計(jì)分析運(yùn)算。平均差的特點(diǎn) 一般情況下都是通過(guò)計(jì)算另一種變異指標(biāo)標(biāo)準(zhǔn)差,來(lái)反映總體內(nèi)部各單位標(biāo)志值的差異狀況. 標(biāo)準(zhǔn)差與方差 標(biāo)準(zhǔn)差(Standard deviation)又稱(chēng)均方差,它是各單位變量值與其平均數(shù)離差平方的平均數(shù)的方根,通常用 表示。它是測(cè)度數(shù)據(jù)離散程度的最主要方法。 方差(Variance)是各變量值與其算術(shù)平均數(shù)離差平方和的平均數(shù),即是標(biāo)準(zhǔn)差的平方,用 表示總體的方差;用 表示樣本的方差。 總體標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)差簡(jiǎn)單式標(biāo)準(zhǔn)差

26、 加權(quán)式標(biāo)準(zhǔn)差 簡(jiǎn)單式標(biāo)準(zhǔn)差 加權(quán)式標(biāo)準(zhǔn)差【例】計(jì)算下表中某公司職工月工資的標(biāo)準(zhǔn)差。月工資(元)組中值(元)職工人數(shù)(人)300以下300400400500500600600700700800800900900以上2503504505506507508509502083143824563052377820合計(jì)2000解:(比較:其工資的平均差為138.95元)即該公司職工月工資的標(biāo)準(zhǔn)差為167.9元。 總體與樣本標(biāo)準(zhǔn)差簡(jiǎn)單式加權(quán)式總體樣本注意:樣本標(biāo)準(zhǔn)差用自由度n-1去除!樣本方差自由度一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n 時(shí),若樣本均值x 確定后,只有n-1個(gè)數(shù)據(jù)可以自由

27、取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來(lái)解釋?zhuān)瑥膶?shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差2時(shí),它是2的無(wú)偏估計(jì)量標(biāo)準(zhǔn)差的特點(diǎn)不易受極端數(shù)值的影響,能綜合反映全部單位標(biāo)志值的實(shí)際差異程度;用平方的方法消除各標(biāo)志值與算術(shù)平均數(shù)離差的正負(fù)值問(wèn)題,可方便地用于數(shù)學(xué)處理和統(tǒng)計(jì)分析運(yùn)算.由同一資料計(jì)算的標(biāo)準(zhǔn)差的結(jié)果一般要略大于平均差。 數(shù)據(jù)標(biāo)準(zhǔn)

28、化 數(shù)據(jù)標(biāo)準(zhǔn)化是變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,也稱(chēng)為z分?jǐn)?shù)或標(biāo)準(zhǔn)化數(shù)值。可用于判斷一組數(shù)據(jù)是否有離群點(diǎn),設(shè)標(biāo)準(zhǔn)化數(shù)值為z,則有:數(shù)據(jù)標(biāo)準(zhǔn)化 (性質(zhì))1. 均值等于02.方差等于1數(shù)據(jù)標(biāo)準(zhǔn)化 (性質(zhì))z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線(xiàn)性變換,它并沒(méi)有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒(méi)有改變?cè)摻M數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。 標(biāo)準(zhǔn)化值 (例題分析)9個(gè)家庭人均月收入標(biāo)準(zhǔn)化值計(jì)算表 家庭編號(hào)人均月收入(元) 標(biāo)準(zhǔn)化值 z 123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5

29、561.8530.1160.996經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱(chēng)分布時(shí)約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 切比雪夫不等式(Chebyshevs inequality )如果一組數(shù)據(jù)不是對(duì)稱(chēng)分布,經(jīng)驗(yàn)法則就不再使用,這時(shí)可使用切比雪夫不等式,它對(duì)任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有 (1-1/ ) 的數(shù)據(jù)落在k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù) 切比雪夫不等式(Che

30、byshevs inequality )對(duì)于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 離散系數(shù) 對(duì)于平均數(shù)不等或計(jì)量單位不同的不同組別的變量值,是不能直接用離散程度的絕對(duì)指標(biāo)比較其離散程度的。為了消除變量平均數(shù)不等和計(jì)量單位不同對(duì)離散程度測(cè)度值的影響,需要計(jì)算離散程度的相對(duì)指標(biāo),即離散系數(shù),又稱(chēng)為變異系數(shù).其一般公式是:可比變異系數(shù)指標(biāo)身高的差異水平:cm體重的差異水平:kg用變異系數(shù)可以相互比較可比【例】某年級(jí)一、二兩班某門(mén)課的平均成績(jī)分別為82

31、分和76分,其成績(jī)的標(biāo)準(zhǔn)差分別為15.6分和14.8分,比較兩班平均成績(jī)代表性的大小。解:一班成績(jī)的標(biāo)準(zhǔn)差系數(shù)為:二班成績(jī)的標(biāo)準(zhǔn)差系數(shù)為:因?yàn)?,所以一班平均成績(jī)的代表性比二班好。標(biāo)準(zhǔn)差系數(shù) 用來(lái)對(duì)比不同水平的同類(lèi)現(xiàn)象,特別是不同類(lèi)現(xiàn)象總體平均數(shù)代表性的大小:標(biāo)準(zhǔn)差系數(shù)小的總體,其平均數(shù)的代表性大;反之,亦然。應(yīng)用:離散系數(shù)(Coefficient of variation)分組單位數(shù)變量值具有某一屬性不具有某一屬性10合計(jì)為研究是非標(biāo)志總體的數(shù)量特征,令指總體中全部單位只具有“是”或“否”、“有”或“無(wú)”兩種表現(xiàn)形式的標(biāo)志,又叫交替標(biāo)志是非標(biāo)志是非標(biāo)志的標(biāo)準(zhǔn)差及方差是非標(biāo)志總體的指標(biāo)具有某種

32、標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)不具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)指是非標(biāo)志總體中具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部總體單位總數(shù)的比重成數(shù)是非標(biāo)志總體的指標(biāo)均值標(biāo)準(zhǔn)差是非標(biāo)志總體的指標(biāo)方差標(biāo)準(zhǔn)差系數(shù)【例】某廠某月份生產(chǎn)了400件產(chǎn)品,其中合格品380件,不合格品20件。求產(chǎn)品質(zhì)量分布的集中趨勢(shì)與離中趨勢(shì)。是非標(biāo)志總體的指標(biāo)解:變異程度題解 (Variation Solution) 全距和四分位差原始數(shù)據(jù):1716211813161211排序之后:1112131616171821位置:12345678四分位差QQ3118126全距XX最大值最小值211110變異程度題解 樣本方差(Sample Variance)原始數(shù)據(jù):1716211813161211S(XX)nXXnSiiniin221122221155(17155)(16155)(11155)811114其中 .(XX)in22變異程度題解樣本標(biāo)準(zhǔn)差變異系數(shù)SS(XX)niin22111114334.一、分布的偏態(tài)二、分布的峰態(tài)第四節(jié) 分布的偏態(tài)與峰態(tài)偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)分布

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論