第2章數(shù)據(jù)的表述_第1頁(yè)
第2章數(shù)據(jù)的表述_第2頁(yè)
第2章數(shù)據(jù)的表述_第3頁(yè)
第2章數(shù)據(jù)的表述_第4頁(yè)
第2章數(shù)據(jù)的表述_第5頁(yè)
已閱讀5頁(yè),還剩121頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章數(shù)據(jù)的表述一、數(shù)據(jù)的分類(lèi)二、數(shù)據(jù)的整理三、數(shù)據(jù)的概括性度量指標(biāo)主要內(nèi)容目錄一、數(shù)據(jù)的分類(lèi)(一)數(shù)據(jù)分類(lèi)的原則互斥原則:每一個(gè)數(shù)據(jù)只能劃歸到某一類(lèi)型中,而不能既是這一類(lèi),又是那一類(lèi)。窮盡原則:所有被觀察的數(shù)據(jù)都可被歸屬到適當(dāng)?shù)念?lèi)型中,沒(méi)有一個(gè)數(shù)據(jù)無(wú)從歸屬。(二)數(shù)據(jù)的類(lèi)型1.定性數(shù)據(jù)和定量數(shù)據(jù)定性數(shù)據(jù):用文字描述的。如消費(fèi)者對(duì)國(guó)美所提供服務(wù)的總體評(píng)價(jià)等都屬于文字描述的定性數(shù)據(jù)。定量數(shù)據(jù):用數(shù)字描述的。如企業(yè)的凈資產(chǎn)額、凈利潤(rùn)額等。2.離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù)類(lèi)型離散型變量:數(shù)據(jù)只能取整數(shù)。如一家公司的職工人數(shù)。連續(xù)型變量的數(shù)據(jù)可以取介于兩個(gè)數(shù)值之間的任意數(shù)值。如銷(xiāo)售額、經(jīng)濟(jì)增長(zhǎng)率等。

3.數(shù)據(jù)的四個(gè)等級(jí)定類(lèi)數(shù)據(jù)例如,對(duì)人口按性別劃分為男性和女性?xún)深?lèi)。也稱(chēng)列名數(shù)據(jù)(分類(lèi)數(shù)據(jù)),這種數(shù)據(jù)只對(duì)事物的某種屬性和類(lèi)別進(jìn)行具體的定性描述。能夠進(jìn)行的唯一運(yùn)算是計(jì)數(shù),即計(jì)算每一個(gè)類(lèi)型的頻數(shù)或頻率(即比重)。定序數(shù)據(jù)例如,對(duì)企業(yè)按經(jīng)營(yíng)管理的水平和取得的效益劃分為一級(jí)企業(yè)、二級(jí)企業(yè)等。定序數(shù)據(jù),也稱(chēng)順序數(shù)據(jù),是對(duì)事物所具有的屬性順序進(jìn)行描述。定距數(shù)據(jù)如10℃、20℃等。它不僅有明確的高低之分,而且可以計(jì)算差距,如20℃比10℃高10℃,比5℃高15℃等。也稱(chēng)間距數(shù)據(jù),是比定序數(shù)據(jù)的描述功能更好一些的定量數(shù)據(jù)。定距測(cè)定的量可以進(jìn)行加或減的運(yùn)算,但卻不能進(jìn)行乘或除的運(yùn)算。定比數(shù)據(jù)如產(chǎn)量、產(chǎn)值、固定資產(chǎn)投資額、居民貨幣收入和支出、銀行存款余額等。也稱(chēng)比率數(shù)據(jù),是比定距數(shù)據(jù)更高一級(jí)的定量數(shù)據(jù)。它不僅可以進(jìn)行加減運(yùn)算,而且還可以作乘除運(yùn)算。測(cè)定層次特征運(yùn)算功能舉例1.定類(lèi)測(cè)定2.定序測(cè)定3.定距測(cè)定4.定比測(cè)定分類(lèi)分類(lèi);排序分類(lèi);排序;有基本測(cè)量單位分類(lèi);排序;有基本測(cè)量單位;有絕對(duì)零點(diǎn)計(jì)數(shù)計(jì)數(shù);排序計(jì)數(shù);排序;加減計(jì)數(shù);排序;加減乘除產(chǎn)業(yè)分類(lèi)企業(yè)等級(jí)溫度商品銷(xiāo)售額統(tǒng)計(jì)數(shù)據(jù)四個(gè)層次的概括

《知音漫客》問(wèn)卷大調(diào)查Q1.看完《知音漫客》第五集的感覺(jué)是什么?1.非常有趣2.有點(diǎn)有趣3.一般4.有點(diǎn)無(wú)趣5.非常無(wú)趣Q2.你的性別是?1.女2.男Q3.你的年齡是?___歲Q4.平均每月購(gòu)買(mǎi)幾本雜志?___本氣溫是什么數(shù)據(jù)?出生地呢?柔道的段位?體重?二、統(tǒng)計(jì)數(shù)據(jù)的整理統(tǒng)計(jì)搜集到的大量資料是分散的,不系統(tǒng)的,只能說(shuō)明各個(gè)單位的特征和屬性,必須按照科學(xué)的原則加以整理,使之條理化和系統(tǒng)化,成為便于儲(chǔ)存和傳遞的、反映總體特征的數(shù)據(jù)。基本問(wèn)題要弄清所面對(duì)的數(shù)據(jù)類(lèi)型不同類(lèi)型的數(shù)據(jù),采取不同的處理方式和方法對(duì)分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)主要是作分類(lèi)整理對(duì)數(shù)值型數(shù)據(jù)則主要是作分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)分類(lèi)數(shù)據(jù)的整理與圖示定類(lèi)數(shù)據(jù)的整理

(基本過(guò)程)1. 列出各類(lèi)別2.計(jì)算各類(lèi)別的頻數(shù)3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)分類(lèi)頻數(shù)比例百分比比率ABCDE定類(lèi)數(shù)據(jù)的整理

(可計(jì)算的統(tǒng)計(jì)量)

SPSS中的頻數(shù)分布表頻數(shù)(Frequency):變量值落在某個(gè)區(qū)間(或某個(gè)類(lèi)別)中的次數(shù)。百分比(Percent):各頻數(shù)占總樣本數(shù)的百分比。有效百分比(ValidPercent):各頻數(shù)占有效樣本數(shù)的百分比。定類(lèi)數(shù)據(jù)整理—頻數(shù)分布表

(例題分析)【例】一家市場(chǎng)調(diào)查公司為研究不同品牌飲料的市場(chǎng)占有率,對(duì)隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對(duì)50名顧客購(gòu)買(mǎi)飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購(gòu)買(mǎi)某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)綠色健康飲品使用Excel計(jì)數(shù)函數(shù)(COUNTIF)如果只需要計(jì)算某一類(lèi)別的數(shù)據(jù)個(gè)數(shù),可以使用Excel中的統(tǒng)計(jì)函數(shù)【COUNTIF】。在對(duì)話框【Range】后輸入數(shù)據(jù)區(qū)域,在【Criteria】后輸入數(shù)字、表達(dá)式、字符串等,計(jì)數(shù)單元格必須符合的條件,即可得出結(jié)果例如,我們要計(jì)算出可口可樂(lè)出現(xiàn)的頻數(shù),在【Range】后輸入A1:A50(數(shù)據(jù)所在的區(qū)域),在【Criteria】后輸入“可口可樂(lè)”,結(jié)果為15。如果數(shù)據(jù)區(qū)域是數(shù)值型數(shù)據(jù),計(jì)算符合特定條件的數(shù)據(jù)個(gè)數(shù),則可在【Criteria】后輸入“>某一數(shù)值”、“<某一數(shù)值”、“=某一數(shù)值”,等等統(tǒng)計(jì)函數(shù)—COUNTIF分類(lèi)數(shù)據(jù)的圖示—條形圖

(barchart)用寬度相同的條形的高度或長(zhǎng)短來(lái)表示各類(lèi)別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類(lèi)數(shù)據(jù)的頻數(shù)分布繪制時(shí),各類(lèi)別可以放在縱軸,稱(chēng)為條形圖,也可以放在橫軸,稱(chēng)為柱形圖(columnchart)分類(lèi)數(shù)據(jù)的圖示—條形圖

(例題分析)分類(lèi)數(shù)據(jù)的圖示—帕雷托圖(Paretochart)按各類(lèi)別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖主要用于展示分類(lèi)數(shù)據(jù)的分布分類(lèi)數(shù)據(jù)的圖示—對(duì)比條形圖

(side-by-sidebarchart)分類(lèi)變量在不同時(shí)間或不同空間上有多個(gè)取值對(duì)比分類(lèi)變量的取值在不同時(shí)間或不同空間上的差異或變化趨勢(shì)電腦品牌一季度二季度聯(lián)想256468IBM285397康柏247328戴爾563688分類(lèi)數(shù)據(jù)的圖示—對(duì)比條形圖

(例題分析)分類(lèi)數(shù)據(jù)的圖示—餅圖

(piechart)也稱(chēng)圓形圖,是用圓形及圓內(nèi)扇形的角度來(lái)表示數(shù)值大小的圖形主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問(wèn)題繪制圓形圖時(shí),樣本或總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形角度表示,這些扇形的中心角度,按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定分類(lèi)數(shù)據(jù)的圖示—餅圖

(例題分析)順序數(shù)據(jù)的整理

(可計(jì)算的統(tǒng)計(jì)量)1.

累積頻數(shù)(cumulativefrequencies):各類(lèi)別頻數(shù)的逐級(jí)累加2.累積頻率(cumulativepercentages):各類(lèi)別頻率(百分比)的逐級(jí)累加順序數(shù)據(jù)的頻數(shù)分布表

(例題分析)【例】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿意?”1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別甲城市戶數(shù)(戶)百分比(%)向下累積向上累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計(jì)300100.0————順序數(shù)據(jù)的頻數(shù)分布表

(例題分析)乙城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計(jì)300100.0————順序數(shù)據(jù)的圖示—累計(jì)頻數(shù)分布圖

(例題分析)243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布環(huán)形圖

(doughnutchart)環(huán)形圖中間有一個(gè)“空洞”,樣本或總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示與餅圖類(lèi)似,但又有區(qū)別餅圖只能顯示一個(gè)總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,每一個(gè)樣本或總體的數(shù)據(jù)系列為一個(gè)環(huán)用于結(jié)構(gòu)比較研究用于展示分類(lèi)和順序數(shù)據(jù)環(huán)形圖

(例題分析)8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

甲乙兩城市家庭對(duì)住房狀況的評(píng)價(jià)數(shù)值型數(shù)據(jù)的整理與展示數(shù)據(jù)分組分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組

(要點(diǎn))1.

將一個(gè)變量值作為一組2.適合于離散變量3.適合于變量值較少的情況組距分組

(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~組距分組

(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),組數(shù)一般為5K15,可以按Sturges

提出的經(jīng)驗(yàn)公式確定組數(shù)K確定組距:組距(classwidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即組距=(最大值-最小值)÷組數(shù)統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表組距分組

(幾個(gè)概念)1.下限(lowlimit):一個(gè)組的最小值2.上限(upperlimit):一個(gè)組的最大值3.組距(classwidth):上限與下限之差4.組中值(classmidpoint):下限與上限之間的中點(diǎn)值下限值+上限值2組中值=頻數(shù)分布表的編制

(例題分析)【例】表中是某電腦公司2005年前四個(gè)月各天的銷(xiāo)售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組頻數(shù)分布表的編制

(步驟)確定組數(shù):根據(jù)

Sturges

提出的經(jīng)驗(yàn)公式得組數(shù)K為確定各組的組距

組距=(237-141)÷10=9.610

用Excel制作頻數(shù)分布表

等距分組表

(上下組限重疊)等距分組表

(上下組限間斷)等距分組表

(使用開(kāi)口組)使用Excel頻數(shù)函數(shù)(FREQUENCY)Excel的【直方圖】工具的缺陷是:頻數(shù)分布及直方圖沒(méi)有與數(shù)據(jù)鏈接,當(dāng)改變?nèi)魏我粋€(gè)數(shù)據(jù)時(shí),頻數(shù)分布表和直方圖不會(huì)跟著改變使用統(tǒng)計(jì)函數(shù)【FREQUENCY】創(chuàng)建頻數(shù)分布表和直方圖可解決這一問(wèn)題。具體步驟是選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域選擇統(tǒng)計(jì)函數(shù)中的【FREQUENCY】函數(shù)在對(duì)話框【Date-array】后輸入數(shù)據(jù)區(qū)域,在【Bins-array】后輸入接受區(qū)域同時(shí)按下“Ctrl-Shift-Enter”組合鍵,即得到頻數(shù)分布統(tǒng)計(jì)函數(shù)—FREQUENCY數(shù)值型數(shù)據(jù)的圖示Excel分組數(shù)據(jù)—直方圖和折線圖分組數(shù)據(jù)—直方圖

(histogram)用于展示分組數(shù)據(jù)分布的一種圖形用矩形的寬度和高度來(lái)表示頻數(shù)分布本質(zhì)上是用矩形的面積來(lái)表示頻數(shù)分布在直角坐標(biāo)系中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖直方圖下的總面積等于1分組數(shù)據(jù)的圖示

(直方圖的繪制)140150210直方圖下的面積之和等于1某電腦公司銷(xiāo)售量分布的直方圖我一眼就看出來(lái)了,銷(xiāo)售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240銷(xiāo)售量(臺(tái))分組數(shù)據(jù)—直方圖

(直方圖與條形圖的區(qū)別)條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類(lèi)別頻數(shù)的多少,其寬度(表示類(lèi)別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開(kāi)排列條形圖主要用于展示分類(lèi)數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)分組數(shù)據(jù)—折線圖

(frequencypolygon)折線圖也稱(chēng)頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來(lái),再把原來(lái)的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布一致分組數(shù)據(jù)的圖示

(折線圖的繪制)折線圖與直方圖下的面積相等!140150210某電腦公司銷(xiāo)售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530銷(xiāo)售量(臺(tái))未分組數(shù)據(jù)—莖葉圖

(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖,低位數(shù)字作樹(shù)葉樹(shù)葉上只保留最后一位數(shù)字對(duì)于n(20n300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過(guò)

L=[10×lg

n]未分組數(shù)據(jù)—莖葉圖

(例題分析)某電腦公司銷(xiāo)售量分布的莖葉圖莖葉圖與直方圖的區(qū)別莖葉圖類(lèi)似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)隨時(shí)間起舞的圖—線圖

(lineplot)表示時(shí)間序列數(shù)據(jù)趨勢(shì)的圖形時(shí)間一般繪在橫軸,數(shù)據(jù)繪在縱軸圖形的長(zhǎng)寬比例大致為10:74.一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開(kāi)始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以采取折斷的符號(hào)將縱軸折斷

(例題分析)【例】我國(guó)1991~2003年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如右表。試?yán)L制線圖¥

1991~2003年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2

708.6784.0921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2

(例題分析)留意象形圖右圖是象形圖,象形圖其實(shí)就是柱狀圖,以圖形取代柱體。這個(gè)圖的目標(biāo)是廣告商,他們正在考慮預(yù)算要花在什么地方。這個(gè)圖顯示,《時(shí)代雜志》吸引了大量的廣告支出。真是這樣的嗎?筆頂端的數(shù)字顯示在《時(shí)代雜志》的廣告費(fèi)是《新聞周刊》的1.64倍。注意刻度改變線圖的刻度所產(chǎn)生的效果:兩個(gè)圖所展示的是同一組數(shù)據(jù),但是右邊的圖使得增加的速度看起來(lái)快得多。怎樣把圖畫(huà)好一定要在表示與說(shuō)明里表示清楚,圖里面變量是什么,單位是什么,以及資料來(lái)源。要讓數(shù)據(jù)很醒目。要確實(shí)注意到,抓住看圖者注意力的是數(shù)據(jù)本身,而不是標(biāo)示,格子,或者背景。你是在畫(huà)一個(gè)呈現(xiàn)數(shù)據(jù)的圖,而不是在搞藝術(shù)創(chuàng)作。要注意實(shí)際上眼睛會(huì)捕捉到什么。避免用象形圖,而且要注意刻度。也不要用很炫目的“三維空間”效果,因?yàn)槟侵粫?huì)讓人看得迷迷糊糊,不會(huì)增加看的人對(duì)數(shù)據(jù)的了解。蹩腳的圖右圖顯示,25歲以上女性擁有高學(xué)位的比率增加了。一共只有五個(gè)數(shù)據(jù)點(diǎn)。所以線圖應(yīng)該很簡(jiǎn)單,但右圖可不簡(jiǎn)單,畫(huà)圖的人大概忍不住在背景中加畫(huà)些東西。三、變量的概括性度量4-60

第四章綜合指標(biāo)4-62

數(shù)值平均數(shù)位置平均數(shù)算術(shù)平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)集中趨勢(shì)的測(cè)度四分位數(shù)4-63

眾數(shù)分布數(shù)列中出現(xiàn)頻數(shù)(率)最多的變量值。

存在條件位置平均數(shù)

總體單位數(shù)較多;變量值的次數(shù)分布有明顯的集中趨勢(shì)特點(diǎn)不受極端值和開(kāi)口組的影響,增強(qiáng)對(duì)數(shù)列一般水平的代表性;是一個(gè)不易確定的平均指標(biāo)例:7名工人日產(chǎn)量(件)為4、5、6、6、6、7、8。則眾數(shù)是6。由未分組資料確定眾數(shù)4-65

【例】:已知某企業(yè)某日工人的日產(chǎn)量資料如下:

計(jì)算工人日產(chǎn)量的眾數(shù)。日產(chǎn)量(件)工人人數(shù)(人)101112131470100380150100合計(jì)800單項(xiàng)數(shù)列4-66

【例】以下是教師按年齡分組的資料,計(jì)算教師年齡的眾數(shù)。教師按年齡分組(歲)人數(shù)(人)20—30830—402840—501650—6010合計(jì)62組距數(shù)列4-67

中位數(shù)

各單位變量值按順序排列,位于中點(diǎn)位置的變量值。1、未分組資料:4562747879818587903645487881848588變量值的個(gè)數(shù)是奇數(shù):變量值的個(gè)數(shù)是偶數(shù):

排序:

中位數(shù)位次:

計(jì)算中位數(shù)的位次:中位數(shù)為:(78+81)/2=79.5中位數(shù)為:79

確定中位數(shù)組

根據(jù)公式計(jì)算中位數(shù)(組距式分組)2、分組資料:4-69

【例】某企業(yè)某日工人的日產(chǎn)量資料如下:計(jì)算該企業(yè)該日全部工人日產(chǎn)量的中位數(shù)。

日產(chǎn)量(件)工人人數(shù)(人)向下累計(jì)次數(shù)(人)10111213147010038015010070170550700800合計(jì)800—

單項(xiàng)數(shù)列中位數(shù)的位次:4-70

【例】以下是教師按年齡分組的資料,計(jì)算教師年齡的中位數(shù)。教師按年齡分組(歲)人數(shù)(人)向下累計(jì)人數(shù)20—30830—402840—501650—6010合計(jì)628365262----組距數(shù)列四分位數(shù)

(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類(lèi)數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)

(位置的確定)原始數(shù)據(jù):分組數(shù)據(jù):數(shù)值型數(shù)據(jù)的四分位數(shù)

(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789數(shù)值型數(shù)據(jù)的四分位數(shù)

(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:12345678910順序數(shù)據(jù)的四分位數(shù)

(例題分析)解:QL位置=(300)/4=75QU位置=(3×300)/4

=225

從累計(jì)頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中

四分位數(shù)為

QL

=不滿意

QU

=一般甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別甲城市戶數(shù)(戶)累計(jì)頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意

2410893

4530

24132225270300合計(jì)300—箱線圖

(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分位數(shù)畫(huà)出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接該箱線圖也稱(chēng)為Median/Quart./Range箱線圖

未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷(xiāo)售量數(shù)據(jù)的Median/Quart./Range箱線圖分布的形狀與箱線圖

對(duì)稱(chēng)分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析)【例】

從某大學(xué)經(jīng)濟(jì)管理專(zhuān)業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門(mén)主要課程的考試成績(jī)進(jìn)行調(diào)查,所得結(jié)果如右表。試?yán)L制各科考試成績(jī)的批比較箱線圖,并分析各科考試成績(jī)的分布特征11名學(xué)生各科的考試成績(jī)數(shù)據(jù)課程名稱(chēng)學(xué)生編號(hào)1234567891011英語(yǔ)經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場(chǎng)營(yíng)銷(xiāo)學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析—Median/Quart./Range)8門(mén)課程考試成績(jī)的Median/Quart./Range箱線圖11名學(xué)生8門(mén)課程考試成績(jī)的Median/Quart./Range箱線圖min-max25%-75%medianvalue455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析—Median/Quart./Range)

集中趨勢(shì)的最常用測(cè)度值一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)均值(算數(shù)平均數(shù))mean4-84

(二)計(jì)算與應(yīng)用未分組資料:

簡(jiǎn)單算術(shù)平均數(shù)例:兩組推銷(xiāo)人員某日的銷(xiāo)售量分別是(箱):一組:10、16、15、8、14、11二組:8、11、13、12、17、14、9比較哪個(gè)組的銷(xiāo)售成績(jī)好?

一組平均銷(xiāo)售量:12.33二組平均銷(xiāo)售量:124-85

例:以下是50個(gè)工人每人每天加工的某種零件數(shù)分組(件):

分組資料:

工人按日產(chǎn)量分組(X)人數(shù)(f)

總產(chǎn)量(X?f)

20120214842261322381842412288251025026718227254合計(jì)501194

工人的平均日產(chǎn)量:4-86

——加權(quán)算術(shù)平均

權(quán)數(shù)

2)如果該班有20名學(xué)生,平均分是多少?3)如果不知道該班的學(xué)生數(shù),能否算出平均分?1)如果該班有10名學(xué)生,平均分是多少?反映了各組的變量值對(duì)平均數(shù)的影響程度例:一次智力測(cè)試中,班級(jí)學(xué)生有30%得5分,50%得4分,10%得3分,10%得1分。4-87

成績(jī)(分)人數(shù)(人)甲班乙班丙班603915010013950平均成績(jī)(分)619980影響總體平均數(shù)的因素?各組頻數(shù)(頻率)各組變量值4-88

【例】某投資項(xiàng)目評(píng)估,將項(xiàng)目投產(chǎn)時(shí),市場(chǎng)可能發(fā)生景氣、一般、不景氣三種情況,分別估計(jì)項(xiàng)目年利潤(rùn)和可能的頻率如下

:計(jì)算該項(xiàng)目平均年利潤(rùn)。市場(chǎng)情況年利潤(rùn)(萬(wàn)元)X頻率(%)(fi/∑fi)景氣一般不景氣

200120505030201004-89

數(shù)學(xué)性質(zhì)各變量值與其算術(shù)平均數(shù)的離差之和等于零

在分析和計(jì)算上非常簡(jiǎn)捷、便利。各個(gè)變量值與其平均數(shù)離差平方之和為最小值不足:易受極端變量值的影響;開(kāi)口式的組距數(shù)列,組中值不易確定,影響其代表性。4-90

幾何平均數(shù)Geometricmean用于計(jì)算現(xiàn)象的平均比率或平均速度應(yīng)用:各個(gè)比率或速度的連乘積等于總比率或總速度;相乘的各個(gè)比率或速度不為零或負(fù)值。應(yīng)用的前提條件:n個(gè)變量值乘積的n次方根

4-91

【例】某流水生產(chǎn)線有前后銜接的五道工序。某日各工序產(chǎn)品的合格率分別為95﹪、92﹪、90﹪、85﹪、80﹪,求整個(gè)流水生產(chǎn)線產(chǎn)品的平均合格率。簡(jiǎn)單公式及應(yīng)用應(yīng)用條件:資料未分組(各變量值次數(shù)都是1)。4-92

析設(shè)最初投產(chǎn)A個(gè)單位

,則

第一道工序的合格品為A×0.95;第二道工序的合格品為(A×0.95)×0.92;

……

第五道工序的合格品為

(A×0.95×0.92×0.90×0.85)×0.80;因該流水線的最終合格品即為第五道工序的合格品,

故該流水線總的合格品應(yīng)為

A×0.95×0.92×0.90×0.85×0.80;則該流水線產(chǎn)品總的合格率為:結(jié)論:即該流水線總的合格率等于各工序合格率的連乘積,符合幾何平均數(shù)的適用條件,故需采用幾何平均法計(jì)算。4-93

【例】某金融機(jī)構(gòu)以復(fù)利計(jì)息。近12年來(lái)的年利率有4年為3﹪,2年為5﹪,2年為8﹪,3年為10﹪,1年為15﹪。求平均年利率。加權(quán)公式及應(yīng)用

應(yīng)用條件:資料經(jīng)過(guò)分組,各組次數(shù)不同。4-94

分析:設(shè)本金為V,則至各年末的本利和應(yīng)為:第1年末的本利和為:第2年末的本利和為:第12年末的本利和為:第2年的計(jì)息基礎(chǔ)第12年的計(jì)息基礎(chǔ)………………

結(jié)論:即12年總本利率等于各年本利率的連乘積,符合幾何平均數(shù)的適用條件,故計(jì)算平均年本利率應(yīng)采用幾何平均法。4-95

幾何平均數(shù)的適用范圍當(dāng)變量值是相對(duì)數(shù),而且變量值之間存在連乘關(guān)系,反映現(xiàn)象的一般水平用幾何平均數(shù)。切尾均值

(trimmedMean)

去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值在電視大獎(jiǎng)賽、體育比賽及需要人們進(jìn)行綜合評(píng)價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用計(jì)算公式為n表示觀察值的個(gè)數(shù);α表示切尾系數(shù),

切尾均值

(例題分析)

【例】某次比賽共有11名評(píng)委,對(duì)某位歌手的給分分別是:

經(jīng)整理得到順序統(tǒng)計(jì)量值為去掉一個(gè)最高分和一個(gè)最低分,取1/11

4-99

各種平均數(shù)的比較(一)各種平均數(shù)的特點(diǎn)及應(yīng)用場(chǎng)合

是就全部數(shù)據(jù)計(jì)算的,具有優(yōu)良的數(shù)學(xué)性質(zhì),實(shí)際中應(yīng)用最為廣泛。其主要缺點(diǎn)是易受極端值的影響,對(duì)偏態(tài)分布其代表性較差。G主要用于計(jì)算比率數(shù)據(jù)的平均數(shù),易受極端值的影響。不受極端值大小的影響,對(duì)偏態(tài)分布其代表性較好。但不是根據(jù)所有的變量值計(jì)算的.不受極端值的影響,對(duì)偏態(tài)分布其代表性較好.但不是根據(jù)所有的變量值計(jì)算的.

4-100

(二)平均數(shù)、中位數(shù)、眾數(shù)的關(guān)系對(duì)稱(chēng)分布左偏分布右偏分布皮爾生經(jīng)驗(yàn)公式:4-101

例:某地居民去年醫(yī)療費(fèi)支出的眾數(shù)是300元,算術(shù)平均數(shù)為250元,(1)計(jì)算中位數(shù)近似值;(2)說(shuō)明該地居民醫(yī)療費(fèi)支出額分布的態(tài)勢(shì)(3)若該地居民醫(yī)療費(fèi)支出額小于400元的人數(shù)占一半,眾數(shù)仍為300元,估計(jì)算術(shù)平均數(shù),并說(shuō)明其分布態(tài)勢(shì)。解:1.

3、4-102

平均數(shù)計(jì)算只宜用于同質(zhì)總體應(yīng)結(jié)合分配數(shù)列和組平均數(shù)補(bǔ)充說(shuō)明總平均數(shù)按地勢(shì)分組甲

地乙

地播種面積(畝)平均畝產(chǎn)(千克/畝)播種面積(畝)平均畝產(chǎn)(千克/畝)旱田190380200320水田70640300620合計(jì)260450500500應(yīng)用平均指標(biāo)須注意的問(wèn)題

4-103

一組:8576758281747279二組:7080829093546095平均值變量值頻率變量變動(dòng)度----數(shù)據(jù)分布離散程度4-104

測(cè)定離散程度的意義1.反映各單位變量值分布的離中趨勢(shì)2.說(shuō)明平均指標(biāo)對(duì)總體的代表性程度3.說(shuō)明現(xiàn)象變動(dòng)的均勻性或穩(wěn)定性程度指總體中各單位變量值背離分布中心的規(guī)模或程度,用離散程度

來(lái)反映。離散程度反映統(tǒng)計(jì)數(shù)據(jù)差異程度的綜合指標(biāo),也稱(chēng)為變量變動(dòng)度4-105

1、極差(range)分布離散程度的測(cè)度

優(yōu)點(diǎn):計(jì)算方法簡(jiǎn)單、易懂;

缺點(diǎn):易受極端數(shù)值的影響,不能全面反映所有變量值差異大小及分布狀況,準(zhǔn)確程度差R=max(xi)-min(xi)2.內(nèi)距(Inter-QuartileRange,IQR)

也稱(chēng)四分位差上四分位數(shù)與下四分位數(shù)之差

內(nèi)距=Q3

–Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性3.方差和標(biāo)準(zhǔn)差

(VarianceandStandarddeviation)1. 離散程度的測(cè)度值之一2. 最常用的測(cè)度值3. 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱(chēng)為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱(chēng)為樣本方差或標(biāo)準(zhǔn)差4681012x=8.3總體方差和標(biāo)準(zhǔn)差

(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本方差和標(biāo)準(zhǔn)差

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí),若樣本均值x確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則x=5。當(dāng)x

=5確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論