版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第四章數(shù)據(jù)分布特征的測(cè)度第1頁(yè),共66頁(yè),2023年,2月20日,星期三
教學(xué)重點(diǎn)與難點(diǎn):重點(diǎn)為各種平均指標(biāo)和變異指標(biāo)的概念、特點(diǎn)、應(yīng)用條件、應(yīng)用范圍和計(jì)算方法。難點(diǎn)是不同條件下平均指標(biāo)和變異指標(biāo)的計(jì)算。第2頁(yè),共66頁(yè),2023年,2月20日,星期三統(tǒng)計(jì)數(shù)據(jù)經(jīng)過整理和顯示后,對(duì)數(shù)據(jù)分布的形狀和特征就可以有一個(gè)大致的了解。為進(jìn)一步掌握數(shù)據(jù)分布的特征和規(guī)律,進(jìn)行更深入的分析,還需要找到反映數(shù)據(jù)分布特征的各個(gè)代表值。第3頁(yè),共66頁(yè),2023年,2月20日,星期三對(duì)一組數(shù)據(jù)分布的特征,可以從三個(gè)方面進(jìn)行測(cè)度和描述:一是分布的集中趨勢(shì),反映各數(shù)據(jù)向其中心值靠攏和聚集的程度;二是分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離中心值的趨勢(shì);三是分布偏態(tài)和峰態(tài),反映數(shù)據(jù)分布的形狀。這三個(gè)方面分別反映了數(shù)據(jù)分布特征的不同側(cè)面。第4頁(yè),共66頁(yè),2023年,2月20日,星期三第一節(jié)集中趨勢(shì)的測(cè)度
集中趨勢(shì)是指一組數(shù)據(jù)向某一中心值靠攏的傾向,它反映了一組數(shù)據(jù)中心點(diǎn)的位置所在。測(cè)度集中趨勢(shì)也就是尋找數(shù)據(jù)一般水平的代表值或中心值。低層次數(shù)據(jù)的集中趨勢(shì)測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),反過來,高層次數(shù)據(jù)的集中趨勢(shì)測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù)。因此,選用哪一個(gè)測(cè)度值來反映數(shù)據(jù)的集中趨勢(shì),要根據(jù)所掌握的數(shù)據(jù)的類型和特點(diǎn)來確定。第5頁(yè),共66頁(yè),2023年,2月20日,星期三一、分類數(shù)據(jù):眾數(shù)(Mo)
眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。
?出現(xiàn)次數(shù)最多的變量值
?不受極端值的影響
?一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)
?主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)
第6頁(yè),共66頁(yè),2023年,2月20日,星期三無眾數(shù)
原始數(shù)據(jù):10591268一個(gè)眾數(shù)
原始數(shù)據(jù):659855多于一個(gè)眾數(shù)
原始數(shù)據(jù):252828364242從分布的角度看,眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,一組數(shù)據(jù)分布的最高峰點(diǎn)所對(duì)應(yīng)的數(shù)值即為眾數(shù)。當(dāng)然,如果數(shù)據(jù)的分布沒有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)也可能不存在;如果有兩個(gè)最高峰點(diǎn),也可以有兩個(gè)眾數(shù),見P78圖4-1。
第7頁(yè),共66頁(yè),2023年,2月20日,星期三
二、順序數(shù)據(jù):中位數(shù)(Me)和分位數(shù)(一)中位數(shù)中位數(shù)是一組數(shù)據(jù)排序后,處于中間位置上的變量值。中位數(shù)是一個(gè)位置代表值,它主要用于測(cè)度順序數(shù)據(jù)的集中趨勢(shì),當(dāng)然也適用于作為數(shù)值型數(shù)據(jù)的集中趨勢(shì),但不適用于分類數(shù)據(jù)。
第8頁(yè),共66頁(yè),2023年,2月20日,星期三根據(jù)未分組數(shù)據(jù)計(jì)算中位數(shù)時(shí),要先對(duì)數(shù)據(jù)進(jìn)行排序,然后確定中位數(shù)的位置,其公式為:中位數(shù)位置=第9頁(yè),共66頁(yè),2023年,2月20日,星期三對(duì)于分類型數(shù)據(jù),中位數(shù)的位置為:中位數(shù)位置=若項(xiàng)數(shù)為奇數(shù),則居于中間位置的那個(gè)標(biāo)志值即為中位數(shù)。若項(xiàng)數(shù)為偶數(shù),則居于中間位置的兩項(xiàng)數(shù)值的平均數(shù)即為中位數(shù)。
第10頁(yè),共66頁(yè),2023年,2月20日,星期三【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789位置=(n+1)/2=(9+1)/2=5中位數(shù)=1080【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排
序:660
75078085096010801250150016302000位
置:12345678910位置=(n+1)/2=(10+1)/2=5.5中位數(shù)=(960+1080)/2=1020對(duì)于數(shù)值型數(shù)據(jù),也可以計(jì)算中位數(shù):第11頁(yè),共66頁(yè),2023年,2月20日,星期三(二)分位數(shù)
四分位數(shù)、十分位數(shù)和百分位數(shù)分別是用3個(gè)點(diǎn)、9個(gè)點(diǎn)和99個(gè)點(diǎn)將數(shù)據(jù)4等分、10等分和100等分后各分位點(diǎn)上的值。四分位數(shù),“四分位點(diǎn)”,是通過三個(gè)點(diǎn)將全部數(shù)據(jù)等分為四部分,其中每部分包含25%的數(shù)據(jù),處在分位點(diǎn)上的數(shù)值就是四分位數(shù)。
25%25%25%25%QMQUQL
下四分位數(shù)
中位數(shù)
上四分位數(shù)
第12頁(yè),共66頁(yè),2023年,2月20日,星期三對(duì)于分類數(shù)據(jù),各四分位數(shù)的位置分別為:
當(dāng)四分位數(shù)的位置不在某一個(gè)數(shù)值上時(shí),可根據(jù)四分位數(shù)的位置,按比例分?jǐn)偹姆治粩?shù)位置兩側(cè)數(shù)值的差值。
第13頁(yè),共66頁(yè),2023年,2月20日,星期三【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排
序:75078085096010801250150016302000位
置:123456789QLQLQLQLQUQUQUQU【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排
序:660
75078085096010801250150016302000位
置:1234
5678910
第14頁(yè),共66頁(yè),2023年,2月20日,星期三
三、數(shù)值型數(shù)據(jù):均值
均值也稱為算術(shù)平均數(shù),是全部數(shù)據(jù)的算術(shù)平均。均值在統(tǒng)計(jì)學(xué)中具有重要的地位,是集中趨勢(shì)的最主要測(cè)度值,它主要適用于數(shù)值型數(shù)據(jù),而不適用于分類和順序數(shù)據(jù)。根據(jù)所掌握數(shù)據(jù)的不同,均值有不同的計(jì)算形式和計(jì)算公式。第15頁(yè),共66頁(yè),2023年,2月20日,星期三
(一)算術(shù)平均數(shù)的基本形式
算術(shù)平均數(shù)=第16頁(yè),共66頁(yè),2023年,2月20日,星期三
(二)簡(jiǎn)單算術(shù)平均數(shù)
當(dāng)掌握的資料是未分組的總體各單位的標(biāo)志值時(shí),則將各單位的標(biāo)志值簡(jiǎn)單相加得出標(biāo)志總量,然后各單位的標(biāo)志值簡(jiǎn)單相加得出標(biāo)志總量,然后在除以總體單位數(shù)之和,這種計(jì)算平均數(shù)的方法稱為簡(jiǎn)單算術(shù)平均數(shù)。第17頁(yè),共66頁(yè),2023年,2月20日,星期三其公式為:第18頁(yè),共66頁(yè),2023年,2月20日,星期三
(三)加權(quán)算術(shù)平均數(shù)當(dāng)掌握的資料已經(jīng)分組,且各組出現(xiàn)的次數(shù)不同時(shí),則采用加權(quán)算術(shù)平均數(shù)。各組的組中值為:M1,M2,…,Mk第19頁(yè),共66頁(yè),2023年,2月20日,星期三
例:某企業(yè)某車間工人每天生產(chǎn)產(chǎn)品資料如表4-1:表4-1按每人生產(chǎn)件數(shù)分組工人數(shù)(人)產(chǎn)品數(shù)(件)xfxf18192021221013382415180247760504330合計(jì)1002021根據(jù)上表資料,計(jì)算平均每人生產(chǎn)產(chǎn)品件數(shù):
第20頁(yè),共66頁(yè),2023年,2月20日,星期三簡(jiǎn)單算術(shù)平均數(shù)的數(shù)值大小只與變量值的大小有關(guān)。加權(quán)算術(shù)平均數(shù)的數(shù)值大小不僅受各組組中值大小的影響,而且受各組變量值出現(xiàn)的頻數(shù)及權(quán)數(shù)大小的影響。如果某一組的權(quán)數(shù)較大,說明該組的數(shù)據(jù)較多,那么該組數(shù)據(jù)的大小對(duì)均值的影響就越大,反之則越小。
第21頁(yè),共66頁(yè),2023年,2月20日,星期三加權(quán)算術(shù)平均數(shù)應(yīng)注意幾個(gè)問題:
1、加權(quán)算術(shù)平均數(shù)的權(quán)數(shù)可以是絕對(duì)數(shù),亦可以是比重;上例的權(quán)數(shù)為絕對(duì)數(shù)?,F(xiàn)舉例說明比重權(quán)數(shù),例如下表資料:
第22頁(yè),共66頁(yè),2023年,2月20日,星期三表4-2按每人生產(chǎn)件數(shù)分組x工人比重(%)181920212210133824151.802.477.605.043.30合計(jì)10020.21平均每人生產(chǎn)產(chǎn)品件數(shù)=第23頁(yè),共66頁(yè),2023年,2月20日,星期三
2、根據(jù)組距數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)
例某企業(yè)某車間工人生產(chǎn)產(chǎn)品資料如表4-3:表4-3按每人生產(chǎn)產(chǎn)品數(shù)量分組(公斤)工人數(shù)f組中值xxf20-3030-4040-5050以上2070803025354555500245036001650合計(jì)200-8200
第24頁(yè),共66頁(yè),2023年,2月20日,星期三
用組中值計(jì)算出來的平均數(shù),只能是平均數(shù)的近似值,而不是平均數(shù)的真值。第25頁(yè),共66頁(yè),2023年,2月20日,星期三
3、若各組單位數(shù)相等,即f1=f2=……
=fn,則加權(quán)算術(shù)平均數(shù)計(jì)算公式與簡(jiǎn)單算術(shù)平均數(shù)存在下面關(guān)系:可見,簡(jiǎn)單算術(shù)平均數(shù)是加權(quán)算術(shù)平均數(shù)的一個(gè)特例。
第26頁(yè),共66頁(yè),2023年,2月20日,星期三(四)算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)均值在統(tǒng)計(jì)學(xué)中具有重要的地位,它是進(jìn)行統(tǒng)計(jì)分析和統(tǒng)計(jì)推斷的基礎(chǔ)。首先,從統(tǒng)計(jì)思想上看,均值是一組數(shù)據(jù)的重心所在,是數(shù)據(jù)誤差相互抵消后的必然性結(jié)果。比如對(duì)同一事物進(jìn)行多次測(cè)量,若所得結(jié)果不一致,可能是由于測(cè)量誤差所致,也可能是其他因素的偶然影響,利用均值作為其代表值,則可以使誤差相互抵消,反映出事物必然性的數(shù)量特征。其次,均值具有下面一些重要的數(shù)學(xué)性質(zhì),這些數(shù)學(xué)性質(zhì)在實(shí)際中有著廣泛的應(yīng)用,體現(xiàn)了均值的統(tǒng)計(jì)思想。第27頁(yè),共66頁(yè),2023年,2月20日,星期三算術(shù)平均數(shù)最重要的兩個(gè)數(shù)學(xué)性質(zhì)是:
1.
各變量值與平均數(shù)的離差之和等于零,即:簡(jiǎn)單算術(shù)平均數(shù):加權(quán)算術(shù)平均數(shù):
第28頁(yè),共66頁(yè),2023年,2月20日,星期三
2.
各變量值與平均數(shù)的離差的平方和為最小值,即:簡(jiǎn)單算術(shù)平均數(shù):加權(quán)算術(shù)平均數(shù):證明見P84。第29頁(yè),共66頁(yè),2023年,2月20日,星期三(五)均值的另一種表現(xiàn)形式:調(diào)和平均數(shù)調(diào)和平均數(shù)是算術(shù)平均數(shù)的另一種表現(xiàn)形式,用表示。在實(shí)際工作中,由于所獲得的數(shù)據(jù)的不同,有時(shí)不能直接采用均值的計(jì)算公式來計(jì)算平均數(shù),這就需要使用調(diào)和平均數(shù)的形式進(jìn)行計(jì)算,二者實(shí)質(zhì)上是相同的,而僅有形式上的區(qū)別。第30頁(yè),共66頁(yè),2023年,2月20日,星期三其計(jì)算公式為:
需要注意的是,當(dāng)數(shù)據(jù)中出現(xiàn)“0”時(shí)不宜計(jì)算調(diào)和平均數(shù)。第31頁(yè),共66頁(yè),2023年,2月20日,星期三例如,某企業(yè)工人月獎(jiǎng)金額如表4-4:表4-4按月獎(jiǎng)金等級(jí)分組獎(jiǎng)金額(元/人)(x)獎(jiǎng)金總額(元)(m)工人數(shù)(人)(m/x)一等二等三等220180100220007560028000100420280合計(jì)——125600800第32頁(yè),共66頁(yè),2023年,2月20日,星期三(六)一種特殊的均值:幾何平均數(shù)統(tǒng)計(jì)幾何平均數(shù)指標(biāo),是指社會(huì)經(jīng)濟(jì)現(xiàn)象的同質(zhì)總體在時(shí)間上變動(dòng)速度的平均數(shù)。是具有經(jīng)濟(jì)意義同質(zhì)總體的n個(gè)環(huán)比發(fā)展速度連乘積的n次方根。統(tǒng)計(jì)幾何平均數(shù)屬于動(dòng)態(tài)平均數(shù)。
第33頁(yè),共66頁(yè),2023年,2月20日,星期三幾何平均數(shù)是適用于特殊數(shù)據(jù)的一種平均數(shù),它主要用于計(jì)算比率的平均。當(dāng)所掌握的變量值本身是比率的形式,這時(shí)就應(yīng)采用幾何平均法計(jì)算平均比率。在實(shí)際應(yīng)用中,幾何平均數(shù)主要用于計(jì)算社會(huì)經(jīng)濟(jì)現(xiàn)象的年平均增長(zhǎng)率。
第34頁(yè),共66頁(yè),2023年,2月20日,星期三設(shè)開始的數(shù)值為,逐年增長(zhǎng)率為,則第n年的數(shù)值為:從到用n年,每年的增長(zhǎng)率都相同,則增長(zhǎng)率G就是平均增長(zhǎng)率,有
第35頁(yè),共66頁(yè),2023年,2月20日,星期三【例某水泥生產(chǎn)企業(yè)1999年的水泥產(chǎn)量為100萬噸,2000年與1999年相比增長(zhǎng)率為9%,2001年與2000年相比增長(zhǎng)率為16%,2002年與2001年相比增長(zhǎng)率為20%。求各年的年平均增長(zhǎng)率。年平均增長(zhǎng)率=114.91%-1=14.91%
幾何平均數(shù)的對(duì)數(shù)是各變量值對(duì)數(shù)的算術(shù)平均。需要注意的是,當(dāng)數(shù)據(jù)中出現(xiàn)零值和負(fù)值是不宜計(jì)算幾何平均數(shù)。第36頁(yè),共66頁(yè),2023年,2月20日,星期三四、眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值是集中趨勢(shì)的三個(gè)主要測(cè)度值,它們具有不同的特點(diǎn)和應(yīng)用場(chǎng)合。
(一)眾數(shù)、中位數(shù)和均值的關(guān)系從分布的角度看,眾數(shù)始終是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,而均值則是全部數(shù)據(jù)的算術(shù)平均。第37頁(yè),共66頁(yè),2023年,2月20日,星期三
因此,對(duì)于具有單峰分布的大多數(shù)數(shù)據(jù)而言,眾數(shù)、中位數(shù)和均值之間有以下關(guān)系:(1)當(dāng)總體內(nèi)部次數(shù)分配呈正態(tài)狀時(shí),三者合而為一,即三者相等:(2)當(dāng)總體內(nèi)部次數(shù)分配呈非正態(tài)狀且右偏時(shí),則(3)當(dāng)總體內(nèi)部次數(shù)分配呈非正態(tài)狀且左偏時(shí),則
第38頁(yè),共66頁(yè),2023年,2月20日,星期三(二)眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用場(chǎng)合
1.
眾數(shù)
n
不受極端值影響
n
具有不唯一性
n
數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用第39頁(yè),共66頁(yè),2023年,2月20日,星期三2.
中位數(shù)n
不受極端值影響n
數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用3.
均值n
易受極端值影響n
數(shù)學(xué)性質(zhì)優(yōu)良n
數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用第40頁(yè),共66頁(yè),2023年,2月20日,星期三第二節(jié)離散程度的測(cè)度集中趨勢(shì)只是數(shù)據(jù)分布的一個(gè)特征,它所反映的是各變量值向其中心值聚集的程度。數(shù)據(jù)的分散程度是數(shù)據(jù)分布的另一個(gè)重要特征,它所反映的是各變量值遠(yuǎn)離其中心值的程度。集中趨勢(shì)的各測(cè)度值是對(duì)數(shù)據(jù)一般水平的一個(gè)概括性度量,它對(duì)一組數(shù)據(jù)的代表程度取決于該組數(shù)據(jù)的離散水平。數(shù)據(jù)的離散程度越大,集中趨勢(shì)的測(cè)度值對(duì)該組數(shù)據(jù)的代表性越差,離散程度越小,其代表性就越好。第41頁(yè),共66頁(yè),2023年,2月20日,星期三一、分類數(shù)據(jù):異眾比率異眾比率,“離異比率或變差比”,是指非眾數(shù)組的頻數(shù)占總頻數(shù)的比率,計(jì)算公式為:式中,為異眾比率;為變量值的總頻數(shù);為眾數(shù)組的頻數(shù)。
第42頁(yè),共66頁(yè),2023年,2月20日,星期三異眾比率的作用是衡量眾數(shù)對(duì)一組數(shù)據(jù)的代表程度。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性就越差;異眾比率越小,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性越好。主要用于測(cè)度分類數(shù)據(jù)的離散程度,當(dāng)然,順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)也可以計(jì)算異眾比率。例題見P90例4.11。第43頁(yè),共66頁(yè),2023年,2月20日,星期三二、順序數(shù)據(jù):四分位差“內(nèi)距或四分間距”,計(jì)算公式為:QD=QU
–QL四分位差反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中;數(shù)值越大,說明中間的數(shù)據(jù)越分散。四分位差不受極值的影響,此外,由于中位數(shù)處于數(shù)據(jù)的中間位置,因此四分位差的大小在一定程度上也說明了中位數(shù)對(duì)一組數(shù)據(jù)的代表程度。四分位差主要用于測(cè)度順序數(shù)據(jù)的離散程度,當(dāng)然對(duì)于數(shù)值型數(shù)據(jù)也可以計(jì)算四分位差,但不適合于分類數(shù)據(jù)。例題見P90例4.12。第44頁(yè),共66頁(yè),2023年,2月20日,星期三
三、數(shù)值型數(shù)據(jù):方差及標(biāo)準(zhǔn)差測(cè)度數(shù)值型數(shù)據(jù)離散程度的方法主要有極差、平均差、方差和標(biāo)準(zhǔn)差,其中最常用的方法是方差和標(biāo)準(zhǔn)差。
第45頁(yè),共66頁(yè),2023年,2月20日,星期三(一)極差“全距”,它是總體中各單位標(biāo)志的最大標(biāo)志值與最小標(biāo)志值之差。全距(R)=最大標(biāo)志值—最小標(biāo)志值
極差是描述數(shù)據(jù)離散程度的最簡(jiǎn)單測(cè)度值,計(jì)算簡(jiǎn)單,易于理解,但它容易受極端值的影響。由于極差只是利用了一組數(shù)據(jù)兩端的信息,不能反映出中間數(shù)據(jù)的分散狀況,因而不能準(zhǔn)確描述出數(shù)據(jù)的分散程度。第46頁(yè),共66頁(yè),2023年,2月20日,星期三(二)平均差“平均離差”,是各個(gè)標(biāo)志值對(duì)算術(shù)平均數(shù)的離差的平均數(shù)。1.對(duì)于未分組數(shù)據(jù):2.對(duì)于分組數(shù)據(jù):例題見P91例4.13。第47頁(yè),共66頁(yè),2023年,2月20日,星期三
平均差以均值為中心,反映了每個(gè)數(shù)據(jù)與均值的平均差異程度,它能全面準(zhǔn)確地反映一組數(shù)據(jù)的離散狀況。平均差越大說明數(shù)據(jù)的離散程度越大,反之則說明數(shù)據(jù)的離散程度越小。為了避免離差之和等于零而無法計(jì)算平均差這一問題,平均差在計(jì)算時(shí)對(duì)離差取絕對(duì)值,以離差的絕對(duì)值來表示總離差,這就給計(jì)算帶來不便。同時(shí)平均差在數(shù)學(xué)性質(zhì)上也不是最優(yōu)的,因此實(shí)際中應(yīng)用較少。第48頁(yè),共66頁(yè),2023年,2月20日,星期三(三)方差和標(biāo)準(zhǔn)差方差是各變量值與其均值離差平方的平均數(shù),是測(cè)度數(shù)值型數(shù)據(jù)離散程度的最主要方法。樣本方差未分組數(shù)據(jù):分組數(shù)據(jù):第49頁(yè),共66頁(yè),2023年,2月20日,星期三2.標(biāo)準(zhǔn)差:方差的平方根即為標(biāo)準(zhǔn)差。未分組數(shù)據(jù):組距分組數(shù)據(jù):第50頁(yè),共66頁(yè),2023年,2月20日,星期三與方差不同的是,標(biāo)準(zhǔn)差是具有量綱的,它與變量值的計(jì)量單位相同,其實(shí)際意義要比方差清楚。因此在對(duì)實(shí)際問題進(jìn)行分析時(shí),更多使用標(biāo)準(zhǔn)差。例題見P93例4.14。
第51頁(yè),共66頁(yè),2023年,2月20日,星期三方差或標(biāo)準(zhǔn)差也是根據(jù)全部數(shù)據(jù)計(jì)算的,它反映了每個(gè)數(shù)據(jù)與其均值相比平均相差的數(shù)值,因此它能準(zhǔn)確反映出數(shù)據(jù)的離散程度。與平均差相比,方差在數(shù)學(xué)處理上是通過平方消去離差的正負(fù)號(hào),更便于數(shù)學(xué)上的處理。因此,方差和標(biāo)準(zhǔn)差是實(shí)際中應(yīng)用最廣泛的離散程度測(cè)度值。第52頁(yè),共66頁(yè),2023年,2月20日,星期三
四、相對(duì)位置的測(cè)量:標(biāo)準(zhǔn)分?jǐn)?shù)
有了均值和標(biāo)準(zhǔn)差之后,可以計(jì)算一組數(shù)據(jù)中各個(gè)數(shù)值的標(biāo)準(zhǔn)分?jǐn)?shù),并可以用它來判斷一組數(shù)據(jù)中某個(gè)數(shù)據(jù)的相對(duì)位置。第53頁(yè),共66頁(yè),2023年,2月20日,星期三(一)標(biāo)準(zhǔn)分?jǐn)?shù)“標(biāo)準(zhǔn)化值或z分?jǐn)?shù)”,它是變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,是對(duì)每個(gè)數(shù)據(jù)在該組數(shù)據(jù)中相對(duì)位置的測(cè)量。
是常用的統(tǒng)計(jì)標(biāo)準(zhǔn)化公式,在對(duì)多個(gè)具有不同量綱的變量進(jìn)行處理時(shí),需要對(duì)各變量數(shù)值進(jìn)行標(biāo)準(zhǔn)化處理。見P94例4.15。第54頁(yè),共66頁(yè),2023年,2月20日,星期三標(biāo)準(zhǔn)分?jǐn)?shù)具有均值為0、標(biāo)準(zhǔn)差為1的特性:
標(biāo)準(zhǔn)分?jǐn)?shù)只是對(duì)原始數(shù)據(jù)進(jìn)行了線性變化,它沒有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變?cè)摻M數(shù)據(jù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。
第55頁(yè),共66頁(yè),2023年,2月20日,星期三
(二)經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí)
?
約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)
?
約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)
?
約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)
第56頁(yè),共66頁(yè),2023年,2月20日,星期三利用標(biāo)準(zhǔn)分?jǐn)?shù)可以判斷一組數(shù)據(jù)中是否存在離群點(diǎn)或離群數(shù)據(jù)。如果一組數(shù)據(jù)中某個(gè)觀察值與其余觀察值相比大得反常或小得反常,這個(gè)觀察值就成為離群點(diǎn)或離群數(shù)據(jù)。
第57頁(yè),共66頁(yè),2023年,2月20日,星期三離群點(diǎn)的產(chǎn)生可能是由于下述原因:
?
該觀測(cè)值被錯(cuò)誤測(cè)量、記錄或輸入計(jì)算機(jī)
?該觀測(cè)值可能來自另一個(gè)總體
?該觀測(cè)值是正確的,不過它代表一個(gè)偶然事件。
第58頁(yè),共66頁(yè),2023年,2月20日,星期三(三)切比雪夫不等式如果一組數(shù)據(jù)不是對(duì)稱分布,經(jīng)驗(yàn)法則就不再使用,這時(shí)可使用切比雪夫不等式,它對(duì)任何分布形狀的數(shù)據(jù)都適用,提供的是“下界”,也就是“所占比例至少是多少”,對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有的數(shù)據(jù)落在k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù)。第59頁(yè),共66頁(yè),2023年,2月20日,星期三對(duì)于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)
第60頁(yè),共66頁(yè),2023年,2月20日,星期三五、相對(duì)離散程度:離散系數(shù)上面介紹的極差、平均差、方差和標(biāo)準(zhǔn)差等都是反映數(shù)據(jù)分散程度的絕
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 攝像頭行業(yè)代理申請(qǐng)書
- 2025年旅游酒店業(yè)服務(wù)規(guī)范
- 實(shí)習(xí)提前結(jié)束的申請(qǐng)書
- 高校干部掛職鍛煉申請(qǐng)書
- 2025年食品生產(chǎn)與質(zhì)量管理指南
- 2026年地質(zhì)勘察中的地球物理方法
- 2026年水土保持與工程地質(zhì)環(huán)境評(píng)價(jià)
- 臨淄區(qū)法律援助申請(qǐng)書
- 企業(yè)主貸款申請(qǐng)書范文
- 查閱法律文書申請(qǐng)書
- 梯子使用安全操作規(guī)程
- 民航保健與衛(wèi)生
- 2025年城市更新的城市更新技術(shù)
- 聚焦2025年:電商物流“最后一公里”配送冷鏈運(yùn)輸解決方案研究
- 冬季代維安全培訓(xùn)課件
- DBJT15-192-2020 平板動(dòng)力載荷試驗(yàn)技術(shù)標(biāo)準(zhǔn)
- 【MOOC答案】《電路分析基礎(chǔ)》(南京郵電大學(xué))章節(jié)作業(yè)慕課答案
- 寒食韓翃古詩(shī)教學(xué)課件
- 工業(yè)壓力容器項(xiàng)目投資可行性研究分析報(bào)告(2024-2030版)
- 公共場(chǎng)所清潔消毒全覆蓋行動(dòng)培訓(xùn)
- 高吸水樹脂混凝土內(nèi)養(yǎng)護(hù)材料性能及作用機(jī)理研究進(jìn)展
評(píng)論
0/150
提交評(píng)論