數(shù)據(jù)分析技術(shù)授課描述性統(tǒng)計(jì)量_第1頁
數(shù)據(jù)分析技術(shù)授課描述性統(tǒng)計(jì)量_第2頁
數(shù)據(jù)分析技術(shù)授課描述性統(tǒng)計(jì)量_第3頁
數(shù)據(jù)分析技術(shù)授課描述性統(tǒng)計(jì)量_第4頁
數(shù)據(jù)分析技術(shù)授課描述性統(tǒng)計(jì)量_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

主講教師:陳悅北京信息職業(yè)技術(shù)學(xué)院數(shù)據(jù)分析技術(shù)描述性統(tǒng)計(jì)量引例:食品加工廠新上一條可以自動(dòng)裝填袋裝食品的生產(chǎn)線。每袋食品的規(guī)格重量是50克,過于偏離這個(gè)標(biāo)準(zhǔn),會(huì)產(chǎn)生不合格品。為檢驗(yàn)生產(chǎn)線的運(yùn)轉(zhuǎn)狀況,質(zhì)檢人員隨機(jī)從生產(chǎn)線上抽取了100袋食品,測得重量數(shù)據(jù)如下表所示:100袋食品的重量(克)4648474047454644444453515554535150534952555249535951605553485357565457555649535152505754495252524952546152535753515357494750574849475251464948415849485857465945474748605348564347464747484345474245504660.057.555.052.550.047.545.042.540.03010020食品重量100袋食品重量頻數(shù)分布頻數(shù)1.離散狀態(tài)2.集中趨勢3.偏斜狀態(tài)4.陡峭狀態(tài)

利用圖表展示數(shù)據(jù),可以對數(shù)據(jù)分布的形狀和特征有一個(gè)大致的了解。要全部把握數(shù)據(jù)分布的特征,還需要找到反映數(shù)據(jù)分布特征的各個(gè)代表值。01集中趨勢描述性統(tǒng)計(jì)量02離散程度描述性統(tǒng)計(jì)量03分布形態(tài)描述性統(tǒng)計(jì)量描述性統(tǒng)計(jì)量01集中趨勢描述性統(tǒng)計(jì)量是指一組數(shù)據(jù)的算術(shù)平均數(shù),描述一組數(shù)據(jù)的平均水平。計(jì)算簡單,反應(yīng)靈敏,適用于需要進(jìn)一步的計(jì)算其他統(tǒng)計(jì)量的情況。為集中量數(shù)中波動(dòng)最小的、最可靠的指標(biāo)。均值100袋食品的重量(克)46484740474546444444535155545351505349525552495359516055534853575654575556495351525057544952525249525461525357535153574947505748494752514649484158494858574659454747486053485643474647474843454742455046

將數(shù)據(jù)中全體觀測值求和再除以觀測值的個(gè)數(shù)即可得到該數(shù)據(jù)的均值,記作。均值的性質(zhì)1.所有觀測值與其均值的離差之和等于0。2.所有觀測值與其均值的離差平方和最小。+-01集中趨勢描述性統(tǒng)計(jì)量又稱中數(shù),中值;指當(dāng)一組數(shù)據(jù)按順序排列后,位于中間位置的數(shù);也可用于快速估計(jì)一組數(shù)據(jù)的代表值;不受極端值的影響。中位數(shù)

將全體觀測值按照從小到大的順序排成一列,處于中間位置上的觀測值即是該數(shù)據(jù)的中位數(shù),記作。9個(gè)家庭人均月收入原始數(shù)據(jù)(元)155076080011808809802100126016409個(gè)家庭人均月收入排序(元)76080088098011801260155016402100中位數(shù)位置10名球員身高排序(厘米)

17017217517817818018318518818810名球員身高排序(厘米)

175172170178185188183178180188觀測值個(gè)數(shù)為偶數(shù)時(shí)中位數(shù)的確定01集中趨勢描述性統(tǒng)計(jì)量是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)值;可用于快速粗略的估計(jì)一組數(shù)據(jù)。不受極端值的影響。眾數(shù)260名畢業(yè)生就業(yè)意向頻數(shù)分布表就業(yè)意向頻數(shù)(人)頻率(%)會(huì)計(jì)金融管理營銷其它765433682929.220.812.726.211.2合計(jì)260100806040200會(huì)計(jì)金融管理營銷其它頻數(shù)1020300頻率%

眾數(shù)是出現(xiàn)次數(shù)最多的觀測值,記作300個(gè)采樣點(diǎn)空氣質(zhì)量評價(jià)數(shù)據(jù)空氣質(zhì)量等級采樣點(diǎn)個(gè)數(shù)優(yōu)良輕度污染中度污染重度污染193672875合計(jì)300重度中度輕度良優(yōu)3002001000100袋食品的重量(克)46484740474546444444535155545351505349525552495359516055534853575654575556495351525057544952525249525461525357535153574947505748494752514649484158494858574659454747486053485643474647474843454742455046眾數(shù)是觀測值的重點(diǎn)中位數(shù)是觀測值的中心均值是觀測值的重心100袋食品的重量(克)46484740474546444444535155545351505349525552495359516055534853575654575556495351525057544952525249525461525357535153574947505748494752514649484158494858574659454747486053485643474647474843454742455046不同類型變量適用的集中趨勢描述性統(tǒng)計(jì)量變量類型定類型定序型數(shù)值型集中趨勢描述性統(tǒng)計(jì)量※眾數(shù)--※中位數(shù)眾數(shù)-※均值中位數(shù)眾數(shù)※為該類變量最適用的集中趨勢描述性統(tǒng)計(jì)量01集中趨勢描述性統(tǒng)計(jì)量Mo=可口可樂甲商店乙商店Mo=可口可樂

兩商店軟飲料購買頻數(shù)的眾數(shù)都是可口可樂,但數(shù)據(jù)的離散程度不同。01020可口可樂雪碧杏

仁露新

騎士醒目01020可口可樂雪碧杏仁露新

騎士醒目Me=一般甲城市乙城市非常不滿意一般滿意非常

滿意Me=一般非常不滿意一般滿意非常滿意

兩城市對住房條件評價(jià)的中位數(shù)都是一般,但數(shù)據(jù)的離散程度不同。不滿意不滿意最大值最小值極差方差標(biāo)準(zhǔn)差02離散程度描述性統(tǒng)計(jì)量又稱全距;數(shù)據(jù)中最大觀測值與最小觀測值之差稱為極差,記作R。極差給出了全體觀測值的變動(dòng)范圍。一般情況下,極差越大,離散程度越大。但其值易受極端值影響。極差02離散程度描述性統(tǒng)計(jì)量100袋食品的重量(克)46484740474546444444535155545351505349525552495359516055534853575654575556495351525057544952525249525461525357535153574947505748494752514649484158494858574659454747486053485643474647474843454742455046100袋食品重量的最小觀測值為40克,最大觀測值為61克,極差是:方差是每個(gè)數(shù)據(jù)與本組數(shù)據(jù)均值之差平方之后的平均數(shù);是一組數(shù)據(jù)中各種變異的總和。標(biāo)準(zhǔn)差即為方差的平方根。方差和標(biāo)準(zhǔn)差是描述一組數(shù)據(jù)離散程度最常用的最好的指標(biāo);值越大,表明數(shù)據(jù)的離散程度越大;值越小,表明數(shù)據(jù)的離散程度越小。方差和標(biāo)準(zhǔn)差02離散程度描述性統(tǒng)計(jì)量方差公式標(biāo)準(zhǔn)差公式方差的含義不易理解,它的計(jì)量單位是觀測值計(jì)量單位的平方。標(biāo)準(zhǔn)差的計(jì)量單位與觀測值計(jì)量單位是一致的。100袋食品的重量(克)46484740474546444444535155545351505349525552495359516055534853575654575556495351525057544952525249525461525357535153574947505748494752514649484158494858574659454747486053485643474647474843454742455046S=3.00S=2.71S=0.82S=0.00理解標(biāo)準(zhǔn)差在均值上加減標(biāo)準(zhǔn)差34.4-2s=20.634.434.4-=27.534.4+2s=48.227名學(xué)生每30秒心跳次數(shù)均值=34.4標(biāo)準(zhǔn)差=6.9觀測值的大小大致不超過均值加減4個(gè)標(biāo)準(zhǔn)差的范圍。本例中均值加減2個(gè)標(biāo)準(zhǔn)差就幾乎包含了所有的觀測值。34.4+s=41.3學(xué)生數(shù)86422124273033363942454851心跳數(shù)03分布形態(tài)描述性統(tǒng)計(jì)量偏度峰度用來評估一組數(shù)據(jù)的分布呈左右對稱的程度。當(dāng)偏度值為0時(shí),分布即為對稱的;當(dāng)偏度值大于0時(shí),分布呈正偏態(tài);當(dāng)偏度值小于0時(shí),分布呈負(fù)偏態(tài);偏度值越大,偏態(tài)程度越大。偏度03分布形態(tài)描述性統(tǒng)計(jì)量頻數(shù)分布的偏態(tài)對稱左偏右偏偏度計(jì)算公式α3>0正偏(右偏);α3<0負(fù)偏(左偏);α3=0對稱;α3越大,偏態(tài)程度越大。100袋食品重量樣本數(shù)據(jù)中,均值為50.67克,標(biāo)準(zhǔn)值為4.61克,依公式計(jì)算100袋食品重量的偏度:100袋食品的重量(克)4648474047454644444453515554535150534952555249535951605553485357565457555649535152505754495252524952546152535753515357494750574849475251464948415849485857

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論