統(tǒng)計數(shù)據(jù)的描述1.ppt_第1頁
統(tǒng)計數(shù)據(jù)的描述1.ppt_第2頁
統(tǒng)計數(shù)據(jù)的描述1.ppt_第3頁
統(tǒng)計數(shù)據(jù)的描述1.ppt_第4頁
統(tǒng)計數(shù)據(jù)的描述1.ppt_第5頁
已閱讀5頁,還剩121頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

華南理工大學(xué)精品課程 統(tǒng)計學(xué) 統(tǒng)計數(shù)據(jù)的描述 第二章 華南理工大學(xué)精品課程 第二章統(tǒng)計數(shù)據(jù)的描述 錄取中有無歧視 某高校只有兩個系 財經(jīng)系和工程系 該校報考及錄取的總體情況如下 引例 華南理工大學(xué)精品課程 第二章統(tǒng)計數(shù)據(jù)的描述 如果我們只看該校男女生錄取的比率 即男生350 800 44 女生200 600 33 這時我們不免會問 是男同學(xué)的成績比女同學(xué)好 還是在錄取中存在著性別的歧視 學(xué)過統(tǒng)計學(xué)的同學(xué)不會簡單地做出結(jié)論 而是繼續(xù)搜集數(shù)據(jù)并得到兩個系各自錄取的男女生數(shù)據(jù) 引例 華南理工大學(xué)精品課程 第二章統(tǒng)計數(shù)據(jù)的描述 引例 華南理工大學(xué)精品課程 第二章統(tǒng)計數(shù)據(jù)的描述 有了分系的錄取數(shù)據(jù) 不難看到工程系錄取的人數(shù)比較多 男女生錄取的比率都是50 而財經(jīng)系招生名額較少 男女生錄取的比率都是25 由于女生報財經(jīng)系的人多 男生報工科的人多 因而導(dǎo)致男生整個錄取率偏高 而女生偏低 這個例子告訴我們對數(shù)據(jù)一是要從不同角度進(jìn)行分析 二是要注意權(quán)數(shù)的影響 這就是本章要討論的問題 引例 華南理工大學(xué)精品課程 6 引例提問 錄取中有無歧視 Q1 Q2 Q3 統(tǒng)計學(xué)怎樣對數(shù)據(jù)進(jìn)行有效分析 怎樣理解權(quán)數(shù)對均值的影響 華南理工大學(xué)精品課程 7 本章學(xué)習(xí)內(nèi)容 1 學(xué)習(xí)如何用數(shù)據(jù)對客觀事物進(jìn)行計量 如何獲取數(shù)據(jù)以及對數(shù)據(jù)質(zhì)量的評價2 如何對獲取的數(shù)據(jù)進(jìn)行整理3 數(shù)據(jù)分布的集中趨勢和離散程度4 非正態(tài)總體的分布偏態(tài)和峰度5 莖葉圖和箱線圖的特點(diǎn)和優(yōu)勢6 統(tǒng)計表及統(tǒng)計圖 華南理工大學(xué)精品課程 8 本章學(xué)習(xí)目標(biāo) 了解數(shù)據(jù)的計量尺度了解統(tǒng)計數(shù)據(jù)的來源和數(shù)據(jù)的質(zhì)量要求掌握數(shù)值型數(shù)據(jù)的整理方法掌握數(shù)據(jù)集中趨勢和離散程度的測度方法掌握莖葉圖和箱線圖的制作方法掌握分布偏態(tài)與峰度的測度方法掌握統(tǒng)計表和統(tǒng)計圖的使用 華南理工大學(xué)精品課程 9 第一節(jié)數(shù)據(jù)的計量尺度 2 1 2 2 2 3 2 4 2 5 第二章具體章節(jié)結(jié)構(gòu) 第二節(jié)統(tǒng)計數(shù)據(jù)的來源 第三節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量 第四節(jié)統(tǒng)計數(shù)據(jù)的整理 第五節(jié)分布集中趨勢的測度 華南理工大學(xué)精品課程 10 第六節(jié)分布離散程度的測度 2 6 2 7 2 8 2 9 第七節(jié)分布偏態(tài)與峰度的測度 第八節(jié)莖葉圖與箱線圖 第九節(jié)統(tǒng)計表與統(tǒng)計圖 第二章具體章節(jié)結(jié)構(gòu) 華南理工大學(xué)精品課程 第一節(jié)數(shù)據(jù)的計量尺度 按照計量學(xué)的一般分類方法 對數(shù)據(jù)分為四種計量尺度 即 一 列名尺度二 順序尺度三 間隔尺度四 比率尺度 華南理工大學(xué)精品課程 12 列名尺度 Nominalscale 也稱名義尺度或分類尺度計量層次最低對事物進(jìn)行平行的分類各類別可以指定數(shù)字代碼表示使用時必須符合類別窮盡和互斥的要求數(shù)據(jù)表現(xiàn)為 類別 具有 或 的數(shù)學(xué)特性 華南理工大學(xué)精品課程 13 順序尺度 Ordinalscale 也稱定序尺度對事物分類的同時給出各類別的順序比定類尺度精確未測量出類別之間的準(zhǔn)確差值數(shù)據(jù)表現(xiàn)為 類別 但有序具有 或 的數(shù)學(xué)特性 華南理工大學(xué)精品課程 14 間隔尺度 Intervalscale 也稱間隔尺度對事物的準(zhǔn)確測度比定序尺度精確數(shù)據(jù)表現(xiàn)為 數(shù)值 沒有絕對零點(diǎn)具有 或 的數(shù)學(xué)特性 華南理工大學(xué)精品課程 15 比率尺度 Ratioscale 也稱比率尺度對事物的準(zhǔn)確測度與定距尺度處于同一層次數(shù)據(jù)表現(xiàn)為 數(shù)值 有絕對零點(diǎn)具有 或 的數(shù)學(xué)特性 華南理工大學(xué)精品課程 16 四種計量尺度的比較 表示該尺度所具有的特性 表2 1四種計量尺度的比較 華南理工大學(xué)精品課程 17 本節(jié)提問 數(shù)據(jù)的計量尺度分為哪幾種 Q1 Q2 Q3 不同計量尺度各有什么特點(diǎn) 間隔尺度和比例尺度有何區(qū)別 華南理工大學(xué)精品課程 第二節(jié)統(tǒng)計數(shù)據(jù)的來源 統(tǒng)計數(shù)據(jù)來源于直接組織的調(diào)查 觀察和科學(xué)試驗(yàn) 我們稱之為第一手?jǐn)?shù)據(jù)或直接的數(shù)據(jù) 或者來源于已有的數(shù)據(jù) 我們稱之為第二手?jǐn)?shù)據(jù)或間接的數(shù)據(jù) 一 間接獲取的數(shù)據(jù)二 直接獲取的數(shù)據(jù) 華南理工大學(xué)精品課程 19 間接取得的數(shù)據(jù) 統(tǒng)計部門和政府部門公布的有關(guān)資料 如各類統(tǒng)計年鑒各類經(jīng)濟(jì)信息中心 信息咨詢機(jī)構(gòu) 專業(yè)調(diào)查機(jī)構(gòu)等提供的數(shù)據(jù)各類專業(yè)期刊 報紙 書籍所提供的資料各種會議 如博覽會 展銷會 交易會及專業(yè)性 學(xué)術(shù)性研討會上交流的有關(guān)資料從互聯(lián)網(wǎng)或圖書館查閱到的相關(guān)資料 華南理工大學(xué)精品課程 20 提供統(tǒng)計數(shù)據(jù)的部分政府網(wǎng)站 表2 2提供統(tǒng)計數(shù)據(jù)的部分政府網(wǎng)站 華南理工大學(xué)精品課程 21 提供統(tǒng)計數(shù)據(jù)的部分政府網(wǎng)站 表2 2提供統(tǒng)計數(shù)據(jù)的部分政府網(wǎng)站 續(xù)表 華南理工大學(xué)精品課程 22 普查 census 為特定目的專門組織的非經(jīng)常性全面調(diào)查通常是一次性或周期性的一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時間數(shù)據(jù)的規(guī)范化程度較高應(yīng)用范圍比較狹窄 華南理工大學(xué)精品課程 23 抽樣調(diào)查 samplingsurvey 1 從總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查 并根據(jù)樣本調(diào)查結(jié)果來推斷總體特征的數(shù)據(jù)收集方法2 具有經(jīng)濟(jì)性 時效性強(qiáng) 適應(yīng)面廣 準(zhǔn)確性高等特點(diǎn) 華南理工大學(xué)精品課程 24 本節(jié)提問 簡要說明統(tǒng)計數(shù)據(jù)的來源 Q1 Q2 獲取直接統(tǒng)計數(shù)據(jù)的渠道主要有哪些 華南理工大學(xué)精品課程 第三節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量 統(tǒng)計數(shù)據(jù)的誤差 一 抽樣誤差二 非抽樣誤差 華南理工大學(xué)精品課程 26 統(tǒng)計數(shù)據(jù)的誤差 華南理工大學(xué)精品課程 27 抽樣誤差 samplingerror 由于抽樣的隨機(jī)性所帶來的誤差所有樣本可能的結(jié)果與總體真值之間的平均性差異影響抽樣誤差大小的因素樣本量的大小總體的變異性 華南理工大學(xué)精品課程 28 非抽樣誤差 non samplingerror 相對于抽樣誤差而言除抽樣誤差之外的 由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣 非概率抽樣 全面性調(diào)查有抽樣框誤差 回答誤差 無回答誤差 調(diào)查員誤差 測量誤差 華南理工大學(xué)精品課程 29 誤差的控制 抽樣誤差可計算和控制非抽樣誤差的控制 調(diào)查員的挑選 調(diào)查員的培訓(xùn) 督導(dǎo)員的調(diào)查專業(yè)水平 調(diào)查過程控制 調(diào)查結(jié)果進(jìn)行檢驗(yàn) 評估 現(xiàn)場調(diào)查人員進(jìn)行獎懲的制度 華南理工大學(xué)精品課程 30 本節(jié)提問 簡要說明抽樣誤差和非抽樣誤差 Q1 Q2 非抽樣誤差的控制有哪些途徑 華南理工大學(xué)精品課程 第四節(jié)統(tǒng)計數(shù)據(jù)的整理 一 統(tǒng)計數(shù)據(jù)的分組二 次數(shù)分配三 次數(shù)分配直方圖四 洛倫茨曲線 華南理工大學(xué)精品課程 32 統(tǒng)計數(shù)據(jù)的分組 統(tǒng)計分組是統(tǒng)計整理的第一步 它是按照統(tǒng)計研究的目的 將數(shù)據(jù)分別分入不同的組內(nèi) 在本章第一節(jié)中 我們將數(shù)據(jù)分成四種計量尺度 即列名尺度 順序尺度 間隔尺度和比例尺度 其中列名尺度和順序尺度的數(shù)據(jù)是按照事物的性質(zhì)和屬性劃分的 因而又稱為按品質(zhì)標(biāo)志分組 間隔尺度和比例尺度是按照事物的數(shù)量標(biāo)準(zhǔn)劃分的 又稱為數(shù)量標(biāo)志分組 華南理工大學(xué)精品課程 33 組距分組 要點(diǎn) 將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循 不重不漏 的原則可采用等距分組 也可采用不等距分組 華南理工大學(xué)精品課程 34 組距分組 步驟 確定組數(shù) 組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的確定組距 組距 classwidth 是一個組的上限與下限之差 可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定 即組距 最大值 最小值 組數(shù)統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表 華南理工大學(xué)精品課程 35 組距分組 幾個概念 1 下限 lowlimit 一個組的最小值2 上限 upperlimit 一個組的最大值3 組距 classwidth 上限與下限之差4 組中值 classmidpoint 下限與上限之間的中點(diǎn)值 華南理工大學(xué)精品課程 36 案例分析次數(shù)分配表的編制 例 某車間30名工人每周加工某種零件件數(shù)如右表試對數(shù)據(jù)進(jìn)行分組 表2 3某車間30名工人周加工零件數(shù) 單位 件 華南理工大學(xué)精品課程 37 案例分析次數(shù)分配表 表2 4某車間30名工人周加工零件數(shù)的頻數(shù)分布 華南理工大學(xué)精品課程 38 使用Excel頻數(shù)函數(shù) FREQUENCY Excel的 直方圖 工具的缺陷是 頻數(shù)分布和直方圖沒有與數(shù)據(jù)聯(lián)系起來 這樣 如果你改變?nèi)魏我粋€數(shù)據(jù) 頻數(shù)分布表和直方圖不會跟著改變 使用Excel中的統(tǒng)計函數(shù) FREQUENCY 來創(chuàng)建頻數(shù)分布表和直方圖 可解決這一問題 華南理工大學(xué)精品課程 39 使用Excel頻數(shù)函數(shù) FREQUENCY 創(chuàng)建頻數(shù)分布表的步驟是 選擇與接受區(qū)域相臨近的單元格區(qū)域 作為頻數(shù)分布表輸出的區(qū)域 選擇統(tǒng)計函數(shù)中的 FREQUENCY 函數(shù)在對話框Date array后輸入數(shù)據(jù)區(qū)域 在Bins array后輸入接受區(qū)域 同時按下ctrl shift Enter組合鍵 即得到頻數(shù)分布 統(tǒng)計函數(shù) FREQUENCY 華南理工大學(xué)精品課程 40 分組數(shù)據(jù)的圖示 直方圖的繪制 我一眼就看出來了 周加工零件在100 110之間的人數(shù)最多 圖2 1某車間工人周加工零件直方圖 華南理工大學(xué)精品課程 41 分組數(shù)據(jù)的圖示 折線圖的繪制 折線圖與直方圖下的面積相等 圖2 2某車間工人周加工零件折線圖 華南理工大學(xué)精品課程 42 次數(shù)分配的類型 圖2 3幾種常見的頻數(shù)分布 華南理工大學(xué)精品課程 43 洛倫茨曲線 20世紀(jì)初美國經(jīng)濟(jì)學(xué)家 統(tǒng)計學(xué)家洛倫茨 M E Lorentz 根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特 V Pareto 提出的收入分配公式繪制而成描述收入和財富分配性質(zhì)的曲線分析該國家或地區(qū)分配的平均程度 累積的人口百分比 絕對公平線 累積的收入百分比 華南理工大學(xué)精品課程 44 基尼系數(shù) 20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼 G Gini 根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標(biāo)A表示實(shí)際收入曲線與絕對平均線之間的面積B表示實(shí)際收入曲線與絕對不平均線之間的面積如果A 0 則基尼系數(shù) 0 表示收入絕對平均 華南理工大學(xué)精品課程 45 基尼系數(shù) 5 如果B 0 則基尼系數(shù) 1 表示收入絕對不平均6 基尼系數(shù)在0和1之間取值7 一般認(rèn)為 基尼系數(shù)若小于0 2 表明分配平均 基尼系數(shù)在0 2至0 4之間是比較適當(dāng)?shù)?即一個社會既有效率又沒有造成極大的分配不公 基尼系數(shù)在0 4被認(rèn)為是收入分配不公平的警戒線 超過了0 4應(yīng)該采取措施縮小這一差距 華南理工大學(xué)精品課程 46 本節(jié)提問 描述次數(shù)分配表的編制過程 Q1 Q2 Q3 解釋洛倫茨曲線及其用途 說明基尼系數(shù)的含義和用途 華南理工大學(xué)精品課程 第五節(jié)分布集中趨勢的測度 一 眾數(shù)二 中位數(shù)三 四分位數(shù)四 均值五 幾何均值六 切尾均值七 眾數(shù) 中位數(shù)和均值的比較 華南理工大學(xué)精品課程 48 眾數(shù) mode 一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù) 也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù) 華南理工大學(xué)精品課程 49 眾數(shù) 不惟一性 無眾數(shù)原始數(shù)據(jù) 11371298 一個眾數(shù)原始數(shù)據(jù) 7461344 多于一個眾數(shù)原始數(shù)據(jù) 171525332424 華南理工大學(xué)精品課程 50 中位數(shù) median 1 排序后處于中間位置上的值2 不受極端值的影響3 主要用于順序數(shù)據(jù) 也可用數(shù)值型數(shù)據(jù) 但不能用于分類數(shù)據(jù)4 各變量值與中位數(shù)的離差絕對值之和最小 即 華南理工大學(xué)精品課程 51 中位數(shù) 位置的確定 華南理工大學(xué)精品課程 52 案例分析 9個數(shù)據(jù)的算例 例 9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù) 14007507601050870950210014501540排序 75076087095010501400145015402100位置 123456789 中位數(shù) 1050 華南理工大學(xué)精品課程 53 案例分析 10個數(shù)據(jù)的算例 例 10個家庭的人均月收入數(shù)據(jù)排序 63569077082093010781230145016902150位置 12345678910 華南理工大學(xué)精品課程 54 四分位數(shù) quartile 1 排序后處于25 和75 位置上的值2 不受極端值的影響3 主要用于順序數(shù)據(jù) 也可用于數(shù)值型數(shù)據(jù) 但不能用于分類數(shù)據(jù) 華南理工大學(xué)精品課程 55 四分位數(shù) 位置的確定 華南理工大學(xué)精品課程 56 案例分析 四分位數(shù)7個數(shù)據(jù)的算例 原始數(shù)據(jù) 23213032282526排序 21232526283032位置 1234567 QL 23 QU 30 N 1 華南理工大學(xué)精品課程 57 案例分析 四分位數(shù)10個數(shù)據(jù)的算例 例 10個家庭的人均月收入數(shù)據(jù)排序 50065076078094010601350168017901900位置 12345678910 統(tǒng)計函數(shù) QUARTILE 華南理工大學(xué)精品課程 58 均值 mean 集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù) 不能用于分類數(shù)據(jù)和順序數(shù)據(jù) 華南理工大學(xué)精品課程 59 簡單均值 simplemean 設(shè)一組數(shù)據(jù)為 x1 x2 xn 總體均值 樣本均值 華南理工大學(xué)精品課程 60 加權(quán)均值 weightedmean 設(shè)一組數(shù)據(jù)為 x1 x2 xn相應(yīng)的頻數(shù)為 f1 f2 fk 總體均值 樣本均值 華南理工大學(xué)精品課程 61 案例分析加權(quán)均值 例 根據(jù)表中的數(shù)據(jù) 計算50名工人日加工零件數(shù)的均值表2 5某車間50名工人日加工零件均值計算表 華南理工大學(xué)精品課程 62 均值 數(shù)學(xué)性質(zhì) 1 各變量值與均值的離差之和等于零2 各變量值與均值的離差平方和最小 華南理工大學(xué)精品課程 63 幾何均值 geometricmean n個變量值乘積的n次方根適用于對比率數(shù)據(jù)的平均主要用于計算平均增長率計算公式為 可看作是均值的一種變形 華南理工大學(xué)精品課程 64 案例分析幾何均值 例 一位投資者購持有一種股票 在1997年 1998年 1999年和2000年收益率分別為4 5 2 0 3 5 5 4 計算該投資者在這四年內(nèi)的平均收益率 平均收益率 103 84 1 3 84 華南理工大學(xué)精品課程 65 切尾均值 trimmedMean 去掉大小兩端的若干數(shù)值后計算中間數(shù)據(jù)的均值在電視大獎賽 體育比賽及需要人們進(jìn)行綜合評價的比賽項(xiàng)目中已得到廣泛應(yīng)用計算公式為 n表示觀察值的個數(shù) 表示切尾系數(shù) 華南理工大學(xué)精品課程 66 案例分析切尾均值 例 某次求職面試中共有11名評委 對某位求職者的給分分別是 經(jīng)整理得到順序統(tǒng)計量值為 去掉一個最高分和一個最低分 取1 11 華南理工大學(xué)精品課程 67 眾數(shù) 中位數(shù)和均值的關(guān)系 圖2 4眾數(shù) 中位數(shù)和均值的關(guān)系 華南理工大學(xué)精品課程 68 眾數(shù) 中位數(shù) 均值的特點(diǎn)和應(yīng)用 眾數(shù) 不受極端值影響 具有不惟一性 數(shù)據(jù)分布偏斜程度較大時應(yīng)用中位數(shù) 不受極端值影響 數(shù)據(jù)分布偏斜程度較大時應(yīng)用均值 易受極端值影響 數(shù)學(xué)性質(zhì)優(yōu)良 數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用 小結(jié) 紅色為該數(shù)據(jù)類型最適合用的測度值 華南理工大學(xué)精品課程 70 本節(jié)提問 一組數(shù)據(jù)的分布特征可以從哪幾個方面進(jìn)行測度 Q1 Q2 Q3 怎樣理解均值在統(tǒng)計學(xué)中的地位 對于比率數(shù)據(jù)的平均 為什么采用幾何平均 簡述眾數(shù) 中位數(shù)和均值的特點(diǎn)和應(yīng)用場合 Q4 華南理工大學(xué)精品課程 第六節(jié)分布離散程度的測度 一 極差二 內(nèi)距三 方差和標(biāo)準(zhǔn)差四 離散系數(shù) 華南理工大學(xué)精品課程 72 極差 range 一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布 計算公式為 R max xi min xi 華南理工大學(xué)精品課程 73 內(nèi)距 Inter QuartileRange IQR 也稱四分位差上四分位數(shù)與下四分位數(shù)之差內(nèi)距 Q3 Q1反映了中間50 數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性 華南理工大學(xué)精品課程 74 案例分析四分位差 例 根據(jù)表中的數(shù)據(jù) 計算甲城市家庭對住房滿意狀況評價的四分位差 解 設(shè)非常不滿意為1 不滿意為2 一般為3 滿意為4 非常滿意為5已知QL 不滿意 2QU 一般 3四分位差 QD QU QL 3 2 1 表2 6甲城市家庭對住房狀況評價的頻數(shù)分布 華南理工大學(xué)精品課程 75 方差和標(biāo)準(zhǔn)差 VarianceandStandarddeviation 1 離散程度的測度值之一2 最常用的測度值3 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的 稱為總體方差或標(biāo)準(zhǔn)差 根據(jù)樣本數(shù)據(jù)計算的 稱為樣本方差或標(biāo)準(zhǔn)差 華南理工大學(xué)精品課程 76 總體方差和標(biāo)準(zhǔn)差 PopulationvarianceandStandarddeviation 未分組數(shù)據(jù) 方差的計算公式 標(biāo)準(zhǔn)差的計算公式 未分組數(shù)據(jù) 組距分組數(shù) 組距分組數(shù) 華南理工大學(xué)精品課程 77 案例分析總體標(biāo)準(zhǔn)差計算過程及結(jié)果 例 根據(jù)表中的數(shù)據(jù) 計算工人日加工零件數(shù)的標(biāo)準(zhǔn)差 表2 7某車間50名工人日加工零件標(biāo)準(zhǔn)差計算表 華南理工大學(xué)精品課程 78 樣本方差和標(biāo)準(zhǔn)差 simplevarianceandstandarddeviation 方差的計算公式 標(biāo)準(zhǔn)差的計算公式 未分組數(shù)據(jù) 未分組數(shù)據(jù) 組距分組數(shù)據(jù) 組距分組數(shù)據(jù) 華南理工大學(xué)精品課程 79 樣本方差自由度 degreeoffreedom 1 一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)2 當(dāng)樣本數(shù)據(jù)的個數(shù)為n時 若樣本均值 x確定后 只有n 1個數(shù)據(jù)可以自由取值 其中必有一個數(shù)據(jù)則不能自由取值3 例如 樣本有3個數(shù)值 即x1 2 x2 4 x3 9 則 x 5 當(dāng) x 5確定后 x1 x2和x3有兩個數(shù)據(jù)可以自由取值 另一個則不能自由取值 比如x1 6 x2 7 那么x3則必然取2 而不能取其他值4 樣本方差用自由度去除 其原因可從多方面解釋 從實(shí)際應(yīng)用角度看 在抽樣估計中 當(dāng)用樣本方差去估計總體方差 2時 它是 2的無偏估計量 華南理工大學(xué)精品課程 80 案例分析樣本方差 樣本方差與標(biāo)準(zhǔn)差 原始數(shù)據(jù) 10591368 華南理工大學(xué)精品課程 81 離散系數(shù) coefficientofvariation 1 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計量單位的影響4 用于對不同組別數(shù)據(jù)離散程度的比較5 計算公式為 華南理工大學(xué)精品課程 82 案例分析離散系數(shù) 例 某公司抽查了所屬的8家超市 其產(chǎn)品銷售數(shù)據(jù)如表 試比較產(chǎn)品銷售額與銷售利潤的離散程度 表2 8某公司所屬8家超市的產(chǎn)品銷售數(shù)據(jù) 華南理工大學(xué)精品課程 83 案例分析離散系數(shù) 結(jié)論 計算結(jié)果表明 v1 v2 說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度 小結(jié) 為該數(shù)據(jù)類型最適合的用的測度值 華南理工大學(xué)精品課程 85 本節(jié)提問 為什么要計算離散系數(shù) Q1 Q2 華南理工大學(xué)精品課程 第七節(jié)分布偏態(tài)與峰度的測度 一 偏態(tài)及其測度二 峰度及其測度 華南理工大學(xué)精品課程 87 偏態(tài)與峰度分布的形狀 偏態(tài) 峰度 圖2 5偏態(tài)與峰度分布的形狀 華南理工大學(xué)精品課程 88 偏態(tài) 1 偏態(tài) 衡量頻數(shù)分配不對稱程度 或偏斜程度的指標(biāo) 2 計算公式 用距法測定 華南理工大學(xué)精品課程 89 當(dāng) 0時 左右完全對稱 為正態(tài)分布 當(dāng) 0時為正偏斜 當(dāng) 0時為負(fù)偏斜 圖2 6偏態(tài)示意圖 偏態(tài) 華南理工大學(xué)精品課程 90 案例分析偏態(tài) 例 已知1997年我國農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù)如表 試計算偏態(tài)系數(shù) 表2 91997年農(nóng)村居民家庭純收入數(shù)據(jù) 華南理工大學(xué)精品課程 91 案例分析偏態(tài)與峰度從直方圖上觀察 按純收入分組 元 結(jié)論 1 為右偏分布2 峰度適中 圖2 7農(nóng)村居民家庭村收入數(shù)據(jù)的直方圖 華南理工大學(xué)精品課程 92 案例分析偏態(tài)系數(shù) 計算過程 表2 10農(nóng)村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計算表 華南理工大學(xué)精品課程 93 案例分析偏態(tài)系數(shù) 計算結(jié)果 根據(jù)上表數(shù)據(jù)計算得 將計算結(jié)果代入公式得 結(jié)論 偏態(tài)系數(shù)為正值 而且數(shù)值較大 說明農(nóng)村居民家庭純收入的分布為右偏分布 即收入較少的家庭占據(jù)多數(shù) 而收入較高的家庭則占少數(shù) 而且偏斜的程度較大 華南理工大學(xué)精品課程 94 峰度 1 峰度 用以衡量頻數(shù)分配的集中程度 即分布曲線的尖峭程度的指標(biāo) 2 計算公式 用距法測定 華南理工大學(xué)精品課程 95 峰度 峰度指標(biāo) 0 分布為正態(tài)峰度 當(dāng)峰度指標(biāo) 0時 表示頻數(shù)分布比正態(tài)分布更集中 分布呈尖峰狀態(tài) 0時表示頻數(shù)分布比正態(tài)分布更分散 分布呈平坦峰 如圖所示 圖2 8峰度示意圖 華南理工大學(xué)精品課程 第八節(jié)莖葉圖與箱線圖 一 莖葉圖二 箱線圖 華南理工大學(xué)精品課程 97 莖葉圖 stem and leafdisplay 用于顯示未分組的原始數(shù)據(jù)的分布由 莖 和 葉 兩部分構(gòu)成 其圖形由數(shù)字組成以該組數(shù)據(jù)的高位數(shù)值作樹莖 低位數(shù)字作樹葉樹葉上只保留一位數(shù)字莖葉圖類似于橫置的直方圖 但又有區(qū)別 直方圖可觀察一組數(shù)據(jù)的分布狀況 但沒有給出具體的數(shù)值 莖葉圖既能給出數(shù)據(jù)的分布狀況 又能給出每一個原始數(shù)值 保留了原始數(shù)據(jù)的信息 華南理工大學(xué)精品課程 98 案例分析莖葉圖 樹莖 樹葉 78 022347778889 001222233334446677789 0133445799 數(shù)據(jù)個數(shù) 圖2 9某車間30名工人周加工零件數(shù)據(jù)的莖葉圖表 華南理工大學(xué)精品課程 99 案例分析擴(kuò)展的莖葉圖 圖2 10擴(kuò)展的莖葉圖表 78802234577788890012222333344455667778890133445799 樹莖 樹葉 10 10 11 11 12 12 13 13 華南理工大學(xué)精品課程 100 箱線圖 boxplot 用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成 它由一個箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個特征值 即最大值 最小值 中位數(shù)Me和兩個四分位數(shù) 下四分位數(shù)QL和上四分位數(shù)QU 連接兩個四分 位 數(shù)畫出箱子 再將兩個極值點(diǎn)與箱子相連接 華南理工大學(xué)精品課程 101 箱線圖 箱線圖的構(gòu)成 華南理工大學(xué)精品課程 102 案例分析箱線圖 華南理工大學(xué)精品課程 103 分布的形狀與箱線圖 圖2 13不同分布的箱線圖 華南理工大學(xué)精品課程 104 案例分析多批數(shù)據(jù)箱線圖 例 從某大學(xué)工商管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人 對8門主要課程的考試成績進(jìn)行調(diào)查 所得結(jié)果如表 試?yán)L制各科考試成績的批比較箱線圖 并分析各科考試成績的分布特征 表2 1111名學(xué)生各科的考試成績數(shù)據(jù) 華南理工大學(xué)精品課程 105 圖2 148門課程考試成績的箱線圖 案例分析多批數(shù)據(jù)箱線圖 華南理工大學(xué)精品課程 106 圖2 1511名學(xué)生8門課程考試成績的箱線圖 min max 25 75 medianvalue 45 55 65 75 85 95 105 學(xué)生1 學(xué)生2 學(xué)生3 學(xué)生4 學(xué)生5 學(xué)生6 學(xué)生7 學(xué)生8 學(xué)生9 學(xué)生10 學(xué)生11 案例分析多批數(shù)據(jù)箱線圖 華南理工大學(xué)精品課程 107 本節(jié)提問 描述莖葉圖和箱線圖的畫法 Q1 Q2 說明莖葉圖和箱線圖的用途 Q2 Q2 華南理工大學(xué)精品課程 第九節(jié)統(tǒng)計表與統(tǒng)計圖 統(tǒng)計表和統(tǒng)計圖是顯示統(tǒng)計數(shù)據(jù)的兩種方式 統(tǒng)計表把雜亂的數(shù)據(jù)有條理地組織在一張簡明的表格內(nèi) 統(tǒng)計圖把數(shù)據(jù)形象地顯示出來 華南理工大學(xué)精品課程 109 統(tǒng)計表 數(shù)字資料 行標(biāo)題 附加 列標(biāo)題 表2 121999 2000年城鎮(zhèn)居民家庭抽樣調(diào)查資料 表頭 資料來源 中國統(tǒng)計年鑒2001 中國統(tǒng)計出版社 2001 第305頁 注 本表為城鎮(zhèn)居民家庭收支抽樣調(diào)查材料 華南理工大學(xué)精品課程 110 統(tǒng)計表設(shè)計的一般要求 1 要合理安排統(tǒng)計表的結(jié)構(gòu)2 總標(biāo)題內(nèi)容應(yīng)滿足3W要求3 數(shù)據(jù)計量單位相同時 可放在表的右上角標(biāo)明 不同時應(yīng)放在每個指標(biāo)后或單列出一列標(biāo)明4 表中的上下兩條橫線一般用粗線 其他線用細(xì)線5 通常情況下 統(tǒng)計表的左右兩邊不封口 華南理工大學(xué)精品課程 111 6 表中的數(shù)據(jù)一般是右對齊 有小數(shù)點(diǎn)時應(yīng)以小數(shù)點(diǎn)對齊 而且小數(shù)點(diǎn)的為數(shù)應(yīng)統(tǒng)一7 對于沒有小數(shù)點(diǎn)的單元 一般用 表示8 必要時可在表的下方加上注釋 統(tǒng)計表設(shè)計的一般要求 華南理工大學(xué)精品課程 112 統(tǒng)計圖 常見的統(tǒng)計圖 直方圖 莖葉圖和箱線圖折線圖 條形圖和圓形圖 環(huán)行圖 雷達(dá)圖等等 華南理工大學(xué)精品課程 113 定類數(shù)據(jù)的圖示 條形圖 條形圖的制作 條形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動的圖形 條形圖有單式 復(fù)式等形式 在表示定類數(shù)據(jù)的分布時 是用條形圖的高度來表示各類別數(shù)據(jù)的頻數(shù)或頻率 繪制時 各類別可以放在縱軸 稱為條形圖 也可以放在橫軸 稱為柱形圖 華南理工大學(xué)精品課程 114 定類數(shù)據(jù)的圖示 條形圖 由Excel繪制的條形圖 定類數(shù)據(jù)的圖示 圓形圖 圓形圖的制作 華南理工大學(xué)精品課程 115 1 也稱餅圖 是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形 2 主要用于表示總體中各組成部分所占的比例 對于研究結(jié)構(gòu)性問題十分有用 3 在繪制圓形圖時 總體中各部分所占的百分比用圓內(nèi)的各個扇形面積表示 這些扇形的中心角度 是按各部分百分比占3600的相應(yīng)比例確定的 4 例如 關(guān)注服務(wù)廣告的人數(shù)占總?cè)藬?shù)的百分比為25 5 那么其扇形的中心角度就應(yīng)為3600 25 5 91 80 其余類推 定類數(shù)據(jù)的圖示 圓形圖 華南理工大學(xué)精品課程 116 由Excel繪制的圓形圖 定序數(shù)據(jù)的圖示 環(huán)形圖 環(huán)形圖的制作 華南理工大學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論