版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、Section 1.3Normal Distributions常態(tài)分配,單一變數(shù)的分配,將觀察資料圖示 直方圖、莖葉圖 檢視圖形的整體型態(tài) 外形、中心點、分散度及離群值 (outliers) 。 以統(tǒng)計數(shù)字概述資料的中心點及分散度。 若觀察資料數(shù)量夠大,則圖形的整體型態(tài)可用平滑曲線顯示。,密度曲線(Density Curve),若觀察資料數(shù)量夠大,則直方圖(組數(shù)適當(dāng)增加)的整體型態(tài)可用一近似的平滑曲線顯示。 上述直方圖中縱軸改為次數(shù)比例,則該平滑曲線稱為密度曲線(density curve)。,直方圖顯示資料的分配,直方圖顯示資料的分配(續(xù)),平滑曲線顯示分配,密度曲線顯示分配,直方圖面積,密
2、度曲線下面積,密度曲線的性質(zhì),曲線都在水平線上 (i.e., 密度函數(shù)=0)。 曲線下所 涵蓋的全部面積正好為1 (i.e., 所有可能性為 1)。 曲線下任何範(fàn)圍所涵蓋的面積,為觀察值落在該範(fàn)圍的比例 (i.e., 機率)。 密度曲線可視為是觀察變數(shù)的理論分配圖形。,密度曲線的中位數(shù),密度曲線的中位數(shù),即為將密度曲線下的面積等分的點(數(shù))。也可視為是觀察變數(shù)的理論中位數(shù)。 四分位數(shù)將曲線下的面積分為四等分。 對稱密度曲線的中位數(shù),即為密度曲線的中心點。 偏斜密度曲線的中位數(shù),並不容易找到,需使用數(shù)學(xué)方法如微積分來求得。,密度曲線與中位數(shù)、四分位點,Q1,Q3,M,密度曲線的平均值,密度曲線的
3、平均值,即為密度曲線(當(dāng)成實體時)的平衡點。也可視為是觀察變數(shù)的理論平均值,多以希臘字 m 表示。,密度曲線的平均值與中位數(shù),對稱密度曲線的 平均值,即密度 曲線的中心點。 Figure 1.15 偏斜密度曲線的 平均值,多使用 數(shù)學(xué)方法如微積 分來求得。,密度曲線的其他統(tǒng)計量,密度曲線的標(biāo)準(zhǔn)差則須以數(shù)學(xué)模式推導(dǎo)。 為區(qū)隔觀察變數(shù)與密度曲線的平均值與標(biāo)準(zhǔn)差,我們以 m 代表理論平均值,以 s 代表理論標(biāo)準(zhǔn)差。 觀察值的樣本平均數(shù)為 ,標(biāo)準(zhǔn)差為 s。,常態(tài)分配,常態(tài)曲線 所有常態(tài)曲線都有相同的外型 具有對稱、單峰及鐘形的特性。 常態(tài)曲線所代表的分配即為常態(tài)分配(normal distributi
4、on) 每一常態(tài)分配都有其平均值m 與標(biāo)準(zhǔn)差s 。,常態(tài)曲線,m,s,常態(tài)曲線 s 較大,m,s,常態(tài)曲線的分割,反曲點落在一個s處,反曲點落在-s處,Why 常態(tài)分配 很重要 in Statistics,Good descriptions for some distributions of real data 身高, 體重, 考試成績 Good approximations to the results of many kinds of chance outcomes Tossing a coin many times Many statistical inference procedure
5、s are based on normal distributions,常態(tài)分配的68-95-99.7規(guī)則,常態(tài)分配有其特定的資料分佈規(guī)則: 平均值為m , 標(biāo)準(zhǔn)差為 s 的常態(tài)分配 68%的觀察資料落在m 的 1s 之內(nèi) 95%的觀察資料落在m 的 2s 之內(nèi) 99.7%的觀察資料落在m 的 3s 之內(nèi),圖示68-95-99.7規(guī)則,0,1,2,3,-1,-2,-3,m,m+s,m+2s,m+3s,m-s,m-2s,m-3s,68% 的資料,95% 的資料,99.7% 的資料,資料標(biāo)準(zhǔn)化(Standardization),令觀察值 x 服從平均值為m ,標(biāo)準(zhǔn)差為 s 的分配,則 x 的標(biāo)準(zhǔn)化
6、值(standardized value)定為 標(biāo)準(zhǔn)化值又稱為 z-值(z-score)。,標(biāo)準(zhǔn)化資料的平均值,變數(shù)z 的平均值為 0 (m = 0 )。 n 筆資料的z-值分別為 z1, z2, , zn, 其中 ,則z-值之平均數(shù)為 0。,標(biāo)準(zhǔn)化資料的標(biāo)準(zhǔn)差,變數(shù)z的標(biāo)準(zhǔn)差為 1 (s = 1)。 n 筆資料的 z-值標(biāo)準(zhǔn)差為 sz,,標(biāo)準(zhǔn)常態(tài)分配,變數(shù) X 服從平均值為 m ,標(biāo)準(zhǔn)差為 s 的常態(tài)分配,簡記為 X N(m, s2)。 X 經(jīng)過標(biāo)準(zhǔn)化後為 Z(=(X- m)/ s ),則 Z 的平均值為 0 ,標(biāo)準(zhǔn)差為 1,即Z N(0, 1)。我們稱 Z 服從標(biāo)準(zhǔn)常態(tài)(standard
7、normal)。,標(biāo)準(zhǔn)常態(tài)表(Table A),z,表列數(shù)字是z左邊的面積,z = - 0.44,z左邊的面積為0.33,- 0.44,0.33,標(biāo)準(zhǔn)常態(tài)表實例,z,表列數(shù)字是z左邊的面積,z = 0.44,z左邊的面積為0.67,常態(tài)資料,例題1.16 : 14 歲男孩之膽固醇值 X (單位mg/dl)服從常態(tài),N(170, 302)。求膽固醇值大於240 (i.e., may need medical attention)的男孩比例? 問題轉(zhuǎn)換:求 X 240的機率? 標(biāo)準(zhǔn)化: 查表:z = 2.33,曲線下小於 z的面積為0.9901,所以 z 2.33的面積為 1- 0.9901=0.
8、0099 。,圖示例題1.16,z = 2.33,z 右邊的面積為0.0099,由數(shù)值求比例(proportion),例題1.17:求膽固醇值介於170與240之間的男孩比例? 問題轉(zhuǎn)換:求 的機率? 標(biāo)準(zhǔn)化: 查表:z = 2.33,曲線下小於 z的面積為0.9901,曲線下小於 0的面積為 0.5,所以,例題1.17:求膽固醇值介於170與240之間的男孩比例? 問題轉(zhuǎn)換:求 的機率? 標(biāo)準(zhǔn)化: 查表:z = 2.33,曲線下小於 z的面積為0.9901,曲線下小於 0的面積為 0.5,所以 的面積為 0.9901- 0.5 = 0.4901。,圖示例題1.17,2.33,面積為0.4901,面積為0.5,0,由比例求數(shù)值,例題1.18:SAT字彙分?jǐn)?shù)的分配近似 N(505, 1102),則前10%的分?jǐn)?shù)應(yīng)該是多少? 問題轉(zhuǎn)換:大於 x 的機率為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 籃球618活動策劃方案(3篇)
- 電路隱蔽施工方案(3篇)
- 粉塵定期清理安全管理制度(3篇)
- 醫(yī)院網(wǎng)評員管理制度(3篇)
- 車間標(biāo)識卡管理制度內(nèi)容(3篇)
- 2026國家統(tǒng)計局黔南調(diào)查隊招聘編外聘用人員1人(貴州)備考考試試題及答案解析
- 2026江蘇南京大學(xué)生物醫(yī)學(xué)工程學(xué)院準(zhǔn)聘長聘崗位(事業(yè)編制)招聘備考考試題庫及答案解析
- 2026年1月江蘇揚州市衛(wèi)生健康系統(tǒng)事業(yè)單位招聘專業(yè)技術(shù)人員54人參考考試題庫及答案解析
- 2026重慶飛駛特人力資源管理有限公司派往重慶市運動技術(shù)學(xué)院專職體能教練員招聘備考考試試題及答案解析
- 護(hù)理案例分享:感染控制與預(yù)防的重要性
- 商業(yè)地產(chǎn)物業(yè)管理運營手冊
- 百人公司年會策劃方案
- 青少年法律知識競賽試題及答案
- 鏈?zhǔn)捷斔蜋C傳動系統(tǒng)設(shè)計
- 加班工時管控改善方案
- 2025分布式數(shù)據(jù)庫 OceanBase 架構(gòu)演進(jìn)與業(yè)務(wù)場景實踐
- 2025年軍工企業(yè)招聘考試面試流程與注意事項詳解
- 《昆蟲記》中的昆蟲圖片
- 鐵路施工安全檢查日志范本
- 五層外架施工方案
- 供應(yīng)鏈中斷應(yīng)急預(yù)案(商品斷供、物流中斷)
評論
0/150
提交評論