版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、概率統(tǒng)計(jì)與隨機(jī)過程,宋 暉 2012年秋,第一章 概率統(tǒng)計(jì)基礎(chǔ),1.1 基本原理 1.2 高斯分布 1.3 統(tǒng)計(jì)基礎(chǔ),高斯分布(Gaussian),Normal 正態(tài)分布,:均值(mean) 2 :方差(variance), :標(biāo)準(zhǔn)方差 = 1/2 :精確度(Precision),Gaussian分布期望與方差,期望,方差,Gaussian分布的再生性,若獨(dú)立隨機(jī)變量 為分別服從均值為 ,方差為 的正態(tài)分布,則,隨機(jī)變量的線性組合仍然服從相同的分布,第一章 概率統(tǒng)計(jì)基礎(chǔ),1.1 基本原理 1.2 高斯分布 1.3 統(tǒng)計(jì)基礎(chǔ) 數(shù)據(jù)顯示與圖形法 常用統(tǒng)計(jì)量 常用統(tǒng)計(jì)分布,總體和統(tǒng)計(jì)推斷,全體被研究
2、對象稱為總體,每個(gè)研究對象稱為個(gè)體 可以是有限的,如學(xué)校學(xué)生身高、視力 有限總體很大時(shí),可以認(rèn)為是無限的,如全國干電池壽命 可以是無限的,如每天的測量氣壓 統(tǒng)計(jì)推斷 當(dāng)無法獲取總體全部個(gè)體的觀測值時(shí),只能依賴從總體中獲得的某個(gè)觀測子集來對總體做出推斷。,抽樣,樣本是總體的一個(gè)子集 保證從樣本到總體推斷的正確性,選擇隨機(jī)抽樣,表示得到的觀測值是獨(dú)立且隨機(jī) 隨機(jī)變量X總體上服從概率分布p(x), 那么隨機(jī)抽樣的n個(gè)樣本值x1,x2,xn獨(dú)立且具有相同概率p(x), 其聯(lián)合概率:,統(tǒng)計(jì)推斷步驟,隨機(jī)抽樣,數(shù)據(jù)分析(圖形法),分布假設(shè),參數(shù)估計(jì),假設(shè)檢驗(yàn),假設(shè)修正,預(yù)測,總體模型,數(shù)據(jù)顯示和圖形法,利
3、用有啟發(fā)性的圖形來提取關(guān)于數(shù)據(jù)特性的信息,對數(shù)據(jù)分布進(jìn)行假設(shè) 莖葉圖(Stem and leaf ) 直方圖(histogram) 箱須圖(Box-Whisker) 經(jīng)驗(yàn)分布函數(shù)圖( empirical cumulative distribution ) 正態(tài)概率分布圖(Normal Probability),莖葉圖,將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較,將數(shù)的大小基本不變或變化不大的位作為一個(gè)主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個(gè)主干后面的幾個(gè)數(shù),每個(gè)數(shù)具體是多少。 通常 選取520根莖,頻率直方圖,將樣本取值分為r個(gè)區(qū)間,n個(gè)樣本,落在某個(gè)區(qū)間(ak-1
4、,ak的個(gè)數(shù) nk稱為頻數(shù) nk /n稱為頻率,目標(biāo):利用頻率直方圖估計(jì)總體的概率密度,在(ak-1,ak區(qū)間用頻率為縱坐標(biāo),制作相應(yīng)的頻率直方圖,相對頻率直方圖,每個(gè)頻數(shù)除以數(shù)據(jù)總量,得到相對頻率,相對頻率折線圖,根據(jù)每個(gè)分區(qū)的相對頻率,畫出折線圖 估計(jì)頻率分布,莖葉圖與直方圖,莖葉圖特優(yōu)點(diǎn) 沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到 圖中的數(shù)據(jù)可以隨時(shí)記錄,隨時(shí)添加,方便記錄與表示。 只便于表示兩位有效數(shù)字的數(shù)據(jù),且只方便記錄兩組的數(shù)據(jù) 莖葉圖與直方圖類似 莖葉圖保留原始資料的資訊,直方圖則失去原始資料的訊息 將莖和葉逆時(shí)針方向旋轉(zhuǎn)90,實(shí)際上就是一個(gè)直方圖,可以從中統(tǒng)計(jì)出次
5、數(shù),計(jì)算出各數(shù)據(jù)段的頻率或百分比。 可以看出分布是否與正態(tài)分布或單峰偏態(tài)分布逼近。,Box-Whisker圖(箱須圖),中位數(shù): 將x1,x2, Xn按升序排列, 四分位數(shù):25%(上Q1 ),75%(下Q3) 四分位數(shù)差(IQR) 上四分位數(shù)與下分位數(shù)之間的差值,BOX圖(2),上邊緣 大于Q1+1.5IQR的點(diǎn) 或最大值 下邊緣 小于Q3-1.5IQR的點(diǎn) 或最小值 上下邊緣以外的點(diǎn)為異常點(diǎn)(Outliers) 例:班級學(xué)生成績統(tǒng)計(jì),班級成績分析,Box圖(3),反映數(shù)據(jù)的中心位置、波動和非對稱程度 中位數(shù):中心 四分位數(shù)差(IQR):波動程度 上下邊緣:異常點(diǎn) 作用 觀察異常點(diǎn) 比較幾批
6、數(shù)據(jù)形狀,經(jīng)驗(yàn)分布函數(shù),F(x) 為總體的分布函數(shù),稱,為經(jīng)驗(yàn)分布函數(shù)或樣本分布函數(shù),目標(biāo):利用經(jīng)驗(yàn)分布估計(jì)總體的分布,經(jīng)驗(yàn)累積分布圖(empirical cumulative distribution),總體的分布函數(shù)稱為理論也分布函數(shù) 經(jīng)驗(yàn)分布函數(shù)利用樣本估計(jì)和推斷總體的分布函數(shù)F(x).,正態(tài)概率分布圖,藍(lán)色+表示樣本數(shù)據(jù) 疊加紅線是連接上四分位數(shù)和下四分位數(shù)的直線,如果數(shù)據(jù)服從正態(tài)分布,樣本數(shù)據(jù)畫出的圖成線性,重要統(tǒng)計(jì)量,統(tǒng)計(jì)量:由隨機(jī)變量組成的一隨機(jī)樣本的函數(shù),不含任何未知參數(shù) 樣本均值,描述樣本中心趨勢 樣本方差,描述樣本的波動性 樣本標(biāo)準(zhǔn)差S,樣本方差的平方根,抽樣分布,統(tǒng)計(jì)推斷
7、從樣本中推斷總體 主要目標(biāo):歸納和預(yù)測 統(tǒng)計(jì)量的概率分布稱為抽樣分布 總體大小 樣本容量 選擇樣本的方法 例:依據(jù) 的抽樣分布對參數(shù) 做出推斷,均值的抽樣分布,樣本容量為n的 的抽樣分布 實(shí)驗(yàn)不斷重復(fù)(樣本容量為n),產(chǎn)生多次的值時(shí)的一個(gè)分布 描述樣本在總體均值附近的平均變化,n個(gè)隨機(jī)樣本來自N(,2)總體,均值, N(,2/n),定義:設(shè)Xk為相互獨(dú)立的隨機(jī)變量序列,有有限的數(shù)學(xué)期望 E(Xk)=k 和方差 D(Xk)=k2,令,若對于一切實(shí)數(shù)x,有,則稱隨機(jī)變量序列Xk服從中心極限定理( Central Limit Theorem ),標(biāo)準(zhǔn)正態(tài)分布,定理(林德貝爾格-勒維,Lindeber
8、g-Levy) 設(shè)Xk為相互獨(dú)立的隨機(jī)變量序列,服從同一分布,且具有數(shù)學(xué)期望 E(Xk)= 和方差 D(Xk)=2 ,則隨機(jī)變量,的分布函數(shù)Fn(x),對于任意x,滿足,如果從一個(gè)未知分布的總體抽樣,不管它是有限還是無限的,假設(shè)樣本容量足夠大時(shí),樣本均值的抽樣分布會近似于 N(,2/n) 的正態(tài)分布。,中心極限定理應(yīng)用,n30, 的正態(tài)分布逼近較好 n30,總體近似正態(tài)分布時(shí),逼近效果較好 如果總體 正態(tài)分布,無論n大小, 的抽樣分布精確服從正態(tài)分布,若一個(gè)隨機(jī)變量 X 可以看做許多微小而獨(dú)立的隨機(jī)因素作用的總和,每一種因素的影響很小,不產(chǎn)生決定作用,則 X 一般可以認(rèn)為近似地服從正態(tài)分布,例
9、:測量誤差X 影響因素:溫度X1、濕度X2 、觀察視線X3 、心情X4等 微小的、隨機(jī)的,而且相互沒有影響 測量的總誤差是上述各個(gè)因素產(chǎn)生的誤差之和:Xi,某樣本的線性擬合模型可以描述為:,例: 將一顆骰子連擲100次,則點(diǎn)數(shù)之和不少于500的概率是多少?,解: 設(shè)Xk為第k 次擲出的點(diǎn)數(shù),k=1,2,100,則 X1,X100獨(dú)立同分布.,由中心極限定理:,定理 (De Moivre-Laplace中心極限定理) 設(shè)隨機(jī)變量Yn服從二項(xiàng)分布Yn B(n,p), (op1),則對于任意x,恒有,證明 設(shè)X1,X2,Xn是n個(gè)相互獨(dú)立的服從(0-1)分布(PXi=0=1-p, PXi=1=p)的
10、隨機(jī)變量,則,Yn= X1+X2+Xn,由于E(Xi)=p, D(Xi)=p(1-p) (i=1,2,n),由此得,例:在一家保險(xiǎn)公司里有10000個(gè)人參加壽命保險(xiǎn),每人每年付12元保險(xiǎn)費(fèi)。在一年內(nèi)一個(gè)人死亡的概率為0.6%,死亡時(shí)其家屬可向保險(xiǎn)公司領(lǐng)得1000元,問:,(1)保險(xiǎn)公司虧本的概率有多大? (2)其他條件不變,為使保險(xiǎn)公司一年的利潤不少于60000元的概率大于0.9,則賠償金至多可設(shè)為多少?,解:設(shè)X表示一年內(nèi)死亡的人數(shù),則X B(n, p) 其中 n= 10000,p=0.6%,設(shè)Y表示保險(xiǎn)公司一年的利潤,,Y = 1000012-1000X,(1) PY0=P1000012-
11、1000X0 =1PX120,由中心極限定理:,1PX120 1 (7.75) =0,PY60000 = P1000012-aX60000 =PX60000/a0.9;,(2)設(shè)賠償金為a元,則令,由中心極限定理,上式等價(jià)于,作業(yè),1. 推導(dǎo)Gaussian分布的方差 2. 食品店有三種蛋糕出售,價(jià)格為1元、1.2元、1.5 元,售出概率分別為0.3、0.2、0.5某天該食品店出售了300 只蛋糕試用中心極限定理計(jì)算,這天的收入至少為395元的概率。 3. 學(xué)習(xí)使用Matlab,熟悉樣本的圖形顯示以及正態(tài)分布的繪制函數(shù) 機(jī)房版本:Matlab7 請自行收集樣本集(注意樣本數(shù)據(jù)盡可能充分) 撰寫報(bào)告,論述樣本數(shù)據(jù)的來源背景、繪制圖形試推斷數(shù)據(jù)的總體分布,并分析所反映的意義,Gaus
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年航運(yùn)風(fēng)險(xiǎn)管理實(shí)務(wù)培訓(xùn)
- 2026年檔案管理數(shù)字化轉(zhuǎn)型培訓(xùn)
- 2026年房地產(chǎn)投資與財(cái)務(wù)自由的關(guān)系
- 2025年北大康奈爾筆試及答案
- 2025年悉尼駕照筆試題庫及答案
- 2025年秦漢中學(xué)招聘教師筆試及答案
- 2025年維修電工面試筆試題及答案
- 2025年蘭西管理崗事業(yè)編考試題及答案
- 2026年河北水利發(fā)展集團(tuán)有限公司公開招聘工作人員1名筆試參考題庫及答案解析
- 2025年洪山街道招聘筆試題庫及答案
- 鋼結(jié)構(gòu)防火涂料應(yīng)用技術(shù)規(guī)程TCECS 24-2020
- 民事答辯狀(信用卡糾紛)樣式
- 橋梁施工現(xiàn)場文明施工方案
- 卡西歐手表WVA-M600(5161)中文使用說明書
- 數(shù)字媒體藝術(shù)設(shè)計(jì)專業(yè)畢業(yè)設(shè)計(jì)任務(wù)書
- JJF(晉) 117-2025 飲用水售水機(jī)校準(zhǔn)規(guī)范
- 國家建設(shè)工程項(xiàng)目施工安全生產(chǎn)標(biāo)準(zhǔn)化工地
- 華為財(cái)務(wù)報(bào)銷培訓(xùn)課件
- 2025年福建省中考英語試卷真題及答案詳解(精校打印版)
- 《鐵路運(yùn)輸調(diào)度》課件全套 孫建暉 第1-5章 貨物列車編組計(jì)劃- 調(diào)度工作分析
- 解讀《華為數(shù)據(jù)之道》
評論
0/150
提交評論