版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
概率數(shù)理統(tǒng)計(jì)第1頁,共37頁,2023年,2月20日,星期五第一章概率統(tǒng)計(jì)基礎(chǔ)1.1基本原理1.2高斯分布1.3統(tǒng)計(jì)基礎(chǔ)第2頁,共37頁,2023年,2月20日,星期五高斯分布
(Gaussian)Normal正態(tài)分布μ:均值(mean)σ2
:方差(variance),σ:標(biāo)準(zhǔn)方差β=1/σ2
:精確度(Precision)第3頁,共37頁,2023年,2月20日,星期五Gaussian分布期望與方差期望方差第4頁,共37頁,2023年,2月20日,星期五Gaussian分布的再生性若獨(dú)立隨機(jī)變量為分別服從均值為,方差為的正態(tài)分布,則隨機(jī)變量的線性組合仍然服從相同的分布第5頁,共37頁,2023年,2月20日,星期五第一章概率統(tǒng)計(jì)基礎(chǔ)1.1基本原理1.2高斯分布1.3統(tǒng)計(jì)基礎(chǔ)數(shù)據(jù)顯示與圖形法常用統(tǒng)計(jì)量常用統(tǒng)計(jì)分布第6頁,共37頁,2023年,2月20日,星期五總體和統(tǒng)計(jì)推斷全體被研究對象稱為總體,每個(gè)研究對象稱為個(gè)體可以是有限的,如學(xué)校學(xué)生身高、視力有限總體很大時(shí),可以認(rèn)為是無限的,如全國干電池壽命可以是無限的,如每天的測量氣壓統(tǒng)計(jì)推斷當(dāng)無法獲取總體全部個(gè)體的觀測值時(shí),只能依賴從總體中獲得的某個(gè)觀測子集來對總體做出推斷。第7頁,共37頁,2023年,2月20日,星期五抽樣樣本是總體的一個(gè)子集保證從樣本到總體推斷的正確性,選擇隨機(jī)抽樣,表示得到的觀測值是獨(dú)立且隨機(jī)隨機(jī)變量X總體上服從概率分布p(x),那么隨機(jī)抽樣的n個(gè)樣本值{x1,x2,…,xn}獨(dú)立且具有相同概率p(x),其聯(lián)合概率:第8頁,共37頁,2023年,2月20日,星期五統(tǒng)計(jì)推斷步驟隨機(jī)抽樣數(shù)據(jù)分析(圖形法)分布假設(shè)參數(shù)估計(jì)假設(shè)檢驗(yàn)假設(shè)修正預(yù)測總體模型第9頁,共37頁,2023年,2月20日,星期五數(shù)據(jù)顯示和圖形法
利用有啟發(fā)性的圖形來提取關(guān)于數(shù)據(jù)特性的信息,對數(shù)據(jù)分布進(jìn)行假設(shè)莖葉圖(Stemandleaf)直方圖(histogram)箱須圖(Box-Whisker)經(jīng)驗(yàn)分布函數(shù)圖(empiricalcumulativedistribution)正態(tài)概率分布圖(NormalProbability)第10頁,共37頁,2023年,2月20日,星期五莖葉圖將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較,將數(shù)的大小基本不變或變化不大的位作為一個(gè)主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個(gè)主干后面的幾個(gè)數(shù),每個(gè)數(shù)具體是多少。通常選取5~20根莖汽車電池壽命2.24.13.54.53.23.73.02.63.41.63.13.33.83.14.73.72.54.33.43.62.93.33.93.13.33.13.74.43.24.11.93.44.73.83.22.63.93.04.24.5汽車電池壽命莖葉圖莖葉頻率16922256695300011112223334445567778899254112345778第11頁,共37頁,2023年,2月20日,星期五頻率直方圖將樣本取值分為r個(gè)區(qū)間,n個(gè)樣本,落在某個(gè)區(qū)間(ak-1,ak]的個(gè)數(shù)nk稱為頻數(shù)nk/n稱為頻率目標(biāo):利用頻率直方圖估計(jì)總體的概率密度在(ak-1,ak]區(qū)間用頻率為縱坐標(biāo),制作相應(yīng)的頻率直方圖第12頁,共37頁,2023年,2月20日,星期五相對頻率直方圖每個(gè)頻數(shù)除以數(shù)據(jù)總量,得到相對頻率汽車電池壽命相對頻率分布區(qū)間組組中點(diǎn)頻率相對頻率1.5-1.91.720.0502.0-2.42.210.0252.5-2.92.740.1003.0-3.43.2150.3753.5-3.93.7100.2504.0-4.44.250.1254.5-4.94.730.075第13頁,共37頁,2023年,2月20日,星期五相對頻率折線圖汽車電池壽命相對頻率分布區(qū)間組組中點(diǎn)頻率相對頻率1.5-1.91.720.0502.0-2.42.210.0252.5-2.92.740.1003.0-3.43.2150.3753.5-3.93.7100.2504.0-4.44.250.1254.5-4.94.730.075根據(jù)每個(gè)分區(qū)的相對頻率,畫出折線圖估計(jì)頻率分布第14頁,共37頁,2023年,2月20日,星期五莖葉圖與直方圖莖葉圖特優(yōu)點(diǎn)沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到圖中的數(shù)據(jù)可以隨時(shí)記錄,隨時(shí)添加,方便記錄與表示。只便于表示兩位有效數(shù)字的數(shù)據(jù),且只方便記錄兩組的數(shù)據(jù)莖葉圖與直方圖類似莖葉圖保留原始資料的資訊,直方圖則失去原始資料的訊息將莖和葉逆時(shí)針方向旋轉(zhuǎn)90°,實(shí)際上就是一個(gè)直方圖,可以從中統(tǒng)計(jì)出次數(shù),計(jì)算出各數(shù)據(jù)段的頻率或百分比??梢钥闯龇植际欠衽c正態(tài)分布或單峰偏態(tài)分布逼近。第15頁,共37頁,2023年,2月20日,星期五Box-Whisker圖(箱須圖)中位數(shù):將x1,x2,…,Xn按升序排列,四分位數(shù):25%(上Q1),75%(下Q3)四分位數(shù)差(IQR)上四分位數(shù)與下分位數(shù)之間的差值第16頁,共37頁,2023年,2月20日,星期五BOX圖(2)上邊緣大于Q1+1.5IQR的點(diǎn)或最大值下邊緣小于Q3-1.5IQR的點(diǎn)或最小值上下邊緣以外的點(diǎn)為異常點(diǎn)(Outliers)例:班級學(xué)生成績統(tǒng)計(jì)第17頁,共37頁,2023年,2月20日,星期五(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)5333535364344454748(11)(12)(13)(14)(15)(16)(17)(18)(19)(20)52555864646568697074(21)(22)(23)(24)(25)(26)(27)(28)(29)(30)78808080828384848589最小數(shù)(90%)下四分位數(shù)
(75%)中位數(shù)
(50%)上四分位數(shù)
(25%)最大數(shù)班級成績分析第18頁,共37頁,2023年,2月20日,星期五Box圖(3)反映數(shù)據(jù)的中心位置、波動和非對稱程度中位數(shù):中心四分位數(shù)差(IQR):波動程度上下邊緣:異常點(diǎn)作用觀察異常點(diǎn)比較幾批數(shù)據(jù)形狀成績甲班乙班丙班第19頁,共37頁,2023年,2月20日,星期五經(jīng)驗(yàn)分布函數(shù)F(x)為總體的分布函數(shù),稱為經(jīng)驗(yàn)分布函數(shù)或樣本分布函數(shù)目標(biāo):利用經(jīng)驗(yàn)分布估計(jì)總體的分布第20頁,共37頁,2023年,2月20日,星期五經(jīng)驗(yàn)累積分布圖(empiricalcumulativedistribution)總體的分布函數(shù)稱為理論也分布函數(shù)經(jīng)驗(yàn)分布函數(shù)利用樣本估計(jì)和推斷總體的分布函數(shù)F(x).高數(shù)成績53335353643444547485255586465686969707478808080828384848589第21頁,共37頁,2023年,2月20日,星期五正態(tài)概率分布圖藍(lán)色’+’表示樣本數(shù)據(jù)疊加紅線是連接上四分位數(shù)和下四分位數(shù)的直線如果數(shù)據(jù)服從正態(tài)分布,樣本數(shù)據(jù)畫出的圖成線性第22頁,共37頁,2023年,2月20日,星期五重要統(tǒng)計(jì)量統(tǒng)計(jì)量:由隨機(jī)變量組成的一隨機(jī)樣本的函數(shù),不含任何未知參數(shù)樣本均值,描述樣本中心趨勢樣本方差,描述樣本的波動性樣本標(biāo)準(zhǔn)差S,樣本方差的平方根
第23頁,共37頁,2023年,2月20日,星期五抽樣分布統(tǒng)計(jì)推斷從樣本中推斷總體主要目標(biāo):歸納和預(yù)測統(tǒng)計(jì)量的概率分布稱為抽樣分布總體大小樣本容量選擇樣本的方法例:依據(jù)的抽樣分布對參數(shù)做出推斷第24頁,共37頁,2023年,2月20日,星期五均值的抽樣分布樣本容量為n的的抽樣分布實(shí)驗(yàn)不斷重復(fù)(樣本容量為n),產(chǎn)生多次的值時(shí)的一個(gè)分布描述樣本在總體均值μ附近的平均變化n個(gè)隨機(jī)樣本來自~N(μ,σ2)總體,均值~N(μ,σ2/n)第25頁,共37頁,2023年,2月20日,星期五定義:設(shè){Xk}為相互獨(dú)立的隨機(jī)變量序列,有有限的數(shù)學(xué)期望E(Xk)=μk和方差D(Xk)=σk2,令若對于一切實(shí)數(shù)x,有則稱隨機(jī)變量序列{Xk}服從中心極限定理(CentralLimitTheorem)標(biāo)準(zhǔn)正態(tài)分布第26頁,共37頁,2023年,2月20日,星期五
定理(林德貝爾格-勒維,Lindeberg-Levy)設(shè){Xk}為相互獨(dú)立的隨機(jī)變量序列,服從同一分布,且具有數(shù)學(xué)期望E(Xk)=μ和方差D(Xk)=σ2
,則隨機(jī)變量的分布函數(shù)Fn(x),對于任意x,滿足第27頁,共37頁,2023年,2月20日,星期五如果從一個(gè)未知分布的總體抽樣,不管它是有限還是無限的,假設(shè)樣本容量足夠大時(shí),樣本均值的抽樣分布會近似于N(μ,σ2/n)的正態(tài)分布。第28頁,共37頁,2023年,2月20日,星期五中心極限定理應(yīng)用n≥30,的正態(tài)分布逼近較好n<30,總體近似正態(tài)分布時(shí),逼近效果較好
如果總體~正態(tài)分布,無論n大小,的抽樣分布精確服從正態(tài)分布第29頁,共37頁,2023年,2月20日,星期五若一個(gè)隨機(jī)變量X可以看做許多微小而獨(dú)立的隨機(jī)因素作用的總和,每一種因素的影響很小,不產(chǎn)生決定作用,則X一般可以認(rèn)為近似地服從正態(tài)分布
例:測量誤差X
影響因素:溫度X1、濕度X2、觀察視線X3、心情X4等
微小的、隨機(jī)的,而且相互沒有影響
測量的總誤差是上述各個(gè)因素產(chǎn)生的誤差之和:∑Xi某樣本的線性擬合模型可以描述為:第30頁,共37頁,2023年,2月20日,星期五例:將一顆骰子連擲100次,則點(diǎn)數(shù)之和不少于500的概率是多少?解:
設(shè)Xk為第k
次擲出的點(diǎn)數(shù),k=1,2,…,100,則X1,…,X100獨(dú)立同分布.由中心極限定理:第31頁,共37頁,2023年,2月20日,星期五定理(DeMoivre-Laplace中心極限定理)設(shè)隨機(jī)變量Yn服從二項(xiàng)分布Yn~B(n,p),(o<p<1),則對于任意x,恒有證明設(shè)X1,X2,…,Xn是n個(gè)相互獨(dú)立的服從(0-1)分布(P{Xi=0}=1-p,P{Xi=1}=p)的隨機(jī)變量,則Yn=X1+X2+…+Xn由于E(Xi)=p,D(Xi)=p(1-p)(i=1,2,…,n),由此得第32頁,共37頁,2023年,2月20日,星期五例:在一家保險(xiǎn)公司里有10000個(gè)人參加壽命保險(xiǎn),每人每年付12元保險(xiǎn)費(fèi)。在一年內(nèi)一個(gè)人死亡的概率為0.6%,死亡時(shí)其家屬可向保險(xiǎn)公司領(lǐng)得1000元,問:
(1)保險(xiǎn)公司虧本的概率有多大?
(2)其他條件不變,為使保險(xiǎn)公司一年的利潤不少于60000元的概率大于0.9,則賠償金至多可設(shè)為多少?第33頁,共37頁,2023年,2月20日,星期五解:設(shè)X表示一年內(nèi)死亡的人數(shù),則X~B(n,p)其中
n=10000,p=0.6%設(shè)Y表示保險(xiǎn)公司一年的利潤,Y=1000012-1000X(1)P{Y<0}=P{1000012-1000X<0}=1P{X120}由中心極限定理:
1P{X120}1
(7.75)=0第34頁,共37頁,2023年,2月20日,星期五P{
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河北省唐山市2025-2026年八年級上期末考試地理試卷(無答案)
- 廣東省惠州市博羅縣2025-2026學(xué)年五年級上學(xué)期1月期末語文試題(含答案)
- 福建省莆田市2025-2026學(xué)年上學(xué)期八年級期末質(zhì)量調(diào)研測試道德與法治試題(含答案)
- 武漢市九調(diào)試卷及答案
- 文化題目及答案
- 網(wǎng)絡(luò)套路題目及答案
- 2026年小學(xué)語文教師模擬培訓(xùn)試卷
- 服務(wù)區(qū)經(jīng)理競聘演講稿
- 2022~2023廣播電視編輯記者考試題庫及答案第646期
- 廣東省深圳市羅湖區(qū)2024-2025學(xué)年高三上學(xué)期期末考試化學(xué)試題(原卷版+解析版)
- 云南省煙草專賣局(公司)2026年畢業(yè)生招聘備考題庫(第一批)完整參考答案詳解
- 2026重慶江津區(qū)社區(qū)專職工作人員公開招聘642人考試參考題庫及答案解析
- 重癥患者營養(yǎng)支持指南2025
- 2025-2026學(xué)年貴州省貴陽市多校高一(上)期末物理試卷(含答案)
- 單位電車充電管理制度規(guī)范
- 社區(qū)救援員培訓(xùn)課件
- 冬季電纜敷設(shè)施工專項(xiàng)方案
- DL-T-710-2018水輪機(jī)運(yùn)行規(guī)程
- 電機(jī)常見故障分析及處理措施
- 《叉車安全作業(yè)培訓(xùn)》課件
- 技術(shù)入股合作協(xié)議合同
評論
0/150
提交評論