版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
衛(wèi)生統(tǒng)計(jì)學(xué)期末復(fù)習(xí)緒論序言個(gè)體與總體樣本統(tǒng)計(jì)量與總體參數(shù)問題根據(jù)研究目的所確定的最基本的抽樣單位個(gè)體01-搜集信息時(shí)的觀察對(duì)象根據(jù)研究目的所確定的所有同質(zhì)個(gè)體的集合總體02-指標(biāo)觀測(cè)值的集合緒論序言個(gè)體與總體樣本統(tǒng)計(jì)量與總體參數(shù)問題樣本:研究總體中的一部分個(gè)體。樣本量&樣本個(gè)數(shù)01刻畫總體特征的統(tǒng)計(jì)指標(biāo)總體參數(shù)02-總體均數(shù)μ,概率π
樣本統(tǒng)計(jì)量緒論序言個(gè)體與總體樣本統(tǒng)計(jì)量與總體參數(shù)問題總體樣本個(gè)體推斷抽樣目標(biāo)人群研究人群觀察對(duì)象觀察搜集信息包含個(gè)體變異抽樣:樣本代表性,樣本量抽樣誤差:個(gè)體變異&隨機(jī)抽樣產(chǎn)生的誤差推斷:識(shí)別樣本統(tǒng)計(jì)量間的差異是
由抽樣誤差造成
or總體參數(shù)間存在差異研究設(shè)計(jì)研究問題受試對(duì)象研究因素實(shí)驗(yàn)效應(yīng)翻譯翻譯:早孕期維生素D和妊娠期糖尿病的相關(guān)性。研究問題:上海市孕產(chǎn)婦早孕期(12周)血液維生素D水平與妊娠期糖尿病發(fā)病的相關(guān)性研究上海市孕產(chǎn)婦孕周12周維生素D血液妊娠期糖尿病發(fā)病目標(biāo)人群研究因素實(shí)驗(yàn)效應(yīng)研究設(shè)計(jì)研究問題受試對(duì)象研究因素實(shí)驗(yàn)效應(yīng)準(zhǔn)確定義效應(yīng)指標(biāo):比較兩組平均血壓比較用藥前后血壓的平均降低值比較兩組高血壓的控制率比較延緩高血壓進(jìn)展的時(shí)長(zhǎng)樣本均數(shù)用藥前后差值的均數(shù)樣本率生存分析研究問題效應(yīng)指標(biāo)例:上海市孕產(chǎn)婦早孕期(12周)血液維生素D水平與妊娠期糖尿病發(fā)病的相關(guān)性研究中,個(gè)體的效應(yīng)指標(biāo)是?OGTT空腹/1h/2h血糖值是否患妊娠期糖尿病統(tǒng)計(jì)描述連續(xù)型變量分類型變量小例子集中趨勢(shì)——對(duì)稱分布(均數(shù)),不對(duì)稱分布(中位數(shù))離散趨勢(shì)——對(duì)稱分布(方差標(biāo)準(zhǔn)差變異系數(shù))不對(duì)稱分布(最大值最小值四分位數(shù)范圍)一般情況——對(duì)稱分布:均數(shù)±標(biāo)準(zhǔn)差Mean±Std.不對(duì)稱分布:中位數(shù)(四分位數(shù)范圍)Median(Q1,Q3)統(tǒng)計(jì)圖:頻數(shù)分布直方圖,箱式圖統(tǒng)計(jì)描述連續(xù)型變量分類型變量小例子比,比例,率的區(qū)分下列指標(biāo)是比,比例,率中的哪一種?時(shí)點(diǎn)患病率死亡率新生兒死亡率
常用分布概述正態(tài)分布二項(xiàng)分布什么叫概率分布?變量的取值范圍及其對(duì)應(yīng)的概率原始資料頻數(shù)分布直方圖頻率密度直方圖縱軸=頻率/組距確定組距統(tǒng)計(jì)組段頻數(shù)概率密度圖組距→0縱坐標(biāo)*組距=對(duì)應(yīng)組段頻率曲線下面積=取值范圍對(duì)應(yīng)概率常用分布概述正態(tài)分布二項(xiàng)分布為什么隨機(jī)變量X在某點(diǎn)x0的取值的概率=0?概率密度圖的曲線下面積為0。累積概率分布圖概率密度圖類比于路程類比于速度路程=速度*時(shí)間。天分再高也需要付出努力才有意義。二項(xiàng)分布的條件每次實(shí)驗(yàn)(觀察)的結(jié)果只有兩種可能(兩分類變量)各次實(shí)驗(yàn)(觀察)的結(jié)果相互獨(dú)立每個(gè)觀察對(duì)象發(fā)生陽(yáng)性結(jié)果的概率相同實(shí)驗(yàn)的次數(shù)n是固定的,與實(shí)驗(yàn)的結(jié)果無關(guān)二項(xiàng)分布的特征二項(xiàng)分布的圖形特征:離散分布圖形取決于兩個(gè)參數(shù),高峰在處當(dāng)接近0.5時(shí),圖形對(duì)稱,越偏離0.5,對(duì)稱性越差隨著n的增大,分布趨于對(duì)稱當(dāng)時(shí),只要不太靠近0或1,二項(xiàng)分布將趨近于正態(tài)分布二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差均數(shù)方差標(biāo)準(zhǔn)差例2.24中,若π=0.7則3只鼠中死亡鼠數(shù)X的總體均數(shù)總體方差二項(xiàng)分布的特征與二項(xiàng)分布相似平穩(wěn)性(隨機(jī)分布性):x的取值與觀察單位的位置無關(guān),與觀察單位的大小有關(guān)獨(dú)立增量性:在某個(gè)觀察單位上x的取值與前面各觀察單位上x的取值無關(guān)普通性:觀察單位可以小到只有1個(gè)事件發(fā)生,發(fā)生概率不變Poisson分布的條件Poisson分布的觀察結(jié)果具有可加性:如果相互獨(dú)立,且分別服從以為參數(shù)的Poisson分布,則也服從總體參數(shù)為的Poisson分布例:放射性物質(zhì)平均每分鐘放射記數(shù)為5,測(cè)量3
次,均服從,則即3分鐘的放射記數(shù)服從Poisson分布的特點(diǎn)正態(tài)分布確定醫(yī)學(xué)參考值范圍4.選擇計(jì)算方法:如果受檢指標(biāo)血紅蛋白近似服從正態(tài)分布,則可以用確定其95%參考值范圍;如果受檢指標(biāo)血紅蛋白呈偏態(tài)分布,則可以用百分位數(shù)P2.5~P97.5確定95%參考值范圍,但樣本量要充分大。
注意:樣本量充分大是相對(duì)于指標(biāo)的變異程度,指標(biāo)變異大,要求樣本量大;指標(biāo)變異程度小,要求樣本量可以相對(duì)小一些。17中心極限定理及其應(yīng)用若個(gè)體資料X服從正態(tài)總體,則樣本均數(shù)也服從正態(tài)分布;個(gè)體資料X服從偏態(tài)分布,當(dāng)樣本量n較大時(shí),樣本均數(shù)近似服從正態(tài)分布18
t分布,標(biāo)準(zhǔn)正態(tài)分布與t統(tǒng)計(jì)量實(shí)際研究中未知,用樣本的標(biāo)準(zhǔn)差S作為的一個(gè)近似值(估計(jì)值)代替,得到變換后的統(tǒng)計(jì)量并記為19(1-)100%可信區(qū)間及其意義更一般而言,可以計(jì)算(1-)100%可信區(qū)間,稱(1-)為可信度??尚哦鹊囊饬x:在同一正態(tài)總體中隨機(jī)抽100個(gè)樣本,每個(gè)樣本可以計(jì)算一個(gè)95%可信區(qū)間,平均有95個(gè)可信區(qū)間包含該總體的總體均數(shù)。檢驗(yàn)統(tǒng)計(jì)量分布情況和假設(shè)檢驗(yàn)基本思想20陰影面積為檢驗(yàn)統(tǒng)計(jì)量超出界值的概率H0為真時(shí),t檢驗(yàn)統(tǒng)計(jì)量服從自由度為n-1的t分布,檢驗(yàn)統(tǒng)計(jì)量|t|大于界值t/2的概率為H1為真時(shí),t檢驗(yàn)統(tǒng)計(jì)量|t|大于界值t/2的概率為1-(較大或很大)21定義P值和應(yīng)用以下以單側(cè)檢驗(yàn)為例:即:在H0為真的情況下,檢驗(yàn)統(tǒng)計(jì)量大于樣本計(jì)算的統(tǒng)計(jì)量數(shù)值的概率。也就是P值=樣本統(tǒng)計(jì)量數(shù)值開始的尾部面積(示意見圖)。意義:如果t檢驗(yàn)統(tǒng)計(jì)量樣本值t=t0.05,則P=t0.05尾部的面積,故P=0.05。P值=P(檢驗(yàn)統(tǒng)計(jì)量>檢驗(yàn)統(tǒng)計(jì)量樣本值|H0)22可信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系兩兩t檢驗(yàn)的誤用m組樣本,需進(jìn)行m(m-1)/2次比較各次比較均正確接受H0的概率為犯I類錯(cuò)誤的概率為如m=3,則進(jìn)行3次比較,如,各次比較均正確接受H0的概率為0.857,實(shí)際而不是0.05,實(shí)際犯I類錯(cuò)誤的概率比0.05要大要控制總的不變四格表2值的校正英國(guó)統(tǒng)計(jì)學(xué)家Yates認(rèn)為,2分布是一種連續(xù)型分布,而四格表資料是分類資料,屬離散型分布,由此計(jì)算的2值的抽樣分布也應(yīng)當(dāng)是不連續(xù)的,當(dāng)樣本量較小時(shí),兩者間的差異不可忽略,應(yīng)進(jìn)行連續(xù)性校正(在每個(gè)單元格的殘差中都減去0.5)若n>40,此時(shí)有1<T5時(shí),需計(jì)算Yates連續(xù)性校正2值T<1,或n<40時(shí),應(yīng)改用Fisher確切概率法直接計(jì)算概率卡方檢驗(yàn)值得指出,成組設(shè)計(jì)四格表資料的2檢驗(yàn)與前面學(xué)習(xí)過的兩樣本率比較的雙側(cè)u檢驗(yàn)是等價(jià)的。若對(duì)同一資料作兩種檢驗(yàn),兩個(gè)統(tǒng)計(jì)量的關(guān)系為2=u2。其對(duì)應(yīng)的界值也為平方關(guān)系。兩者的應(yīng)用條件也是基本一致的,連續(xù)性校正也基本互相對(duì)應(yīng)。配對(duì)卡方注意事項(xiàng)McNemar檢驗(yàn)只會(huì)利用非主對(duì)角線單元格上的信息,即它只關(guān)心兩者不一致的評(píng)價(jià)情況,用于比較兩個(gè)評(píng)價(jià)者間存在怎樣的傾向。因此,對(duì)于一致性較好的大樣本數(shù)據(jù),McNemar檢驗(yàn)可能會(huì)失去實(shí)用價(jià)值。例如對(duì)1萬(wàn)個(gè)案例進(jìn)行一致性評(píng)價(jià),9995個(gè)都是完全一致的,在主對(duì)角線上,另有5個(gè)分布在左下的三角區(qū),顯然,此時(shí)一致性相當(dāng)?shù)暮?。但如果使用McNemar檢驗(yàn),此時(shí)反而會(huì)得出兩種評(píng)價(jià)有差異的結(jié)論來。直線回歸原理示意圖所以如果固定x,Y服從正態(tài)分布,其散點(diǎn)圖呈直線帶分布回歸模型根據(jù)上述性質(zhì),應(yīng)用到本例的實(shí)際問題:固定年齡X,身高Y服從總體均數(shù)為,方差為2的正態(tài)分布。2.由散點(diǎn)圖可以假定總體均數(shù)3.故4.令,5.即:,并稱為直線回歸模型。簡(jiǎn)單線性回歸Linear作散點(diǎn)圖、趨勢(shì)線scatteryxtwoway(scatteryx)
(lowess
yx)Normal&Equalvariance作回歸,求殘差,檢驗(yàn)正態(tài)性,作散點(diǎn)圖reg
yxpredicte,residual/predict
ee
,rstudentsktest
e
/
swilk
e
/P-P圖&Q-Q圖scatterex觀察殘差的變異程度是否與X有關(guān)Independent專業(yè)知識(shí)、資料背景按時(shí)間/地理位置等順序作散點(diǎn)圖觀察趨勢(shì)簡(jiǎn)單線性回歸參數(shù)推斷與結(jié)果解釋回歸系數(shù)的假設(shè)檢驗(yàn)
結(jié)果的解釋膽固醇每增加1個(gè)單位,收縮壓平均改變0.178個(gè)單位Root
MSE評(píng)估預(yù)測(cè)的誤差
線性回歸的變異分解示意圖線性相關(guān)分析相關(guān)分析的條件:獨(dú)立、線性、二元正態(tài)分布檢驗(yàn)殘差是否服從正態(tài)分布檢驗(yàn)X是否服從正態(tài)分布Y與X作回歸,產(chǎn)生殘差Spearman秩相關(guān)反應(yīng)X與Y伴隨變化的同步程度,但與X伴隨Y同步變化的幅度沒有直接聯(lián)系相關(guān)系數(shù)r=0,只是可以認(rèn)為不存在線性相關(guān)關(guān)系,不能由此認(rèn)為X與Y之間沒有關(guān)系
相關(guān)系數(shù)的含義生存曲線及中位生存期生存曲線survivalcurve:以隨訪時(shí)間為橫
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全警示標(biāo)識(shí)管理制度及流程
- 2024年郎溪縣招教考試備考題庫(kù)及答案解析(奪冠)
- 2024年皮山縣招教考試備考題庫(kù)帶答案解析(奪冠)
- 2025年花垣縣招教考試備考題庫(kù)帶答案解析
- 2025年新源縣招教考試備考題庫(kù)帶答案解析
- 2025年南京中醫(yī)藥大學(xué)翰林學(xué)院馬克思主義基本原理概論期末考試模擬題及答案解析(奪冠)
- 2025年灤縣招教考試備考題庫(kù)附答案解析
- 2025年山西鐵道職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性考試題庫(kù)附答案解析
- 2025年南昌健康職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)帶答案解析
- 2025年桐梓縣幼兒園教師招教考試備考題庫(kù)帶答案解析
- 2026年齊齊哈爾高等師范??茖W(xué)校單招職業(yè)適應(yīng)性測(cè)試題庫(kù)必考題
- 安徽省六校2026年元月高三素質(zhì)檢測(cè)考試物理試題(含答案)
- 2025年西南醫(yī)科大學(xué)馬克思主義基本原理概論期末考試真題匯編
- (2025版)肥胖癥合并骨關(guān)節(jié)炎專家共識(shí)課件
- T-SUCCA 01-2025 二手摩托車鑒定評(píng)估技術(shù)規(guī)范
- 2025山西焦煤集團(tuán)所屬華晉焦煤井下操作技能崗?fù)艘圮娙苏衅?0人筆試試題附答案解析
- 2026年南京交通職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試題庫(kù)及答案詳解一套
- 2型糖尿病臨床路徑標(biāo)準(zhǔn)實(shí)施方案
- 2025年醫(yī)療人工智能產(chǎn)業(yè)報(bào)告-蛋殼研究院
- 《研學(xué)旅行課程設(shè)計(jì)》課件-理解研學(xué)課程設(shè)計(jì)內(nèi)涵
- AQT 1089-2020 煤礦加固煤巖體用高分子材料
評(píng)論
0/150
提交評(píng)論