醫(yī)學統(tǒng)計學(白皮)_第1頁
醫(yī)學統(tǒng)計學(白皮)_第2頁
醫(yī)學統(tǒng)計學(白皮)_第3頁
醫(yī)學統(tǒng)計學(白皮)_第4頁
醫(yī)學統(tǒng)計學(白皮)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第_章緒論1、 總體:根據(jù)研究目的確定的具有相同性質的研究總體,分目標總體和研究總體2、 樣本:從研究總體中隨機抽取的一部分有代表性的個體3、 抽樣:從研究總體中隨機抽取一部分有代表性的個體的過程。抽樣研究的目的是用樣本推斷總體4、 變量:在統(tǒng)計學中,將對每個觀察測定的指標稱為變量「分類變量:二分類變量(eg:性別)&多分類變量(eg:血型)「定性變量I有序變量變量< J離散型變量(eg:人口數(shù))I定量變量[連續(xù)型變量(eg:血壓、紅細胞數(shù))變量的轉化:定量一有序一分類一二值(只能單向轉化)5、 同質:指的是總體中的個體性質相同或相近變異:指的是觀測變量在總體中的個體之間取值不同6、 參數(shù):反映總體特征的統(tǒng)計指標,如心。,總體參數(shù)是固定的常數(shù)樣本統(tǒng)計量:與總體參數(shù)對應的,反映樣本特征的量,如亍、S,由樣本資料計算出來7、 抽樣誤差:當我們所要研究的變量在總體中存在變異時,從這個總體中抽取的樣本在這個變量的取值情況上往往與總體有一個偏差,這是不可避免的。8、 概率:指一個隨機事件發(fā)生的可能性大小,當PM0.05時為小概率事件。實際應用中:頻率即指樣本率;概率即指總體率。統(tǒng)計基本公理:小概率事件在一次隨機實驗中幾乎是不可能發(fā)生的,這是假設檢驗的基礎。第二章定量資料統(tǒng)計描述一、 頻率分布表離散型資料:變量取值不連續(xù),頻率分布圖橫軸為變量值,縱軸為頻率,用直條圖表示。連續(xù)型資料:變量取值連續(xù),頻率分布圖橫軸為變量值(標出組中值),縱軸為頻率密度(即頻率/組距),用直方圖表示,各直條面積為相應組段頻率,直方圖面積之和為1。連續(xù)型資料的頻率分布表編制步驟:1、 計算極差2、 確定組段數(shù)與組距,組距=極差/組段數(shù)3、 確定組段的上、下限,第一組段包含最小值,最后一組段包含最大值,除最后組段外,各組段應包含其下限值,不包含其上限值4、 列表二、 定量資料的統(tǒng)計描述描述集中趨勢的統(tǒng)計指標意義適用條件均數(shù)算術均數(shù)X描述一組數(shù)據(jù)集中趨勢或平均水平的最常用統(tǒng)計指標適用于對稱分布資料,尤其是正態(tài)分布資料或近似正態(tài)分布資料幾何均數(shù)G用來反映一組含多個數(shù)量級的數(shù)據(jù)的集中位置適用于原始觀察值成等比數(shù)列,尤其對數(shù)正態(tài)分布資料,求平均效價和平均滴度中位數(shù)M反映一組數(shù)據(jù)集中趨勢的位置指標,Px表示排序后的全部實測值的某百等份分隔值,m=p50資料不限,但最常用于非對稱分布的資料百分位數(shù)Px各指標的計算方法(一)算數(shù)均數(shù)1、直接法(基于原始數(shù)據(jù))-X+X+X...+XZXx=一~^n =-—其中,X],X2,X3,…,Xn為觀察值2、加權法(基于頻數(shù)表)

—£X£X X=V0=一久其中,f為組段的頻數(shù),X為組中值,X廣(上限+下限)/2£fn ° 0(二)幾何均數(shù)1、直接法(基于原始數(shù)據(jù))£logx其中,X£logx其中,X],X2,X3,…,Xn為觀察值「£flogX[「£flogX]:=log-1_ n _2、加權法(基于頻數(shù)表)G=log-1G71X2X3...xn或G=log-1(三)中位數(shù)1、直接法(基于原始數(shù)據(jù))將n例數(shù)據(jù)按升序排列后,第i(三)中位數(shù)1、直接法(基于原始數(shù)據(jù))將n例數(shù)據(jù)按升序排列后,第i個數(shù)據(jù)用x*表示。當n為奇數(shù)時,M=X* 'n+12當n為偶數(shù)時,M=1-1X*+X1'nI22、內(nèi)插法(基于頻數(shù)表)"X'n-f、L)其中*n+1)2L為欲求的Px所在組段的下限,i為該組段的組距,入為fxI100該組段的頻數(shù),n為總頻數(shù),fL為該組段之前的累計頻數(shù)。M=L+f描述離散趨勢的統(tǒng)計指標意義適用條件計算方法極差反映一組數(shù)據(jù)的變異范圍,比較粗略和不穩(wěn)定資料不限日=最大值-最小值四分位數(shù)間距全部觀察值中居中的一半數(shù)值散步的范圍適用于偏態(tài)分布資料Q=P75-P25方差反映總體中觀測值之間的離散趨勢或變異程度,數(shù)值越小表明變異程度越小適用于對稱分布資總體方差:£(X-Db2= N樣本萬差: \£X-X】S2= n—1料,J尤其止態(tài)或近似正態(tài)分布資料總體標準差:標準差槌(x2b=11\ N樣本標準差: 、i£(X-X>2S=】| Vn-1變異系數(shù)標準差與算數(shù)均數(shù)之比,是一個不帶量綱的相對數(shù)適用于量綱不同的變量間,或均數(shù)差別較大的變量間變異程度的比較CV=SX100%X

描述分布形態(tài)的統(tǒng)計指標(了解,公式應用不考)意義計算方法偏度系數(shù)總體偏度系數(shù)為0時,分布是對稱的取正值時,分布為正偏峰取負值時,分布為負偏峰。SK瑚F或一2)£、x-X、3S>峰度系數(shù)正態(tài)分布的總體峰度系數(shù)為0取正值時,分布較正態(tài)分布的峰尖峭取負值時,分布較正態(tài)分布的峰平闊。KUg小T〉、£(X-X]4 3(n-1iCDC2O〔SJ(n-2)£-3)第三章定性資料統(tǒng)計描述相對數(shù)是兩個有聯(lián)系的指標之比,相對數(shù)指標大致有三種類型:頻率、強度和相對比意義計算方法頻率型(構成比)某一部分觀察單位數(shù)占總觀察單位數(shù)的比例,近似地反映某一事件出現(xiàn)的機會大小頻率型指標=某事件發(fā)生的個體數(shù)xK可能發(fā)生某事件的個儆強度型(率)單位時間內(nèi)某現(xiàn)象發(fā)生的頻率。反映一段時間內(nèi)的平均概率強度型指標—,某事件發(fā)生的個體數(shù) 、"強度指標—£(可能發(fā)生某事件的個體數(shù)x時間)xK相對比型任何兩個相關聯(lián)的變量A與B之比相對比型指標-B注:K為比例基數(shù),通常取值100%,也可取1000%。、1萬/1萬和10萬/10萬等。構成比和率的計算式中分子是分母的一部分,而相對比分子和分母可以性質相同,也可以不同。應用相對數(shù)應注意:分母應有足夠的數(shù)量,例數(shù)很少的情況最好不用相對數(shù)表示,應使用絕對數(shù)。合計率的時候不能簡單地由兩組分別計算的率相加后求平均,而應該把兩組分子之和除以兩組分母之和。3.資料應具有可比性,除了對比因素,其余因素應盡可能相同或相近。觀察對象內(nèi)部結構不同時,應進行率的標準化。常用指標:老年系數(shù):N65歲人口數(shù)x ,頻率型指標人口總數(shù)少兒系數(shù):<14歲人口數(shù)x100%,頻率型指標人口總數(shù)負擔系數(shù):人口中非勞動年齡人口數(shù)與勞動年齡人口數(shù)之比,相對比型老少比:65歲以上的老年人口與14歲以下的少年兒童人口之比,相對比型總生育率:—同年活產(chǎn)數(shù)—x1000%。,相對比型同年15~49歲婦女數(shù)年齡別生育率:一同年某年齡組活產(chǎn)數(shù) x1000%,強度型(近似)同年某年齡組平均婦女數(shù)x1年總和生育率:15?49歲年齡別生育率的綜合,是測量生育水平比較理想的指標,反映調查時間的生育水平。終生生育率:49歲以上婦女生育的活產(chǎn)子女數(shù)x %反映過去時間的生育水平,比總和生49歲以上婦女總數(shù)育率來得大。自然增長率:粗出生率與粗死亡率之差,用來粗略的估計人口增長趨勢粗再生率:總和生育率X女嬰占出生嬰兒的比例,指每個婦女一生平均生育的女兒數(shù)。凈再生育率:大于1表示未來人口將增多,小于1表示未來人口將減少。嬰兒死亡率:同年<1周歲死亡人數(shù)x1000%,是死亡統(tǒng)計指標中較敏感的指標同年活產(chǎn)兒總數(shù)注意:嬰兒死亡率和圍生兒死亡率都是相對比型指標死亡率:同年內(nèi)死亡人數(shù)

年平均人口數(shù)x死亡率:同年內(nèi)死亡人數(shù)

年平均人口數(shù)x1年x1000%,強度型病死率:同年某病死亡人數(shù)X100%,頻率型同年患該病總數(shù)發(fā)病率:新發(fā)生的某病病例數(shù)

年平均人口數(shù)發(fā)病率:新發(fā)生的某病病例數(shù)

年平均人口數(shù)X1年X10萬/10萬,分母不包括不可能發(fā)生某病的人,有二次患病病例,則發(fā)病率有可能超過1患病率:現(xiàn)患疾病人數(shù)檢查人口數(shù)患病率:現(xiàn)患疾病人數(shù)檢查人口數(shù)X10萬/10萬第五章常用概率分布二項分布:X?B(n,n)。二項分布的概率函數(shù)P(X)=/xGK,其中。廣X^,0!=1二項分布的形態(tài)取決于n和n,高峰在日=n兀處。當n接近0.5時,圖形是對稱的;n離0.5愈遠,對稱性愈差,但隨著n的增大,分布趨于對稱。當n一8時,只要n不太靠近0或1,特別是當nn和n(1-n)都大于5時,二項分布近似于正態(tài)分布。,丸G—丸)K,標準差為bp=t~^二項分布的總體均數(shù)為日=n兀,方差為b2=n丸G—丸),標準差為b=(,丸G—丸)K,標準差為bp=t~^TOC\o"1-5"\h\z如果將出現(xiàn)陽性結果的頻率記為p=-,則p的總體均數(shù)為匕n P二項分布的應用:出現(xiàn)陽性的次數(shù)至多為k次的概率為:P(X<k)=1LP(X)=£G,X!兀x(l一兀I—xX=0 X=0' ,出現(xiàn)陽性的次數(shù)至少為k次的概率為:P(X>k)=£P(X)=£X!G?x)兀X(1—兀)n一XX=k X=kPossion分布(適用于菌落數(shù)、粉塵等)概率n很小,而觀察例數(shù)n很大,除二項分布的三個基本條件以外,還要求n接近于0。Possion分布的概率函數(shù):P(X)=e-^――X!式中,X=n冗為Possion分布的總體均數(shù),X為觀察單位內(nèi)某稀有事件的發(fā)生次數(shù),e為自然對數(shù)的底,取2.71828。Possion分布的特征1) 當總體均數(shù)入值小于5時為偏鋒,隨著入增大,分布趨向對稱,人巳20,近似正態(tài)分布。2) 總體均數(shù)與總體方差相等,均為入。3) 觀察結果具有可加性。Possion分布的應用如果稀有事件發(fā)生次數(shù)的總體均數(shù)為入,那么發(fā)生次數(shù)至多為k次的概率為Px<心工Px)=Ee頊X!發(fā)生次數(shù)至少為k次的概率為P(X>k)=1—P(XX<k—1)正態(tài)分布:X?N(PG2)特點:中間頻數(shù)最多,兩邊頻數(shù)漸少且對稱1 _(X瑚》正態(tài)分布的概率函數(shù):f(X)=——e2b2,其中,g為總體均數(shù),G為總體標準差。'?2兀b正態(tài)分布密度曲線的特點:1)關于x=R對稱2) 在x=|i處取得函數(shù)最大值,在x=^±b處有拐點,表現(xiàn)為鐘形曲線。3) 曲線下面積為1。4) g決定曲線在橫軸上的位置,g增大,曲線沿橫軸向右移;g減小,曲線沿橫軸向左移5) 。決定曲線的形狀,當g恒定時,。越大,數(shù)據(jù)越分散,曲線越矮胖;。越小,數(shù)據(jù)越集中,曲線越瘦高。正態(tài)曲線下面積的分布規(guī)律標準正態(tài)分布:g=0、。2=1的正態(tài)分布稱為標準正態(tài)分布,用N(0,1)表示。對任意一個服從正態(tài)分布N(g,。2)的隨機變量X,經(jīng)過標準化變換Z=X二旦可以轉變b為標準正態(tài)分布。此時概率密度函數(shù)為:f。)=-^e-土.J2兀正態(tài)分布的應用:(1) 二項分布、Possion分布的正態(tài)分布近似n很大,p很小時,二項分布近似Possion分布。隨著n的增大,二項分布趨于對稱。理論上可以證明:當n相當大時,只要n不太靠近0或1,特別是當nn和n(1-n)都大于5時,二項分布近似于正態(tài)分布。隨著總體均數(shù)入的增大,Possion分布趨向對稱。理論上可以證明,隨著入一皿Possion分布也漸近正態(tài)分布。一般,當X>20時Possion分布資料可按正態(tài)分布處理。(2) 確定醫(yī)學參考值范圍1、 百分位數(shù)法:雙側95%醫(yī)學參考值范圍是(P25,P975)單側范圍是P95以下(如血鉛、發(fā)汞),或P5以上(如肺活量)。該法適用于任何分布類型的資料。2、 正態(tài)分布法:若X服從正態(tài)分布,醫(yī)學參考值還可以依正態(tài)分布規(guī)律計算。正態(tài)分布資料雙側醫(yī)學參考值范圍一般按下式作近似估計:X±1.96S其中,X和S分別為樣本的均數(shù)和標準差。第六章參數(shù)估計基礎(1)均數(shù)的標準誤意義:均數(shù)標準誤用符號。-表示,也稱樣本均數(shù)的標準差。它反映了樣本均數(shù)之間、樣本X均數(shù)與總體均數(shù)之間的離散程度,也反映了樣本均數(shù)抽樣誤差的大小。b計算:可按公式b-=,計算。在實際應用中,總體標準差。常常未知,需要用樣本標準X\:n。由此式可知,若增加樣本含量n可以差來估計。此時,均數(shù)標準誤的估計值為S。由此式可知,若增加樣本含量n可以x減少樣本均數(shù)的抽樣誤差。主要應用:估計總體均數(shù)的置信區(qū)間,均數(shù)的假設檢驗(2)頻率的標準誤意義:頻率的標準誤用符號b,表示,它反映了樣本頻率與樣本頻率之間、樣本頻率與總體概率之間的離散程度,也反映了樣本頻率抽樣誤差的大小。.兀G—兀) _計算:可按公式。=」 計算。在實際應用中,總體概率n常常未知,需要用樣本頻P\np(1-p)pG-P率p作為總體概率n的估計值,因此頻率的標準誤的估計值為Sp=了—n—「w—n—。由此式可見,增加樣本含量n可以減小樣本頻率的抽樣誤差。主要應用:估計總體概率的置信區(qū)間,頻率指標的假設檢驗t分布X-「X—「,服從自由度u=n-1的t分布。=sx-S志t分布是總體均數(shù)的區(qū)間估計及假設檢驗的理論基礎。t分布與標準正態(tài)分布相比,其分布密度有如下特征:(1) 單峰分布,以0為中心,左右對稱(2) 自由度u越小,則S[越大,t值越分散,曲線的峰部越矮,尾部越高(3) 自由度u逐漸增大時:t分布逐漸逼近標準正態(tài)分布;當u趨于8時,t分布就完全成為標準正態(tài)分布。按t分布的規(guī)律,密度曲線下面積分布規(guī)律為:單側:P,<-t)=a和P,>t)=a雙側:PC<-t)+PC>t)=a總體均數(shù)及總體概率的估計E參數(shù)估計是指用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))。參數(shù)估計有點估計和區(qū)間估計兩種。點估計:由樣本統(tǒng)計量直接估計總體參數(shù),即X一四,p-兀,S一。區(qū)間估計:用已知樣本統(tǒng)計量和標準誤確定總體參數(shù)所在范圍的方法稱為區(qū)間估計。所估計的總體參數(shù)的范圍通常稱為參數(shù)的置信區(qū)間。這一估計可相信的程度稱為置信度或置信水平。若標準差不變,置信度由95%提高到99%,置信區(qū)間便由窄變寬,估計的精度下降。計算:(1) 正態(tài)分布總體均數(shù)的置信區(qū)間TOC\o"1-5"\h\zX土t S-總體均數(shù)置信區(qū)間的基本公式是 a心*??傮w均數(shù)的置信區(qū)間: S S?s未知,且n較小,按t分布0-ta/;n'*+ta/斯)(最常用)b— O"、s已知,或s未知但n足夠大(大于50),按z分布 (尤-zv^=,*+zy^=)(2)二項分布總體概率的置信區(qū)間 -77—7總體概率置信區(qū)間的基本公式是P土z里7p)a/2、, n正態(tài)近似法:當n足夠大,且樣本頻率p和(1-p)均不太小時,如np與n(1-p)均大于5,p的抽樣分布接近正態(tài)分布,此時總體概率的置信區(qū)間為(P—Za/2Sp'P+Za/2^p),縮小p士ZS為 a/2p。可信區(qū)間估計的優(yōu)劣一是可信度1-a(準確度),愈接近1愈好,如99%的可信度比95%的可信度要好;二是區(qū)間的寬度(精密度),區(qū)間愈窄愈好。當樣本含量為定值時,上述兩者互相矛盾。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度。第七章假設檢驗基礎假設檢驗的兩類錯誤實際情況檢驗結果拒絕H0不拒絕H0H。真第I類錯誤(a)結論正確(1-a)—H0不真結論正確(1-p)第I類錯誤(P)當樣本容量n一定時,a越小。越大;a越大。越小;當a一定時,樣本量增加,B減少a的意義:如果原假設H0成立,按照同樣方法在原假設H0規(guī)定的總體中重復抽樣,那么在每100次檢驗結論中平均可以有100Xa次拒絕H0(棄真,犯第I類錯誤)P的意義:如果原假設H0并不成立,即所研究的總體與H0有實質差異,按照同樣的方法在總體中重復抽樣,那么在每100次檢驗結論中平均可以有100Xp次接受H0(存?zhèn)?,犯第II類錯誤)。要想同時降低a與P,唯一的方法是增大樣本容量。

假設檢驗思路:明確要解決的問題,需要對總體的哪個特征建立假設,均數(shù)還是分布(中位數(shù))判斷資料的類型,不同類型的資料有不同的檢驗方法分布其分布類型,是否正態(tài)分布,兩獨立樣本是否具有方差齊性選擇檢驗方法,建立假設檢驗,確定檢驗水準,統(tǒng)一為a=0.05,單側還是雙側計算統(tǒng)計量,此時要考慮n,小樣本與大樣本資料的檢驗方法有別得出P值,與檢驗水準a作比較,下結論框架{統(tǒng)計描述統(tǒng)計推斷框架{統(tǒng)計描述統(tǒng)計推斷「集中趨勢L離散趨勢廣參數(shù)估計i假設檢驗a(參數(shù)檢驗)先進行兩獨立樣本資 1料的方差齊性檢驗r單樣本資料的t檢驗配對設計資料的t檢驗 /計量資料 J兩獨立樣本資料t檢驗f總體方差相等t檢驗*’總體參數(shù)的檢驗 I總體方差不等t,檢驗(基于t分布)大樣本資料的z檢驗〔Possion分布資料的z檢驗f單樣本資料z檢驗I兩獨立樣本資料z檢驗非參數(shù)檢驗?(非參數(shù)檢驗?分類資料 J兩獨立樣本2x2列聯(lián)表資料的x2檢驗總體分布的檢驗 兩獨立樣本RxC列聯(lián)表資料的x2檢驗(基于%2分布) 配對設計資料2x2列聯(lián)表資料的x2檢驗I配對設計資料RxR列聯(lián)表資料的x2檢驗基本推斷原理:小概率事件在一次隨機試驗中不(大)可能發(fā)生。假設檢驗的基本步驟:1、 選擇檢驗方法,建立檢驗假設并確定檢驗水準(統(tǒng)一用a=0.05);2、 計算檢驗統(tǒng)計量;3、 確定P值,做出推斷結論。t檢驗如果P<a,時>《V,則拒絕H0,接受H1如果P>a,仇<二/2V,拒絕H0的樣本證據(jù)不足,就不拒絕H0,暫且認為H0成立,根據(jù)統(tǒng)計推斷結果,結合相應的專業(yè)知識,給出一個專業(yè)的結論。單、雙側檢驗一一由專業(yè)知識確定單、雙側。H]:uNu0,雙側,uvu0與u>u0都有可能H1:u>u0,單側H1:uvu0,單側t檢驗的應用條件:1、 隨機樣本2、 來自正態(tài)分布總體

t檢驗假設檢驗檢驗統(tǒng)計量說明單樣本資料的t檢驗X-R0此為已知的總體均數(shù)i 1—,u—n-1S/*'n配對涉及資料的t檢驗d-0d為差值的均數(shù),Sd為差值的樣本標準差,n是對子數(shù)。1- i—,u—n-1S商 d X—X= 2,(n-1)S2+(n-1)S2S2——1 1 2 2-c n+n-2總體方差金驗)兩樣本所屬,相等("11一+—nn*k1 27u=n+n-2兩獨立樣本資料t檢驗兩樣本所屬總體方差不等(t’檢驗)t'=—U=——Sn 1X1-X2,S2S2'+~^r-Sn+S)十―^1 ^2 ‘4 S4-x1—+ x2—一1n一1S-和S—分別為兩組樣本均數(shù)x1 X2的標準誤。兩組獨立樣本資料的方差齊性檢驗F=S:(較大)S2(較小),2u—n-1,u—n-1S2與S2是被比較的兩個樣本方1 2差。單樣本資料的z檢驗Z=X-RS舟大樣本資料的z檢驗兩獨立樣本資料z檢驗Z—aX1-X2i'S2S2+——2-VnnX1、X2,S]、S2,n1>n2分別為兩樣本的均數(shù)、標準差、樣本含量單樣本資料z檢驗Z—X-人= 0X條件是樣本均數(shù)大于20Possion分布資料的z檢驗兩獨當兩樣本觀測單位數(shù)相等時Z—-X,-X。Jx1+X2x1與x2分別為兩樣本的計數(shù)值。條件是兩樣本均數(shù)均大于20立樣本資料z檢驗當兩樣本觀測單位數(shù)不等時Z-二\_X/1VX1-云2邕+互n nn-X/n1 2——2-X X—1+—2-n2n2X1與X2分別為兩樣本均數(shù),n1與n2分別為兩樣本觀測單位數(shù)。條件是兩樣本均數(shù)均大于20

第九章X2檢驗X2分布是連續(xù)型隨機變量的概率分布,用于推斷總體分布。Z?N(0,1),則Z2?X 當nN40且所有TN5時,改用確切概率法 當nN40且有1WTV5,用連續(xù)性校正公式 當n<40或TV1時,用Fisher精確檢驗。(1),其概率密度曲線在(0,+8)區(qū)間上表現(xiàn)為L形,對應于V二 當nN40且所有TN5時,改用確切概率法 當nN40且有1WTV5,用連續(xù)性校正公式 當n<40或TV1時,用Fisher精確檢驗。擬合優(yōu)度檢驗一一根據(jù)樣本的頻率分布檢驗其總體分布是否等于某給定的理論分布。用于單樣本資料的X2檢驗假設檢驗檢驗統(tǒng)計量說明注意事項單樣本資料的擬合優(yōu)度檢驗nN40V(A-T)2X2=V—tu=k-1-sA為實際頻數(shù),T為理論頻數(shù),s為估計的總體參數(shù)的個數(shù)應滿足TN5,出現(xiàn)T<5要合并組段,此時k值有變化;n<40時進行校正n<40校正公式:v(A-T-0.5)X2=V T 'u=k-1-s獨立樣本2X2列聯(lián)表V(A-T)2X2=乙^^u=k-1-s或u=(R-1)(C-1)亦可用四格表專用公式:(ad-bc)2nnm司 n應滿足nN40,且TN5,當n巳40,有某個格子出現(xiàn)1WT<5,需進行校正:(a—T—0.5)或X2=V 次(ad一bc|-n/2>n"=(a+b)C+d)a+c)b+d)X (a+b)c+d)a+c)b+d)RXC列聯(lián)表「NCA2 [)X2=nVV—s 1(-1-1nm Ju=(R-1)(C-1)RXC列聯(lián)表資料的X2檢驗拒絕H0時,若要兩兩比較應進行卡方分割要求1WT<5的個數(shù)不能超過總個數(shù)的1/5配對設計資料2X2列聯(lián)表b+cN40X2=",u=1b+cb+c<40 f (b-c|-1) |X2= , ,uTb+cRXC列聯(lián)表k一1q(n-m力T—k n+m一2Au=R-1四格表資料X2檢驗公式選擇條件:檢驗方法的選擇:1、 資料類型:定量、定性(等級)2、 資料分析:統(tǒng)計描述+統(tǒng)計推斷(區(qū)間估計、假設檢驗)單變量統(tǒng)計描述統(tǒng)計推斷定量資料集中趨勢、離散趨勢統(tǒng)計圖表總體均數(shù)95%CIt檢驗,u檢驗方差分析秩和檢驗定性資料相對數(shù)統(tǒng)計圖表總體均數(shù)95%CI二項分布和泊松分布的Z檢驗X2檢驗秩和檢驗1) 定量資料單樣本資料:若正態(tài)分布,小樣本,可用t檢驗;已知總體方差或大樣本,可用u檢驗若非正態(tài)或無法確定分布類型,秩和檢驗兩獨立樣本:若正態(tài)且方差齊,可用t檢驗;方差不齊,可用t’檢驗若非正態(tài)或無法確定分布類型,秩和檢驗配對設計資料:若正態(tài),t檢驗;否則,秩和檢驗多組樣本:正態(tài)且方差齊,方差分析;不滿足,可數(shù)據(jù)變換后滿足正態(tài)性或方差齊,采用方差分析;否則,秩和檢驗注意:多組樣本比較,得到的僅是不全相等,若想得到具體兩兩情況,須多樣本間的兩兩比較(比如X2分割)2) 定性資料單樣本資料:泊松分布的Z檢驗(亦稱u檢驗)兩獨立樣本:二分類(2X2列聯(lián)表):若nN40且TN5,X2檢驗若nN40,但出現(xiàn)1WTV5,校正X2檢驗若n<40或TV1,F(xiàn)isher確切概率法多分類(RXC列聯(lián)表)若指標變量是無序的(如類型,方法等),X2檢驗若指標變量是有序的(如療效等),秩和檢驗配對設計資料二分類(2X2列聯(lián)表)若b+cN40,X2檢驗;若b+c<40,校正X2檢驗多分類(RXR列聯(lián)表)有序多分類變量,秩和檢驗無序多分類變量,X2檢驗多組樣本若雙向無序(即行和列的變量均是無等級之分的)RXC的X2檢驗若單向有序:①分組變量無序,指標變量有序,秩和檢驗②分組變量有序,指標變量無序,RXC的X2檢驗注意:不同的數(shù)據(jù)資料,相關分析的方法不同。

tobecontinued估計兩變量1關聯(lián)性分析回歸分析(回歸系數(shù)b,B)(相關系數(shù)r,P)區(qū)間估計假設檢驗服從正態(tài)分布不服從正態(tài)分布分類變量獨立性的X估計兩變量1關聯(lián)性分析回歸分析(回歸系數(shù)b,B)(相關系數(shù)r,P)區(qū)間估計假設檢驗服從正態(tài)分布不服從正態(tài)分布分類變量獨立性的X2檢驗假設檢驗 區(qū)間方差分析 _t檢驗關系:t=癥或分布類型未知或等級資料T I計算或分布類型未知或等級資料T I計算Pearson計算Spearman積矩相關系數(shù)r 秩相關系數(shù)rs進行t檢驗 進行秩和檢驗后求列聯(lián)系數(shù)一、關聯(lián)性分析:'正相關P>0從散點圖反映出兩變量變化趨勢接近直線―j負相關P<01-完全相關P=±1P取值為-IMPM1|P|越接近1,關聯(lián)越密切,|P|=1,完全相關|P|越接近0,關聯(lián)越不密切,|P|=0,不存在線性相關P表示總體相關系數(shù),(表示樣本相關系數(shù)F— XY = Z \ Z v'xJyy —X)】Y—Y)總體相關系數(shù)P未知,由已知的樣本相關系數(shù)r進行統(tǒng)計推斷總體相關系數(shù)P的統(tǒng)計推斷(一)定量變量的關聯(lián)性分析(1)兩變量均服從正態(tài)分布——計算Pearson積矩相關系數(shù)r,進行t檢驗對服從正態(tài)分布的兩變量隨機樣本,可通過繪制散點圖,觀察發(fā)現(xiàn)有線性趨勢之后,進而計兩變量關聯(lián)性分析統(tǒng)計描述統(tǒng)計推斷相關散點圖相關系數(shù)t檢驗秩和檢驗X2檢驗總體相關系數(shù)95%CI回歸散點圖回歸系數(shù),回歸方程方差分析t檢驗總體回歸系數(shù)95%CI算Pearson積矩相關系數(shù),對積矩相關系數(shù)r的假設檢驗可用查表法或t檢驗。一定要先繪制散點圖,看出兩變量間有線性趨勢時,再計算積矩相關系數(shù)。Ho:P=0 H]:P/0 a=0.05r一0t=—, ,u=n—2■1—r2\n—2P>0.05,不拒絕H0,認為兩變量無關聯(lián)P<0.05,拒絕H0,認為兩變量間相關性有統(tǒng)計學意義(2)兩變量不服從正態(tài)分布,或總體分布類型未知,或原始數(shù)據(jù)用等級表示——計算Spearman秩相關系數(shù)r,進行秩和檢驗秩相關系數(shù)同積矩相關系數(shù)的計算公式一樣,但在計算秩相關性時不再用原來的數(shù)據(jù),而是對兩變量分別排序編秩,以各數(shù)據(jù)對應的秩次帶入Pearson積矩相關系數(shù)的計算公式中去計算秩相關系數(shù)r,對其檢驗也是用查表法或t檢驗。r=S(二)分類變量的關聯(lián)性分析——進行獨立性的X2檢驗H0:兩變量互相獨立,即無關聯(lián)性H1:兩變量存在關聯(lián)性 a=0.05計算X2值,進行X2檢驗注意:此時X2檢驗統(tǒng)計量的計算公式是獨立樣本的公式結論若是存在關聯(lián)性,計算列聯(lián)系數(shù):r=;X1\X2+n總體相關系數(shù)P的區(qū)間估計r1+r)rZ.Z)先將r轉換為z:z=-m——,得到z的置信區(qū)間Z—a/2,Z+a/22U—r)I Jn—3V'n—3)e2z—1后將z轉換回r:將z的置信區(qū)間兩個端點值分別帶入式子r=云n,得P的置信區(qū)間。二、回歸分析關聯(lián)性分析是定性的判斷兩變量有無關聯(lián),進而定量的判斷存在關聯(lián)性的兩變量其關聯(lián)程度的大小回歸分析是求解一條最能表示兩變量之間數(shù)量關系的直線,并用于求解未知變量的估計值??傮w的線性回歸方程:^yX=a+0X樣本的線性回歸方程:Y=a+bXa,a為回歸直線的截距P,b為回歸直線的斜率,即回歸系數(shù)iSX—x)Y—Y)b=產(chǎn)=S(x—X^XXa=Y—bX總體回歸系數(shù)8的統(tǒng)計推斷一Y:總的差異,用SS總表示,u總=n一2—Y:殘差部分,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論