版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
易考君之
《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》
(封面)
目錄
第一部分、易考君之期末精華總結(jié)
第一章-----------------------------------------------------(3)
人二々-I*1,
--------------------------------(4)
第三章------------------------------------------------------(5)
第四章------------------------------------------------------(6)
第五章------------------------------------------------------(7)
第六章------------------------------------------------------(8)
第七章------------------------------------------------------(9)
第八章------------------------------------------------------(10)
第九章------------------------------------------------------(11)
第二部分、易考君之期末模擬試題卷(5套)
模擬試題卷一模擬試題卷二
模擬試題卷三模擬試題卷四模擬試題卷五
第三部分、歷年期末考試原題(后期逐步完善)
第一章(易考君之重點(diǎn))
1、期末重點(diǎn):
、數(shù)據(jù)/資料的分類(lèi):
①、計(jì)量資料,又稱(chēng)定量資料或者數(shù)值變量;為觀測(cè)每個(gè)觀察單位某
項(xiàng)治療的大小而獲得的資料。
②、計(jì)數(shù)資料,又稱(chēng)定性資料或者無(wú)序分類(lèi)變量;為將觀察單位按照
某種屬性或者類(lèi)別分組計(jì)數(shù),分組匯總各組觀察單位數(shù)后而得到的資
料。
③、等級(jí)資料,又稱(chēng)半定量資料或者有序分類(lèi)變量。為將觀察單位按
某種屬性的不同程度分成等級(jí)后分組計(jì)數(shù),分類(lèi)匯總各組觀察單位數(shù)
后而得到的資料。
2、統(tǒng)計(jì)學(xué)常用基本概念:
①、統(tǒng)計(jì)學(xué)(statistics)是關(guān)于數(shù)據(jù)的科學(xué)與藝術(shù),包括設(shè)計(jì)、搜
集、整理、分析和表達(dá)等步驟,從數(shù)據(jù)中提煉新的有科學(xué)價(jià)值的信息。
②、總體(population)指的是根據(jù)研究目的而確定的同質(zhì)觀察單
位的全體。
③、醫(yī)學(xué)統(tǒng)計(jì)學(xué)(medicalstatistics):用統(tǒng)計(jì)學(xué)的原理和方法處
理醫(yī)學(xué)資料中的同質(zhì)性和變異性的科學(xué)和藝術(shù),通過(guò)一定數(shù)量的觀
察、對(duì)比、分析,揭示那些困惑費(fèi)解的醫(yī)學(xué)問(wèn)題背后的規(guī)律性。
④、樣本(sample):指的是從總體中隨機(jī)抽取的部分觀察單位。
⑤、變量(variable):對(duì)觀察單位某項(xiàng)特征進(jìn)行測(cè)量或者觀察,這
種特征稱(chēng)為變量。
⑥、頻率(frequency):指的是樣本的實(shí)際發(fā)生率。
⑦、概率(probability):指的是隨機(jī)事件發(fā)生的可能性大小。用
大寫(xiě)的P表示。
3、統(tǒng)計(jì)工作的基本步驟:
①、統(tǒng)計(jì)設(shè)計(jì):包括對(duì)資料的收集、整理和分析全過(guò)程的設(shè)想與安排;
②、收集資料:采取措施取得準(zhǔn)確可靠的原始數(shù)據(jù);
③、整理資料:將原始數(shù)據(jù)凈化、系統(tǒng)化和條理化;
④、分析資料:包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷兩個(gè)方面。
第二章計(jì)量資料的統(tǒng)計(jì)描述
1.頻數(shù)表的編制方法,頻數(shù)分布的類(lèi)型及頻數(shù)表的用途
①、求極差(range):也稱(chēng)全距,即最大值和最小值之差,記作R;
②、確定組段數(shù)和組距,組段數(shù)通常取10-15組;
③、根據(jù)組距寫(xiě)出組段,每個(gè)組段的下限為L(zhǎng),上限為U,變量X值
得歸組統(tǒng)一定為L(zhǎng)<X<U,最后一組包括下限。
④、分組劃記并統(tǒng)計(jì)頻
頻數(shù)分布的類(lèi)型包括對(duì)稱(chēng)分布和偏態(tài)分布;
偏態(tài)分布主要分為右偏態(tài)分布(也稱(chēng)正偏態(tài)分布)和左偏態(tài)分布(也
稱(chēng)負(fù)偏態(tài)分布)。
頻數(shù)表的用途包括以下幾個(gè)方面:
①、描述頻數(shù)分布的類(lèi)型;
②、描述頻數(shù)分布的特征;
③、便于發(fā)現(xiàn)一些特大或特小的離群值;
④、便于進(jìn)一步做統(tǒng)計(jì)分析和處理。
2.集中趨勢(shì)指標(biāo)的適用條件、計(jì)算方法和意義。
統(tǒng)計(jì)學(xué)用平均數(shù)(average)這一指標(biāo)體系來(lái)描述一組變量值的幾種
位置或者平均水平。
常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。
①、算數(shù)均數(shù),簡(jiǎn)稱(chēng)均數(shù)(mean),可用于反映一組呈對(duì)稱(chēng)分布的
變量值在數(shù)量上的平均水平。計(jì)算方法包括直接計(jì)算法和頻數(shù)表法
(公式見(jiàn)2-2)。
②、幾何均數(shù)(geometricmean),可用于反映一組經(jīng)對(duì)數(shù)轉(zhuǎn)換
后呈對(duì)稱(chēng)分布的變量值在數(shù)量上的平均水平,在醫(yī)學(xué)研究中常用于免
疫學(xué)的指標(biāo)。(計(jì)算公式見(jiàn)于2-3)
③、中位數(shù)(median),適用于各種分布類(lèi)型的資料,尤其是偏態(tài)
分布資料和一端或者兩端無(wú)確切數(shù)值的資料。
④、百分位數(shù)(percentile)是一種位置指標(biāo),是一個(gè)界值,其重要
用途是確定醫(yī)學(xué)參考值范圍)
(referencerangeo
直接計(jì)算法(公式見(jiàn)于2-7、2-8)
頻數(shù)表法(2-9、2-10)
3、離散趨勢(shì)指標(biāo)的適用條件、計(jì)算方法和意義。
描述數(shù)據(jù)變異大小的常用統(tǒng)計(jì)指標(biāo)有醺、四分位數(shù)間距、方差、拯
準(zhǔn)差和變異系數(shù)。
①、極差,一組變量值的最大值與最小值之差。
②、四分位數(shù)間距(quartilerange,QR)是把全部變量值分為四
部分的分位數(shù)后,由第3四分位數(shù)和第1四分位數(shù)相減而得。它一
般和中位數(shù)一起描述偏態(tài)分布資料的分布特征。QR=P75-P25o
③、方差(variance)也稱(chēng)均方差(meansquaredeviation)離均
差平方和與樣本含量的比值。計(jì)算公式為2-11
④、標(biāo)準(zhǔn)差(standarddeviation)是方差的正平方根,其單位與
原變量值得單位相同。計(jì)算公式為2-13、2-14
⑤、變異系數(shù)(coefficientofvariation)記作CV,多用于觀察指
標(biāo)單位不同時(shí),或者均數(shù)相差較大時(shí)兩者變異程度的比較。計(jì)算公式
為2-16
4.正態(tài)分布的圖形,正態(tài)分布的特征,正態(tài)曲線下面積的分布規(guī)律。
正態(tài)分布的特征:
①、在直角坐標(biāo)的橫軸上方呈鐘形曲線,兩端與X軸永不相交,且以
X=|J為對(duì)稱(chēng)軸,左右完全對(duì)稱(chēng)。
②、在X二|J處,f(X)取最大值,遠(yuǎn)離IJ,其值越小。
③、正態(tài)分布有兩個(gè)參數(shù),位置參數(shù)"口形態(tài)參數(shù)Q,口決定正態(tài)分布
的曲線在坐標(biāo)軸上的左右移動(dòng),越大越右移;。決定曲線的弓背程度,
越小峰值越高。
④正態(tài)分布曲線下的面積分布有一定的規(guī)律。X軸與正態(tài)曲線所夾面
積恒等于I或者100%;
區(qū)間口土。的面積為68.27%;
區(qū)間|j±1.96。的面積為95.00%,
區(qū)間口±2.58。的面積為99.00%。
5.醫(yī)學(xué)參考值范圍的意義和估計(jì)方法。
醫(yī)學(xué)參考值(referencevalue)是指包括絕大多數(shù)正常人的人體形
態(tài)、機(jī)能和代謝產(chǎn)物等各種生理及生化指標(biāo)常數(shù),也稱(chēng)正常值。
由于存在個(gè)體差異,生物醫(yī)學(xué)數(shù)據(jù)并非常數(shù),而是在一定范圍內(nèi)波動(dòng),
故采用醫(yī)學(xué)參考值范圍(medicalreferencerange)作為判定正常
和異常的參考標(biāo)準(zhǔn)。通常使用的醫(yī)學(xué)參考值范圍有90%、95%、99%
①、正態(tài)分布法:數(shù)據(jù)服從或者近似服從正態(tài)分布,或者通過(guò)適當(dāng)?shù)?/p>
變換轉(zhuǎn)換為正態(tài)分布,采用此方法之前一般要對(duì)資料進(jìn)行正態(tài)性檢驗(yàn)
且要求樣本含量足夠大(如n2100)
計(jì)算公式為2-23、2-24:
雙側(cè):
單側(cè):
②、百分位數(shù)法:適用于偏態(tài)分布資料醫(yī)學(xué)參考值范圍的制定,所要
求的樣本含量比正態(tài)分布要多(不低于
100)o
計(jì)算公式為2-25、2-26:
雙側(cè):
單側(cè):
第三章總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)
工基本概念:
①抽樣誤差(samplingerror):指的是由于個(gè)體變異產(chǎn)生、隨機(jī)
抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異。
②標(biāo)準(zhǔn)誤(standarderror,SE):指的是樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。
③均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM):指的是樣本
均數(shù)的標(biāo)準(zhǔn)差。
XSEM反映樣本均數(shù)之間的離散程度,也反映樣本均數(shù)與相應(yīng)總體
均數(shù)間的差異。
均數(shù)的標(biāo)準(zhǔn)誤的計(jì)算公式為3-1、3-2
④統(tǒng)計(jì)推斷(statisticalinference):通過(guò)抽樣研究的方法從總體
中隨機(jī)抽取一個(gè)樣本,用樣本的信息來(lái)推斷總體的特征的統(tǒng)計(jì)學(xué)方
法,包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。
2、標(biāo)準(zhǔn)差的用途:
①、反映資料的離散趨勢(shì)。標(biāo)準(zhǔn)差越小,說(shuō)明變異程度越小,均數(shù)的
代表性越好;
②用于計(jì)算變異系數(shù);
③用于計(jì)算標(biāo)準(zhǔn)誤;
④結(jié)合均數(shù)和正態(tài)分布規(guī)律估計(jì)參考值范圍。
3.u分布與t分布:
u分布(也稱(chēng)Z分布):指的是總體均數(shù)為0,總體標(biāo)準(zhǔn)差為1的標(biāo)
2
準(zhǔn)正態(tài)分布N(0,l)o
t分布:隨機(jī)變量X服從總體均數(shù)為口,總體標(biāo)準(zhǔn)差為。的正態(tài)分布N
(M,o2),則可以通過(guò)u變換將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分
布。
※但是通常獲得的資料為樣本的均數(shù)標(biāo)準(zhǔn)誤,因此經(jīng)過(guò)轉(zhuǎn)換后并不是
完全意義上的標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布。(計(jì)算公式為3-3)
t分布主要用于總體均數(shù)的區(qū)間估計(jì)和t檢驗(yàn)。
4目?jī)z掰.?從固定樣本含量的已知總體總進(jìn)行重復(fù)隨機(jī)抽樣試驗(yàn),
根據(jù)每個(gè)樣本可算得一個(gè)可信區(qū)間,則平均有1-a(如95%)的可
信區(qū)間包含了總體參數(shù),而不是總體參數(shù)落在該范圍的可能性為1-
go
5.參考值范圍和總體均數(shù)可信區(qū)間的區(qū)別
見(jiàn)課本表3-2
6、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別和聯(lián)系:
均數(shù)的盯準(zhǔn)戾桁口住左
意反映又的抽樣誤反映一組數(shù)據(jù)的離散情
義差大小況
記
法b氏(SQb⑸
%=b/6b=
計(jì)
算
=S/右$=
鸚增加n不能通過(guò)統(tǒng)計(jì)方法來(lái)控
制
7、總體均數(shù)可信區(qū)間的計(jì)算:
※根據(jù)總體標(biāo)準(zhǔn)差。是否已知以及樣本含量n的大小而異,通常有t
分布和u分布兩類(lèi)方法。
A、單一總體均數(shù)的可信區(qū)間:
a、總體標(biāo)準(zhǔn)差。已未知:按t分布
雙側(cè)和單側(cè)公式見(jiàn)3-5、3-6、3-7
b、。已知或者未知,但n足夠大(如>60)時(shí):按u分布
雙側(cè)和單側(cè)公式見(jiàn)3、8、3-9、3-10
B、兩總體均數(shù)之差的可信區(qū)間:
※前提:兩總體方差相等,但均數(shù)不等
計(jì)算公式見(jiàn)于3-12、3-13、3-14
&t分布圖的特征:
①、單峰分布,以0為中心,左右對(duì)稱(chēng);
②、t分布的曲線形態(tài)取決于自由度v的大小,自由度越小,則t值
越分散,曲線的峰部越矮而尾部翹得越高;
③、當(dāng)自由度逼近無(wú)窮的時(shí)候,樣本標(biāo)準(zhǔn)誤接近總體標(biāo)準(zhǔn)誤,t分布
逼近標(biāo)準(zhǔn)正態(tài)分布。(標(biāo)準(zhǔn)正態(tài)分布是t分布的特例)
9、t檢驗(yàn)的適用條件
t檢驗(yàn)(ttest/Studentt-test)當(dāng)。未知且樣本含量較小時(shí)(如n<
60),理論上要求t檢驗(yàn)的樣本隨機(jī)地取自正態(tài)分布的總體,兩小樣
本均數(shù)比較式還要求兩樣本所對(duì)應(yīng)的兩總體方差相等,即方差齊性。
在實(shí)際應(yīng)用中,如與上述條件略有偏離,對(duì)結(jié)果影響也不大。
10、假設(shè)檢驗(yàn)
A、假設(shè)檢驗(yàn)的基本思想:利用小概率反證法的思想,從問(wèn)題的對(duì)立
面(Ho)出發(fā)簡(jiǎn)介判斷要解決的問(wèn)題(Hi)是否成立。即在假設(shè)Ho
成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,然后根據(jù)獲得的P值來(lái)判斷。
B、假設(shè)檢驗(yàn)的基本步驟:①建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn);
②計(jì)算檢驗(yàn)統(tǒng)計(jì)量;
③確定P值,做出推斷結(jié)論。
C、假設(shè)檢驗(yàn)的錯(cuò)誤
I型錯(cuò)誤:拒絕了實(shí)際上成立的H0,這類(lèi)"棄真"的錯(cuò)誤;(a)
n型錯(cuò)誤:"接受"了實(shí)際上不成立的H0,這類(lèi)"取偽"的錯(cuò)誤。
(P)
注意:①a越小,B越大;反之a(chǎn)越大,B越?。?/p>
②若重點(diǎn)是減少I(mǎi)型錯(cuò)誤,一般取a=0.05;若重點(diǎn)是減少H
型錯(cuò)誤,一般取0=0.10或者0.20甚至更高;
③若要同時(shí)減小I型和口型錯(cuò)誤,唯一的方法就是增加樣本
含量n;
④拒絕H0,只可能犯I型錯(cuò)誤;接受H0,只可能犯H型錯(cuò)誤。
兩單樣本t適用于已知樣本均數(shù)和已t分布對(duì)方差齊?
樣檢驗(yàn)知總體均數(shù)的比較(v=n-l)要求
本正態(tài)分布
(配對(duì)樣本t適用于配對(duì)設(shè)計(jì)的計(jì)量資t分布對(duì)方差齊?
樣檢驗(yàn)料(v=n-l)要求
本正態(tài)分布
含兩樣本t方差齊適用于仕思兩計(jì)t分布方差齊
量檢驗(yàn)/成組量資料的比較(v=nl+n正態(tài)分布
較t檢驗(yàn)2-2)
資小,方差不Cochran&Cox近t分布方差不齊
料<齊似t檢驗(yàn)正態(tài)分布
或資料60)t分布方差不齊
數(shù)(已Satterthwait正態(tài)分布
據(jù)知均e近似t檢驗(yàn)
數(shù)和/※兩樣本的方差比較時(shí),可以使用F檢驗(yàn),分子為較大的樣本方
或標(biāo)方差(自由度為n2-l)。F值滿(mǎn)足F分布,統(tǒng)計(jì)值為F值。
準(zhǔn)差)多完全隨機(jī)完全隨機(jī)化分組方法將試F分布方差齊
樣設(shè)計(jì)資料驗(yàn)對(duì)象分配到g個(gè)處理組正態(tài)分布
本的方差分中去,試驗(yàn)后比較各組均數(shù)
析之間的差別
隨機(jī)區(qū)組隨機(jī)分配的次數(shù)要重復(fù)多F分布方差齊
設(shè)計(jì)資料次,且各個(gè)處理組實(shí)驗(yàn)對(duì)象正態(tài)分布
的方差分?jǐn)?shù)量相同,區(qū)組內(nèi)均衡
析
拉丁方設(shè)可多安排一個(gè)已知的對(duì)實(shí)F分布方差齊
計(jì)資料的驗(yàn)結(jié)果有影響的非處理因正態(tài)分布
方差分析素,增加了均衡性,減少了
誤差,提高了效率
兩階段交兩種處理在全部實(shí)驗(yàn)過(guò)程F分布方差齊
叉設(shè)計(jì)資中交叉進(jìn)行正態(tài)分布
料的方差
分析
分類(lèi)資料四格表資料通過(guò)兩個(gè)樣本的樣本率來(lái)卡方分布無(wú)方差齊,
反映總體率有無(wú)差異要求
無(wú)正態(tài)分;
要求
配對(duì)四格表強(qiáng)調(diào)配對(duì):即針對(duì)同一樣卡方分布無(wú)方差齊,
資料本采取不同的試驗(yàn)或者處麻
理方法。無(wú)正態(tài)分;
要求
行X列表資用于多個(gè)樣本率的比較、卡方分布無(wú)方差齊,
料兩個(gè)或多個(gè)構(gòu)成比的比較酎
以及雙向無(wú)序分類(lèi)資料的無(wú)正態(tài)分;
關(guān)聯(lián)性檢驗(yàn)要求
多樣本率的適用于多樣本率兩兩之間卡方分布無(wú)方差齊,
多重比較的多重比較(基本思想:酎
其對(duì)卡方值進(jìn)行校正)無(wú)正態(tài)分;
他要求
類(lèi)頻數(shù)分布的推斷頻數(shù)分布的擬合優(yōu)度卡方分布無(wú)方差齊,
型擬合優(yōu)度適用于正態(tài)分布、二項(xiàng)分戢
資布、poisson分布和負(fù)二無(wú)正態(tài)分;
料項(xiàng)分布要求
不滿(mǎn)足上述配對(duì)樣本的適用于配對(duì)樣本差值的中無(wú)方差齊,
統(tǒng)計(jì)方法的檢驗(yàn)位數(shù)和0比較;還可用十麻
資料、等級(jí)單個(gè)立數(shù)和總體中無(wú)正態(tài)分;
資^——位數(shù)比較要求
秩檢驗(yàn)兩獨(dú)立樣本適用于推斷計(jì)量資料或等方差不齊
比較級(jí)資料的兩個(gè)獨(dú)立樣本所正態(tài)分布
來(lái)自的兩個(gè)總體分布是否
有差別
完全隨機(jī)多用于推斷計(jì)量資料或者等無(wú)方差齊,
樣本比較級(jí)資料的多個(gè)獨(dú)立樣本所酎
來(lái)自的多個(gè)總體分布是否無(wú)正態(tài)分;
有差別要求
多變量資料雙變量直線用于對(duì)兩父量總體間雌線性、獨(dú):
的處理一回歸關(guān)系的估計(jì)力差齊性、
一回歸與差服從均,
相關(guān)為0的正彳
布
雙變量直線用于判斷兩個(gè)數(shù)值變量之正態(tài)分布
相關(guān)間白尢線性關(guān)系,雙變量
正態(tài)分布資料
多元線性回用于分析一個(gè)應(yīng)變量與多正態(tài)分布
歸個(gè)自變量之間的線性關(guān)系
第四章多樣本均數(shù)比較的方差分析
1、概念:
①離均差平方和(sumofsquaresofdeviationfrommean,SS)
指的是各個(gè)觀測(cè)值與總均數(shù)差值的平方。
②均方差,簡(jiǎn)稱(chēng)均方(meansquare,MS)指的是離均差平方和與自
由度之間的比值。
2、方差分析的基本思想:
設(shè)處理因素有g(shù)(g>2)個(gè)不同的水平,實(shí)驗(yàn)對(duì)象隨機(jī)分為g組,分
別接受不同水平的干預(yù)。方差分析的目的就是在H0:門(mén)=口2:……=
pg成立的條件下,通過(guò)分析各處理均數(shù)之間的差別大小,推斷g各
總體均數(shù)間有無(wú)差別。
3、方差分析的應(yīng)用條件為:各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本,均來(lái)
自于正態(tài)分布總體汴目互比較的各個(gè)樣本的總體方差相等,即具有方
差齊性。
4、方差分析的變異分析:
總變異的大小——SS總:各個(gè)觀測(cè)值與總均數(shù)差值的平方和;
組間變異的大小——SS組間:各組均數(shù)與總均數(shù)的離均差平方和;
組內(nèi)變異的大小——SS組內(nèi):組內(nèi)個(gè)觀測(cè)值與其所在組的均數(shù)的差值
的平方和。
并有SS總二SS組間+SS組內(nèi)
由于組間與組內(nèi)的離均差平方和的自由度不同,因此單純的比較并無(wú)
實(shí)際意義。
MS組間=SS組間/v組間;MS組內(nèi)二SS組內(nèi)/v組內(nèi)
5、完全隨機(jī)設(shè)計(jì)資料的方差分析:
變異來(lái)源自由度MSF
后變異N-1
組間g-iMS組間MS組間/MS組
內(nèi)
組內(nèi)N-gMS組內(nèi)
完全隨機(jī)設(shè)計(jì)資料:
正態(tài)分布且方差齊:?jiǎn)我蛩胤讲罘治?/p>
成組t檢驗(yàn)(意義相同t2=F)
非正態(tài)分布或/和方差不齊:變量轉(zhuǎn)換一單因素方差分析
秩和檢驗(yàn)
6、隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析:
變異來(lái)源自由度MSF
總變異N-1
處理間g-iMS處理MS處理/MS誤
差
區(qū)組間n-1MS區(qū)組MS區(qū)組/MS誤
差
誤差(n-l)(g-1)MS誤差
隨機(jī)區(qū)組設(shè)計(jì)資料:
正態(tài)分布且方差齊:雙向分類(lèi)的方差分析
配對(duì)t檢驗(yàn)(意義相同t2=F)
非正態(tài)分布或/和方差不齊:變量轉(zhuǎn)換一雙向分類(lèi)的方差分析
FriedmanM檢驗(yàn)
初衷:考慮環(huán)境因素對(duì)實(shí)驗(yàn)結(jié)果的影響。
7、拉丁方設(shè)計(jì)資料的方差分析:
可多安排一個(gè)已知的對(duì)實(shí)驗(yàn)結(jié)果有影響的非處理因素,增加了均衡
性,減少了誤差,提高了效率。
完全隨機(jī)設(shè)計(jì)只涉及一個(gè)處理因素;
隨機(jī)區(qū)組設(shè)計(jì)涉及一個(gè)處理因素、一個(gè)區(qū)組因素;
如果實(shí)驗(yàn)研究涉及一個(gè)處理因素和兩個(gè)控制因素,每個(gè)因素的類(lèi)別數(shù)
或水平數(shù)相等,此時(shí)可采用拉丁方設(shè)計(jì)。
變異來(lái)源自由度MSF
應(yīng)變異N-1
處理組g-iMS處理MS處理/MS誤差
行區(qū)組g-iMS行MS行/MS誤差
列區(qū)組g-iMS列MS列/MS誤差
誤差(g-i)(gMS誤差
-2)
8、兩階段交叉設(shè)計(jì)資料的方差分析
該設(shè)計(jì)不僅平衡了處理順序的影響,而且能把處理方法間的差別、時(shí)
間先后之間的差別和實(shí)驗(yàn)對(duì)象之間的差別分開(kāi)來(lái)分析。
9、多樣本均數(shù)間的多重比較方法:LSD-t檢驗(yàn)、Dunnett-t檢驗(yàn)、
SNK-q檢驗(yàn)三種。
10、多樣本方差比較:Bartlett檢驗(yàn)、Levene檢驗(yàn)
第五章計(jì)數(shù)資料的統(tǒng)計(jì)描述
1、基本概念:
①、相對(duì)數(shù)(Relativenumber):是兩個(gè)有關(guān)聯(lián)的數(shù)據(jù)之比,用
以說(shuō)明事物的相對(duì)關(guān)系,便于對(duì)比分析。
常用的相對(duì)數(shù)指標(biāo)很多才安聯(lián)系的性質(zhì)和說(shuō)明的問(wèn)題不同,主要分為:
率、構(gòu)成、相對(duì)比三類(lèi)。
②、強(qiáng)度相對(duì)數(shù)--頻率(frequency):是最常見(jiàn)的一種相對(duì)數(shù),頻
率在實(shí)踐中又稱(chēng)為比率(proportion)。它表示事物內(nèi)部某個(gè)組成
部分所占的相對(duì)多少。
③、結(jié)構(gòu)相對(duì)數(shù)一構(gòu)成比(constituentratio):說(shuō)明某事物內(nèi)部各
組成部分所占的比重或分布,又稱(chēng)構(gòu)成比。構(gòu)成比可相加,和等
于100%。
④、優(yōu)勢(shì)相對(duì)數(shù)--比(rati。):是指兩個(gè)有關(guān)聯(lián)的指標(biāo)A和B之
比,簡(jiǎn)稱(chēng)比。A和B可以是性質(zhì)相同,也可以是性質(zhì)不相同。通常以
倍數(shù)或百分?jǐn)?shù)(%)表示。
⑤、率的標(biāo)準(zhǔn)化法:指的是消除內(nèi)部構(gòu)成差別,使總體率能夠直接進(jìn)
行比較的方法。采用統(tǒng)一標(biāo)準(zhǔn)調(diào)整后的率為標(biāo)準(zhǔn)化率,簡(jiǎn)稱(chēng)為標(biāo)化率
(standardizedrate)o
標(biāo)準(zhǔn)化的基本思想:采用統(tǒng)一的"標(biāo)準(zhǔn)人口構(gòu)成",以消除人
口構(gòu)成不同對(duì)各組總率的影響,使算得的標(biāo)準(zhǔn)化率具有可比性。
⑥、動(dòng)態(tài)數(shù)列(dynamicseries):是按時(shí)間順序排列的統(tǒng)計(jì)指標(biāo)(可
以為絕對(duì)數(shù),相對(duì)數(shù)或平均數(shù)),用以觀察和比較該事物在時(shí)間上的
變化和發(fā)展趨勢(shì)。
分析動(dòng)態(tài)數(shù)列常用的指標(biāo)有:絕對(duì)增長(zhǎng)量、發(fā)展速度與增長(zhǎng)速度、平
均發(fā)展速度與平均增長(zhǎng)速度。
⑦、發(fā)展速度:表示報(bào)告期指標(biāo)的水平相當(dāng)于基線期(或前一期)
指標(biāo)的百分之多少或若干倍。
⑧、增長(zhǎng)速度表示的是凈增加速度增長(zhǎng)速度=發(fā)展速度-1(100%)o
2、率的標(biāo)準(zhǔn)化的注意事項(xiàng):
①.標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率,已經(jīng)不再反映當(dāng)時(shí)當(dāng)?shù)氐膶?shí)際水平,它只
是表示相互比較的資料間的相對(duì)水平。
②.兩樣本標(biāo)準(zhǔn)化率是樣本值,存在抽樣誤差。當(dāng)樣本含量較小時(shí),
比較兩樣本的標(biāo)準(zhǔn)化率,需要作假設(shè)檢驗(yàn)。(但如果比較的兩者是總
體的參數(shù),則可進(jìn)行直接比較,無(wú)需進(jìn)行t、F檢驗(yàn))
第六章幾種離散型變量的分布及其應(yīng)用
連續(xù)型分布舉例:u分布、t分布和F分布;
常用離散型分布:二項(xiàng)分布、Poisson分布、負(fù)二項(xiàng)分布。
1、基本概念
①、二項(xiàng)分布(binomialdistribution):是指在只會(huì)產(chǎn)生兩種可
能結(jié)果之一的n次獨(dú)立重復(fù)試驗(yàn)中,當(dāng)每次實(shí)驗(yàn)的"陽(yáng)性"的概率Ti
保持不變時(shí),出現(xiàn)"陽(yáng)性"次數(shù)X=0,l,2……n的一種概率分布。
②、Poisson分布(Poissondistribution):是二項(xiàng)分布的一種極
端形式,指的是每次實(shí)驗(yàn)的"陽(yáng)性"概率比較低的時(shí)候,出現(xiàn)陽(yáng)性次
數(shù)的相應(yīng)概率滿(mǎn)足以人為參數(shù)的X~P(A)O
2、二項(xiàng)分布的適用條件:
①、每次試驗(yàn)只會(huì)發(fā)生兩種隊(duì)里的額可能結(jié)果之一,即分別發(fā)生兩種
結(jié)果的概率之和很等于1;
②、每次試驗(yàn)產(chǎn)生某種結(jié)果的概率固定不變;
③、重復(fù)試驗(yàn)是相互獨(dú)立的,不相互影響。
3、二項(xiàng)分布的性質(zhì)
①、樣本率的標(biāo)準(zhǔn)差也稱(chēng)為率的標(biāo)準(zhǔn)誤,可以用來(lái)描述樣本率的抽樣
誤差,率的標(biāo)準(zhǔn)誤越小,則率的抽樣誤差就越小。
②、當(dāng)n=0.5時(shí),二項(xiàng)分布圖形是對(duì)稱(chēng)的,當(dāng)n/0.5時(shí),圖形是偏
態(tài)的,隨著n增大,圖形趨于對(duì)稱(chēng)。當(dāng)n-無(wú)窮時(shí),只要n不太靠近
?;?,二項(xiàng)分布則近似正態(tài)分布。
③、利用二項(xiàng)分布的性質(zhì),可進(jìn)行總體率的區(qū)間估計(jì)和差異推斷。(當(dāng)
n<50時(shí)可查表得到可信區(qū)間,>50是可采用近似正態(tài)分布法)
4、Poisson分布的適用條件:
普通性:才充分小的觀測(cè)單位上X的取值最多為1;
獨(dú)立增量性:重復(fù)實(shí)驗(yàn)室相互獨(dú)立的,不相互影響;
平穩(wěn)性:每次試驗(yàn)陽(yáng)性時(shí)間發(fā)生的概率都應(yīng)相同。
5、Poisson分布的性質(zhì):
①、總體均數(shù)人與總體方差。2相等時(shí)Poisson分布的重要特征;
②、當(dāng)n很大,而II很小時(shí),且rm二人為常數(shù)時(shí),二項(xiàng)分布近似Poisson
分布;
③、當(dāng)人增大時(shí),Poisson分布逐漸近似正態(tài)分布。一般而言,入220
時(shí),Poisson分布資料可作為正態(tài)分布處理。
④、Poisson分布具備可加性。
6、Poisson分布的圖形特點(diǎn):
當(dāng)人越小,分布就越偏態(tài);當(dāng)人越大時(shí),Poisson分布則越漸近正態(tài)分
布。當(dāng)入W1時(shí),隨X取值的變大,P(X)值反而會(huì)變小;當(dāng)人>1時(shí),
隨X取值的變大,P(X)值先增大后變小。
第七章卡方檢驗(yàn)X?
1、X2分布曲線的特點(diǎn):X2分布曲線的形狀依賴(lài)于自由度的大?、佼?dāng)
自由度《2時(shí),曲線呈L形;隨著自由度的增加,曲線逐漸趨于對(duì)稱(chēng);
當(dāng)自由度一無(wú)窮時(shí),X?分布趨近正態(tài)分布。
2、Xz分布的基本性質(zhì):可加性;
3、Xz檢驗(yàn)的原理:通過(guò)實(shí)際頻數(shù)和理論頻數(shù)滿(mǎn)足f(x3,來(lái)推斷實(shí)際
頻數(shù)與理論
頻數(shù)的差異大小及有無(wú)統(tǒng)計(jì)學(xué)意義。
4、幾種常見(jiàn)的資料類(lèi)型:
①、普通四格表:自由度二(行數(shù)-1)(歹I」數(shù)-1)
X?可使用四格表專(zhuān)用公式;
X:n>40且所有的T>5-使用基本公式;
P*a時(shí),改用Fisher確切概率法;
n>40但有1<T<5—四格表校正公式或者Fisher確切概率法
n<40或T<1Fisher確切概率法
②配對(duì)四格表資料:b+c<40且1<T<5要校正;
5、Fisher■確切概率法思想:
四格表資料周邊合計(jì)數(shù)不變的條件下,計(jì)算表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)時(shí)
的各種組合之概率;再按照假設(shè)檢驗(yàn)用單側(cè)或雙側(cè)的累計(jì)概率依據(jù)所
取得檢驗(yàn)水準(zhǔn)a做出推斷。
6、行x列表資料使用范圍:
多個(gè)樣本率的比較;樣本構(gòu)成比的比較;雙向無(wú)序分類(lèi)資料的關(guān)聯(lián)性
檢驗(yàn);
7、多個(gè)樣本率的多重比較:
多個(gè)實(shí)驗(yàn)組間的兩兩比較與實(shí)驗(yàn)組與同一對(duì)照組的比較均應(yīng)對(duì)a進(jìn)
行校準(zhǔn),且方法相同。
8、擬合優(yōu)度檢驗(yàn):
適用范圍:推斷某一現(xiàn)象的頻數(shù)分布是否符合某一理論分布;比較實(shí)
際頻數(shù)與理論頻數(shù)的差異大小。
第八章非參數(shù)檢驗(yàn)
1、非參數(shù)檢驗(yàn)的適用范圍:
①不滿(mǎn)足正態(tài)分布和方差齊性條件的計(jì)量資料;
②對(duì)于分布不知道是否正態(tài)的小樣本資料;
③對(duì)于一端或兩端是不確定值得資料;
④推斷等級(jí)資料的等級(jí)強(qiáng)度差別。
2、主要數(shù)據(jù)資料類(lèi)型:
①配對(duì)樣本比較:(樣本量>50時(shí)可以采用近似正態(tài)法作u檢驗(yàn))
H0:樣本總體中位數(shù):人群總體中位數(shù);
H1:樣本總體中位數(shù)聲人群總體中位數(shù)。
②兩獨(dú)立樣本的比較:(nl>10或n2-nl>10時(shí),令nl+n2=N,
作近似正態(tài)分布檢驗(yàn))
H0:兩樣本總體分布位置相同;
H1:兩樣本總體分布位置不同。
③完全隨機(jī)多個(gè)樣本:
H0:多個(gè)樣本總體分布位置相同;
H1:多個(gè)樣本總體分布位置不全相同。
注意:當(dāng)完全隨機(jī)的多個(gè)樣本為兩個(gè)樣本時(shí),使用完全隨機(jī)多個(gè)樣本
的檢驗(yàn)方法求得的統(tǒng)計(jì)值H(或He)與使用兩獨(dú)立樣本的u檢驗(yàn)求
得的值等價(jià)。2
uH=uo
第九章:雙變量回歸與相關(guān)
1、直線回歸(linearregression):因變量Y隨著自變量X的變
化而變化呈直線趨勢(shì),但并非所有的對(duì)應(yīng)點(diǎn)恰好全都在一條直線上,
稱(chēng)為直線回歸或者簡(jiǎn)單回歸。
注:a為常數(shù)項(xiàng),是回歸直線在Y軸上的截距;
b為回歸系數(shù)(coefficientofregression),為直線的斜率;其
統(tǒng)計(jì)意義是當(dāng)X變化一個(gè)單位時(shí)Y的平均改變的估計(jì)值。
直線回歸方程的求法
基本原則:最小二乘(leastsumofsquares)
將實(shí)測(cè)值與假定回歸線上的估計(jì)值的縱向距離稱(chēng)為殘差(residual)
或剩余值。為了使各點(diǎn)殘差盡可能的小,考慮到所有點(diǎn)之殘差有正有
負(fù),所以通常取各點(diǎn)殘差平方和最小的直線即為所求,如此得到的回
歸系數(shù)最理想。
統(tǒng)計(jì)推斷的檢驗(yàn):方差分析F檢驗(yàn)或者t檢驗(yàn)
兩者等價(jià):t=F2
b離0越遠(yuǎn),Y受X的影響越大,SS回就越大,回歸效果越好;
SS殘?jiān)叫?,估?jì)誤差越小,回歸作用越明顯。
2、直線相關(guān)(linearcorrelation):兩個(gè)數(shù)值變量進(jìn)行比較時(shí),
一個(gè)變量在增加或者減少時(shí),另一個(gè)變量也表現(xiàn)為增加或者減少,這
兩個(gè)變量之間的關(guān)系即為直線相關(guān)。
相關(guān)系數(shù)(correlationcoefficient)又稱(chēng)為pearson積差相關(guān)系
數(shù),以符號(hào)r表示樣本相關(guān)系數(shù),符號(hào)p表示其總體相關(guān)系數(shù)。用來(lái)
說(shuō)明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向。
相關(guān)系數(shù)的統(tǒng)計(jì)推斷:t檢驗(yàn)
決定系數(shù)(coefficientofdetermination):為回歸平方和與總平
方和之比。其數(shù)值大小反映了回歸貢獻(xiàn)的相對(duì)程度,也就是在Y的總
變異中回歸關(guān)系所能解釋的百分比。
3、殘差圖考察數(shù)據(jù)是否符合模型假設(shè)的基本要求:
①、應(yīng)變量與自變量關(guān)系為線性;
②、誤差服從均數(shù)為0的正態(tài)分布;
③、方差相等;
④、各觀測(cè)對(duì)象獨(dú)立。
4、直線回歸與直線相關(guān)的區(qū)別和共同點(diǎn)
區(qū)別:①相關(guān)系數(shù)無(wú)單位,回歸系數(shù)有單位;
②相關(guān)表示相互關(guān)系,沒(méi)有依存關(guān)系,回歸有依存關(guān)系;
③兩者對(duì)資料的要求不同:當(dāng)X和Y都是隨機(jī)的,可以進(jìn)行
相關(guān)和回歸分析;當(dāng)Y是隨機(jī)變量,X是控制變量時(shí),理論上只能做
回歸分析。
聯(lián)系:①均表示線性關(guān)系;
②符號(hào)相同,共變方向一致;
③假設(shè)檢驗(yàn)結(jié)果相同;(tr=tb)
第十二章重復(fù)測(cè)量設(shè)計(jì)資料的方差分析
1、重復(fù)測(cè)量設(shè)計(jì)資料的數(shù)據(jù)特征:
①、未設(shè)立平行對(duì)照的前后測(cè)量設(shè)計(jì):(重復(fù)測(cè)量資料最常見(jiàn)的情況
是前后測(cè)量設(shè)計(jì))
前后測(cè)量設(shè)計(jì)與配對(duì)設(shè)計(jì)t檢驗(yàn)的區(qū)別:
a、配對(duì)設(shè)計(jì)中同一對(duì)子的兩個(gè)實(shí)驗(yàn)單位可以隨機(jī)分配處理,兩個(gè)實(shí)
驗(yàn)單位同期觀察實(shí)驗(yàn)結(jié)果,可以比較處理組間差別;前后測(cè)量設(shè)計(jì)不
能同期觀察實(shí)驗(yàn)結(jié)果,雖然可以在前后測(cè)量之間安排處理,但本質(zhì)上
比較的是前后差別,推論處理是否有效是有條件的,即假定測(cè)量時(shí)間
對(duì)觀察結(jié)果沒(méi)有影響。
b、配對(duì)t檢驗(yàn)要求同一對(duì)子的兩個(gè)實(shí)驗(yàn)單位的觀察結(jié)果分別是差值
相互獨(dú)立,差值服從正態(tài)分布。而前后測(cè)量設(shè)計(jì)前后兩次觀察結(jié)果通
常與差值不獨(dú)立,大多數(shù)情況第一次觀察結(jié)果與差值存在負(fù)相關(guān)的關(guān)
系。
c、配對(duì)設(shè)計(jì)用平均差值推論處理的作用,前后測(cè)量設(shè)計(jì)出了分析平
均差值外,還可進(jìn)行相關(guān)分析。
②、設(shè)立平行對(duì)照的前后測(cè)量設(shè)計(jì):
雖然分為處理組和對(duì)照組,但是不能進(jìn)行差值均數(shù)t檢驗(yàn),因?yàn)橥ǔ?/p>
兩組差值的方差不會(huì)相等。
③、重復(fù)測(cè)量設(shè)計(jì):
④可以互相換算(數(shù)值的相同不代表意義的相同)
第十五章多元線性回歸資料的分析
適用范圍:分析一個(gè)應(yīng)變量與多個(gè)自變量之間的線性關(guān)系;
1、多元線性回歸模型的一般形式:Y邛0+01X1+02X2+……+0
mXm+e
a、偏回歸系數(shù)百的意義:表示在其他自變量保持不變的時(shí)候,
Xj增加或減少一個(gè)單位時(shí)Y的平均變化量。
b、偏回歸分布的應(yīng)用條件:
①、Y與各個(gè)變量之間有線性關(guān)系;
②、各例觀測(cè)值Yi相互獨(dú)立;
③、殘差e服從均數(shù)為0,方差為拄的正態(tài)分布。(等價(jià)于對(duì)任
意一組自變量XI、X2……Xm值,應(yīng)變量Y具有相同方差,并且服
從正態(tài)分布)
c、參數(shù)的計(jì)算方法:最小二乘法
2、多元線性回歸方程的假設(shè)檢驗(yàn)及其評(píng)價(jià):(對(duì)整體的假設(shè)檢驗(yàn))
A、可以將回歸方程中所有的自變量作為一個(gè)整體來(lái)檢驗(yàn)它們與應(yīng)變
量Y之間是否具有線性關(guān)系。
假設(shè)檢驗(yàn)方法:方差分析法:H0:P1=P2=……邛m=0;Hl:各內(nèi)
不全為0.
若拒絕H0,接受H1,即可確定所擬合的回歸方程有統(tǒng)計(jì)學(xué)意義。
1)決定系數(shù)R2:即為偏回歸平方和與殘差平方和的比值,其值越接
近1,說(shuō)明擬合程度越好。
2)復(fù)相關(guān)系數(shù):決定系數(shù)開(kāi)根號(hào),可用來(lái)度量應(yīng)變量與多個(gè)自變量
之間的線性相關(guān)程度。
B、各自變量的假設(shè)檢驗(yàn):
①、使用方法為偏回歸平方和(SS回(Xj)):表示在m-1個(gè)自變
量的基礎(chǔ)上新增加X(jué)j所引起的回歸平方和的增加量。其值越大,說(shuō)
明Xj越重要。
偏回歸平方和檢驗(yàn):H0:Pj=0;Hl:酣0
注意:?jiǎn)为?dú)分析各個(gè)變量的偏回歸平方和,所有值的和小于總的回歸
平方和,其原因是忽略了各個(gè)變量之間的相互作用成分。
②、t檢驗(yàn)法:對(duì)于同一資料,不同自變量的t值間可以相互比較,t
的絕對(duì)值越大,說(shuō)明該自變量對(duì)Y的回歸所起的作用越大。
③標(biāo)準(zhǔn)化回歸系數(shù):減少自變量觀測(cè)單位不同對(duì)結(jié)果的影響。
在有統(tǒng)計(jì)學(xué)意義的前提下,標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值越大說(shuō)明相應(yīng)自
變量對(duì)Y的作用越大。
3、自變量選擇方法:
A、全局擇優(yōu)法:
①、校正決定系數(shù)Rc選擇法(當(dāng)R2相同時(shí),自變量個(gè)數(shù)越多,Rc
越小,最優(yōu)為Rc最大)
②、Cp選擇法:應(yīng)選擇Cp最接近p+1的回歸方程為最優(yōu)方程。
B、逐步選擇法:
①、前進(jìn)法:(只選不剔)在有統(tǒng)計(jì)學(xué)意義的前提下,選取偏回歸平
方和最大的一個(gè)自變量做F檢驗(yàn)以決定是否選入。
②、后退法:(只剔不選)選取回歸平方和最小的一個(gè)自變量做F檢
驗(yàn)以決定是否剔除。
③、逐步回歸法:先選后剔,雙向篩選。本質(zhì)上是前進(jìn)法,但每引入
一個(gè)自變量進(jìn)入方程后,要對(duì)方程中的每一個(gè)自變量做基于偏回歸平
方和的F檢驗(yàn),看是否需要剔除一些退化為不顯著的自變量。
注意:為了避免已經(jīng)剔除的自變量再次入選,選入自變量的檢驗(yàn)水準(zhǔn)
要小于或等于剔除自變量的檢驗(yàn)水準(zhǔn)。
第十六章logistic[□歸分析
logistic回歸(logisticregression)屬于概率型非線性回歸。
適用對(duì)象:二分類(lèi)或多分類(lèi)影響因素之間的關(guān)系。
1、表示方法:陽(yáng)性概率P=l/l+exp(-Z)Z邛0+01X1邛2X2+……
+pmXm
P的logit轉(zhuǎn)換:logitP=ln(p/l-p)=pO+piXl+p
2X2+……+pmXm
回歸系數(shù)Bj表示自變量Xj改變一個(gè)單位時(shí)logitP的該變量。
2、模型參數(shù)的意義:
①、確定優(yōu)勢(shì)比(oddsratio,OR)——衡量危險(xiǎn)因素作用大小的
比數(shù)比例
OR適用于分類(lèi)指標(biāo)而不適用于計(jì)量指標(biāo);
多變量調(diào)整后的優(yōu)勢(shì)比(adjustoddsratio)ORj:表示扣除了
其他自變量影響后危險(xiǎn)因素的作用。
用來(lái)對(duì)比某一危險(xiǎn)因素兩個(gè)不同暴露水平Xj=cl和Xj=c0之間的
發(fā)病情況。
1)份=0時(shí),ORj=l,說(shuō)明因素Xj對(duì)疾病的發(fā)生不起作用;
2)例>0時(shí),ORj>1,說(shuō)明因素Xj對(duì)疾病發(fā)生起危險(xiǎn)作用;
3)向<0時(shí),ORj<1,說(shuō)明因素Xj時(shí)一個(gè)保護(hù)因子。
②、確定相對(duì)危險(xiǎn)度(relativerisk,RR)
對(duì)于發(fā)病率很低的疾病存在優(yōu)勢(shì)比即等于兩種暴露水平之間的相對(duì)
危險(xiǎn)度。
2.logistic回歸方程的參數(shù)估計(jì):
主要方法有最大似然估計(jì)法(maximumlikelihoodestimate,MLE)
和優(yōu)勢(shì)比估計(jì)法。
3.logistic回歸的適用對(duì)象:
①、比較各暴露因素的致病風(fēng)險(xiǎn)的大??;
②、多因素的共同作用的評(píng)價(jià);
③、危險(xiǎn)因素的篩選:多經(jīng)文獻(xiàn)報(bào)道選取,但統(tǒng)計(jì)學(xué)資料不能代替專(zhuān)
業(yè)依據(jù)
4.logistic回歸模型的假設(shè)檢驗(yàn):
常用的檢驗(yàn)方法有似然比檢驗(yàn)(likelihoodratiotest)、Wald檢驗(yàn)
和計(jì)分檢驗(yàn)(scoretest)----統(tǒng)計(jì)量為卡方值
logistic回歸模型變量的篩選與多元線性回歸相同。
第十七章生存分析
1、生存分析資料與一般資料比較的不同:
①、同時(shí)考慮生存時(shí)間和生存結(jié)局;
②、通常含有刪失數(shù)據(jù);
③、生存時(shí)間的分布通常不服從正態(tài)分布。
2、概念:
生存時(shí)間(survivaltime),從起始事件到終點(diǎn)事之間所經(jīng)歷的時(shí)
間跨度。
完全數(shù)據(jù)(completedata),在追蹤觀察中,當(dāng)觀察到了某觀察
對(duì)象的明確結(jié)局時(shí),該觀察對(duì)象所提供的關(guān)于生存時(shí)間的信息是完整
的,這種生存時(shí)間數(shù)據(jù)稱(chēng)為完全數(shù)據(jù)。
不完全數(shù)據(jù)(incompletedata),在實(shí)際追蹤觀察中,由于某種
原因無(wú)法知道觀察對(duì)象的確切生存時(shí)間,這種生存時(shí)間數(shù)據(jù)也稱(chēng)為截
尾數(shù)據(jù)。
生存率(survivalrate)是指病人經(jīng)歷給定的時(shí)間之后仍存活的概
率,若有截尾數(shù)據(jù),應(yīng)用乘積極限法。
生存概率(probabilityofsurvival)表示某段時(shí)段開(kāi)始時(shí)存活的個(gè)
體,到該時(shí)段結(jié)束時(shí)仍存活的可能性。
死亡概率(probabilityofdeath成示某段時(shí)段開(kāi)始時(shí)存活的個(gè)體,
到該時(shí)段結(jié)束時(shí)死亡的可能性。
死亡率(deathrate)指的是某單位時(shí)間內(nèi)的平均死亡強(qiáng)度。
四分位數(shù)間距:記為Q,表示中間半數(shù)病人生存期的分布范圍,它反
映生存期的離散程度,其定義為:Q=T25-T75,式中,725和T75
分別是25百分位數(shù)和75百分位數(shù).
3、生存率的估計(jì)與生存曲線:
小樣本的生存率估計(jì):kaplan-Meier法(又稱(chēng)乘積極限法)
大樣本的生存率估計(jì)也可使用上述乘積極限法。。
4、生存率的比較:
最常見(jiàn)的方法是使用log-rank檢驗(yàn)(也稱(chēng)為Mantel-Cox檢驗(yàn))
其基本思想為實(shí)際死亡數(shù)與理論死亡數(shù)之間的比較。統(tǒng)計(jì)量為卡方值
假設(shè)檢驗(yàn):HO:St(l)=St⑵,即兩種方式的患者生存率相同;
H1:兩種方式的患者生存率不同
5、多因素生存分析方法:Cox比例風(fēng)險(xiǎn)模型(為半?yún)?shù)法)
其參數(shù)的估計(jì)采用的方法為最大似然估計(jì)法
因素的篩選與多元線性回歸模型相同。
注意:Cox比例風(fēng)險(xiǎn)回歸模型的主要前提條件是假定風(fēng)險(xiǎn)比值
h⑴/hO⑴為固定值,即協(xié)變量對(duì)生存率的影響不隨時(shí)間的改變而改
變。
第二十七章—第二十九章
1、醫(yī)學(xué)科學(xué)研究的分類(lèi):
按照目的:驗(yàn)證性研究和探索性研究
按照形式:觀察性研究與實(shí)驗(yàn)性研究
按照指標(biāo):?jiǎn)我蛩匮芯亢投嘁蛩匮芯?/p>
按照時(shí)限:前瞻性研究、回顧性研究和橫斷面研究
按照對(duì)象:臨床試驗(yàn)、社區(qū)研究和實(shí)驗(yàn)研究
2、醫(yī)學(xué)科學(xué)研究的基本步驟:
①、選題;
②、制定研究方案;
③、收集資料;
④、數(shù)據(jù)整理與分析;
⑤、撰寫(xiě)研究報(bào)告。
3、調(diào)查研究(surveyresearch)是指在沒(méi)有任何干預(yù)措施的條件下,
客觀地觀察和記錄研究對(duì)象的現(xiàn)狀及其相關(guān)特征。
調(diào)查研究的特點(diǎn)是:研究的對(duì)象及其相關(guān)因素是客觀存在的,不
能用隨機(jī)化分組來(lái)平衡混雜因素對(duì)調(diào)查結(jié)果的影響。
4、常用的抽樣方法包括:
單純隨機(jī)抽樣(簡(jiǎn)單隨機(jī)抽樣)、系統(tǒng)抽樣(機(jī)械抽樣)、分層抽
樣(分類(lèi)抽樣)、整群抽樣和多階段抽樣。
5、觀察性研究中估計(jì)總體參數(shù)所需樣本含量的條件:
(1)、可信度1-?:其值越大,可信區(qū)間估計(jì)的可靠性越好,但相
應(yīng)所需樣本含量就越大。
(2)、總體的標(biāo)準(zhǔn)差。:其值越大,相應(yīng)所需的樣本含量也越大。
(3)、容許誤差b:即預(yù)計(jì)樣本統(tǒng)計(jì)量與相應(yīng)總體參數(shù)的最大相差
控制所在的范圍。
用上面的三個(gè)條件求得的樣本含量的意義是:當(dāng)樣本含量為n時(shí),用
統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù),兩者之差不超過(guò)b的可能性是l-ao
6、實(shí)驗(yàn)設(shè)計(jì)的三個(gè)基本組成部分:實(shí)驗(yàn)單位、處理因素和實(shí)驗(yàn)效應(yīng)
注意:特異性:反映該指標(biāo)鑒別真陰性的能力,特異度高的指標(biāo)
能較好的揭示處理因素的作用
靈敏性:反映該指標(biāo)檢出真陽(yáng)性的能力,靈敏度高的指標(biāo)
對(duì)外界的反應(yīng)靈敏,能將處理因素的效應(yīng)更好的顯示出來(lái)。
、實(shí)驗(yàn)設(shè)計(jì)的基本原則:對(duì)照(隨機(jī)化()、
7control)xrandomization
重復(fù)(replication)
8、實(shí)驗(yàn)性研究中估計(jì)總體參數(shù)所需樣本含量的條件:
(1)、假設(shè)檢驗(yàn)的I型錯(cuò)誤概率a的大?。篴越小,所需樣本含量
越大。對(duì)于相同a,雙側(cè)檢驗(yàn)比單側(cè)檢驗(yàn)所需樣本含量多。
(2)、假設(shè)檢驗(yàn)的H型錯(cuò)誤概率0或檢驗(yàn)效能(1-B)的大小邛越
小,所需樣本含量越多。
(3)、容許誤差5的大小:其值越大,所需樣本含量越小。
(4)、總體的相關(guān)信息:總體標(biāo)準(zhǔn)差越大,所需樣本含量越多;總
體率越接近于0.5,所需樣本含量越多;總體相關(guān)系數(shù)越小,所需樣
本含量越多??傮w的參數(shù)可通過(guò)樣本來(lái)估計(jì)。
2、期末難點(diǎn):
一、總體:是根據(jù)研究目的確定的同質(zhì)觀測(cè)單位的集合。
樣本:是從統(tǒng)計(jì)總體中隨機(jī)抽取的、具有代表性的部分觀測(cè)單位的集
合。
同質(zhì):即構(gòu)成總體的各個(gè)觀測(cè)單位在某一方面或幾方面的性質(zhì)相同或
基本相同。變異:是指在同質(zhì)基礎(chǔ)上各觀測(cè)單位之間的差異。
離散型變量:指只能取可數(shù)的或有限個(gè)數(shù)的變量。特點(diǎn)只是取順序整
數(shù)值
連續(xù)性變量:指可以取各整數(shù)區(qū)間的一切實(shí)數(shù)值的變量。特點(diǎn)是
在兩個(gè)連續(xù)的整數(shù)值之間還可以用小數(shù)或分?jǐn)?shù)連接起來(lái)的非整數(shù)
值。二、統(tǒng)計(jì)的含義
1.統(tǒng)計(jì)工作:指搜集、整理、分析和研究統(tǒng)計(jì)數(shù)據(jù)的工作,是統(tǒng)計(jì)數(shù)
據(jù)與統(tǒng)計(jì)理論的基礎(chǔ)和源泉。
2.統(tǒng)計(jì)數(shù)據(jù):指統(tǒng)計(jì)工作研究的主體及成果。
3.統(tǒng)計(jì)學(xué):是對(duì)研究對(duì)象的數(shù)據(jù)進(jìn)行搜集、整理、分析和研究,以揭
示其總體特征和規(guī)律性的方法論科學(xué)。
三、統(tǒng)計(jì)學(xué)的主要內(nèi)容
1.研究設(shè)計(jì):是按照研究目的和統(tǒng)計(jì)學(xué)要求制定具有針對(duì)性、具體性、
專(zhuān)業(yè)性的工作方案。2.統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖、統(tǒng)計(jì)表等方
法描述樣本資料的數(shù)據(jù)特征及其分布規(guī)律,是整個(gè)統(tǒng)計(jì)學(xué)的基礎(chǔ)。
3.統(tǒng)計(jì)推斷:用樣本信息推論總體特征的歸納過(guò)程,它有兩個(gè)重要領(lǐng)
域。四、誤差及其分類(lèi)
誤差指實(shí)際觀測(cè)值與真值之差或樣本指標(biāo)與總體指標(biāo)之差。誤差
分為非隨機(jī)誤差和隨機(jī)誤差,
非隨機(jī)誤差:粗差-粗心大意,無(wú)規(guī)律性,可以避免;
系統(tǒng)誤差-儀器、方法、等條件的差異,感官、理論和實(shí)驗(yàn)方法的差
異。
隨機(jī)誤差:測(cè)量誤差-由一系列實(shí)驗(yàn)或觀測(cè)條件的隨機(jī)波動(dòng)造成的
實(shí)測(cè)值與真值之差;抽樣誤差-隨機(jī)抽樣引起的統(tǒng)計(jì)量與參
數(shù)之間的差異。五、統(tǒng)計(jì)工作的基本步驟
研究設(shè)計(jì)、搜集資料、整理資料、分析資料
中醫(yī)統(tǒng)計(jì)資料的搜集與整理
一、中醫(yī)統(tǒng)計(jì)資料的類(lèi)型
1.計(jì)量資料:是由數(shù)值變量產(chǎn)生的資料,即對(duì)每個(gè)觀察單位用計(jì)量方
法測(cè)得某項(xiàng)標(biāo)志數(shù)值大小所得資料,變量值大多有度量衡單位;2.
計(jì)數(shù)資料:是由分類(lèi)變量產(chǎn)生的資料,即對(duì)每個(gè)觀察單位按某種屬性
分組計(jì)數(shù)得到的資料,變量值變現(xiàn)為互不相容的屬性或類(lèi)別,無(wú)度量
衡單位。
統(tǒng)計(jì)描述
一、頻數(shù)分布:是指觀測(cè)值按大小分組,各個(gè)組段內(nèi)觀測(cè)值個(gè)數(shù)的分
布,它是了解數(shù)據(jù)分布形態(tài)特征與規(guī)律的基礎(chǔ)。集中趨勢(shì)和離散趨勢(shì)
是其兩個(gè)重要特征。
集中趨勢(shì)是指一組變量值的集中傾向或中心位置;離散趨勢(shì)即一
組變量值的離散傾向。它們是揭示數(shù)據(jù)分布的類(lèi)型和正確進(jìn)行統(tǒng)計(jì)描
述與統(tǒng)計(jì)推斷的前提。
頻數(shù)分布表(頻數(shù)表):是觀測(cè)值或某些類(lèi)別及其相應(yīng)的頻數(shù)按一定
順序排列的表格。醫(yī)學(xué)參考值范圍:是為了減小變異的影響,提高
參考值作為判定正常或異常的可靠性所確定的絕大多數(shù)正常人醫(yī)學(xué)
參考值的波動(dòng)范圍。
率:表示某現(xiàn)象發(fā)生的頻率或強(qiáng)度,是頻率指標(biāo)。
構(gòu)成比:事物內(nèi)部各組成部分所占整體的比重或分布,常用百分?jǐn)?shù)表
ZJ\o
相對(duì)比:描述兩個(gè)有關(guān)指標(biāo)的比例關(guān)系,指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)
或平均數(shù)。
率的標(biāo)準(zhǔn)化:采用統(tǒng)一標(biāo)準(zhǔn)計(jì)算各率的標(biāo)準(zhǔn)化率,使各率具有可比性,
目的是在比較總率時(shí)消除混雜因素的影響。
二、頻數(shù)分布表/圖的作用
1.描述頻數(shù)分布的集中趨勢(shì)與離散趨勢(shì),直觀地揭示數(shù)據(jù)的分布特征
和分布類(lèi)型;2.便于發(fā)現(xiàn)資料中某些遠(yuǎn)離群體的特大或特小的可疑
值;3.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)分析。三、正態(tài)分布的
特征
1.集中性、對(duì)稱(chēng)性和均勻變動(dòng)性;
2.u和。是正態(tài)分布的兩個(gè)參數(shù),決定了整個(gè)分布圖形;u恒定時(shí),
。越大,表示數(shù)據(jù)越分散,曲線越矮胖;反之”
3.任何均數(shù)為u、標(biāo)準(zhǔn)差為。的正態(tài)分布N(v,o2)都可以轉(zhuǎn)換為
均數(shù)為、標(biāo)準(zhǔn)差為的標(biāo)準(zhǔn)正態(tài)分布
01N(
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 干燥綜合征的皮膚干燥護(hù)理
- 室內(nèi)空氣檢測(cè)服務(wù)合同協(xié)議(2025年環(huán)保要求)
- 種植體維護(hù)工具采購(gòu)協(xié)議2025年
- 餐飲連鎖經(jīng)營(yíng)合同協(xié)議(2025年餐飲)
- 2025年企業(yè)環(huán)保合規(guī)與風(fēng)險(xiǎn)評(píng)估指南
- 倉(cāng)庫(kù)批次管理培訓(xùn)
- 倉(cāng)庫(kù)安全培訓(xùn)教學(xué)課件
- 員工網(wǎng)絡(luò)信息安全培訓(xùn)
- 生命體征監(jiān)測(cè)的跨文化差異
- 護(hù)理技能提升進(jìn)修匯報(bào)
- 脊柱內(nèi)鏡手術(shù)機(jī)器人系統(tǒng)設(shè)計(jì)與精準(zhǔn)位置控制研究
- 【基于PLC的地鐵屏蔽門(mén)控制系統(tǒng)設(shè)計(jì)8900字(論文)】
- (高清版)DG∕TJ 08-9-2023 建筑抗震設(shè)計(jì)標(biāo)準(zhǔn)
- 《特種設(shè)備74號(hào)令宣貫材料》知識(shí)培訓(xùn)
- 波形護(hù)欄施工質(zhì)量控制方案
- 2024年重慶市中考英語(yǔ)試卷真題B卷(含標(biāo)準(zhǔn)答案及解析)+聽(tīng)力音頻
- 系統(tǒng)性紅斑狼瘡的飲食護(hù)理
- 電氣試驗(yàn)報(bào)告模板
- 陶瓷巖板應(yīng)用技術(shù)規(guī)程
- 道德經(jīng)原文(白話版)
- WORD版A4橫版密封條打印模板(可編輯)
評(píng)論
0/150
提交評(píng)論