醫(yī)學(xué)中的統(tǒng)計與研究_第1頁
醫(yī)學(xué)中的統(tǒng)計與研究_第2頁
醫(yī)學(xué)中的統(tǒng)計與研究_第3頁
醫(yī)學(xué)中的統(tǒng)計與研究_第4頁
醫(yī)學(xué)中的統(tǒng)計與研究_第5頁
已閱讀5頁,還剩151頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)中的統(tǒng)計與研究xx為何要作研究科學(xué)需要不斷求進(jìn)步學(xué)術(shù)能力的指標(biāo)自我激勵的表現(xiàn)方式強(qiáng)化自己的經(jīng)歷研究的種類:依動機(jī)分類描述性研究:描述一種現(xiàn)象NPC五年存活率多少?想研究影響NPC五年存活率的因子?NPC有哪些geneexpression?假設(shè)性研究:牽涉到比較NPC五年存活率在肌肉層侵犯是否較差?想研究肌肉層侵犯是否為影響NPC五年存活率的因子之一?NPC是否VEGFgene過度表現(xiàn)?統(tǒng)計與研究研究常常產(chǎn)生數(shù)據(jù)有數(shù)據(jù)就牽涉到統(tǒng)計統(tǒng)計常常需要比較來證實(shí)假設(shè)醫(yī)學(xué)期刊論文十之八九需要統(tǒng)計比較實(shí)證醫(yī)學(xué)絕對會用到統(tǒng)計比較統(tǒng)計:真真假假?例一:劑量越高組的預(yù)后反而差?

例二:治療時間越短組,局部控制率越高?例三:男生得肺癌機(jī)率高?例四:南部選民較支持阿扁?統(tǒng)計:真真假假?要思考真正原因例一:劑量越高組的預(yù)后反而差?死于副作用因為事先知道預(yù)后差,所以給高劑量

例二:治療時間越短組,局部控制率越高?因為預(yù)后較好組不需太高劑量所以療程較短例三:男生得肺癌機(jī)率高?男生抽煙多例四:南部選民較支持阿扁?某些因素集中在南部統(tǒng)計種類描述性統(tǒng)計收集100位病患,60位男性,40位女性,平均年齡55歲(24-77歲,中值50歲)經(jīng)過4到30個月追蹤(中值20個月),有35位(35%)病患因癌癥而死,有18位(18%)病患放射治療后復(fù)發(fā)。第四期病患中值存活期12個月(=1年存活率50%)。比較性統(tǒng)計男性發(fā)病年齡為5310歲,女性發(fā)病年齡為5512歲,發(fā)病年齡在統(tǒng)計學(xué)并無差異(p=0.669)。第三期病患2年存活率50%,第四期病患2年存活率10%,統(tǒng)計學(xué)有顯著意義(p=0.021)。數(shù)據(jù)種類類別性(categorical):彼此分不出高低,例如血型、星座、省籍、宗教信仰、職業(yè)次序性(ordinal):彼此可分出高低,但無小數(shù)點(diǎn)的存在,例如Stage(I,II,III,IV)、Grade(I,II,III,IV)、教育程度、職級連續(xù)性(continuous):允許小數(shù)點(diǎn)的存在,例如身高、體重、年齡、抽血值(WBC,SCC,PSA)、dose統(tǒng)計假設(shè)比較性統(tǒng)計需要統(tǒng)計假設(shè)想要算比較性統(tǒng)計要先問自己:要比什么東西(身高、投票率、血壓):end-point是誰和誰比(男與女、不同血型之間、治療前與治療后)Nullhypothesis(虛無假設(shè))=H0:A組的什么東西=B組的什么東西→沒差異Alternativehypothesis(對立假設(shè))=H1:A組的什么東西≠(<or>)B組的什么東西→有差異當(dāng)p<0.05時便推翻虛無假設(shè),接受對立假設(shè)平均值(mean)與標(biāo)準(zhǔn)偏差(standarddeviation):meanSD-2,-1,0,1,2:0.01.6-1,0,1,2,3:1.01.6-20,-10,0,10,20:0.015.8-19,-9,1,11,21:1.015.8標(biāo)準(zhǔn)偏差代表數(shù)據(jù)的集中性Z值=(觀查值-平均值)/SD=和mean差幾個SD=標(biāo)準(zhǔn)化值樣品平均值(samplemean)與標(biāo)準(zhǔn)誤差(standarderror):meanSESE=SD/(根號n)=SEM(standarderrorofmean)t值=(族群平均值

樣品平均值)/SE=和樣品平均值差幾個SE調(diào)查市面上出售某廠牌奶粉5罐,其重量為452,445,451,453,443克,問其重量是否符合450克之標(biāo)準(zhǔn)?H0:mean=450H1:mean≠450

信賴區(qū)間(ConfidenceInterval:CI)探討樣品平均值時,常以95%CI表示(允許5%的錯誤)95%CI=Meant×SE故此例題95%CI=448.80.597×2=443.22~454.38,p=0.583>0.05450包含在95%CI內(nèi)故mean448.8和450沒差異此就是著名的onesamplettest95%CIrangeofdifference=-6.78~4.38是指和450的差異各加450上去就是443.22~454.38調(diào)查市面上出售某廠牌奶粉5罐,其重量為443,445,451,444,443克,問其重量是否符合450克之標(biāo)準(zhǔn)?p=0.033,95%CI不包含450→偷工減料P值,

value,

value,powerpvalue=probability=significance=

value=TypeIerror=本來沒差異而誤認(rèn)為有差異的機(jī)率=(假陽性率)Pvalue越小代表可信度越高一般認(rèn)為統(tǒng)計上有意義之p<0.05(允許5%出錯率)Pvalue不可能為0(可寫成p<0.001),但可能為1

value=1

power(檢力)=TypeIIerror=本來有差異而誤認(rèn)為沒差異的機(jī)率=(假陰性率)power和samplesize正比一般認(rèn)為統(tǒng)計之power>0.8Power的用法50%和40%到底有無差異?→先看p

值如果p<0.05,就是有差異了,就算power(samplesize)很低也沒關(guān)系,因為samplesize小要讓p<0.05很不容易,所以連samplesize小都會有意義,代表真實(shí)性很高?!鷓<0.05不必考慮power如果p>0.05,也不能說一定沒差異,此時要算power,若power<0.8,就代表很可能是samplesize不夠才讓統(tǒng)計沒差異。若power>0.8,就認(rèn)輸了,真的是沒差異。如果你算出有統(tǒng)計意義,有人質(zhì)疑你的samplesize少(power不夠)→Don’tcareit!Youareright!除非這些sample是故意挑選的。Samplesize的算法一個前瞻性研究通常需要算samplesize50%(n=100)和40%(n=100)到底有無差異?先看p

值=0.155power=0.45<0.8代表samplesize不夠才讓統(tǒng)計沒差異。所以需要多少samplesize才會有無差異?此時=0.05power=0.8or=0.2如果兩組數(shù)目相同每組需要407個casenumber才讓統(tǒng)計有差異。

TwoProportionsPowerAnalysisPage/Date/Time 12003/3/811:23:43NumericResultsNullHypothesis:P1=P2AlternativeHypothesis:P1<>P2.ContinuityCorrectionUsed. Allocation Odds Power N1 N2 Ratio P1 P2 Ratio Alpha Beta0.80067 407 407 1.000 0.50000 0.40000 0.667 0.05000 0.19933ScheduleDateTopic2004/3/10統(tǒng)計和研究2004/3/24統(tǒng)計數(shù)據(jù)輸入技巧2004/4/7比較平均值:t-testandANOVA2004/4/21比較百分比:Chi-squaretest2004/5/12無母數(shù)分析2004/5/26存活分析2004/6/9回歸法簡介和交互作用介紹2004/6/23線性回歸2004/7/14LogisticandCoxregression2004/7/28信度與效度2004/8/11因素分析和數(shù)據(jù)聚集2004/8/25重復(fù)量數(shù)法考試候選人是屬于何種變項?A:連續(xù)B:次序C:類別統(tǒng)計數(shù)據(jù)輸入技巧黃英彥醫(yī)師2004/3/24數(shù)據(jù)種類類別性(categorical):彼此分不出高低,例如血型、星座、省籍、宗教信仰、職業(yè)次序性(ordinal):彼此可分出高低,但無小數(shù)點(diǎn)的存在,例如Stage(I,II,III,IV)、Grade(I,II,III,IV)、教育程度、職級連續(xù)性(continuous):允許小數(shù)點(diǎn)的存在,例如身高、體重、年齡、抽血值(WBC,SCC,PSA)、doseExcel數(shù)據(jù)輸入建議輸在excel第一列(row)的各格輸入各變項名(如性別、年齡、身高、血壓)等第一欄(column)的各格輸入每筆資料的流水號或病歷號或姓名等開始輸入數(shù)據(jù)時,類別或次序性變項需自行定義coding并以數(shù)據(jù)型式輸入女=0,男=1stageI=1,stageII=2O型=0,A型=1,B型=2,AB型=3答錯=0,答對=1Missingdata輸入m,以免認(rèn)為漏輸Excel數(shù)據(jù)輸入數(shù)據(jù)變項或筆數(shù)太多時,需采第一列及第一欄鎖定的方式mouse按在B2以定格按上面的”視窗”按”分割”:此時A,B和1,2間各出現(xiàn)一縱和一橫粗線按”凍結(jié)窗格”:此兩條線變細(xì)黑按縱或橫卷軸可發(fā)現(xiàn)第一列及第一欄已被鎖定Excel數(shù)據(jù)輸入數(shù)據(jù)輸完時需檢查,以抓出錯誤或漏輸欄位并更正mouse按在第一列的其中一格按”篩選”:會出現(xiàn)”自動篩選”并按之第一列的每欄位右邊會出現(xiàn)黑箭頭按欲檢查變項的黑箭頭,會出現(xiàn)”全部”、”前10項”、”自定”、之前輸入之?dāng)?shù)據(jù),如果有missingdata還會出現(xiàn)”空格”、”非空格”選取”空格”并可抓出漏輸欄位,或選出認(rèn)為錯誤data后,便可根據(jù)第一欄的筆數(shù)找出是何筆資料漏輸,此時黑箭頭會變藍(lán)箭頭修正完后按藍(lán)箭頭選”全部”恢復(fù)全部數(shù)據(jù),此時藍(lán)箭頭會變回黑箭頭再進(jìn)行另一變項檢查當(dāng)確定全部數(shù)據(jù)無誤后,篩選各變項含m之欄位并刪除含m之格子Excel數(shù)據(jù)輸入:插入欄位如果要將年齡分組,例如1-10、11-20、21-30等,必須插入新變項:在年齡變項左或右,點(diǎn)選欄位,此時整排變色按”插入”會出現(xiàn)”欄”并按之在篩選方式,在年齡變項操作選”自訂”后輸入要求之條件,例如選取41-50歲時,選大于等于41且小于等于50可以篩選出41-50歲,在age1以下空格輸”4”,mouse框住4,對準(zhǔn)右下角,mouse會變十字,然后往下拉到data結(jié)束依此類推,最后檢查有無漏輸完成年齡recodingSPSS數(shù)據(jù)讀取SPSS可讀excel檔,open后在檔案類型選其副檔名要先將excel關(guān)掉才能讀取如果要在SPSS作recoding:如果要將年齡分組,選transform,按recode選”IntoDifferentVariables”,出現(xiàn)新視窗左邊選出年齡變項丟到右邊Inputvariable→Outputvariable框位在最右邊Outputvariable框位Name輸入新變項名age1并按下”change”(一定要按)按下面OldandNewValues,出現(xiàn)新視窗左邊是舊數(shù)據(jù),點(diǎn)”Range”后,框位出現(xiàn),輸入41through50右邊在NewValue輸入4,記得按中間”Add”,Old→New框位才有字跑出來按Continue后回到前畫面,再按OK完成年齡recodingSPSS數(shù)據(jù)標(biāo)記變項和coding很多有時不容易記住,需要作標(biāo)記,以免output看不懂可選下面的”VariableView”切換,此時各Variables都在左邊Type:數(shù)據(jù)形式,如數(shù)字日期等Decimals:調(diào)小數(shù)點(diǎn)Label:變項最多只能8個半形字,因此在此可作完整補(bǔ)充Value:可把原coding=0定義作無,按格子右邊可出現(xiàn)視窗,在Value輸入0,Valuelabel輸入”無”,記得按add才成立,最后按OK比較平均值:t-testandANOVAxx何種數(shù)據(jù)可以比平均值?優(yōu)先級連續(xù)性變項且常態(tài)分布(N>30)連續(xù)性變項但samplesize不大(N<30)次序變項(比較不建議)組別特性和數(shù)目一組:和母群體比→onesamplet-test不可能相同之二組:→independentt-test(例如男和女比;同時期小孩和大人比)相同二組:→pairedt-test(例如同一群病患之治療前和治療后比;同一群小孩和以后長大成人比)不可能相同之三組或以上:→ANOVA(AnalysisofVariance)相同之三組或以上:→repeatedmeasurementofANOVA(以后討論)SPSS統(tǒng)計:Onesamplet-test選Analyze,按”Comparemeans”,按”O(jiān)nesamplet-test”

出現(xiàn)Testvariable(s),把要分析平均值的變項名稱放入框框?qū)⒛溉后w的平均質(zhì)輸入至”TestValue”,然后按OK即可p=0.131統(tǒng)計無差異,此870病患抽樣年齡和母群體60歲病無差異SPSS統(tǒng)計:Independentsamplet-test選Analyze,按”Comparemeans”,按”IndependentSamplest-test”

出現(xiàn)Testvariable(s),把要分析平均值的變項名稱放入框框?qū)⒁容^的組別變項放入GroupingVariable,然后按DefineGroups,

將要比較的兩組coding輸入到Group1and2,按Continue回到前畫面最后按OK即可要先看Levene’sTestforEqualityofVariances如果Sig.<0.05代表Variances不相同,t-test之p值等于Sig.(2-tailed)下面的數(shù)字如果Sig.>0.05代表Variances相同,t-test之p值等于Sig.(2-tailed)上面的數(shù)字SPSS統(tǒng)計:Pairedsamplet-test選Analyze,按”Comparemeans”,按”PairedSamplest-test”

出現(xiàn)Pairedvariable(s),把要分析平均值的兩組變項名稱同時選取才能放入框框最后按OK即可SPSS統(tǒng)計:ANOVA選Analyze,按”Comparemeans”,按”O(jiān)ne-WayANOVA”

出現(xiàn)DependentList,把要分析平均值的變項名稱放入框框?qū)⒁容^的組別變項放入Factor,按option,出現(xiàn)新畫面,勾選”Descriptive”和”Homogeneityofvariancetest”,按Continue回前畫面最后按OK即可SPSS統(tǒng)計:ANOVA如果要比較到底哪幾組有差異,需用事后比較(Post-Hoccomparison)一樣要先看variance是否equal,可看output的Testofhomogeneityofvariances,P<0.05就是unequal

variances,P>0.05就是equal

variances在操作ANOVA時,順便按”PostHoc”,如果是equal

variances在Equalvarianceassume內(nèi)選”Tukey”,如果是unequal

variances就在Equalvariancenotassume按”Dunnett’s”然后按Continue回到前畫面最后按OK即可比較百分比:Chi-squaretest黃英彥醫(yī)師2004/4/28何種數(shù)據(jù)可以比百分比?非連續(xù)性變項(次序或類別):R×CtableR=C=類別→傳統(tǒng)chi-squaretest,R=C=2可衍生出Fisher’sexacttest和Yate’scorrectionR=類別;C=次序→R=2可跑lineartrendR=C=次序→可跑lineartrend,有相關(guān)的味道組別特性和數(shù)目一組:和母群體比→適合度考驗(testofgoodnessoffit)不可能相同之二組或以上:R×Ccrosstable百分比同質(zhì)性考驗(testofhomogeneityofproportions):因果關(guān)系(R→C),例如不同藥物的治療效果獨(dú)立性考驗(testofindependence):看不同因是否有相關(guān)(R和C同時存在地位平等),例如身高和體重等級比較相同二組或以上:→改變的顯著性考驗(testofsignificantchange)McNemartest

(例如同一群病患之治療前和治療后比):for2×2Bowker’stestofsymmetry:for>

2×2但SPSS缺SPSS統(tǒng)計:testofgoodnessoffit想要知道280位幼兒對七彩顏色的喜好度是否相同?選紅橙黃綠藍(lán)靛紫各為52,48,44,31,29,30,46位首先選Data,按”WeightCases”,先點(diǎn)選”Weightcaseby”,然后將顏色次數(shù)變項放入”FrequencyVariable”空格內(nèi),然后按OK即可選Analyze,按”NonparametricTests”,按”Chi-squaretest”,將顏色次數(shù)變項放入”TestVariableList”,如果假設(shè)喜好度都一樣,那每種顏色理論值都一樣,因此在下面ExpectedValue點(diǎn)選Allcategoriesequal然后按OK即可Chi-square值為14.05,p=0.029統(tǒng)計有差異,此280幼兒對七彩顏色的喜好度并不相同SPSS統(tǒng)計:testofhomogeneityofproportions想要知道42位、46位、37位國一、國二、國三生看過武俠小說的經(jīng)驗是否相同?他們各有27、34、28位看過要設(shè)計一欄位為年級(year),可輸入1,2,3再設(shè)計一欄位為讀過小說(book),可輸入0,1再設(shè)計一欄位為人數(shù)(frequency)首先選Data,按”WeightCases”,先點(diǎn)選”Weightcaseby”,然后將frequency次數(shù)變項放入”FrequencyVariable”空格內(nèi),然后按OK即可選Analyze,按”DescriptiveStatistics”,按”Crosstabs”,將year和book個放入row(s)和column(s)內(nèi)(交換也可),然后按下面Cells按鈕,出現(xiàn)有Percent欄位選Column或Row(視需要而定),然后選Continue回到前畫面再按下面Statistics按鈕,出現(xiàn)新畫面,點(diǎn)選Chi-square后選Continue回到前畫面最后按OK即可Chi-square值為1.506,p=0.471統(tǒng)計無差異,看過武俠小說的經(jīng)驗在此三個年級內(nèi)并無差異SPSS統(tǒng)計:Chi-square之lineartrend以上一張output表為例(如果samplesize放大10倍),如果假設(shè)是國一、國二、國三生看過武俠小說的經(jīng)驗是否相同?那Chi-square之p值要看PearsonChi-square那一行之pvalue=0.001如果假設(shè)是國一、國二、國三生看過武俠小說的經(jīng)驗是否隨年級增加而增加?那Chi-square之p值要看Linear-by-Linear那一行之pvalue<0.001SPSS統(tǒng)計:testofindependence測試100位學(xué)童左右腦側(cè)化測驗和手臂左右利測驗,結(jié)果如下,問此兩者是否獨(dú)立無關(guān)方法同testofhomogeneityofproportionsChi-square值為15.126,p<0.001統(tǒng)計有差異,因此左右腦側(cè)化和手臂左右利并非獨(dú)立SPSS統(tǒng)計:McNemartest50名初二學(xué)生在學(xué)期初和學(xué)期末均被問是否喜歡英文課,其反應(yīng)結(jié)果如下,問學(xué)期前后喜歡英文課的情形是否有顯著改變前面方法同testofhomogeneityofproportions直到選Chi-suqare畫面時

,在右下方加點(diǎn)選”McNemar”,然后以后步驟皆同p=0.087,學(xué)期前后喜歡英文課的情形并無顯著改變SPSS統(tǒng)計:>2×2table之事后比較以武俠小說的經(jīng)驗是否相同(largesamplesize)?以Chi-squaretest檢定之p=0.001,但到底是哪些年級有差異?SPSS并無題供事后比較的方法可用一變通方法

,那就是采用logisticregression(是Chi-squaretest的多變數(shù)分析)來輔以參考選Analyze,按”Regression”,選”BinaryLogistic”,將book放入dependent方塊內(nèi),year放入Covariates方塊內(nèi),然后按下面Categorical按鈕,把year從Covariates丟到CategoricalCovariates內(nèi),然后選Continue回到前畫面,最后按OK即可這叫dummyvariable虛擬變量,有n個coding就會有n-1的虛擬變量。像本例year有1,2,3coding故有2個虛擬變量因此本output虛擬變量coding為year1=10以(1)代表,year1=01以(2)代表,year3=00稱為reference。Overallpvalue(=0.001)看YEAR那一行,會和PearsonChi-square之pvalue一樣。但YEAR(1)(=year1)后面的p=0.001代表year(1)和reference(=year3)比較的p值,因此一年級和三年級有差異YEAR(2)(=year2)后面的p=0.562代表year(2)和reference(=year3)比較的p值,因此二年級和三年級沒差異但一年級和二年級在本output并無比較,該如何辦到?此時必需更換reference在原先按下Categorical按鈕,把year從Covariates丟到CategoricalCovariates內(nèi)時,將最下面ReferenceCategory點(diǎn)選First并按Change,然后選Continue回到前畫面,最后按OK即可此時虛擬變量coding為year2=10以(1)代表,year3=01以(2)代表,year1=00稱為reference。Overallpvalue(=0.001)看YEAR那一行,仍不變但YEAR(1)(=year2)后面的p=0.002代表YEAR(1)和reference(=year1)比較的p值,因此一年級和二年級有差異YEAR(2)(=year3)后面的p=0.001代表YEAR(2)和reference(=year1)比較的p值,因此一年級和三年級有差異,其實(shí)這在year3當(dāng)reference已比過因此結(jié)論是此種差距是發(fā)生在一和二年級以及一和三年級,二和三年級已無差異Overallpvalue(=0.001)看YEAR那一行,會和PearsonChi-square之pvalue一樣。但YEAR(1)(=year1)后面的p=0.001代表year(1)和reference(=year3)比較的p值,因此一年級和三年級有差異YEAR(2)(=year2)后面的p=0.562代表year(2)和reference(=year3)比較的p值,因此二年級和三年級沒差異但一年級和二年級在本output并無比較,該如何辦到?此時必需更換reference在原先按下Categorical按鈕,把year從Covariates丟到CategoricalCovariates內(nèi)時,將最下面ReferenceCategory點(diǎn)選First并按Change,然后選Continue回到前畫面,最后按OK即可SPSS統(tǒng)計:Fisher’sexacttest用于2×2table只要其中一個格子(cell)以上的期望值<5時,需用Fisher’sexacttestp=0.001有高血壓的人比較會同時有糖尿病有高血壓的人是否比較會同時有糖尿病?SPSS統(tǒng)計:Chi-square之Correlation如果要比較兩組次序變項是否有相關(guān),需用correlation前面方法同testofhomogeneityofproportions直到選Chi-suqare畫面時

,在右上方加點(diǎn)選”Correlation”,然后以后步驟皆同p=0.001有相關(guān),T越大,N也大的機(jī)會很高乳癌T和Nstage是否相關(guān)?無母數(shù)分析xx何種數(shù)據(jù)可以用無母數(shù)分析?連續(xù)性變項但非常態(tài)分布次序變項組別特性和數(shù)目一組:Signtest:看多方是否有意義多于少方,SPSS無Binomialtest:看機(jī)率是否如預(yù)期Runtest:看隨機(jī)性不可能相同之二組或以上:Mann-WhitneyUtest=Wilcoxonranksumtest相當(dāng)于independentt-testKruskal-Wallistest:相當(dāng)于ANOVA

Mediantest:相當(dāng)于ANOVA

相同二組或以上:Wilcoxonmatchedpairedsignedranktest:相當(dāng)于pairedt-test

,變項為多變數(shù)Signedtest:相當(dāng)于pairedt-test

,變項為多變數(shù)McNemartest:相當(dāng)于pairedt-test,但變項為二變量CochranQtest:相當(dāng)于repeatedmeasurementofANOVA,但變項為二變量Friedmantest:相當(dāng)于repeatedmeasurementofANOVA,變項為多變數(shù)SPSS統(tǒng)計:Binomialtest今有某花卉種子商人宣稱他的種子發(fā)芽率達(dá)90%,今隨機(jī)實(shí)驗200粒,結(jié)果170粒發(fā)芽,問此人廣告是否可靠?首先建立發(fā)芽變項,再建立相對應(yīng)數(shù)目變項,然后選Data,按”WeightCases”,先點(diǎn)選”Weightcaseby”,然后將次數(shù)變項放入”FrequencyVariable”空格內(nèi),然后按OK即可選Analyze,按”NonparametricTests”,按”Binomial”,將發(fā)芽變項放入”TestVariableList”,并在”testporportion”輸入0.9(因假設(shè)90%發(fā)芽),然后按OK即可p=0.013統(tǒng)計有差異,此人廣告不可靠SPSS統(tǒng)計:Runtest從一群小雞隨意抓12只,其雌雄出現(xiàn)順序如下問此群小雞出現(xiàn)順序是否隨機(jī)?FFFMMFFMMMFF首先按順序輸入coding:000110011100,然后選Analyze,按”NonparametricTests”,按”Run”,將順序變項放入”TestVariableList”,然后在左下角勾選mean,然后按OK即可p=0.405統(tǒng)計無差異,小雞出現(xiàn)順序為隨機(jī)SPSS統(tǒng)計:Mann-WhitneyUtest

想要知道停經(jīng)前和停經(jīng)后乳癌病患的體重是否有不同?

選Analyze,按”Non-parametricTests”,按”2independentSamples”,將體重變項放入”TestVariablesList”,將停經(jīng)變項放入”GroupingVariable”然后按DefineGroups,

將要比較的兩組coding輸入到Group1and2,并勾選Mann-WhitneyU后按Continue回到前畫面,最后按OK即可p=0.025統(tǒng)計有差異,停經(jīng)前和停經(jīng)后乳癌病患的體重果然不同SPSS統(tǒng)計:Kruskal-WallisandMediantest想要知道不同ER接受體狀態(tài)乳癌病患的體重是否有不同?選Analyze,按”Non-parametricTests”,按”2independentSamples”,將體重變項放入”TestVariablesList”,將ER接受體變項放入”GroupingVariable”然后按DefineRange,

將要比較的codingrange輸入到MinimumandMaximum,并勾選Kruskal-Wallis或Median后按Continue回到前畫面,最后按OK即可p>0.05統(tǒng)計無差異,不同ER接受體狀態(tài)乳癌病患的體重并無不同Kruskal-WallisTestMedianTestSPSS統(tǒng)計:Wilcoxonmatchedpairedsignedrankandsigntest想了解乳癌病患以1997年N分期和2002年N分期是否有差異?選Analyze,按”Non-parametricTests”,按”2relatedSamples”,將1997年和2002年N分期變項放入”TestPair(s)List”,并勾選Wilcoxon或Sign后按OK即可p<0.001統(tǒng)計有顯著差異,2002年N分期不同于N分期WilcoxonSignedRanksTestSignTestSPSS統(tǒng)計:McNemartest50名初二學(xué)生在學(xué)期初和學(xué)期末均被問是否喜歡英文課,其反應(yīng)結(jié)果如下,問學(xué)期前后喜歡英文課的情形是否有顯著改變選Analyze,按”Non-parametricTests”,按”2relatedSamples”,將before和after變項放入”TestPair(s)List”,并勾選McNemar后按OK即可p=0.089統(tǒng)計無差異,學(xué)期前后喜歡英文課的情形并無顯著改變SPSS統(tǒng)計:CochranQtest有ABC三種開罐器分給位家庭主婦使用,以比較受喜好程度是否相同?對于喜歡品牌給1,否則給0:

12345678910A0001000001B1101010011C1111111110選Analyze,按”Non-parametricTests”,按”KrelatedSamples”將ABC變項放入”TestVariables”,并勾選CochranQ后按OK即可P=0.016統(tǒng)計有顯著差異,喜好程度不相同SPSS統(tǒng)計:Friedmantest今有ABCD四種綠茶,經(jīng)四位評審評分如下,問質(zhì)量是否相同?

1234A85879080B82758175C82868081D79827675選Analyze,按”Non-parametricTests”,按”KrelatedSamples”將ABC變項放入”TestVariables”,并勾選Friedman后按OK即可P=0.043統(tǒng)計有顯著差異,綠茶質(zhì)量不相同存活分析黃英彥醫(yī)師2004/5/26存活分析Crudeincidence:分子/分母,和時間無關(guān)Actuarialincidence:和時間有關(guān),較精準(zhǔn)Uncensor:事件已發(fā)生Censor:事件未發(fā)生存活分析計算方式:Kaplan-Meiermethod:無限制,最常用Lifetable:只能用于casenumber很多者(>300)兩組以上差異比較Logranktest899091929312345654472526732788189101614Kaplan-Meiermethod選Analyze,按”Survival”,按”Kaplan-Meier”,將follow-uptime變項放入”Time”,將end-point變項放入”status”然后按DefineEvent,

將發(fā)生event之coding輸入到singlevalue中(例如輸入死亡之coding),然后按Continue回到前畫面,最后按OK即可如需作圖,在按主劃面之Options,選survival回到前劃面即可Logranktest如需比較組別差異,在主畫面還要將組別變項coding放入”Factors”,然后按左下角”Comparefactor”,進(jìn)入新視窗勾選左上角Logrank,然后按Continue回到前畫面,最后按OK即可

SurvivalAnalysisforMONTHSTimeStatusCumulativeStandardCumulativeNumberSurvivalErrorEventsRemaining7.00.00.9000.0949198.001.001814.001.001716.00.00.7714.14422618.00.00.6429.16793525.001.003426.00.00.4821.18774332.00.00.3214.18135247.001.005154.001.0050NumberofCases:10Censored:5(50.00%)Events:5SurvivalTimeStandardError95%ConfidenceIntervalMean:31.756.13(19.73,43.77)(Limitedto54.00)Median:26.008.18(9.97,42.03)_x000C_SurvivalAnalysisforMONTHSFactorLN=.00TimeStatusCumulativeStandardCumulativeNumberSurvivalErrorEventsRemaining25.001.000426.00.00.7500.21651332.00.00.5000.25002247.001.002154.001.0020NumberofCases:5Censored:3(60.00%)Events:2SurvivalTimeStandardError95%ConfidenceIntervalMean:41.506.34(29.07,53.93)(Limitedto54.00)Median:32.00.(.,.)_x000C_SurvivalAnalysisforMONTHSFactorLN=1.00TimeStatusCumulativeStandardCumulativeNumberSurvivalErrorEventsRemaining7.00.00.8000.1789148.001.001314.001.001216.00.00.4000.29662118.00.00.0000.000030NumberofCases:5Censored:2(40.00%)Events:3SurvivalTimeStandardError95%ConfidenceIntervalMean:15.002.30(10.50,19.50)Median:16.006.67(2.92,29.08)_x000C_SurvivalAnalysisforMONTHSTotalNumberNumberPercentEventsCensoredCensoredLN.0052360.00LN1.0053240.00Overall105550.00TestStatisticsforEqualityofSurvivalDistributionsforLNStatisticdfSignificance

LogRank7.071.0078_x000C_

回歸法簡介和交互作用介紹黃英彥醫(yī)師2004/6/9回歸(Regression)用于預(yù)測有因果關(guān)系:因

果類似函數(shù)的概念:f(x)=a+bxf(x)=a+bx+cx2果只有一種,因可以很多種很多原因可以引起某種疾病回歸(Regression)y=a+bx(國中一元一次多項式)

直線y叫依變量(dependentvariable),就是”果”x叫自變數(shù)(independentvariable),就是”因”a叫常數(shù),或是截距(intercept)b叫系數(shù)(coefficient)y=a+b1x1+b2x2(國中二元一次多項式)x1和x2就是不同的自變數(shù)y=a+bx+cx2(國中一元二次多項式)

拋物線只有一自變數(shù)x簡單線性回歸(SimpleLinearRegression)華氏溫度=32+9/5

攝氏溫度32就是常數(shù),就是x=0時的y值,攝氏0度時華氏就是32度

9/5就是系數(shù)(coefficient),就是攝氏每增加1度時華氏就增加1.8度:攝氏0度時華氏就是32度;攝氏1度時華氏就是33.8度:攝氏2度時華氏就是35.6度多重線性回歸(MultipleLinearRegression)出租車費(fèi)=75+5(公里/0.4)+5(分鐘/5)75就是起跳費(fèi)

第一個5就是每跳400公尺增加5元,第二個5就是每過5分鐘增加5元所以影響車費(fèi)有兩種因素:里程數(shù)和時間多重線性回歸(MultipleLinearRegression)出租車費(fèi)=75+5(公里/0.4)+5(分鐘/5)50

(會講臺語)會講臺語是類別變項:0=不會講臺語;1=會講臺語所以影響車費(fèi)有三種因素:里程數(shù)和時間和會講臺語,前兩者是正相關(guān),第三者是負(fù)相關(guān)因此由系數(shù)的正負(fù)可看某因素的正負(fù)相關(guān)有無交互作用(Interaction)之比較出租車費(fèi)=75+10(公里)+1(分鐘)

每跑1公里增加10元;每跑1分鐘增加1元過年期間出租車費(fèi)=75+10(公里)+1(分鐘)+2(公里)(分鐘)每跑1公里增加10元?No!要視時間而定每跑1分鐘增加1元?No!要視里程而定如下表KmMinuteFeeNewFee15901002510012035110140451201605513018011095115210105145310115175410125205510135235115100130215110170315120210415130250515140290KmMinuteFeeNewFee5112613652127147531281585412916955130180101176196102177217103178238104179259105180280151226256152227287153228318154229349155230380有無交互作用之解讀無交互作用:各個自變數(shù)彼此獨(dú)立(independent)分析和解讀容易,廣為大家接受有交互作用:各個自變數(shù)有可能相互影響在生命科學(xué)界常見,錯綜復(fù)雜不易分析和解讀,一旦可分析出來的貢獻(xiàn)度高于無交互作用線性回歸黃英彥醫(yī)師2004/6/23線性回歸(LinearRegression)簡單線性回歸(SimpleLinearRegression)Y=a+bx(是多重線性回歸的最簡化)多重線性回歸(MultipleLinearRegression)Y=a+b1x1+b2x2+….+bnxn線性回歸統(tǒng)計(不考慮交互作用):SPSS本科林佳欣等人探討和皮膚百分劑量有關(guān)之因素:能量:6,10,or15MV照野大小:55,1010,2020,or3030加Tray與否:0or1多重線性回歸(MultipleLinearRegression)皮膚百分劑量=a+b1能量+b2照野大小+b3Tray線性回歸統(tǒng)計(不考慮交互作用):SPSS選Analyze,按”Regression”,按”Linear”,將皮膚百分劑量值(Y)變項放入”Dependent”,將能量、照野大小、加Tray與否變項放入”Independent(s)”,

最后按OK即可多重線性回歸(MultipleLinearRegression)皮膚百分劑量=a+b1能量+b2照野大小+b3Tray線性回歸統(tǒng)計(不考慮交互作用):SPSS皮膚百分劑量=a+b1能量+b2照野大小+b3Traya=14.326;b1=

0.739;b2=1.352;b3=5.383皮膚百分劑量=14.326

0.739能量+1.352照野大小+5.383Tray線性回歸統(tǒng)計(考慮交互作用):SPSSwithGLM選Analyze,按”GeneralLinearModel”,按”Univariate”,將皮膚百分劑量值(Y)變項放入”DependentVariable”,將加Tray與否變項放入”FixedFactor(s)”,將能量、照野大小變項放入”Covariate(s)”然后按Model,點(diǎn)選右上方Custom,在左下面框框變成可選

,將三種因素A,B,C個別放入右框,然后將兩兩同時選AB,BC,CA放入右框,最后將ABC放入右框,最后按Continue回到前畫面按OK即可有意義因子為能量、照野大小、Tray*照野大小(交互作用),但用此GeneralLinearModel(GLM)無法看出正負(fù)相關(guān)和系數(shù)常數(shù)線性回歸統(tǒng)計(考慮交互作用):SPSSwithLinearregression首先必須制造兩兩相乘或三三相乘欄位選Transform后,按Compute,將新欄位命名后,將運(yùn)算公式輸入在右邊框框內(nèi),然后按OK即可然后選Analyze,按”Regression”,按”Linear”,將新(有相乘AB、BC、CA、ABC)舊(A、B、C)變項都放入Independent(s)”,

最后按OK即可線性回歸統(tǒng)計(考慮交互作用):SPSSwithLinearregression皮膚百分劑量=18.544

0.785能量+1.112照野大小+0.411Tray

照野大小TrayinTrayout6MV6MV10MV10MV15MV15MV有無交互作用(Interaction)之比較出租車費(fèi)=75+10(公里)+1(分鐘)

每跑1公里增加10元;每跑1分鐘增加1元過年期間出租車費(fèi)=75+10(公里)+1(分鐘)+2(公里)(分鐘)每跑1公里增加10元?No!要視時間而定每跑1分鐘增加1元?No!要視里程而定如下表KmMinuteFeeNewFee15901002510012035110140451201605513018011095115210105145310115175410125205510135235115100130215110170315120210415130250515140290KmMinuteFeeNewFee5112613652127147531281585412916955130180101176196102177217103178238104179259105180280151226256152227287153228318154229349155230380出租車費(fèi)=75+10(公里)+1(分鐘)

每跑1公里增加10元;每跑1分鐘增加1元過年期間出租車費(fèi)=75+10(公里)+1(分鐘)+2(公里)(分鐘)每跑1公里增加10元?No!要視時間而定每跑1分鐘增加1元?No!要視里程而定選擇Model原則Model(方程式)很多種,有無交互作用的組合也很多種,到底要選擇哪一種?沒有完全正確的答案,大部份的人選擇對自己有利的model盡量選擇Rsquare(解釋能力)最大的modelLogisticandCoxregression

xx各種回歸的比較多重線性回歸(MultipleLinearRegression)Y=a+b1x1+b2x2+….+bnxnY是連續(xù)變項,Xn可以是連續(xù)或類別變項LogisticRegression:是Chi-squaretest的多變項分析Y是二分變項(binaryvariable),Xn可以是連續(xù)或類別變項Log-odds=a+b1x1+b2x2+….+bnxn=ln(1-p)-ln(p)p=1/(1+e

Log-odds)可根據(jù)以上式子算出機(jī)率

CoxRegression:是Kaplain-Meiertest的多變項分析Y是二分變項,Xn可以是連續(xù)或類別變項公式復(fù)雜,多了時間函數(shù)t,可算幾年存活率Oddsratio問男生抽煙的勝算比是女生的幾倍?女生當(dāng)分母.男比女:(9/1)(2/8)=36LogisticRegression:SPSS選Analyze,按”Regression”,按”Binarylogistic”,將end-point(二分變項)(Y)放入”Dependent”,將x1、x2、xn變項放入”Covariates”,在下面的Method選”Forward:Wald”最后按OK即可如果要考慮interaction,可同時按Ctrl再按x1和x2,此時>a*b>會變明顯,去按它會將x1*x2放入CovariatesLogisticRegression:SPSS嚴(yán)重腸道副作用和parametrialdose>54Gy和ICRUrectalpointcumulativeBED>100Gy3有關(guān)(看laststep)Exp(B)就是Oddsratio,>1表正比,dose越高副作用機(jī)率越高LogisticRegression:SPSS(考慮交互作用)同時有parametrialdose>54Gy和

ICRUrectalpointcumulativeBED>100Gy3副作用機(jī)率越高達(dá)8倍以上CoxRegression:SPSS選Analyze,按”Survival”,按”Coxregression”,將end-point(二分變項)(Y)放入”Status”,并定義event(出事),將x1、x2、xn變項放入”Covariates”,在下面的Method選”Forward:Wald”最后按OK即可如果要考慮interaction,可同時按Ctrl再按x1和x2,此時>a*b>會變明顯,去按它會將x1*x2放入CovariatesCoxRegression:SPSS嚴(yán)重腸道副作用和parametrialdose>54Gy和ICRUrectalpointcumulativeBED>100Gy3有關(guān)(看laststep)Exp(B)就是Oddsratio,>1表正比,dose越高副作用機(jī)率越高同時有parametrialdose>54Gy和ICRUrectalpointcumulativeBED>100Gy3副作用機(jī)率越高達(dá)8倍以上選擇各種回歸法的原則先看dependent(Y:因變量)屬于何種變項連續(xù):MultipleLinearRegression二分變項:LogisticorCoxregression次序變項:MultinominalLogisticregression(很少人用)二分變項和時間無關(guān)(nocensoreddata):Logisticregression和時間有關(guān)(censoreddata):Coxregression這些multivariateanalysis操作雖容易但解讀不易,如有實(shí)際案例可找我討論信度與效度xx信度(reliability)與效度(Validity)信度(reliability)是代表一個測驗可靠的程度,也就是精密度,即此測驗重覆施行,應(yīng)會產(chǎn)生類似的結(jié)果。效度的檢定是指分析工具的準(zhǔn)確性。舉例來說子宮頸抹片偵測出子宮頸癌的準(zhǔn)確性(陽性度)有多少?常用的信度分析如果測驗只作一次則須求得內(nèi)部一致性(internalconsistent):Cronbach’s

(用于連續(xù)性變項)或Kuder-Richardson20(KR-20)(用于二分性變項)或Split-halfcoefficient。凡是同一受測者不只接受一次測驗需要計算Intraclasscorrelationcoefficient(ICC)。同一群測試者于不同時間接受同一測驗所求出的信度稱為再測信度(Testre-testreliability)。如果是不同裁判來測試同一群受測者稱為測試者一致信度(Inter-raterreliability)。Internalconsistent:SPSSInternalconsistent我們可以選”

Statistics”之后再選”Scales”,然后再選”ReliabilityAnalysis”,計算機(jī)會要求把你想要分析的variables用箭頭移到右邊的空間處,然后再按下面”Statistics”按鈕后進(jìn)入下一對話方塊,再勾選”Saleifterm”,最后按Continue回到前畫面,再按OK即可看output。Output會顯示alpha值。ScaleScaleCorrectedMeanVarianceItem-AlphaifItemifItemTotalifItemDeletedDeletedCorrelationDeletedD130.967711.5071.2545.5537D231.50009.5984.4165.4999D332.032310.5891.1971.5654D431.451611.0714.3303.5381D532.177411.0336.1759.5674D632.435510.6761.1299

.5917D731.61299.8477.3700.5144D831.338711.1129

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論