醫(yī)藥常用統(tǒng)計(jì)方法終課件_第1頁(yè)
醫(yī)藥常用統(tǒng)計(jì)方法終課件_第2頁(yè)
醫(yī)藥常用統(tǒng)計(jì)方法終課件_第3頁(yè)
醫(yī)藥常用統(tǒng)計(jì)方法終課件_第4頁(yè)
醫(yī)藥常用統(tǒng)計(jì)方法終課件_第5頁(yè)
已閱讀5頁(yè),還剩84頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)藥常用統(tǒng)計(jì)方法與統(tǒng)計(jì)圖表中國(guó)藥科大學(xué)生物統(tǒng)計(jì)與計(jì)算藥學(xué)研究中心主要內(nèi)容統(tǒng)計(jì)基本概念1假設(shè)檢驗(yàn)2常用統(tǒng)計(jì)方法3統(tǒng)計(jì)圖表4一、統(tǒng)計(jì)基本概念 醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容統(tǒng)計(jì)工作貫穿醫(yī)學(xué)研究中的全過(guò)程,醫(yī)學(xué)研究中的統(tǒng)計(jì)工作包括:研究設(shè)計(jì)數(shù)據(jù)搜集數(shù)據(jù)整理數(shù)據(jù)分析醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容研究設(shè)計(jì)設(shè)計(jì)一般包括專業(yè)設(shè)計(jì)和統(tǒng)計(jì)設(shè)計(jì)。專業(yè)設(shè)計(jì)即確定調(diào)查題目、 內(nèi)容等。統(tǒng)計(jì)設(shè)計(jì)包括資料收集、整理與分析。實(shí)驗(yàn)三要素:處理因素、受試對(duì)象、實(shí)驗(yàn)效應(yīng)設(shè)計(jì)四原則:對(duì)照、隨機(jī)化、重復(fù)、盲法搜集資料:按照設(shè)計(jì)要求,原則是及時(shí)、準(zhǔn)確、完整地收集原始數(shù)據(jù)。 數(shù)據(jù)來(lái)源:病歷、日常醫(yī)療工作記錄、臨床檢查與化驗(yàn)記錄、 疾病監(jiān)測(cè)報(bào)表、專題研究數(shù)據(jù)整理:

2、對(duì)數(shù)據(jù)進(jìn)行清理、改錯(cuò)、數(shù)量化數(shù)據(jù)分析:統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷一、統(tǒng)計(jì)基本概念常用概念 A. 同質(zhì)與變異在調(diào)查研究或?qū)嶒?yàn)研究中,除了直接關(guān)注的影響因素外,其他非研究因素也會(huì)影響研究結(jié)果,為了突出研究因素的作用,需要使各比較組之間非研究因素盡可能相同,即同質(zhì)即使非研究因素控制在相同條件下,個(gè)體的觀察值之間也會(huì)有所不同,這種差異叫做變異 C. 抽樣和抽樣誤差抽樣是指從總體選取樣本的過(guò)程,抽樣的目的是用樣本信息來(lái)推斷總體特征由于抽樣所造成的樣本指標(biāo)與總體指標(biāo)的差異稱為抽樣誤差 D. 概率和小概率事件概率(probability)是反映某一事件發(fā)生的可能性的大小,常用符號(hào)P表示。其值在0和1之間。概率等于1

3、的事件是必然事件,概率等于0的事件是不可能事件,隨機(jī)事件的概率小于1,而大于0。小概率事件習(xí)慣上是指P 2 samplesInterval One way ANOVARepeated measured ANOVAOrdinalKruskal-Wallis testFriedman testNominalChi-square testCochrans Q test (dichotomous data only)三、常用統(tǒng)計(jì)方法生存分析Logistic回歸分析判別分析聚類分析Meta分析主成分分析1、生存分析醫(yī)學(xué)研究中,為了了解某種疾病的預(yù)后、評(píng)價(jià)治療方法的優(yōu)劣或觀察預(yù)防保健措施的效果等,常需對(duì)研

4、究對(duì)象進(jìn)行追蹤觀察,以獲得必要的數(shù)據(jù),這類資料都屬于隨訪資料。 其研究?jī)?nèi)容主要包括3個(gè)方面: 對(duì)生存狀況進(jìn)行統(tǒng)計(jì)描述(生存概率、生存率、中位生存期等); 尋找影響生存時(shí)間的“危險(xiǎn)因素”和“保護(hù)因素”; 估計(jì)生存率和生存時(shí)間長(zhǎng)短,進(jìn)行預(yù)后評(píng)價(jià)。傳統(tǒng)方法在分析隨訪資料時(shí)的困難1、時(shí)間和生存結(jié)局都成為了要關(guān)心的因如果將兩者均作為變量擬合多元模型,因?yàn)闀r(shí)間分布不明(一般不呈正態(tài)分布,在不同情況下的分布規(guī)律也不同),擬合多元模型極為困難2、存在大量失訪的資料,數(shù)據(jù)刪失失去聯(lián)系(病人搬走,電話號(hào)碼改變)無(wú)法觀察到結(jié)局(死于其他原因)研究截止 關(guān)于截尾或刪失隨訪開(kāi)始事件失訪失訪研究截止時(shí)仍存活研究截止時(shí)點(diǎn)患

5、者進(jìn)入期間刪失的模式圖乘積極限法(product-limit method)非參數(shù)方法,是由Kaplan和Meier在1958年首先提出,故又稱Kaplan-Meier法(K-M法)。用于估計(jì)生存率主要適用于樣本含量較小的資料。圖16-2 兩種療法治療后白血病患者的生存率曲線 設(shè)含有p個(gè)變量x1, x2,xp及時(shí)間T和結(jié)局C的n個(gè)觀察對(duì)象. 其數(shù)據(jù)結(jié)構(gòu)為: 編號(hào) X1 X2 . XP T C 1 x11 x21 x1p y1 1 2 x21 x22 x2p y2 0 n xn1 xn2 xnp yp .COX模型:Cox模型的適用范圍Cox模型適用于生存資料的統(tǒng)計(jì)分析,屬半?yún)?shù)模型,對(duì)資料沒(méi)有

6、特殊的要求,也可以估計(jì)各因素的參數(shù),并能做多因素的統(tǒng)計(jì)分析。該模型的主要優(yōu)點(diǎn)在于能從眾多的影響因素中排除混雜因素的影響,找出影響生存時(shí)間的因素,根據(jù)各因素的參數(shù)估計(jì)出個(gè)體的生存率。另外,Cox模型能分析具有截尾數(shù)值的生存時(shí)間。Cox模型在臨床流行病學(xué)分析中,使臨床觀察的定性指標(biāo)又加上定量指標(biāo)進(jìn)行分析,提高了分析的效率。 2、logistic回歸模型Logistic回歸模型概念:研究因變量y取某個(gè)值的概率變量p與自變量x的依存關(guān)系模型:由于概率只能取0到1之間的值,為了把因變量擴(kuò)展到整個(gè)實(shí)數(shù)范圍,對(duì)p做logit變換回歸模型參數(shù)數(shù)學(xué)意義0(常數(shù)項(xiàng)):所有影響因素均為 0 時(shí)(記作X=0),個(gè)體發(fā)

7、生事件概率與不發(fā)生事件的概率之比的自然對(duì)數(shù)值。j 的含義:某因素 Xj 改變一個(gè)單位時(shí),個(gè)體發(fā)生事件概率與不發(fā)生事件的概率之比的自然對(duì)數(shù)值。優(yōu)勢(shì)比(odds ratio,OR)或比數(shù)比優(yōu)勢(shì)(odds)是指某影響因素控制在某種水平時(shí),事件發(fā)生率與事件不發(fā)生率的比值,即P/(1-P)。某影響因素的兩個(gè)不同水平的優(yōu)勢(shì)的比值稱為優(yōu)勢(shì)比,如某影響因素的一個(gè)水平為c1,另一個(gè)水平為c0,則這兩個(gè)水平的優(yōu)勢(shì)比為:優(yōu)勢(shì)比(odds ratio,OR)OR表示影響因素對(duì)事件發(fā)生的影響方向和影響能力大小。OR1表示該因素取值越大,事件發(fā)生的概率越大,又稱危險(xiǎn)因素。OR 0,OR 1,影響因素的取值越大,事件的發(fā)生

8、的概率越大。 0,OR 1,影響因素的取值越大,事件的發(fā)生的概率越小。優(yōu)勢(shì)比實(shí)例結(jié)果吸煙不吸煙合計(jì)食管癌患者309(a)126(b)435非食管癌患者208(c)243(d)451合計(jì)517(a+c)369(b+d)886吸煙與食管癌關(guān)系的病例對(duì)照調(diào)查結(jié)果3、判別分析在我們的日常生活和工作實(shí)踐中,常常會(huì)遇到判別分析問(wèn)題,即根據(jù)歷史上劃分類別的有關(guān)資料和某種最優(yōu)準(zhǔn)則,確定一種判別方法,判定一個(gè)新的樣本歸屬哪一類。例如,某醫(yī)院有部分患有肺炎、肝炎、冠心病、糖尿病等病人的資料,記錄了每個(gè)患者若干項(xiàng)癥狀指標(biāo)數(shù)據(jù)?,F(xiàn)在想利用現(xiàn)有的這些資料找出一種方法,使得對(duì)于一個(gè)新的病人,當(dāng)測(cè)得這些癥狀指標(biāo)數(shù)據(jù)時(shí),能夠

9、判定其患有哪種病。這些問(wèn)題都可以應(yīng)用判別分析方法予以解決。對(duì)相似性的刻畫(huà)有不同的準(zhǔn)則:最小距離準(zhǔn)則、Fisher準(zhǔn)則、平均損失最小準(zhǔn)則、最小平方準(zhǔn)則、最大概率準(zhǔn)則等判別分析法距離判別法Fisher判別法逐步判別法Logistic回歸判別法Bayes判別法距離判別的思想和方法 例:兩個(gè)總體的距離判別問(wèn)題 設(shè)有兩個(gè)總體G1和G2,其均值分別是1和 2, 協(xié)方差矩陣為 對(duì)于一個(gè)新的樣品X,要判斷它來(lái)自哪個(gè)總體 一般的想法是計(jì)算新樣品X到兩個(gè)總體的距離 D2(X,G1)和D2(X,G2),并按照如下判別規(guī)則進(jìn)行判斷其中:對(duì)于多總體的判別,方法類似。都是從已知的數(shù)據(jù)出發(fā),建立判別函數(shù),由判別函數(shù)判斷新樣

10、本所屬類別當(dāng)兩總體靠的很近,無(wú)論用何種辦法,判錯(cuò)概率都很大,這時(shí)做判別分析是沒(méi)有意義的。因此只有當(dāng)兩個(gè)總體的均值有顯著差異時(shí),做判別分析才有意義4、聚類分析概念:統(tǒng)計(jì)學(xué)家常常采用聚類分析來(lái)完成分類的工作。聚類分析是用“物以類聚”的方法將客觀世界中紛紜繁雜的事物加以分門別類,使之系統(tǒng)化和條理化的一種方法。聚類分析事先不知道客觀事物的分類,需要根據(jù)各個(gè)樣本或指標(biāo)的數(shù)量表現(xiàn)來(lái)進(jìn)行聚類種類樣品聚類:基于樣品間的距離將樣本進(jìn)行分類指標(biāo)聚類:基于指標(biāo)間的相關(guān),旨在在每類指標(biāo)中選擇一個(gè)代表性較好的指標(biāo),達(dá)到指標(biāo)精選的目的聚類方法系統(tǒng)聚類法:首先將n個(gè)樣品看成n類,然后將性質(zhì)相近的兩類合并為一個(gè)新類,得n-1

11、類,再?gòu)膎-1類中找出最接近的兩類合并成n-2類,以此類推,最后將所有樣品合并成一類分解法:系統(tǒng)聚類法的逆過(guò)程,首先將所有樣品看成一類,然后用某種最優(yōu)準(zhǔn)則將其分成兩類,再依次用相同的準(zhǔn)則進(jìn)一步裂分,直到每類只有一個(gè)樣品為止加入法:假設(shè)已經(jīng)存在一個(gè)分類系統(tǒng),新樣品進(jìn)入時(shí)只能加入到聚類圖中已存在的分類中,當(dāng)新樣本全部放入后,就得到新的聚類圖有序樣品聚類:將n個(gè)樣品按照某種準(zhǔn)則排序,在聚類的時(shí)候只有相鄰的樣品才能在一類中動(dòng)態(tài)聚類法:開(kāi)始將n個(gè)樣品粗略的分為若干類,然后用某種最優(yōu)準(zhǔn)則對(duì)類別進(jìn)行調(diào)整,直至不能調(diào)整為止最優(yōu)準(zhǔn)則上述5種方法聚類時(shí)都需要某種最優(yōu)準(zhǔn)則,這些最優(yōu)準(zhǔn)則即為描述樣品間接近程度的指標(biāo),

12、接近程度可用p維空間點(diǎn)的距離來(lái)度量常用的定義類與類距離的方法有最短距離法最長(zhǎng)距離法中間距離法可變距離法重心法類平均法S1 .S2.S3 .S4 . .S5 .S6S1 .S2.S3 .S4 . .S5 .S6S1 .S2.S3 .S4 . .S5 .S6例:根據(jù)信息基礎(chǔ)設(shè)施的發(fā)展?fàn)顩r,對(duì)世界20個(gè)國(guó)家和地區(qū)進(jìn)行分類。5、Meta分析Meta分析醫(yī)學(xué)研究中,針對(duì)同一問(wèn)題,不同研究者得到不一樣的結(jié)論,例:阿司匹林是否能降低心肌梗死,為了對(duì)以往的研究結(jié)果綜合評(píng)價(jià),得到更加接近真實(shí)情況的結(jié)果可使用meta分析是一種基于文獻(xiàn)資料的定量化綜合評(píng)價(jià)多個(gè)同類獨(dú)立研究結(jié)果的統(tǒng)計(jì)學(xué)方法,常用于臨床試驗(yàn)、診斷試驗(yàn)和

13、流行病學(xué)研究等方面的綜合評(píng)價(jià)可以將針對(duì)同一問(wèn)題的,多個(gè)獨(dú)立的研究結(jié)果進(jìn)行定量分析。Meta分析應(yīng)用條件收集的資料要全面確定meta分析研究資料的入選標(biāo)準(zhǔn)及排除標(biāo)準(zhǔn)研究資料效應(yīng)指標(biāo)明確各研究的同質(zhì)性Meta分析步驟擬定研究計(jì)劃收集資料根據(jù)入選標(biāo)準(zhǔn)選擇合格的研究復(fù)習(xí)每個(gè)研究并進(jìn)行質(zhì)量評(píng)估提取信息,填寫(xiě)過(guò)錄表,建立數(shù)據(jù)庫(kù)計(jì)算各獨(dú)立研究的效應(yīng)大小異質(zhì)性檢驗(yàn)總結(jié)報(bào)告計(jì)算各獨(dú)立研究的效應(yīng)大小通常兩組間比較時(shí) 連續(xù)變量 平均差值 率差(rate difference) 二分變量 比值比(OR)相對(duì)危險(xiǎn)度(RR)異質(zhì)性檢驗(yàn)(heterogeneity)重要性 Meta分析重要的環(huán)節(jié)目的檢查各個(gè)獨(dú)立研究的結(jié)果是

14、否具有可合并性 產(chǎn)生異質(zhì)性的原因 研究設(shè)計(jì)不同、試驗(yàn)條件不同 試驗(yàn)所定義的暴露、結(jié)局及其測(cè)量方法不同 協(xié)變量的存在注意 資料的“可合并性”研究結(jié)果(線寬表示其95%CI)研究結(jié)果點(diǎn)估計(jì)值,其大小代表該研究在Meta分析中的權(quán)重?zé)o效應(yīng)線各個(gè)研究合并后的效應(yīng)估計(jì))總結(jié)報(bào)告(森林圖) 6、主成分分析在實(shí)證問(wèn)題研究中,為了全面、系統(tǒng)地分析問(wèn)題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為變量。因?yàn)槊總€(gè)變量都在不同程度上反映了所研究問(wèn)題的某些信息,并且指標(biāo)之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計(jì)數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計(jì)方法研究多變量問(wèn)題時(shí),變量太多會(huì)增加計(jì)算量和增加分析問(wèn)題的復(fù)雜性,

15、人們希望在進(jìn)行定量分析的過(guò)程中,涉及的變量較少,得到的信息量較多。主成分分析正是適應(yīng)這一要求產(chǎn)生的,是解決這類題的理想工具。主成分分析和聚類分析 都可以減少原有指標(biāo)(樣品)的個(gè)數(shù),但主成分分析是從原有指標(biāo)出發(fā),尋找?guī)讉€(gè)綜合指標(biāo)(或樣品)來(lái)減少指標(biāo)(或樣品)個(gè)數(shù);而聚類分析是先把原有指標(biāo)(或樣品)聚成幾類,再在某一類指標(biāo)(或樣品)中各挑選一個(gè)典型指標(biāo)(或樣品)來(lái)減少指標(biāo)(或樣品)個(gè)數(shù),兩者是不同的。由于兩者都可以減少指標(biāo)(或樣品)各數(shù),因此兩者都可以和其它統(tǒng)計(jì)分析方法(如判別分析、回歸分析法)結(jié)合使用。 四、常用統(tǒng)計(jì)圖表 統(tǒng)計(jì)表(statistical table)和統(tǒng)計(jì)圖(statistica

16、l chart)是統(tǒng)計(jì)描述的重要工具。醫(yī)學(xué)科學(xué)研究資料經(jīng)過(guò)整理和計(jì)算各種必要的統(tǒng)計(jì)指標(biāo)后,所得結(jié)果除了用適當(dāng)文字說(shuō)明以外,常用統(tǒng)計(jì)表和統(tǒng)計(jì)圖表達(dá)分析結(jié)果。統(tǒng)計(jì)圖表可以對(duì)于數(shù)據(jù)進(jìn)行概括、對(duì)比或做直觀的表達(dá)。統(tǒng)計(jì)表和統(tǒng)計(jì)圖不僅便于閱讀,而且便于分析比較。一、統(tǒng)計(jì)表1概念:指在科技報(bào)告中,常將統(tǒng)計(jì)分析的事物及其指標(biāo)用表格列出,以反映事物的內(nèi)在規(guī)律性和關(guān)聯(lián)性。2作用:1)避免繁雜的文字?jǐn)⑹?)便于計(jì)算3)便于事物間的比較分析3. 統(tǒng)計(jì)表的結(jié)構(gòu) 從外形上看,統(tǒng)計(jì)表由標(biāo)題、標(biāo)目(包括橫標(biāo)目、縱標(biāo)目)、線條、數(shù)字及必要的文字說(shuō)明和備注5部分構(gòu)成。其基本格式如表1: 4.統(tǒng)計(jì)表的種類 根據(jù)說(shuō)明事物的主要標(biāo)志(

17、主語(yǔ))的復(fù)雜程度,統(tǒng)計(jì)表可以分成簡(jiǎn)單表和復(fù)合表。 l)簡(jiǎn)單表:只有一種主要標(biāo)志,即主語(yǔ)按一個(gè)標(biāo)志分組。 2)復(fù)合表:有兩種或兩種以上的標(biāo)志,即主語(yǔ)按多個(gè)標(biāo)志分組。在安排上可以將部分主語(yǔ)放在表的上方與謂語(yǔ)配合起來(lái)。611843合計(jì)321418甲硝唑29425替硝唑合計(jì)未愈治愈分組表2-1 不同藥物治療急性冠周炎效果比較20010025751002575合計(jì)100501733501535B10050842501040A合計(jì)無(wú)效有效合計(jì)無(wú)效有效合計(jì)乙醫(yī)院甲醫(yī)院藥物表2-2 A、B兩種藥物在甲、乙兩醫(yī)院的療效5.編制統(tǒng)計(jì)表的基本要求 1)重點(diǎn)突出,簡(jiǎn)單明了。即一張表只包括一個(gè)中心內(nèi)容,表達(dá)一個(gè)主題。

18、2)主謂分明,層次清楚。即主謂語(yǔ)的位置準(zhǔn)確,標(biāo)目的安排及分組要層次清楚,符合專業(yè)邏輯。簡(jiǎn)單表只有一個(gè)分組標(biāo)志,一般作為橫標(biāo)目,而縱標(biāo)目就是統(tǒng)計(jì)指標(biāo)名稱。復(fù)合表有兩個(gè)以上分組標(biāo)志,一般把其中主要的和分項(xiàng)較多的一個(gè)作為橫標(biāo)目,而其余的則安排在縱標(biāo)目上。 3)數(shù)據(jù)準(zhǔn)確、可靠。6.統(tǒng)計(jì)表的審查與修改 統(tǒng)計(jì)表制作是否良好,可以從以下幾方面檢查:1)標(biāo)題是否正確。2)主謂語(yǔ)的排列是否合適,標(biāo)目是否組合重復(fù)。3)表線是否過(guò)多過(guò)密。 某醫(yī)院對(duì)麥牙根糖漿治療急性慢性肝炎161例的療效,資料如表,指出缺點(diǎn)并加以改進(jìn)。32.95323.63843.57067.1108%例%例%例%例好轉(zhuǎn)近期痊愈小計(jì)無(wú)效有效 效果總

19、例數(shù)缺點(diǎn)是:1)無(wú)標(biāo)題。 2)標(biāo)目組合重復(fù)。 3)主謂語(yǔ)排列不當(dāng)。 100.0161合計(jì)43.570近期痊愈23.638好轉(zhuǎn)32.953無(wú)效百分比(%)例數(shù)療效表12-8 某年某醫(yī)院麥芽根糖漿治療急慢性肝炎的療效觀察二、統(tǒng)計(jì)圖1. 概念:利用點(diǎn)的位置、線段的升降、直條的長(zhǎng)短和面積的大小等各種幾何圖形來(lái)表達(dá)統(tǒng)計(jì)資料和指標(biāo).2. 作用:它將研究對(duì)象的特征、內(nèi)部構(gòu)成、相互關(guān)系、對(duì)比情況、頻數(shù)分布等情況形象而生動(dòng)地表達(dá)出來(lái),更直觀地反映出事物間的數(shù)量關(guān)系,更易于比較和理解。但對(duì)數(shù)量的表達(dá)較粗略,從圖中不能獲得確切數(shù)字。 常用統(tǒng)計(jì)圖條形圖bar chart百分條圖(percentage bar char

20、t)餅圖(pie chart) 線圖(line diagram) 直方圖(histogram) 散點(diǎn)圖(scatter diagram) 箱形圖 box plotQ-Q plotKaplan-Meier生存曲線ROC曲線空間統(tǒng)計(jì)圖條形圖(bar chart) 概念:用等寬直條的長(zhǎng)短來(lái)表示各個(gè)相互獨(dú)立的指標(biāo)大小的圖形。適用資料:相互獨(dú)立的資料(資料有明確分組,不連續(xù))。分類:分為單式和復(fù)式兩種。單式適用于只有一組觀察資料(見(jiàn)圖1),復(fù)式適用于有若干組觀察資料 應(yīng)用:相互獨(dú)立資料間的比較。 百分條圖(percentage bar chart) 概念:以長(zhǎng)條面積為100%,用長(zhǎng)條內(nèi)各段面積所占的百分

21、比來(lái)表示各部分在全體中所占的比例 適用資料:構(gòu)成比資料。應(yīng)用:描述各部分的百分構(gòu)成。餅圖(pie chart) 概念:以一個(gè)圓面積為100%,用圓內(nèi)各扇形面積所占的百分比來(lái)表示各部分所占的構(gòu)成比例 適用資料:構(gòu)成比資料。應(yīng)用:描述各部分的百分構(gòu)成。 線圖(line diagram) 概念:以線段的上升或下降來(lái)表示事物在時(shí)間上的發(fā)展變化或一種現(xiàn)象隨另一種現(xiàn)象變遷的情況 適用資料:連續(xù)性資料。應(yīng)用:反映事物的連續(xù)的動(dòng)態(tài)變化規(guī)律。 直方圖(histogram) 概念:以各矩形的面積來(lái)代表各組頻數(shù)的多少。適用資料:連續(xù)變量的頻數(shù)分布。應(yīng)用:反應(yīng)某一連續(xù)性變量的分布情況散點(diǎn)圖(scatter diagr

22、am) 概念:以點(diǎn)的密集程度和趨勢(shì)來(lái)表示兩種現(xiàn)象的相關(guān)關(guān)系。適用資料:雙變量資料。應(yīng)用:反映兩事物間的相關(guān)關(guān)系,主要用于相關(guān)回歸分析。 箱形圖 box plot概念:一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計(jì)圖。因形狀如箱子而得名。適用資料:連續(xù)性變量應(yīng)用:顯示出一組數(shù)據(jù)的最大值、最小值、中位數(shù)、下四分位數(shù)、上四分位數(shù)和異常值,識(shí)別數(shù)據(jù)異常值,判斷數(shù)據(jù)偏態(tài)。Q-Q plotQQ圖是一種通過(guò)畫(huà)出分位數(shù)來(lái)比較兩個(gè)概率分布的圖形方法作用:用于直觀驗(yàn)證一組數(shù)據(jù)是否來(lái)自某個(gè)分布,或者驗(yàn)證某兩組數(shù)據(jù)是否來(lái)自同一(族)分布判斷標(biāo)準(zhǔn):散點(diǎn)落在參考直線附近則服從某一分布,如果被比較的兩個(gè)分布比較相似,則其QQ圖近似地位于y=x上。如果兩個(gè)分布線性相關(guān),則QQ圖上的點(diǎn)近似地落在一條直線上,但并不一定是y=x這條線。適用資料:連續(xù)性變量Kaplan-Meier生存曲線概念:以生存時(shí)間為橫坐標(biāo),生存率為縱坐標(biāo)繪制的階梯狀生存曲線描述:隨時(shí)間的增加,該曲線一般呈下降趨勢(shì),平緩的生存曲線表示高生存率或較長(zhǎng)生存期,陡峭的生存曲線表示低生存率或較短生存期適用資料:生存時(shí)間數(shù)據(jù)ROC曲線概念:受試者工作特征曲線 (receiver operating characteristic curve,簡(jiǎn)稱ROC曲線)是根據(jù)一系列不同的二分類方式,以真陽(yáng)性率(靈

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論