統(tǒng)計(jì)學(xué)名稱解釋_第1頁
統(tǒng)計(jì)學(xué)名稱解釋_第2頁
統(tǒng)計(jì)學(xué)名稱解釋_第3頁
統(tǒng)計(jì)學(xué)名稱解釋_第4頁
統(tǒng)計(jì)學(xué)名稱解釋_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章一、名詞解釋1、參數(shù)(parameter):也叫參變量,是一個(gè)變量。如果我們引入一個(gè)或一些另外的變量來描述自變量與因變量的變化,引入的變量本來并不是當(dāng)前問題必須研究的變量,我們把這樣的變量叫做參變量或參數(shù)。描述總體特征的概括性數(shù)字度量,它是研究者想要了解的總體的某種特征值。2、統(tǒng)計(jì)量(statistic):描述樣本特征的數(shù),是統(tǒng)計(jì)理論中用來對(duì)數(shù)據(jù)進(jìn)行分析、檢驗(yàn)的變量。3、總體(population):根據(jù)研究目的確定的研究對(duì)象的全體。當(dāng)研究有具體而明確的指標(biāo)時(shí),總體是指該項(xiàng)變量值的全體。4、樣本 (sample):從總體中隨機(jī)抽取的部分觀察單位,總體中有代表性的一部分。5、同質(zhì) (hom

2、ogeneity):是指觀察單位(研究個(gè)體)間被研究指標(biāo)的影響因素相同。6、變異 (variation):同質(zhì)事物個(gè)體間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。7、 概率 (probability):度量隨機(jī)事件發(fā)生可能性大小的一個(gè)數(shù)值,是一個(gè)在0到1之間的實(shí)數(shù)。8、 抽樣誤差 (sampling error):由于抽樣所造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差別。三、簡(jiǎn)答題1、 統(tǒng)計(jì)學(xué)的基本步驟有哪些?設(shè)計(jì)、搜集、整理、分析資料2、 總體與樣本的區(qū)別與關(guān)系?區(qū)別:總體:根據(jù)研究目的確定的研究對(duì)象的全體。當(dāng)研究有具體而明確的指標(biāo)時(shí),總體是指該項(xiàng)變量值的全體。樣本:總體中有代表性的一部分

3、。聯(lián)系:總體包含樣本,樣本是總體中的一部分3、 抽樣誤差產(chǎn)生的原因有哪些?可以避免抽樣誤差嗎?產(chǎn)生原因: (1)總體單位的標(biāo)志值的差異程度。 差異程度愈大則抽樣誤差愈大,反之則愈小。 (2)樣本單位數(shù)的多少。 在其他條件相同的情況下,樣本單位數(shù)愈多,則抽樣誤差愈小。 (3)抽樣方法。 抽樣方法不同,抽樣誤差也不相同。一般說,重復(fù)抽樣比不重復(fù)抽樣,誤差要大些。 (4)抽樣調(diào)查的組織形式。 抽樣調(diào)查的組織形式不同,其抽樣誤差也不相同,而且同一組織形式的合理程度也會(huì)影響抽樣誤差。不可以,它具有不可避免性,只能減少抽樣誤差4、 何為概率及小概率事件?概率:度量隨機(jī)事件發(fā)生可能性大小的一個(gè)數(shù)值,是一個(gè)在

4、0到1之間的實(shí)數(shù)。小概率事件:統(tǒng)計(jì)分析中的很多結(jié)論都基于一定置信程度下的概率推斷,習(xí)慣上將 p(A)0.05 或 0.01 稱為小概率事件,認(rèn)為小概率事件在一次試驗(yàn)中不可能發(fā)生。第二章第三章1. 正態(tài)分布 (normal distribution):也叫高斯分布(Gaussian distribution),一種最常見、最重要的連續(xù)型對(duì)稱分布(正態(tài)分布是對(duì)稱分布,但對(duì)稱分布不一定是正態(tài)分布)2. 中位數(shù) (median):是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。 3. 四分位數(shù)間距 (quartile interval):是上四分位數(shù)與下四分位數(shù)之差,用四

5、分位數(shù)間距可反映變異程度的大小.即:Q3 -Q14. 方差 (variance):樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。反映一組數(shù)據(jù)的平均離散水平。5. 正偏態(tài)分布 (positively skewed distribution):也稱右偏態(tài)分布,右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾 6. 負(fù)偏態(tài)分布 (negatively skewed distribution):左偏態(tài)分布,左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾 7. 對(duì)數(shù)正態(tài)分布 (logarithmic normal distribution ):對(duì)數(shù)為正態(tài)分布的任意隨機(jī)變量的概率分布。如果 X 是

6、正態(tài)分布的隨機(jī)變量,則 exp(X) 為對(duì)數(shù)分布;同樣,如果 Y 是對(duì)數(shù)正態(tài)分布,則 log(Y) 為正態(tài)分布。8. 醫(yī)學(xué)參考值范圍 (medical reference range):指絕大多數(shù)正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動(dòng)范圍。最常用的是95%參考值范圍。三、簡(jiǎn)答題1. 描述數(shù)值變量資料集中趨勢(shì)的指標(biāo)有哪些?其適用范圍有何異同?平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。 不同的分布使用不同的指標(biāo) (算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料 幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料 中位數(shù) :一般偏態(tài)分布(傳染病發(fā)病的潛伏期)2. 描

7、述數(shù)值變量資料離散趨勢(shì)的指標(biāo)有哪些?其適用范圍有何異同?反映數(shù)據(jù)的離散度( Dispersion )。即個(gè)體觀察值的變異(variation)程度。常用的指標(biāo)有: 1. 極差(Range) (全距) 適用范圍:任何計(jì)量資料;是參考變異指標(biāo) 2. 百分位數(shù)與四分位數(shù)間距 Percentile and Quartile range百分位數(shù):適用范圍廣泛,可用于偏態(tài)資料,分布不明的資料和分布兩端無確定值的資料四分位數(shù)間距:常用于描述偏態(tài)分布資料的離散程度,值越大變異程度越大,中位數(shù)與四分位間距一起使用,描述偏態(tài)分布資料的特征。 3. 方差 Variance正態(tài)分布資料 4. 標(biāo)準(zhǔn)差Standard

8、Deviation適用范圍:均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時(shí)用來描述正態(tài)分布資料的集中和離散趨勢(shì)。 5. 變異系數(shù) Coefficient of Variation適用范圍:主要用于單位不同或均數(shù)相差懸殊資料3. 醫(yī)學(xué)中參考值范圍的涵義是什么?確定的步驟和方法是什么?醫(yī)學(xué)參考值范圍 :指絕大多數(shù)正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動(dòng)范圍。最常用的是95%參考值范圍。步驟與方法:1). 確定“正常人”對(duì)象的范圍:即根據(jù)研究目的確定的未患被研究疾病的個(gè)體。2). 統(tǒng)一測(cè)定標(biāo)準(zhǔn):即檢驗(yàn)用的試劑批號(hào)、儀器、人員、條件等應(yīng)相同。3). 確定分組:一般需用年齡、性別等對(duì)“正常人”對(duì)象進(jìn)行

9、分組,分組特征也可根據(jù)檢驗(yàn)判斷。4). 樣本含量確定:一般來講,正態(tài)分布資料所需的樣本含量應(yīng)在100以上,偏態(tài)或未知分布時(shí)樣本含量應(yīng)更大。5). 確定參考值范圍的單雙側(cè):一般生理物質(zhì)指標(biāo)多為雙側(cè)、毒物指標(biāo)則多為單側(cè)。6). 確定百分位點(diǎn):一般取95%或99%。第四章第五章一、名詞解釋1 標(biāo)準(zhǔn)誤(standard error):表示樣本統(tǒng)計(jì)量抽樣誤差大小的統(tǒng)計(jì)指標(biāo),統(tǒng)計(jì)上通常將統(tǒng)計(jì)量(如樣本均數(shù)、樣本率p等)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。 2 可信區(qū)間(confidence interval):按一定的概率或可信度(1-)用一個(gè)區(qū)間來估計(jì)總體參數(shù)所在的范圍,該范圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間(con

10、fidenceinterval,CI),預(yù)先給定的概率(1-)稱為可信度或者置信度(confidencelevel),常取95%或99%。3 假設(shè)檢驗(yàn)(hypothesis testing):利用樣本提供的信息判斷假設(shè)是否成立的統(tǒng)計(jì)方法稱為統(tǒng)計(jì)假設(shè)檢驗(yàn)。4 統(tǒng)計(jì)推斷(statistical inference):用一個(gè)或一系列樣本的結(jié)果去估計(jì)總體可能的結(jié)果的過程。包括假設(shè)檢驗(yàn)和參數(shù)估計(jì)。5 型錯(cuò)誤(type I error):“實(shí)際無差別,但下了有差別的結(jié)論”,假陽性錯(cuò)誤。犯這種錯(cuò)誤的概率是a(其值等于檢驗(yàn)水準(zhǔn))6 型錯(cuò)誤(type II error): “實(shí)際有差別,但下了不拒絕H0的結(jié)論”

11、,假陰性錯(cuò)誤。犯這種錯(cuò)誤的概率是b(其值未知) 7 檢驗(yàn)效能(power of test):當(dāng)兩總體確有差別,按檢驗(yàn)水準(zhǔn) a 所能發(fā)現(xiàn)這種差別的能力。8 變量變換 (variable transformation):也稱變量代換,是將原始數(shù)據(jù)作某種函數(shù)轉(zhuǎn)換,如轉(zhuǎn)換為對(duì)數(shù)值。三、簡(jiǎn)答題1 假設(shè)檢驗(yàn)的基本原理和步驟。假設(shè)檢驗(yàn)過去稱顯著性檢驗(yàn)。它是利用小概率反證法,從問題的對(duì)立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,最后獲得P值來判斷。1. 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)(選用單側(cè)或雙側(cè)檢驗(yàn)) (1)無效假設(shè)(null hypothesis)零假設(shè),記為

12、H0; (2)備擇假設(shè)又稱對(duì)立假設(shè),記為H1。 2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量 根據(jù)變量和資料類型、設(shè)計(jì)方案、統(tǒng)計(jì)推斷的目的、是否滿足特定條件等(如數(shù)據(jù)的分布類型)選擇相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。 3. 確定P值,下結(jié)論。選定顯著性水平的值,P,拒絕H0,接受H1 ,下“有差別”的結(jié)論。P不拒絕H0,但不能下“無差別”或“相等”的結(jié)論,只能下“根據(jù)目前試驗(yàn)結(jié)果,尚不能認(rèn)為有差別”的結(jié)論。 2 標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的異同。相同點(diǎn):都是用來表示變異程度的,均是反映隨機(jī)誤差的。區(qū)別:標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的意義、作用和使用范圍均不同。標(biāo)準(zhǔn)差(亦稱單數(shù)標(biāo)準(zhǔn)差) 一般用SD 表示,是表示個(gè)體間變異大小的指標(biāo),反映了整個(gè)樣本對(duì)樣本平均數(shù)的

13、離散程度,是數(shù)據(jù)精密度的衡量指標(biāo);而標(biāo)準(zhǔn)誤一般用SE 表示,反映樣本平均數(shù)對(duì)總體平均數(shù)的變異程度,從而反映抽樣誤差,是量度結(jié)果精密度的指標(biāo)。標(biāo)準(zhǔn)差是最常用的統(tǒng)計(jì)量, 一般用于表示一組樣本變量的分散程度;標(biāo)準(zhǔn)誤一般用于統(tǒng)計(jì)推斷中,主要包括假設(shè)檢驗(yàn)和參數(shù)估計(jì),如樣本平均數(shù)的假設(shè)檢驗(yàn)、參數(shù)的區(qū)間估計(jì)與點(diǎn)估計(jì)等。3 參考值范圍和置信區(qū)間有何區(qū)別?參考值范圍是指具有明確背景資料的參考人群某項(xiàng)指標(biāo)的測(cè)定值,例如醫(yī)學(xué)參考范圍指包括絕大多數(shù)的正常人的人體形態(tài),功能和代謝產(chǎn)物等,表示值時(shí)可能有單側(cè)也可能有雙側(cè),表示方法為正態(tài)分布或百分位數(shù)法.置信區(qū)間是指在做區(qū)間的估計(jì)時(shí)指按一定的概率(1-a)估計(jì)總體參數(shù)所在的

14、范圍,其中(1-a)被稱為置信度,兩者的不同之處在于前者是對(duì)于某種指標(biāo)的估計(jì),后者是對(duì)參數(shù)的估計(jì)。置信區(qū)間與參考值范圍的意義、計(jì)算公式和用途均不同。 1.從意義來看 95參考值范圍是指同質(zhì)總體內(nèi)包括95個(gè)體值的估計(jì)范圍,而總體均數(shù)95可信區(qū)間是指按95可信度估計(jì)的總體均數(shù)的所在范圍。 2.從計(jì)算公式看若指標(biāo)服從正態(tài)分布,95參考值范圍的公式是:1.96s。 總體均數(shù)95可信區(qū)間的公式是:未知的小樣本 未知的大樣本前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。前者用1.96,后者用為0.05,自由度為v的t或u界值。4 t 檢驗(yàn)和方差分析的基本思想各是什么?二者的區(qū)別是什么?t 檢驗(yàn)(假設(shè)檢驗(yàn)的一種):假設(shè)檢驗(yàn)的

15、基本思想是小概率反證法思想。小概率思想是指小概率事件(P0.01或P0.05)在一次試驗(yàn)中基本上不會(huì)發(fā)生。反證法思想是先提出假設(shè)(檢驗(yàn)假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè)不成立,若可能性大,則還不能認(rèn)為假設(shè)不成立。方差分析的基本思想是根據(jù)資料設(shè)計(jì)的類型及研究目的,可將總變異分解為兩個(gè)或多個(gè)部分,每個(gè)部分的變異可由某因素的作用來解釋。通過比較可能由某因素所至的變異與隨機(jī)誤差,即可了解該因素對(duì)測(cè)定結(jié)果有無影響。區(qū)別:t檢驗(yàn)可用于2個(gè)樣本均數(shù)差異的顯著性檢驗(yàn),但不適于多組均數(shù)的檢驗(yàn)。方差分析是判斷多組( 3 )數(shù)據(jù)之間均數(shù)差異是否顯著的一種假設(shè)檢驗(yàn)方法。 5

16、、 t 檢驗(yàn)和t 檢驗(yàn)的應(yīng)用條件有何異同?t 檢驗(yàn):樣本含量n較小時(shí)(如n5, 且有p0.5時(shí),二項(xiàng)分布可看成近似正態(tài)分布。Poisson 分布:它是普通二項(xiàng)分布在次數(shù)極大,發(fā)生機(jī)率很小時(shí)的極限,記作,越大則Poisson分布漸近正態(tài)分布。實(shí)際應(yīng)用上,20就可將其看作是正態(tài)分布。第6章 分類資料的統(tǒng)計(jì)描述一、名詞解釋1、 率(rate):是說明某事物(或現(xiàn)象)發(fā)生的頻率或強(qiáng)度的指標(biāo)。2、 構(gòu)成比(constituent ratio):是說明某事物內(nèi)部各組成部分的比重或分布的指標(biāo)。3、 相對(duì)比(relative ratio):是說明兩個(gè)有關(guān)聯(lián)的事物間的相對(duì)關(guān)系的指標(biāo)。4、 標(biāo)準(zhǔn)化率(standa

17、rdized rate):也稱調(diào)整率,是多組率之間按統(tǒng)一的“標(biāo)準(zhǔn)”進(jìn)行調(diào)整,使之具有可比性的率。5、 標(biāo)化發(fā)病比(standardized incidence ratio):被標(biāo)化組實(shí)際發(fā)病數(shù)與預(yù)期發(fā)病數(shù)之比。6、 標(biāo)化死亡比(standardized mortality ratio):被標(biāo)化組實(shí)際死亡(發(fā)病、患病等)數(shù)與預(yù)期死亡(發(fā)病、患病等)數(shù)之比。第7章 二項(xiàng)分布與Poisson分布及其應(yīng)用第8章 X2檢驗(yàn)第9章 秩和檢驗(yàn)3、 簡(jiǎn)答題1、 二項(xiàng)分布、Poisson分布與正態(tài)分布間有何關(guān)系?2、 X2檢驗(yàn)的應(yīng)用條件有哪些? (1)四格表的分析方法選擇條件: n40,T5,專用公式; n40

18、,1T5,校正公式; n40或T1,直接計(jì)算概率。X2連續(xù)性校正僅用于v=1的四格表資料,當(dāng)v2時(shí),一般不作校正。 (2)配對(duì)四格表的分析分析方法選擇條件: b+c40,專用公式; 20b+c40,用校正公式; b+c20,二項(xiàng)分布直接計(jì)算概率。 (3)RC表的分析方法選擇條件: 1.理論數(shù)不能小于1; 2.理論數(shù)大于等于1小于5的格子數(shù)不超過總格子數(shù)的1/5; 3.否則用Fisher確切概率,或似然比檢驗(yàn)。 4.如果以上條件不能滿足,可采用:增加樣本含量;刪去某行或某列;合理地合并部分行或列;Fisher精確概率法。 5.多個(gè)率或構(gòu)成比比較的X2檢驗(yàn),結(jié)論為拒絕H0時(shí),僅表示幾組有差別,并非任兩組之間都有差別。若要了解之,可進(jìn)行多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論