統(tǒng)計(jì)學(xué)名稱解釋

上傳人：無*** IP屬地：河北上傳時(shí)間：2020-06-22 格式：DOC 頁數(shù)：7 大小：154KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章一、名詞解釋1、參數(shù)(parameter)：也叫參變量，是一個(gè)變量。如果我們引入一個(gè)或一些另外的變量來描述自變量與因變量的變化，引入的變量本來并不是當(dāng)前問題必須研究的變量，我們把這樣的變量叫做參變量或參數(shù)。描述總體特征的概括性數(shù)字度量，它是研究者想要了解的總體的某種特征值。2、統(tǒng)計(jì)量(statistic)：描述樣本特征的數(shù)，是統(tǒng)計(jì)理論中用來對(duì)數(shù)據(jù)進(jìn)行分析、檢驗(yàn)的變量。3、總體(population)：根據(jù)研究目的確定的研究對(duì)象的全體。當(dāng)研究有具體而明確的指標(biāo)時(shí)，總體是指該項(xiàng)變量值的全體。4、樣本 (sample)：從總體中隨機(jī)抽取的部分觀察單位，總體中有代表性的一部分。5、同質(zhì) (hom

2、ogeneity)：是指觀察單位（研究個(gè)體）間被研究指標(biāo)的影響因素相同。6、變異 (variation)：同質(zhì)事物個(gè)體間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。7、概率 (probability)：度量隨機(jī)事件發(fā)生可能性大小的一個(gè)數(shù)值，是一個(gè)在0到1之間的實(shí)數(shù)。8、抽樣誤差 (sampling error)：由于抽樣所造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差別。三、簡(jiǎn)答題1、統(tǒng)計(jì)學(xué)的基本步驟有哪些？設(shè)計(jì)、搜集、整理、分析資料2、總體與樣本的區(qū)別與關(guān)系？區(qū)別：總體：根據(jù)研究目的確定的研究對(duì)象的全體。當(dāng)研究有具體而明確的指標(biāo)時(shí)，總體是指該項(xiàng)變量值的全體。樣本：總體中有代表性的一部分

3、。聯(lián)系：總體包含樣本，樣本是總體中的一部分3、抽樣誤差產(chǎn)生的原因有哪些？可以避免抽樣誤差嗎？產(chǎn)生原因: (1)總體單位的標(biāo)志值的差異程度。差異程度愈大則抽樣誤差愈大，反之則愈小。 (2)樣本單位數(shù)的多少。在其他條件相同的情況下，樣本單位數(shù)愈多，則抽樣誤差愈小。 (3)抽樣方法。抽樣方法不同，抽樣誤差也不相同。一般說，重復(fù)抽樣比不重復(fù)抽樣，誤差要大些。 (4)抽樣調(diào)查的組織形式。抽樣調(diào)查的組織形式不同，其抽樣誤差也不相同，而且同一組織形式的合理程度也會(huì)影響抽樣誤差。不可以，它具有不可避免性，只能減少抽樣誤差4、何為概率及小概率事件？概率：度量隨機(jī)事件發(fā)生可能性大小的一個(gè)數(shù)值，是一個(gè)在

4、0到1之間的實(shí)數(shù)。小概率事件：統(tǒng)計(jì)分析中的很多結(jié)論都基于一定置信程度下的概率推斷，習(xí)慣上將 p（A）0.05 或 0.01 稱為小概率事件，認(rèn)為小概率事件在一次試驗(yàn)中不可能發(fā)生。第二章第三章1. 正態(tài)分布 (normal distribution)：也叫高斯分布（Gaussian distribution），一種最常見、最重要的連續(xù)型對(duì)稱分布（正態(tài)分布是對(duì)稱分布，但對(duì)稱分布不一定是正態(tài)分布）2. 中位數(shù) (median)：是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值，反映一批觀察值在位次上的平均水平。 3. 四分位數(shù)間距 (quartile interval)：是上四分位數(shù)與下四分位數(shù)之差,用四

5、分位數(shù)間距可反映變異程度的大小.即：Q3 -Q14. 方差 (variance)：樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。反映一組數(shù)據(jù)的平均離散水平。5. 正偏態(tài)分布 (positively skewed distribution)：也稱右偏態(tài)分布，右側(cè)的組段數(shù)多于左側(cè)的組段數(shù)，頻數(shù)向右側(cè)拖尾 6. 負(fù)偏態(tài)分布 (negatively skewed distribution)：左偏態(tài)分布，左側(cè)的組段數(shù)多于右側(cè)的組段數(shù)，頻數(shù)向左側(cè)拖尾 7. 對(duì)數(shù)正態(tài)分布 (logarithmic normal distribution )：對(duì)數(shù)為正態(tài)分布的任意隨機(jī)變量的概率分布。如果 X 是

6、正態(tài)分布的隨機(jī)變量，則 exp(X) 為對(duì)數(shù)分布；同樣，如果 Y 是對(duì)數(shù)正態(tài)分布，則 log(Y) 為正態(tài)分布。8. 醫(yī)學(xué)參考值范圍 (medical reference range)：指絕大多數(shù)正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動(dòng)范圍。最常用的是95%參考值范圍。三、簡(jiǎn)答題1. 描述數(shù)值變量資料集中趨勢(shì)的指標(biāo)有哪些？其適用范圍有何異同？平均數(shù)：描述一組變量值的集中位置或平均水平的指標(biāo)體系。不同的分布使用不同的指標(biāo) (算術(shù))均數(shù)：正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料幾何均數(shù)：對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料中位數(shù) ：一般偏態(tài)分布（傳染病發(fā)病的潛伏期）2. 描

7、述數(shù)值變量資料離散趨勢(shì)的指標(biāo)有哪些？其適用范圍有何異同？反映數(shù)據(jù)的離散度（ Dispersion ）。即個(gè)體觀察值的變異（variation）程度。常用的指標(biāo)有： 1. 極差(Range） (全距) 適用范圍：任何計(jì)量資料；是參考變異指標(biāo) 2. 百分位數(shù)與四分位數(shù)間距 Percentile and Quartile range百分位數(shù)：適用范圍廣泛，可用于偏態(tài)資料，分布不明的資料和分布兩端無確定值的資料四分位數(shù)間距：常用于描述偏態(tài)分布資料的離散程度，值越大變異程度越大，中位數(shù)與四分位間距一起使用，描述偏態(tài)分布資料的特征。 3. 方差 Variance正態(tài)分布資料 4. 標(biāo)準(zhǔn)差Standard

8、Deviation適用范圍：均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時(shí)用來描述正態(tài)分布資料的集中和離散趨勢(shì)。 5. 變異系數(shù) Coefficient of Variation適用范圍：主要用于單位不同或均數(shù)相差懸殊資料3. 醫(yī)學(xué)中參考值范圍的涵義是什么？確定的步驟和方法是什么？醫(yī)學(xué)參考值范圍：指絕大多數(shù)正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動(dòng)范圍。最常用的是95%參考值范圍。步驟與方法：1）. 確定“正常人”對(duì)象的范圍：即根據(jù)研究目的確定的未患被研究疾病的個(gè)體。2）. 統(tǒng)一測(cè)定標(biāo)準(zhǔn)：即檢驗(yàn)用的試劑批號(hào)、儀器、人員、條件等應(yīng)相同。3）. 確定分組：一般需用年齡、性別等對(duì)“正常人”對(duì)象進(jìn)行

9、分組，分組特征也可根據(jù)檢驗(yàn)判斷。4）. 樣本含量確定：一般來講，正態(tài)分布資料所需的樣本含量應(yīng)在100以上，偏態(tài)或未知分布時(shí)樣本含量應(yīng)更大。5）. 確定參考值范圍的單雙側(cè)：一般生理物質(zhì)指標(biāo)多為雙側(cè)、毒物指標(biāo)則多為單側(cè)。6）. 確定百分位點(diǎn)：一般取95%或99%。第四章第五章一、名詞解釋1 標(biāo)準(zhǔn)誤(standard error)：表示樣本統(tǒng)計(jì)量抽樣誤差大小的統(tǒng)計(jì)指標(biāo)，統(tǒng)計(jì)上通常將統(tǒng)計(jì)量（如樣本均數(shù)、樣本率p等）的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。 2 可信區(qū)間(confidence interval)：按一定的概率或可信度(1-)用一個(gè)區(qū)間來估計(jì)總體參數(shù)所在的范圍,該范圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間(con

10、fidenceinterval,CI),預(yù)先給定的概率(1-)稱為可信度或者置信度(confidencelevel),常取95%或99%。3 假設(shè)檢驗(yàn)(hypothesis testing)：利用樣本提供的信息判斷假設(shè)是否成立的統(tǒng)計(jì)方法稱為統(tǒng)計(jì)假設(shè)檢驗(yàn)。4 統(tǒng)計(jì)推斷(statistical inference)：用一個(gè)或一系列樣本的結(jié)果去估計(jì)總體可能的結(jié)果的過程。包括假設(shè)檢驗(yàn)和參數(shù)估計(jì)。5 型錯(cuò)誤(type I error)：“實(shí)際無差別，但下了有差別的結(jié)論”，假陽性錯(cuò)誤。犯這種錯(cuò)誤的概率是a（其值等于檢驗(yàn)水準(zhǔn)）6 型錯(cuò)誤(type II error)： “實(shí)際有差別，但下了不拒絕H0的結(jié)論”

11、，假陰性錯(cuò)誤。犯這種錯(cuò)誤的概率是b（其值未知） 7 檢驗(yàn)效能(power of test)：當(dāng)兩總體確有差別，按檢驗(yàn)水準(zhǔn) a 所能發(fā)現(xiàn)這種差別的能力。8 變量變換 (variable transformation)：也稱變量代換，是將原始數(shù)據(jù)作某種函數(shù)轉(zhuǎn)換，如轉(zhuǎn)換為對(duì)數(shù)值。三、簡(jiǎn)答題1 假設(shè)檢驗(yàn)的基本原理和步驟。假設(shè)檢驗(yàn)過去稱顯著性檢驗(yàn)。它是利用小概率反證法，從問題的對(duì)立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量，最后獲得P值來判斷。1. 建立檢驗(yàn)假設(shè)，確定檢驗(yàn)水準(zhǔn)（選用單側(cè)或雙側(cè)檢驗(yàn)）（1）無效假設(shè)（null hypothesis）零假設(shè)，記為

12、H0；（2）備擇假設(shè)又稱對(duì)立假設(shè)，記為H1。 2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)變量和資料類型、設(shè)計(jì)方案、統(tǒng)計(jì)推斷的目的、是否滿足特定條件等（如數(shù)據(jù)的分布類型）選擇相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。 3. 確定P值，下結(jié)論。選定顯著性水平的值，P，拒絕H0，接受H1 ，下“有差別”的結(jié)論。P不拒絕H0，但不能下“無差別”或“相等”的結(jié)論，只能下“根據(jù)目前試驗(yàn)結(jié)果，尚不能認(rèn)為有差別”的結(jié)論。 2 標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的異同。相同點(diǎn)：都是用來表示變異程度的，均是反映隨機(jī)誤差的。區(qū)別：標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的意義、作用和使用范圍均不同。標(biāo)準(zhǔn)差(亦稱單數(shù)標(biāo)準(zhǔn)差) 一般用SD 表示,是表示個(gè)體間變異大小的指標(biāo),反映了整個(gè)樣本對(duì)樣本平均數(shù)的

13、離散程度,是數(shù)據(jù)精密度的衡量指標(biāo);而標(biāo)準(zhǔn)誤一般用SE 表示,反映樣本平均數(shù)對(duì)總體平均數(shù)的變異程度,從而反映抽樣誤差,是量度結(jié)果精密度的指標(biāo)。標(biāo)準(zhǔn)差是最常用的統(tǒng)計(jì)量, 一般用于表示一組樣本變量的分散程度;標(biāo)準(zhǔn)誤一般用于統(tǒng)計(jì)推斷中,主要包括假設(shè)檢驗(yàn)和參數(shù)估計(jì),如樣本平均數(shù)的假設(shè)檢驗(yàn)、參數(shù)的區(qū)間估計(jì)與點(diǎn)估計(jì)等。3 參考值范圍和置信區(qū)間有何區(qū)別？參考值范圍是指具有明確背景資料的參考人群某項(xiàng)指標(biāo)的測(cè)定值,例如醫(yī)學(xué)參考范圍指包括絕大多數(shù)的正常人的人體形態(tài),功能和代謝產(chǎn)物等,表示值時(shí)可能有單側(cè)也可能有雙側(cè),表示方法為正態(tài)分布或百分位數(shù)法.置信區(qū)間是指在做區(qū)間的估計(jì)時(shí)指按一定的概率(1-a)估計(jì)總體參數(shù)所在的

14、范圍,其中(1-a)被稱為置信度,兩者的不同之處在于前者是對(duì)于某種指標(biāo)的估計(jì),后者是對(duì)參數(shù)的估計(jì)。置信區(qū)間與參考值范圍的意義、計(jì)算公式和用途均不同。 1.從意義來看 95參考值范圍是指同質(zhì)總體內(nèi)包括95個(gè)體值的估計(jì)范圍，而總體均數(shù)95可信區(qū)間是指按95可信度估計(jì)的總體均數(shù)的所在范圍。 2.從計(jì)算公式看若指標(biāo)服從正態(tài)分布，95參考值范圍的公式是：1.96s。總體均數(shù)95可信區(qū)間的公式是：未知的小樣本未知的大樣本前者用標(biāo)準(zhǔn)差，后者用標(biāo)準(zhǔn)誤。前者用1.96，后者用為0.05，自由度為v的t或u界值。4 t 檢驗(yàn)和方差分析的基本思想各是什么？二者的區(qū)別是什么？t 檢驗(yàn)（假設(shè)檢驗(yàn)的一種）：假設(shè)檢驗(yàn)的

15、基本思想是小概率反證法思想。小概率思想是指小概率事件（P0.01或P0.05）在一次試驗(yàn)中基本上不會(huì)發(fā)生。反證法思想是先提出假設(shè)(檢驗(yàn)假設(shè)H0)，再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小，如可能性小,則認(rèn)為假設(shè)不成立，若可能性大，則還不能認(rèn)為假設(shè)不成立。方差分析的基本思想是根據(jù)資料設(shè)計(jì)的類型及研究目的，可將總變異分解為兩個(gè)或多個(gè)部分，每個(gè)部分的變異可由某因素的作用來解釋。通過比較可能由某因素所至的變異與隨機(jī)誤差，即可了解該因素對(duì)測(cè)定結(jié)果有無影響。區(qū)別：t檢驗(yàn)可用于2個(gè)樣本均數(shù)差異的顯著性檢驗(yàn)，但不適于多組均數(shù)的檢驗(yàn)。方差分析是判斷多組（ 3 ）數(shù)據(jù)之間均數(shù)差異是否顯著的一種假設(shè)檢驗(yàn)方法。 5

16、、 t 檢驗(yàn)和t 檢驗(yàn)的應(yīng)用條件有何異同？t 檢驗(yàn)：樣本含量n較小時(shí)(如n5，且有p0.5時(shí)，二項(xiàng)分布可看成近似正態(tài)分布。Poisson 分布：它是普通二項(xiàng)分布在次數(shù)極大，發(fā)生機(jī)率很小時(shí)的極限，記作，越大則Poisson分布漸近正態(tài)分布。實(shí)際應(yīng)用上，20就可將其看作是正態(tài)分布。第6章分類資料的統(tǒng)計(jì)描述一、名詞解釋1、率（rate）：是說明某事物（或現(xiàn)象）發(fā)生的頻率或強(qiáng)度的指標(biāo)。2、構(gòu)成比（constituent ratio)：是說明某事物內(nèi)部各組成部分的比重或分布的指標(biāo)。3、相對(duì)比（relative ratio)：是說明兩個(gè)有關(guān)聯(lián)的事物間的相對(duì)關(guān)系的指標(biāo)。4、標(biāo)準(zhǔn)化率（standa

17、rdized rate)：也稱調(diào)整率，是多組率之間按統(tǒng)一的“標(biāo)準(zhǔn)”進(jìn)行調(diào)整，使之具有可比性的率。5、標(biāo)化發(fā)病比（standardized incidence ratio)：被標(biāo)化組實(shí)際發(fā)病數(shù)與預(yù)期發(fā)病數(shù)之比。6、標(biāo)化死亡比（standardized mortality ratio)：被標(biāo)化組實(shí)際死亡（發(fā)病、患病等）數(shù)與預(yù)期死亡（發(fā)病、患病等）數(shù)之比。第7章二項(xiàng)分布與Poisson分布及其應(yīng)用第8章 X2檢驗(yàn)第9章秩和檢驗(yàn)3、簡(jiǎn)答題1、二項(xiàng)分布、Poisson分布與正態(tài)分布間有何關(guān)系？2、 X2檢驗(yàn)的應(yīng)用條件有哪些？（1）四格表的分析方法選擇條件： n40，T5，專用公式； n40

18、，1T5，校正公式； n40或T1，直接計(jì)算概率。X2連續(xù)性校正僅用于v=1的四格表資料，當(dāng)v2時(shí)，一般不作校正。（2）配對(duì)四格表的分析分析方法選擇條件： b+c40，專用公式； 20b+c40，用校正公式； b+c20，二項(xiàng)分布直接計(jì)算概率。（3）RC表的分析方法選擇條件： 1.理論數(shù)不能小于1； 2.理論數(shù)大于等于1小于5的格子數(shù)不超過總格子數(shù)的1/5； 3.否則用Fisher確切概率，或似然比檢驗(yàn)。 4.如果以上條件不能滿足，可采用：增加樣本含量；刪去某行或某列；合理地合并部分行或列；Fisher精確概率法。 5.多個(gè)率或構(gòu)成比比較的X2檢驗(yàn)，結(jié)論為拒絕H0時(shí)，僅表示幾組有差別，并非任兩組之間都有差別。若要了解之，可進(jìn)行多

人人文庫(kù)> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)學(xué)名稱解釋

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

統(tǒng)計(jì)學(xué)名稱解釋

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔