統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第1頁
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第2頁
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第3頁
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第4頁
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、極差:一組數(shù)據(jù)的最大值與最小值之差稱為極差,也稱全距,用R表示。其計(jì)算公式為:R=max(xi)min(xi)離散系數(shù):也稱為變異系數(shù),它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比。其計(jì)算公式為:V=S/X。離散系數(shù)是測(cè)量數(shù)據(jù)離散程度的相對(duì)統(tǒng)計(jì)量,主要是用于比較不同樣本數(shù)據(jù)的離散程度。離散系數(shù)大,說明數(shù)據(jù)的離散程度也大;離散系數(shù)小,說明數(shù)據(jù)的離散程度也小。三大統(tǒng)計(jì)分布:卡方分布、T分布、F分布卡方分布(2)定理:設(shè)n個(gè)相互獨(dú)立并且都服從正態(tài)N(0,1)分布的隨機(jī)變量X1、X2,Xn,記則隨機(jī)變量2服從自由度為n的2分布。統(tǒng)計(jì)變量服從卡方分布,其含義是:在給定概率的條件下,滿足或者說表達(dá)式的概率為。

2、T分布定理:設(shè)隨機(jī)變量x,y相互獨(dú)立,XN(0,1),Y2(n)記。則隨機(jī)變量T服從自由度為n的t分布。設(shè)Tt(n),01,對(duì)于滿足下列 等式的數(shù)ta(n),稱為t(n)分布的上側(cè)分位數(shù)。對(duì)于較大的n(45)可以同標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位數(shù)ua作為t(n)分布的上側(cè)分位數(shù)F分布定理:設(shè)隨機(jī)變量x,y相互獨(dú)立,X2(n1),Y2(n2)記,則隨機(jī)變量F服從第一自由度為n1,第二自由度為n2的F分布,記作:FF(n1,n2)若FF(n1,n2),易知:,若則統(tǒng)計(jì)量:描述樣本特征的概括性數(shù)字度量。完全由樣本決定的量,叫做統(tǒng)計(jì)量;或者說不含有其他未知量的樣本的函數(shù)稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量可以看做是對(duì)樣本的一種

3、加工,它吧樣本中所包含的關(guān)于總體的其一方面的信息集中起來。最常用的統(tǒng)計(jì)量是樣本均值和樣本方差S2。自由度:隨機(jī)變量所包含的獨(dú)立變量的個(gè)數(shù)。參數(shù)估計(jì):就是用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)。在參數(shù)估計(jì)中,用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱稱為估計(jì)量,用符號(hào)表示。樣本均值、樣本比例、樣本方差等都可以是一個(gè)估計(jì)量。而根據(jù)一個(gè)具體的樣本計(jì)算出來的估計(jì)量的數(shù)值稱為估計(jì)值。參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。點(diǎn)估計(jì):就是用樣本統(tǒng)計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值。區(qū)間估計(jì):是在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間通常由樣本統(tǒng)計(jì)量加減估計(jì)誤差得到。與點(diǎn)估計(jì)不同,進(jìn)行區(qū)間估計(jì)時(shí),根據(jù)樣本統(tǒng)計(jì)量的

4、抽樣分布可以對(duì)樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。樣本量:從總體中抽取的一部分元素的集合為樣本,構(gòu)成樣本的元素的數(shù)目為樣本量。樣本量的大小是選擇檢驗(yàn)統(tǒng)計(jì)量得一個(gè)要素。置信區(qū)間:在區(qū)間估計(jì)中,由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間。置信水平:將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。表示為(1)%,為是總體參數(shù)未在區(qū)間內(nèi)的比例。也稱置信度或置信系數(shù)。假設(shè)檢驗(yàn):利用樣本信息,對(duì)提出的命題進(jìn)行檢驗(yàn)的一套程序和方法。事先對(duì)總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷假設(shè)是否成立;有參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn)。采用邏輯上的反

5、證法,依據(jù)統(tǒng)計(jì)上的小概率原理。單側(cè)檢驗(yàn):拒絕域在右側(cè)或者在左側(cè)的假設(shè)檢驗(yàn),左單側(cè)檢驗(yàn) 右單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn):拒絕域在兩側(cè)的假設(shè)檢驗(yàn)原假設(shè):提出一個(gè)或兩個(gè)參數(shù)是否等于或大于、小于某個(gè)特殊值的命題。H0:有待檢驗(yàn)的假設(shè),又稱0假設(shè),收集證據(jù)予以反對(duì)的假設(shè)(總是有等號(hào))備擇假設(shè):H1:又稱研究假設(shè),收集證據(jù)予以支持的假設(shè)。與原假設(shè)相對(duì)立的假設(shè)(總是有不等號(hào))方差分析:縮寫為ANOVA,就是通過檢驗(yàn)各總體的均值是否相等來判斷分類型對(duì)數(shù)值型變量是否有顯著影響的統(tǒng)計(jì)方法。因子和處理:在方差分析中,所要檢驗(yàn)的對(duì)象稱為因素或因子,是所研究的分類型變量的另一個(gè)名稱。因素的不同表現(xiàn)稱為處理或水平??偲椒胶停河洖镾S

6、T。它是全部觀測(cè)值xij與總均值x的誤差平方和。組間平方和:記為SSA,它是各組均值xi與總均值x的誤差平方和,反應(yīng)各樣本之間的差異程度,因此又稱為因素平方和。組內(nèi)平方和:記為SSE,它是每個(gè)水平或組的各樣本數(shù)據(jù)與其組均值的誤差平方和,反應(yīng)了每個(gè)樣本觀測(cè)值的離散情況,因此稱為組內(nèi)平方和。該平方和反應(yīng)了隨機(jī)誤差的大小。SST、SSA、SSE之間的關(guān)系:組間方差:SSA的均方,也稱為組間均方,記為MSA,其計(jì)算公式為:MSA=組間平方和/自由度=SSA/k1組內(nèi)方差:SSE的均方,也稱為組內(nèi)均方,記為MSE,其計(jì)算公式為:MSE=組內(nèi)平方和/自由度=SSE/nk將上述MSA與MSE進(jìn)行對(duì)比,即得到

7、所需要的檢驗(yàn)統(tǒng)計(jì)量F。當(dāng)H0為真時(shí),二者的比值服從分子自由度為k1、分母自由度為nk的F分布。單因素方差分析:研究一個(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。雙因素方差分析:研究兩個(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。當(dāng)方差分析中涉及兩個(gè)分類型自變量時(shí),稱為雙因素方差分析。無重復(fù)雙因素分析 有重復(fù)雙因素分析相關(guān)關(guān)系:變量之間存在的不確定的數(shù)量關(guān)系,稱為相關(guān)關(guān)系,一個(gè)變量的取值不能由另一個(gè)變量唯一確定。相關(guān)系數(shù):是根據(jù)樣本數(shù)據(jù)計(jì)算的度量兩個(gè)變量之間線性關(guān)系強(qiáng)度的統(tǒng)計(jì)量。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為;若使根據(jù)眼根數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),

8、記為r。樣本相關(guān)系數(shù)的計(jì)算公式為:LSD:最小顯著差異法。存在一定的缺陷。在都與對(duì)照相比時(shí)可以使用該法。是對(duì)檢驗(yàn)兩個(gè)總計(jì)均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來代替)而得到的。式中,t/2為t分布的臨界值,通過查t分布表得到,其自由度為(nk),這里的k是因素中水平的個(gè)數(shù);MSE為組內(nèi)方差;ni和nj分別是第i個(gè)樣本和第j個(gè)樣本的樣本量。簡述評(píng)價(jià)估計(jì)量好壞的標(biāo)準(zhǔn)。1. 無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。設(shè)總體參數(shù)為,所選擇的估計(jì)量為,如果E()=,則稱為的無偏估計(jì)量。2. 有效性:對(duì)同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。在無偏估計(jì)的條件

9、下,估計(jì)量的方差越小,估計(jì)也就越有效。3. 一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)。換而言之,一個(gè)大樣本給出的估計(jì)量要比一個(gè)小樣本給出的估計(jì)量更接近總體的參數(shù)。怎樣理解置信區(qū)間?在區(qū)間估計(jì)中,又樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間,其中區(qū)間的最小值稱為置信下線,最大值稱為置信上線。由于統(tǒng)計(jì)學(xué)家在某種程度是上確信這個(gè)區(qū)間會(huì)包含真正的樣本的總體參數(shù),所以給它取名為置信區(qū)間。什么是假設(shè)檢驗(yàn)中的兩類錯(cuò)誤?兩類錯(cuò)誤之間存在什么樣的數(shù)量關(guān)系?一類錯(cuò)誤是原假設(shè)H0為真卻被我們拒絕了,犯這種錯(cuò)誤的概率用表示,所以也稱錯(cuò)誤或棄真錯(cuò)誤;另一類錯(cuò)誤是原假設(shè)為偽我們卻沒有拒絕,犯

10、這種錯(cuò)誤的概率用表示,所以也稱錯(cuò)誤或者取偽錯(cuò)誤。和在數(shù)量上是此消彼長的關(guān)系。簡述假設(shè)檢驗(yàn)的基本步驟。1. 提出假設(shè)2. 確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量3. 規(guī)定顯著性水平4. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值5. 作出統(tǒng)計(jì)決策方差分析包括哪些類型?它們有何區(qū)別?1. 單因素方差分析:研究一個(gè)分類型自變量最一個(gè)數(shù)值型因變量的影響。2. 雙因素方差分析:究兩個(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。當(dāng)方差分析中涉及兩個(gè)分類型自變量時(shí),稱為雙因素方差分析。無重復(fù)雙因素分析:兩個(gè)影響因素相互獨(dú)立;可重復(fù)雙因素分析:兩個(gè)因素有交互作用,結(jié)合后產(chǎn)生新的影響。簡述方差分析的基本思想。方差分析的基本假定:1.每個(gè)總體都應(yīng)服

11、從正態(tài)分布 2.各個(gè)總體的方差必須相同(同質(zhì)性) 3.觀察值是獨(dú)立的方差分析的基本思想和原理:1.判斷均值之間是否有差異時(shí)需要借助于方差。 2,。通過對(duì)數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。 3.即:判斷均值之間是否有差異需要進(jìn)行方差分析。解釋R2的含義和作用。R2稱為多重判定系數(shù),在無重復(fù)雙因素方差分析中用于關(guān)系強(qiáng)度的測(cè)量。行因素所產(chǎn)生的誤差平方和記為SSR,列因素所產(chǎn)出的誤差平方和記為SSC,這兩個(gè)平方和加在一起則度量了兩個(gè)自變量對(duì)因變量的聯(lián)合效應(yīng),聯(lián)合效應(yīng)與總平方和的比值定義為R2,其平方根R則反映了這兩個(gè)自變量合起來與因變量之間的關(guān)系強(qiáng)度。即:R2=聯(lián)合效應(yīng)/總效應(yīng)=SSR+S

12、SC/SST簡述相關(guān)系數(shù)的性質(zhì)。1. r的取值范圍為-1到1,r=1時(shí),完全正線性相關(guān) R=-1時(shí),完全負(fù)線性相關(guān) R=0時(shí),不存在線性相關(guān)關(guān)系 0r=-1,負(fù)線性相關(guān) 0rF,則不接受H0雙因素方差分析: (1),同單因素一樣,首先進(jìn)行假設(shè),H0,H1;H0,H1(因?yàn)槭莾蓚€(gè)因素,所以要分別的假設(shè),最后的結(jié)果也是分開的,分別的檢驗(yàn)) (2),求出總誤差平方和SST,自由度為kr-1 行誤差平方和SSR,自由度為k-1 列誤差平法和SSC,自由度為r-1 隨機(jī)誤差項(xiàng)平方和SSE,自由度為(k-1)(r-1) SST=SSR+SSC+SSE (3),根據(jù)各誤差平方和和自由度,求出各均方,MST,

13、MSE,MSR,MSC 下面的步驟和單因素類似,根據(jù)行誤差均方和隨機(jī)誤差均方的比值MSR/MSE=Fr 根據(jù)列誤差均方和隨機(jī)誤差均方的比之MSC/MSE=Fc 分別就兩種因素中的一種檢驗(yàn),根據(jù)自由度,給定的置信度,查出Fa。分別查找行行和列的,分別比較回歸分析與相關(guān)分析的區(qū)別1.相關(guān)分析中,變量 x 變量 y 處于平等的地位;2.回歸分析中,變量 y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預(yù)測(cè)因變量的變化.3.相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;4.回歸分析不僅可以揭示變量 x 對(duì)變量 y 的影響大小,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制。 回歸分析與相關(guān)分析的聯(lián)系相關(guān)分析反映的是一元回歸分析所揭示的兩個(gè)變量之間線性關(guān)系的密切程度;棄法法則:1.四舍五入法2.四舍六入五單雙法 (1)四舍六入 (2)若舍入的該位數(shù)是5,則分情況: a.若該位數(shù)前為奇數(shù),或該位數(shù)后還有不為零的數(shù)字,則入; b.若該位數(shù)后數(shù)字全為0,且其前為偶數(shù),則舍去。計(jì)算法則: (1)進(jìn)行加減法運(yùn)算結(jié)果的有效位數(shù),自左起不超過參加運(yùn)算中的數(shù)值第一個(gè)出現(xiàn)的可疑數(shù)字位數(shù),如: 1.481.2321.4024.1124.1(2)進(jìn)行乘除運(yùn)算,其積商保留的有效數(shù)字可比參加運(yùn)算的有效數(shù)字?jǐn)?shù)最少數(shù)多一位。如: 0.0326.03460.0326

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論