統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理

上傳人：N*** IP屬地：廣東上傳時(shí)間：2020-09-19 格式：DOC 頁數(shù)：7 大?。?35.50KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、極差：一組數(shù)據(jù)的最大值與最小值之差稱為極差，也稱全距，用R表示。其計(jì)算公式為：R=max（xi）min（xi）離散系數(shù)：也稱為變異系數(shù)，它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比。其計(jì)算公式為：V=S/X。離散系數(shù)是測(cè)量數(shù)據(jù)離散程度的相對(duì)統(tǒng)計(jì)量，主要是用于比較不同樣本數(shù)據(jù)的離散程度。離散系數(shù)大，說明數(shù)據(jù)的離散程度也大；離散系數(shù)小，說明數(shù)據(jù)的離散程度也小。三大統(tǒng)計(jì)分布：卡方分布、T分布、F分布卡方分布（2）定理：設(shè)n個(gè)相互獨(dú)立并且都服從正態(tài)N（0,1）分布的隨機(jī)變量X1、X2，Xn，記則隨機(jī)變量2服從自由度為n的2分布。統(tǒng)計(jì)變量服從卡方分布，其含義是：在給定概率的條件下，滿足或者說表達(dá)式的概率為。

2、T分布定理：設(shè)隨機(jī)變量x，y相互獨(dú)立，XN（0,1），Y2（n）記。則隨機(jī)變量T服從自由度為n的t分布。設(shè)Tt（n），01，對(duì)于滿足下列等式的數(shù)ta（n），稱為t（n）分布的上側(cè)分位數(shù)。對(duì)于較大的n（45）可以同標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位數(shù)ua作為t（n）分布的上側(cè)分位數(shù)F分布定理：設(shè)隨機(jī)變量x，y相互獨(dú)立，X2（n1），Y2（n2）記，則隨機(jī)變量F服從第一自由度為n1，第二自由度為n2的F分布，記作：FF（n1，n2）若FF（n1，n2），易知：，若則統(tǒng)計(jì)量：描述樣本特征的概括性數(shù)字度量。完全由樣本決定的量，叫做統(tǒng)計(jì)量；或者說不含有其他未知量的樣本的函數(shù)稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量可以看做是對(duì)樣本的一種

3、加工，它吧樣本中所包含的關(guān)于總體的其一方面的信息集中起來。最常用的統(tǒng)計(jì)量是樣本均值和樣本方差S2。自由度：隨機(jī)變量所包含的獨(dú)立變量的個(gè)數(shù)。參數(shù)估計(jì)：就是用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)。在參數(shù)估計(jì)中，用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱稱為估計(jì)量，用符號(hào)表示。樣本均值、樣本比例、樣本方差等都可以是一個(gè)估計(jì)量。而根據(jù)一個(gè)具體的樣本計(jì)算出來的估計(jì)量的數(shù)值稱為估計(jì)值。參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。點(diǎn)估計(jì)：就是用樣本統(tǒng)計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值。區(qū)間估計(jì)：是在點(diǎn)估計(jì)的基礎(chǔ)上，給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍，該區(qū)間通常由樣本統(tǒng)計(jì)量加減估計(jì)誤差得到。與點(diǎn)估計(jì)不同，進(jìn)行區(qū)間估計(jì)時(shí)，根據(jù)樣本統(tǒng)計(jì)量的

4、抽樣分布可以對(duì)樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。樣本量：從總體中抽取的一部分元素的集合為樣本，構(gòu)成樣本的元素的數(shù)目為樣本量。樣本量的大小是選擇檢驗(yàn)統(tǒng)計(jì)量得一個(gè)要素。置信區(qū)間：在區(qū)間估計(jì)中，由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間。置信水平：將構(gòu)造置信區(qū)間的步驟重復(fù)很多次，置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。表示為（1）%，為是總體參數(shù)未在區(qū)間內(nèi)的比例。也稱置信度或置信系數(shù)。假設(shè)檢驗(yàn)：利用樣本信息，對(duì)提出的命題進(jìn)行檢驗(yàn)的一套程序和方法。事先對(duì)總體參數(shù)或分布形式作出某種假設(shè)，然后利用樣本信息來判斷假設(shè)是否成立；有參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn)。采用邏輯上的反

5、證法，依據(jù)統(tǒng)計(jì)上的小概率原理。單側(cè)檢驗(yàn)：拒絕域在右側(cè)或者在左側(cè)的假設(shè)檢驗(yàn)，左單側(cè)檢驗(yàn) 右單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)：拒絕域在兩側(cè)的假設(shè)檢驗(yàn)原假設(shè)：提出一個(gè)或兩個(gè)參數(shù)是否等于或大于、小于某個(gè)特殊值的命題。H0：有待檢驗(yàn)的假設(shè)，又稱0假設(shè)，收集證據(jù)予以反對(duì)的假設(shè)（總是有等號(hào)）備擇假設(shè)：H1：又稱研究假設(shè)，收集證據(jù)予以支持的假設(shè)。與原假設(shè)相對(duì)立的假設(shè)（總是有不等號(hào)）方差分析：縮寫為ANOVA，就是通過檢驗(yàn)各總體的均值是否相等來判斷分類型對(duì)數(shù)值型變量是否有顯著影響的統(tǒng)計(jì)方法。因子和處理：在方差分析中，所要檢驗(yàn)的對(duì)象稱為因素或因子，是所研究的分類型變量的另一個(gè)名稱。因素的不同表現(xiàn)稱為處理或水平?？偲椒胶停河洖镾S

6、T。它是全部觀測(cè)值xij與總均值x的誤差平方和。組間平方和：記為SSA，它是各組均值xi與總均值x的誤差平方和，反應(yīng)各樣本之間的差異程度，因此又稱為因素平方和。組內(nèi)平方和：記為SSE，它是每個(gè)水平或組的各樣本數(shù)據(jù)與其組均值的誤差平方和，反應(yīng)了每個(gè)樣本觀測(cè)值的離散情況，因此稱為組內(nèi)平方和。該平方和反應(yīng)了隨機(jī)誤差的大小。SST、SSA、SSE之間的關(guān)系：組間方差：SSA的均方，也稱為組間均方，記為MSA，其計(jì)算公式為：MSA=組間平方和/自由度=SSA/k1組內(nèi)方差：SSE的均方，也稱為組內(nèi)均方，記為MSE，其計(jì)算公式為：MSE=組內(nèi)平方和/自由度=SSE/nk將上述MSA與MSE進(jìn)行對(duì)比，即得到

7、所需要的檢驗(yàn)統(tǒng)計(jì)量F。當(dāng)H0為真時(shí)，二者的比值服從分子自由度為k1、分母自由度為nk的F分布。單因素方差分析：研究一個(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。雙因素方差分析：研究兩個(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。當(dāng)方差分析中涉及兩個(gè)分類型自變量時(shí)，稱為雙因素方差分析。無重復(fù)雙因素分析有重復(fù)雙因素分析相關(guān)關(guān)系：變量之間存在的不確定的數(shù)量關(guān)系，稱為相關(guān)關(guān)系，一個(gè)變量的取值不能由另一個(gè)變量唯一確定。相關(guān)系數(shù)：是根據(jù)樣本數(shù)據(jù)計(jì)算的度量兩個(gè)變量之間線性關(guān)系強(qiáng)度的統(tǒng)計(jì)量。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的，稱為總體相關(guān)系數(shù)，記為；若使根據(jù)眼根數(shù)據(jù)計(jì)算的，則稱為樣本相關(guān)系數(shù)，

8、記為r。樣本相關(guān)系數(shù)的計(jì)算公式為：LSD：最小顯著差異法。存在一定的缺陷。在都與對(duì)照相比時(shí)可以使用該法。是對(duì)檢驗(yàn)兩個(gè)總計(jì)均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正（用MSE來代替）而得到的。式中，t/2為t分布的臨界值，通過查t分布表得到，其自由度為（nk），這里的k是因素中水平的個(gè)數(shù)；MSE為組內(nèi)方差；ni和nj分別是第i個(gè)樣本和第j個(gè)樣本的樣本量。簡述評(píng)價(jià)估計(jì)量好壞的標(biāo)準(zhǔn)。1. 無偏性：估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。設(shè)總體參數(shù)為，所選擇的估計(jì)量為，如果E（）=，則稱為的無偏估計(jì)量。2. 有效性：對(duì)同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。在無偏估計(jì)的條件

9、下，估計(jì)量的方差越小，估計(jì)也就越有效。3. 一致性：隨著樣本容量的增大，估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)。換而言之，一個(gè)大樣本給出的估計(jì)量要比一個(gè)小樣本給出的估計(jì)量更接近總體的參數(shù)。怎樣理解置信區(qū)間？在區(qū)間估計(jì)中，又樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間，其中區(qū)間的最小值稱為置信下線，最大值稱為置信上線。由于統(tǒng)計(jì)學(xué)家在某種程度是上確信這個(gè)區(qū)間會(huì)包含真正的樣本的總體參數(shù)，所以給它取名為置信區(qū)間。什么是假設(shè)檢驗(yàn)中的兩類錯(cuò)誤？兩類錯(cuò)誤之間存在什么樣的數(shù)量關(guān)系？一類錯(cuò)誤是原假設(shè)H0為真卻被我們拒絕了，犯這種錯(cuò)誤的概率用表示，所以也稱錯(cuò)誤或棄真錯(cuò)誤；另一類錯(cuò)誤是原假設(shè)為偽我們卻沒有拒絕，犯

10、這種錯(cuò)誤的概率用表示，所以也稱錯(cuò)誤或者取偽錯(cuò)誤。和在數(shù)量上是此消彼長的關(guān)系。簡述假設(shè)檢驗(yàn)的基本步驟。1. 提出假設(shè)2. 確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量3. 規(guī)定顯著性水平4. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值5. 作出統(tǒng)計(jì)決策方差分析包括哪些類型？它們有何區(qū)別？1. 單因素方差分析：研究一個(gè)分類型自變量最一個(gè)數(shù)值型因變量的影響。2. 雙因素方差分析：究兩個(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。當(dāng)方差分析中涉及兩個(gè)分類型自變量時(shí)，稱為雙因素方差分析。無重復(fù)雙因素分析：兩個(gè)影響因素相互獨(dú)立；可重復(fù)雙因素分析：兩個(gè)因素有交互作用，結(jié)合后產(chǎn)生新的影響。簡述方差分析的基本思想。方差分析的基本假定：1.每個(gè)總體都應(yīng)服

11、從正態(tài)分布 2.各個(gè)總體的方差必須相同（同質(zhì)性） 3.觀察值是獨(dú)立的方差分析的基本思想和原理：1.判斷均值之間是否有差異時(shí)需要借助于方差。 2,。通過對(duì)數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。 3.即：判斷均值之間是否有差異需要進(jìn)行方差分析。解釋R2的含義和作用。R2稱為多重判定系數(shù)，在無重復(fù)雙因素方差分析中用于關(guān)系強(qiáng)度的測(cè)量。行因素所產(chǎn)生的誤差平方和記為SSR，列因素所產(chǎn)出的誤差平方和記為SSC，這兩個(gè)平方和加在一起則度量了兩個(gè)自變量對(duì)因變量的聯(lián)合效應(yīng)，聯(lián)合效應(yīng)與總平方和的比值定義為R2，其平方根R則反映了這兩個(gè)自變量合起來與因變量之間的關(guān)系強(qiáng)度。即：R2=聯(lián)合效應(yīng)/總效應(yīng)=SSR+S

12、SC/SST簡述相關(guān)系數(shù)的性質(zhì)。1. r的取值范圍為-1到1，r=1時(shí)，完全正線性相關(guān) R=-1時(shí)，完全負(fù)線性相關(guān) R=0時(shí)，不存在線性相關(guān)關(guān)系 0r=-1,負(fù)線性相關(guān) 0rF，則不接受H0雙因素方差分析：（1），同單因素一樣，首先進(jìn)行假設(shè)，H0,H1；H0,H1(因?yàn)槭莾蓚€(gè)因素，所以要分別的假設(shè)，最后的結(jié)果也是分開的，分別的檢驗(yàn)) （2），求出總誤差平方和SST,自由度為kr-1 行誤差平方和SSR,自由度為k-1 列誤差平法和SSC,自由度為r-1 隨機(jī)誤差項(xiàng)平方和SSE,自由度為(k-1)(r-1) SST=SSR+SSC+SSE (3),根據(jù)各誤差平方和和自由度，求出各均方，MST,

13、MSE,MSR,MSC 下面的步驟和單因素類似，根據(jù)行誤差均方和隨機(jī)誤差均方的比值MSR/MSE=Fr 根據(jù)列誤差均方和隨機(jī)誤差均方的比之MSC/MSE=Fc 分別就兩種因素中的一種檢驗(yàn)，根據(jù)自由度，給定的置信度，查出Fa。分別查找行行和列的，分別比較回歸分析與相關(guān)分析的區(qū)別1.相關(guān)分析中，變量 x 變量 y 處于平等的地位；2.回歸分析中，變量 y 稱為因變量，處在被解釋的地位，x 稱為自變量，用于預(yù)測(cè)因變量的變化.3.相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度；4.回歸分析不僅可以揭示變量 x 對(duì)變量 y 的影響大小，還可以由回歸方程進(jìn)行預(yù)測(cè)和控制。回歸分析與相關(guān)分析的聯(lián)系相關(guān)分析反映的是一元回歸分析所揭示的兩個(gè)變量之間線性關(guān)系的密切程度；棄法法則：1.四舍五入法2.四舍六入五單雙法（1）四舍六入 (2)若舍入的該位數(shù)是5，則分情況： a.若該位數(shù)前為奇數(shù)，或該位數(shù)后還有不為零的數(shù)字，則入； b.若該位數(shù)后數(shù)字全為0，且其前為偶數(shù)，則舍去。計(jì)算法則：（1）進(jìn)行加減法運(yùn)算結(jié)果的有效位數(shù)，自左起不超過參加運(yùn)算中的數(shù)值第一個(gè)出現(xiàn)的可疑數(shù)字位數(shù)，如： 1.481.2321.4024.1124.1（2）進(jìn)行乘除運(yùn)算，其積商保留的有效數(shù)字可比參加運(yùn)算的有效數(shù)字?jǐn)?shù)最少數(shù)多一位。如： 0.0326.03460.0326

人人文庫> 全部分類> 應(yīng)用文書 > 工作計(jì)劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理

文檔簡介

溫馨提示

最新文檔

評(píng)論

統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔