統(tǒng)計學(xué)復(fù)習(xí)大綱本科生.ppt_第1頁
統(tǒng)計學(xué)復(fù)習(xí)大綱本科生.ppt_第2頁
統(tǒng)計學(xué)復(fù)習(xí)大綱本科生.ppt_第3頁
統(tǒng)計學(xué)復(fù)習(xí)大綱本科生.ppt_第4頁
統(tǒng)計學(xué)復(fù)習(xí)大綱本科生.ppt_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)復(fù)習(xí),2012.06,第一章 統(tǒng)計及統(tǒng)計數(shù)據(jù),統(tǒng)計學(xué):收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué) 描述統(tǒng)計:研究數(shù)據(jù)收集、整理和描述的統(tǒng)計學(xué)方法 推斷統(tǒng)計:研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學(xué)方法 變量、變量的分類: 數(shù)值變量、分類變量和順序變量 抽樣方法: 簡單隨機抽樣,分層抽樣,系統(tǒng)抽樣,整群抽樣。,第二章 數(shù)據(jù)的圖表表示,定性數(shù)據(jù)的圖表表示: 頻數(shù)分布表,條形圖,帕累托圖,餅圖,環(huán)形圖。 定量數(shù)據(jù)的圖表表示: 頻數(shù)分布表,直方圖,莖葉圖,箱線圖,散點圖,雷達圖,第 三章 用統(tǒng)計量描述數(shù)據(jù),水平的度量:平均數(shù)、中位數(shù)、分位數(shù)、眾數(shù) 差異的度量:極差、四分位差、方差(樣本

2、方差,總體方差)、標準差、離散系數(shù),第四章 概率分布,概率:對事件發(fā)生的可能性大小的度量 離散型概率分布: 二項分布:一次試驗只有兩個可能結(jié)果,即“成功”和“失敗”一次試驗“成功”的概率為p ,失敗的概率為q =1- p,且概率p對每次試驗都是相同的 ,試驗是相互獨立的,并可以重復(fù)進行n次 。重復(fù)進行 n 次試驗,出現(xiàn)“成功”的次數(shù)的概率分布稱為二項分布,記為XB(n,p)。,泊松分布: 連續(xù)型概率分布:正態(tài)分布,第四章 概率分布,c2- 分布:對于n個標準正態(tài)隨機變量y1 ,y2 ,yn,則隨機變量 稱為具有n個自由度的2分布,記為,由正態(tài)分布導(dǎo)出的幾個重要分布:c2- 分布, t-分布,

3、F-分布,t-分布,提出者是William Gosset,也被稱為學(xué)生分布(students t) t 分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布,x,t 分布與標準正態(tài)分布的比較,t 分布,標準正態(tài)分布,t,不同自由度的t分布,標準正態(tài)分布,t (df = 13),t (df = 5),z,若隨機變量X N(0,1),Yc2 (n),則,F分布,設(shè)若U為服從自由度為n1的2分布,即U2(n1),V為服從自由度為n2的2分布,即V2(n2),且U和V相互獨立,則 稱F為服從自由度n1和n2的F分

4、布,記為,第四章 概率分布,參數(shù)、統(tǒng)計量的概念,第四章 概率分布,統(tǒng)計量的分布: 樣本均值的分布: 樣本比例的分布: 樣本方差的分布:,中心極限定理(central limit theorem),從均值為,方差為 2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布,大樣本,不管總體分布是否正態(tài),總體方差s2已知,,大樣本,不管總體分布是否正態(tài),總體方差s2未知,,樣本均值的分布,小樣本,總體分布正態(tài),總體方差s2已知,,小樣本,總體分布正態(tài),總體方差s2未知,,樣本比例的分布: 當樣本容量很大時(np(成功次數(shù))和n(1-p)(失敗次數(shù)

5、)均應(yīng)該大于10) ,樣本比例的抽樣分布可用正態(tài)分布近似,即,第四章 概率分布,樣本方差的分布:,對于來自正態(tài)總體的簡單隨機樣本,則,第五章 參數(shù)估計,參數(shù)估計:用樣本統(tǒng)計量去估計總體的參數(shù) 點估計:用樣本的估計量的某個取值直接作為總體參數(shù)的估計值 區(qū)間估計:在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個估計區(qū)間,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到 評價估計量的標準:無偏、有效、一致 置信水平:將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,也稱置信度, -1.96 x,95%,構(gòu)造m區(qū)間估計的原理:, +1.96 x,構(gòu)造的m估計區(qū)間為:,稱為置信水平。,稱為95%置信

6、水平下的置信區(qū)間,Z /2,1- ,0,區(qū)間估計的原理,-Z /2,/2,/2,Z=,構(gòu)造的m 的(1 - 置信水平下的置信區(qū)間為:,由,第五章 參數(shù)估計,一個總體參數(shù)的區(qū)間估計 總體均值的區(qū)間估計 總體比例的區(qū)間估計 總體方差的區(qū)間估計,總體均值的區(qū)間估計,總體均值在置信水平下的置信區(qū)間可一般性地表達為 注:具體分位數(shù)為多少,要看樣本均值服從的分布。此時要考慮以下三個方面:大樣本/小樣本;總體是否正態(tài);總體方差是否已知。,樣本均值分位數(shù)值樣本均值的標準誤差,總體比例的區(qū)間估計,1.假定條件 總體服從二項分布;np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于10(也有些書上說大于5) 使用

7、正態(tài)分布統(tǒng)計量 z,總體比例在1-置信水平下的置信區(qū)間為,樣本比例分位數(shù)值樣本比例的標準誤差,2. 由,總體方差的區(qū)間估計 (總體服從正態(tài)分布),1.估計一個總體的方差或標準差 2.總體方差 2 的點估計量為s2,且,總體方差在1- 置信水平下的置信區(qū)間為,3. 由,第五章 參數(shù)估計,樣本量的確定 估計總體均值時樣本量的確定 估計總體比例時樣本量的確定,其中:,其中:,第 六 章 假設(shè)檢驗,假設(shè)檢驗:先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計方法 原假設(shè):又稱“0假設(shè)”,研究者想收集證據(jù)予以反對的假設(shè),用H0表示。所表達的含義總是指參數(shù)沒有變化或變量之間沒

8、有關(guān)系 備擇假設(shè):也稱“研究假設(shè)”,研究者想收集證據(jù)予以支持的假設(shè),用H1或Ha表示, 所表達的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關(guān)系,第 六 章 假設(shè)檢驗,假設(shè)檢驗邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理 備擇假設(shè)通常用于表達研究者自己傾向于支持的看法,然后就是想辦法收集證據(jù)拒絕原假設(shè),以支持備擇假設(shè) 小概率是在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率(一般認為小于0.05) 在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè),雙側(cè)檢驗與單側(cè)檢驗 (假設(shè)的形式),以總體均值的檢驗為例,假設(shè)檢驗的步驟,1.提出原假設(shè)與備擇假設(shè) 2.確定檢驗統(tǒng)計量 3.確定顯著性水平 4.用統(tǒng)計量

9、的值或者P值做決策(此步驟需要知道統(tǒng)計量的分布,需要確定是雙側(cè)檢驗還是單側(cè)檢驗),雙側(cè)檢驗,左側(cè)檢驗,Z,拒絕H0,0,臨界值,計算出的樣本統(tǒng)計量,P 值,右側(cè)檢驗,Z,拒絕H0,0,計算出的樣本統(tǒng)計量,臨界值,P 值,第 六 章 假設(shè)檢驗,一個總體參數(shù)的檢驗 總體均值的檢驗 總體比例的檢驗 總體方差的檢驗,一個總體均值的檢驗(作出判斷),樣本量n,總體比例檢驗,假定條件 總體服從二項分布 可用正態(tài)分布來近似(大樣本) 檢驗的 z 統(tǒng)計量, 0為假設(shè)的總體比例,總體方差的檢驗 ( 2檢驗),檢驗一個總體的方差或標準差 假設(shè)總體近似服從正態(tài)分布 使用 2分布 檢驗統(tǒng)計量,假設(shè)的總體方差,兩個總體

10、均值之差的檢驗(方法總結(jié)),兩類錯誤與顯著性水平,第類錯誤(錯誤) 原假設(shè)為正確時拒絕原假設(shè) 第類錯誤的概率記為,被稱為顯著性水平 2.第類錯誤(錯誤) 原假設(shè)為錯誤時未拒絕原假設(shè) 第類錯誤的概率記為(Beta),H0為真,H1為真,接受H0,拒絕H0,第 八章 一元線性回歸,相關(guān)關(guān)系 用散點圖描述相關(guān)關(guān)系 用相關(guān)系數(shù)度量關(guān)系強度,回歸分析: 重點考察一個特定的變量(因變量),而把其他變量(自變量)看作是影響這一變量的因素,并通過適當?shù)臄?shù)學(xué)模型將變量間的關(guān)系表達出來 利用樣本數(shù)據(jù)建立模型的估計方程 對模型進行顯著性檢驗 進而通過一個或幾個自變量的取值來估計或預(yù)測因變量的取值,第 八章 一元線性

11、回歸,一元線性回歸,最小二乘估計,Karl Gauss的最小化圖,Karl Gauss的最小化圖,參數(shù)的最小二乘估計 ( 和 的計算公式), 根據(jù)最小二乘法,可得求解 和 的公式如下,誤差分解圖,x,y,誤差平方和的分解 (三個平方和的意義),總平方和(SSTtotal sum of squares) 反映因變量的 n 個觀察值與其均值的總誤差 回歸平方和(SSRsum of squares of regression) 反映自變量 x 的變化對因變量 y 取值變化的影響,或者說,是由于 x 與 y 之間的線性關(guān)系引起的 y 的取值變化,也稱為可解釋的平方和 殘差平方和(SSEsum of squares of error) 反映除 x 以外的其他因素對 y 取值的影響,也稱為不可解釋的平方和或剩余平方和,判定系數(shù)R2 (coefficient of determination),回歸平方和占總誤差平方和的比例,反映回歸直線的擬合程度,是度量擬合優(yōu)度的統(tǒng)計量 取值范圍在 0 , 1 之間 R2 1,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差 決定系數(shù)平方根等于相關(guān)系數(shù),第十章 時間序列,時間序列:按時間順序記錄的一組數(shù)據(jù) 時間序列的成分:趨勢、季節(jié)變動、隨機性 平穩(wěn)序列用平滑法預(yù)測(簡單平均法、移動平均法、指數(shù)平滑法) 趨勢預(yù)測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論