文科概率和統(tǒng)計基礎(chǔ)知識_第1頁
文科概率和統(tǒng)計基礎(chǔ)知識_第2頁
文科概率和統(tǒng)計基礎(chǔ)知識_第3頁
文科概率和統(tǒng)計基礎(chǔ)知識_第4頁
文科概率和統(tǒng)計基礎(chǔ)知識_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、本文格式為Word版,下載可任意編輯 文科概率和統(tǒng)計基礎(chǔ)知識 概率與統(tǒng)計 一、統(tǒng)計 1 1 三種抽樣方法的對比 類別 共同點 特點 相互聯(lián)系 適用范圍 簡 單 隨 機抽樣 抽樣過程中每個個體被抽到的可能性相等;每次抽出個體后不再放回,即不 放回抽樣. 從總體中逐個抽 取. 總 體 個 數(shù)較少. 系統(tǒng)抽樣 將總體平均分成幾部分,按預(yù)先制定的規(guī)矩在各 部分中抽取 1 個個體. 系統(tǒng):在 起始部分取樣時,采用簡單隨機抽樣,其余部分等距抽。 分層:各層抽樣時,采用簡單隨機抽樣或系統(tǒng)抽樣(層的容量大時可用系統(tǒng)抽樣). 總 體 個 數(shù)較多. 分層抽樣 將 總 體 分 成 幾層,按各層個體 數(shù)之比抽取. 總

2、體由差 異 明 顯 的幾 部 分 組成. 2 2 常用的統(tǒng)計圖表:一表(頻率分布表);兩圖(頻率分布直方圖和莖葉圖) (1) 頻率分布直方圖 小長方形的面積=組距頻率組距=頻率; 各小長方形的面積之和等于 1; 小長方形的高=頻率組距,所有小長方形的高的和為1組距 【注意】直方圖的縱軸(小長方形的高)一般是) 頻率除以組距的商(而不是頻率),橫軸一般是 數(shù)據(jù)的大小,小長方形的面積表示頻率 (2)莖葉圖 在樣本數(shù)據(jù)較少時,用莖葉圖表示數(shù)據(jù)的效果較好 3 3 用樣本的數(shù)字特征估計總體的數(shù)字特征 (1)眾數(shù)、中位數(shù)、平均數(shù) 數(shù)字特征 樣本數(shù)據(jù) 頻率分布直方圖 眾數(shù) 出現(xiàn)次數(shù)最多的數(shù)據(jù) 取最高的小長方

3、形 底邊中點 的橫坐標(biāo) 中位數(shù) 將數(shù)據(jù) 按大小依次排列,處在最中間位置的一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)的平均數(shù)) 把頻率分布直方圖劃分成 左右兩個面積相等的 分界限與 x 軸交點的橫坐標(biāo) 平均數(shù) 樣本數(shù)據(jù)的 算術(shù)平均數(shù) 每個小長方形的面積乘以小長方形 底邊中點的橫坐標(biāo)之 和 (2)平均數(shù)1 21( )nx x x xn 方差2 2 2 21 21( ) ( ) ( ) ns x x x x x xn 標(biāo)準(zhǔn)差2 2 21 21( ) ( ) ( ) ns x x x x x xn 【提醒】標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定 4 變量間的相關(guān)關(guān)系 知識點分析 1、線性回歸方程: a x b

4、 y ( x 叫做解釋變量, y 叫做預(yù)報變量) 線性回歸方程系數(shù)公式: ( 公式說明: 回歸直線過樣本的中心點 ) ( y x , ,也就是平均值點.) 2、相關(guān)系數(shù)公式 3、幾個結(jié)論: (1)回歸直線過樣本的中心點 ) ( y x , . (2) b b 0 0 時, y 與 x 正相關(guān),散點圖呈上升趨勢; b b 0 0 時, y 與 x 負(fù)相關(guān),散點圖呈下降趨勢. (3)斜率 b 的含義(舉例): 假如回歸方程為 y =2.5 x +2, 說明 x 增加 1 個單位時, y 平均增加 2.5 個單位; 假如回歸方程為 y =2.5 x +2,說明 x 增加 1 個單位時, y 平均減少

5、 2.5 個單位. (4)相關(guān)系數(shù) r 表示變量的相關(guān)程度。 范圍: 1 r ,即 1 1 r r 越 大,相關(guān)性越 強。 0 r 時, y 與 x 正相關(guān); 0 r 時, y 與 x 負(fù)相關(guān). (5)相關(guān)指數(shù)2R 表示模型的擬合效果。范圍: 1 0 2, R 2R 越 大,擬合效果越 好, ,(這時:殘差平方和越小,殘差點在帶狀區(qū)域內(nèi)的分布對比均勻,帶狀區(qū)域?qū)挾仍秸瑪M合精度越高). 2R 表示解釋變量 x 對于預(yù)報變量 y 變化的貢獻(xiàn)率。 例如: 64 . 02 R ,說明 x 解釋了 64%的 y 變化,或者說 y 的差異有 64%是由 x引起的。 (6)線性回歸模型 e a bx y

6、, 其中 e 叫做 隨機誤差。( y 是由 x 和 e 共同確定的) 二、概率 1 1 概率的五個基本性質(zhì) (1)隨機事件 A 的概率:0 ( ) P A 1 (2)必然事件的概率為 1 (3)不可能事件的概率為 0 (4)假如事件 A 與事件 B 互斥(不可能同時發(fā)生),則 ( ) ( ) ( ) P A B P A P B (5)假如事件 A 與事件 B 互為對立事件(不會同時發(fā)生,但一定有一個發(fā)生),那么( ) ( ) ( ) 1 P A B P A P B ,即 ( ) 1 ( ) P A P B 對立必互斥,互斥未必對立 2 2 古典概型 (1)特點:有限性,等可能性 (2)概率公式

7、: ( )AP A 事件 中所含的基才能件數(shù)試驗的基才能件總數(shù) 3 3 幾何概型 (1)特點:無限性,等可能性 (2)概率公式:( )( )( )AP A 構(gòu)成事件 的區(qū)域長度 面積或體積試驗的全部結(jié)果所構(gòu)成的區(qū)域長度 面積或體積 三 、獨立性檢驗 (一) 知識點分析 1 1 、 2 22 列聯(lián)表:統(tǒng)計 被調(diào)查者的兩種狀態(tài), 每種狀態(tài)又分兩種狀況的調(diào)查結(jié)果表.對于 性別變量,其取值為男和女兩種,這種變量的不同值表示個體所屬的不同類別,像這類變量稱為 分類變量。 2 2 、卡方統(tǒng)計量:為了研究事件 X 與 Y 的關(guān)系,經(jīng)調(diào)查得到一張 22 列聯(lián)表,如下表所示: Y 1 Y 2 合計 X 1 a

8、b a + b X 2 c d c + d 合計 a + c b + d n = a + b + c + d 獨立性檢驗原理:也叫) 假設(shè)性檢驗(類似反證法原理),一般狀況下, 假設(shè)分類變量 X和 Y 之間 沒有關(guān)系,通過計算2K 值,然后 查表對照相應(yīng)的概率 P P, 發(fā)現(xiàn)這種假設(shè)正確的概率 率 P P 很小,從而 推翻假設(shè),結(jié)果得出 X 和 Y 之間 有關(guān)系的可能性為(1P),也就是X X 和 和 Y Y有關(guān)系.(表中的 k 就是2K 的觀測值,即2K k ) 統(tǒng)計量2K (讀做 卡方),它的表達(dá)式是:) )( )( )( () (22d b c a d c b abc ad nK 獨立性

9、檢驗臨界值表 P P( ( k k 2 2 k k ) ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 k k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 (表中的 K K 是理論值,2K 是實際觀測值,2K 越 大,說明變量間越 有關(guān)系) (二) 獨立性檢驗舉例 例 例 1 1、某高校統(tǒng)計初步課程的教師隨機調(diào)查了選該課的一些學(xué)生狀況,具體數(shù)據(jù)如下表: 非統(tǒng)計專業(yè) 統(tǒng)計專業(yè) 男 13 10 女 7 20 為了檢驗主修統(tǒng)計專業(yè)是否與性別有關(guān)系,根據(jù)表中的數(shù)據(jù),查對臨界值 P P( ( k k 2 2 k k ) ) 0.10 0.05 0.025 0.010 k k 2.706 3.841 5.024 6.635 根據(jù)表中數(shù)據(jù),得到 。所以有 的把握認(rèn)為主修統(tǒng)計專業(yè)與性別有關(guān)系。 例 例 2 2、某電視臺在一次對收看文藝節(jié)目和新聞節(jié) 目觀眾的抽樣調(diào)查中,隨機抽取了 100 名電視觀 眾,相關(guān)的數(shù)據(jù)如表所示: (1)由表中數(shù)據(jù)分析,收看新聞節(jié)目的觀眾是 否與年齡有關(guān)? (2)用分層抽樣方法在收看新聞節(jié)目的觀眾中隨機抽取 5 名,大于 40 歲的觀眾應(yīng)當(dāng)抽取幾名? (3)在上述抽取的5名觀眾中任取2名,求恰有1名

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論