版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、統(tǒng)計學(xué)第一章1、什么是統(tǒng)計學(xué):收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)2、分類數(shù)據(jù):只能歸于某一類別的非數(shù)字型數(shù)據(jù),對事物進行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述3、順序數(shù)據(jù):只能歸于某一有序類別的非數(shù)字型數(shù)據(jù).對事物類別順序的測度,數(shù)據(jù)表現(xiàn)為類別,用文字來表述4、數(shù)值型數(shù)據(jù):按數(shù)字尺度測量的觀察值.結(jié)果表現(xiàn)為具體的數(shù)值,對事物的精確測度分類數(shù)據(jù)和順序數(shù)據(jù)說明事物的品質(zhì)特征定性數(shù)據(jù);數(shù)值型數(shù)據(jù)是說明事物的數(shù)量特征定量數(shù)據(jù)5、截面數(shù)據(jù):在相同或近似相同的時間點上收集的數(shù)據(jù),描述現(xiàn)象在某一時刻的變化情況6、時間序列數(shù)據(jù):在不同時間上收集到的數(shù)據(jù),描述現(xiàn)象隨時間變化的情況7、總體:所研
2、究的全部個體(數(shù)據(jù)) 的集合,其中的每一個個體也稱為元素8、樣本:從總體中抽取的一部分元素的集合,構(gòu)成樣本的元素的數(shù)目稱為樣本容量或樣本量9、參數(shù):描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值10統(tǒng)計量:用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)第二章1、概率抽樣:也稱隨機抽樣2、特點:按一定的概率以隨機原則抽取樣本 抽取樣本時使每個單位都有一定的機會被抽中 每個單位被抽中的概率是已知的,或是可以計算出來的 當(dāng)用樣本對總體目標(biāo)量進行估計時,要考慮到每個樣本單位被抽中的概率3、常用的概率抽樣:簡單隨機抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多
3、階段抽樣4、非概率抽樣:相對于概率抽樣而言抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查5、常用的非概率抽樣:方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式 6、非抽樣誤差:相對抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異(存在于所有的調(diào)查之中,包括概率抽樣,非概率抽樣,全面性調(diào)查)7、非抽樣誤差的類型:有抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測量誤差第三章P43-50 3.2.1 分類數(shù)據(jù)的整理與圖示頻數(shù):落在各類別中的數(shù)據(jù)個數(shù)頻數(shù)分布表:把各個類別及落在其中的相應(yīng)頻數(shù)全部列出,用表
4、格形式表現(xiàn)出來比例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值百分比:將對比的基數(shù)作為100而計算的比值比率:不同類別數(shù)值的比值1、 條形圖:用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形;有單式條形圖、復(fù)式條形圖等形式;主要用于反映分類數(shù)據(jù)的頻數(shù)分布;繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖 2、帕雷托圖:按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖 ;主要用于展示分類數(shù)據(jù)的分布3、 餅圖:也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形;主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題;繪制圓形圖時,樣本或總體中各部分所占的百分比用圓內(nèi)的各個扇形角度
5、表示,這些扇形的中心角度,按各部分數(shù)據(jù)百分比占3600的相應(yīng)比例確定 4、環(huán)形圖:1、環(huán)形圖中間有一個“空洞”,樣本或總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示 2、與餅圖類似,但又有區(qū)別:a.餅圖只能顯示一個總體各部分所占的比例b.環(huán)形圖則可以同時 繪制多個樣本或總體的數(shù)據(jù)系列,每一個樣本或總體的數(shù)據(jù)系列為一個環(huán) 3、用于結(jié)構(gòu)比較研究 4、用于展示分類和順序數(shù)據(jù)P55-63 3.3.2 數(shù)值型數(shù)據(jù)的圖示1、 分組數(shù)據(jù)直方圖:用于展示分組數(shù)據(jù)分布的一種圖形;用矩形的寬度和高度來表示頻數(shù)分布(本質(zhì)上是用矩形的面積來表示頻數(shù)分布);在直角坐標(biāo)系中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)
6、就形成了一個矩形,即直方圖直方圖與條形圖的區(qū)別:A.條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的B.直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,.其高度與寬度均有意義C.直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列D.條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)2、未分組數(shù)據(jù)莖葉圖:A用于顯示未分組的原始數(shù)據(jù)的分布B由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的C以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉D樹葉上只保留最后一位數(shù)字E對于n(20 n 300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過 L
7、= 10 lg n F 莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)3.箱線圖未分組數(shù)據(jù)箱線圖:用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成繪制方法:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU);連接兩個四分位數(shù)畫出箱子,再將兩個極值點與箱子相連接未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖:未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖:4、時間序列數(shù)據(jù)線圖:表示時間序
8、列數(shù)據(jù)趨勢的圖形;時間一般繪在橫軸,數(shù)據(jù)繪在縱軸;圖形的長寬比例大致為10 : 7;一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷5、 兩個變量間的關(guān)系二維散點圖:展示兩個變量之間的關(guān)系;用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi ,yi)在坐標(biāo)系中用一個點表示,n組數(shù)據(jù)在坐標(biāo)系中形成的個點稱為散點,由坐標(biāo)及其散點形成的二維數(shù)據(jù)圖6.三個變量間的關(guān)系氣泡圖:顯示三個變量之間的關(guān)系;圖中數(shù)據(jù)點的大小依賴于第三個變量7、多變量數(shù)據(jù)雷達圖:也稱為蜘蛛圖;顯示多個變量的圖示方法;在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時十分有用;假定各變量的取
9、值具有相同的正負號,總的絕對值與圖形所圍成的區(qū)域成正比;可用于研究多個樣本之間的相似程度第四章P81-82 4.1.4 眾數(shù)、中位數(shù)和平均數(shù)的比較1、 眾數(shù)、中位數(shù)和均值的關(guān)系2、 眾數(shù)、中位數(shù)和均值的特點和應(yīng)用 眾數(shù):不受極端值影響; 具有不唯一性; 數(shù)據(jù)分布偏斜程度較大時應(yīng)用中位數(shù):不受極端值影 ;數(shù)據(jù)分布偏斜程度較大時應(yīng)用平均數(shù):易受極端值影響;數(shù)學(xué)性質(zhì)優(yōu)良;數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用P84-88 4.2.3 數(shù)值型數(shù)據(jù):方差和標(biāo)準差 極差:一組數(shù)據(jù)的最大值與最小值之差;離散程度的最簡單測度值;易受極端值影響;未考慮數(shù)據(jù)的分布 計算公式為:R = max(xi) - min(xi)
10、平均差:各變量值與其均值離差絕對值的平均數(shù);能全面反映一組數(shù)據(jù)的離散程度; 數(shù)學(xué)性質(zhì)較差,實際中應(yīng)用較少 計算公式為: 方差和標(biāo)準差:數(shù)據(jù)離散程度的最常用測度值;反映了各變量值與均值的平均差異 根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準差P89-90 4.2.4 相對離散程度:離散系數(shù)1.標(biāo)準差與其相應(yīng)的均值之比2.、對數(shù)據(jù)相對離散程度的測度3、消除了數(shù)據(jù)水平高低和計量單位的影響4.用于對不同組別數(shù)據(jù)離散程度的比較5. 計算公式為第七章P159 表7-1 常用置信水平的Z值置信水平aa/2Z(a/2)90%0.100.051.64595%0.050.025
11、1.9699%0.010.0052.58P169-172 1. 兩個總體均值之差的估計:獨立樣本 (提示EXCEL生成的分析表)P178-180 7.4 樣本量的確定第八章P196-199 8.2.2 總體均值的檢驗.大樣本:使用z-統(tǒng)計量: 小樣本,已知,使用z-統(tǒng)計量: 未知,使用t統(tǒng)計量: P203-206 8.3.2 兩個總體均值之差的檢驗 (提示EXCEL生成的分析表)1.總體標(biāo)準差已知:1)假定條件兩個樣本是獨立的隨機樣本兩個總體都是正態(tài)分布若不是正態(tài)分布, 可以用正態(tài)分布來近似(n130和 n230)(2)原假設(shè):H0: u1- u2 =0;備擇假設(shè):H1: u1- u2 =/=
12、 0(3)檢驗統(tǒng)計量為: 第九章P220 列聯(lián)分析的作用第十章P235 方差分析的作用P246 表10-4 方差分析表的一般形式P251-260 10.3 雙因素方差分析 (提示EXCEL生成的分析表第十一章P270-272 2.相關(guān)系數(shù)1、度量變量之間關(guān)系強度的一個統(tǒng)計量2、對兩個變量之間線性相關(guān)強度的度量稱為簡單相關(guān)系數(shù)3、若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為r4、若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),簡稱為相關(guān)系數(shù),記為 r。也稱為線性相關(guān)系數(shù) 或稱為Pearson相關(guān)系數(shù) 樣本相關(guān)系數(shù)的計算公式:性質(zhì)1:r 的取值范圍是 -1,1 |r|=1,為完全相關(guān)r
13、=1,為完全正相關(guān)r =-1,為完全負正相關(guān) r = 0,不存在線性相關(guān)關(guān)系 -1r0,為負相關(guān)0r1,為正相關(guān)|r|越趨于1表示關(guān)系越強;|r|越趨于0表示關(guān)系越弱性質(zhì)2:r具有對稱性。性質(zhì)3:r數(shù)值大小與x和y原點及尺度無關(guān),性質(zhì)4:僅僅是x與y之間線性關(guān)系的一個度量,它不能用于描述非線性關(guān)系。這意為著, r=0只表示兩 個變量之間不存在線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系性質(zhì)5:r雖然是兩個變量之間線性關(guān)系的一個度量,卻不一定意味著x與y一定有因果關(guān)系相關(guān)系數(shù)的經(jīng)驗解釋: |r|0.8時,可視為兩個變量之間高度相關(guān)0.5|r|0.8時,可視為中度相關(guān)0.3|r|0.5時,視為低度相
14、關(guān)|r|0.3時,說明兩個變量之間的相關(guān)程度極弱,可視為不相關(guān)上述解釋必須建立在對相關(guān)系數(shù)的顯著性進行檢驗的基礎(chǔ)之上P286 11.2.5 回歸分析結(jié)果的評價1、所估計的回歸系數(shù)的符號是否與理論或事先預(yù)期相一致2、如果理論上認為x與y之間的關(guān)系不僅是正的,而且是統(tǒng)計上顯著的,那么所建立的回歸方程也應(yīng)該如此3、回歸模型在多大程度上解釋了因變量y取值的差異?可以用判定系數(shù)R2來回答這一問題4、考察關(guān)于誤差項e的正態(tài)性假定是否成立。因為我們在對線性關(guān)系進行F檢驗和回歸系數(shù)進行t檢驗時,都要求誤差項e服從正態(tài)分布,否則,我們所用的檢驗程序?qū)⑹菬o效的。e正態(tài)性的簡單方法是畫出殘差的直方圖或正態(tài)概率圖第十
15、二章P302-303 例12.1P303-305 12.2 回歸方程的擬合優(yōu)度P305-308 12.3 顯著性檢驗P308-311 12.4 多重共線性多重共線性:回歸模型中兩個或兩個以上的自變量彼此相關(guān)多重共線性帶來的問題有: 1、可能會使回歸的結(jié)果造成混亂,甚至?xí)逊治鲆肫缤?2、可能對參數(shù)估計值的正負號產(chǎn)生影響,特別是各回歸系數(shù)的正負號有可能同我們預(yù)期的正負號相反 多重共線性的識別:1、檢測多重共線性的最簡單的一種辦法是計算模型中各對自變量之間的相關(guān)系數(shù),并對各相關(guān)系數(shù)進行顯著性檢驗通過自變量間的相關(guān)系數(shù)矩陣,若有一個或多個相關(guān)系數(shù)顯著,就表示模型中所用的自變量之間相關(guān),存在著多重共
16、線性(一般說來,相關(guān)系數(shù)超過0.9將會存在共線性問題;相關(guān)系數(shù)在0.8以上可能有問題)2、如果出現(xiàn)下列情況,暗示存在多重共線性a.型中各對自變量之間顯著相關(guān)。b.當(dāng)模型的線性關(guān)系檢驗(F檢驗)顯著時,幾乎所有回歸系數(shù)的t檢驗卻不顯著 c.回歸系數(shù)的正負號同預(yù)期的相反。 3、 多重共線性(問題的處理)a.將一個或多個相關(guān)的自變量從模型中剔除,使保留的自變量盡可能不相關(guān)b.如果要在模型中保留所有的自變量,則應(yīng)避免根據(jù) t 統(tǒng)計量對單個參數(shù)進行檢驗對因變量值的推斷(估計或預(yù)測)的限定在自變量樣本值的范圍內(nèi)c.增大樣本量,有時可以部分解決共線性問題。d.采用多種自變量篩選方法相結(jié)合的方式,建立一個最優(yōu)的逐步回歸方程。e.從專業(yè)的角度加以判斷,人為去除在專業(yè)上較次要的,或缺失值較多、測量誤差較大的共線性因子。f.進行主成分分析,用提取出的因子代替原變量進行回歸分析。g.進行嶺回歸分析,可以有效的解決多重共線性問題。h.進行通經(jīng)分析,采用結(jié)構(gòu)方程,可以對應(yīng)/自變量間復(fù)雜的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 消防安全管理實施指南(標(biāo)準版)
- 2025年企業(yè)財務(wù)分析指導(dǎo)手冊
- 煙草專賣管理與監(jiān)管流程(標(biāo)準版)
- 電影院票務(wù)銷售與退換票制度
- 物流運輸操作流程與安全管理規(guī)范
- 超市員工績效考核及獎懲標(biāo)準制度
- 產(chǎn)品研發(fā)與創(chuàng)新管理制度
- 辦公室員工培訓(xùn)效果評估指標(biāo)制度
- 辦公室員工獎懲與考核制度
- 2026年新鄉(xiāng)某國有企業(yè)公開招聘備考題庫及答案詳解一套
- 2022年上海市各區(qū)中考一模語文試卷及答案
- 重慶市智慧園林綠化管理信息系統(tǒng)-可行性研究報告(國信咨詢)
- 污水處理銷售工作總結(jié)
- 迎接期末+做自己的英雄 高二上學(xué)期心理健康教育主題班會
- TRIZ-阿奇舒勒矛盾矩陣表格
- GB/T 4074.5-2024繞組線試驗方法第5部分:電性能
- 招標(biāo)代理服務(wù)服務(wù)方案
- 氣體制劑機械相關(guān)項目可行性研究分析報告
- 食堂外包監(jiān)督管理制度
- 頂板離層儀管理規(guī)定
- 長輸管道施工技術(shù)(完整版)
評論
0/150
提交評論