版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、應(yīng)用統(tǒng)計學(xué)應(yīng)用統(tǒng)計學(xué)周忠良周忠良公共政策與管理學(xué)院公共政策與管理學(xué)院Telmail:參考教材參考教材n何曉群,何曉群,現(xiàn)代統(tǒng)計分析方法與應(yīng)用現(xiàn)代統(tǒng)計分析方法與應(yīng)用(第三版第三版),中國人民大學(xué)出版社,中國人民大學(xué)出版社,2012n盧淑華,社會統(tǒng)計學(xué)(第四版),北京大學(xué)出盧淑華,社會統(tǒng)計學(xué)(第四版),北京大學(xué)出版社,版社,2009為什么要學(xué)習(xí)統(tǒng)計學(xué)?為什么要學(xué)習(xí)統(tǒng)計學(xué)?課程內(nèi)容課程內(nèi)容導(dǎo)論導(dǎo)論參數(shù)估計和參數(shù)估計和假設(shè)檢驗假設(shè)檢驗分類數(shù)據(jù)分分類數(shù)據(jù)分析析數(shù)值型數(shù)據(jù)數(shù)值型數(shù)據(jù)分析分析線性回歸模線性回歸模型型二分類變量二分類變量回歸模型回歸模型聚類分析聚類分析主成分分析主成分
2、分析因子分析因子分析通徑分析通徑分析 統(tǒng)計過程統(tǒng)計過程實際問題實際問題(Practical problem)數(shù)據(jù)收集數(shù)據(jù)收集(Data collection)數(shù)據(jù)整理數(shù)據(jù)整理(Data cleaning)數(shù)據(jù)分析數(shù)據(jù)分析(Data analysis)數(shù)據(jù)解釋數(shù)據(jù)解釋(Data interpretation)描述統(tǒng)計描述統(tǒng)計推斷統(tǒng)計推斷統(tǒng)計理論統(tǒng)計理論統(tǒng)計應(yīng)用統(tǒng)計應(yīng)用統(tǒng)計|統(tǒng)計學(xué)的類型統(tǒng)計學(xué)的類型描述統(tǒng)計與推斷統(tǒng)計的關(guān)系描述統(tǒng)計與推斷統(tǒng)計的關(guān)系1分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)2觀測數(shù)據(jù)和實驗數(shù)據(jù)觀測數(shù)據(jù)和實驗數(shù)據(jù)3截面數(shù)據(jù)和時間序列數(shù)據(jù)截面數(shù)據(jù)和時間序列數(shù)據(jù)第四節(jié)第
3、四節(jié) 統(tǒng)計數(shù)據(jù)的類型統(tǒng)計數(shù)據(jù)的類型什么是統(tǒng)計數(shù)據(jù)?什么是統(tǒng)計數(shù)據(jù)?(data)1.對現(xiàn)象進行計量的結(jié)果對現(xiàn)象進行計量的結(jié)果 2.不是指單個的數(shù)字,而是由多個數(shù)據(jù)構(gòu)成不是指單個的數(shù)字,而是由多個數(shù)據(jù)構(gòu)成的數(shù)據(jù)集的數(shù)據(jù)集 3.不僅僅是指數(shù)字,它可以是數(shù)字的,也可不僅僅是指數(shù)字,它可以是數(shù)字的,也可以是文字的以是文字的 統(tǒng)計數(shù)據(jù)的分類統(tǒng)計數(shù)據(jù)的分類n統(tǒng)計數(shù)據(jù)的分類統(tǒng)計數(shù)據(jù)的分類n按計量層次按計量層次n按時間狀況按時間狀況n按收集方法按收集方法統(tǒng)計數(shù)據(jù)的分類 (按計量尺度分)u分類數(shù)據(jù)分類數(shù)據(jù)(categorical data) u順序數(shù)據(jù)順序數(shù)據(jù)(rank data)u數(shù)值型數(shù)據(jù)數(shù)值型數(shù)據(jù)(Metr
4、ic data) 性別、年齡、民族、婚姻狀況、文化程度、醫(yī)保類型、產(chǎn)性別、年齡、民族、婚姻狀況、文化程度、醫(yī)保類型、產(chǎn)品的等級、家庭收入、高血壓級別、入院病情、患病次數(shù)、品的等級、家庭收入、高血壓級別、入院病情、患病次數(shù)、住院費用住院費用u分類數(shù)據(jù)分類數(shù)據(jù)(categorical data) 對事物進行分類的結(jié)果對事物進行分類的結(jié)果數(shù)據(jù)表現(xiàn)為類別,用文字來表述數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,人口按性別分為男、女兩類例如,人口按性別分為男、女兩類 u分類數(shù)據(jù)分析方法分類數(shù)據(jù)分析方法描述性統(tǒng)計方法描述性統(tǒng)計方法 構(gòu)成比、餅圖、條圖構(gòu)成比、餅圖、條圖假設(shè)檢驗假設(shè)檢驗 Z檢驗、卡方檢驗檢驗、卡方檢驗
5、相關(guān)分析相關(guān)分析 列聯(lián)相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)回歸模型回歸模型 廣義線性模型廣義線性模型u等級數(shù)據(jù)等級數(shù)據(jù)(rank data) 對事物類別等級的測度對事物類別等級的測度數(shù)據(jù)表現(xiàn)為類別,用文字來表述數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,產(chǎn)品分為一等品、二等品、三等品、例如,產(chǎn)品分為一等品、二等品、三等品、次品等次品等 u等級數(shù)據(jù)分析方法等級數(shù)據(jù)分析方法描述性統(tǒng)計方法描述性統(tǒng)計方法 構(gòu)成比、餅圖、條圖構(gòu)成比、餅圖、條圖假設(shè)檢驗假設(shè)檢驗 秩和檢驗秩和檢驗相關(guān)分析:相關(guān)分析: 秩相關(guān)秩相關(guān)回歸模型:回歸模型: 有序回歸(有序回歸(ordinal regression )u數(shù)值型數(shù)據(jù)數(shù)值型數(shù)據(jù)(metric
6、data) 對事物的精確測度對事物的精確測度結(jié)果表現(xiàn)為具體的數(shù)值結(jié)果表現(xiàn)為具體的數(shù)值例 如 : 身 高 為例 如 : 身 高 為 175cm、 168cm、183cmu數(shù)值型數(shù)據(jù)分析方法數(shù)值型數(shù)據(jù)分析方法描述性統(tǒng)計方法:描述性統(tǒng)計方法: 集中趨勢、離散趨勢、集中趨勢、離散趨勢、95%CI、直方圖、線圖、箱圖、直方圖、線圖、箱圖假設(shè)檢驗:假設(shè)檢驗: t檢驗、方差分析檢驗、方差分析相關(guān)分析相關(guān)分析 pearson相關(guān)相關(guān)回歸模型回歸模型 線性回歸模型、線性回歸模型、Tobit模型、負(fù)二項模型模型、負(fù)二項模型統(tǒng)計數(shù)據(jù)的分類(按收集方法分)1.觀測的數(shù)據(jù)觀測的數(shù)據(jù)(observational data
7、) n通過調(diào)查或觀測而收集到的數(shù)據(jù)n在沒有對事物人為控制的條件下而得到的n有關(guān)社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù)2.試驗的數(shù)據(jù)試驗的數(shù)據(jù)(experimental data) n在試驗中控制試驗對象而收集到的數(shù)據(jù)n比如,對一種新藥療效的試驗,對一種新的農(nóng)作物品種的試驗等n自然科學(xué)領(lǐng)域的數(shù)據(jù)大多數(shù)都為試驗數(shù)據(jù)統(tǒng)計數(shù)據(jù)的分類(按時間狀況分)u截面數(shù)據(jù)(cross-sectional data) n在相同或近似相同的時間點上收集的數(shù)據(jù)n描述現(xiàn)象在某一時刻的變化情況n比如,2002年我國各地區(qū)的國內(nèi)生產(chǎn)總值數(shù)據(jù)u時間序列數(shù)據(jù)(time series data) n在不同時間上收集到的數(shù)據(jù)n描述現(xiàn)象
8、隨時間變化的情況n比如,1996年至2002年國內(nèi)生產(chǎn)總值數(shù)據(jù)u混合橫截面數(shù)據(jù)混合橫截面數(shù)據(jù)(pooled cross section data) n是橫截面數(shù)據(jù)和時間序列并存的二維空間;n在不同時點,從一個大總體里進行多次隨機抽樣;n把不同時點抽取的隨機樣本合并起來就構(gòu)成了一個獨立混合橫截面數(shù)據(jù);n在每一個時點上進行的都是隨機抽樣,所以混合截面數(shù)據(jù)是由獨立抽取的觀測值構(gòu)成。u面板數(shù)據(jù)面板數(shù)據(jù)(panel data)n又稱縱列數(shù)據(jù)(Longitudinal Data),是指不同的橫截面?zhèn)€體在不同的時間上的觀測值的集合;n從水平看,它包括了某一時間上的不同的橫截面?zhèn)€體的數(shù)據(jù);n從縱向看,它包括了
9、每一橫截面的時間序列數(shù)據(jù)。第六節(jié)第六節(jié) 統(tǒng)計中的幾個基本概念統(tǒng)計中的幾個基本概念1總體和樣本總體和樣本2參數(shù)和統(tǒng)計量參數(shù)和統(tǒng)計量3變量變量總體和樣本1.總體總體(population)n所研究的全部元素的集合 ,其中的每一個元素稱為個體 n分為有限總體和無限總體n有限總體的范圍能夠明確確定,且元素的數(shù)目是有限的n無限總體所包括的元素是無限的,不可數(shù)的2.樣本樣本 (sample)n從總體中抽取的一部分元素的集合n構(gòu)成樣本的元素的數(shù)目稱為樣本容量 參數(shù)和統(tǒng)計量1.參數(shù)參數(shù)(parameter)n研究者想要了解的總體的某種特征值n所關(guān)心的參數(shù)主要有總體均值()、標(biāo)準(zhǔn)差()、總體比例()等n總體參數(shù)
10、通常用希臘字母表示 2.統(tǒng)計量統(tǒng)計量(statistic)n根據(jù)樣本數(shù)據(jù)計算出來的一個量 n所關(guān)心的樣本統(tǒng)計量有樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等n樣本統(tǒng)計量通常用小寫英文字母來表示 變 量(Variable) 1.說明現(xiàn)象某種特征的概念n如商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級等n變量的具體表現(xiàn)稱為變量值,即數(shù)據(jù)2.變量可以分為n分類變量(categorical variable) :說明事物類別的一個名稱n順序變量(rank variable) :說明事物有序類別的一個名稱n數(shù)值型變量(metric variable) :說明事物數(shù)字特征的一個名稱 n離散變量:取有限個值
11、n連續(xù)變量:可以取無窮多個值 統(tǒng)計中的幾個基本概念幾種常用的統(tǒng)計軟件幾種常用的統(tǒng)計軟件(Software)n典型的統(tǒng)計軟件典型的統(tǒng)計軟件n數(shù)據(jù)庫數(shù)據(jù)庫 Access, Excel, Epidata, Oracol 一個變量一列,一個病例一行n統(tǒng)計分析軟件統(tǒng)計分析軟件 SPSS: 菜單操作為主 Stata: 程序菜單操作 SAS: 程序為主 S-plus: 程序菜單操作Stata軟件軟件nStata 是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專業(yè)圖是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專業(yè)圖表的完整及整合性統(tǒng)計軟件。表的完整及整合性統(tǒng)計軟件。n數(shù)值變量資料的一般分析:數(shù)值變量資料的一般分
12、析:參數(shù)估計,t檢驗,單因素和多因素的方差分析,協(xié)方差分析,交互效應(yīng)模型,平衡和非平衡設(shè)計,嵌套設(shè)計,隨機效應(yīng),多個均數(shù)的兩兩比較,缺項數(shù)據(jù)的處理,方差齊性檢驗,正態(tài)性檢驗,變量變換等。n分類資料的一般分析:分類資料的一般分析:參數(shù)估計,列聯(lián)表分析 ( 列聯(lián)系數(shù),確切概率 ) ,流行病學(xué)表格分析等。n順序資料的一般分析:順序資料的一般分析:秩變換,秩和檢驗,秩相關(guān)等。n相關(guān)與回歸分析:相關(guān)與回歸分析:簡單相關(guān),偏相關(guān),典型相關(guān),以及多達數(shù)十種的回歸分析方法,如多元線性回歸,逐步回歸,加權(quán)回歸,穩(wěn)鍵回歸,二階段回歸,Cox 比例風(fēng)險回歸,指數(shù)與 Weibull 回歸,多類結(jié)果與有序結(jié)果的 log
13、istic 回歸,Tobit回歸,Poisson 回歸,負(fù)二項回歸及廣義負(fù)二項回歸,隨機效應(yīng)的線性回歸模型等。n其他方法:其他方法:質(zhì)量控制,整群抽樣的設(shè)計效率,診斷試驗評價, kappa 等。Stata、SPSS與與SASnStata 其統(tǒng)計分析能力遠(yuǎn)遠(yuǎn)超過了 SPSS ,在許多方面也超過了 SAS 。n由于 Stata 在分析時是將數(shù)據(jù)全部讀入內(nèi)存,在計算全部完成后才和磁盤交換數(shù)據(jù),因此計算速度極快(一般來說, SAS 的運算速度要比 SPSS 至少快一個數(shù)量級,而 Stata 的某些模塊和執(zhí)行同樣功能的 SAS 模塊比,其速度又比 SAS 快將近一個數(shù)量級?。﹏ Stata 也是采用命令行方式來操作,但使用上遠(yuǎn)比 SAS 簡單。其
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030便利店行業(yè)競爭格局與加盟體系優(yōu)化研究報告
- 2025-2030中國防輻射市場需求前景預(yù)測與投資價值評估研究報告
- 2025-2030中國智能陽臺行業(yè)市場現(xiàn)狀分析及投資評估規(guī)劃前景研究報告
- 2025-2030中國電腦散熱風(fēng)扇行業(yè)需求規(guī)模預(yù)測及競爭戰(zhàn)略規(guī)劃研究報告
- 2025-2030中國生物飼料行業(yè)投資效益分析及需求格局趨勢預(yù)測研究報告
- 2026年浙江省溫嶺市衛(wèi)生事業(yè)單位公開招聘醫(yī)學(xué)衛(wèi)生類高學(xué)歷人才備考題庫及一套完整答案詳解
- 涼州區(qū)從2026屆小學(xué)全科型教師培養(yǎng)計劃畢業(yè)生中公開招聘事業(yè)單位工作人員備考題庫及完整答案詳解一套
- 2025至2030中國白羽肉雞種源自主化進程與市場替代空間研究報告
- 2026年長春市消防救援支隊南部都市經(jīng)濟開發(fā)區(qū)大隊公開招錄政府專職消防員的備考題庫及參考答案詳解一套
- 安泰天龍鎢鉬科技有限公司招聘備考題庫-2026屆及答案詳解1套
- 植入式靜脈給藥裝置(輸液港)-中華護理學(xué)會團體標(biāo)準(zhǔn)2023
- GB/T 2988-2023高鋁磚
- 東風(fēng)7電路圖解析
- 數(shù)字填圖系統(tǒng)新版(RgMap2.0)操作手冊
- YY/T 1778.1-2021醫(yī)療應(yīng)用中呼吸氣體通路生物相容性評價第1部分:風(fēng)險管理過程中的評價與試驗
- FZ/T 73009-2021山羊絨針織品
- JJF 1069-2012 法定計量檢定機構(gòu)考核規(guī)范(培訓(xùn)講稿)
- 2011-2015廣汽豐田凱美瑞維修手冊wdl
- DFMEA編制作業(yè)指導(dǎo)書新版
- DB35∕T 1844-2019 高速公路邊坡工程監(jiān)測技術(shù)規(guī)程
- 城市管理綜合執(zhí)法局城管執(zhí)法與執(zhí)法程序PPT模板
評論
0/150
提交評論