版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、描述統(tǒng)計分析,1. 編程方法 2. SAS/ANALYST 3. SAS/INSIGHT 4. SAS/ASSIST,基本概念,南京財經(jīng)大學(xué) 管于華,比較,案例數(shù)據(jù),描述統(tǒng)計,1. 檢驗數(shù)據(jù)的真實性 (對“臟”數(shù)據(jù)進行清洗) 2. 對大量數(shù)據(jù)進行壓縮 (次數(shù)分布表、描述統(tǒng)計量) 3. 表現(xiàn)數(shù)據(jù) (利用統(tǒng)計圖、統(tǒng)計表),次數(shù)分布表,典型的次數(shù)分布表:,編制,編制步驟,編制變量次數(shù)分布表的過程可以分解為五步: 排序并求出全距(最大值最小值); 確定組數(shù)和組距; 確定組限; 歸組并計算出各組的次數(shù); 顯示或打印出次數(shù)分布表。,描述統(tǒng)計量,反映集中趨勢的描述統(tǒng)計量: 數(shù)值平均數(shù):算術(shù)平均數(shù)、調(diào)和平均數(shù)
2、、幾何平均數(shù) 位置平均數(shù):眾數(shù)、中位數(shù)、分位數(shù),反映離中趨勢的描述統(tǒng)計量: 全距、平均差、標準差(方差)、離散系數(shù)、標準誤,反映分布趨勢的描述統(tǒng)計量: 偏度 、 峰度,數(shù)據(jù)標準化,SAS中的統(tǒng)計量,SAS中的統(tǒng)計量,總體與樣本標準差,簡單式,加權(quán)式,總體,樣本,方差是變量值與其算術(shù)平均數(shù)的離差平方的算術(shù)平均數(shù),標準差是方差的平方根,又稱均方差,其計量單位與平均數(shù)的計量單位相同。,離散系數(shù),對于平均數(shù)不等或計量單位不同的不同組別的變量值,是不能直接用離散程度的絕對指標比較其離散程度的。為了消除變量平均數(shù)不等和計量單位不同對離散程度測度值的影響,需要計算離散程度的相對指標,即離散系數(shù),其一般公式是
3、:,偏度,偏度(Skewness)是對分布偏斜方向和程度的測度。變量分組后,總體中各個體在不同的分組變量值下分布并不均勻?qū)ΨQ,而呈現(xiàn)出偏斜的分布狀況,統(tǒng)計上將其稱為偏態(tài)分布。,偏度系數(shù) 的數(shù)值一般在0與3之間,越接近0,分布的偏斜度越?。辉浇咏?,分布的偏斜度越大。,峰度,峰度(Kurtosis)是分布集中趨勢高峰的形狀。在變量數(shù)列的分布特征中,常常以正態(tài)分布為標準,觀察變量數(shù)列分布曲線頂峰的尖平程度,統(tǒng)計上稱之為峰度。,正態(tài)分布的峰度系數(shù)為0,當0時為尖峰分布,當0時為平頂分布。,數(shù)據(jù)標準化,標準化數(shù)值是變量值與其平均數(shù)的離差除以標準差后的值,也稱為z分數(shù)或標準分數(shù)。設(shè)標準化數(shù)值為z,則有:
4、,標準化后的數(shù)列均值為0,方差為1。,統(tǒng)計圖,直觀表現(xiàn)數(shù)據(jù): 條(柱)形圖 餅圖 折線圖 圓環(huán)圖 Bar chart Pie chart Line Chart 輔助統(tǒng)計分析: 箱形圖 QQ圖 PP圖 Box- var a; run;,箱形圖,QQ圖,PP圖,統(tǒng)計表,簡單表:指未經(jīng)任何分組的統(tǒng)計表 又稱 一覽表 簡單分組表:指只用一個標志分組形成的統(tǒng)計表簡稱 分組表 復(fù)合分組表:指按兩個或兩個以上標志進行分組簡稱 復(fù)合表,一覽表,分組表,復(fù)合表,五個過程,描述性統(tǒng)計指標的計算主要通過以下五個不同的過程來實現(xiàn): Means 過程 Summary 過程 Tabulate過程 Univariate 過
5、程 Freq 過程,Means過程格式,解釋,Summary 過程,解釋,Univariate 過程,Univariate過程和以上兩個過程的格式非常相似,所不同的是某些統(tǒng)計量只能在Univariate過程中計算(如眾數(shù)),Univariate過程有繪圖功能。histogram語句即用來指示對所指定的變量繪制直方圖,選項用來指示添加不同類型的擬合圖形。,解釋,Tabulate 過程,解釋,Freq過程,解釋,案例數(shù)據(jù),data03_01:40對數(shù)據(jù)(name, age,gender-男 女,height,weight)是按age排序的 (又名:class.sas7bdat) data03_02
6、:110名7歲男童的身高(cm)資料(僅一個變量a) (又名:boys.sas7bdat) data03_03:100名學(xué)生的考試成績(x是組中值,f是次數(shù),w是權(quán)數(shù)) (又名:students.sas7bdat),比較,SAS/ANALYST, 單擊“Solutions”AnalysisAnalyst, 或在命令行鍵入“Analyst” 單擊“File”O(jiān)pen By SAS Name, 調(diào)入數(shù)據(jù)集文件 單擊“Statistics”Descriptive 分:匯總統(tǒng)計量 分布 頻數(shù)統(tǒng)計,例題:110名7歲男童的身高(cm)資料,例題-匯總統(tǒng)計量,例題:110名7歲男童的身高(cm)資料,執(zhí)行Means過程,例題-分布,例題:110名7歲男童的身高(cm)資料,執(zhí)行Univariate過程,例題-頻數(shù)統(tǒng)計,例題:110名7歲男童的身高(cm)資料,執(zhí)行Freq過程,SAS/INSIGHT, 單擊 SolutionsAnalysisInteractive Data Analysis 單擊Open按鈕,調(diào)入數(shù)據(jù)集文件 單擊“Analyze”Distribution(Y),例題:110名7歲男童的身高(cm)資料,例題,例題:110名7歲男童的身高(cm)資料,SAS/ASSIST, 單擊 SolutionsASSIST 選擇Data Analysis-Elementary
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年湖南環(huán)境生物職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性考試備考試題及答案解析
- 2025年山東單招技能題庫及答案
- 基于視覺的顯示同步
- 2025年欽州英語高考真題及答案
- 商務(wù)述職報告
- 藍色2026新征程再起航簡約年終工作總結(jié)匯報
- 麻風(fēng)十大線索培訓(xùn)課件
- 城市物流中心的設(shè)計與優(yōu)化
- 2025年廣東省江門臺山一中自主招生英語試卷真題(含答案)
- 微信在線考試題目及答案
- 寧夏調(diào)味料項目可行性研究報告
- GRR計算表格模板
- 長沙市長郡雙語實驗學(xué)校人教版七年級上冊期中生物期中試卷及答案
- 馬克思主義經(jīng)典著作選讀智慧樹知到課后章節(jié)答案2023年下四川大學(xué)
- 金庸短篇小說《越女劍》中英文對照版
- 2023年洛陽市洛龍區(qū)政務(wù)中心綜合窗口人員招聘筆試題庫及答案解析
- GB/T 19867.1-2005電弧焊焊接工藝規(guī)程
- GB/T 16102-1995車間空氣中硝基苯的鹽酸萘乙二胺分光光度測定方法
- GB/T 15171-1994軟包裝件密封性能試驗方法
- 醫(yī)院轉(zhuǎn)院證明樣本圖片(范文四篇)
- 外科護理學(xué)期末試卷3套18p
評論
0/150
提交評論