版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
關(guān)于簡(jiǎn)單統(tǒng)計(jì)分析與過(guò)程一、假設(shè)檢驗(yàn)與SAS過(guò)程平均每戶消費(fèi)支出5006007008009001000家庭數(shù)8153025139例題6.1:為了了解農(nóng)村居民家庭消費(fèi)水平是否有所提高,2008年,某市對(duì)其農(nóng)村居民家庭進(jìn)行了一次抽樣調(diào)查,其中100戶被抽樣家庭的調(diào)查結(jié)果如下表:表6.12008年某市農(nóng)村居民家庭月均消費(fèi)水平若3年前該市農(nóng)村居民家庭月均消費(fèi)支出服從N(720,17580),假定2008年月均消費(fèi)支出服從正態(tài)分布,問(wèn)該市農(nóng)村居民家庭月均消費(fèi)支出是否有顯著提高?(顯著性水平0.05)即在方差未知的情況下檢驗(yàn)第2頁(yè),共43頁(yè),2024年2月25日,星期天統(tǒng)計(jì)量的計(jì)算值、臨界值、顯著性水平及檢驗(yàn)概率之間的關(guān)系假定檢驗(yàn)統(tǒng)計(jì)量Z服從正態(tài)分布統(tǒng)計(jì)量的計(jì)算值:一次抽樣觀測(cè)值代入統(tǒng)計(jì)量Z后得到的數(shù)值Z0.臨界值:在給定的顯著性水平下,由第3頁(yè),共43頁(yè),2024年2月25日,星期天統(tǒng)計(jì)量的計(jì)算值、臨界值、顯著性水平及檢驗(yàn)概率之間的關(guān)系檢驗(yàn)概率:由臨界值和檢驗(yàn)概率的計(jì)算公式,可知因此,判斷接受或拒絕H0只需看p大于還是小于第4頁(yè),共43頁(yè),2024年2月25日,星期天單樣本和兩樣本下的假設(shè)檢驗(yàn)單樣本的假設(shè)檢驗(yàn)(一)單樣本的參數(shù)假設(shè)檢驗(yàn)(正態(tài)分布總體)
總體均值的假設(shè)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量:拒絕域:第5頁(yè),共43頁(yè),2024年2月25日,星期天檢驗(yàn)統(tǒng)計(jì)量:拒絕域:第6頁(yè),共43頁(yè),2024年2月25日,星期天對(duì)于總體均值的假設(shè)檢驗(yàn),可轉(zhuǎn)化為均值是否為零的檢驗(yàn),可通過(guò)PROCMEANS過(guò)程實(shí)現(xiàn),只需在選項(xiàng)中選擇t,prt,和clm,alpha。例6.1程序:dataconsume;inputexpendnumber@@;dif=expend-720;cards;50086001575030800259001310009;procmeansmeantprt;vardif;freqnumber;outputout=meantt=tv;run;第7頁(yè),共43頁(yè),2024年2月25日,星期天由于檢驗(yàn)變量dif=expend-720的t值=3.17,概率pr>|t|的值為0.0020,小于顯著性水平0.05,故在0.05的顯著性水平下推斷出dif的均值顯著不為0,也即居民月均消費(fèi)支出顯著不等于720.第8頁(yè),共43頁(yè),2024年2月25日,星期天dataa;setmeant;k=_freq_-1;p=1-probt(tv,k);t1=tinv(0.95,k);procprint;run;
p=1-probt(t,k)t1=tinv(0.95,k);計(jì)算t分布的0.95分位數(shù)顯然,tv的值>t1且p值也<0.05,故在0.05的顯著性水平下拒絕原假設(shè),也即接受居民月均消費(fèi)支出顯著大于720.第9頁(yè),共43頁(yè),2024年2月25日,星期天
總體方差的假設(shè)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量:拒絕域:第10頁(yè),共43頁(yè),2024年2月25日,星期天例6.2:檢驗(yàn)例6.1中居民消費(fèi)支出的方差是否有變化,即是否仍為17580。procmeansvar;varexpend;freqnumber;outputout=testvar=varex;run;dataA(drop=_type_);settest;k=_freq_-1;chisq=k*varex/17580;p=1-probchi(chisq,k);
ci1=cinv(0.025,k);ci2=cinv(0.975,k);procprintdata=anoobs;run;第11頁(yè),共43頁(yè),2024年2月25日,星期天程序說(shuō)明:ci1=cinv(0.025,k);ci2=cinv(0.975,k);chisq=k*varex/17580;p=1-probchi(chisq,k);
分別計(jì)算分布的0.025和0.975分位數(shù)。由于chisq統(tǒng)計(jì)量值滿足ci1<chisq<ci2,正好落在拒絕域外,故接受原假設(shè),認(rèn)為方差沒(méi)有發(fā)生顯著變化。另一方面,p=0.48018>0.05也表明,在0.05的顯著性水平下,接受原假設(shè)。第12頁(yè),共43頁(yè),2024年2月25日,星期天(二)單樣本的非參數(shù)假設(shè)檢驗(yàn)K.Pearson提出以下統(tǒng)計(jì)量:
總體分布的擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)是根據(jù)樣本的經(jīng)驗(yàn)分布對(duì)總體分布作出的估計(jì)。拒絕域:第13頁(yè),共43頁(yè),2024年2月25日,星期天表6.3訂單頻數(shù)分布表星期一星期二星期三星期四星期五合計(jì)71215111560問(wèn):該企業(yè)的訂單在每星期5天中是否服從均勻分布?(顯著性水平0.05)例6.3
某企業(yè)欲了解其產(chǎn)品訂單的分布情況,在隨機(jī)選擇的一周中發(fā)現(xiàn),其訂單頻數(shù)分布如下表:第14頁(yè),共43頁(yè),2024年2月25日,星期天程序?qū)崿F(xiàn):datachisq;inputfoifei@@;dif=(foi-fei);div=dif*dif/fei;cards;7121212151211121512; procmeanssum;vardiv;outputout=testsum=chisq;run;dataA;settest;k=_freq_-1;p=1-probchi(chisq,k);ci1=cinv(0.025,k);ci2=cinv(0.975,k);procprintdata=anoobs;run;第15頁(yè),共43頁(yè),2024年2月25日,星期天程序說(shuō)明:ci1=cinv(0.025,k);ci2=cinv(0.975,k);div=dif*dif/fei;procmeanssum;vardiv;outputout=testsum=chisq;
p=1-probchi(chisq,k);
分別計(jì)算分布的0.025和0.975分位數(shù)。第16頁(yè),共43頁(yè),2024年2月25日,星期天由于chisq統(tǒng)計(jì)量值滿足ci1<chisq<ci2,正好落在拒絕域外,故接受原假設(shè),認(rèn)為訂單在每周的5天中服從均勻分布。另一方面,p=0.45299>0.05也表明,在0.05的顯著性水平下,接受原假設(shè)。第17頁(yè),共43頁(yè),2024年2月25日,星期天
總體均值的非參數(shù)檢驗(yàn)(總體不服從正態(tài)分布)利用UNIVARIATE過(guò)程中的符號(hào)檢驗(yàn)與威爾克森秩和檢驗(yàn)。dataconsume;inputexpendnumber@@;dif=expend-720;cards;50086001575030800259001310009;procunivariatealpha=0.1;vardif;freqnumber;run;第18頁(yè),共43頁(yè),2024年2月25日,星期天總體不服從正態(tài)分布,利用符號(hào)檢驗(yàn)與威爾克森秩和檢驗(yàn)(符號(hào)秩檢驗(yàn))。由于Pr>=|M|的P值小于0.0001,Pr>=|S|的P值為0.002,都小于給定的顯著性水平,故拒絕原假設(shè),認(rèn)為dif均值不為零,與即認(rèn)為居民家庭月均消費(fèi)支出顯著大于720.第19頁(yè),共43頁(yè),2024年2月25日,星期天兩樣本的假設(shè)檢驗(yàn)(一)兩獨(dú)立組的假設(shè)檢驗(yàn)獨(dú)立組:兩樣本來(lái)自于兩個(gè)獨(dú)立總體樣本需滿足以下兩個(gè)條件:正態(tài)性,方差齊次性。檢驗(yàn)統(tǒng)計(jì)量:拒絕域檢驗(yàn)可通過(guò)Procttest實(shí)現(xiàn)第20頁(yè),共43頁(yè),2024年2月25日,星期天
滿足正態(tài)性而不滿足方差齊次性時(shí),采用參數(shù)的近似T檢驗(yàn)或非參數(shù)的威爾克森秩和檢驗(yàn)。
兩個(gè)條件都不滿足時(shí),采用非參數(shù)的威爾克森秩和檢驗(yàn)。(procnparlwaywilcoxon;)第21頁(yè),共43頁(yè),2024年2月25日,星期天滿足正態(tài)分布條件表6.4地區(qū)A和B家庭平均收入水平情況A地區(qū)2.52.93.25.33.84.24.03.93.33.14.54.74.25.75.13.04.92.73.84.6B地區(qū)3.74.14.33.63.93.84.74.45.35.13.83.76.05.52.93.45.23.84.84.6問(wèn):這兩個(gè)地區(qū)的家庭平均收入是否有顯著差異?(顯著性水平0.05)例6.4:某銀行考慮在兩個(gè)相鄰地區(qū)A和B之間開(kāi)設(shè)一個(gè)新的營(yíng)業(yè)網(wǎng)點(diǎn)。銀行所關(guān)心的時(shí)這兩個(gè)地區(qū)家庭平均收入是否相同。為此,在這兩個(gè)地區(qū)分別抽取了20戶居民家庭進(jìn)行調(diào)查,調(diào)查結(jié)果如下表:第22頁(yè),共43頁(yè),2024年2月25日,星期天dataincome;inputarea$income@@;cards;A2.5B3.7A3.2B4.3A3.8B3.9A4.0B4.7A3.3B5.3A4.5B3.8A4.2B6.0A5.1B2.9A4.9B5.2A3.8B4.8A2.9B4.1A5.3B3.6A4.2B3.8A3.9B4.4A3.1B5.1A4.7B3.7A5.7B5.5A3.0B3.4A2.7B3.8A4.6B4.6;procsort;byarea;run;procunivariatenormal;varincome;byarea;run;procttest;classarea;varincome;run;第23頁(yè),共43頁(yè),2024年2月25日,星期天area=A的正態(tài)性檢驗(yàn)結(jié)果area=B的正態(tài)性檢驗(yàn)結(jié)果由于W檢驗(yàn)的P值都大于給定的顯著性水平,故接受原假設(shè),認(rèn)為都服從正態(tài)分布。第24頁(yè),共43頁(yè),2024年2月25日,星期天又由方差是否相等(EqualityofVariances)的F檢驗(yàn):F值=1.31,P值Pr>F=0.5658(>0.05),故認(rèn)為兩組方差相等。因此可用T檢驗(yàn)對(duì)兩組均值是否相等進(jìn)行檢驗(yàn),對(duì)應(yīng)T檢驗(yàn)的T值=-1.32,P值Pr>|T|=0.1938(>0.05),接受原假設(shè),即A,B兩地區(qū)家庭收入沒(méi)有顯著差異。第25頁(yè),共43頁(yè),2024年2月25日,星期天正態(tài)性不滿足datazichfz;inputtype$rate@@;cards;pt99.4pt94.8pt38.4pt52.7pt92.1pt87.9pt334.2pt86.9pt134.5pt74.9pt69.9pt48.0pt104.9pt67.8pt60.8pt59.5pt62.0pt75.4pt715.2pt15.3pt224.6pt90.6pt86.7pt65.4pt77.1pt354.2pt59.7nopt31.3nopt54.7nopt29.7nopt40.0nopt55.1nopt32.6nopt59.2nopt46.9nopt52.9nopt29.1nopt64.8nopt35.0nopt56.6nopt44.5nopt52.3nopt21.8nopt52.0nopt28.0nopt24.0nopt13.5nopt29.8nopt67.1nopt17.1nopt48.1nopt30.8nopt32.6nopt24.1;procsort;bytype;run;procunivariatenormal;varrate;bytype;run;procnpar1waywilcoxon;classtype;varrate;run;見(jiàn)課本例6.6第26頁(yè),共43頁(yè),2024年2月25日,星期天type=nopt的正態(tài)性檢驗(yàn)結(jié)果type=pt的正態(tài)性檢驗(yàn)結(jié)果由于W檢驗(yàn)的P值0.2488>0.05,故接受原假設(shè),認(rèn)為服從正態(tài)分布。由于W檢驗(yàn)的P值<0.0001,故拒絕原假設(shè),認(rèn)為不服從正態(tài)分布。第27頁(yè),共43頁(yè),2024年2月25日,星期天采用非參數(shù)檢驗(yàn)WilcoxonTwo-SampleTest檢驗(yàn)中的近似Z檢驗(yàn)和近似T檢驗(yàn)的雙側(cè)檢驗(yàn)的P值都<0.001,故拒絕原假設(shè),即兩類公司的資產(chǎn)負(fù)債率有顯著差異。第28頁(yè),共43頁(yè),2024年2月25日,星期天又由于nopt類公司資產(chǎn)負(fù)債率rate的均值39.7629630顯然小于Pt類公司的均值,故Pt類公司的資產(chǎn)負(fù)債率顯著高于nopt類公司的資產(chǎn)負(fù)債率。第29頁(yè),共43頁(yè),2024年2月25日,星期天(二)成對(duì)組的假設(shè)檢驗(yàn)成對(duì)組:兩樣本來(lái)自于同一總體在不同時(shí)間或不同處理下的數(shù)據(jù)。差值來(lái)自正態(tài)總體:用MEANS過(guò)程中T檢驗(yàn)來(lái)自其它分布總體:用UNIVARIATE過(guò)程中的符號(hào)檢驗(yàn)或符號(hào)秩檢驗(yàn)。第30頁(yè),共43頁(yè),2024年2月25日,星期天課本例6.7datapackage;inputsale1sale2@@;dif=sale2-sale1;cards;667270757568798765849073857082839795959092827378716969747786;procunivariatenormal;vardif;run;第31頁(yè),共43頁(yè),2024年2月25日,星期天課本例6.8datastock(keep=rate1rate2dif);inputprice1price2@@;rate1=(price1-lag(price1))/lag(price1)*100;rate2=(price2-lag(price2))/lag(price2)*100;dif=rate2-rate1;cards;25.7924.9024.3724.8823.2425.2022.1125.1022.0024.9922.1224.7820.2924.9019.7024.8020.4626.0519.9825.4120.6825.46;procunivariatenormal;varrate1rate2dif;run;第32頁(yè),共43頁(yè),2024年2月25日,星期天相關(guān)分析與CORR過(guò)程兩連續(xù)型變量:Pearson積矩相關(guān)系數(shù)兩有序變量:(1)Spearman等級(jí)相關(guān)系數(shù)(或秩序相關(guān)系數(shù))(2)Kendall’stau_b相關(guān)系數(shù)兩分類變量:列聯(lián)系數(shù)相關(guān)關(guān)系的度量第33頁(yè),共43頁(yè),2024年2月25日,星期天主要功能:計(jì)算變量間的相關(guān)系數(shù):包括Pearson相關(guān)系數(shù),Spearman等級(jí)相關(guān)系數(shù)、Kendall’stau_b相關(guān)系數(shù)、Hoeffding的相關(guān)性度量D.還可以計(jì)算偏相關(guān)和Cronbach系數(shù)及一些單變量的描述性統(tǒng)計(jì)量。CORR(相關(guān))過(guò)程第34頁(yè),共43頁(yè),2024年2月25日,星期天CORR(相關(guān))過(guò)程的一般格式PROCCORR<option-list>;VARvariable-list;WITHvariable-list;PARTIALvariable-list;WEIGHTvariable;FREQvariable;BYvariable-list;第35頁(yè),共43頁(yè),2024年2月25日,星期天CORR(相關(guān))過(guò)程中語(yǔ)句說(shuō)明:(1)PROCCORR語(yǔ)句一般格式為:PROCCORR<option-list>;<option-list>有以下幾類:數(shù)據(jù)集選項(xiàng):
DATA=SAS-data-set;OUTP=SAS-data-set;創(chuàng)建存放Pearson統(tǒng)計(jì)量的數(shù)據(jù)集,需同時(shí)使用PEARSON選項(xiàng)。
OUTS=SAS-data-set;創(chuàng)建存放Spearman統(tǒng)計(jì)量的數(shù)據(jù)集,需同時(shí)使用SPEARMAN選項(xiàng)。第36頁(yè),共43頁(yè),2024年2月25日,星期天OUTH=SAS-data-set;創(chuàng)建存放Hoeffding統(tǒng)計(jì)量的數(shù)據(jù)集,需同時(shí)使用HOEFFDING選項(xiàng)。
OUTK=SAS-data-set;創(chuàng)建存放Kendall的tau_b統(tǒng)計(jì)量的數(shù)據(jù)集,需同時(shí)使用KENDALL選項(xiàng)。相關(guān)類型選項(xiàng):
Pearson相關(guān)系數(shù);沒(méi)有規(guī)定選項(xiàng),即默認(rèn)為Pearson相關(guān)系數(shù)。
Spearman秩序相關(guān)系數(shù);
Kendall等級(jí)相關(guān)系數(shù)tau_b;Hoeffding的相關(guān)性度量;第37頁(yè),共43頁(yè),2024年2月25日,星期天(2)VAR語(yǔ)句一般格式為:VARvariable-list;如:varabc;(3)WITH語(yǔ)句一般格式為:WITHvariable-list;該句與VAR語(yǔ)句一起使用,得到變量間特殊組合的相關(guān)系數(shù)。如:varabc;withxy;第38頁(yè),共43頁(yè),2024年2月25日,星期天(4)PARTIAL語(yǔ)句一般格式為:PARTIAL
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年度寧國(guó)市事業(yè)單位統(tǒng)一公開(kāi)招聘工作人員16名參考考試題庫(kù)及答案解析
- 2026年江西生物科技職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026年貴州食品工程職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年武漢城市職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫(kù)含詳細(xì)答案解析
- 2026年河南檢察職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫(kù)含詳細(xì)答案解析
- 2026年江蘇商貿(mào)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫(kù)含詳細(xì)答案解析
- 2026年云南現(xiàn)代職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試模擬試題含詳細(xì)答案解析
- 2026年廣西自然資源職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題含詳細(xì)答案解析
- 2026年棗莊科技職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫(kù)含詳細(xì)答案解析
- 2026年湖南汽車工程職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題含詳細(xì)答案解析
- 《人民調(diào)解員培訓(xùn)》課件
- 出租車春節(jié)應(yīng)急預(yù)案
- 華羅庚數(shù)學(xué)課本六年級(jí)
- DB12-T885-2019-植物提取物中原花青素的測(cè)定紫外-可見(jiàn)分光光度法-天津市
- 董氏奇穴針灸學(xué)(楊維杰)
- 日間手術(shù)病人術(shù)前的護(hù)理
- 1000張隱患辨識(shí)圖
- 智能水務(wù)管理基礎(chǔ)知識(shí)單選題100道及答案
- 《職業(yè)院校與本科高校對(duì)口貫通分段培養(yǎng)協(xié)議書(shū)》
- 危巖帶治理工程初步設(shè)計(jì)計(jì)算書(shū)
- 精神病學(xué)考試重點(diǎn)第七版
評(píng)論
0/150
提交評(píng)論