第17講 數(shù)據(jù)的統(tǒng)計(jì)分析與描述-Matlab_第1頁
第17講 數(shù)據(jù)的統(tǒng)計(jì)分析與描述-Matlab_第2頁
第17講 數(shù)據(jù)的統(tǒng)計(jì)分析與描述-Matlab_第3頁
第17講 數(shù)據(jù)的統(tǒng)計(jì)分析與描述-Matlab_第4頁
第17講 數(shù)據(jù)的統(tǒng)計(jì)分析與描述-Matlab_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2020/7/4,1,數(shù)據(jù)的統(tǒng)計(jì)描述和分析,實(shí)驗(yàn)?zāi)康?實(shí)驗(yàn)內(nèi)容,2、掌握用數(shù)學(xué)軟件包求解統(tǒng)計(jì)問題。,1、直觀了解統(tǒng)計(jì)基本內(nèi)容。,1、統(tǒng)計(jì)的基本理論。,3、實(shí)驗(yàn)作業(yè)。,2、用數(shù)學(xué)軟件包求解統(tǒng)計(jì)問題。,2020/7/4,3,統(tǒng)計(jì)的基本概念,參數(shù)估計(jì),假設(shè)檢驗(yàn),數(shù)據(jù)的統(tǒng)計(jì)描述和分析,2020/7/4,4,統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令,1.數(shù)據(jù)的錄入、保存和調(diào)用,2.基本統(tǒng)計(jì)量,3.常見概率分布的函數(shù),4.頻數(shù)直方圖的描繪,5.參數(shù)估計(jì),6.假設(shè)檢驗(yàn),7.綜合實(shí)例,返回,2020/7/4,5,一、數(shù)據(jù)的錄入、保存和調(diào)用,例1上海市區(qū)社會(huì)商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下,統(tǒng)計(jì)工具箱中的基本統(tǒng)

2、計(jì)命令,2020/7/4,6,1、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。命令格式:x=a:h:bt=78:87,2、分別以x和y代表變量職工工資總額和商品零售總額。x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,3、將變量t、x、y的數(shù)據(jù)保存在文件data中。savedatatxy,4、進(jìn)行統(tǒng)計(jì)分析時(shí),調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù)。loaddata,ToMATLAB(txy),方法1,2020/7/4,7,1、輸入矩陣:data

3、=78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,2、將矩陣data的數(shù)據(jù)保存在文件data1中:savedata1data,3、進(jìn)行統(tǒng)計(jì)分析時(shí),先用命令:loaddata1調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)

4、據(jù),可用命令:data(:,j),方法2,ToMATLAB(data),返回,2020/7/4,8,二、基本統(tǒng)計(jì)量,對隨機(jī)變量x,計(jì)算其基本統(tǒng)計(jì)量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x),例對例1中的職工工資總額x,可計(jì)算上述基本統(tǒng)計(jì)量。,ToMATLAB(tjl),返回,2020/7/4,9,三、常見概率分布的函數(shù),Matlab工具箱對每一種分布都提供五類函數(shù),其命令字符為:概率密度:pdf概率分布:cdf逆概率分布:inv均值與方差:stat隨機(jī)數(shù)生成:rnd,(當(dāng)需要一種分布的

5、某一類函數(shù)時(shí),將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.),2020/7/4,10,在Matlab中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z),1、密度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)mu=0,sigma=1時(shí)可缺省),ToMATLAB(liti2),如對均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:,2020/7/4,11,ToMATLAB(liti3),3、逆概率分布:x=norminv(P,mu,sigma).即求出x,使得PX

6、x=P.此命令可用來求分位數(shù).,2、概率分布:P=normcdf(x,mu,sigma),ToMATLAB(liti4),2020/7/4,12,ToMATLAB(liti5),4、均值與方差:m,v=normstat(mu,sigma),例5求正態(tài)分布N(3,52)的均值與方差.命令為:m,v=normstat(3,5)結(jié)果為:m=3,v=25,5、隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生mn階的正態(tài)分布隨機(jī)數(shù)矩陣.,例6命令:M=normrnd(123;456,0.1,2,3)結(jié)果為:M=0.95672.01252.88543.83345.02886.1191,ToMA

7、TLAB(liti6),此命令產(chǎn)生了23的正態(tài)分布隨機(jī)數(shù)矩陣,各數(shù)分別服從N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32),返回,2020/7/4,13,1、給出數(shù)組data的頻數(shù)表的命令為:N,X=hist(data,k)此命令將區(qū)間min(data),max(data)分為k個(gè)小區(qū)間(缺省為10),返回?cái)?shù)組data落在每一個(gè)小區(qū)間的頻數(shù)N和每一個(gè)小區(qū)間的中點(diǎn)X.,2、描繪數(shù)組data的頻數(shù)直方圖的命令為:hist(data,k),四、頻數(shù)直方圖的描繪,返回,2020/7/4,14,五、參數(shù)估計(jì),1、正態(tài)總體的參數(shù)估計(jì),設(shè)總體服從正態(tài)分布

8、,則其點(diǎn)估計(jì)和區(qū)間估計(jì)可同時(shí)由以下命令獲得:muhat,sigmahat,muci,sigmaci=normfit(X,alpha),此命令在顯著性水平alpha下估計(jì)數(shù)據(jù)X的參數(shù)(alpha缺省時(shí)設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計(jì)值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,muci是均值的區(qū)間估計(jì),sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計(jì).,2020/7/4,15,2、其它分布的參數(shù)估計(jì),有兩種處理辦法:一.取容量充分大的樣本(n50),按中心極限定理,它近似地服從正態(tài)分布;二.使用Matlab工具箱中具有特定分布總體的估計(jì)命令.,(1)muhat,muci=expfit(X,alph

9、a)-在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).(2)lambdahat,lambdaci=poissfit(X,alpha)-在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì).(3)phat,pci=weibfit(X,alpha)-在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì).,返回,2020/7/4,16,六、假設(shè)檢驗(yàn),在總體服從正態(tài)分布的情況下,可用以下命令進(jìn)行假設(shè)檢驗(yàn).,1、總體方差sigma2已知時(shí),總體均值的檢驗(yàn)使用z-檢驗(yàn),h,sig,ci=ztest(x,m,sigma,alpha,tai

10、l)檢驗(yàn)數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中sigma為已知方差,alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于m”tail=1,檢驗(yàn)假設(shè)“x的均值大于m”tail=-1,檢驗(yàn)假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.,返回值h為一個(gè)布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci為均值的1-alpha置信區(qū)間.,2020/7/4,17,例7Matlab統(tǒng)計(jì)工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價(jià)格(price1,price2分

11、別是一,二月份的油價(jià),單位為美分),它是容量為20的雙樣本.假設(shè)一月份油價(jià)的標(biāo)準(zhǔn)偏差是一加侖四分幣(=4),試檢驗(yàn)一月份油價(jià)的均值是否等于115.,解作假設(shè):m=115.首先取出數(shù)據(jù),用以下命令:loadgas然后用以下命令檢驗(yàn)h,sig,ci=ztest(price1,115,4),返回:h=0,sig=0.8668,ci=113.3970116.9030.,檢驗(yàn)結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說明提出的假設(shè)均值115是合理的.2.sig-值為0.8668,遠(yuǎn)超過0.5,不能拒絕零假設(shè)3.95%的置信區(qū)間為113.4,116.9,它完全包括115,且精度很高.,ToMATLAB(

12、liti7),2020/7/4,18,2、總體方差sigma2未知時(shí),總體均值的檢驗(yàn)使用t-檢驗(yàn),h,sig,ci=ttest(x,m,alpha,tail)檢驗(yàn)數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于m”tail=1,檢驗(yàn)假設(shè)“x的均值大于m”tail=-1,檢驗(yàn)假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.,返回值h為一個(gè)布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci為均值的1-alpha置信區(qū)間.,2020/7/4,19,返

13、回:h=1,sig=4.9517e-004,ci=116.8120.2.,檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)油價(jià)均值115是不合理的.2.95%的置信區(qū)間為116.8120.2,它不包括115,故不能接受假設(shè).3.sig-值為4.9517e-004,遠(yuǎn)小于0.5,不能接受零假設(shè).,ToMATLAB(liti8),例8試檢驗(yàn)例8中二月份油價(jià)Price2的均值是否等于115.,解作假設(shè):m=115,price2為二月份的油價(jià),不知其方差,故用以下命令檢驗(yàn)h,sig,ci=ttest(price2,115),2020/7/4,20,3、兩總體均值的假設(shè)檢驗(yàn)使用t-檢驗(yàn),h,

14、sig,ci=ttest2(x,y,alpha,tail)檢驗(yàn)數(shù)據(jù)x,y的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于y的均值”tail=1,檢驗(yàn)假設(shè)“x的均值大于y的均值”tail=-1,檢驗(yàn)假設(shè)“x的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.,返回值h為一個(gè)布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci為與x與y均值差的的1-alpha置信區(qū)間.,2020/7/4,21,返回:h=1,sig=0.0083,ci=-5.8,-0.9.,檢驗(yàn)

15、結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)“油價(jià)均值相同”是不合理的.2.95%的置信區(qū)間為-5.8,-0.9,說明一月份油價(jià)比二月份油價(jià)約低1至6分.3.sig-值為0.0083,遠(yuǎn)小于0.5,不能接受“油價(jià)均相同”假設(shè).,ToMATLAB(liti9),例9試檢驗(yàn)例8中一月份油價(jià)Price1與二月份的油價(jià)Price2均值是否相同.,解用以下命令檢驗(yàn)h,sig,ci=ttest2(price1,price2),2020/7/4,22,4、非參數(shù)檢驗(yàn):總體分布的檢驗(yàn),Matlab工具箱提供了兩個(gè)對總體分布進(jìn)行檢驗(yàn)的命令:,(1)h=normplot(x),(2)h=weibplo

16、t(x),此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).,此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).,返回,2020/7/4,23,例10一道工序用自動(dòng)化車床連續(xù)加工某種零件,由于刀具損壞等會(huì)出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時(shí)出現(xiàn)故障機(jī)會(huì)均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時(shí)該刀具完成的零件數(shù)如下:45936262454250958443374881550561

17、2452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851試觀察該刀具出現(xiàn)故障時(shí)完成的零件數(shù)屬于哪種分布.,2020/7/

18、4,24,解1、數(shù)據(jù)輸入,ToMATLAB(liti101),2、作頻數(shù)直方圖hist(x,10),3、分布的正態(tài)性檢驗(yàn)normplot(x),4、參數(shù)估計(jì):muhat,sigmahat,muci,sigmaci=normfit(x),(看起來刀具壽命服從正態(tài)分布),(刀具壽命近似服從正態(tài)分布),估計(jì)出該刀具的均值為594,方差204,均值的0.95置信區(qū)間為553.4962,634.5038,方差的0.95置信區(qū)間為179.2276,237.1329.,ToMATLAB(liti104),ToMATLAB(liti102),ToMATLAB(liti103),2020/7/4,25,5、假設(shè)

19、檢驗(yàn),ToMATLAB(liti105),已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗(yàn)其均值m是否等于594.,結(jié)果:h=0,sig=1,ci=553.4962,634.5038.,檢驗(yàn)結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說明提出的假設(shè)壽命均值594是合理的.2.95%的置信區(qū)間為553.5,634.5,它完全包括594,且精度很高.3.sig-值為1,遠(yuǎn)超過0.5,不能拒絕零假設(shè).,返回,2020/7/4,26,1、某校60名學(xué)生的一次考試成績?nèi)缦?937583939185848277767795948991888683968179977875676968848381756

20、685709484838280787473767086769089716686738094797877635355,1)計(jì)算均值、標(biāo)準(zhǔn)差、極差、偏度、峰度,畫出直方圖;2)檢驗(yàn)分布的正態(tài)性;3)若檢驗(yàn)符合正態(tài)分布,估計(jì)正態(tài)分布的參數(shù)并檢驗(yàn)參數(shù).,作業(yè),2020/7/4,27,2、據(jù)說某地汽油的價(jià)格是每加侖115美分,為了驗(yàn)證這種說法,一位學(xué)者開車隨機(jī)選擇了一些加油站,得到某年一月和二月的數(shù)據(jù)如下:一月:119117115116112121115122116118109112119112117113114109109118二月:1181191151221181211201221281161201

21、23121119117119128126118125,1)分別用兩個(gè)月的數(shù)據(jù)驗(yàn)證這種說法的可靠性;2)分別給出1月和2月汽油價(jià)格的置信區(qū)間;3)給出1月和2月汽油價(jià)格差的置信區(qū)間.,確定性模型和隨機(jī)性模型,隨機(jī)因素可以忽略,隨機(jī)因素影響可以簡單地以平均值的作用出現(xiàn),隨機(jī)因素影響必須考慮,概率模型,統(tǒng)計(jì)回歸模型,馬氏鏈模型,概率模型,例:報(bào)童的利潤,為了獲得最大的利潤,報(bào)童每天應(yīng)購進(jìn)多少份報(bào)紙?,162天報(bào)紙需求量的調(diào)查,報(bào)童早上購進(jìn)報(bào)紙零售,晚上將未賣掉的報(bào)紙退回。,購進(jìn)價(jià)b(=0.8元),零售價(jià)a(=1元),退回價(jià)c(=0.75元),售出一份賺a-b,退回一份賠b-c/p>

22、9224197213187187230172227157114156,問題分析,購進(jìn)太多賣不完退回賠錢,購進(jìn)太少不夠銷售賺錢少,應(yīng)根據(jù)需求確定購進(jìn)量,每天需求量是隨機(jī)的,目標(biāo)函數(shù)應(yīng)是長期的日平均利潤,=每天收入的期望值,隨機(jī)性優(yōu)化模型,需求量的隨機(jī)規(guī)律由162天報(bào)紙需求量的調(diào)查得到,模型建立,設(shè)每天購進(jìn)n份,日平均收入為G(n),求n使G(n)最大,已知售出一份賺a-b;退回一份賠b-c,r視為連續(xù)變量,模型建立,模型建立,結(jié)果解釋,取n使,a-b售出一份賺的錢b-c退回一份賠的錢,MATLAB統(tǒng)計(jì)工具箱常用命令(一),MATLAB統(tǒng)計(jì)工具箱常用命令(一),y=normpdf(1.5,1,2)

23、正態(tài)分布x=1.5的概率密度(=1,=2),y=fcdf(1,10,50)F分布x=1的分布函數(shù)(自由度n1=10,n2=50),y=tinv(0.9,10)概率=0.9的逆t分布(分位數(shù),自由度n=10),由計(jì)算n,用MATLAB統(tǒng)計(jì)工具箱求解報(bào)童模型,根據(jù)數(shù)據(jù)確定需求量的概率分布p(x),baotongdata.m,baotong1.m,回歸模型,1.在快速靜脈注射的給藥方式下,研究血藥濃度(單位體積血液中的藥物含量)的變化規(guī)律。,問題,2.給定藥物的最小有效濃度和最大治療濃度,設(shè)計(jì)給藥方案(每次注射劑量,間隔時(shí)間)。,分析,半對數(shù)坐標(biāo)系(semilogy)下c(t)的圖形,理論:用一室模

24、型研究血藥濃度變化規(guī)律,負(fù)指數(shù)規(guī)律,xueyao1.m,實(shí)驗(yàn)數(shù)據(jù)作圖,3.血液容積v,t=0注射劑量d,血藥濃度立即為d/v,2.藥物排除速率與血藥濃度成正比,比例系數(shù)k(0),模型假設(shè),1.機(jī)體看作一個(gè)房室,室內(nèi)血藥濃度均勻一室模型,模型建立,由假設(shè)2,由假設(shè)3,給藥方案設(shè)計(jì),設(shè)每次注射劑量D,間隔時(shí)間,血藥濃度c(t)應(yīng)c1c(t)c2,初次劑量D0應(yīng)加大,給藥方案記作,給定c1=10,c2=25,為確定只需確定參數(shù)k,v,參數(shù)估計(jì),由實(shí)驗(yàn)數(shù)據(jù)擬合曲線c(t)以估計(jì)k,v,xueyao2.m,思考:取對數(shù)化為線性最小二乘,對結(jié)果有影響嗎?,c1=10,c2=25,給藥方案設(shè)計(jì),直線擬合:a

25、=polyfit(x,y,1),b=polyfit(x,z,1),同一條直線y=0.33x+0.96(z=0.33x+0.96),從擬合到回歸,x=01234,y=1.01.31.52.02.3(+號)x=01234,z=0.61.950.92.851.8(*號),問題:你相信哪個(gè)擬合結(jié)果?怎樣給以定量評價(jià)?,得到a=0.330.96b=0.330.96,收集一組包含因變量和自變量的數(shù)據(jù);選定因變量與自變量之間的模型,利用數(shù)據(jù)按照最小二乘準(zhǔn)則計(jì)算模型中的系數(shù);利用統(tǒng)計(jì)分析方法對不同的模型進(jìn)行比較,找出與數(shù)據(jù)擬合得最好的模型;判斷得到的模型是否適合于這組數(shù)據(jù),診斷有無不適合回歸模型的異常數(shù)據(jù);利

26、用模型對因變量作出預(yù)測或解釋。,回歸分析的主要步驟,2004B題電力市場的輸電阻塞管理,確定各線路上潮流關(guān)于各發(fā)電機(jī)組出力的近似表達(dá)式,當(dāng)前時(shí)段各發(fā)電機(jī)組出力p1(0),pn(0),線路潮流uj(0),答卷中的問題:沒有常數(shù)項(xiàng)a0;沒有統(tǒng)計(jì)檢驗(yàn),例1:血壓與年齡、體重指數(shù)、吸煙習(xí)慣,體重指數(shù)=體重(kg)/身高(m)的平方,吸煙習(xí)慣:0表示不吸煙,1表示吸煙,建立血壓與年齡、體重指數(shù)、吸煙習(xí)慣之間的回歸模型,模型建立,血壓y,年齡x1,體重指數(shù)x2,吸煙習(xí)慣x3,y與x1的散點(diǎn)圖,y與x2的散點(diǎn)圖,線性回歸模型,回歸系數(shù)0,1,2,3由數(shù)據(jù)估計(jì),是隨機(jī)誤差,MATLAB統(tǒng)計(jì)工具箱常用命令(二)

27、,b=regress(y,X)b,bint,r,rint,s=regress(y,X,alpha),輸入:y因變量(列向量),X1與自變量組成的矩陣,Alpha顯著性水平(缺省時(shí)設(shè)定為0.05),s:3個(gè)統(tǒng)計(jì)量:決定系數(shù)R2,F(xiàn)值,F(1,n-2)分布大于F值的概率p,p時(shí)回歸模型有效.,rcoplot(r,rint),殘差及其置信區(qū)間作圖,MATLAB7.0版本s增加一個(gè)統(tǒng)計(jì)量:剩余方差s2.,模型求解,剔除異常點(diǎn)(第2點(diǎn)和第10點(diǎn))后,xueya01.m,例2軟件開發(fā)人員的薪金,資歷從事專業(yè)工作的年數(shù);管理1=管理人員,0=非管理人員;教育1=中學(xué),2=大學(xué),3=更高程度,建立模型研究薪金

28、與資歷、管理責(zé)任、教育程度的關(guān)系,分析人事策略的合理性,作為新聘用人員薪金的參考,分析與假設(shè),y薪金,x1資歷(年),x2=1管理人員,x2=0非管理人員,1=中學(xué)2=大學(xué)3=更高,資歷每加一年薪金的增長是常數(shù);管理、教育、資歷之間無交互作用,教育,線性回歸模型,a0,a1,a4是待估計(jì)的回歸系數(shù),是隨機(jī)誤差,模型求解,R2,F,p模型整體上可用,資歷增加1年薪金增長546,管理人員薪金多6883,中學(xué)程度薪金比更高的少2994,大學(xué)程度薪金比更高的多148,a4置信區(qū)間包含零點(diǎn),解釋不可靠!,xinjindata.mxinjin.m,殘差分析方法,結(jié)果分析,殘差,e與資歷x1的關(guān)系,e與管理

29、教育組合的關(guān)系,殘差全為正,或全為負(fù),管理教育組合處理不當(dāng),殘差大概分成3個(gè)水平,6種管理教育組合混在一起,未正確反映,應(yīng)在模型中增加管理x2與教育x3,x4的交互項(xiàng),進(jìn)一步的模型,增加管理x2與教育x3,x4的交互項(xiàng),R2,F有改進(jìn),所有回歸系數(shù)置信區(qū)間都不含零點(diǎn),模型完全可用,消除了不正?,F(xiàn)象,異常數(shù)據(jù)(33號)應(yīng)去掉,ex1,e組合,去掉異常數(shù)據(jù)后的結(jié)果,ex1,e組合,R2:0.9570.9990.9998F:22655436701置信區(qū)間長度更短,殘差圖十分正常,最終模型的結(jié)果可以應(yīng)用,xinjindata2.mxinjin1.m,模型應(yīng)用,制訂6種管理教育組合人員的“基礎(chǔ)”薪金(資

30、歷為0),中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0,x1=0;x2=1管理,x2=0非管理,大學(xué)程度管理人員比更高程度管理人員的薪金高,大學(xué)程度非管理人員比更高程度非管理人員的薪金略低,例3商品銷售量與價(jià)格,某廠生產(chǎn)的一種電器的銷售量y與競爭對手的價(jià)格x1及本廠的價(jià)格x2有關(guān),該商品在10個(gè)城市的銷售記錄如下,根據(jù)數(shù)據(jù)建立y與x1和x2的模型,對得到的模型和系數(shù)進(jìn)行檢驗(yàn)。若某市本廠產(chǎn)品售價(jià)160(元),競爭對手售價(jià)170(元),預(yù)測該市的銷售量.,將(x1,y),(x2,y)各10個(gè)點(diǎn)分別畫圖,y與x2有較明顯的線性關(guān)系,y與x1之間的關(guān)系難以確定,需要對模型y=f(x1,x2)作幾種嘗試,用統(tǒng)計(jì)分析決定優(yōu)劣。,例3商品銷售量與價(jià)格,b,bint,r,rint,stats=regress(Y,X,alpha),例3商品銷售量與價(jià)格,一次函數(shù)的回歸模型,結(jié)果不是太好:=0.05時(shí)模型有效,但=0.01時(shí)模型不能用;R2較小;1的置信區(qū)間包含零點(diǎn)。,shangpin.m,MATLAB統(tǒng)計(jì)工具箱常用命令(三),rstool(x,y,m

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論