版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章非參數(shù)統(tǒng)計(jì)分析詳解演示文稿當(dāng)前第1頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)優(yōu)選第一章非參數(shù)統(tǒng)計(jì)分析當(dāng)前第2頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)非參數(shù)統(tǒng)計(jì)狹義非參數(shù)統(tǒng)計(jì)非參數(shù)計(jì)量經(jīng)濟(jì)學(xué)非參數(shù)模型半?yún)?shù)模型估計(jì)總體的分布函數(shù)是否等于已知的分布
檢驗(yàn)兩或以上個(gè)總體的分布是否相同,通常是檢驗(yàn)其中位數(shù)是否相等
估計(jì)總體的密度函數(shù)的曲線(xiàn),但是不能寫(xiě)出解釋式當(dāng)前第3頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)第一章非參數(shù)統(tǒng)計(jì)及一些概念當(dāng)前第4頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
教學(xué)中使用的軟件SPSS和R。SPSS的非參數(shù)統(tǒng)計(jì)菜單已經(jīng)比較全面了。當(dāng)前第5頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)SPSS非參數(shù)檢驗(yàn)的過(guò)程Chi-Squaretest卡方檢驗(yàn)(檢驗(yàn)總體是否服從某個(gè)給定的離散分布)2.Binomialtest
二項(xiàng)分布檢驗(yàn)(檢驗(yàn)總體是否服從二項(xiàng)分布)3.
Runstest游程檢驗(yàn)(檢驗(yàn)樣本序列是否隨機(jī))4.
1-SampleKolmogorov-Smirnovtest
一個(gè)樣本柯?tīng)柲缏宸?斯米諾夫檢驗(yàn)(檢驗(yàn)總體是否服從某個(gè)連續(xù)分布)當(dāng)前第6頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)5.
2independentSamplesTest兩個(gè)獨(dú)立樣本檢驗(yàn)(檢驗(yàn)兩個(gè)獨(dú)立總體差異性)6.
KindependentSamplesTestK個(gè)獨(dú)立樣本檢驗(yàn)(檢驗(yàn)k個(gè)獨(dú)立總體的差異性)7.
2relatedSamplesTest兩個(gè)相關(guān)樣本檢驗(yàn)(檢驗(yàn)兩個(gè)相關(guān)總體差異性)8.
KrelatedSamplesTestK個(gè)相關(guān)樣本檢驗(yàn)(檢驗(yàn)k個(gè)相關(guān)總體差異性)當(dāng)前第7頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
思考的要點(diǎn)什么是計(jì)數(shù)統(tǒng)計(jì)量;什么是秩統(tǒng)計(jì)量,為什么要討論秩;為什么要討論秩的分布、秩的期望和方差;什么是符號(hào)秩和線(xiàn)性符號(hào)秩;線(xiàn)性符號(hào)秩的期望和方差。當(dāng)前第8頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)第一節(jié)關(guān)于非參數(shù)統(tǒng)計(jì)
在參數(shù)統(tǒng)計(jì)學(xué)中,最基本的概念是總體、樣本、隨機(jī)變量、概率分布、估計(jì)和假設(shè)檢驗(yàn)等。其很大一部分內(nèi)容是建立在正態(tài)分布相關(guān)的理論基礎(chǔ)之上的??傮w的分布形式或分布族往往是給定的或者是假定了的,所不知道的僅僅是一些參數(shù)的值。當(dāng)前第9頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)于是,分析人員的就是對(duì)一些參數(shù),比如均值和方差(或標(biāo)準(zhǔn)差),進(jìn)行點(diǎn)估計(jì)或區(qū)間估計(jì),或者是對(duì)某些參數(shù)值進(jìn)行各種檢驗(yàn),比如檢驗(yàn)正態(tài)分布的均值是否相等或等于零等等。最常見(jiàn)的檢驗(yàn)為對(duì)正態(tài)總體的t—檢驗(yàn)、F—檢驗(yàn)和極大似然比檢驗(yàn)等。又比如,線(xiàn)性回歸分析中,需要估計(jì)回歸系數(shù)j,j稱(chēng)為參數(shù),所以線(xiàn)性回歸分析應(yīng)該屬于參數(shù)統(tǒng)計(jì)的范疇。當(dāng)前第10頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
然而,在實(shí)際生活中,那種對(duì)總體分布的假定并不是能隨便做出的。有時(shí),數(shù)據(jù)并不是來(lái)自所假定分布的總體?;蛘邤?shù)據(jù)根本不是來(lái)自一個(gè)總體,數(shù)據(jù)因?yàn)榉N種原因被嚴(yán)重污染。這樣,在假定總體分布的情況下進(jìn)行推斷的做法就可能產(chǎn)生錯(cuò)誤的結(jié)論。于是,人們希望在不假定總體分布的情況下,盡量從數(shù)據(jù)本身來(lái)獲得所需要的信息。這就是非參數(shù)統(tǒng)計(jì)的宗旨。因?yàn)榉菂?shù)統(tǒng)計(jì)方法不利用關(guān)于總體分布的相關(guān)信息,所以,就是在對(duì)于總體分布的任何信息都沒(méi)有的情況下,它也能很容易而又較為可靠地獲得結(jié)論。這時(shí)非參數(shù)方法往往優(yōu)于參數(shù)方法。在臺(tái)灣這種方法稱(chēng)為“無(wú)母數(shù)統(tǒng)計(jì)”,即不知到總體信息的統(tǒng)計(jì)方法。當(dāng)前第11頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
在不知總體分布的情況下如何利用數(shù)據(jù)所包含的信息呢?一組數(shù)據(jù)最基本的信息就是次序。如果可以把數(shù)據(jù)按大小次序排隊(duì),每一個(gè)具體數(shù)目都有它在整個(gè)數(shù)據(jù)中(從最小的數(shù)起)的位置或次序,稱(chēng)為該數(shù)據(jù)的秩(rank)。數(shù)據(jù)有多少個(gè)觀察值,就有多少個(gè)秩。在一定的假定下,這些秩和秩的統(tǒng)計(jì)量的分布是求得出來(lái)的,而且和原來(lái)的總體分布無(wú)關(guān)。這樣就可以進(jìn)行所需要的統(tǒng)計(jì)推斷。注意:非參數(shù)統(tǒng)計(jì)的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關(guān)數(shù)值參數(shù)(均值和方差等);它被稱(chēng)為和分布無(wú)關(guān)(distribution—free),是因?yàn)槠渫茢喾椒ê涂傮w分布無(wú)關(guān);不應(yīng)理解為與所有分布(例如有關(guān)秩的分布)無(wú)關(guān)。
當(dāng)前第12頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)【例1】在我國(guó)的工業(yè)和商業(yè)企業(yè)中隨機(jī)抽取22家企業(yè)進(jìn)行資產(chǎn)負(fù)債率行業(yè)差異分析,其某年底的資產(chǎn)負(fù)債率(%)如下:工業(yè)647655825982707561647383商業(yè)77808065939184918486
兩個(gè)行業(yè)的負(fù)債水平是否有顯著性差異a=0.05。這樣的數(shù)據(jù)中有兩個(gè)問(wèn)題:
其一是樣本容量不大;
其二是總體服從何種分布未知。下面我們來(lái)構(gòu)造一種檢驗(yàn)的方法,看他們的資產(chǎn)負(fù)債有無(wú)顯著性差異。當(dāng)前第13頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
將兩類(lèi)企業(yè)的資產(chǎn)負(fù)債混合排序,并給出其序次,這在統(tǒng)計(jì)中稱(chēng)為“秩”。在這張表中我們有兩個(gè)可用的信息。負(fù)債率5559616464657073757677秩1234567891011組別11111211112負(fù)債率8080828283848486919193秩1213141516171819202122組別22111222222當(dāng)前第14頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
如果我們將12家工業(yè)企業(yè)的秩相加是94,其平均秩是7.88,將10家商業(yè)企業(yè)的秩相加得159,其平均秩為15.9,這就給我們一個(gè)可以考慮的信息,兩種企業(yè)的資產(chǎn)負(fù)債是有差異的。他們的平均秩不同。另一個(gè)想法是好像工業(yè)排的順序相對(duì)靠前,有11111,2,1111,222,111,222222共有6段(相同特點(diǎn)的個(gè)案的一段稱(chēng)為游程)。如果原假設(shè)成立,則兩個(gè)行業(yè)的負(fù)債水平的分布使相同的,將其混合后,應(yīng)能較為充分、均勻地混合,游程數(shù)R應(yīng)該比較大,反之當(dāng)游程數(shù)R較小,則說(shuō)明兩個(gè)總體的分布可能不同。那么6這個(gè)游程數(shù)是大還是小呢?當(dāng)前第15頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)【例2】模擬一個(gè)污染的正態(tài)分布,計(jì)算其樣本均值,但是樣本均值非正態(tài)分布了。這個(gè)分布是以0.8的概率是標(biāo)準(zhǔn)正態(tài)分布,0.2的概率混進(jìn)方差為9的正態(tài)分布。當(dāng)前第16頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)workfileu11000Seriesjunzhifor!i=1to1000smpl120seriesy1=rndseriesy2=nrndsmplify1<0.8Genra=y2smplify1>=0.8Genra=9*y2smpl120scalarmean=@mean(a)junzhi(!i)=meannextsmpl11000junzhi.hist當(dāng)前第17頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)此數(shù)據(jù)的正態(tài)性檢驗(yàn)是非正態(tài)。當(dāng)前第18頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)非參數(shù)統(tǒng)計(jì)歸納起來(lái)有如下的幾點(diǎn):
1.對(duì)總體的假定少;
2.可以處理許多有問(wèn)題數(shù)據(jù),比如污染的正態(tài)分布,有奇異值的情形;
3.容易計(jì)算,當(dāng)然如果不去證明統(tǒng)計(jì)量漸近分布。
4.在使用時(shí),最好與參數(shù)統(tǒng)計(jì)分析方法結(jié)合應(yīng)用,以便相互驗(yàn)證結(jié)果的可靠性。當(dāng)前第19頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)第二節(jié)計(jì)數(shù)統(tǒng)計(jì)量
設(shè)是一個(gè)隨機(jī)變量,對(duì)于一個(gè)給定的常數(shù)0,定義隨機(jī)變量稱(chēng)隨機(jī)變量為X按0分段的計(jì)數(shù)統(tǒng)計(jì)量。即滿(mǎn)足括號(hào)里的條件得1,否則得0。
一、計(jì)數(shù)統(tǒng)計(jì)量
當(dāng)前第20頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)最常用的計(jì)數(shù)統(tǒng)計(jì)量為
符號(hào)檢驗(yàn)。設(shè)隨機(jī)變量X1,…,Xn是從某個(gè)總體X中抽出的簡(jiǎn)單隨機(jī)樣本。且分布函數(shù)F(X)在X=0是連續(xù)的。檢驗(yàn)0是其中位數(shù)。檢驗(yàn)的統(tǒng)計(jì)量可以取二、計(jì)數(shù)統(tǒng)計(jì)量的應(yīng)用
在原假設(shè)為真的條件下,B服從參數(shù)為n和0.5的二項(xiàng)分布b(n,0.5)。由于原假設(shè)為時(shí),B應(yīng)該不太大,也不太小,如果B太大或太小,應(yīng)該拒絕原假設(shè)。當(dāng)前第21頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
例生產(chǎn)過(guò)程是否需要調(diào)整。某企業(yè)生產(chǎn)一種鋼管,規(guī)定長(zhǎng)度的中位數(shù)是l0米?,F(xiàn)隨機(jī)地:從正在生產(chǎn)的生產(chǎn)線(xiàn)上選取10根進(jìn)行測(cè)量,結(jié)果:
9.8,10.1,9.7,9.9,9.8,10.0,9.7,10.0,9.9,9.8分析:中位數(shù)是這個(gè)問(wèn)題中所關(guān)心的一個(gè)位置參數(shù)。若產(chǎn)品長(zhǎng)度真正的中位數(shù)大于或小于10米,則生產(chǎn)過(guò)程需要調(diào)整。這是一個(gè)雙側(cè)檢驗(yàn),應(yīng)建立假設(shè)為了對(duì)假設(shè)作出判定,先要得到檢驗(yàn)統(tǒng)計(jì)量或。將調(diào)查得到數(shù)據(jù)分別與10比較,算出各個(gè)符號(hào)的數(shù)目:=1,=7,n=8。P值=0.0214小于顯著性水平0.05。表明調(diào)查數(shù)據(jù)支持備擇假設(shè)。即生產(chǎn)過(guò)程需要調(diào)整。當(dāng)前第22頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
有人說(shuō)我國(guó)國(guó)有經(jīng)濟(jì)單位15個(gè)行業(yè)的某年職工平均工資的中位數(shù)為7000元?,F(xiàn)從15個(gè)行業(yè)中抽出樣本,如下表所示。
40384940579861616344661066956709--------6769699278977987854686798701--+++++
在顯著性水平a=0.05下,我國(guó)國(guó)有經(jīng)濟(jì)單位15個(gè)行業(yè)的1996年職工平均工資的中位數(shù)為7000元嗎?
因?yàn)?,,故接受原假設(shè)。當(dāng)前第23頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)第二節(jié)秩統(tǒng)計(jì)量
設(shè)來(lái)自總體X的樣本,記為樣本點(diǎn)的秩,即Ri為大于等于的次數(shù)。一、秩統(tǒng)計(jì)量
當(dāng)前第24頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)Xi5.61.42.75.22.64.82.3X(i)1.42.32.62.74.85.25.6Ri1234567當(dāng)前第25頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)二、秩統(tǒng)計(jì)量的分布和數(shù)字特征
的聯(lián)合分布為:
的概率分布為當(dāng)前第26頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
Ri的數(shù)學(xué)期望當(dāng)前第27頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
Ri的方差:當(dāng)前第28頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)Ri和Rj的協(xié)方差由于所以當(dāng)前第29頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)當(dāng)前第30頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)一、絕對(duì)秩和符號(hào)秩
設(shè)隨機(jī)變量X1,X2,…,Xn
獨(dú)立同分布,分布函數(shù)F(x)連續(xù),關(guān)于y軸為對(duì)稱(chēng)。隨機(jī)變量|X1|,|X2|,…,|Xn|對(duì)應(yīng)的秩向量記為稱(chēng)為Xi的絕對(duì)秩稱(chēng)為Xi的符號(hào)絕對(duì)秩第四節(jié)線(xiàn)性符號(hào)秩統(tǒng)計(jì)量當(dāng)前第31頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
若X是連續(xù)的隨機(jī)變量,分布關(guān)于Y軸為對(duì)稱(chēng),則隨機(jī)變量|X|與計(jì)數(shù)統(tǒng)計(jì)量(x)相互獨(dú)立。當(dāng)前第32頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
事實(shí)上,對(duì)于t0,i=1或i=0,顯然有
對(duì)于t>0,有
因?yàn)椋瑇關(guān)于0為對(duì)稱(chēng),則當(dāng)前第33頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
根據(jù)隨機(jī)變量獨(dú)立的充分必要條件,可知二者是獨(dú)立的,同理可證
在結(jié)論下,我們有如下結(jié)論。當(dāng)前第34頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
設(shè)隨機(jī)變量X1,X2,…,Xn
相互獨(dú)立同分布,分布函數(shù)F(x)連續(xù),關(guān)于y軸為對(duì)稱(chēng)。其絕對(duì)秩向量計(jì)數(shù)統(tǒng)計(jì)量二者相互獨(dú)立。當(dāng)前第35頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)二、符號(hào)秩統(tǒng)計(jì)量擴(kuò)展
若隨機(jī)變量X1,X2,…,Xn相互獨(dú)立且同連續(xù)的分布,分布關(guān)于軸為對(duì)稱(chēng)。其對(duì)應(yīng)的符號(hào)秩Wilcoxon符號(hào)秩統(tǒng)計(jì)量當(dāng)前第36頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)當(dāng)前第37頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)當(dāng)前第38頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)當(dāng)前第39頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
當(dāng)前第40頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)三、線(xiàn)性秩統(tǒng)計(jì)量
(一)線(xiàn)性秩序統(tǒng)計(jì)量的定義
設(shè)X1,X2,,XN為N個(gè)隨機(jī)變量,其對(duì)應(yīng)的秩向量記為:
又設(shè)α(1),α(2),,α(N)和c(1),c(2),,c(N)是兩組數(shù),組內(nèi)的N個(gè)數(shù)不全相等。定義統(tǒng)計(jì)量為
當(dāng)前第41頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)S稱(chēng)為線(xiàn)性秩統(tǒng)計(jì)量,α(1),α(2),,α(N)被稱(chēng)為分值,c(1),c(2),,c(N)被稱(chēng)為回歸常數(shù)。
例二樣本問(wèn)題。隨機(jī)變量X1,X2,,Xm相互獨(dú)立同分布,分布函數(shù)為F(x);隨機(jī)變量Y1,Y2,,Yn相互獨(dú)立同分布,分布函數(shù)為G(y)。混合樣本X1,X2,,Xm和Y1,Y2,,Yn對(duì)應(yīng)的秩向量,記為當(dāng)前第42頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)取兩組常數(shù)當(dāng)前第43頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)又若取兩組數(shù)為:當(dāng)前第44頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)則S為Y總體樣本中,觀測(cè)值大于混合中位數(shù)me的個(gè)數(shù)。當(dāng)前第45頁(yè)\共有60頁(yè)\編于星期五\7點(diǎn)
設(shè)a(1),a(2),,a(N)
是一組,若秩向量在集合上均勻分布(二)線(xiàn)性秩
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 21561.1-2025軌道交通機(jī)車(chē)車(chē)輛受電弓特性和試驗(yàn)第1部分:機(jī)車(chē)車(chē)輛受電弓
- 2026年環(huán)境影響評(píng)價(jià)技術(shù)方法培訓(xùn)
- 2026年農(nóng)民田間學(xué)校教學(xué)方法指南
- 跨境貿(mào)易跨境電商平臺(tái)操作手冊(cè)
- 2026年酒店收益管理策略?xún)?yōu)化課程
- 財(cái)稅制度管理培訓(xùn)課件
- 職業(yè)健康檔案電子化數(shù)據(jù)生命周期管理
- 職業(yè)健康政策下醫(yī)院?jiǎn)T工組織承諾的調(diào)節(jié)效應(yīng)
- 職業(yè)健康大數(shù)據(jù)與職業(yè)病防治投入產(chǎn)出趨勢(shì)關(guān)聯(lián)
- 青海2025年青海省生態(tài)環(huán)境監(jiān)測(cè)中心招聘筆試歷年參考題庫(kù)附帶答案詳解
- 2026 年初中英語(yǔ)《狀語(yǔ)從句》專(zhuān)項(xiàng)練習(xí)與答案 (100 題)
- 2026年遼寧省盤(pán)錦市高職單招語(yǔ)文真題及參考答案
- 農(nóng)投集團(tuán)安全生產(chǎn)制度
- 近五年貴州中考物理真題及答案2025
- 2025年黑龍江省大慶市中考數(shù)學(xué)試卷
- 山東煙草2026年招聘(197人)考試備考試題及答案解析
- 空芯光纖行業(yè)分析報(bào)告
- 置業(yè)顧問(wèn)崗位招聘考試試卷及答案
- 大眾試駕協(xié)議書(shū)
- 2026年醫(yī)療行業(yè)患者滿(mǎn)意度改善方案
- GB/T 4605-2025滾動(dòng)軸承推力滾針和保持架組件及推力墊圈
評(píng)論
0/150
提交評(píng)論