《非參數(shù)方法》PPT課件.ppt_第1頁
《非參數(shù)方法》PPT課件.ppt_第2頁
《非參數(shù)方法》PPT課件.ppt_第3頁
《非參數(shù)方法》PPT課件.ppt_第4頁
《非參數(shù)方法》PPT課件.ppt_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第七章 非參數(shù)方法,非參數(shù)方法(亦稱非參數(shù)檢驗),是根據(jù)樣本資料對總體的某種性質(zhì)或關(guān)系進(jìn)行假設(shè)檢驗的統(tǒng)計推斷方法。,主要特點,不要求總體分布已知或?qū)傮w分布作任何限制性假定; 不以估計總體參數(shù)為目的; 能適用于定性變量中的定類數(shù)據(jù)或定序數(shù)據(jù) ,也能適用于定距數(shù)據(jù)和定比數(shù)據(jù)這種定量變量 方法直觀,易于理解,運算比較簡單。 缺點是檢驗的功效不如參數(shù)檢驗方法。,非參數(shù)統(tǒng)計與傳統(tǒng)的參數(shù)統(tǒng)計相比,有以下優(yōu)點:,非參數(shù)統(tǒng)計方法要求的假定條件比較少,因而它的適用范圍比較廣泛。 多數(shù)非參數(shù)統(tǒng)計方法要求的運算比較簡單,可以迅速完成計算取得結(jié)果,因而比較節(jié)約時間。 大多數(shù)非參數(shù)統(tǒng)計方法在直觀上比較容易理解,不需要

2、太多的數(shù)學(xué)基礎(chǔ)知識和統(tǒng)計學(xué)知識。 大多數(shù)非參數(shù)統(tǒng)計方法可用來分析如象由等級構(gòu)成的數(shù)據(jù)資料,而對計量水準(zhǔn)較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計方法卻不適用。 當(dāng)推論多達(dá)3個以上時,非參數(shù)統(tǒng)計方法尤具優(yōu)越性。,非參數(shù)統(tǒng)計方法也有以下缺點:,在給定的顯著性水平下進(jìn)行檢驗時,非參數(shù)統(tǒng)計方法與參數(shù)統(tǒng)計方法相比,第類錯誤的概率要大些。 對于大樣本,如不采用適當(dāng)?shù)慕疲嬎憧赡茏兊檬謴?fù)雜。,主要內(nèi)容,成對比較檢驗,曼惠特尼U檢驗,游程檢驗,等級相關(guān)檢驗,成對比較檢驗,是對兩個相關(guān)樣本的比較分析。有符號檢驗和威爾科克森符號秩檢驗兩種方法。,符號檢驗,也稱正負(fù)號檢驗,其基本思想是分析正負(fù)號出現(xiàn)的頻率而忽略具體量的差異,以確

3、定他們是否有顯著差異的一種檢驗方法。,符號檢驗,涉及由n名潛在顧客組成的樣本來確定對某種產(chǎn)品的兩種品牌之一的偏好。 其實質(zhì)是檢驗顧客是否對所比較的兩種品牌存在偏好上的差異。 符號檢驗根據(jù)樣本量的不同(小樣本、大樣本),采取不同的檢驗方法。 符號檢驗的小樣本情形是指n20,作為二項分布處理。 符號檢驗的大樣本情形是指n20,作為正態(tài)近似處理。,小樣本情形,P523:陽光海岸農(nóng)場生產(chǎn)一種在市場上名為“柑桔谷”的桔汁,競爭對手生產(chǎn)一種新的名為“熱帶桔”的桔汁飲品,研究人員隨機調(diào)查了12名消費者,結(jié)果如下(“”表示對柑桔谷的偏好,“”表示對熱帶桔的偏好):,解: H0: p=0.5 ; H1:p0.5

4、(雙尾檢驗,P(0)=0.0002,(BINOMDIST(0,12,0.5,FALSE) P(1)=0.0029, (BINOMDIST(1,12,0.5,FALSE) P(2)=0.0161, (BINOMDIST(2,12,0.5,FALSE),2(P(0)+P(1)+P(2))=0.03840.05,0,1,2,3,4,5,6,可見,拒絕域應(yīng)為0,1,2。,7,8,9,10,11,12,拒絕域,現(xiàn)檢驗統(tǒng)計量()=2 (即2個加號), 0.03840.05所以,原假設(shè)H0:P=0.5在5%顯著性水平上被拒絕。此研究提供的證據(jù)表明,消費者對兩種品牌的桔汁的偏好存在差異。,例 2:隨機抽取12

5、個單位,放映一部描述吸煙有害健康的影片, 并調(diào)查得到觀看電影前后各單位職工認(rèn)為吸煙有害的人 數(shù)的百分比。檢驗該電影宣傳是否有效果(=0.05)。,解:H0:P=0.5 H1:P 0.5,P(0)=0.0002, P(1)=0.0030, P(2)=0.0161, P(3)=0.0537,P(0)+P(1)+P(2)=0.01930.05,P(3)+0.01930.05370.0193=0.0730.05,0,1,2,3,4,5,6,可見,拒絕域應(yīng)為0,1,2。,7,8,9,10,11,12,拒絕域,現(xiàn)檢驗統(tǒng)計量(-)=3 (即3個負(fù)號),0.0730.05所以,原假設(shè)H0:P=0.5在5%顯著

6、性水平上不能被拒絕。也即不能認(rèn)為職工在觀看影片前后的認(rèn)識有顯著提高。,大樣本情形,使用零假設(shè)H0:P=0.5和樣本容量n 20,則可以用正態(tài)分布來近似加號個數(shù)的抽樣分布。 在假設(shè)H0:P=0.5的條件下,加號個數(shù)的抽樣分布的正態(tài)近似: 均值:u=0.5n 標(biāo)準(zhǔn)差: 檢驗統(tǒng)計量,或:,P524政治民意測驗問題,n=200-25=175 U=0.5n=87.5,=6.6,Z=(72-87.5)/6.6=-2.35,2.351.96,所以,拒絕原假設(shè)。認(rèn)為公眾對候選人的對外政策評價時有差異的。,例2:隨機抽取60名消費者對甲、乙兩種品牌的飲料評分,甲、乙得分之差為“+”號者35個,“-”號15 個,

7、“0”號10個。以顯著性水平=0.05檢驗兩種飲料是否同等受歡迎。,解:H0:P=0.5, H1:P0.5,n20,按正態(tài)分布近似處理,該成數(shù)抽樣分布的均值和標(biāo)準(zhǔn)差分別為,2.821.96,所以,拒絕原假設(shè)。認(rèn)為兩種飲料并不受到同等歡迎。且乙種優(yōu)于甲種。,檢驗步驟,1.確定配對樣本,分別計算差異正與負(fù)的數(shù)目,無差異則記為0,將它從樣本中剔除,并相應(yīng)地減少樣本容量n,把正負(fù)號數(shù)目之和視為樣本總個數(shù)(n) 。,2.建立假設(shè):H0: p=0.5 ; H1:p0.5,3.觀察樣本容量,如果n20,則作為二項分布處理 如果n20,則作為正態(tài)近似處理。,4.設(shè)定顯著性水平,并查表確定臨界值,進(jìn)行比較和作出

8、判斷。,威爾科克森符號的等級檢驗,這種檢驗方法不僅考慮了兩組數(shù)據(jù)差異的正、負(fù)號,而且還利用了其差異大小的信息。因此,是一種更為有效的檢驗方法。,1、應(yīng)用條件和檢驗內(nèi)容與符號檢驗相同。,2、方法思想:若關(guān)聯(lián)樣本(匹配樣本)的兩組數(shù)據(jù)沒有顯著差異,則不僅其差異的正、負(fù)符號應(yīng)大致相等,而且將其差的數(shù)值按大小順序排列編自然序號(即秩)后,它們的正號(+)的秩和(記為T+)與負(fù)號(-)的秩和(記為T-)也應(yīng)該大致相等,因此正秩與負(fù)秩將相互抵消,符號秩之和的數(shù)值將接近于零。威爾科克森符號秩檢驗就是確定符號秩之和是否顯著地不等于零。,令T表示威爾科克森符號秩檢驗中的符號秩之和。如果兩個總體相同,并且匹配數(shù)據(jù)

9、對的個數(shù)為10或者更多時, T的抽樣分布近似于如下的正態(tài)分布。,=,檢驗統(tǒng)計量:,標(biāo)準(zhǔn)差:,均值:u=0,檢驗步驟,將樣本數(shù)據(jù)配對并計算各對正負(fù)差值,將差數(shù)取絕對值按從小到大順序排列并編上等級,即確定順序號1、2、3等。對于相等的值,則取其位序的平均數(shù)為等級,建立假設(shè):H0:T+= T- ; H1 : T+ T-(雙側(cè)) H1 :T+T-或T+T-(單側(cè)),計算檢驗統(tǒng)計量:,設(shè)定,并查表確定臨界值T(或Z/2),比較檢驗值與臨界值 作出判斷,TT, 拒絕H0; TT, 接受H0,P527兩種不同的方法完成生產(chǎn)任務(wù)的時間是否存在顯著差異,2.241.96,所以,拒絕原假設(shè)。認(rèn)為兩種方法在完成任務(wù)

10、的時間上存在差異。且方法2優(yōu)于方法1。,曼惠特尼U檢驗,曼惠特尼U檢驗適用于從兩個總體中分別獨立抽取兩個樣本的檢驗,方法思想與威爾科克森秩和檢驗相同。,檢驗步驟:,從總體A、B中分別獨立抽取樣本nA和nB,將(nA+nB)個觀察值從小到大編序,分別計算兩個樣本,的秩和TA和TB,建立假設(shè)H0:兩總體A和B相對次數(shù)分布相同 H1:兩總體相對次數(shù)分布不同,當(dāng)n1、n2均大于等于10時, T的抽樣分布近似于如下的正態(tài)分布。,=,檢驗統(tǒng)計量:,標(biāo)準(zhǔn)差:,均值:u=n1(n1+n2+1)/2,P532兩個分行的支票的賬戶余額是否相同,n1、n2均大于10, T的抽樣分布近似于如下的正態(tài)分布。,檢驗統(tǒng)計量

11、:,標(biāo)準(zhǔn)差:,均值:u=n1(n1+n2+1)/2=12(12+10+1)/2=138,2.081.96,所以,拒絕原假設(shè)。認(rèn)為兩個分行的賬戶余額存在差異。,克魯斯卡爾-沃利斯檢驗,MWW檢驗是用于檢驗兩個總體是否相同 克魯斯卡爾和沃利斯將其擴展到更多總體的情形。(總體K3) 方差分析(AVOVA)可以對多個總體均值是否相等進(jìn)行檢驗。 AVOVA的適用條件是所有總體都服從正態(tài)分布,并要求是定距數(shù)據(jù)或定比數(shù)據(jù)。,檢驗步驟,1.從總體A、B、C(K=3)中分別獨立抽取樣本n1、n2和 n3,將(nT=n1+n2+n3)個觀察值從小到大編序,分別計算三個樣本的秩和R1、R2、R3,2.建立假設(shè):H0

12、: 所有總體相同; H1:并非所有總體都相同,3.觀察樣本容量,如果每個樣本量都大于5,克魯斯卡爾和沃利斯已經(jīng)證明,統(tǒng)計量W(卡魯斯卡爾沃利斯檢驗統(tǒng)計量近似服從自由度為(K-1)的X2分布。,4.設(shè)定顯著性水平,并查表確定臨界值,進(jìn)行比較和作出判斷。,W=,P536:威廉姆斯制造公司招聘問題。(從三所大學(xué)招聘來的管理人員是否有差別),W=,nT=7+6+7=20,=,W=8.92臨界值CHIINV(0.025,2)=7.378,P值 CHIDIST(8.92,2)=0.011560.05,結(jié)論:3個總體不相同,游程檢驗,一、什么是游程檢驗,游程檢驗(亦稱連貫檢驗)是根據(jù)樣本標(biāo)志表現(xiàn)排列所形成的

13、游程的多少進(jìn)行判斷的檢驗方法。,設(shè)某樣本n=12人的標(biāo)志表現(xiàn)為男、女,有以下三種排列。,(i) 男,男,女,女,女,男,女,女,男,男,男,男 (ii) 男,男,男,男,男,男,男,女,女,女,女,女 (iii) 男,女,男,女,男,女,男,女,男,女,男,男,連續(xù)出現(xiàn)男或女的區(qū)段稱為游程。每個游程包含的個數(shù)為游程長度。以r表示序列中游程的個數(shù):,(i)r=5, (ii)r=2, (iii) r=11,(i)是隨機性序列;(ii)(iii)是非隨機性序列,所以,可以用游程的個數(shù)來檢驗樣本的隨機性,或總體的分布特征。,二、游程檢驗方法,1檢驗總體分布是否相同。,將從兩個總體中獨立抽取的兩個樣本的

14、觀察值混合有序后,觀察游程個數(shù),進(jìn)行比較。,2檢驗樣本的隨機性,將取自某一總體的樣本的觀察值按從小到大順序排列,找出中位數(shù)(或平均數(shù)),分為大于中位數(shù)的小于中位數(shù)的兩個部分。用上下交錯形成的游程個數(shù)來檢驗樣本是否是隨機的。,3檢驗規(guī)則(小樣本,n1與n2都小于20),應(yīng)用表La和Lb,(=0.05,r為臨界值),(1)單側(cè)檢驗:,觀察到的游程個數(shù) ro臨界值(La表),或ro臨界值(Lb表),反之,接受Ho。,(2)雙側(cè)檢驗:,觀察到的游程個數(shù)ro,r(La)ror(Lb) 接受Ho 下限 上限,反之,拒絕Ho,否定Ho,4大樣本(n1或n2大于20),游程個數(shù)r近似正態(tài)分布,檢驗統(tǒng)計量,其中

15、:,例1:對某校16名學(xué)生進(jìn)行口試測試,按他們進(jìn)入試場的先后次序,將成績記錄如下:,61,74,70,63,64,58,82,78,60,76,85,72,68,54,62,56,試問:該樣本在0.05的顯著水平下是否具有隨機性?,解:(1)建立假設(shè): H0:該樣本具有隨機性;H1:該樣本不具有隨機性。,(2)將成績按大小順序排列,計算中位數(shù)為: (64+68)/2=66 (3)按原記錄的順序,用x表示小于66分的成績,用y表示大于66分的成績,得到如下序列:,x,y,y,x,x,x,y,y,x,y,y,y,y,x,x,x,游程個數(shù):r=7 查表得:r(la)=4;r(lb)=14 4714

16、故:不能拒絕原假設(shè),認(rèn)為該樣本具有隨機性。,例2:某汽油站有兩種商標(biāo)的汽油A和B,某天售出的50桶汽油可按商標(biāo)A和商標(biāo)B排成以下的順序:,AABAABABBAAABBABBABBABBABBAABBBBAABABABAAABAAAAABB,試問:這一序列在0.05的顯著水平下是否具有隨機性?,解:(1)建立假設(shè): H0:該序列具有隨機性;H1:該序列不具有隨機性。,(2)A的數(shù)目:n1=26, B的數(shù)目:n2=24,游程個數(shù):r=7,顯著性水平為0.05時,z的臨界值為1.96,0.580.05 故:不能拒絕原假設(shè),認(rèn)為該序列具有隨機性,等級相關(guān)檢驗,將兩組變量按順序等級排列,在等級的基礎(chǔ)上計

17、算等級相關(guān)系數(shù),從而反映兩組變量之間聯(lián)系的密切程度。,等級相關(guān)系數(shù)的計算公式,其中di為兩變量每一對樣本的等級之差,n為樣本容量。,等級相關(guān)系數(shù)與相關(guān)系數(shù)一樣,取值-1到+1之間,區(qū)別是它是建立在等級的基礎(chǔ)上計算的,較適用于反映序列變量的相關(guān)。,一、等級相關(guān)檢驗的基本原理,二、等級相關(guān)系數(shù)的應(yīng)用,利用斯皮爾曼等級相關(guān)系數(shù),可以對兩序列變量是否相關(guān)進(jìn)行檢驗。,(一)檢驗的假設(shè),(1)H0:rs=0 , Xi和Yi 相互獨立;,H1:Xi和Yi不獨立。(此為雙側(cè)檢驗),(2)H0: rs=0 ,Xi和Yi相互獨立; H1: Xi和Yi是正相關(guān)。(即Xi的大值與Yi的大值相配對),(3)H0: rs=0 ,Xi和Yi相互獨立; H1:Xi和Yi是負(fù)相關(guān)。(即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論