版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一章多元正態(tài)分布及其參數(shù)估計(jì)1PPT課件第一章多元正態(tài)分布及其參數(shù)估計(jì)1PPT課件多元正態(tài)分布的重要性:(1)多元統(tǒng)計(jì)分析中很多重要的理論和方法都是直接或間接地建立在正態(tài)分布基礎(chǔ)上的,許多統(tǒng)計(jì)量的極限分布往往和正態(tài)分布有關(guān)。(2)許多實(shí)際問題涉及的隨機(jī)向量服從多元正態(tài)分布或近似服從正態(tài)分布。因此多元正態(tài)分布是多元統(tǒng)計(jì)分析的基礎(chǔ)。一、多元正態(tài)分布的定義定義1:若p維隨機(jī)向量的密度函數(shù)為:其中,是p維向量是p階正定矩陣,則稱X服從p維正態(tài)分布,記為
§1多元正態(tài)分布的定義及其性質(zhì)2PPT課件多元正態(tài)分布的重要性:一、多元正態(tài)分布的定義§1多元正態(tài)分布定義2:獨(dú)立標(biāo)準(zhǔn)正態(tài)變量的有限線性組合
稱為p維正態(tài)隨機(jī)變量,記為其中但是的分解一般不是唯一的。3PPT課件定義2:獨(dú)立標(biāo)準(zhǔn)正態(tài)變量定義3:若隨機(jī)向量X的特征函數(shù)為:其中t為實(shí)向量,則稱X服從p元正態(tài)分布。特征函數(shù)定義的優(yōu)點(diǎn)在于可以包含的情況。4PPT課件定義3:若隨機(jī)向量X的特征函數(shù)為:4PPT課件特別地,二元正態(tài)分布:
5PPT課件特別地,二元正態(tài)分布:5PPT課件二元正態(tài)分布曲面()
6PPT課件二元正態(tài)分布曲面(二元正態(tài)分布曲面()7PPT課件二元正態(tài)分布曲面(即,兩個隨機(jī)變量獨(dú)立而可以求得的邊緣密度函數(shù)為:當(dāng)時X1與X2不相關(guān),對于正態(tài)分布來說不相關(guān)和獨(dú)立等價。因?yàn)榇藭r:為X1和X2的相關(guān)系數(shù)。8PPT課件即二、多元正態(tài)分布的性質(zhì)性質(zhì)1:若,是對角矩陣,則相互獨(dú)立。性質(zhì)2:若則
性質(zhì)3:若,將作剖分:則9PPT課件二、多元正態(tài)分布的性質(zhì)性質(zhì)3:若性質(zhì)4:p元正態(tài)分布的條件分布仍服從正態(tài)分布。即在某些變量取固定值時,另外一些變量的分布仍然服從多元正態(tài)分布。10PPT課件性質(zhì)4:p元正態(tài)分布的條件分布仍服從正態(tài)分布。即在某些變量三、正態(tài)分布數(shù)據(jù)的變換若一批多元數(shù)據(jù)不滿足正態(tài)分布時,可以對數(shù)據(jù)進(jìn)行正態(tài)變換。一般來說常采用冪變換,如果想使值變小可以采用變換:如果想使值變大,則采用變換:不管使用哪種冪變換,還應(yīng)該對變換后的數(shù)據(jù)的正態(tài)性做檢驗(yàn).11PPT課件三、正態(tài)分布數(shù)據(jù)的變換若一批多元數(shù)據(jù)不滿足正態(tài)分布時,可以對§2多元正態(tài)分布的參數(shù)估計(jì)
一、多元樣本及其樣本數(shù)字特征1.多元樣本陣記12PPT課件§2多元正態(tài)分布的參數(shù)估計(jì)12PPT課件2、多元樣本的數(shù)字特征樣本均值:樣本均值向量可以用樣本矩陣表示出來,即13PPT課件2、多元樣本的數(shù)字特征樣本均值向量可以用樣本矩陣表示出來,即因?yàn)椋?4PPT課件因?yàn)椋?4PPT課件樣本離差陣15PPT課件樣本離差陣15PPT課件樣本協(xié)方差矩陣
或
樣本離差陣用樣本資料陣表示為:16PPT課件樣本協(xié)方差矩陣因?yàn)?7PPT課件因?yàn)?7PPT課件二、多元正態(tài)總體的最大似然估計(jì)及其性質(zhì)利用最大似然法求出和的最大似然估計(jì)為:18PPT課件二、多元正態(tài)總體的最大似然估計(jì)及其性質(zhì)18PPT課件求解過程似然函數(shù)為:19PPT課件求解過程19PPT課件對數(shù)似然函數(shù)為:20PPT課件對數(shù)似然函數(shù)為:20PPT課件21PPT課件21PPT課件(引理:設(shè)A為p階正定矩陣,則當(dāng)A=I等號成立。22PPT課件(引理:設(shè)A為p階正定矩陣,則最大似然估計(jì)的性質(zhì),即是的無偏估計(jì)。,即不是的無偏估計(jì)。,即是無偏估計(jì)。分別是的最小方差無偏估量。3.分別是的一致估計(jì)。
23PPT課件最大似然估計(jì)的性質(zhì)23PPT課件三、維斯特(Wishart)分布---一元分布的推廣定義:
設(shè)個隨機(jī)向量
獨(dú)立同分布于,則隨機(jī)矩陣服從自由度為n的非中心維斯特分布,記為
隨機(jī)矩陣的分布:將該矩陣的列向量(或行向量)連接起來組成的長向量稱為拉直向量,拉直向量的分布定義為該矩陣的分布,如果是對稱矩陣則只取其下三角的部分拉直即可。24PPT課件三、維斯特(Wishart)分布---一元分布性質(zhì):(1)若W1和W2獨(dú)立,其分布分別為和,則分布為,即維斯特(Wishart)分布有可加性。(2),C為m×p階的矩陣,則的分布為25PPT課件性質(zhì):(1)若W1和W2獨(dú)立,其分布分別為定理:設(shè)分別是來自正態(tài)總體的樣本均值和離差陣,則(1)(2)
相互獨(dú)立。
S為正定矩陣的充分必要條件是n>p。1126PPT課件定理:設(shè)分別是來自正態(tài)總體一元正態(tài)總體:為來自一元正態(tài)總體的一組樣本定理:證明:構(gòu)造正交矩陣27PPT課件一元正態(tài)總體:為來自一元正態(tài)總體的一組樣本定理:證明:構(gòu)造做變換28PPT課件做變換28PPT課件第三章多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)一、Hotelling
T2分布—一元t分布的推廣定義設(shè),且X與S相互獨(dú)立,,則稱統(tǒng)計(jì)量的分布為非中心的Hotelling
T2分布,記為,當(dāng)時稱為中心的Hotelling
T2分布。記為一元t分布:設(shè)總體是一組樣本,則統(tǒng)計(jì)量29PPT課件第三章多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)一、HotellingT2其中與類似并且30PPT課件其中與定理:設(shè)且X與S相互獨(dú)立,令基本性質(zhì):則31PPT課件定理:設(shè)二、多元正態(tài)總體均值向量的假設(shè)檢驗(yàn)1.單個正態(tài)總體(1)協(xié)方差矩陣已知時均值向量的檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量設(shè)水平為,查表確定,使得(當(dāng)H0成立時)拒絕域?yàn)椋?2PPT課件二、多元正態(tài)總體均值向量的假設(shè)檢驗(yàn)1.單個正態(tài)總體(1)協(xié)當(dāng)原假設(shè)成立時33PPT課件當(dāng)原假設(shè)成立時33PPT課件(2)協(xié)方差矩陣未知時均值向量的檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量拒絕域?yàn)椋?4PPT課件(2)協(xié)方差矩陣未知時均值向量的檢驗(yàn)例:人的出汗多少于人體內(nèi)鉀和鈉的含量有一定的關(guān)系。測得20名健康成年女性的出汗多少(X1)、鈉的含量(X2)和鉀的含量(X3)的數(shù)據(jù),做如下的假設(shè)檢驗(yàn):35PPT課件例:人的出汗多少于人體內(nèi)鉀和鈉的含量有一定的關(guān)系。測得20名例:在企業(yè)市場結(jié)構(gòu)研究中,起關(guān)鍵作用的指標(biāo)有市場份額X1,企業(yè)規(guī)模(資產(chǎn)凈值總額的對數(shù))X2,資本收益率X3,總收益增長率X4.為了研究市場結(jié)構(gòu)的變動Shepherd(1972)抽取了美國231個大型企業(yè),調(diào)查了這些企業(yè)1960-1969年的資料。假設(shè)以前企業(yè)市場結(jié)構(gòu)指標(biāo)的均值向量為:而該次調(diào)查得到的企業(yè)市場結(jié)構(gòu)指標(biāo)的均值向量和協(xié)方差矩陣為:36PPT課件例:在企業(yè)市場結(jié)構(gòu)研究中,起關(guān)鍵作用的指標(biāo)有市場份額X1,企試問市場結(jié)構(gòu)是否發(fā)生了變化?37PPT課件試問市場結(jié)構(gòu)是否發(fā)生了變化?37PPT課件帶入到T2統(tǒng)計(jì)量中得到臨界值因此拒絕原假設(shè),認(rèn)為市場結(jié)構(gòu)已經(jīng)發(fā)生了顯著的變化。38PPT課件帶入到T2統(tǒng)計(jì)量中得到臨界值因此拒絕原假設(shè),認(rèn)為市場結(jié)構(gòu)已經(jīng)2.協(xié)方差陣相等時,兩個正態(tài)總體均值向量的檢驗(yàn)設(shè)且兩組樣本相互獨(dú)立。(1)有共同已知的協(xié)方差矩陣39PPT課件2.協(xié)方差陣相等時,兩個正態(tài)總體均值向量的檢驗(yàn)設(shè)39PPT課檢驗(yàn)統(tǒng)計(jì)量為:拒絕域?yàn)椋?0PPT課件檢驗(yàn)統(tǒng)計(jì)量為:拒絕域?yàn)椋?0PPT課件(2)有共同的未知協(xié)方差矩陣檢驗(yàn)統(tǒng)計(jì)量為:41PPT課件(2)有共同的未知協(xié)方差矩陣檢驗(yàn)統(tǒng)計(jì)量為:41PPT課件
用代替∑即可得到上述統(tǒng)計(jì)量。42PPT課件用例:為了研究日美企業(yè)在華投資企業(yè)對中國經(jīng)營環(huán)境的評價是否存在差異,現(xiàn)從兩國在華投資企業(yè)中各抽出10家,讓其對如下指標(biāo)進(jìn)行打分。假設(shè)兩組來自正態(tài)總體,有共同的未知協(xié)方差矩陣,且兩組樣本相互獨(dú)立。43PPT課件例:為了研究日美企業(yè)在華投資企業(yè)對中國經(jīng)營環(huán)境的評價是否存在經(jīng)計(jì)算44PPT課件經(jīng)計(jì)算44PPT課件45PPT課件45PPT課件代入統(tǒng)計(jì)量中得:查F分布表得:顯然有:故拒絕原假設(shè),認(rèn)為日、美兩國在華投資企業(yè)對中國經(jīng)營環(huán)境的評價存在差別。3.協(xié)方差陣不相等時,兩個正態(tài)總體均值向量的檢驗(yàn)略46PPT課件代入統(tǒng)計(jì)量中得:3.協(xié)方差陣不相等時,兩個正態(tài)總體均值向量的一元方差分析一、方差分析的概念及有關(guān)術(shù)語
方差分析是根據(jù)實(shí)驗(yàn)數(shù)據(jù)來推斷一個或多個因素在其狀態(tài)變化時是否會對實(shí)驗(yàn)指標(biāo)產(chǎn)生顯著影響的一種數(shù)理統(tǒng)計(jì)方法。方差分析可以用來研究分類型自變量(名義測度)對數(shù)值型因變量的影響。包括它們之間有沒有關(guān)系、關(guān)系的強(qiáng)度如何等,也就是研究一個或多個因素變化時不同總體的某個指標(biāo)是否有顯著差異,所采用的方法就是檢驗(yàn)各個總體的均值是否相等。方差分析是用于評價實(shí)驗(yàn)的最重要的分析方法。4.多個正態(tài)總體均值向量的檢驗(yàn)(多元方差分析)47PPT課件一元方差分析一、方差分析的概念及有關(guān)術(shù)語4.多個正態(tài)總體均值例子:為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的企業(yè)作為樣本。每個行業(yè)中所抽取的樣本在服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等基本上是相同的,統(tǒng)計(jì)出消費(fèi)者對23家企業(yè)的投訴次數(shù),現(xiàn)判斷幾個行業(yè)的服務(wù)質(zhì)量是否有差別。投訴次數(shù)如下表:返回48PPT課件例子:為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售業(yè)、假定各個行業(yè)在服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等基本相同的前提下,要分析4個行業(yè)的服務(wù)質(zhì)量是否有顯著差,實(shí)際上就是判斷“行業(yè)”對投訴次數(shù)是否有顯著影響,即“行業(yè)”為自變量,投訴次數(shù)為因變量。做出這種判斷最終歸結(jié)為檢驗(yàn)4個行業(yè)被投訴次數(shù)的均值是否相等。如果相等則認(rèn)為行業(yè)因素對投訴次數(shù)是沒有影響的,如果均值不全相等,則意味著行業(yè)因素對服務(wù)質(zhì)量有影響。在做假設(shè)檢驗(yàn)時每個行業(yè)看作是一個總體,因此我們可以簡單概括為:方差分析主要用來對多個總體均值是否相等作出假設(shè)檢驗(yàn)。49PPT課件假定各個行業(yè)在服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等基本相同的前提下典型的應(yīng)用實(shí)例:不同影院節(jié)目宣傳方式(如海報(bào)和報(bào)紙廣告)對票房有何影響?影院老板為了知道答案,每次僅用一種方式宣傳一段時期,就可以獲得樣本數(shù)據(jù)進(jìn)行方差分析。兩種營銷手段單獨(dú)作用或共同作用分別對目標(biāo)變量有何影響?例如,一位果醬生產(chǎn)商認(rèn)為,商標(biāo)名稱和銷售途徑有重要影響,于是他對三個不同的商標(biāo)名稱在兩種不同銷售途徑下進(jìn)行測試。對同一個年級的幾個班級用不同的教學(xué)方法,調(diào)查教學(xué)效果。50PPT課件典型的應(yīng)用實(shí)例:50PPT課件相關(guān)術(shù)語因素(因子):在方差分析中,所要檢驗(yàn)的對象稱為因素或因子。例子中的“行業(yè)”水平:因素中的不同表現(xiàn)稱為水平。例子中的零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是“行業(yè)”因素的具體表現(xiàn),即水平。單因素方差分析:只針對一個因素進(jìn)行分析;多因素方差分析:同時針對多個因素進(jìn)行分析。51PPT課件相關(guān)術(shù)語因素(因子):在方差分析中,所要檢驗(yàn)的對象稱為因素或(1)每個總體(因素的各個水平)的相應(yīng)變量服從正態(tài)分布。也就是說,對于因素的每個水平,其觀測值是來自正態(tài)總體的簡單隨機(jī)樣本,上例中每個行業(yè)的投訴次數(shù)應(yīng)服從正態(tài)分布。(2)所有總體的方差相等2。也就是說,各組觀測數(shù)據(jù)來自相同方差的正態(tài)總體。上例中4個行業(yè)被投訴次數(shù)的方差相同。(3)不同觀察值相互獨(dú)立。(每個樣本點(diǎn)的取值不影響其他樣本點(diǎn)的取值)上例中,每個企業(yè)被投訴的次數(shù)與其他企業(yè)被投訴的次數(shù)是相互獨(dú)立的。方差分析的三個基本假定52PPT課件(1)每個總體(因素的各個水平)的相應(yīng)變量服從正態(tài)分布。也就問題的一般提法設(shè)因素有r個水平,每個水平的均值分別為,要檢驗(yàn)r個水平(即為r個總體)的均值是否相等,提出如下假設(shè):與原來兩兩總體的假設(shè)檢驗(yàn)方法相比,方差分析不僅可以提高檢驗(yàn)的效率,同時由于它是將所有的樣本信息結(jié)合在一起,因此增加了分析的可靠性。,上例中如果用一般的假設(shè)檢驗(yàn)方法,需要兩兩組合作6次檢驗(yàn)。53PPT課件問題的一般提法設(shè)因素有r個水平,每個水平的均值分別為我們畫出不同行業(yè)投訴次數(shù)的散點(diǎn)圖零售業(yè)旅游業(yè)航空家電制造業(yè)806040200投訴次數(shù)行業(yè)●●●●●●●●●●●●●●●●●●●●●●●×××54PPT課件我們畫出不同行業(yè)投訴次數(shù)的散點(diǎn)圖零售業(yè)
圖中的折線是由投訴次數(shù)的均值連接而成的。從圖中可以看出不同行業(yè)投訴次數(shù)是有顯著差異的,而且即使在同一個行業(yè),不同企業(yè)的投訴次數(shù)也明顯不同這表明行業(yè)與被投訴次數(shù)有關(guān)系,因?yàn)槿绻袠I(yè)與被投訴次數(shù)之間如果沒有關(guān)系,不同行業(yè)被投訴次數(shù)的均值應(yīng)該差不多相同。但是,僅僅從散點(diǎn)圖上還不能提供充分的證據(jù)證明不同行業(yè)被投訴次數(shù)之間有顯著差異,因?yàn)橐苍S這種差異是由于抽樣的隨機(jī)性所造成的。因此需要通過對數(shù)據(jù)誤差來源進(jìn)行分析來判斷不同總體的均值是否相等,進(jìn)而分析某一個因素對實(shí)驗(yàn)結(jié)果是否有影響。因此進(jìn)行方差分析時,需要考察數(shù)據(jù)誤差的來源。55PPT課件圖中的折線是由投訴次數(shù)的均值連接而成的。從圖中首先,我們注意到同一行業(yè)(同一總體)下,樣本的觀測值是不同的。因?yàn)槠髽I(yè)是隨機(jī)抽取的,因此他們之間的差異可以看成是由隨機(jī)因素的影響造成的,或者說是由抽樣的隨機(jī)性造成的,我們稱之為隨機(jī)誤差。
其次,在不同的行業(yè)(不同的總體)下,各個觀測值也是不同的。這種差異除了抽樣的隨機(jī)性造成的,也可能是由于行業(yè)因素本身造成的,由不同行業(yè)所形成的誤差稱之為系統(tǒng)誤差。
數(shù)據(jù)的誤差用平方和表示。衡量因素的同一水平下(同一總體)下樣本數(shù)據(jù)的誤差,稱為是組內(nèi)誤差。例如,零售業(yè)所抽取的7家企業(yè)被投訴次數(shù)之間的誤差。衡量因素的不同水平(不同總體)下樣本之間的誤差,稱為組間誤差。例如,零售業(yè)、旅游業(yè)、航空業(yè)、家電制造業(yè)之間被投訴次數(shù)之間的誤差。56PPT課件首先,我們注意到同一行業(yè)(同一總體)下,樣本的觀顯然,組內(nèi)誤差只包含隨機(jī)誤差,組間誤差既包含隨機(jī)誤差也包含系統(tǒng)誤差。假如不同行業(yè)對投訴次數(shù)沒有影響,那么在組間誤差中只包含隨機(jī)誤差,而沒有系統(tǒng)誤差。這時,組內(nèi)誤差和組間誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就接近于1.反之,如果不同行業(yè)對投訴次數(shù)有影響,在組間誤差中除了包含隨機(jī)誤差外還包含系統(tǒng)性誤差,這時組間誤差平均后的值就會大于組內(nèi)誤差平均后的值,它們的比值就會大于1,當(dāng)這個比值大于某個臨界值時,我們就可以說因素的不同水平之間存在顯著差異。因此判斷行業(yè)對投訴次數(shù)是否有顯著影響這一問題,實(shí)際上就是檢驗(yàn)投訴次數(shù)的差異主要是由什么原因引起的。如果這種差異主要是系統(tǒng)誤差,我們就說不同行業(yè)對投訴次數(shù)有顯著影響。57PPT課件顯然,組內(nèi)誤差只包含隨機(jī)誤差,組間誤差既包含隨機(jī)誤差也包含系如果原假設(shè)成立:說明某因素不同水平的影響不顯著(無系統(tǒng)性影響),只剩下隨機(jī)性影響,因此組間誤差與組內(nèi)誤差差別不大,它們的比接近于1。如果原假設(shè)不成立:說明某因素不同水平的影響顯著(存在系統(tǒng)性影響),組間誤差與組內(nèi)誤差差別較大,它們的比遠(yuǎn)超出1構(gòu)造統(tǒng)計(jì)量:58PPT課件如果原假設(shè)成立:說明某因素不同水平的影響不顯著(無系統(tǒng)性影響
為全體樣本合并的大樣本的樣本均值為第
j個總體的樣本均值xij=第j個子樣本中第
i個觀測值;nj=第j個子樣本的樣本容量其中,n=n1+n2+…+nrr為總體的個數(shù)于是,大樣本的總誤差平方和(SumofSquaresforTotal,SST)為:設(shè)39誤差平方和的計(jì)算59PPT課件為全體樣本合并的大樣本的樣本均值為第j個總體的樣本均值
可以證明:
第一項(xiàng)是各子樣本均值與合并的大樣本的公共均值的離差平方和,它反映了因素不同水平對總離差平方和的影響(系統(tǒng)性影響),稱為組間誤差平方和(因素效應(yīng)誤差平方和)(SumofSquaresforFactorA,SSA);
第二項(xiàng)是各子樣本內(nèi)部離差平方和之和,反映了隨機(jī)性因素的影響(誤差性影響),稱為組內(nèi)誤差平方和(SumofSquaresforError,SSE)。60PPT課件可以證明:第一項(xiàng)是各子樣本均值與合并的大樣本的各誤差平方和的大小與觀測值的多少有關(guān),為了消除觀測值多少對誤差平方和大小的影響,用各個平方和除以自由度即得到平均平方誤差,簡稱均方誤差:
即
SST=SSA+SSE
總誤差平方和=組間誤差平方和+組內(nèi)誤差平方和構(gòu)造F統(tǒng)計(jì)量:當(dāng)原假設(shè)成立時61PPT課件各誤差平方和的大小與觀測值的多少有關(guān),為了消除觀測值根據(jù)給定的顯著性水平,查表得到拒絕域:上例中,經(jīng)計(jì)算說明不同行業(yè)被投訴次數(shù)的均值有顯著差異,這意味著行業(yè)(自變量)與投訴次數(shù)(因變量)之間的關(guān)系是顯著的。62PPT課件根據(jù)給定的顯著性水平,查表得到拒絕域:上例中,經(jīng)計(jì)算說明不同關(guān)系強(qiáng)度的測量上述F統(tǒng)計(jì)量只能表明自變量和因變量之間是否有關(guān)系,不能表明關(guān)系的強(qiáng)弱,為了度量相關(guān)強(qiáng)度定義判定系數(shù):R2越大說明關(guān)系越強(qiáng),越小關(guān)系越弱。類似于相關(guān)系數(shù)。上例中,R2=0.349759。這表明行業(yè)對投訴次數(shù)的影響效應(yīng)占總效應(yīng)的34.9759%,而殘差效應(yīng)則占65.0241%。
63PPT課件關(guān)系強(qiáng)度的測量上述F統(tǒng)計(jì)量只能表明自變量和因變量之間是否有關(guān)方差分析中的多重比較上面的分析得出的結(jié)論是不同行業(yè)被投訴次數(shù)的均值是不全相同的,但是究竟哪些均值不相等呢,也就是這種差異究竟出現(xiàn)在哪些行業(yè)之間呢?則需要對總體均值進(jìn)行兩兩比較。多重比較的方法有很多,我們簡單介紹一下由Fisher提出的最小顯著差異方法(LSD方法)。檢驗(yàn)步驟為:第一步:提出原假設(shè):第二步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量:第三步:計(jì)算LSD,公式為:第四步:根據(jù)顯著性水平做出決策:如果則拒絕原假設(shè),否則接受原假設(shè)。64PPT課件方差分析中的多重比較上面的分析得出的結(jié)論是不同行業(yè)被投訴次數(shù)例:對4個行業(yè)的均值作多重比較第一步:提出假設(shè)第二步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量65PPT課件例:對4個行業(yè)的均值作多重比較第一步:提出假設(shè)第二步:計(jì)算檢第三步:計(jì)算LSD第四步:做出決策不能拒絕原假設(shè),說明零售業(yè)和旅游業(yè)之間的投訴次數(shù)沒有顯著差異。......66PPT課件第三步:計(jì)算LSD第四步:做出決策不能拒絕原假設(shè),說明零售業(yè)雙因素方差分析
單因素方差分析只是考慮一個分類型自變量對數(shù)值型因變量的影響。如果同時需考慮兩個因素A與B對實(shí)驗(yàn)結(jié)果的影響,則可進(jìn)行雙因素方差分析。例:分析影響彩電銷售量的因素,需要考察品牌、銷售地區(qū)等因素的影響?,F(xiàn)有4種品牌的彩電在5個地區(qū)進(jìn)行銷售,為分析彩電的“品牌”因素和“地區(qū)”因素對銷售量是否有影響,調(diào)查數(shù)據(jù)如下:67PPT課件雙因素方差分析單因素方差分析只是考慮一個分類型自雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)68PPT課件雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)68PPT課件在雙因素方差分析中因?yàn)橛袃蓚€因素,例如“品牌”和“銷售地區(qū)”兩個因素,如果兩個因素對銷售量的影響是相互獨(dú)立,我們分別判斷兩個因素對銷售量的影響,稱為無交互作用的雙因素方差分析。如果除了兩個因素的單獨(dú)影響外,兩個因素的搭配還會對銷售量產(chǎn)生新的影響效應(yīng),例如,某個地區(qū)對某個品牌的彩電有特殊偏好,這就是兩個因素結(jié)合后產(chǎn)生的新效應(yīng),此時的雙因素方差分析稱為有交互作用的雙因素方差分析。69PPT課件在雙因素方差分析中因?yàn)橛袃蓚€因素,例如“品牌”和“銷售地區(qū)”無交互作用的雙因素方差分析為了檢驗(yàn)兩個因素的影響,需要分別對兩個因素提出假設(shè)。對行因素提出的假設(shè)為:對列因素提出的假設(shè)為:地區(qū)對銷售量沒有顯著影響品牌對銷售量沒有顯著影響70PPT課件無交互作用的雙因素方差分析為了檢驗(yàn)兩個因素的影響,需要分別對誤差平方和的分解其中:可以證明:71PPT課件誤差平方和的分解其中:可以證明:71PPT課件分別構(gòu)造統(tǒng)計(jì)量關(guān)系強(qiáng)度的測量反應(yīng)了這兩個因素聯(lián)合起來與因變量之間的相關(guān)程度。72PPT課件分別構(gòu)造統(tǒng)計(jì)量關(guān)系強(qiáng)度的測量反應(yīng)了這兩個因素聯(lián)合起來與因變量有交互作用的方差分析例:分別在兩個路段和高峰期及非高峰期進(jìn)行駕車實(shí)驗(yàn),得到20個駕車時間的數(shù)據(jù):73PPT課件有交互作用的方差分析例:分別在兩個路段和高峰期及非高峰期進(jìn)行假設(shè)行變量有k個水平,列變量有r個水平,行變量每個水平的行數(shù)為m74PPT課件假設(shè)行變量有k個水平,列變量有r個水平,行變量每個水構(gòu)造統(tǒng)計(jì)量:75PPT課件構(gòu)造統(tǒng)計(jì)量:75PPT課件Wilks分布在一元統(tǒng)計(jì)中,方差是刻畫隨機(jī)變量分散程度的一個重要特征,而在多元情況下方差變?yōu)閰f(xié)防差矩陣。如何用一個數(shù)量指標(biāo)來反映協(xié)方差矩陣所體現(xiàn)的分散程度呢?有的用行列式,有的用跡,目前使用較多的是行列式。定義1:若定義2:若的分布為Wilks分布,記為,其中為自由度。在實(shí)際應(yīng)用中把統(tǒng)計(jì)量轉(zhuǎn)化為T2統(tǒng)計(jì)量,進(jìn)而轉(zhuǎn)化為F統(tǒng)計(jì)量。76PPT課件Wilks分布在一元統(tǒng)計(jì)中,方差是刻畫隨機(jī)變量分散程度的一個多元方差分析(多個正態(tài)總體均值向量的檢驗(yàn))設(shè)有k個p元正態(tài)總體從每個總體抽取獨(dú)立樣本個數(shù)為數(shù)據(jù)結(jié)構(gòu)為:全部樣本的均值向量各總體的均值向量:77PPT課件多元方差分析(多個正態(tài)總體均值向量的檢驗(yàn))設(shè)有k個p元正態(tài)總與一元方差分析的思想類似,離差平方和變成了離差陣:78PPT課件與一元方差分析的思想類似,離差平方和變成了離差陣:78PPT提出假設(shè):用似然比原則構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量為:給定檢驗(yàn)的顯著性水平,查Wilks分布表,確定臨界值,拒絕域?yàn)椋喝绻麤]有Wilks分布表可以用分布和F分布來近似。79PPT課件提出假設(shè):用似然比原則構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量為:給定檢驗(yàn)的顯著性水例:1999年國家財(cái)政部、國家經(jīng)貿(mào)委、人事部和國家計(jì)委聯(lián)合發(fā)布了《國有資本金績效評價規(guī)則》。其中競爭性工商企業(yè)的評價指標(biāo)體系見表。我們借助這一指標(biāo)體系對我國上市公司的運(yùn)營情況進(jìn)行分析,利用該數(shù)據(jù)進(jìn)行方差分析。經(jīng)過正態(tài)性檢驗(yàn)我們認(rèn)為由凈資產(chǎn)收益率、總資產(chǎn)報(bào)酬率、資產(chǎn)負(fù)債率及銷售增長率這四個指標(biāo)組成的向量服從正態(tài)分布。這四個指標(biāo)涉及了公司的獲利能力、資本結(jié)構(gòu)及成長能力,我們認(rèn)為這四個指標(biāo)可以對公司的運(yùn)營能力作出近似的度量。80PPT課件例:1999年國家財(cái)政部、國家經(jīng)貿(mào)委、人事部和國家計(jì)委聯(lián)合發(fā)81PPT課件81PPT課件82PPT課件82PPT課件第一章多元正態(tài)分布及其參數(shù)估計(jì)83PPT課件第一章多元正態(tài)分布及其參數(shù)估計(jì)1PPT課件多元正態(tài)分布的重要性:(1)多元統(tǒng)計(jì)分析中很多重要的理論和方法都是直接或間接地建立在正態(tài)分布基礎(chǔ)上的,許多統(tǒng)計(jì)量的極限分布往往和正態(tài)分布有關(guān)。(2)許多實(shí)際問題涉及的隨機(jī)向量服從多元正態(tài)分布或近似服從正態(tài)分布。因此多元正態(tài)分布是多元統(tǒng)計(jì)分析的基礎(chǔ)。一、多元正態(tài)分布的定義定義1:若p維隨機(jī)向量的密度函數(shù)為:其中,是p維向量是p階正定矩陣,則稱X服從p維正態(tài)分布,記為
§1多元正態(tài)分布的定義及其性質(zhì)84PPT課件多元正態(tài)分布的重要性:一、多元正態(tài)分布的定義§1多元正態(tài)分布定義2:獨(dú)立標(biāo)準(zhǔn)正態(tài)變量的有限線性組合
稱為p維正態(tài)隨機(jī)變量,記為其中但是的分解一般不是唯一的。85PPT課件定義2:獨(dú)立標(biāo)準(zhǔn)正態(tài)變量定義3:若隨機(jī)向量X的特征函數(shù)為:其中t為實(shí)向量,則稱X服從p元正態(tài)分布。特征函數(shù)定義的優(yōu)點(diǎn)在于可以包含的情況。86PPT課件定義3:若隨機(jī)向量X的特征函數(shù)為:4PPT課件特別地,二元正態(tài)分布:
87PPT課件特別地,二元正態(tài)分布:5PPT課件二元正態(tài)分布曲面()
88PPT課件二元正態(tài)分布曲面(二元正態(tài)分布曲面()89PPT課件二元正態(tài)分布曲面(即,兩個隨機(jī)變量獨(dú)立而可以求得的邊緣密度函數(shù)為:當(dāng)時X1與X2不相關(guān),對于正態(tài)分布來說不相關(guān)和獨(dú)立等價。因?yàn)榇藭r:為X1和X2的相關(guān)系數(shù)。90PPT課件即二、多元正態(tài)分布的性質(zhì)性質(zhì)1:若,是對角矩陣,則相互獨(dú)立。性質(zhì)2:若則
性質(zhì)3:若,將作剖分:則91PPT課件二、多元正態(tài)分布的性質(zhì)性質(zhì)3:若性質(zhì)4:p元正態(tài)分布的條件分布仍服從正態(tài)分布。即在某些變量取固定值時,另外一些變量的分布仍然服從多元正態(tài)分布。92PPT課件性質(zhì)4:p元正態(tài)分布的條件分布仍服從正態(tài)分布。即在某些變量三、正態(tài)分布數(shù)據(jù)的變換若一批多元數(shù)據(jù)不滿足正態(tài)分布時,可以對數(shù)據(jù)進(jìn)行正態(tài)變換。一般來說常采用冪變換,如果想使值變小可以采用變換:如果想使值變大,則采用變換:不管使用哪種冪變換,還應(yīng)該對變換后的數(shù)據(jù)的正態(tài)性做檢驗(yàn).93PPT課件三、正態(tài)分布數(shù)據(jù)的變換若一批多元數(shù)據(jù)不滿足正態(tài)分布時,可以對§2多元正態(tài)分布的參數(shù)估計(jì)
一、多元樣本及其樣本數(shù)字特征1.多元樣本陣記94PPT課件§2多元正態(tài)分布的參數(shù)估計(jì)12PPT課件2、多元樣本的數(shù)字特征樣本均值:樣本均值向量可以用樣本矩陣表示出來,即95PPT課件2、多元樣本的數(shù)字特征樣本均值向量可以用樣本矩陣表示出來,即因?yàn)椋?6PPT課件因?yàn)椋?4PPT課件樣本離差陣97PPT課件樣本離差陣15PPT課件樣本協(xié)方差矩陣
或
樣本離差陣用樣本資料陣表示為:98PPT課件樣本協(xié)方差矩陣因?yàn)?9PPT課件因?yàn)?7PPT課件二、多元正態(tài)總體的最大似然估計(jì)及其性質(zhì)利用最大似然法求出和的最大似然估計(jì)為:100PPT課件二、多元正態(tài)總體的最大似然估計(jì)及其性質(zhì)18PPT課件求解過程似然函數(shù)為:101PPT課件求解過程19PPT課件對數(shù)似然函數(shù)為:102PPT課件對數(shù)似然函數(shù)為:20PPT課件103PPT課件21PPT課件(引理:設(shè)A為p階正定矩陣,則當(dāng)A=I等號成立。104PPT課件(引理:設(shè)A為p階正定矩陣,則最大似然估計(jì)的性質(zhì),即是的無偏估計(jì)。,即不是的無偏估計(jì)。,即是無偏估計(jì)。分別是的最小方差無偏估量。3.分別是的一致估計(jì)。
105PPT課件最大似然估計(jì)的性質(zhì)23PPT課件三、維斯特(Wishart)分布---一元分布的推廣定義:
設(shè)個隨機(jī)向量
獨(dú)立同分布于,則隨機(jī)矩陣服從自由度為n的非中心維斯特分布,記為
隨機(jī)矩陣的分布:將該矩陣的列向量(或行向量)連接起來組成的長向量稱為拉直向量,拉直向量的分布定義為該矩陣的分布,如果是對稱矩陣則只取其下三角的部分拉直即可。106PPT課件三、維斯特(Wishart)分布---一元分布性質(zhì):(1)若W1和W2獨(dú)立,其分布分別為和,則分布為,即維斯特(Wishart)分布有可加性。(2),C為m×p階的矩陣,則的分布為107PPT課件性質(zhì):(1)若W1和W2獨(dú)立,其分布分別為定理:設(shè)分別是來自正態(tài)總體的樣本均值和離差陣,則(1)(2)
相互獨(dú)立。
S為正定矩陣的充分必要條件是n>p。11108PPT課件定理:設(shè)分別是來自正態(tài)總體一元正態(tài)總體:為來自一元正態(tài)總體的一組樣本定理:證明:構(gòu)造正交矩陣109PPT課件一元正態(tài)總體:為來自一元正態(tài)總體的一組樣本定理:證明:構(gòu)造做變換110PPT課件做變換28PPT課件第三章多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)一、Hotelling
T2分布—一元t分布的推廣定義設(shè),且X與S相互獨(dú)立,,則稱統(tǒng)計(jì)量的分布為非中心的Hotelling
T2分布,記為,當(dāng)時稱為中心的Hotelling
T2分布。記為一元t分布:設(shè)總體是一組樣本,則統(tǒng)計(jì)量111PPT課件第三章多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)一、HotellingT2其中與類似并且112PPT課件其中與定理:設(shè)且X與S相互獨(dú)立,令基本性質(zhì):則113PPT課件定理:設(shè)二、多元正態(tài)總體均值向量的假設(shè)檢驗(yàn)1.單個正態(tài)總體(1)協(xié)方差矩陣已知時均值向量的檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量設(shè)水平為,查表確定,使得(當(dāng)H0成立時)拒絕域?yàn)椋?14PPT課件二、多元正態(tài)總體均值向量的假設(shè)檢驗(yàn)1.單個正態(tài)總體(1)協(xié)當(dāng)原假設(shè)成立時115PPT課件當(dāng)原假設(shè)成立時33PPT課件(2)協(xié)方差矩陣未知時均值向量的檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量拒絕域?yàn)椋?16PPT課件(2)協(xié)方差矩陣未知時均值向量的檢驗(yàn)例:人的出汗多少于人體內(nèi)鉀和鈉的含量有一定的關(guān)系。測得20名健康成年女性的出汗多少(X1)、鈉的含量(X2)和鉀的含量(X3)的數(shù)據(jù),做如下的假設(shè)檢驗(yàn):117PPT課件例:人的出汗多少于人體內(nèi)鉀和鈉的含量有一定的關(guān)系。測得20名例:在企業(yè)市場結(jié)構(gòu)研究中,起關(guān)鍵作用的指標(biāo)有市場份額X1,企業(yè)規(guī)模(資產(chǎn)凈值總額的對數(shù))X2,資本收益率X3,總收益增長率X4.為了研究市場結(jié)構(gòu)的變動Shepherd(1972)抽取了美國231個大型企業(yè),調(diào)查了這些企業(yè)1960-1969年的資料。假設(shè)以前企業(yè)市場結(jié)構(gòu)指標(biāo)的均值向量為:而該次調(diào)查得到的企業(yè)市場結(jié)構(gòu)指標(biāo)的均值向量和協(xié)方差矩陣為:118PPT課件例:在企業(yè)市場結(jié)構(gòu)研究中,起關(guān)鍵作用的指標(biāo)有市場份額X1,企試問市場結(jié)構(gòu)是否發(fā)生了變化?119PPT課件試問市場結(jié)構(gòu)是否發(fā)生了變化?37PPT課件帶入到T2統(tǒng)計(jì)量中得到臨界值因此拒絕原假設(shè),認(rèn)為市場結(jié)構(gòu)已經(jīng)發(fā)生了顯著的變化。120PPT課件帶入到T2統(tǒng)計(jì)量中得到臨界值因此拒絕原假設(shè),認(rèn)為市場結(jié)構(gòu)已經(jīng)2.協(xié)方差陣相等時,兩個正態(tài)總體均值向量的檢驗(yàn)設(shè)且兩組樣本相互獨(dú)立。(1)有共同已知的協(xié)方差矩陣121PPT課件2.協(xié)方差陣相等時,兩個正態(tài)總體均值向量的檢驗(yàn)設(shè)39PPT課檢驗(yàn)統(tǒng)計(jì)量為:拒絕域?yàn)椋?22PPT課件檢驗(yàn)統(tǒng)計(jì)量為:拒絕域?yàn)椋?0PPT課件(2)有共同的未知協(xié)方差矩陣檢驗(yàn)統(tǒng)計(jì)量為:123PPT課件(2)有共同的未知協(xié)方差矩陣檢驗(yàn)統(tǒng)計(jì)量為:41PPT課件
用代替∑即可得到上述統(tǒng)計(jì)量。124PPT課件用例:為了研究日美企業(yè)在華投資企業(yè)對中國經(jīng)營環(huán)境的評價是否存在差異,現(xiàn)從兩國在華投資企業(yè)中各抽出10家,讓其對如下指標(biāo)進(jìn)行打分。假設(shè)兩組來自正態(tài)總體,有共同的未知協(xié)方差矩陣,且兩組樣本相互獨(dú)立。125PPT課件例:為了研究日美企業(yè)在華投資企業(yè)對中國經(jīng)營環(huán)境的評價是否存在經(jīng)計(jì)算126PPT課件經(jīng)計(jì)算44PPT課件127PPT課件45PPT課件代入統(tǒng)計(jì)量中得:查F分布表得:顯然有:故拒絕原假設(shè),認(rèn)為日、美兩國在華投資企業(yè)對中國經(jīng)營環(huán)境的評價存在差別。3.協(xié)方差陣不相等時,兩個正態(tài)總體均值向量的檢驗(yàn)略128PPT課件代入統(tǒng)計(jì)量中得:3.協(xié)方差陣不相等時,兩個正態(tài)總體均值向量的一元方差分析一、方差分析的概念及有關(guān)術(shù)語
方差分析是根據(jù)實(shí)驗(yàn)數(shù)據(jù)來推斷一個或多個因素在其狀態(tài)變化時是否會對實(shí)驗(yàn)指標(biāo)產(chǎn)生顯著影響的一種數(shù)理統(tǒng)計(jì)方法。方差分析可以用來研究分類型自變量(名義測度)對數(shù)值型因變量的影響。包括它們之間有沒有關(guān)系、關(guān)系的強(qiáng)度如何等,也就是研究一個或多個因素變化時不同總體的某個指標(biāo)是否有顯著差異,所采用的方法就是檢驗(yàn)各個總體的均值是否相等。方差分析是用于評價實(shí)驗(yàn)的最重要的分析方法。4.多個正態(tài)總體均值向量的檢驗(yàn)(多元方差分析)129PPT課件一元方差分析一、方差分析的概念及有關(guān)術(shù)語4.多個正態(tài)總體均值例子:為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的企業(yè)作為樣本。每個行業(yè)中所抽取的樣本在服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等基本上是相同的,統(tǒng)計(jì)出消費(fèi)者對23家企業(yè)的投訴次數(shù),現(xiàn)判斷幾個行業(yè)的服務(wù)質(zhì)量是否有差別。投訴次數(shù)如下表:返回130PPT課件例子:為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售業(yè)、假定各個行業(yè)在服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等基本相同的前提下,要分析4個行業(yè)的服務(wù)質(zhì)量是否有顯著差,實(shí)際上就是判斷“行業(yè)”對投訴次數(shù)是否有顯著影響,即“行業(yè)”為自變量,投訴次數(shù)為因變量。做出這種判斷最終歸結(jié)為檢驗(yàn)4個行業(yè)被投訴次數(shù)的均值是否相等。如果相等則認(rèn)為行業(yè)因素對投訴次數(shù)是沒有影響的,如果均值不全相等,則意味著行業(yè)因素對服務(wù)質(zhì)量有影響。在做假設(shè)檢驗(yàn)時每個行業(yè)看作是一個總體,因此我們可以簡單概括為:方差分析主要用來對多個總體均值是否相等作出假設(shè)檢驗(yàn)。131PPT課件假定各個行業(yè)在服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等基本相同的前提下典型的應(yīng)用實(shí)例:不同影院節(jié)目宣傳方式(如海報(bào)和報(bào)紙廣告)對票房有何影響?影院老板為了知道答案,每次僅用一種方式宣傳一段時期,就可以獲得樣本數(shù)據(jù)進(jìn)行方差分析。兩種營銷手段單獨(dú)作用或共同作用分別對目標(biāo)變量有何影響?例如,一位果醬生產(chǎn)商認(rèn)為,商標(biāo)名稱和銷售途徑有重要影響,于是他對三個不同的商標(biāo)名稱在兩種不同銷售途徑下進(jìn)行測試。對同一個年級的幾個班級用不同的教學(xué)方法,調(diào)查教學(xué)效果。132PPT課件典型的應(yīng)用實(shí)例:50PPT課件相關(guān)術(shù)語因素(因子):在方差分析中,所要檢驗(yàn)的對象稱為因素或因子。例子中的“行業(yè)”水平:因素中的不同表現(xiàn)稱為水平。例子中的零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是“行業(yè)”因素的具體表現(xiàn),即水平。單因素方差分析:只針對一個因素進(jìn)行分析;多因素方差分析:同時針對多個因素進(jìn)行分析。133PPT課件相關(guān)術(shù)語因素(因子):在方差分析中,所要檢驗(yàn)的對象稱為因素或(1)每個總體(因素的各個水平)的相應(yīng)變量服從正態(tài)分布。也就是說,對于因素的每個水平,其觀測值是來自正態(tài)總體的簡單隨機(jī)樣本,上例中每個行業(yè)的投訴次數(shù)應(yīng)服從正態(tài)分布。(2)所有總體的方差相等2。也就是說,各組觀測數(shù)據(jù)來自相同方差的正態(tài)總體。上例中4個行業(yè)被投訴次數(shù)的方差相同。(3)不同觀察值相互獨(dú)立。(每個樣本點(diǎn)的取值不影響其他樣本點(diǎn)的取值)上例中,每個企業(yè)被投訴的次數(shù)與其他企業(yè)被投訴的次數(shù)是相互獨(dú)立的。方差分析的三個基本假定134PPT課件(1)每個總體(因素的各個水平)的相應(yīng)變量服從正態(tài)分布。也就問題的一般提法設(shè)因素有r個水平,每個水平的均值分別為,要檢驗(yàn)r個水平(即為r個總體)的均值是否相等,提出如下假設(shè):與原來兩兩總體的假設(shè)檢驗(yàn)方法相比,方差分析不僅可以提高檢驗(yàn)的效率,同時由于它是將所有的樣本信息結(jié)合在一起,因此增加了分析的可靠性。,上例中如果用一般的假設(shè)檢驗(yàn)方法,需要兩兩組合作6次檢驗(yàn)。135PPT課件問題的一般提法設(shè)因素有r個水平,每個水平的均值分別為我們畫出不同行業(yè)投訴次數(shù)的散點(diǎn)圖零售業(yè)旅游業(yè)航空家電制造業(yè)806040200投訴次數(shù)行業(yè)●●●●●●●●●●●●●●●●●●●●●●●×××136PPT課件我們畫出不同行業(yè)投訴次數(shù)的散點(diǎn)圖零售業(yè)
圖中的折線是由投訴次數(shù)的均值連接而成的。從圖中可以看出不同行業(yè)投訴次數(shù)是有顯著差異的,而且即使在同一個行業(yè),不同企業(yè)的投訴次數(shù)也明顯不同這表明行業(yè)與被投訴次數(shù)有關(guān)系,因?yàn)槿绻袠I(yè)與被投訴次數(shù)之間如果沒有關(guān)系,不同行業(yè)被投訴次數(shù)的均值應(yīng)該差不多相同。但是,僅僅從散點(diǎn)圖上還不能提供充分的證據(jù)證明不同行業(yè)被投訴次數(shù)之間有顯著差異,因?yàn)橐苍S這種差異是由于抽樣的隨機(jī)性所造成的。因此需要通過對數(shù)據(jù)誤差來源進(jìn)行分析來判斷不同總體的均值是否相等,進(jìn)而分析某一個因素對實(shí)驗(yàn)結(jié)果是否有影響。因此進(jìn)行方差分析時,需要考察數(shù)據(jù)誤差的來源。137PPT課件圖中的折線是由投訴次數(shù)的均值連接而成的。從圖中首先,我們注意到同一行業(yè)(同一總體)下,樣本的觀測值是不同的。因?yàn)槠髽I(yè)是隨機(jī)抽取的,因此他們之間的差異可以看成是由隨機(jī)因素的影響造成的,或者說是由抽樣的隨機(jī)性造成的,我們稱之為隨機(jī)誤差。
其次,在不同的行業(yè)(不同的總體)下,各個觀測值也是不同的。這種差異除了抽樣的隨機(jī)性造成的,也可能是由于行業(yè)因素本身造成的,由不同行業(yè)所形成的誤差稱之為系統(tǒng)誤差。
數(shù)據(jù)的誤差用平方和表示。衡量因素的同一水平下(同一總體)下樣本數(shù)據(jù)的誤差,稱為是組內(nèi)誤差。例如,零售業(yè)所抽取的7家企業(yè)被投訴次數(shù)之間的誤差。衡量因素的不同水平(不同總體)下樣本之間的誤差,稱為組間誤差。例如,零售業(yè)、旅游業(yè)、航空業(yè)、家電制造業(yè)之間被投訴次數(shù)之間的誤差。138PPT課件首先,我們注意到同一行業(yè)(同一總體)下,樣本的觀顯然,組內(nèi)誤差只包含隨機(jī)誤差,組間誤差既包含隨機(jī)誤差也包含系統(tǒng)誤差。假如不同行業(yè)對投訴次數(shù)沒有影響,那么在組間誤差中只包含隨機(jī)誤差,而沒有系統(tǒng)誤差。這時,組內(nèi)誤差和組間誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就接近于1.反之,如果不同行業(yè)對投訴次數(shù)有影響,在組間誤差中除了包含隨機(jī)誤差外還包含系統(tǒng)性誤差,這時組間誤差平均后的值就會大于組內(nèi)誤差平均后的值,它們的比值就會大于1,當(dāng)這個比值大于某個臨界值時,我們就可以說因素的不同水平之間存在顯著差異。因此判斷行業(yè)對投訴次數(shù)是否有顯著影響這一問題,實(shí)際上就是檢驗(yàn)投訴次數(shù)的差異主要是由什么原因引起的。如果這種差異主要是系統(tǒng)誤差,我們就說不同行業(yè)對投訴次數(shù)有顯著影響。139PPT課件顯然,組內(nèi)誤差只包含隨機(jī)誤差,組間誤差既包含隨機(jī)誤差也包含系如果原假設(shè)成立:說明某因素不同水平的影響不顯著(無系統(tǒng)性影響),只剩下隨機(jī)性影響,因此組間誤差與組內(nèi)誤差差別不大,它們的比接近于1。如果原假設(shè)不成立:說明某因素不同水平的影響顯著(存在系統(tǒng)性影響),組間誤差與組內(nèi)誤差差別較大,它們的比遠(yuǎn)超出1構(gòu)造統(tǒng)計(jì)量:140PPT課件如果原假設(shè)成立:說明某因素不同水平的影響不顯著(無系統(tǒng)性影響
為全體樣本合并的大樣本的樣本均值為第
j個總體的樣本均值xij=第j個子樣本中第
i個觀測值;nj=第j個子樣本的樣本容量其中,n=n1+n2+…+nrr為總體的個數(shù)于是,大樣本的總誤差平方和(SumofSquaresforTotal,SST)為:設(shè)39誤差平方和的計(jì)算141PPT課件為全體樣本合并的大樣本的樣本均值為第j個總體的樣本均值
可以證明:
第一項(xiàng)是各子樣本均值與合并的大樣本的公共均值的離差平方和,它反映了因素不同水平對總離差平方和的影響(系統(tǒng)性影響),稱為組間誤差平方和(因素效應(yīng)誤差平方和)(SumofSquaresforFactorA,SSA);
第二項(xiàng)是各子樣本內(nèi)部離差平方和之和,反映了隨機(jī)性因素的影響(誤差性影響),稱為組內(nèi)誤差平方和(SumofSquaresforError,SSE)。142PPT課件可以證明:第一項(xiàng)是各子樣本均值與合并的大樣本的各誤差平方和的大小與觀測值的多少有關(guān),為了消除觀測值多少對誤差平方和大小的影響,用各個平方和除以自由度即得到平均平方誤差,簡稱均方誤差:
即
SST=SSA+SSE
總誤差平方和=組間誤差平方和+組內(nèi)誤差平方和構(gòu)造F統(tǒng)計(jì)量:當(dāng)原假設(shè)成立時143PPT課件各誤差平方和的大小與觀測值的多少有關(guān),為了消除觀測值根據(jù)給定的顯著性水平,查表得到拒絕域:上例中,經(jīng)計(jì)算說明不同行業(yè)被投訴次數(shù)的均值有顯著差異,這意味著行業(yè)(自變量)與投訴次數(shù)(因變量)之間的關(guān)系是顯著的。144PPT課件根據(jù)給定的顯著性水平,查表得到拒絕域:上例中,經(jīng)計(jì)算說明不同關(guān)系強(qiáng)度的測量上述F統(tǒng)計(jì)量只能表明自變量和因變量之間是否有關(guān)系,不能表明關(guān)系的強(qiáng)弱,為了度量相關(guān)強(qiáng)度定義判定系數(shù):R2越大說明關(guān)系越強(qiáng),越小關(guān)系越弱。類似于相關(guān)系數(shù)。上例中,R2=0.349759。這表明行業(yè)對投訴次數(shù)的影響效應(yīng)占總效應(yīng)的34.9759%,而殘差效應(yīng)則占65.0241%。
145PPT課件關(guān)系強(qiáng)度的測量上述F統(tǒng)計(jì)量只能表明自變量和因變量之間是否有關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職俄語(俄語會話)試題及答案
- 2025年大學(xué)大四(護(hù)理學(xué))婦產(chǎn)科護(hù)理學(xué)基礎(chǔ)測試題及答案
- 2025年中職汽車美容(汽車美容技術(shù))試題及答案
- 中學(xué)教師安全培訓(xùn)課件
- 運(yùn)行休息室管理制度
- 會議資料保密與安全管理制度
- 工資分配培訓(xùn)
- 2026年施工升降機(jī)安裝維修工防墜安全器校驗(yàn)測試含答案
- 2026年北京保安證試題及詳細(xì)答案解析
- 2026年理財(cái)規(guī)劃基礎(chǔ)認(rèn)證考題含答案
- 2026屆四川省成都市青羊區(qū)樹德實(shí)驗(yàn)中學(xué)物理九年級第一學(xué)期期末考試試題含解析
- 高溫熔融金屬冶煉安全知識培訓(xùn)課
- 林業(yè)種苗培育與管理技術(shù)規(guī)范
- 遼寧中考數(shù)學(xué)三年(2023-2025)真題分類匯編:專題06 幾何與二次函數(shù)壓軸題 解析版
- 修復(fù)征信服務(wù)合同范本
- 2025年及未來5年中國鈉基膨潤土市場深度評估及行業(yè)投資前景咨詢報(bào)告
- 康復(fù)醫(yī)學(xué)科進(jìn)修匯報(bào)
- 患者身份識別管理標(biāo)準(zhǔn)WST840-2025學(xué)習(xí)解讀課件
- 東航客服面試題目及答案
- 醫(yī)院醫(yī)療質(zhì)量分析會
- 酒吧廚房小吃承包協(xié)議書
評論
0/150
提交評論