GB/T 3358.1-2009統(tǒng)計學(xué)詞匯及符號第1部分:一般統(tǒng)計術(shù)語與用于概率的術(shù)語_第1頁
GB/T 3358.1-2009統(tǒng)計學(xué)詞匯及符號第1部分:一般統(tǒng)計術(shù)語與用于概率的術(shù)語_第2頁
GB/T 3358.1-2009統(tǒng)計學(xué)詞匯及符號第1部分:一般統(tǒng)計術(shù)語與用于概率的術(shù)語_第3頁
GB/T 3358.1-2009統(tǒng)計學(xué)詞匯及符號第1部分:一般統(tǒng)計術(shù)語與用于概率的術(shù)語_第4頁
GB/T 3358.1-2009統(tǒng)計學(xué)詞匯及符號第1部分:一般統(tǒng)計術(shù)語與用于概率的術(shù)語_第5頁
已閱讀5頁,還剩107頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

代替GB/T3358.1-1993統(tǒng)計學(xué)詞匯及符號一般統(tǒng)計術(shù)語與用于概率的術(shù)語2009-10-15發(fā)布中華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局發(fā)布IGB/T3358.1—2009/ISO3534-1:2006前言 范圍 1一般統(tǒng)計術(shù)語 12用于概率的術(shù)語 附錄A(資料性附錄)符號 附錄B(資料性附錄)統(tǒng)計概念圖 附錄C(資料性附錄)概率概念圖 41附錄D(資料性附錄)定義標準中的術(shù)語所使用的方法 參考文獻 48索引 漢語拼音索引 49英文對應(yīng)詞索引 ⅢGB/T3358《統(tǒng)計學(xué)詞匯及符號》分為以下部分:--第1部分:一般統(tǒng)計術(shù)語與用于概率的術(shù)語;-—第2部分:應(yīng)用統(tǒng)計;——第3部分:實驗設(shè)計。本部分為GB/T3358的第1部分,等同采用ISO3534-1:2006《統(tǒng)計學(xué)詞匯及符號第1部分:一般統(tǒng)計術(shù)語與用于概率的術(shù)語》。與ISO3534-1:2006相比,訂正了原文的錯誤,修正原文中概念表——刪去了1.24原文中的注1;——2.38示例中變異系數(shù)的計算式“0.99/0.995=0.99497”更正為“0.995/0.9=1.10556”;為便于使用,本部分作了下列編輯性修改:——刪去了ISO前言;——為術(shù)語的簡練起見,在少數(shù)術(shù)語中,使用中括號表示其中可省略部分。例如:2.5中,[事件A的]概率(probability[ofancventA]),表示此術(shù)語實際定義的是“概率(probability)”,其中“事件A的”在許多場合可省略。又如2.34“r階[原點]矩(momentoforderr)”表示原文的“γ階矩(momentoforderr)”也稱為“r階原點矩”。本部分代替GB/T3358.1—1993《統(tǒng)計學(xué)術(shù)語第一部分一般統(tǒng)計術(shù)語》,與GB/T3358.1-- 對術(shù)語條目作了較大的調(diào)整;增加了一般統(tǒng)計術(shù)語及用于概率的術(shù)語;將GB/T3358.1-1993中第4章“觀測和測試結(jié)果的一般術(shù)語”及第5章“抽樣方法的一般術(shù)語”中的內(nèi)容移至GB/T3358的第2部分;——增加了大量的示例及注釋; 增加了術(shù)語概念圖(附錄B、附錄C)及定義標準中的術(shù)語所使用的方法的附錄D,并將關(guān)于符號的附錄A改為資料性附錄。本部分由全國統(tǒng)計方法應(yīng)用標準化技術(shù)委員會提出并歸口。本部分于1993年首次發(fā)布,本次為第一次修訂。目前版本的GB/T3358.1和GB/T3358.2是兼容的,其共同目標是在一致、準確而簡潔的前提下,將定義所需的數(shù)學(xué)程度限制在最低水平。由于GB/T3358.1是概率和統(tǒng)計的基礎(chǔ)術(shù)語,所以有必要用相對嚴格而復(fù)雜的數(shù)學(xué)語言來表述??紤]到GB/T3358.2及其他統(tǒng)計方法應(yīng)用標準的使用者有時需要查詢GB/T3358.1中術(shù)語的定義,因此本部分的術(shù)語盡可能用通俗的方式來描述,并輔以注釋及示例。盡管這些非正式的描述并不能取代正式的定義,但為統(tǒng)計專業(yè)以外的人員提供了有效的概念性的定義,能滿足這些術(shù)語標準的大多數(shù)用戶的需要。為了進一步適應(yīng)經(jīng)常使用GB/T3358.2或GB/T6379等標準的用戶,通過注釋和示例使GB/T3358.1更易于理解。一套明確定義的,且相對完整的概率統(tǒng)計術(shù)語對統(tǒng)計標準的編制及有效使用是必需的。定義必須足夠準確、且具備數(shù)學(xué)意義上的嚴格性,使在編制其他統(tǒng)計標準時避免出現(xiàn)概念模糊。當然,對概念的更詳細的解釋、背景和應(yīng)用領(lǐng)域可在初等概率統(tǒng)計教材中找到。資料性附錄B與附錄C分別為一般統(tǒng)計術(shù)語與用于概率的術(shù)語提供了系列概念框圖。其中一般統(tǒng)計術(shù)語包含六個概念圖;用于概率的術(shù)語包含四個概念圖。某些術(shù)語同時出現(xiàn)在幾個不同的框圖中,從而起到一組概念與另一組概念的聯(lián)系作用。附錄D提供了關(guān)于概念圖的簡要介紹及其解釋。這些框圖有助于本次修訂,因為它們有助于描述不同術(shù)語之間的相互聯(lián)系。這些框圖也有助于標準文本的翻譯。除非另有說明,本標準中大部分術(shù)語均在一維(單變量)場合下定義。這避免了許多術(shù)語在類似條件下進行重復(fù)定義。1統(tǒng)計學(xué)詞匯及符號用于概率的術(shù)語GB/T3358的本部分規(guī)定了用于標準起草的一般統(tǒng)計術(shù)語、用于概率的術(shù)語的定義及部分術(shù)語的本部分中的術(shù)語分為:a)一般統(tǒng)計術(shù)語(第1章);b)用于概率的術(shù)語(第2章)。附錄A列出了本部分推薦使用的符號。附錄B和附錄C是本部分所有術(shù)語條目的概念框圖。1一般統(tǒng)計術(shù)語所考慮對象的全體。注1:總體可是真實有限或無限的,也可是完全虛構(gòu)的。有時,特別是在調(diào)查抽樣中也使用“有限總體”;在一些流注2:對于虛構(gòu)的總體,允許人們想象在不同假定條件下的數(shù)據(jù)所具有的屬性。因此,虛構(gòu)總體在統(tǒng)計研究的設(shè)計階段,特別是確定適宜樣本量時非常有用。虛構(gòu)總體所含對象數(shù)目可以是有限的也可以是無限的。在統(tǒng)計推斷中,這是一個對評價統(tǒng)計研究證據(jù)強度特別有用的概念。注3:下面的例子能幫助理解總體這一概念:若有三個村莊被選中作人口統(tǒng)計或健康研究,總體即由這三個村莊的全體居民構(gòu)成;若這三個村莊是從某個特定區(qū)域中的所有村莊中隨機抽選出來的,則總體由該區(qū)域中的所有居民構(gòu)成。抽樣單元samplingunit總體(1.1)劃分成若干部分中的每一部分。由一個或者多個抽樣單元(1.2)組成的總體(1.1)的子集。注1:根據(jù)所研究總體的情況,樣本中的每個單元可是真實或抽象的個體,也可是具體的數(shù)值。注2:在GB/T3358.2關(guān)于樣本的定義中,包括一個抽樣框的示例。抽樣框在從有限總體中抽取隨機樣本時是必須的。由樣本(1.3)中每個單元獲得的相關(guān)特性的值。2注2:本定義并沒有指明值的來源或如何被獲得。觀測值可表示某隨機變量(2.10)的一次實現(xiàn),但并不一定如此。它可以是相繼用于統(tǒng)計分析的若干值中的一個。正確的推斷需要一定的統(tǒng)計假定,但首先要做的是對觀測值的計算概括或圖形描述。僅當需要解決進一步的問題,如確定觀測值落人某一指定集合的概率,統(tǒng)計機制才是重要而本質(zhì)的。觀測值分析的初始階段通常稱為數(shù)據(jù)分析。描述性統(tǒng)計量descriptivestatistics觀測值(1.4)的圖形、數(shù)值或其他概括性描述。示例1:數(shù)值描述包括樣本均值(1.15)、樣本極差(1.10)、樣本標準差(1.17)等。示例2:圖形描述包括箱線圖、示意圖、Q-Q圖、正態(tài)分位圖、散隨機樣本randomsample由隨機抽取的方法獲得的樣本(1.3)。注1:本定義比GB/T3358.2給出的定義限制要少,樣本允許來自無限總體。注2:當從有限樣本空間(2.1)中抽取n個抽樣單元組成樣本時,n個抽樣單元的任意一種組合都會以特定的概率(2.5)被抽中。對于調(diào)查抽樣方案而言,每一種可能組合被抽中的概率可事先計算。注3:對有限樣本空間的調(diào)查抽樣,隨機樣本可以通過不同的抽樣方法得到,如分層隨機抽樣、隨機起點的系統(tǒng)抽樣、整群抽樣、與輔助變量的大小成比例的概率抽樣以及其他可能的抽樣。注4:本定義一般是指實際觀測值(1.4)。這些觀測值被認為是隨機變量(2.10)的實現(xiàn),其中每個觀測值都對應(yīng)于一個隨機變量。當由隨機樣本構(gòu)造估計量(1.12)、統(tǒng)計檢驗(1.48)的檢驗統(tǒng)計量或置信區(qū)間(1.28)時,本定義是指從樣本中的抽象個體得到的隨機變量而不是這些隨機變量的實際觀測值。注5:無限總體中的隨機樣本一般是從樣本空間中重復(fù)抽取產(chǎn)生的。根據(jù)注4的解釋,此時樣本由獨立同分布的隨機變量組成。簡單隨機樣本simplerandomsample〈有限總體>給定樣本量的每個子集都有相等的被抽選概率的隨機樣本(1.6)。注:此處的定義與GB/T3358.2中的定義是一致的,僅在措辭上稍有不同。由隨機變量(2.10)完全確定的函數(shù)。注1:在1.6注4的意義下,統(tǒng)計量是隨機樣本(1.6)中隨機變量的函數(shù)。注2:按注1,若(X?,X?,…,X.》是來自未知均值(2.35)μ和未知標準差(2.37)o的正態(tài)分布(2.50)的隨機樣本,則樣本均值(1.15)(X?+X?+…+X,)/n是一個統(tǒng)計量;而[(X?+X?+…+X,)/n]-μ不是統(tǒng)計量,因為它包含了未知參數(shù)(2.9)p。注3:相應(yīng)于數(shù)理統(tǒng)計中的表述,此處給出的是統(tǒng)計量的一種技術(shù)性定義。英語中,統(tǒng)計量(statistic)的復(fù)數(shù)形式就是統(tǒng)計學(xué)(statistics),它是一門包括了統(tǒng)計方法應(yīng)用標準中所敘述的分析方法的技術(shù)學(xué)科。次序統(tǒng)計量orderstatistic由隨機樣本(1.6)中的隨機變量(2.10)的值,依非降次序排列所確定的統(tǒng)計量(1.8)。示例:假設(shè)樣本觀測值為9,13,7,6,13,7,19,6,10,7,則次序統(tǒng)計量的觀測值為:6,6,7,7,7,9,10,13,13,19。這些值是Xa),…,X(ao)的一次實現(xiàn)。注1:假設(shè)隨機樣本(1.6)的觀測值(1.4)為《x?,x?,…,x,},按非降的次序排列為xu≤…≤x?≤…≤x,則(xu),…,Zuy,…,Z()是次序統(tǒng)計量(Xu),…,Xa,…,X(w)的觀測值,xa。為第k個次序統(tǒng)計量的觀測值。注2:在實際應(yīng)用中,為獲得一組數(shù)據(jù)的次序統(tǒng)計量,即是將數(shù)據(jù)按照注1中所述方式進行排序。將一組數(shù)據(jù)按上述方法排序后,還可獲得其他幾個術(shù)語定義的有用的統(tǒng)計量,如1.10、1.11等。注3:次序統(tǒng)計量涉及按照非降次序排列后的位置來識別的樣本值。正如示例所示,將樣本值(隨機變量的實現(xiàn))排序比將未觀測的隨機變量排序更容易理解。它可以通過按照非降次序排列的隨機樣本(1.6)來理解隨機變3量。比如,n個隨機變量的最大值可以先于它的實現(xiàn)值來研究。注4:單個次序統(tǒng)計量是隨機變量的一個特定函數(shù)。這個函數(shù)可以簡單地由其在隨機變量排序集合中的位置或序次(稱為秩)來確定。注6:排序按照隨機變量的實數(shù)值進行,而不是按照其絕對值進行。注7:次序統(tǒng)計量(Xu,…,Xa,…,X()組成n維隨機變量,n是樣本中觀測值的個數(shù)。注8:次序統(tǒng)計量的分量也是次序統(tǒng)計量,而且保持其在原樣本排序中的位置標識。注9:最小值,最大值以及樣本量為奇數(shù)時的樣本中位數(shù)(1.13)都是特殊的次序統(tǒng)計量。比如樣本量為11,那么最大次序統(tǒng)計量(1.9)與最小次序統(tǒng)計量的差。示例:在1.9中的示例中,樣本極差的觀測值為19-6=13。注:在統(tǒng)計過程控制中,尤其當樣本量相對比較小時,樣本極差通常用來監(jiān)測過程的離散程度隨時間的變化。最大和最小次序統(tǒng)計量(1.9)的平均值(1.15)。示例:1.9的示例中,中程數(shù)的觀測值為(6+19)/2=12.5。注:中程數(shù)能夠?qū)^小數(shù)據(jù)集的中心提供一種快捷而簡單的估計。δ用于對參數(shù)0估計(1.36)的統(tǒng)計量(1.8)。注1:樣本均值(1.15)是總體均值(2.35)μ的一個估計量。例如,對于正態(tài)分布(2.50),樣本均值是總體均值μ的估計量。注2:要估計總體的特征(如一維(元)分布(2.16)的眾數(shù)(2.27)),一個合適的估計量可以是分布參數(shù)估計量的函注3:此處所講的“估計量”是一個寬泛的概念。它包括某參數(shù)的點估計,也包括用于預(yù)測的區(qū)間估計。估計量也包括該估計量和其他特殊形式的統(tǒng)計量。另見1.36注的討論。樣本中位數(shù)samplemedian若樣本量(見GB/T3358.2—2009,1.2.26)n為奇數(shù),則是第(n+1)/2個次序統(tǒng)計量(1.9);若樣本量n是偶數(shù),則是第n/2與第(n/2)+1個次序統(tǒng)計量之和除以2。示例:續(xù)1.9的示例,8為樣本中位數(shù)的一個實現(xiàn),此時樣本量為10(偶數(shù)),第5和第6個次序統(tǒng)計量分別為7和9,其平均值為8。盡管嚴格來說樣本中位數(shù)是作為一個隨機變量來定義的,但在實際中也說“樣本中位數(shù)為8”。注1:對于樣本量為n的隨機樣本(1.6),其隨機變量(2.10)按照非降順序從1到n排列,如果樣本量為奇數(shù),則樣本中位數(shù)為第(n+1)/2個隨機變量,如果樣本量為偶數(shù),則樣本中位數(shù)為第(n/2)個與第(n+1)/2個隨機注2:從概念上講,對一個沒有觀測到的隨機變量進行排序似乎是不可能的。但不經(jīng)觀測也可理解次序統(tǒng)計量的結(jié)構(gòu)。在實際中,通過獲得觀測值并對其進行排序,從而得到次序統(tǒng)計量的實現(xiàn)。這些實現(xiàn)值可用于解釋次序注3:樣本中位數(shù)是分布中間位置的一個估計,各有一半的樣本單元大于等于或小于等于它。注4:樣本中位數(shù)在實際問題中是有用的,它提供了一個對數(shù)據(jù)極端值不敏感的估計量。例如,中位收入和中位房價都是常用的統(tǒng)計指標。4GB/T3358.1—2009/ISO隨機樣本(1.6)中隨機變量(2.10)的k次冪的和除以和中的項數(shù)。注1:對于樣本量為n的隨機樣本《X?,X?,…,X。},k階樣本矩為:注2:本術(shù)語也稱為k階樣本原點矩。注3:一階樣本矩即為樣本均值(1.15)。注4:雖然本定義中k可取任意值,但在實際中常用的是k=1[樣本均值(1.15)],k=2[與樣本方差(1.16)和樣本標準差(1.17)有關(guān)],k=3[與樣本偏度系數(shù)(1.20)有關(guān)]和k=4[與樣本峰度系數(shù)(1.21)有關(guān)]的情形。樣本均值samplemean平均數(shù)average隨機樣本(1.6)中隨機變量(2.10)的和除以和中的項數(shù)。示例:續(xù)1.9中的示例,觀測值的和為97,樣本量為10,樣本均值的實現(xiàn)為9.7。注1:在1.8中注3的意義下,樣本均值作為統(tǒng)計量是隨機樣本中隨機變量的函數(shù)。必須區(qū)分統(tǒng)計量與由隨機樣本中觀測值(1.4)計算得出的樣本均值的數(shù)值。注2:樣本均值作為統(tǒng)計量,常用作總體均值(2.35)的估計量。算術(shù)平均值是它的同義詞。注3:對樣本量為n的隨機樣本{X?,X?,…,X,},樣本均值為:注4:樣本均值就是一階樣本矩。注5:樣本量為2時,樣本均值、樣本中位數(shù)(1.13)和中程數(shù)(1.11)皆相同。S2隨機樣本(1.6)中隨機變量(2.10)與樣本均值(1.15)差的平方和用和中項數(shù)減1除。示例:續(xù)1.9中的示例,樣本觀測值與樣本均值差的平方和為158.10,樣本量10減1為9,計算得樣本方差為注1:樣本方差S2作為統(tǒng)計量(1.8),是隨機樣本中隨機變量的函數(shù)。必須區(qū)分這個統(tǒng)計量與根據(jù)隨機樣本觀測值(1.4)計算得出的樣本方差的數(shù)值,該值稱為經(jīng)驗樣本方差或觀測樣本方差,通常記作s2。注2:對樣本量為n的隨機樣本{X?,X?,…,X,},樣本均值為X,則注3:樣本方差作為一個統(tǒng)計量“差不多”等于該隨機變量(2.10)與樣本均值(1.15)差的平方的平均數(shù)(其中“差不多”是指這里平均用n-1而不是用n作分母),用n-1作分母是為總體方差(2.36)提供一個無偏估計量注4:n-1稱為自由度(2.54)。注5:樣本方差可以近似認為是中心化樣本隨機變量(2.31)的二階樣本矩(僅以n-1代替n)。S樣本方差(1.16)的非負平方根。示例:續(xù)1.9中的示例,觀測樣本方差為17.57,觀測樣本標準差為4.192。注1:實際中樣本標準差用來估計總體標準差(2.37)。再次強調(diào)S也是一個隨機變量(2.10),而并不是隨機樣本(1.6)的實現(xiàn)。注2:樣本標準差是分布(2.11)離散程度的一個度量。5GB/T3358.1—2009/ISO3534-1:2006樣本變異系數(shù)samplecoefficientofvariation樣本標準差(1.17)除以非零樣本均值(1.15)的絕對值。注:變異系數(shù)通常表示成百分數(shù)。標準化樣本隨機變量standardizedsamplerandomvariable隨機變量(2.10)與其樣本均值(1.15)的差除以樣本標準差(1.17)。示例:續(xù)1.9中的示例,觀測樣本均值為9.7,觀測樣本標準差為4.192,觀測標準化隨機變量(表示為兩位小數(shù))為:一0.17;0.79;-0.64;一0.88;0.79;一0.64;2.22,-0.88;0.07;-0.62。注1:標準化樣本隨機變量應(yīng)區(qū)別于理論上的標準化隨機變量(2.33)。將隨機變量標準化的目的在于使得其均值為0、標準差為1,便于解釋和比較。注2:標準化樣本觀測值的觀測樣本均值為0,觀測樣本標準差為1。樣本偏度系數(shù)samplecoefficientofskewness隨機樣本(1.6)的標準化樣本隨機變量(1.19)三次冪的算術(shù)平均值。示例:續(xù)1.9中的示例,觀測樣本偏度系數(shù)的計算結(jié)果為0.97188。如本例中的樣本量為10的情形,樣本偏度系數(shù)不夠穩(wěn)定,因此應(yīng)謹慎使用。根據(jù)注1給出的另一公式計算出的值為1.34983。注1:對應(yīng)于定義中公式為:有些統(tǒng)計軟件里使用下面的公式修正樣本偏度系數(shù)的偏倚(1.33):其中:當樣本量很大時,兩個公式的差別可以忽略。當n=10,100,1000時,修偏估計值與定義中的估計值之比分別為1.389,1.031,1.003。注2:偏度系數(shù)是對分布不對稱性的度量,如果偏度系數(shù)接近0意味著真實分布近似對稱。偏度系數(shù)不為零時意味著在某一側(cè)尾部可能有極端值。有偏的數(shù)據(jù)也會在樣本均值(1.15)與樣本中位數(shù)(1.13)的差異上體現(xiàn)出來。正偏(右偏)數(shù)據(jù)表明可能有少數(shù)大的極端值。同樣,負偏(左偏)數(shù)據(jù)表明可能有少數(shù)小的極端值。注3:樣本偏度系數(shù)也是標準化樣本隨機變量(1.19)的三階樣本矩。樣本峰度系數(shù)samplecoefficientofkurtosis隨機樣本(1.6)的標準化樣本隨機變量(1.19)四次冪的算術(shù)平均值。示例:續(xù)1.9中的示例,觀測樣本峰度系數(shù)的計算結(jié)果為2.67419。如本例中的樣本量為10的情形,樣本峰度系數(shù)極不穩(wěn)定,因此應(yīng)謹慎使用。統(tǒng)計軟件包在計算樣本峰度系數(shù)時常進行了各種修正(參見2.40中的注3)。應(yīng)用注1中的另一公式計算的值為0.43605。不能直接比較2.67419和0.43605這兩個數(shù)值。為此,應(yīng)將2.67419減去3(正態(tài)分布的峰度系數(shù)為3),其差為一0.32581,這個數(shù)值可與0.43605進行比較。注1:與定義對應(yīng)的公式是:一些統(tǒng)計軟件包使用下面公式來修正樣本峰度系數(shù)的偏倚(1.33),它表示對正態(tài)分布峰度系數(shù)(等于3)的偏離:6其中:當n充分大時,上式第二項近似為3。有時為了強調(diào)與正態(tài)分布的比較,峰度表示為如2.40中定義的值減去3。顯然,實際應(yīng)用者需要注意到統(tǒng)計軟件包中是否包含任何修正。注2:峰度描述了(單峰)分布的重尾程度。對正態(tài)分布(2.50),由于抽樣隨機性,樣本峰度系數(shù)一般只近似,而不是恰好為3。在實際應(yīng)用中正態(tài)的峰度提供了一個基準值:峰度值小于3的分布(2.11)有比正態(tài)輕的尾部;峰度值大于3的分布有比正態(tài)重的尾部。注3:對于峰度觀測值大于3很多的情形,一種可能是因為真實分布的尾部比正態(tài)尾部重,另一可能是分布中存在潛在的離群值。注4:樣本峰度系數(shù)可認為是標準化隨機變量的四階樣本矩。隨機樣本(1.6)中兩個隨機變量(2.10)對各自樣本均值(1.15)的離差的乘積之和被求和項數(shù)減示例1:考慮下列三個變量的10組觀測值。在這個示例中,只考慮x和y。表1示例1的觀測結(jié)果i123456789ZyzX的觀測樣本均值是46.1,Y的觀測樣本均值是75.4,X與Y的樣本協(xié)方差等于,示例2:在上例的表中,考慮y和z,Z的觀測樣本均值是31.3,Y與Z的樣本協(xié)方差等于,=-54.356注1:作為統(tǒng)計量(1.8),樣本協(xié)方差是樣本量為n的隨機變量對:(X?,Y?),(X?,Y?),…,(X,,Y)義下的函數(shù)。這個統(tǒng)計量需要與隨機樣本中由抽樣單元(1.2)(x?,y?),(x?,y?),…,(x,,y)得到樣本協(xié)方差的數(shù)值相區(qū)別。后者稱為經(jīng)驗樣本協(xié)方差或觀測樣本協(xié)方差。注2:樣本協(xié)方差Sxy由下式給出:在(1.6)注3意的觀測值計算注3:用n-1除是為總體協(xié)方差(2.43)提供一個無偏估計量(1.34)。注4:表1的示例包含3個變量,而協(xié)方差定義中只涉及2個變量。在實際應(yīng)用中經(jīng)常會遇到多個變量的情況。樣本相關(guān)系數(shù)samplecorrelationcoefficientrzy樣本協(xié)方差(1.22)用相應(yīng)樣本標準差(1.17)的乘積來除。示例1:續(xù)1.22中的示例1。X的觀測標準差為12.945,Y的觀測標準差為21.329。從而X和Y的觀測樣本相關(guān)系數(shù)為:示例2:繼續(xù)1.22的示例2,Y的觀測標準差為21.329,Z的觀測標準差為4.165。從而Y和Z的觀測樣本相關(guān)系數(shù)為:7注1:樣本相關(guān)系數(shù)的計算公式如下:這個表達式等價于樣本協(xié)方差與兩方差乘積的平方根的比。有時用r。表示樣本相關(guān)系數(shù)。觀測樣本相關(guān)系數(shù)是基于實現(xiàn)值(x?,y?),(x?,y?),…,(x.,y.)的。注2:觀測樣本相關(guān)系數(shù)取值在[-1,1]之間。取值接近于1表示強的正相關(guān);取值接近于一1表示強的負相關(guān)。取值接近于1或-1表明數(shù)據(jù)點近似在一條直線上。標準誤差standarderror估計量(1.12)à的標準差(2.37)。示例:如果以樣本均值(1.15)作為總體均值(2.35)的一個估計,且隨機變量(2.10)的標準差為σ,則樣本均值的標準誤差為σ/√π,其中n是樣本中觀測值的個數(shù)。標準誤差的一個估計是S/√π,其中S是樣本標準差(1.17)。注:不存在反義詞“非標準”誤差。通常在應(yīng)用中,標準誤差特指樣本均值的標準差,記為σx,此時也常簡稱為“標由一個上限統(tǒng)計量和一個下限統(tǒng)計量(1.8)所界定的區(qū)間。注1:區(qū)間的一個端點可以是+驚,-m或是參數(shù)值的一個自然界限。如“0”是總體方差(2.36)區(qū)間估計的一個自然下限。在此情形,區(qū)間稱為是單側(cè)的。注2:區(qū)間估計可結(jié)合參數(shù)(2.9)估計(1.36)給出。區(qū)間估計通常是以假定在重復(fù)抽樣下,區(qū)間包含所估計的參數(shù)確定比例或其他某種概率意義下給出的。注3:區(qū)間估計通常有三種:參數(shù)的置信區(qū)間(1.28),對未來觀測的預(yù)測區(qū)間(1.30)和分布(2.11)被包含一個確定比例的統(tǒng)計容忍區(qū)間(1.26)。在規(guī)定置信水平下,由隨機樣本(1.6)確定的至少覆蓋抽樣總體(1.1)的指定比例的區(qū)間。注:這里“置信”一詞是指在大量重復(fù)意義下,所構(gòu)造區(qū)間應(yīng)至少包含抽樣總體的指定比例。統(tǒng)計容忍限statisticaltolerancelimit表示統(tǒng)計容忍區(qū)間(1.26)端點的統(tǒng)計量(1.8)。注:統(tǒng)計容忍限可為以下兩種情況的一種: 單側(cè)容忍限,即單側(cè)的統(tǒng)計容忍上限或單側(cè)的統(tǒng)計容忍下限,此時另一個容忍限為隨機變量的自然界限——雙側(cè)容忍限,此時有兩個統(tǒng)計容忍限,置信區(qū)間confidenceinterval參數(shù)(2.9)0的區(qū)間估計(1.25)(T。,T?),其中作為區(qū)間限的統(tǒng)計量(1.8)T。,T?,滿足P[T。<注1:置信度反映了在同一條件下大量重復(fù)隨機抽樣(1.6)中,置信區(qū)間包含參數(shù)真值的比例。置信區(qū)間并不能反映觀測到的區(qū)間包含參數(shù)真值的概率(2.5)(觀測到的區(qū)間只能是要么包含要么不包含參數(shù)真值)。注2:一個與置信區(qū)間相關(guān)的量是100(1-a)%,稱為置信系數(shù)或置信水平,其中α是一個小的數(shù)。對任意確定但置信系數(shù)通常取為95%或99%。8其中一個端點固定為+騖,-0或某個自然確定邊界的置信區(qū)間(1.28)。注1:這是將定義1.28應(yīng)用在To=-或T?=+時的情形。單側(cè)置信區(qū)間出現(xiàn)在只對一個方向感興趣的情形。例如在移動電話安全音量測試中,關(guān)心的是安全上限。安全上限表示在假定安全條件下產(chǎn)生的音量的上界。注2:另一種單側(cè)置信區(qū)間的情況出現(xiàn)在參數(shù)有自然邊界(例如為0)的情形中。在用泊松分布(2.47)作為顧客投訴次數(shù)的模型時,0是自然下限。又如,一個電子元件可靠度的置信區(qū)間可以為(0.98,1),其中1是可靠度的自然上限。由一個可連續(xù)觀測的總體中抽取的隨機樣本(1.6)值所確定的,以一定置信水平使得來自同一總體(1.1)的未來隨機樣本值落在其中的變量取值范圍。注:預(yù)測通常關(guān)注的是來自相同總體的單個未來觀測值。另一個實際背景是回歸分析中由一系列獨立觀測值構(gòu)造響應(yīng)變量的預(yù)測區(qū)間。估計量(1.12)的觀測值(1.4)。注:估計值是從觀測值中獲得的數(shù)值。對于一個假定的概率分布(2.11)中參數(shù)(2.9)的估計(1.36),估計量是指為了估計參數(shù)的統(tǒng)計量(1.8),而估計值是在估計量中使用觀測值的結(jié)果。有時在估計的前面加形容詞“點”,即估計誤差errorofestimation估計值(1.31)與待估計的參數(shù)(2.9)或總體特性值的差。注1:總體特性值可以是參數(shù)的函數(shù)或某個與概率分布(2.11)有關(guān)的量。注2:估計誤差可由抽樣、測量的不確定性、數(shù)值修約或其他原因引起。事實上,估計誤差表示實際工作者所關(guān)心性能的底線。確定估計誤差的來源是質(zhì)量改進努力的關(guān)鍵。偏倚bias估計誤差(1.32)的期望(2.12)。注1:本定義與GB/T3358.2—2009(3.3.2)和VIM:1993(5.25和5.28)有所不同。這里的偏倚正如1.34的注所注2:實際中偏倚的存在可能導(dǎo)致不幸的結(jié)果。例如低估材料的強度的偏倚可能導(dǎo)致設(shè)備的失效。在調(diào)查抽樣中的偏倚導(dǎo)致根據(jù)民意測驗結(jié)果引起決策的失誤。偏倚(1.33)為0的估計量(1.12)。示例1:一個由n個獨立隨機變量(2.10)組成的隨機樣本(1.6),每個服從均值(2.35)為μ,標準差(2.37)為o的正態(tài)分布(2.50)。樣本均值(1.15)X和樣本方差(1.16)S2分別是均值μ和方差(2.36)d2的無偏估計量。示例2:如1.37的注1所述的方差o2的極大似然估計(1.35)中,分母用n-1代替n,則它是無偏估計量。在應(yīng)用中也經(jīng)常使用樣本標準差(1.17),注意使用n-1作為除數(shù)的樣本方差的平方根并不是總體標準差(2.37)的無偏估計量。示例3:一個由n個獨立隨機變量組成的隨機樣本,每一對都服從協(xié)方差(2.43)為poxo,的二維正態(tài)分布(2.65),則樣本協(xié)方差(1.22)是總體協(xié)方差的無偏估計量。而協(xié)方差的的極大似然估計中,分母用的是n,而不是n-1,因此它是有偏估計量。9GB/T3358.1—2009/ISO3534-1:2006注1:無偏估計是在平均意義下,給出了正確的值。無偏估計量為尋求總體參數(shù)的“最優(yōu)”估計提供了一個有用的初始值。這里給出的定義是無偏估計量的一種統(tǒng)計特征。注2:在日常應(yīng)用中,實際工作者通過某種機制,例如保證隨機樣本對總體的代表性,來努力避免可能出現(xiàn)的偏倚。極大似然估計量maximumlikelihoodestimator使似然函數(shù)(1.38)達到或趨近最大值的參數(shù)(2.9)的估計量(1.12)。注1:當分布(2.11)(如正態(tài)分布(2.50)、伽瑪分布(2.56)、威布爾分布(2.63)等)確定時,極大似然估計方法是獲得參數(shù)估計值的一種成熟方法。極大似然估計量具有許多優(yōu)良的統(tǒng)計性質(zhì)(如在單調(diào)變換下不變),對許多情形是一種可選擇的估計方法。如果極大似然估計量有偏,有時需要進行簡單的偏倚(1.33)修正。如1.34示例2所述的正態(tài)分布方差(2.36)的極大似然估計量是有偏,但偏倚隨著樣本量的增加而減少,若將分母n改為n—1,即可將有偏的估計量修正為無偏的。注2:極大似然估計量和極大似然估計通常都簡寫成MLE,應(yīng)隨上下文適當選用。估計estimation通過從總體(1.1)中抽取的隨機樣本(1.6),獲得對該總體的一種統(tǒng)計表示的方法。注1:特別地,估計程序包含由估計量(1.12)到具體估計值(1.31)的過程。注2:估計是一個相當廣泛的概念,包括點估計、區(qū)間估計或總體性質(zhì)的估計。注3:統(tǒng)計表示經(jīng)常是指假定模型下,參數(shù)(2.9)或參數(shù)函數(shù)的估計。更一般地,總體表示可以不完全確定,例如有關(guān)自然災(zāi)難影響的統(tǒng)計(應(yīng)急管理者所希望得到的傷亡人數(shù)、財產(chǎn)損失或農(nóng)業(yè)損失等的估計)。注4:通過對描述性統(tǒng)計量(1.5)的研究,可能揭示假定模型是否對數(shù)據(jù)提供了不適當?shù)慕y(tǒng)計表示。如對模型擬合基于極大似然估計量(1.35)進行的估計(1.36)。注1:對正態(tài)分布(2.50),樣本均值(1.15)是參數(shù)(2.9)μ的極大似然估計量。分母用n(而不是n-1)的樣本方差(1.16)是σ2的極大似然估計量。一般情況下,樣本方差分母使用n—1,是為了得到σ2的一個無偏估計量注2:極大似然估計有時用來描述從似然函數(shù)導(dǎo)出(極大似然)估計量(1.12)的過程。注3:盡管在某些情況下似然方程可以有顯式解,但是很多情況下極大似然估計量是一組方程的迭代解。注4:極大似然估計量和極大似然估計值通常簡寫成MLE,需隨上下文來合理選擇。似然函數(shù)likelihoodfunction在觀測值(1.4)處,將概率密度函數(shù)(2.26)看作分布族(2.8)中參數(shù)(2.9)的函數(shù)。示例1:考慮從一個非常大的總體(1.1)中隨機抽取10個個體,發(fā)現(xiàn)其中3個具有指定的特征。對這個樣本,總體中具有指定特征的比例的一個直觀估計值(1.31)是0.3(10個中有3個)。在二項分布(2.46)模這也可通過畫出二項分布(2.46)的概率函數(shù)120p3(1一p)’關(guān)于p的圖形進一步驗證。示例2:對正態(tài)分布(2.50),可以證明,當標準差(2.37)已知時,似然函數(shù)在μ等于樣本均值時達到最大值。剖面似然函數(shù)profilelikelihoodfunction其余參數(shù)取使其極大化,而僅作為一個單參數(shù)(2.9)的似然函數(shù)(1.38)。H關(guān)于總體(1.1)的陳述。注:通常這個命題與分布族(2.8)中的一個或幾個參數(shù)(2.9),或與此分布族本身有關(guān)。用統(tǒng)計檢驗(1.48)方法來檢驗的假設(shè)(1.40)。示例1:在獨立同分布正態(tài)隨機變量(2.10)的隨機樣本(1.6)中,均值(2.35)和標準差(2.37)未知,對均值μ的一個原假設(shè)是:“均值小于或等于某給定值μ”。上述原假設(shè)一般寫成形式:H?:μ≤A?。示例2:原假設(shè)也可為:“總體(1.1)的統(tǒng)計模型是正態(tài)分布”。對此原假設(shè),均值和標準差可以不確定。示例3:原假設(shè)也可為:“總體的統(tǒng)計模型是對稱分布”。對此原假設(shè),分布形式可以不確定。注1:顯然,原假設(shè)可以由所有可能的概率分布的子集組成。注2:本定義應(yīng)與備擇假設(shè)(1.42)和統(tǒng)計檢驗(1.48)聯(lián)合考慮。注3:在實際中,從不說“證明”了原假設(shè),而是說在給定條件下,不足以拒絕原假設(shè)。進行假設(shè)檢驗的原始目的很可能是對于當前問題,希望檢驗結(jié)果支持一個指定的備擇假設(shè)。注4:不拒絕原假設(shè)并不是“證明”了它真的成立,而只是說沒有足夠的證據(jù)拒絕它。此時原假設(shè)也許真的成立(或近似成立);也許由于樣本的原因(如樣本量不夠大)而未能檢出其中的差異。注5:有時,最初的興趣是原假設(shè),但對原假設(shè)的偏離也有意義。適當?shù)臉颖玖亢蜋z驗指定的偏離或備擇假設(shè)的功效能用來構(gòu)造出合適評估原假設(shè)的檢驗方法。注6:與“不能拒絕原假設(shè)”相反,“接受備擇假設(shè)”是一個肯定的結(jié)果,它支持所感興趣的猜測。與諸如“這次不能拒注7:原假設(shè)是構(gòu)造相應(yīng)的檢驗統(tǒng)計量(1.52)的出發(fā)點,該統(tǒng)計量用于對原假設(shè)的評估。注8:原假設(shè)通常記為H?。注9:若有可能,原假設(shè)與備擇假設(shè)的命題應(yīng)互斥,參見1.48的注2和1.49的示例。備擇假設(shè)alternativehypothesisH?,H?對從所有不屬于原假設(shè)(1.41)的可能容許概率分布(2.11)中選擇的一個集合或其子集的陳述。示例1:在1.41示例1中,對應(yīng)原假設(shè)的備擇假設(shè)是“均值(2.35)大于該給定值”,表示為:H?:μ>M。示例2:在1.41示例2中,對應(yīng)原假設(shè)的備擇假設(shè)是“總體的統(tǒng)計模型不是正態(tài)分布(2.50)”。示例3:在1.41示例3中,對應(yīng)原假設(shè)的備擇假設(shè)為“總體的統(tǒng)計模型是由非對稱分布構(gòu)成的”。對這個備擇假設(shè),非對稱分布的具體形式?jīng)]有確定。注1:在需要特別指定備擇假設(shè)時,一般將原假設(shè)的補作為備擇假設(shè)。注2:備擇假設(shè)既可以記為H?,也可以記為H?,不存在優(yōu)先選用的問題。注3:備擇假設(shè)是與原假設(shè)相對立的一種陳述。對應(yīng)的檢驗統(tǒng)計量(1.52)用于在原假設(shè)和備擇假設(shè)之間進行抉擇。注4:不能脫離原假設(shè)和統(tǒng)計檢驗(1.48)來考慮備擇假設(shè)。注5:與“不能拒絕原假設(shè)”相比,“接受備擇假設(shè)在一個分布族(2.8)中,指定了某單個分布(2.11)的假設(shè)(1.40)。注1:簡單假設(shè)是選定的子集只由單個概率分布(2.11)組成的原假設(shè)(1.41)或備擇假設(shè)(1.42)。注2:根據(jù)從均值(2.35)未知、標準差σ已知的正態(tài)分布(2.50)總體中獨立抽取的隨機樣本(1.6),對均值μ的簡單假設(shè)是均值等于一個給定值x。,通常表示為如下形式:H?:μ=r?。注3:簡單假設(shè)完全確定了概率分布(2.11)。在一個分布族(2.8)中,指定了多于一個分布(2.11)的假設(shè)(1.40)。示例1:1.41和1.42給出的原假設(shè)(1.41)和備擇假設(shè)(1.42)都是復(fù)合假設(shè)的例。示例2:1.48示例3中情形3的原假設(shè)是簡單假設(shè),示例4中的原假設(shè)也是簡單假設(shè),1.48中其他假設(shè)都是復(fù)合假設(shè)。注:復(fù)合假設(shè)是所選定的子集由一個以上的概率分布組成原假設(shè)或備擇假設(shè)。α注:如果原假設(shè)是一個簡單假設(shè)(1.43),則當原假設(shè)為真時,拒絕它的概率是一個確定的值。第一類錯誤TypeIerror拒絕事實上為真的原假設(shè)(1.41)的錯誤。注1:事實上,第一類錯誤是一種不正確的判定。因此,要使這種不正確判定的概率(2.5)盡可能小。要使犯第一類錯誤的概率為0,只有永不拒絕原假設(shè),而不管證據(jù)如何。當然,這是不可能的。注2:在有些情況下(如檢驗二項參數(shù)p),由于結(jié)果的離散性,有可能達不到預(yù)先設(shè)定的顯著性水平,如0.05。第二類錯誤TypeⅡerror沒有拒絕事實上不為真的原假設(shè)(1.41)的錯誤。注:事實上,第二類錯誤是一種不正確的判定。因此,要使這種不正確判定的概率(2.5)盡可能小。第二類錯誤通常是在當樣本量不夠大,因而不足以揭示與原假設(shè)的偏離時發(fā)生。判斷是否拒絕原假設(shè)(1.41),支持備擇假設(shè)(1.42)的方法。示例1:作為例子,如果一個實際的連續(xù)隨機變量(2.29)在一心到+騖之間取值,懷疑它的真實的概率分布不是正態(tài)分布(2.50),則可以按以下步驟構(gòu)造假設(shè):——考慮所有在一到+m上取值的連續(xù)概率分布(2.23);—-猜測真實的概率分布不是正態(tài)分布;—備擇假設(shè)為:概率分布不是正態(tài)分布。示例2:如果隨機變量服從正態(tài)分布,標準差(2.37)已知,懷疑它的期望值μ與給定的值μ?有偏離,則可以按示例3中的情形3的步驟構(gòu)造假設(shè)。示例3:本例考慮統(tǒng)計檢驗的三種可能情形。情形1:猜測過程均值大于目標均值A(chǔ)?。這個猜測導(dǎo)致如下假設(shè):情形2:猜測過程均值小于目標均值x?。這個猜測導(dǎo)致如下假設(shè):情形3:猜測過程均值與目標均值不相容,但方向不確定。這個猜測導(dǎo)致如下假設(shè):在這三個情形中,假設(shè)的形成是從考慮備擇假設(shè)和基本條件偏離的猜測導(dǎo)出的,示例4:本例考慮兩批產(chǎn)品(1和2)中的不合格品的比例p?和p?,范圍皆介于0和1之間。懷疑兩批產(chǎn)品是不同的,因此猜測兩個批不合格品率也不同。這個猜測導(dǎo)致如下假設(shè):注1:統(tǒng)計檢驗是一個方法,利用樣本觀測值來判斷真實的概率分布是屬于原假設(shè)還是備擇假設(shè),在一定條件下,這注2:在實施統(tǒng)計檢驗之前,首先要在可利用信息基礎(chǔ)上確定概率分布的可能集合。其次,在研究猜測的基礎(chǔ)上,確認由可能為真的概率分布組成備擇假設(shè)。最后,用備擇假設(shè)的補來組成原假設(shè)。在很多情形下,概率分布的可能集(即原假設(shè)和備擇假設(shè))可以用相關(guān)參數(shù)值的集合來確定。注3:因為判斷是在樣本觀測的基礎(chǔ)上作的,這可能導(dǎo)致第一類錯誤(1.46),即原假設(shè)為真時拒絕原假設(shè);或第二類注4:上面示例3中情形1和情形2是單側(cè)檢驗的例子。情形3是雙側(cè)檢驗的例子。在這三個情形中,檢驗是單側(cè)持備擇假設(shè)判定的檢驗統(tǒng)計量的區(qū)域,即臨界域。但它可能并不能像情形1,2,3那樣,對參數(shù)空間的直接、簡單的描述。注5:在應(yīng)用統(tǒng)計檢驗時,必須注意應(yīng)該遵循的基本假定。在偏離基本假定情形下,仍能做出穩(wěn)定推斷的統(tǒng)計檢驗稱為是穩(wěn)健的。例如對均值的單個樣本t檢驗就是在非正態(tài)分布下非常穩(wěn)健的一個例子。而對方差齊性的在原假設(shè)(1.41)為真時,獲得檢驗統(tǒng)計量(1.52)的觀測值及更不支持原假設(shè)的其他值的概率示例1:考慮1.9中引入的數(shù)值例,為解釋方便,假定這些觀測值來自一個標稱均值為12.5的過程,并且從先前經(jīng)驗看,相關(guān)的工程技術(shù)人員認為過程是一致低于該標稱值。為研究,收集了一個樣本量為10的隨機樣本,樣本數(shù)據(jù)由1.9給出。合適的假設(shè)是:樣本均值是9.7,正如所猜測的那樣,比標稱值小。但是它是否距12.5足夠遠,從而可以支持猜測?本例中,檢驗統(tǒng)計量(1.52)值為一1.9764,相應(yīng)的p值為0.040。這表明如果過程的真實的均值等于12.5時,則在100次觀測中,最多有4次機會使檢驗統(tǒng)計量的值等于或低于一1.9764。如果預(yù)先設(shè)定的顯著性水平是0.05,則據(jù)此拒絕原假設(shè),支持備擇假設(shè)。若將對此問題稍作不同的考慮。想象所關(guān)心的是過程偏離了目標值12.5,但偏大還是偏小不定,這導(dǎo)致以下假設(shè):假定從隨機樣本中收集到相同數(shù)據(jù),檢驗統(tǒng)計量也一樣,其值為一1.9764。對這個備擇假設(shè),感興趣的問題是“看到這樣一個極端值或更極端的概率是多少?”在這種情形下,有兩個相關(guān)的區(qū)域:一個是檢驗統(tǒng)計量值小于或等于-1.9764;另一個是統(tǒng)計量值大于或等于1.9764。t檢驗統(tǒng)計量落在這兩個區(qū)域中的一個的概率是0.08(單側(cè)值的兩倍)。也就是說原假設(shè)為真時,檢驗統(tǒng)計量在100次觀測中大約會有8次機會取此極端值或更極端的值。因此在0.05注1:若p值為0.029,則在原假設(shè)為真的條件下,每100次觀測中,僅有不到3次的機會使檢驗統(tǒng)計量的值取此極為0.05,而p值0.029小于0.05,因而拒絕原假設(shè)。注2:有人將p值稱為顯著概率,但它不能與顯著性水平(1.45)混淆,后者在應(yīng)用中是指定的常值。檢驗功效powerofatest1減去犯第二類錯誤(1.47)的概率(2.5)。注2:在大多數(shù)有實際意義的情形中,增加樣本量會增加檢驗的功效。換句話說,當備擇假設(shè)(1.42)為真時,拒絕原假設(shè)的概率隨著樣本量的增加而增加,從而減小了犯第注3:在檢驗情形下,人們愿意樣本量變得足夠大,這樣即使距原假設(shè)有小的偏離也應(yīng)該能被檢測到,從而拒絕原假設(shè)。換句話說,當樣本量變得足夠大時,對每個對應(yīng)原假設(shè)的備擇假設(shè),檢驗功效都接近于1。這樣的檢驗稱的。對相合性和有效性有更正式的數(shù)學(xué)描述,這超出了GB/T3358本部分的范圍(可參考各種統(tǒng)計百科全書或數(shù)理統(tǒng)計教材)。功效曲線powercurve表示作為分布族(2.8)中總體參數(shù)(2.9)函數(shù)的檢驗功效(1.50)值的曲線。注:功效函數(shù)等于1減去操作特性值。檢驗統(tǒng)計量teststatistic用于統(tǒng)計檢驗(1.48)的統(tǒng)計量(1.8)。注:檢驗統(tǒng)計量用來評判考察的概率分布(2.11)是否與原假設(shè)(1.41)或備擇假設(shè)(1.42)相符。圖形描述性統(tǒng)計量graphicaldescriptivestatistics圖形形式的描述性統(tǒng)計量(1.5)。注:描述性統(tǒng)計量的目的一般是將大量的數(shù)據(jù)減少到容易控制的數(shù)量或者用一種直觀的方式來展現(xiàn)數(shù)據(jù)。圖形概數(shù)值描述性統(tǒng)計量numericaldescriptivestatistics數(shù)值形式的描述性統(tǒng)計量(1.5)?!炊ㄐ蕴匦?gt;來自樣本(1.3)的某些個體的集合。<有序特性〉有序尺度下一個或者多個相鄰類別的集合?!炊刻匦浴祵崝?shù)軸上的區(qū)間。組限classlimits;classboundaries<定量特征>定義組(1.55.3)的上、下邊界值。注:本定義指定量特性組的邊界。組中值mid-pointofclass〈定量特征>上、下組限(1.56)的平均數(shù)(1.15)。組距classwidth〈定量特征>組(1.55.3)的上限減去其下限。給定類(組)(1.55)中,特定事件發(fā)生的次數(shù)或觀測值(1.4)的個數(shù)。GB/T3358.1—2009/ISO3534-1:2006類(組)(1.55)與其中特定事件發(fā)生的次數(shù)或觀測值(1.4)的個數(shù)之間的經(jīng)驗關(guān)系。頻數(shù)分布(1.60)的一種圖形表示,由一些相鄰的長方形組成,每個長方形的底寬等于組距(1.58),注:要注意從不等組距的組中產(chǎn)生數(shù)據(jù)的情況。由一組寬度相同、高度與頻數(shù)(1.59)成比例的長方形組成的,表示名義特性頻數(shù)分布(1.60)的注1:有時為了美觀,將長方形畫成三維圖形,但這并不會增加任何信息,所以不推薦使用。條形圖中的長方形并不需要相鄰。注2:由于現(xiàn)成軟件大都沒有按此處的定義繪制,現(xiàn)在直方圖和條形圖的差別越來越模糊。給定界限以下所有類(組)的頻數(shù)(1.59)之和。注:本定義只適用于對應(yīng)于組限(1.56)的給定界限值。用事件或者觀測值(1.4)發(fā)生的總數(shù)目除頻數(shù)(1.59)。用事件或者觀測值(1.4)發(fā)生的總數(shù)目除累積頻數(shù)(1.63)。Ω示例1:考慮某消費者所購買電池的壽命(失效時間)。若電池一開始使用時就失效,其壽命為0;若電池開始能工本例在本章中經(jīng)常會用到,在2.68還將對它作進一步的討論。示例2:一個盒子里裝有標著1,2,3,4,5,6,7,8,9,10的10個電阻。如果從盒中不放回地隨機抽出兩個電阻,則樣本空間包含以下45個結(jié)果:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,9),(1,10),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,9),(2,10),(3,4),(3,5),(3,6),(3,7),(3,8),(3,9),(3,10),(4,5),(4,6),(4,7),(4,8),(4,9),(4,10),(5,6),(5,7),(5,8),(5,9),(5,10),(6,7),(6,8),(6,9),(6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10)。事件(1,2)認為與事件(2,1)是相同的,此時不考慮抽取電阻的次序。如果考慮抽樣次序,則認為事件(1,2)與事件(2,1)是不同的,在這種情況下,樣本空間中共有90個結(jié)果。示例3:在上例中,如果允許放回抽樣,那么事件(1,1),(2,2),(3,3),(4,4),(5,5),(6,6),(7,7),(8,8),(9,9),(10,10)也應(yīng)包含在樣本空間中。若不考慮抽樣次序,樣本空間中有55個結(jié)果;若考慮抽樣次序,則樣本空間中有100個結(jié)果。注1:結(jié)果可以由一個實際的實驗或一個完全假設(shè)的實驗得到,這些結(jié)果可以明確列出,例如可由正整數(shù){1,2,3,…}組成的可列集,也可能是整個實數(shù)軸。注2:樣本空間是概率空間(2.68),的第一要素。A樣本空間(2.1)的子集。示例1:續(xù)2.1中的示例1。以下都為事件的例子:{0},(0,2),{5,7},(7,+彆),分別表示電池一開始就失效,開始能工作但壽命不到2h,壽命恰好為5h或7h,壽命等于或大于7h。{0}和{5,7}都只包含單個數(shù)值的集合;(0,2)為實數(shù)軸上的開區(qū)間;(7,+騖)為實數(shù)軸上左閉右開的一個無限區(qū)間。示例2:續(xù)2.1中的示例2??紤]不放回抽樣且不考慮抽樣次序情形。定義事件A為{樣本中至少包含電阻1或者電阻2},該事件有17個結(jié)果(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,9),(1,10),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,9)和(2,10)。定義事件B為{樣本中不包含電阻8,9或10},該事件有21個結(jié)果(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(2,3),(2,4),(2,5),(2,6),(2,7),(3,4),(3,5),(3,6),(3,7),(4,5),(4,6),(4,7),(5,6),(5,示例3:續(xù)示例2。事件A和B的交集(即至少包含電阻1或2中的一個,又不包含電阻8,9和10中的任一個),有11個結(jié)果:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(2,3),(2,4),(2,5),(2,6),(2,7)。事件A和B的并集(即或至少包含電阻1或2中的一個,或不包含電阻8,9和10中的任一個),有27個結(jié)果:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,9),(1,10),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,9),(2,10),(3,4),(3,5),(3,6),(3,7),(4,5),(4,6),(4,7),(5,6),(5,7),(6,7)。順便指出,事件A和B的并集中的結(jié)果數(shù)為事件A中的結(jié)果數(shù)加上事件B中的結(jié)果數(shù)減去事件A和B交集中的結(jié)果數(shù),即17+21—11=27。注:對確定的事件和一個實驗結(jié)果,如果該實驗結(jié)果屬于這個事件,則稱該事件發(fā)生。實際感興趣的事件屬于事件σ代數(shù)(2.69),后者是概率空間(2.68)的第二個要素。在賭博游戲(如撲克、輪盤賭等)中,所感興趣的事件包含的結(jié)果數(shù)決定了它發(fā)生機會的大小。對立事件complementaryeventA?示例1:續(xù)2.1中的示例1。事件{0}的對立事件為(0,+驚),即事件“電池一開始就失效”的對立事件是“電池開始能工作”。事件(0,3)為電池一開始就失效或壽命小于3h,它的對立事件是(3,+騖),即電池壽命達到或超過3h。示例2:續(xù)2.2中的示例2。通過考慮B的對立事件:{至少包含電阻8,9,10中的一個},容易得到事件B中的實驗結(jié)果數(shù)目。B的對立事件有7+8+9=24個結(jié)果,即(1,8),(2,8),(3,8),(4,8),(5,8),(6,8),(7,8),(1,9),(2,9),(3,9),(4,9),(5,9),(6,9),(7,9),(8,9),(1,10),(2,10),(3,10),(4,10),(5,10),(6,10),(7,10),(8,10),(9,10)。由于整個樣本空間有45個結(jié)果,因此事件B有45—24=21個結(jié)果:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(2,3),(2,4),(2,5),(2,6),(2,7),(3,4),(3,5),(3,6),(3,7),(4,5),(4,6),(4,7),(5,6),(5,7),(6,7)。注1:對立事件是相應(yīng)事件在樣本空間的補集。注2:對立事件也是一個事件。注3:對給定的事件A,A的對立事件通常記為A‘。注4:有時計算對立事件的概率比計算事件本身的概率要容易。例如,事件:“從一個包含有1000個產(chǎn)品,不合格品率為1%的總體中隨機抽取10個產(chǎn)品,至少有一個不合格品”包含非常多可能的結(jié)果,此時計算其對立事件“沒有不合格品”的概率要容易得多。其交的概率(2.5)等于各自事件概率乘積的兩個事件(2.2)。示例1:考慮投擲一紅一白兩枚正六面體的均勻骰子,可能結(jié)果有36個,每個發(fā)生的概率都是1/36。記D:為兩枚骰子點數(shù)之和為i的事件,W為白色骰子點數(shù)為1的事件,則事件W與事件D,相互獨立,但事件W與事件D.(i=2,3,4,5,6)不獨立。不獨立的事件也稱為相依事件。示例2:在應(yīng)用中,獨立事件和相依事件容易判斷。在事件或者環(huán)境相依的情形下,知道與其相關(guān)事件的結(jié)果是相手術(shù)失敗引起的死亡是相依的。作為對照,死亡似乎和病人出生在星期幾是獨立的。在可靠性問題中,有相同失效原因的元件的失效時間是不獨立的。例如,反應(yīng)堆中的燃料棒發(fā)生爆裂概率很低,但在有一根燃料棒爆裂的條件下,其毗鄰的燃料棒隨著發(fā)生爆裂的概率就會大為增加。示例3:續(xù)2.2中的示例2。假定抽樣是一個簡單隨機抽樣,每個結(jié)果發(fā)生的概率都為1/45,則P(A)=17/45=0.3778,P(B)=21/45=0.4667,P(A∩B)=11/45=0.2444。由于P(A)P(B)=(17/45)×(21/45)=0.1763,并不等于0.2444,所以事件A和事件B不獨立。注:本定義是關(guān)于兩個事件的,可以將其推廣到多個事件情形。對事件A和B,獨立的條件為P(A∩B)=P(A)P(B)。三個事件A,B,C相互獨立的條件是:更一般地,多于兩個事件的事件組A?,A?,…,A,稱為相互獨立,如果對于事件組任意給定子集中事件交的概率等于子集中每個事件概率的乘積。此條件要求對事件組中的任一子集均成立。可以構(gòu)造這樣的例子:每對事賦予事件(2.2)閉區(qū)間[0,1]中的一個實數(shù)。示例:續(xù)2.1中示例2。事件的概率可通過計算構(gòu)成該事件的所有結(jié)果的概率求得。如果45個結(jié)果具有相同的概率,每個結(jié)果發(fā)生的概率為1/45,那么某個事件發(fā)生的概率等于該事件所包含的結(jié)果數(shù)除以45。注1:概率測度(2.70)對所有事件都賦予了[0,1]上的實數(shù)值,而事件的概率只是概率測度賦予該事件的特定值。注2:本定義中的概率指的是某個特定事件的概率。概率可能與事件在長期試驗中發(fā)生的頻率有關(guān),或是對一個事件A可能發(fā)生的相信程度。通常事件A發(fā)生的概率用P(A)表示,當需要考慮概率空間(2.68)時,用O(A)表示事件A發(fā)生的概率。P(A|B)事件A與事件B交的概率(2.5)除以事件B的概率。示例1:續(xù)2.1中示例1??紤]事件(2.2)A={電池壽命至少為3h》,即(3,+α),設(shè)事件B=《電池一開始就有電》,即(0,+鈮),給定事件B下事件A發(fā)生的條件概率P(A|B)是指一開始就有電的電池中,其壽命至少為3h的概率。示例2:續(xù)2.1中示例2。設(shè)抽樣是不放回的,在第一次抽取到電阻2的條件下,第二次再抽到電阻2的概率等于0。如果所有電阻被抽取的概率相等,第一次未抽到電阻2的條件下,第二次抽到電阻2的概率為0.1111。示例3:續(xù)2.1中示例2。如果抽取是放回的,且所有電阻在每次抽取中被抽中的概率相等,則電阻2在第一次不論被抽到與否,第二次抽到它的概率都是0.1。因此第一次抽出的結(jié)果和第二次抽出的結(jié)果是獨立事件。注1:事件B發(fā)生的概率要求大于0。注2:“給定B下A的”可更完整地表述為“給定事件B發(fā)生條件下的事件A”。注3:如果給定事件B發(fā)生條件下事件A的條件概率等于事件A發(fā)生的概率,則事件A與事件B相互獨立。也就是說,事件B發(fā)生與否不影響事件A的發(fā)生。[隨機變量X的]分布函數(shù)distributionfunction[ofarandomvariableX]隨機變量(2.10)X的取值落在(-o,x)上這一事件(2.2)發(fā)生的概率(2.5)。注1:隨機變量X的分布函數(shù)是x的函數(shù),它給出了隨機變量X值小于或等于z這一事件的概率,即F(z)=P(X≤x)。GB/T3358.1—2009/ISO3534-1:2006注2:分布函數(shù)F(x)關(guān)于x是非降的。注3:對多維分布(2.17),分布函數(shù)是指多維分布中每個隨機變量小于或等于指定值的概率(2.5)。多維分布函數(shù)定義為:F(x?,x?,…,x.)=P(x?≤x?,x?≤x?,…,x.≤x.)注4:分布和隨機變量是離散型的或是連續(xù)型,取決于其分布函數(shù)的分類。通常,分布函數(shù)分為離散型分布函數(shù)(2.22)和連續(xù)型分布函數(shù)(2.23),但也有其他的可能。對2.1中電池的示例,電池壽命的一個可能的分布函數(shù)為:由該分布函數(shù)可知:電池壽命是非負的,有10%的可能性它一開始就不能工作,若開始能正常工作,則壽命服從均值為1h的指數(shù)分布(2.58)。注5:通常分布函數(shù)縮寫為cdf(cumulativedistributionfunction,即累積分布函數(shù))。分布族familyofdistributions概率分布(2.11)的集合。注1:概率分布族一般用概率分布的參數(shù)(2.9)來標記。注2:通常,概率分布的均值(2.35)和/或方差(2.36)常用作分布族的標記,當參數(shù)多于兩個時,它們也可能為分布族的部分標記。在其他情形,均值和方差不一定是分布族的顯式參數(shù),而是參數(shù)的函數(shù)。分布族(2.8)的標記。注1:參數(shù)可以是一維的也可以是多維的。注2:某些參數(shù)可作為位置參數(shù),特別當該參數(shù)對應(yīng)分布族的均值時;某些參數(shù)可作為刻度參數(shù),特別當該參數(shù)恰好是與分布的標準差(2.37)成正比。既不是位置參數(shù)又不是刻度參數(shù)的參數(shù)通常視為形狀參數(shù)。示例:續(xù)2.1中電池的示例。樣本空間由如下事件生成:《電池開始使用時即失效,或開始能正常,但在x小時失效}。這些事件難以用數(shù)學(xué)進行處理。因此自然地把每個事件與電池壽命(一個實數(shù))相聯(lián)系。當隨機變量取值為零時,表示電池開始使用時即失效。當隨機變量取值大于零時,可以理解為電池一開始正常工作,然后突然在一個特定值時失效。應(yīng)用隨機變量使我們可以回答諸如“電池壽命超過它保證使用時間(比如6h)的概率是多少?”這樣的問題。注1:通常隨機變量有個維數(shù)k。若k=1,稱為一維隨機變量:當k>1時,稱為多維隨機變量。在實際中,當維數(shù)為指定的k時,稱該隨機變量為k維的。注2:一維隨機變量是定義在樣本空間(2.1)上的實值函數(shù)。注3:取值于二元有序?qū)崝?shù)的隨機變量稱為二維隨機變量。注4:k元有序?qū)崝?shù)的例:(x,,x,,…,x?)。一個k元有序?qū)崝?shù)就是一個k維向量(行向量或列向量)。注5:k維隨機變量的第j個分量對應(yīng)于k元有序?qū)崝?shù)中第j個分量的隨機變量。2.11概率分布probabilitydistrib分布distribution由隨機變量(2.10)導(dǎo)出的概率測度(2.70)。示例:續(xù)2.1中的示例。電池的壽命分布完整地描述在所有指定時間失效的概率,我們不可能確切知道給定電池的失效時間,也不知道(事先去檢驗)電池開始工作后是否能繼續(xù)工作。概率分布完全刻畫了一個不確定結(jié)果的概率性質(zhì)。在2.7的注4中,給出了概率分布的一種表示方法,即分布函數(shù)。注1:對一個分布,有許多等價的數(shù)學(xué)表達,包括分布函數(shù)(2.7),概率密度函數(shù)(2.26)(如果存在的話),及特征函數(shù)。盡管難易程度不同,這些表達都使我們能確定隨機變量在給定區(qū)域內(nèi)取值的概率。注2:隨機變量是樣本空間子集到實直線上的一個函數(shù),比如,一個隨機變量能取任意實數(shù)這一事件的概率為1,就是一例。對電池的例子而言,P(X≥0)=1。在許多情況下,用隨機變量和它測度更容易處理。但是概率測度保證了從一種表達方式到另一種表達方式時的一致性。注3:只有一個分量的隨機變量稱為一維或單變量(一元)概率分布。如果一個隨機變量有兩個分量,我們稱為二維或二變量(二元)概率分布,如果這個隨機變量有不少于兩個分量,則隨機變量(2.10)的函數(shù)關(guān)于概率測度(2.70)在樣本空間(2.1)上的積分。注1:隨機變量X的函數(shù)g(X)的期望用E[g(X)]表示,可以按下式計算:其中F(x)是對應(yīng)的分布函數(shù)。實線映射的一個算子或函數(shù)。本身(例如事件用文字敘述給出)。第二個積分描述了在R*上的計算,這種表達更常用。注4:在許多實際應(yīng)用場合中,上面積分中的被積函數(shù)都有具體形式。例如在r階矩(2.34)的注中g(shù)(x)=x′,均值(2.35)的注中g(shù)(x)=x以及方差(2.36)的注中g(shù)(x)=[x-E(X)]?。注5:本定義并不局限于前面的示例和注中所提到的一維積分。高維情況見2.43。注6:對離散隨機變量(2.28),注1中的第二個積分用求和號代替。見2.35的示例。示例1:考慮二項分布(2.46),表2給出參數(shù)n=6,p=0.3的二項分布的概率函數(shù)。分布的某些p分位數(shù)為:x?.zs=1I?.γs=3x?.go=3Z?,gs=4x?.gg=5Z?.9gg=5由于二項分布是離散的,它的p分位數(shù)都是整數(shù)。表2二項分布的示例-P(X=x)P(X≤x)P(X>x)00.1176490.117649088235110.3025260.4201750.57982520.3241350.7443100.25569030.1852200.9295300.07047040.0595350.9890650.01093550.01020609992710.00072960.0007290.000000示例2:考慮標準正態(tài)分布(2.51),表3是對分布函數(shù)的某些數(shù)值及對應(yīng)的p分位數(shù):表3標準正態(tài)分布示例p由于X的分布是連續(xù)的,第二列的標題也可以寫為:滿足P(X<x)=p的x。注1:對于連續(xù)分布(2.23),如果p是0.5,則0.5分位數(shù)即為中位數(shù)(2.14)。對p等于0.25,相應(yīng)的0.25分位數(shù)被稱為下四分位數(shù)。對于連續(xù)分布,分布的25%低于0.25分位數(shù)而分布的75%高于0.25分位數(shù)。當p等于0.75,相應(yīng)的0.75分位數(shù)被稱為上四分位數(shù)。注2:通常,分布的100p%小于p分位數(shù);分布的100(1-p)%大于p分位數(shù)。但很難確定離散分布的中位數(shù),因為會有很多值滿足定義。注3:如果F是連續(xù)且嚴格遞增的,則p分位數(shù)是F(x)=p注4:如果分布函數(shù)在某一個區(qū)間上都等于常數(shù)p,則這個區(qū)間上的所有值都是這個分布的p分位數(shù)。注5:p分位數(shù)的定義僅適用于一維分布(2.16)。0.5分位數(shù)(2.13)。示例:在2.7注4的示例中,通過解x的方程0.1+0.9[1-exp(-x)]=0.5,可得中位數(shù)為0.5878。注1:中位數(shù)是在實際中最常用的p分位數(shù)(2.13)之一。連續(xù)一維分布(2.16)的中位數(shù)滿足:總體(1.1)的一半大注2:中位數(shù)的定義僅適用于一維分布(2.16)。0.25分位數(shù)(2.13)或0.75分位數(shù)。示例:續(xù)2.14中的示例??梢宰C明0.25分位數(shù)是0.1823以及0.75分位數(shù)是1.2809。注1:0.25分位數(shù)稱為下四分位數(shù);而0.75分位數(shù)稱為上四分位數(shù)。注2:分位數(shù)的定義僅適用于一維分布(2.16)。2.16一維分布univariatedistribution單個隨機變量(2.10)的概率分布(2.11)。注:一維[概率]分布是關(guān)于單個隨機變量的,故也稱為單變量分布。二項分布(2.46),泊松分布(2.47),正態(tài)分布(2.50),伽瑪分布(2.56),t分布(2.53),威布爾分布(2.63)以及貝塔分布(2.59)都是一維分布的例子。多維概率分布multivariateprobabilitydistribution變量的概率分布,可以明確地稱為一維分布或單變量分布(2.16)。由于單變量場合有明顯的優(yōu)勢,因此除非另有說明通常都假設(shè)是單變量的。注2:多維概率分布有時也稱為聯(lián)合分布。注3:多項分布(2.45),二維正態(tài)分布(2.65),多維正態(tài)分布(2.64)是GB/T3358中提到的部分多維概率分布的例子。k維隨機變量(2.10)所有分量的非空真子集的概率分布(2.11)。示例1:三個隨機變量X,Y和Z的概率分布,有三個二維邊緣分布即(X,Y)的分布,(X,Z)的分布和(Y,Z)的分布,有三個單變量的邊緣分布即X的分布,Y的分布和Z的分布。示例2:若(X,Y)的分布為二維正態(tài)分布(2.65),則分別考慮X和Y的分布都是邊緣分布,且都是正態(tài)分布示例3:對多項分布(2.45),如果k>3,(X?,X?)的分布是邊緣分布。分別考慮x?,x?,…,x,中每個變量的分布也注1:在一個k維聯(lián)合分布中,包含k?(k?<k)個隨機變量的概率分布是邊緣分布。注2:給定一個用概率密度函數(shù)(2.26)表示的多維連續(xù)概率分布(2.23),其邊緣概率分布的概率密度函數(shù),可以通過概率密度函數(shù)對不屬于邊緣分布中的變量積分得到。注3:給定一個用概率函數(shù)(2.24)表示的多維離散概率分布(2.22),其邊緣概率分布的概率函數(shù),可以通過概率函數(shù)對不屬于邊緣分布中的變量求和得到。2.19條件概率分布conditionalprobabilitydistribution條件分布conditionaldistribution將樣本空間(2.1)限制在其一個非空子集上,且將受限制的樣本空間的概率調(diào)整為1的概率分布示例1:在2.7注4的示例中,給定電池一開始能工作的電池條件壽命分布為指數(shù)分布(2.58)。示例2:對二維正態(tài)分布(2.65),給定X=x,Y的條件概率分布反映了已知X的信息對Y的影響。示例3:考慮隨機變量X,它刻畫了每年某地由于毀滅性的颶風(fēng)事件造成的保險損失的分布。因為在給定一年中某地可能沒有任何颶風(fēng)發(fā)生,所以這個分布在0損失點可能存在一個非0的概率,因此感興趣的研究是在某地颶風(fēng)發(fā)生的年份中損失的條件分布。注1:在具有兩個隨機變量X和Y的分布中,既有X的條件分布也有Y的條件分布。X在Y=y下的條件分布稱注2:邊緣概率分布(2.18)可認為是無條件分布。注3:上面的示例1說明了存在下面的情形:一個單變量的條件分布經(jīng)過設(shè)定條件后被調(diào)整為另一個單變量的分分布仍為具有相同參數(shù)的指數(shù)分布。注4:條件分布可用于某些特定結(jié)果是不可能時的離散分布。例如,在考慮腫瘤病人總體中,泊松分布可以作為在病人數(shù)嚴格為正(沒有腫瘤的人不作為病人)的條件下,腫瘤病人數(shù)的模型。注5:條件分布出現(xiàn)在把樣本空間限制在一個特定子集的情況下。對服從二維正態(tài)分布(2.65)的(X,Y),可能會對發(fā)生的事件必須落在單位正方形[0,1]×[0,1]上的(X,Y)的條件分布感興趣,也可能只是對給定X2+給定隨機變量X=x的條件下,隨機變量(2.10)Y的條件概率分布(2.19)的期望(2.12)值的集合。注:此處,回歸曲線是在(X,Y)服從一個二維分布(見2.17的注1)的框架下定義的,因此不同于通?;貧w分析中所討論的Y與自變量的某個確定集合的關(guān)系。給定隨機變量X?=x,和X?=x?的條件下,隨機變量(2.10)Y的條件概率分布(2.19)的期望注:如同2.20,此處的回歸曲面是在(Y,X?,X?)服從一個多維分布(2.17)的框架下定義的。因此也與回歸曲線一樣,此處的回歸曲面也是與回歸分析和響應(yīng)面方法中所用概念不同。樣本空間(2.1)是有限的或可列無限多的概率分布(2.11)。示例:離散分布的示例有多項分布(2.45)、二項分布(2.46)、泊松分布(2.47)、超幾何分布(2.48)和負二項分布注1:“離散”意味著樣本空間是有限的,或是無限可列的,其中序列是顯式的,如缺陷數(shù)為:0,1,2,…。例如,二項分布對應(yīng)于一個有限的樣本空間{0,1,2,…,n};而泊松分布對應(yīng)于一個可列無限的樣本空間{0,1,2,…}。注2:驗收抽樣中的計數(shù)數(shù)據(jù)涉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論