版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析2 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析2.1 數(shù)據(jù)統(tǒng)計(jì)與分析的根本范疇2.2 常用的統(tǒng)計(jì)目的2.3 環(huán)境樣本特征推斷2.4 參數(shù)估計(jì)2.5 顯著性檢驗(yàn)2.6 直線相關(guān)與直線回歸2.7 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的計(jì)算機(jī)處置2.8 可疑值的取舍2.1 數(shù)據(jù)統(tǒng)計(jì)與分析的根本范疇2.1.1 總體與樣本 統(tǒng)計(jì)學(xué)中,把性質(zhì)一樣的研討對(duì)象的一切觀測(cè)結(jié)果的集合稱為總體(population)??傮w又分為無(wú)限總體和有限總體。 在實(shí)踐任務(wù)中,經(jīng)常是從被研討的總體中隨機(jī)抽取部分觀測(cè)結(jié)果進(jìn)展研討。每個(gè)部分觀測(cè)結(jié)果的集合稱為樣本。 從總體中隨機(jī)抽取樣本用以推斷總體的方法稱為抽樣研討。 2.1.2 參數(shù)與統(tǒng)計(jì)量統(tǒng)計(jì)目
2、的 統(tǒng)計(jì)學(xué)中,把根據(jù)規(guī)定的函數(shù)關(guān)系計(jì)算出的描畫總體或樣本特征的函數(shù)值稱為統(tǒng)計(jì)目的index。參數(shù) 由總體資料計(jì)算出的統(tǒng)計(jì)目的稱為參數(shù)parameter,用于描畫總體特征。統(tǒng)計(jì)量 由樣本資料計(jì)算出的統(tǒng)計(jì)目的稱為統(tǒng)計(jì)量statistic,用于描畫樣本特征 。2.1.3 變異與誤差變異variation 變異指觀測(cè)結(jié)果之間實(shí)踐存在的差別。誤差error 誤差指觀測(cè)結(jié)果與真實(shí)值之差及統(tǒng)計(jì)量與參數(shù)之差。過(guò)失誤差gross error過(guò)失誤差可以防止;系統(tǒng)誤差systematic error系統(tǒng)誤差可以減少;隨機(jī)誤差random error隨機(jī)誤差無(wú)法消除。 2.2 常用的統(tǒng)計(jì)目的2.2.1 平均數(shù)2.2
3、.2 變異數(shù)2.2.3 相對(duì)數(shù)2.2.1 平均數(shù)定義 平均數(shù)average是表示觀測(cè)值的平均程度的統(tǒng)計(jì)目的,常用的有算術(shù)平均數(shù)、幾何均數(shù)及中位數(shù)。 2.2.1.1 算術(shù)均數(shù)定義 算術(shù)均數(shù)arithmetic mean,簡(jiǎn)稱均數(shù),常用、希臘字母表示,表示樣本均數(shù),表示總體均數(shù)。均數(shù)適用于正態(tài)分布資料統(tǒng)計(jì)。計(jì)算方法直接計(jì)算法頻數(shù)-加權(quán)計(jì)算法直接計(jì)算法 當(dāng)察看值的個(gè)數(shù)不多時(shí),將一切察看值x1,x2,x3,xn直接相加,其和除以察看值的個(gè)數(shù)n,即為均數(shù)。 計(jì)算公式:式中, 算術(shù)平均數(shù) x1,xn 各察看值 求和符號(hào) x 察看值總和 n 察看值的個(gè)數(shù) 頻數(shù)-加權(quán)計(jì)算法 對(duì)一個(gè)隨機(jī)事件作反復(fù)察看,其中某察
4、看值出現(xiàn)的次數(shù)稱頻數(shù); 各察看值對(duì)應(yīng)的頻數(shù)稱為頻數(shù)分布;顯示各察看值對(duì)應(yīng)的頻數(shù)的表格稱為頻數(shù)分布表,簡(jiǎn)稱頻數(shù)表。 頻數(shù)-加權(quán)計(jì)算法計(jì)算步驟 計(jì)算全距找出察看值中的最大值、最小值,并計(jì)算全距range,全距最大值最小值。 定組段數(shù)普通取815個(gè)為宜,多取10個(gè),組段數(shù)太多,計(jì)算較繁,組段數(shù)過(guò)少那么誤差較大。 定組距class interval相鄰兩組段下限值之差為組距class interval。各組段的組距可以相等,也可以不等。假設(shè)擬定為相等組距,那么組距全距/組段數(shù),為便于察看值歸組,組距常取整數(shù)。 定組段class range即定各組數(shù)據(jù)的上下限,俗稱“封口。通常,某組段的最小值為下限(l
5、ower limit),相鄰較大組段的下限即本組段的上限(upper limit)。第一組段應(yīng)包括最小值,最末組段應(yīng)包括最大值。 計(jì)數(shù)fi劃分組段后,將原始數(shù)據(jù)以適當(dāng)方式劃記計(jì)數(shù)常用“正字法歸組。得頻數(shù)分布表。 計(jì)算組中值(Class mid-value)xi組中值 計(jì)算均數(shù) 將各組段的頻數(shù)與組中值之積相加求和,再除以總頻數(shù)即得均數(shù)。 2.2.1.2 幾何均數(shù)定義幾何均數(shù)geometric mean,G,也叫倍數(shù)均數(shù),當(dāng)察看值相差較大甚至成倍數(shù)關(guān)系時(shí),如用算術(shù)均數(shù)表示其平均程度時(shí)受少數(shù)特大或特小值影響較大,那么用幾何均數(shù)來(lái)表示其平均程度。計(jì)算步驟先對(duì)察看值取數(shù)值,計(jì)算對(duì)數(shù)值的均數(shù)后,再查反對(duì)數(shù)
6、,即得幾何均數(shù)。計(jì)算方法直接計(jì)算法頻數(shù)表法直接計(jì)算法頻數(shù)表法 當(dāng)察看值較多時(shí),可先編頻數(shù)表,再按頻數(shù)表計(jì)算幾何均數(shù)。2.2.1.3 中位數(shù)定義中位數(shù)median,M,Md指全部察看值按大小順序陳列,居于中間位置的數(shù)值。 偏態(tài)分布資料,一端或兩端有不確定數(shù)值分布的資料,分布情況不清的資料,適宜用中位數(shù)統(tǒng)計(jì)。計(jì)算方法直接計(jì)算法頻數(shù)表法 直接計(jì)算法樣本含量n較少時(shí),先將察看值按大小順序陳列,再進(jìn)展計(jì)算。 頻數(shù)表法中位數(shù)是一個(gè)特定的百分位數(shù),在全部察看值中有一半比它大,一半比它小。當(dāng)例數(shù)較多時(shí),先將察看值編制頻數(shù)表,再按公式計(jì)算。 2.2.2 變異數(shù)定義 變異數(shù)是表示察看值變異程度的統(tǒng)計(jì)目的,常用目的
7、有極差、方差、規(guī)范差和變異系數(shù)等。 2.2.2.1 極差定義 亦稱全距rangc,R,即一組察看值中最大值與最小值之差。RXmaxXmin特點(diǎn) 全距反映了變異的范圍,極差大,變異度大;極差小,變異度小。缺陷 用極差表示變異程度的大小簡(jiǎn)單明了,但它僅思索了察看值的最大值和最小值,而沒有思索其他數(shù)值,因此是不夠全面的。 2.2.2.2 方差要抑制全距的缺陷,必需全面思索到每個(gè)察看值。首先思索用每一個(gè)察看值與均數(shù)之差的和即離均差總和x 來(lái)描畫。 再思索用離均差平方和x 2來(lái)描畫。最終思索用離均差平方和的均數(shù)即方差S2來(lái)描畫。 2.2.2.3 規(guī)范差定義為了堅(jiān)持與原察看值及其均數(shù)的單位一致,將方差開平
8、方,即得規(guī)范差,以S表示。特點(diǎn) 規(guī)范差直接表示察看值分布的離散程度,間接反映樣本的代表性。 在察看單位數(shù)一樣,均數(shù)相近條件下,規(guī)范差較大,闡明察看值的變異程度較大,即察看值圍繞均數(shù)的分布較離散,因此樣本的代表性較差;反之,規(guī)范差較小,闡明察看值的變異程度較小,察看值圍繞均數(shù)的分布較密集,樣本的代表性好。2.2.2.4 變異系數(shù)定義對(duì)均數(shù)相差較大或性質(zhì)不同的資料,不能直接用規(guī)范差比較變異程度的大小,要用變異系數(shù)作比較。特點(diǎn)與規(guī)范差一樣,變異系數(shù)愈大,闡明察看值的變異程度愈大,變異系數(shù)愈小,闡明變異程度愈小。 2.2.3 相對(duì)數(shù)定義 環(huán)境研討直接觀測(cè)到的數(shù)據(jù)稱為絕對(duì)數(shù),絕對(duì)數(shù)雖然能反映調(diào)查中所發(fā)現(xiàn)
9、的某種景象的絕對(duì)程度,但作深化分析時(shí),僅看絕對(duì)數(shù)是不夠的,必需思索運(yùn)用相對(duì)數(shù)relative number,即兩個(gè)有聯(lián)絡(luò)的目的之比。 常用相對(duì)數(shù)有率、比等。 2.2.3.1 率定義率rate是某一景象發(fā)生的頻度頻繁程度或強(qiáng)度,通常指在一定條件下某種景象實(shí)踐發(fā)生的次數(shù)與能夠發(fā)生該景象的總次數(shù)之比。 率= 率的比例基數(shù)可用100、1000、10,000、100,000等分別稱為百分率,千分率,萬(wàn)分率,或十萬(wàn)分率。環(huán)境監(jiān)測(cè)常用的率有:檢出率 回收率 最高濃度出現(xiàn)率 殘留率 超標(biāo)率 2.2.3.2 構(gòu)成比定義構(gòu)成比constitution ratio是事物內(nèi)部某種構(gòu)成部分對(duì)總體之比。闡明部分在總體中所
10、占的比重,是一種用來(lái)表示事物內(nèi)部各構(gòu)成情況的目的。 構(gòu)成比 2.2.3.3 相對(duì)比定義相對(duì)比relative ratio指兩個(gè)有關(guān)聯(lián)的同類目的的比。以倍數(shù)或百分?jǐn)?shù)()來(lái)表示,其計(jì)算式:相對(duì)比=常用的相對(duì)比有倍數(shù)、指數(shù)、系數(shù)等。 倍數(shù) 在大氣監(jiān)測(cè)中,經(jīng)常用測(cè)定值與國(guó)家衛(wèi)生規(guī)范值的比較來(lái)評(píng)價(jià)車間、工廠或大氣的污染程度。 指數(shù)index 環(huán)境維護(hù)研討中,指數(shù)是環(huán)境污染物的實(shí)測(cè)濃度對(duì)該污染物在環(huán)境中的允許濃度的比值,是環(huán)境質(zhì)量評(píng)價(jià)的常用手段。 I I :環(huán)境質(zhì)量指數(shù)C:污染物實(shí)測(cè)平均濃度S:污染物允許規(guī)范。系數(shù) 如排毒系數(shù),環(huán)境污染物的排放濃度對(duì)該污染物的排放規(guī)范的比值,用于表示各種污染物和污染源對(duì)環(huán)
11、境的毒害的潛在才干。2.3 環(huán)境樣本特征推斷環(huán)境樣本特征 主要指環(huán)境樣本的分布方式和環(huán)境樣本的正常值范圍等,可以利用獲得的統(tǒng)計(jì)量進(jìn)展統(tǒng)計(jì)處置,完成上述推斷任務(wù)。2.3.1 樣本特征推斷的實(shí)際根底正態(tài)分布 定義正態(tài)分布normal distribution又稱高斯分布(Gaussian Distribution),是以均數(shù)為中心的對(duì)稱鐘型分布。正態(tài)曲線是一條頂峰位于中央,兩側(cè)完全對(duì)稱并逐漸下降但永遠(yuǎn)不與橫軸相交的鐘形曲線 正態(tài)曲線由和兩個(gè)參數(shù)決議,為總體均數(shù),為總體規(guī)范差。決議正態(tài)曲線的位置,決議正態(tài)曲線外形 。2.3.2 樣本特征推斷樣本分布方式的斷定確定正常值范圍確定樣本所代表總體的實(shí)際頻數(shù)
12、分布2.4 參數(shù)估計(jì)定義探知研討對(duì)象的總體特征是環(huán)境研討的主要目的,由于總體龐大的緣由,直接計(jì)算參數(shù)是極其困難的,因此,往往用樣本統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù),這個(gè)過(guò)程稱為參數(shù)估計(jì)estimation of parameter。 本節(jié)主要討論總體均數(shù)估計(jì)的根本問(wèn)題。 總體均數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì)。點(diǎn)估計(jì)point estimation是根據(jù)一個(gè)樣本求出總體參數(shù)的詳細(xì)數(shù)值,常用根據(jù)極大似然法原理導(dǎo)出的公式計(jì)算極大似然估計(jì)量。 由于存在變異和抽樣的隨機(jī)性,用不同的樣本推斷總體時(shí),能夠得到不同的參數(shù)估計(jì)值。因此更穩(wěn)妥的方法是采用區(qū)間估計(jì)。 2.4.1 總體均數(shù)區(qū)間估計(jì)的實(shí)際根底t分布 2.4.1.1 抽
13、樣誤差定義 對(duì)樣本的統(tǒng)計(jì)結(jié)果與總體的“真實(shí)之間必然存在差別,這種由于抽樣而引起的樣本與總體之間的差別稱為抽樣誤差。規(guī)范誤差樣本均數(shù)的規(guī)范差稱為規(guī)范誤差, 。計(jì)算公式為:在實(shí)踐任務(wù)中,總體規(guī)范差 常屬未知,只能用樣本規(guī)范差S替代 作為最正確的無(wú)偏估計(jì),于是規(guī)范誤的計(jì)算公式變?yōu)椋?.4.1.2 描畫樣本均數(shù)的分布t分布 從一個(gè)均數(shù)為,規(guī)范差為的正態(tài)總體中,隨機(jī)抽取含量為n的樣本,可計(jì)算樣本均數(shù) ,樣本規(guī)范誤 ,那么將樣本均數(shù)與總體均數(shù)的離差以樣本規(guī)范誤 為單位,得正態(tài)離差 t ,假設(shè)干樣本的t值就構(gòu)成統(tǒng)計(jì)上著名的t分布。實(shí)踐任務(wù)中總體規(guī)范差 往往是不知道的,只能用樣本規(guī)范差S來(lái)替代,于是得t 2.
14、4.2 總體均數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)interval estimation 按預(yù)先給定的概率,由一個(gè)樣本均數(shù)及其規(guī)范誤求出總體均數(shù)數(shù)值范圍的過(guò)程。“預(yù)先給定的概率 也稱為可信度、可信程度、可信系數(shù),符號(hào)為1-,常取0.99或0.95。“總體均數(shù)數(shù)值范圍 也稱為可信區(qū)間,符號(hào)為CI。其含義是:由一個(gè)樣本均數(shù)及其規(guī)范誤求出的被估計(jì)參數(shù)值有0.99或0.95的能夠在此數(shù)值范圍內(nèi),或由假設(shè)干個(gè)樣本均數(shù)及其規(guī)范誤求出的假設(shè)干個(gè)被估計(jì)參數(shù)值中,有99或95的個(gè)數(shù)能夠在此數(shù)值范圍內(nèi)。 2.4.3 總體率的區(qū)間估計(jì)可仿照總體均數(shù)的可信區(qū)間估計(jì)的方法來(lái)估計(jì)總體率的所在范圍,即求總體率的可信區(qū)間,我們引見兩種方法。
15、 正態(tài)近似法 當(dāng)n足夠大,且p和1-p不接近零,有np和n1-p均大于5時(shí),總體率的可信區(qū)間為: 式中u為可信度1-時(shí)的規(guī)范正態(tài)離差,由u界值得知,如99可信區(qū)間時(shí),0.01,u2.58,95可信區(qū)間時(shí),0.05,u1.96。 查表法 當(dāng)n1000,pl時(shí),可查附表3百分率的可信限表,得到總體率的可信區(qū)間。 2.5 顯著性檢驗(yàn)兩均數(shù)差別顯著性檢驗(yàn)樣本均數(shù)與總體均數(shù)的差別顯著性檢驗(yàn)兩樣本均數(shù)的差別顯著性檢驗(yàn)兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差別顯著性檢驗(yàn)配對(duì)資料的差別顯著性檢驗(yàn)兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)u 檢驗(yàn)方差不齊的兩樣本均數(shù)差別的顯著性檢驗(yàn)t檢驗(yàn)2.5.1 顯著性檢驗(yàn)的含義與普通步驟含義在回答樣本與總
16、體能否有本質(zhì)差別或差別能否有顯著時(shí),必需思索:樣本與總體差別無(wú)顯著性和樣本與總體差別有顯著性2種情況。終究屬于那種情況,需經(jīng)過(guò)差別顯著性檢驗(yàn)來(lái)回答。顯著性檢驗(yàn)的步驟建立“檢驗(yàn)假設(shè)確定檢驗(yàn)水準(zhǔn)選擇檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量確定概率做出推斷結(jié)論2.5.2 兩均數(shù)差別顯著性檢驗(yàn) 2.5.2.1 兩均數(shù)差別顯著性檢驗(yàn)的根本思緒 t檢驗(yàn)是檢驗(yàn)兩均數(shù)間差別顯著性的根本方法。按式2.20計(jì)算統(tǒng)計(jì)量t值后,與根據(jù)相應(yīng)自在度查附表2t值表所得的t界值進(jìn)展比較,判別均數(shù)間差別的顯著性。 tt0.05v P0.05 差別無(wú)顯著性假設(shè)t0.05vtt0.01v 那么 0.05P0.01 即 差別有顯著性 tt0.01v P
17、0.01 差別有極顯著性 當(dāng)v自在度50時(shí),可直接采用正態(tài)分布臨界值1.96或2.58來(lái)判別P大于還是小于0.05或0.01。 2.5.2.2 樣本均數(shù)與總體均數(shù)的差別顯著性檢驗(yàn) 【例 2.17】解題步驟:建立檢驗(yàn)假設(shè)計(jì)算t值確定p值結(jié)果判別2.5.2.3 兩樣本均數(shù)的差別顯著性檢驗(yàn) 兩樣本均數(shù)比較是最常見的統(tǒng)計(jì)比較研討,又稱成組比較,其目的是推斷兩樣本分別代表的總體均數(shù)1與2能否相等。采用下面的公式來(lái)檢驗(yàn)兩均數(shù)的差別能否有顯著性。 2.5.2.4 兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差別顯著性檢驗(yàn) 檢驗(yàn)兩個(gè)幾何均數(shù)的差別能否有顯著性,所采用的方法,依然是t檢驗(yàn)法,只是將一切數(shù)值全部轉(zhuǎn)換為對(duì)數(shù)值進(jìn)展計(jì)算。
18、2.5.2.5 配對(duì)資料的差別顯著性檢驗(yàn) 在實(shí)驗(yàn)研討中,常采用配對(duì)比較的方法。配對(duì)研討的目的是比較兩種處置方法或?qū)嶒?yàn)前后的結(jié)果有無(wú)差別。配對(duì)資料的實(shí)驗(yàn)設(shè)計(jì)有兩種:同體配對(duì),實(shí)驗(yàn)對(duì)象本身對(duì)比;非同體配對(duì)。2.5.2.6 兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)u 檢驗(yàn) 當(dāng)兩個(gè)樣本的察看單位數(shù)較多時(shí)每組n50,資料分布根本近似于正態(tài)分布,可以用u檢驗(yàn)。計(jì)算出u值后,直接根據(jù)表2.13 u檢驗(yàn)的檢驗(yàn)水準(zhǔn)表作出結(jié)果判別。 2.5.2.7 方差不齊的兩樣本均數(shù)差別的顯著性檢驗(yàn)t檢驗(yàn) 運(yùn)用t檢驗(yàn)的前提條件是兩個(gè)總體的方差相等, ?,F(xiàn)實(shí)上,即使兩個(gè)總體方差相等,樣本方差也會(huì)由于抽樣而出現(xiàn)動(dòng)搖,因此必需對(duì)兩組樣本進(jìn)展方差齊
19、性檢驗(yàn)。假設(shè)方差齊性檢驗(yàn)顯示方差不齊時(shí),那么不能直接采用t檢驗(yàn),需求用校正t檢驗(yàn)法t檢驗(yàn)。 方差齊性檢驗(yàn) 計(jì)算F統(tǒng)計(jì)量 查附表4方差齊性F界值表 做出兩總體方差能否相等的推斷 t檢驗(yàn) 計(jì)算均數(shù)規(guī)范誤平方 計(jì)算兩樣本均數(shù)差數(shù)的規(guī)范誤 計(jì)算t值 求t顯著性界限的近似值 2.5.3多均數(shù)差別的顯著性檢驗(yàn)F檢驗(yàn) 在環(huán)境研討任務(wù)中,經(jīng)常有兩個(gè)以上的均數(shù)需求同時(shí)進(jìn)展比較,這時(shí),假設(shè)運(yùn)用上述的t檢驗(yàn)法,那么必需對(duì)每?jī)蓚€(gè)均數(shù)進(jìn)展t檢驗(yàn),比較繁瑣。而運(yùn)用F檢驗(yàn)法即方差分析法可使顯著性檢驗(yàn)大為簡(jiǎn)化。 方差分析又稱變異數(shù)分析,其根本思想是把全部察看值之間總變異,按設(shè)計(jì)和需求分為二個(gè)或多個(gè)組成部分進(jìn)展分析。 總變異的
20、分類在單要素的完全隨機(jī)設(shè)計(jì)的實(shí)驗(yàn)資料中,總變異可分為組內(nèi)變異和組間變異。在配伍組設(shè)計(jì)的資料中,總變異可分為處置組間變異、配伍組間變異及誤差三部分。在22析因設(shè)計(jì)資料中,總變異可分為兩個(gè)要素的兩個(gè)組間變異、兩要素交互作用及誤差四部分。 2.5.3.1 單要素多個(gè)樣本均數(shù)比較 比較步驟檢驗(yàn)假設(shè)計(jì)算校正數(shù)確定P值結(jié)果判別2.5.3.2 兩要素多個(gè)樣本均數(shù)比較比較步驟列計(jì)算表計(jì)算校正數(shù)C計(jì)算離均差平方和SS計(jì)算自在度計(jì)算均方MS計(jì)算F值確定P值并判別結(jié)果2.5.3.3 多組均數(shù)間兩兩比較 資料經(jīng)F檢驗(yàn)后,各組均數(shù)間的差別為無(wú)顯著性,那么不須作進(jìn)一步的統(tǒng)計(jì)處置;假設(shè)各組均數(shù)間的差別有顯著意義,那么須作進(jìn)
21、一步的分析,以檢驗(yàn)兩兩均數(shù)間的差別哪些是有顯著性的。比較步驟檢驗(yàn)假設(shè)計(jì)算q值求處置數(shù)a根據(jù)誤差的自在度及處置數(shù)a查附表6q值表,得q的顯著界值。 確定P值與判別結(jié)果2.5.4 兩率差別的顯著性檢驗(yàn) 2.5.4.1 率的抽樣誤差 定義樣本率與總體率間的差別情況是由于抽樣呵斥的,稱為率的抽樣誤差。 公式率的抽樣誤差可用率的規(guī)范誤來(lái)表示 。2.5.4.2 大樣本率與總體率差別的顯著性檢驗(yàn)u檢驗(yàn) 通常,樣本率與總體率之間進(jìn)展比較時(shí),如樣本含量較大普通大于50,可采用u檢驗(yàn)。再根據(jù)表作判別。 2.5.4.3 兩大樣本率的差別顯著性檢驗(yàn)u檢驗(yàn) 公式檢驗(yàn)兩個(gè)樣本率的差別能否顯著時(shí),可用公式: 2.5.4.4
22、 兩大樣本率的差別顯著性檢驗(yàn)四格表 檢驗(yàn) 檢驗(yàn)范圍 檢驗(yàn)卡方檢驗(yàn)常用以檢驗(yàn)兩個(gè)率或多個(gè)率之間的差別,兩組或多組資料內(nèi)部構(gòu)成之間的差別,實(shí)際分布數(shù)列與實(shí)踐察看分布數(shù)列之間的差別,兩個(gè)察看數(shù)列之間的差別能否有顯著性等。公式檢驗(yàn)的根本公式:X2 式中 A 實(shí)踐數(shù) T 實(shí)際數(shù) 檢驗(yàn)步驟:1檢驗(yàn)假設(shè)2計(jì)算 值3確定概率,做出判別 四格表公用公式法四格表公用公式是從 根本公式推導(dǎo)出來(lái)的,故兩者計(jì)算的結(jié)果是一樣的。 四格表的方式: 四格表公用公式:2.5.4.5 n40且有一個(gè)實(shí)際數(shù)小于5的兩率差別顯著性檢驗(yàn)四格表校正 值檢驗(yàn) 公式=2.5.4.6 n40且有一個(gè)實(shí)際數(shù)小于5的兩率差別顯著性檢驗(yàn)準(zhǔn)確檢驗(yàn)法
23、四格表中有實(shí)踐值為零時(shí),計(jì)算概率的公式為: P 式中! 階乘,規(guī)定0!1。 四格表中無(wú)實(shí)踐值為零時(shí) 【例 2.31】2.5.5 多率的差別顯著性檢驗(yàn)行列的 檢驗(yàn) 定義當(dāng)資料的組數(shù)或處置方法超越兩組即行數(shù)或列數(shù)超越兩組時(shí),通稱為行列表或稱RC表,其檢驗(yàn)方法,可用 的根本公式法,也可采用行列表公用公式法。公式行列表公用公式為: 2.5.6 配對(duì)計(jì)數(shù)資料的差別顯著性檢驗(yàn) 檢驗(yàn) 經(jīng)過(guò)配對(duì)的方法進(jìn)展實(shí)驗(yàn),如每一對(duì)實(shí)驗(yàn)對(duì)象分別給予不同的處置,或同一實(shí)驗(yàn)對(duì)象,先后給予不同的處置,既可獲得計(jì)量資料,也可獲得計(jì)數(shù)資料,這類計(jì)數(shù)資料的率的差別顯著性檢驗(yàn),采用配對(duì)的檢驗(yàn)法。 公式計(jì)算公式:=當(dāng) b + c 40時(shí),
24、那么改用校正公式:= 2.6 直線相關(guān)與直線回歸 相關(guān)correlation 相關(guān)指兩事物或兩變量之間呈現(xiàn)某種相依變動(dòng)關(guān)系。相關(guān)有直線相關(guān)、曲線相關(guān)、多元線性相關(guān),直線相關(guān)是最簡(jiǎn)單的相關(guān)。回歸regression 回歸原指樣本統(tǒng)計(jì)量向總體參數(shù)靠攏或回歸的景象,現(xiàn)指利用方程描畫變量變化的數(shù)量關(guān)系?;貧w有直線回歸、曲線擬合、多元線性回歸,直線回歸是最簡(jiǎn)單的回歸。 2.6.1 直線相關(guān)定義 假設(shè)相關(guān)散點(diǎn)圖顯示一個(gè)變量X由小到大變化,另一個(gè)變量Y亦相應(yīng)地呈直線由小到大或由大到小變化,那么這兩個(gè)變量間有直線關(guān)系;散點(diǎn)圖顯示的相關(guān)性質(zhì)和親密程度,由直線相關(guān)系數(shù)描畫。這種直線關(guān)系以及分析這種直線關(guān)系的實(shí)際和
25、方法,統(tǒng)稱直線相關(guān)linear correlation。 2.6.1.1 相關(guān)散點(diǎn)圖與相關(guān)系數(shù) 相關(guān)以橫軸(X)代表汽車輛數(shù),以縱軸(Y)代表NO2濃度,繪制相關(guān)散點(diǎn)圖,見以下圖。從圖中可見,隨著汽車輛數(shù)的添加,大氣中NO2的濃度也隨之增高,呈現(xiàn)從左下到右上的變化趨勢(shì)。我們稱這種“從左下到右上的變化趨勢(shì)為正相關(guān)。 現(xiàn)實(shí)上,除正相關(guān)外,相關(guān)散點(diǎn)圖的散點(diǎn)分布還有多種情形,見以下圖。 相關(guān)系數(shù) 定量地表示變量間的線性相關(guān)程度及相關(guān)方向。 相關(guān)系數(shù)沒有單位,其值在1至+1之間。 正相關(guān): 散點(diǎn)的Y值隨X值添加而上升,0r1,如圖2.7(a);假設(shè)散點(diǎn)完全在一條直線上,那么為完全正相關(guān),r1,如上圖 (
26、b)。 負(fù)相關(guān): 散點(diǎn)的Y值隨X值添加而減少,lr0,如上圖 (c);假設(shè)散點(diǎn)完全在一條直線上,那么為完全負(fù)相關(guān),r1,如上圖 (d)。零相關(guān): 散點(diǎn)的X與Y的數(shù)值增減無(wú)一定規(guī)律,或Y值的變化不受X變化的影響, r0,如上圖 (e、f、g)。無(wú)線性相關(guān):散點(diǎn)的X與Y的數(shù)值增減服從非直線規(guī)律,r0,如上圖 (h)。 2.6.1.2 相關(guān)系數(shù)的計(jì)算計(jì)算公式r = = 2.6.2 相關(guān)系數(shù)的顯著性檢驗(yàn) 定義 由于抽樣誤差的影響,從相關(guān)系數(shù)為零的總體中隨機(jī)抽取的樣本的相關(guān)系數(shù)不一定為零,檢驗(yàn)樣本相關(guān)系數(shù)不等于零的能夠性,即稱為相關(guān)系數(shù)的差別顯著性檢驗(yàn)。常用方法為 檢驗(yàn)。 2.6.2.1 計(jì)算法計(jì)算步驟
27、1檢驗(yàn)假設(shè) X與Y沒有相關(guān)關(guān)系,即總體相關(guān)系數(shù) 0,樣本相關(guān)系數(shù)r是從 中抽取,r與 的差別是由于抽樣誤差而引起。 2計(jì)算 3確定P值與判別結(jié)果2.6.2.2 查表法椐自在度nn2查附表8 (相關(guān)系數(shù)r界值表),據(jù)界值與計(jì)算相關(guān)系數(shù)的比較結(jié)果斷定。 2.6.3 直線回歸2.6.3.1 直線回歸概述環(huán)境研討中,常需由一個(gè)變量自變量,X推算另一個(gè)變量因變量,Y的估計(jì)值,稱為回歸分析。直線回歸linear regression分析的義務(wù)是,按照各點(diǎn)到直線的間隔的平方和最小的要求,確定一條最接近于各點(diǎn)的直線回歸直線,并建立這條直線的方程回歸方程,regression equation,以描畫兩變量的變
28、化規(guī)律或進(jìn)展變量推算。2.6.3.2 回歸方程的建立【例2.37】解題步驟:計(jì)算根本數(shù)據(jù): 、 、 、 、 。相關(guān)系數(shù)r及其顯著性檢驗(yàn)。按2.51式計(jì)算回歸系數(shù) 。 按2.53式計(jì)算截距a 。按2.54建立回歸方程 a+bX 。顯示回歸線。 2.6.3.3 回歸方程的顯著性檢驗(yàn)1單樣本回歸系數(shù)的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)也用t檢驗(yàn)。檢驗(yàn)假設(shè)計(jì)算規(guī)范估計(jì)誤差計(jì)算 、 值確定P值及結(jié)果判別2兩樣本回歸系數(shù)的差別顯著性檢驗(yàn) 假設(shè)經(jīng)過(guò)兩個(gè)樣本,獲得兩個(gè)回歸系數(shù)b1和b2,回歸系數(shù)的規(guī)范誤分別為Sb1和Sb2,需對(duì)兩樣本之間的差別進(jìn)展顯著性檢驗(yàn)。檢驗(yàn)假設(shè)按公式計(jì)算t值確定P值及結(jié)果判別2.7 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的計(jì)算機(jī)處置2.7.1 均數(shù)2.7.1.1 算術(shù)均數(shù)直接計(jì)算法頻數(shù)加權(quán)計(jì)算法2.7.1.2 幾何均數(shù)直接計(jì)算法頻數(shù)表計(jì)算法2.7.2 中位數(shù)直接計(jì)算法頻數(shù)表計(jì)算法2.7.3 變異數(shù)規(guī)范差變異系數(shù)2.7.4 樣本特征推斷2.7.4.1 樣本分布方式的斷定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年杭州市富陽(yáng)區(qū)春建鄉(xiāng)人民政府網(wǎng)格隊(duì)伍招聘1人備考考試試題附答案解析
- 2026廣東廣州市天河區(qū)華南農(nóng)業(yè)大學(xué)附屬小學(xué)英語(yǔ)教師招聘1人參考考試試題附答案解析
- 2026年楚雄州武定縣公安局特巡警大隊(duì)招聘輔警(2人)參考考試題庫(kù)附答案解析
- 2026重慶大學(xué)城樹人小學(xué)人才儲(chǔ)備參考考試題庫(kù)附答案解析
- 2026內(nèi)蒙古心腦血管醫(yī)院招聘1人參考考試題庫(kù)附答案解析
- 2026安徽靈璧農(nóng)商銀行實(shí)習(xí)活動(dòng)招聘19人參考考試試題附答案解析
- 2025年濟(jì)寧理工單招題庫(kù)及答案
- 生產(chǎn)現(xiàn)場(chǎng)集中配料管理制度
- 木門廠生產(chǎn)廠長(zhǎng)管理制度
- 消防安全標(biāo)識(shí)手抄報(bào)
- 2026中國(guó)國(guó)際航空招聘面試題及答案
- (2025年)工會(huì)考試附有答案
- 2026年國(guó)家電投集團(tuán)貴州金元股份有限公司招聘?jìng)淇碱}庫(kù)完整參考答案詳解
- 復(fù)工復(fù)產(chǎn)安全知識(shí)試題及答案
- 中燃魯西經(jīng)管集團(tuán)招聘筆試題庫(kù)2026
- 資產(chǎn)接收協(xié)議書模板
- 數(shù)據(jù)中心合作運(yùn)營(yíng)方案
- 印鐵涂料基礎(chǔ)知識(shí)
- 工資欠款還款協(xié)議書
- 石籠網(wǎng)廠施工技術(shù)交底
- 新建粉煤灰填埋場(chǎng)施工方案
評(píng)論
0/150
提交評(píng)論