統(tǒng)計數(shù)據(jù)的搜集和整理_第1頁
統(tǒng)計數(shù)據(jù)的搜集和整理_第2頁
統(tǒng)計數(shù)據(jù)的搜集和整理_第3頁
統(tǒng)計數(shù)據(jù)的搜集和整理_第4頁
統(tǒng)計數(shù)據(jù)的搜集和整理_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計數(shù)據(jù)的搜集和整理第1頁,共42頁,2023年,2月20日,星期二2.1.1統(tǒng)計數(shù)據(jù)的不齊性1.數(shù)據(jù)的變異性生物科學研究中的數(shù)據(jù)千差萬別,各不相同,即存在著變異。變異是生物試驗數(shù)據(jù)的共同特點和基本特征。2.1總體和樣本數(shù)據(jù)(data):在生物科學試驗或調(diào)查過程中,對研究對象的某些特征或性狀進行觀察記載得到的數(shù)字資料。第2頁,共42頁,2023年,2月20日,星期二2.1.1統(tǒng)計數(shù)據(jù)的不齊性2.數(shù)據(jù)的趨中性:

同一種生物品種同一性狀的觀測數(shù)據(jù)在其平均數(shù)兩側(cè)集中分布,距平均數(shù)越近,分布的越多,距平均數(shù)越遠,分布的越少。第3頁,共42頁,2023年,2月20日,星期二2.1.2變數(shù)和變量1.變數(shù)(variable)凡是其觀測值具有變異的特征或性狀稱為變數(shù)。例如,研究對象是農(nóng)作物,株高、粒重、穗長、穗粒數(shù)、產(chǎn)量都是變數(shù)表示方法:用X表示,多個變數(shù)則用X、Y、Z、…等表示第4頁,共42頁,2023年,2月20日,星期二2.變量(Variate)變數(shù)的每一個具體值或觀測值。表示方法:對n個個體就其X變數(shù)進行觀測,可得到n個變量或觀測值,可用X1、X2、…Xn表示。Xi

:X變數(shù)的某個變量或觀測值,i代表1到n中的任何一個。第5頁,共42頁,2023年,2月20日,星期二2.1.3、總體和樣本1.總體(Population)整個研究對象中每一個個體某一變數(shù)觀測值的集合??傮w中的每一個數(shù)據(jù)或個體叫總體單位總體中的個體數(shù)叫總體單位數(shù)(總體容量),用N表示總體根據(jù)總體單位數(shù)目可分為無限總體和有限總體第6頁,共42頁,2023年,2月20日,星期二2.1.3總體和樣本2.樣本(sample)總體中的一部分,樣本中包含的個體數(shù)目稱為樣本含量(samplesize)第7頁,共42頁,2023年,2月20日,星期二2.1.4抽樣1.抽樣(sampling)從總體中獲得樣本的過程。目的:是希望通過對樣本的研究,推斷其總體方法:隨機抽樣(randomsampling),例如,抽簽、拈鬮等

第8頁,共42頁,2023年,2月20日,星期二2.1.4抽樣從一有限總體中抽樣,可分為:放回式抽樣(samplingwithreplacement):從總體中抽出一個樣本,記下它的特征后,放回總體中,再做第二次抽樣。非放回式抽樣(samplingwithoutreplacement):從總體中抽出個體后,不再放回。第9頁,共42頁,2023年,2月20日,星期二2.2數(shù)據(jù)類型及頻數(shù)(率)分布2.2.1連續(xù)型數(shù)據(jù)和離散性數(shù)據(jù)2.2.2頻數(shù)(率)表和圖的編繪第10頁,共42頁,2023年,2月20日,星期二2.2.1連續(xù)型數(shù)據(jù)和離散性數(shù)據(jù)1.連續(xù)型數(shù)據(jù)(continuousdata)與某種標準做比較所得到的數(shù)據(jù),又稱為度量數(shù)據(jù)(measurementdata)變量的方法(measurementdata)第11頁,共42頁,2023年,2月20日,星期二2.離散型數(shù)據(jù)(discretedata):由記錄不同類別個體的數(shù)目所得到的數(shù)據(jù),又稱為計數(shù)數(shù)據(jù)(countdata)屬性的方法(methodofattribute)第12頁,共42頁,2023年,2月20日,星期二2.2.2頻數(shù)(率)表和圖的編繪在判斷數(shù)據(jù)的類型后,就要進一步研究數(shù)據(jù)的變化規(guī)律。描述數(shù)據(jù)變化規(guī)律的最簡單方法是將這些數(shù)據(jù)列成頻數(shù)表或繪成頻數(shù)圖,根據(jù)頻數(shù)分布進行研究。第13頁,共42頁,2023年,2月20日,星期二1.單項式分組單項式分組:適用于變異范圍不大的離散型數(shù)據(jù)和質(zhì)量性狀的分組。單項式分組是一個單獨的數(shù)值分組只需要計算頻數(shù),編制頻數(shù)分布表組成各組的數(shù)值就是該組的組值第14頁,共42頁,2023年,2月20日,星期二表:100株豫麥9號主莖結(jié)實小穗數(shù)頻數(shù)分布主莖結(jié)實小穗數(shù)頻數(shù)頻率(%)164417991819191932322021212112122233合計100100第15頁,共42頁,2023年,2月20日,星期二表某玉米雜交組合F2代兩對性狀的分離性狀次數(shù)相對次數(shù)(%)黃色非甜85056.16黃色甜粒28218.61白色非甜28718.94白色甜粒966.34合計1515100.00第16頁,共42頁,2023年,2月20日,星期二2.組限式分組組限式分組:將連續(xù)型數(shù)據(jù)或變異范圍較大的離散型數(shù)據(jù),按照一定的數(shù)值距離,進行分組的方法(1)計算全距全距(極差),用R表示。等于資料中的最大值于最小值的差第17頁,共42頁,2023年,2月20日,星期二例1表1.2某小麥雜交組合F2代100株的株高8788111105917370929894999198110989083979288869410299891049494929687949286102887590908084918294991029196949485888083816995809792961099180809410280869190838491879576909177103898885959210492958386818691898396867592第18頁,共42頁,2023年,2月20日,星期二(2)確定組數(shù)和組距1).確定組數(shù):分組的公式:組數(shù)=1+3.3lgn

(n:樣本單位數(shù))組數(shù)的范圍:6~30之間,一般應(yīng)在15組左右,視樣本單位數(shù)而定組數(shù)多少也可根據(jù)樣本單位數(shù)n,查表確定。表1.3按樣本單位數(shù)確定組數(shù)的參考標準樣本單位數(shù)40~6060~100100~200200~500500以上應(yīng)分組數(shù)6~87~109~1215~30第19頁,共42頁,2023年,2月20日,星期二2)確定組距:組距=全距÷組數(shù)也可用標準差的1/2~1/3作為組距由于分組階段,σ不知道可以通過R(全距)加以計算組數(shù)=1+3.3lgn=1+3.3lg100=7.6≈8組距=全距÷組數(shù)=42÷8=5.25cm利用一個與其接近且方便的值,組距定為5cm表1.4樣本單位數(shù)不同時全距相當于總體標準差的倍數(shù)樣本單位數(shù)20305070100150R/σ3.74.14.54.85.05.3樣本單位數(shù)2003004005001000R/σ5.55.85.96.16.5第20頁,共42頁,2023年,2月20日,星期二(3)確定組限組限是各組的界限,即每組的兩個極端數(shù),一個組的最大值為組上限,最小值為組下限。組限應(yīng)從最低一組定起最低一組的組下限要小于資料中的最小值最低一組的組下限加上1/2組距后接近資料中的最小值最高一組的組上限要大于資料中的最大值最高一組的組上限減去1/2組距后接近資料中的最大值。第21頁,共42頁,2023年,2月20日,星期二(4)計算頻數(shù)計算各組頻數(shù)可用劃記法,可用“正”字劃記,便于計算。表100株小麥株高劃記計算次數(shù)10正正(7)97.5~102.4918正正正(6)92.5~97.493(9)107.5~112.494(8)102.5~107.4930正正正正正正(5)87.5~92.4918正正正(4)82.5~87.4910正正(3)77.5~82.495正(2)72.5~77.492(1)67.5~72.49頻數(shù)劃記組限(cm)第22頁,共42頁,2023年,2月20日,星期二(5)編制頻數(shù)分布表各組次數(shù)計算出后,將各組的組限、組中值、次數(shù)以及相對次數(shù)一起歸入表格,即為頻數(shù)分布表。組中值=組上限+組下限/2各組的頻率(%)=各組的頻數(shù)×100/總頻數(shù)第23頁,共42頁,2023年,2月20日,星期二表100株小麥株高頻數(shù)(率)表組限(cm)組中值(cm)頻數(shù)頻率(%)67.5~72.49702272.5~77.49755577.5~82.4980101082.5~87.4985181887.5~92.4990303092.5~97.4995181897.5~102.491001010102.5~107.4910544107.5~112.4911033合計100100第24頁,共42頁,2023年,2月20日,星期二3.三種最常用的頻數(shù)圖(1)直方圖(histogram)頻數(shù)(率)直方圖橫軸:各組的組界縱軸:頻數(shù)(率)以每一組的組界為一個邊,相應(yīng)的頻數(shù)(率)為另一個邊,作矩形第25頁,共42頁,2023年,2月20日,星期二(2)多邊形圖多邊形圖(polygon)橫軸:組中值縱軸:頻數(shù)(率)在坐標平面內(nèi),標出相應(yīng)的點,以中值為橫坐標,以該中值對應(yīng)的頻數(shù)(率)為縱坐標,用線段連接各點第26頁,共42頁,2023年,2月20日,星期二(3)累積頻數(shù)圖(cumulativefrequencygraph)根據(jù)頻數(shù)(率)表制成累積頻數(shù)表橫軸:組中值縱軸:累積頻數(shù)(率)組中值(cm)累積頻數(shù)70275780178535906595831009310597110100第27頁,共42頁,2023年,2月20日,星期二4.研究頻數(shù)(率)分布的意義根據(jù)編繪的頻數(shù)(率)圖,可以明顯地看出數(shù)據(jù)的三個重要特征。數(shù)據(jù)的集中情況直觀地看出數(shù)據(jù)的變異情況數(shù)據(jù)是集中在平均數(shù)附近,還是分散在平均數(shù)兩側(cè)圖形的形狀此外,還可以顯示一些不規(guī)則的情況。此時,需要認真研究,盡可能找出原因。第28頁,共42頁,2023年,2月20日,星期二2.3樣本的幾個特征數(shù)2.3.1平均數(shù)(mean)1.算術(shù)平均數(shù)資料中各觀測值的總和除以觀測值個數(shù)所得的商??傮w:樣本:第29頁,共42頁,2023年,2月20日,星期二2.加權(quán)算術(shù)平均數(shù)適用于已分組的數(shù)據(jù)總體:χ-組值。?-頻數(shù),N-總頻數(shù),k-組數(shù),?χ-?和χ相乘樣本:第30頁,共42頁,2023年,2月20日,星期二3.幾何平均數(shù)幾何平均數(shù)G是n個數(shù)值積的n次方根。幾何平均數(shù)主要用來計算平均增長率。(1)幾何平均數(shù)的計算此外,如果數(shù)據(jù)的變異成倍性關(guān)系,則幾何平均數(shù)更適合于說明數(shù)據(jù)的典型水平。(2)平均增長率的計算第31頁,共42頁,2023年,2月20日,星期二此外,平均數(shù)還有:調(diào)和平均數(shù)H:是各觀測值的算術(shù)平均數(shù)的倒數(shù),主要用于計算平均速度。中位數(shù):排列在中間位置的數(shù)值。眾數(shù)Mo:是資料中出現(xiàn)次數(shù)最多的數(shù)值。中位數(shù)和眾數(shù)是地位平均數(shù),不受極端觀測值的影響,計算簡便,又可用于開口的次數(shù)分布。但其數(shù)理基礎(chǔ)不夠健全,又不能利用全部數(shù)據(jù)提供的信息,所以應(yīng)用范圍比較狹窄。第32頁,共42頁,2023年,2月20日,星期二2.3.2變異數(shù)1.極差極差(全距),用R表示。等于資料中的最大值于最小值的差,n≤10時適用例如,有五個數(shù):96.4、96.6、97.2、97.4、97.8(ml)R=97.8-96.4=1.4ml極差表達變異的方法最簡單,但也最容易受遠離數(shù)群的一個數(shù)的影響。而且也很難解釋一個個別的數(shù)與平均數(shù)之間的關(guān)系。第33頁,共42頁,2023年,2月20日,星期二2.標準差(1)方差:離均差平方和的平均數(shù)方差的定義公式總體樣本,當n≥30時,可用n代替n-1(自由度,df/v)自由度的統(tǒng)計意義是樣本內(nèi)獨立而能自由變動的觀測值個數(shù)第34頁,共42頁,2023年,2月20日,星期二(2)標準差:方差的算術(shù)平方根。定義公式:總體樣本離差平方和(sumofsquareofdeviations)第35頁,共42頁,2023年,2月20日,星期二(3)標準差的計算不分組數(shù)據(jù)(非頻數(shù)資料)標準差的計算,計算公式為:總體樣本第36頁,共42頁,2023年,2月20日,星期二例:從兩個小區(qū)分別隨機抽取10株小麥,測其單穗粒數(shù),結(jié)果如下表,計算標準差。IIIxx2

xx2

266762878425625309002352929841235292144126676224842562524576245762772926676266762878425625277292562525364252576681解:將表中數(shù)據(jù)代入公式,得:s1

=1.63s2

=2.91第37頁,共42頁,2023年,2月20日,星期二分組數(shù)據(jù)標準差的計算由于分組數(shù)據(jù)(頻數(shù)資料)一般都是大樣本,所以總體和樣本標準差的計算公式完全一樣,為:其中,f=頻數(shù),x=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論