統(tǒng)計(jì)與實(shí)驗(yàn)設(shè)計(jì)基本知識(shí)課件_第1頁
統(tǒng)計(jì)與實(shí)驗(yàn)設(shè)計(jì)基本知識(shí)課件_第2頁
統(tǒng)計(jì)與實(shí)驗(yàn)設(shè)計(jì)基本知識(shí)課件_第3頁
統(tǒng)計(jì)與實(shí)驗(yàn)設(shè)計(jì)基本知識(shí)課件_第4頁
統(tǒng)計(jì)與實(shí)驗(yàn)設(shè)計(jì)基本知識(shí)課件_第5頁
已閱讀5頁,還剩215頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物統(tǒng)計(jì)與實(shí)驗(yàn)設(shè)計(jì)BiologicalStatisticsAndExperimentalDesigns

2課程內(nèi)容:生物統(tǒng)計(jì)與實(shí)驗(yàn)設(shè)計(jì)I所涵蓋內(nèi)容(學(xué)科基礎(chǔ),預(yù)備課程)統(tǒng)計(jì)學(xué)基礎(chǔ)(統(tǒng)計(jì)的眼光看問題)統(tǒng)計(jì)學(xué)基本概念統(tǒng)計(jì)推斷——參數(shù)估計(jì)、假設(shè)檢驗(yàn)統(tǒng)計(jì)分析方法及應(yīng)用(統(tǒng)計(jì)的方法解決問題)方差分析、回歸分析、試驗(yàn)設(shè)計(jì)等等統(tǒng)計(jì)與試驗(yàn)設(shè)計(jì)II所涵蓋內(nèi)容(方法合成,軟件應(yīng)用)

協(xié)方差分析

統(tǒng)計(jì)軟件分析及應(yīng)用(SPSS)課程簡(jiǎn)介3學(xué)科基礎(chǔ)課36/2學(xué)分第一章統(tǒng)計(jì)學(xué)基本知識(shí)第二章置信區(qū)間估計(jì)第三章假設(shè)檢驗(yàn)第四章方差分析第五章回歸分析第六章基本試驗(yàn)設(shè)計(jì)及其統(tǒng)計(jì)分析考核方式:課堂開卷(需使用計(jì)算器)5從什么是統(tǒng)計(jì)談起6日常生活中我們常聽到很多關(guān)于“統(tǒng)計(jì)”的詞匯

例如:國家統(tǒng)計(jì)局公布,2004年全國GDP增長9%;國家氣象局預(yù)報(bào),明天北京天氣陰,降水概率40%;2003年,北京市人平壽命77.93歲,嬰兒死亡率為5.56‰,兒童計(jì)劃免疫接種率98%.這些主要健康指標(biāo)已接近或超過中等發(fā)達(dá)國家的水平.

北京日?qǐng)?bào).京報(bào)網(wǎng),2003年11月207統(tǒng)計(jì)是人類思維的一個(gè)歸納過程

站在一個(gè)路口,看到每過去20輛小轎車時(shí),也有100輛自行車通過而且平均每10個(gè)轎車載有12個(gè)人于是,你認(rèn)為小汽車和自行車在這個(gè)路口的運(yùn)載能力為24:100這是一個(gè)典型的統(tǒng)計(jì)思維過程感受統(tǒng)計(jì)(之一)統(tǒng)計(jì)在戰(zhàn)爭(zhēng)中的例子:二戰(zhàn)時(shí)期,德國的潛艇非常猖狂,而盟國的雷達(dá)還不夠先進(jìn),給英國的運(yùn)輸船隊(duì)造成巨大的損失,英國人通過多次統(tǒng)計(jì)觀察,發(fā)現(xiàn)有德國潛艇的上方,會(huì)聚集大量的海鳥。朝鮮戰(zhàn)場(chǎng)上,美國人對(duì)志愿軍感覺很奇怪,他們的一個(gè)軍事專家,通過統(tǒng)計(jì)發(fā)現(xiàn),志愿軍的進(jìn)攻大約是七天一個(gè)周期,打七天,志愿軍肯定會(huì)跑,或者叫轉(zhuǎn)移。8感受統(tǒng)計(jì)(之三)媒體的數(shù)字化傾向

——《統(tǒng)計(jì)視線里的社會(huì)和經(jīng)濟(jì)》

文革時(shí)期媒體種類數(shù)量少得可憐不說,且在有限的報(bào)導(dǎo)中空話、大話和假話連篇,較典型和常見的情況就是不敢用數(shù)字來實(shí)打?qū)嵉卣f話。隨著改革開放特別是市場(chǎng)經(jīng)濟(jì)體制的確立,使得媒體開始“青睞”起數(shù)字來。但凡打開任何一張報(bào)紙的任何一個(gè)版面的任何一條消息,無不或多或少的“充斥”著統(tǒng)計(jì)數(shù)字。媒體的這種數(shù)字化傾向表現(xiàn)出在社會(huì)、經(jīng)濟(jì)和生活中用數(shù)字解說相應(yīng)問題的現(xiàn)實(shí)狀況。10后40回出自誰的手筆

之后,又進(jìn)一步分析前80回是否為曹雪芹所寫?這時(shí)又找了一本曹雪芹的其它著作,做了類似計(jì)算,結(jié)果證實(shí)了用詞手法完全相同,斷定為曹雪芹一人手筆。而后40回是否為高鶚寫的呢?論證結(jié)果推翻了后40回是高鶚一個(gè)人所寫。這個(gè)論證在紅學(xué)界轟動(dòng)很大,他們用多元統(tǒng)計(jì)分析方法支持了紅學(xué)界觀點(diǎn),使紅學(xué)界大為贊嘆。1214Casestudy該案例的所有內(nèi)容均來自網(wǎng)絡(luò),課程不做任何評(píng)論,僅作為思考素材/view/73813.htm15/view/283249.htm16/question/43415709.html/view/939539.htm?fr=ala0_1_1一、統(tǒng)計(jì)學(xué)的產(chǎn)生和發(fā)展281、什么是統(tǒng)計(jì)?統(tǒng)計(jì)的原義——合計(jì)、匯總計(jì)算。統(tǒng)計(jì)——對(duì)大量現(xiàn)象數(shù)量方面進(jìn)行的調(diào)查研究活動(dòng)。即指人們?yōu)榱苏f明所研究現(xiàn)象的某種數(shù)量特征和規(guī)律性而對(duì)有關(guān)數(shù)據(jù)進(jìn)行搜集、整理和分析研究。302、統(tǒng)計(jì)的三種涵義統(tǒng)計(jì)工作——統(tǒng)計(jì)實(shí)踐活動(dòng),是人們?yōu)榱苏f明所研究對(duì)象的某種數(shù)量特征和數(shù)量規(guī)律性,而對(duì)該現(xiàn)象的數(shù)據(jù)進(jìn)行收集、整理與分析的活動(dòng)。統(tǒng)計(jì)資料——即統(tǒng)計(jì)數(shù)據(jù),是通過統(tǒng)計(jì)工作所獲得的能夠說明現(xiàn)象總體某種特征的數(shù)據(jù),是統(tǒng)計(jì)實(shí)踐活動(dòng)的成果。統(tǒng)計(jì)學(xué)——即統(tǒng)計(jì)科學(xué),是一門研究收集數(shù)據(jù)、表現(xiàn)數(shù)據(jù)、分析數(shù)據(jù)、解釋數(shù)據(jù),從而認(rèn)識(shí)數(shù)量規(guī)律的方法論科學(xué)。31統(tǒng)計(jì)學(xué)是:“關(guān)于收集和分析數(shù)據(jù)的科學(xué)與藝術(shù)(art)”。3、另一種定義——來自《不列顛百科全書》的定義藝術(shù)性體現(xiàn)在:1)、數(shù)據(jù)有隨機(jī)性(帶偶然誤差)。2)、應(yīng)用時(shí)有人的判斷和主動(dòng)性(“藝術(shù)”),不是死套公式。4、統(tǒng)計(jì)實(shí)踐活動(dòng)的產(chǎn)生和發(fā)展有文字記載的統(tǒng)計(jì)實(shí)踐活動(dòng),如埃及建造金字塔時(shí)期,中國大禹治水時(shí)期。資本主義生產(chǎn)方式出現(xiàn)以前,統(tǒng)計(jì)主要限于人口/土地/財(cái)產(chǎn)等;隨著資本主義生產(chǎn)方式的推進(jìn),統(tǒng)計(jì)飛速發(fā)展——統(tǒng)計(jì)內(nèi)容擴(kuò)展,專門統(tǒng)計(jì)機(jī)構(gòu)成立;20世紀(jì)50年代以后,統(tǒng)計(jì)又得到了迅速發(fā)展。325、統(tǒng)計(jì)學(xué)的產(chǎn)生國勢(shì)學(xué)派(記述學(xué)派)——(德)海門爾.康令;阿亨瓦爾1749年提出“統(tǒng)計(jì)學(xué)”。有統(tǒng)計(jì)學(xué)之名,無統(tǒng)計(jì)學(xué)之實(shí)。

政治算術(shù)學(xué)派——威廉.配第,約翰.格朗特用數(shù)字描述經(jīng)濟(jì)現(xiàn)象和人口狀況;雖無統(tǒng)計(jì)學(xué)之名,但有統(tǒng)計(jì)學(xué)之實(shí)。數(shù)理統(tǒng)計(jì)學(xué)派——?jiǎng)P特勒(比利時(shí))。引入概率論,開創(chuàng)近代統(tǒng)計(jì)學(xué)。使統(tǒng)計(jì)學(xué)產(chǎn)生了質(zhì)的飛躍——統(tǒng)計(jì)方法成為通用方法;重心從描述統(tǒng)計(jì)轉(zhuǎn)移到推斷統(tǒng)計(jì)…社會(huì)統(tǒng)計(jì)學(xué)派——恩斯特.恩格爾;梅爾。從實(shí)質(zhì)論逐漸轉(zhuǎn)向(社會(huì)現(xiàn)象數(shù)量研究的)方法論,與數(shù)理統(tǒng)計(jì)學(xué)派從對(duì)立逐漸轉(zhuǎn)向融合。336、統(tǒng)計(jì)學(xué)的發(fā)展進(jìn)程341.統(tǒng)計(jì)學(xué)的初創(chuàng)階段(17世紀(jì)中葉~19世紀(jì)末)。描述統(tǒng)計(jì)和概率論的基本內(nèi)容和框架逐漸形成。2.以推斷統(tǒng)計(jì)為中心的現(xiàn)代統(tǒng)計(jì)學(xué)的形成階段,(20世紀(jì)上半葉)。概率論體系日臻完善,推斷統(tǒng)計(jì)迅速發(fā)展,逐漸構(gòu)筑起了以推斷統(tǒng)計(jì)為中心的現(xiàn)代統(tǒng)計(jì)學(xué)的基本框架。3.統(tǒng)計(jì)理論方法與應(yīng)用全面發(fā)展的新階段(20世紀(jì)50年代起)。統(tǒng)計(jì)學(xué)研究的新領(lǐng)域?qū)映霾桓F,開拓了許多新分支和新方法;統(tǒng)計(jì)的應(yīng)用領(lǐng)域也不斷擴(kuò)展;計(jì)算機(jī)為統(tǒng)計(jì)理論和方法的不斷完善和深化提供了不可缺少的工具。35統(tǒng)計(jì)學(xué)可以應(yīng)用于幾乎所有的領(lǐng)域:精算,農(nóng)業(yè),動(dòng)物學(xué),人類學(xué),考古學(xué),審計(jì)學(xué),晶體學(xué),人口統(tǒng)計(jì)學(xué),牙醫(yī)學(xué),生態(tài)學(xué),經(jīng)濟(jì)計(jì)量學(xué),教育學(xué),選舉預(yù)測(cè)和策劃,工程,流行病學(xué),金融,水產(chǎn)漁業(yè)研究,遺傳學(xué),地理學(xué),地質(zhì)學(xué),歷史研究,人類遺傳學(xué),水文學(xué),工業(yè),法律,語言學(xué),文學(xué),勞動(dòng)力計(jì)劃,管理科學(xué),市場(chǎng)營銷學(xué),醫(yī)學(xué)診斷,氣象學(xué),軍事科學(xué),核材料安全管理,眼科學(xué),制藥學(xué),物理學(xué),政治學(xué),心理學(xué),心理物理學(xué),質(zhì)量控制,宗教研究,社會(huì)學(xué),調(diào)查抽樣,分類學(xué),氣象改善,博彩等。36一句話,要記住:統(tǒng)計(jì)學(xué)(statistics)是用以收集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。37根據(jù)研究領(lǐng)域和研究對(duì)象,統(tǒng)計(jì)學(xué)又分為:數(shù)理統(tǒng)計(jì)、經(jīng)濟(jì)統(tǒng)計(jì)、生物統(tǒng)計(jì)、醫(yī)學(xué)統(tǒng)計(jì)、衛(wèi)生統(tǒng)計(jì)……在上述學(xué)科已經(jīng)有其特有的方法和特點(diǎn);如生物統(tǒng)計(jì)(biostatistics)、經(jīng)濟(jì)計(jì)量學(xué)(econometrics)以及目前很熱門的生物信息(bioinformation)和數(shù)據(jù)挖掘(DataMining)的方法主體都是統(tǒng)計(jì)。381.采用統(tǒng)計(jì)學(xué)方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。變異(variation)是社會(huì)和生物醫(yī)學(xué)中的普遍現(xiàn)象。變異使得實(shí)驗(yàn)或觀察的結(jié)果具有不確定性,如每個(gè)人的身高、體重、血壓等各有不同。

為什么要學(xué)統(tǒng)計(jì)學(xué)?39最大值=6.18,最小值=3.29,極差=2.89

算術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.57。二、統(tǒng)計(jì)學(xué)的研究對(duì)象與研究方法1、統(tǒng)計(jì)學(xué)的研究對(duì)象群體現(xiàn)象的數(shù)量方面,即現(xiàn)象總體的數(shù)量特征和數(shù)量關(guān)系。數(shù)量性——統(tǒng)計(jì)研究現(xiàn)象的數(shù)量特征(從數(shù)量上來認(rèn)識(shí)事物的性質(zhì)和規(guī)律性).在質(zhì)與量的辨證統(tǒng)一中研究;不同于純數(shù)量的研究。

總體性——研究大量個(gè)別事物構(gòu)成的現(xiàn)象整體的數(shù)據(jù)。現(xiàn)象的數(shù)量規(guī)律性只有在總體層面上才能體現(xiàn)出來;研究目的在于說明總體特征,但常常從觀察個(gè)體數(shù)量特征入手,分析時(shí)也要注意一般與個(gè)別的結(jié)合.402、統(tǒng)計(jì)學(xué)的研究方法1)大量觀察法

指對(duì)總體中的全部或足夠多數(shù)的單位進(jìn)行調(diào)查觀察和綜合研究。其數(shù)理依據(jù)是大數(shù)定律——從數(shù)量關(guān)系上揭示了現(xiàn)象的偶然性與必然性的關(guān)系。實(shí)質(zhì)上是統(tǒng)計(jì)研究的重要思想方法和原則,而不是一種具體的應(yīng)用方法。2)分組法根據(jù)研究目的和現(xiàn)象的性質(zhì)特點(diǎn),按照一定的標(biāo)志將總體分為若干部分的一種研究方法。其應(yīng)用貫穿于整個(gè)統(tǒng)計(jì)工作的全過程。413)綜合指標(biāo)法指運(yùn)用各種綜合指標(biāo)來反映和研究現(xiàn)象總體的數(shù)量特征和數(shù)量關(guān)系。數(shù)字(即指標(biāo)數(shù)字)是統(tǒng)計(jì)的語言。綜合指標(biāo)法既是描述統(tǒng)計(jì)的中心,也是推斷統(tǒng)計(jì)的基礎(chǔ)。4)統(tǒng)計(jì)模型法根據(jù)一定的理論和假定條件,用數(shù)學(xué)模型去模擬現(xiàn)象之間相互關(guān)系、現(xiàn)象變化趨勢(shì)等的一種研究方法。統(tǒng)計(jì)模型包括三個(gè)要素——變量、數(shù)學(xué)關(guān)系式和模型參數(shù)。統(tǒng)計(jì)模型的參數(shù)由實(shí)際觀察的數(shù)據(jù)來估計(jì)。425)歸納推斷法

從個(gè)別到一般、從具體事實(shí)到抽象概括的推理方法,稱為歸納法。以一定的可信程度,根據(jù)樣本數(shù)據(jù)來判斷總體數(shù)量特征的歸納推理方法稱為統(tǒng)計(jì)推斷法。43三、統(tǒng)計(jì)學(xué)的分類1、描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)描述統(tǒng)計(jì)——研究如何對(duì)客觀現(xiàn)象的數(shù)量特征進(jìn)行計(jì)量、觀察、概括和表述。用表和圖表示,計(jì)算特征量(如平均值)等,所論不超出已有數(shù)據(jù)。推斷統(tǒng)計(jì)(統(tǒng)計(jì)推斷)——據(jù)數(shù)據(jù)所提供信息對(duì)數(shù)據(jù)所來自的總體(母體)的性質(zhì)作推斷,推斷會(huì)有錯(cuò)誤、誤差,用概率論的術(shù)語和方法來描述和論證。誤差的產(chǎn)生源于數(shù)據(jù)有誤差。怎樣盡可能減少推斷的錯(cuò)誤和誤差,是統(tǒng)計(jì)推斷的中心問題。442、描述統(tǒng)計(jì)目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律內(nèi)容確定要研究的數(shù)量特征設(shè)計(jì)統(tǒng)計(jì)指標(biāo)(說明這些數(shù)量特征的)搜集數(shù)據(jù)整理數(shù)據(jù)計(jì)算并顯示指標(biāo)數(shù)據(jù)45x

=30s2=10502550Q1Q2Q3Q43、推斷統(tǒng)計(jì)目的——對(duì)總體特征作出推斷。內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)相關(guān)回歸分析46樣本總體4、描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系47反映客觀現(xiàn)象的數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(jì)(利用樣本信息對(duì)總體的數(shù)量特征進(jìn)行估計(jì)和檢驗(yàn)等)概率論(包括分布理論,大數(shù)定律和中心極限定理等)描述統(tǒng)計(jì)(統(tǒng)計(jì)數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計(jì)學(xué)探索現(xiàn)象數(shù)量規(guī)律性的過程5、理論統(tǒng)計(jì)學(xué)與應(yīng)用統(tǒng)計(jì)學(xué)1)理論統(tǒng)計(jì)學(xué)是關(guān)于數(shù)據(jù)的搜集、整理和分析的最基本原理、原則和方法。適用于各種現(xiàn)象數(shù)量特征的分析研究。它是應(yīng)用統(tǒng)計(jì)學(xué)共同的理論基礎(chǔ)。所謂統(tǒng)計(jì)學(xué)是一門通用方法論科學(xué),就是指理論統(tǒng)計(jì)學(xué)而言。2)應(yīng)用統(tǒng)計(jì)學(xué)運(yùn)用于某一特定領(lǐng)域的統(tǒng)計(jì)理論和方法。例如:生物統(tǒng)計(jì)學(xué)、醫(yī)藥統(tǒng)計(jì)學(xué)、氣象統(tǒng)計(jì)學(xué)、科技統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)統(tǒng)計(jì)學(xué)(宏觀經(jīng)濟(jì)統(tǒng)計(jì)學(xué)、企業(yè)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)、金融統(tǒng)計(jì)學(xué)、保險(xiǎn)統(tǒng)計(jì)學(xué)、價(jià)格統(tǒng)計(jì)學(xué)、對(duì)外貿(mào)易統(tǒng)計(jì)學(xué)…)48統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域49統(tǒng)計(jì)學(xué)經(jīng)濟(jì)學(xué)管理學(xué)醫(yī)學(xué)工程學(xué)社會(huì)學(xué)…1、統(tǒng)計(jì)學(xué)與數(shù)學(xué)

聯(lián)系:一方面,統(tǒng)計(jì)學(xué)要用到數(shù)學(xué)知識(shí),統(tǒng)計(jì)的數(shù)量分析要符合數(shù)學(xué)原理;另一方面,統(tǒng)計(jì)方法和數(shù)學(xué)方法一樣,并不能獨(dú)立地直接研究和探索現(xiàn)象的規(guī)律,而是為各學(xué)科提供研究和探索客觀規(guī)律的數(shù)量分析方法。

50四、統(tǒng)計(jì)學(xué)與其他學(xué)科的關(guān)系區(qū)別主要在于:(1)數(shù)學(xué)研究的是抽象的數(shù)量規(guī)律性,而統(tǒng)計(jì)學(xué)研究的是具體的、實(shí)實(shí)在在的數(shù)量規(guī)律性。數(shù)學(xué)研究的是沒有量綱或單位的數(shù),而統(tǒng)計(jì)學(xué)研究的是有具體實(shí)物內(nèi)容或計(jì)量單位的數(shù)據(jù)。(2)數(shù)學(xué)研究使用的是純粹的演繹,而統(tǒng)計(jì)學(xué)是演繹與歸納相結(jié)合,且占主導(dǎo)地位的是歸納。512、統(tǒng)計(jì)學(xué)與哲學(xué)

哲學(xué)是關(guān)于自然、社會(huì)和思維發(fā)展的普遍規(guī)律的科學(xué),包括辨證唯物主義和歷史唯物主義,它不僅是正確的世界觀,也是科學(xué)的方法論。統(tǒng)計(jì)學(xué)作為一門探索客觀事物數(shù)量規(guī)律性的方法論科學(xué),必然要以哲學(xué)作為它的方法論基礎(chǔ)。

523、統(tǒng)計(jì)學(xué)與其他學(xué)科的關(guān)系統(tǒng)計(jì)方法可以幫助其他學(xué)科探索內(nèi)在的數(shù)量規(guī)律性,而這種數(shù)量規(guī)律性的解釋(和由數(shù)量規(guī)律性進(jìn)而研究各學(xué)科內(nèi)在的規(guī)律)只能由各學(xué)科的研究完成。53生物統(tǒng)計(jì)學(xué)的概念及主要內(nèi)容一、概念

生物統(tǒng)計(jì)學(xué)(Biostatistics)是數(shù)理統(tǒng)計(jì)在生物學(xué)研究中的應(yīng)用,它是應(yīng)用數(shù)理統(tǒng)計(jì)的原理,運(yùn)用統(tǒng)計(jì)方法來認(rèn)識(shí)、分析、推斷和解釋生命過程中的各種現(xiàn)象和試驗(yàn)調(diào)查資料的科學(xué)。屬于生物數(shù)學(xué)的范疇。54二、主要內(nèi)容生的物基統(tǒng)本計(jì)內(nèi)學(xué)容試驗(yàn)設(shè)計(jì)統(tǒng)計(jì)分析基本原則方案制定常用試驗(yàn)設(shè)計(jì)方法資料的搜集和整理數(shù)據(jù)特征數(shù)的計(jì)算統(tǒng)計(jì)推斷方差分析回歸和相關(guān)分析協(xié)方差分析主成分分析聚類分析對(duì)比設(shè)計(jì)隨機(jī)區(qū)組設(shè)計(jì)裂區(qū)設(shè)計(jì)拉丁方設(shè)計(jì)正交設(shè)計(jì)55三、生物統(tǒng)計(jì)學(xué)的基本作用提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定某些性狀和特征的數(shù)量特征。運(yùn)用顯著檢驗(yàn),判斷試驗(yàn)結(jié)果的可靠性或可行性。提供由樣本推斷總體的方法。提供試驗(yàn)設(shè)計(jì)的一些重要原則。56四、常用統(tǒng)計(jì)學(xué)術(shù)語(一)總體與樣本具有相同性質(zhì)或?qū)傩缘膫€(gè)體所組成的集合稱為總體

(population),它是指研究對(duì)象的全體;組成總體的基本單元稱為個(gè)體(individual);從總體中抽出若干個(gè)體所構(gòu)成的集合稱為樣本(sample);總體又分為有限總體和無限總體:含有有限個(gè)個(gè)體的總體稱為有限總體(finitudepopuoation);包含有極多或無限多個(gè)體的總體稱為無限總體(infinitudepopuoation).57構(gòu)成樣本的每個(gè)個(gè)體稱為樣本單位;樣本中所包含的個(gè)體數(shù)目叫樣本容量或樣本大小(samplesize),樣本容量常記為n。 一般在生物學(xué)研究中,通常把n≤30的樣本叫小樣本,n>30的樣本叫大樣本。對(duì)于小樣本和大樣本,在一些統(tǒng)計(jì)數(shù)的計(jì)算和分析檢驗(yàn)上是不一樣的。研究的目的是要了解總體,然而能觀測(cè)到的卻是樣本,通過樣本來推斷總體是統(tǒng)計(jì)分析的基本特點(diǎn)。58(二)變量與常量

變量,或變數(shù),指相同性質(zhì)的事物間表現(xiàn)差異性或差異特征的數(shù)據(jù)。常數(shù),表示能代表事物特征和性質(zhì)的數(shù)值,通常由變量計(jì)算而來,在一定過程中是不變的。59變量定性變量定量變量連續(xù)變量非連續(xù)變量只有整數(shù)出現(xiàn)可以有任何小數(shù)出現(xiàn)60為了表示總體和樣本的數(shù)量特征,需要計(jì)算出幾個(gè)特征數(shù),包括平均數(shù)和變異數(shù)(極差、方差、標(biāo)準(zhǔn)差等)。描述總體特征的數(shù)量稱為參數(shù)(parameter),也稱參量。常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ表示總體標(biāo)準(zhǔn)差;描述樣本特征的數(shù)量稱為統(tǒng)計(jì)數(shù)(staistic),也稱統(tǒng)計(jì)量。常用拉丁字母表示統(tǒng)計(jì)數(shù),例如用表示樣本平均數(shù),用S表示樣本標(biāo)準(zhǔn)差。(三)參數(shù)與統(tǒng)計(jì)數(shù)總體樣本抽取部分觀察單位

統(tǒng)計(jì)量

參數(shù)

推斷inference61

基本統(tǒng)計(jì)參數(shù)1、平均數(shù)算術(shù)平均數(shù)幾何平均數(shù)622、變異數(shù)極差極差又稱全距,它是樣本變量中最大值和最小值之差,一般用R表示。方差(Variance)

樣本方差總體方差63標(biāo)準(zhǔn)差(standarddeviation)

樣本標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差變異系數(shù)Variationcoefficient

變異系數(shù)是樣本變量的相對(duì)變異量,是不帶單位的純數(shù)。用變異系數(shù)可以比較不同樣本相對(duì)變異程度的大小。64(四)效應(yīng)與互作通過施加試驗(yàn)處理,引起試驗(yàn)差異的作用稱為效應(yīng)。效應(yīng)是一個(gè)相對(duì)量,而非絕對(duì)量,表現(xiàn)為施加處理前后的差異。效應(yīng)有正效應(yīng)與負(fù)效應(yīng)之分。

互作,又叫連應(yīng),是指兩個(gè)或兩個(gè)以上處理因素間相互作用產(chǎn)生的效應(yīng)?;プ饕灿姓?yīng)(協(xié)同作用)與負(fù)效應(yīng)(拮抗作用)之分。65(五)隨機(jī)誤差與錯(cuò)誤變異效應(yīng)誤差隨機(jī)誤差/機(jī)誤(Randomerror)系統(tǒng)誤差/錯(cuò)誤(Systematicerror)66

隨機(jī)誤差,也叫抽樣誤差(samplingerror)。這是由于試驗(yàn)中無法控制的內(nèi)在和外在的偶然因素所造成。如試驗(yàn)動(dòng)物的初始條件、飼養(yǎng)條件、管理措施等盡管在試驗(yàn)中力求一致,但也不可能達(dá)到絕對(duì)一致,所以隨機(jī)誤差帶有偶然性質(zhì),在試驗(yàn)中,即使十分小心也是不可避免的。如果通過良好的試驗(yàn)設(shè)計(jì)、正確的試驗(yàn)操作,增加抽樣或試驗(yàn)次數(shù),隨機(jī)誤差可能減小,但不可能完全消滅。統(tǒng)計(jì)上的試驗(yàn)誤差一般都指隨機(jī)誤差。隨機(jī)誤差越小,試驗(yàn)精確性越高。67

系統(tǒng)誤差,也叫片面誤差

(lopsidederror)。這是由于試驗(yàn)條件控制不一致、測(cè)量?jī)x器不準(zhǔn)、試劑配制不當(dāng)、試驗(yàn)人員粗心大意使稱量、觀測(cè)、記載、抄錄、計(jì)算中出現(xiàn)錯(cuò)誤等人為因素而引起的。系統(tǒng)誤差影響試驗(yàn)的準(zhǔn)確性。只要以認(rèn)真負(fù)責(zé)的態(tài)度和細(xì)心的工作作風(fēng)是完全可以避免的。(六)準(zhǔn)確度與可靠度準(zhǔn)確度(accuracy)或真實(shí)性(validity):觀察值與真值的接近程度,受系統(tǒng)誤差的影響(常用指標(biāo):如靈敏度、特異度)??煽慷龋╮eliabiliy)——也稱精密度(precision)或重復(fù)性(repeatability):重復(fù)觀察時(shí)觀察值與其均值的接近程度,受隨機(jī)誤差的影響(常用指標(biāo):一致百分率、Kappa值)。686970

樣本的實(shí)際發(fā)生率稱為頻率。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行n次試驗(yàn),事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。

概率:隨機(jī)事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。(七)頻率與概率

frequencyandprobability71必然事件P=1隨機(jī)事件0<P<1不可能事件P=0

P≤0.05(5%)或P≤0.01(1%)稱為小概率事件(習(xí)慣),統(tǒng)計(jì)學(xué)上認(rèn)為不大可能發(fā)生。小概率事件CertainImpossible0.50172數(shù)據(jù)的組織與表達(dá)A數(shù)據(jù)與數(shù)據(jù)類型一、原始數(shù)據(jù)的組織二、變量的類型三、定量變量的離散化與有序分類變量的數(shù)量化B頻數(shù)分布表一、定量數(shù)據(jù)的頻數(shù)分布表二、定性數(shù)據(jù)的頻數(shù)分布表三、配對(duì)設(shè)計(jì)定性數(shù)據(jù)的頻數(shù)分布表C統(tǒng)計(jì)圖形表達(dá)73一、原始數(shù)據(jù)的組織每一行代表一個(gè)研究對(duì)象(單位)的觀測(cè)記錄每一列代表一個(gè)觀測(cè)指標(biāo)(變量)

74SPSS軟件的數(shù)據(jù)界面SPSS-----StatisticalPackageforSocialScience(社會(huì)科學(xué)統(tǒng)計(jì)軟件包)現(xiàn)改為StatisticalProductandServiceSolutions(統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案)75SAS軟件的數(shù)據(jù)界面76SPSS軟件的數(shù)據(jù)界面二、變量的類型只有認(rèn)識(shí)了變量的類型,才能正確地選用統(tǒng)計(jì)分析方法

按變量測(cè)量的精確程度由低到高,將數(shù)據(jù)分類為:名義變量(如性別、婚姻狀況)、有序變量(如療效,類別間差別大小難以度量)、區(qū)間變量(如攝氏體溫,類別間差別有實(shí)際意義)、比變量(如身高,除具有區(qū)間變量的特征外,還具有真實(shí)意義的零點(diǎn)。攝氏溫度的零點(diǎn)為水結(jié)冰時(shí)溫度,并非絕對(duì)意義的零點(diǎn),所以它不屬于比變量)定量變量定性變量1、定性變量(QualitativeVariable)也稱為:計(jì)數(shù)數(shù)據(jù)(enumeration(counting)data)(1)名義變量(Nominalvariable)二項(xiàng)分類

性別分類,如男性為1,女性為0。多項(xiàng)無序分類

血型的A、B、AB、O型多項(xiàng)無序分類(2)有序(等級(jí))變量(Ordinalorrankingvariable)多項(xiàng)有序分類療效觀測(cè)分為顯效、有效、好轉(zhuǎn)及無效4個(gè)類別。782、定量變量(QuantitativeVariable)(1)區(qū)間變量(intervalvariable)

或數(shù)值變量(numericalvariable)如:身高,血壓,血清膽固醇濃度,體溫,脈搏計(jì)數(shù)、紅細(xì)胞計(jì)數(shù)、玫瑰花環(huán)計(jì)數(shù)、住院天數(shù)等。(一般有度量衡單位,類別間的差別大小有實(shí)際意義)(2)比變量(ratiovariable)

以上例子中除體溫外(具有真實(shí)意義的零點(diǎn))79

連續(xù)型變量(Continuousvariable)

與離散型變量(Discretevariables)

根據(jù)觀察數(shù)據(jù)之間有無縫隙(gap),常將數(shù)據(jù)分類為離散型變量(有縫隙)與連續(xù)型變量(無縫隙)兩大類,名義變量一定是離散型變量;連續(xù)型變量只能是比、區(qū)間和有序變量,但比、區(qū)間和有序變量也可以是離散型變量(見圖)

80三、定量變量的離散化

與有序分類變量的數(shù)量化811、實(shí)際年齡---------少年、青年、中年、老年2、有序療效等級(jí):顯效、有效、好轉(zhuǎn)、無效

4321丟失信息賦值的合理性?定量變量--定性變量例:一組2040歲成年人的血壓以12kPa為界分為正常與異常兩組,統(tǒng)計(jì)每組例數(shù)

<8低血壓

8

正常血壓

12

輕度高血壓

15

中度高血壓

17

重度高血壓定量變量有序分類定性變量丟失信息住院號(hào)年齡身高體重住院天數(shù)職業(yè)文化程度分娩方式妊娠結(jié)局20256552716571.55無中學(xué)順產(chǎn)足月20256532216074.05無小學(xué)助產(chǎn)足月20258302515868.06管理員大學(xué)順產(chǎn)足月20225432316169.05無中學(xué)剖宮產(chǎn)足月20224662515962.011商業(yè)中學(xué)剖宮產(chǎn)足月20245352715768.02無小學(xué)順產(chǎn)早產(chǎn)20258342015866.04無中學(xué)助產(chǎn)早產(chǎn)20194642415870.53無中學(xué)助產(chǎn)足月20257832915457.07干部中學(xué)剖宮產(chǎn)足月觀察單位observations個(gè)體individuals變量variablesQuantitativedata定量數(shù)據(jù)Qualitativedata定性數(shù)據(jù)Units;elements頻數(shù)分布表一、定量數(shù)據(jù)的頻數(shù)分布二、(非配對(duì)設(shè)計(jì))定性數(shù)據(jù)的頻數(shù)分布三、配對(duì)設(shè)計(jì)定性數(shù)據(jù)的頻數(shù)分布84

頻數(shù)(frequency)——將定量數(shù)據(jù)分類成若干個(gè)組段,或?qū)⒍ㄐ詳?shù)據(jù)分類成若干個(gè)類別,所清點(diǎn)得到的每一組段或類別的數(shù)據(jù)出現(xiàn)個(gè)數(shù)。一、定量數(shù)據(jù)的頻數(shù)分布

853.203.625.084.864.053.914.264.454.933.613.924.434.884.264.103.553.685.774.334.974.644.344.584.834.833.453.814.762.954.975.134.634.876.023.543.773.555.764.653.946.025.415.233.665.295.325.222.934.303.783.075.573.764.023.963.954.813.453.712.943.694.695.525.584.624.644.494.553.853.344.675.134.274.544.313.925.304.775.303.584.743.554.103.924.745.813.504.853.144.473.254.973.143.983.685.924.493.824.202.843.325.474.503.695.333.323.104.033.434.405.633.746.293.594.733.643.294.084.235.074.195.914.175.224.964.515.243.525.594.124.064.452.724.364.185.324.034.634.644.124.504.544.373.854.576.264.575.324.053.93150名成年男子血清總膽固醇水平(mmol/L)測(cè)定頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。R=6.29-2.72=3.57mmol/L(2)決定分組組數(shù)、組距根據(jù)研究目的和樣本含量n確定分組組數(shù),通常分為10~15個(gè)組。組距=極差/組數(shù),為方便計(jì),組距=極差/10,再略加調(diào)整。3.57/10=0.357≈0.4(3)列出組段第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值。2.7~3.1~……5.5~5.9~6.3(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。8687(5)

計(jì)算頻率:Pi=fi/n,如P1=f1/n=6/150=0.04(6)計(jì)算累計(jì)頻數(shù)(fc)(7)計(jì)算累計(jì)頻率:Pc=fc/n88

二、(非配對(duì)設(shè)計(jì))定性數(shù)據(jù)的頻數(shù)分布一維頻數(shù)表二維頻數(shù)表高維頻數(shù)表200名學(xué)生的血型血型OABAB合計(jì)觀測(cè)數(shù)6572382520089普通二維表的常見類型9091由原始數(shù)據(jù)整理成一維頻數(shù)表婚姻狀況頻數(shù)單身

3已婚

5離異

2分居

4合計(jì)1414名成人的婚姻狀況編號(hào)性別身高婚姻狀況1男175單身2女167單身3男187單身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167離異10女186離異11男182分居12女159分居13男167分居14女182分居14名成人的原始數(shù)據(jù)婚姻狀況性別頻數(shù)單身男2已婚男2離異男1分居男2單身女1已婚女3離異女1分居女292由原始數(shù)據(jù)整理成二維頻數(shù)表婚姻狀況性別男女單身21已婚23離異11分居22不同性別的婚姻狀況編號(hào)性別身高婚姻狀況1男175單身2女167單身3男187單身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167離異10女186離異11男182分居12女159分居13男167分居14女182分居14名成人的原始數(shù)據(jù)三、配對(duì)設(shè)計(jì)定性數(shù)據(jù)的頻數(shù)分布1甲培養(yǎng)基乙培養(yǎng)基頻數(shù)11381050190024樣本編號(hào)甲培養(yǎng)基乙培養(yǎng)基1陽性陽性………38陽性陽性39陽性陰性………43陽性陰性44陰性陽性………52陰性陽性53陰性陰性………76陰性陰性93甲培養(yǎng)基乙培養(yǎng)基合計(jì)陽性1陰性0陽性138543陰性092433合計(jì)472976表2.7同一樣品經(jīng)兩種培養(yǎng)基培養(yǎng)結(jié)果自身配對(duì)三、配對(duì)設(shè)計(jì)定性數(shù)據(jù)的頻數(shù)分布2對(duì)比法核素法頻數(shù)11581221332112242237318329331794統(tǒng)計(jì)圖形表達(dá)95變量類型一維情況二維情況定量數(shù)據(jù)定性數(shù)據(jù)定量數(shù)據(jù)1.莖葉圖2.盒式圖3.直方圖4.加分布曲線的直方圖1.散點(diǎn)圖2.加置信橢圓的散點(diǎn)圖1.分組盒式圖2.分組散點(diǎn)圖定性數(shù)據(jù)1.直條圖2.餅圖1.分組盒式圖2.分組散點(diǎn)圖1.城區(qū)圖2.馬賽克圖

1、直方圖(Histogram):用于描述定量變量的數(shù)據(jù)分布特征。962(1)、概率-概率散點(diǎn)圖(p-pplot)又稱為p-p圖或百分點(diǎn)圖,橫軸為觀察累積概率,縱軸為理論(如正態(tài))累積概率,確定樣本數(shù)據(jù)對(duì)于理論分布的一致性97圖表2-3數(shù)據(jù)的p-p圖2(2)、分位數(shù)-分位數(shù)散點(diǎn)圖(q-qplot)又稱為q-q圖,橫軸為觀察值,縱軸為理論(如正態(tài))分位數(shù),確定樣本數(shù)據(jù)對(duì)于理論分布的一致性98圖表2-3數(shù)據(jù)的q-q圖繪P-P或Q-Q圖的數(shù)據(jù)992、莖葉(Stem-Leaf)圖100

StemLeaf#626926022258112356367354172789652223490022231150783344813356783677712462334445793446714440355799001445778164203667013467114023355680022789143812551222345681336124688991467813343550245558911320592246307044428434542621----+----+----+----+MultiplyStem.Leafby10**-13、盒式圖(Boxplot)1014、直條圖(Barchart):用直條反映定性變量不同類別下的某指標(biāo)大小。

102四種營養(yǎng)素喂養(yǎng)小白鼠三周后所增體重(克)繪制直條圖注意事項(xiàng)

103

⑴縱軸的刻度必須從“0”開始,否則會(huì)改變各對(duì)比組間的比例關(guān)系。

(2)橫軸各直條一般按統(tǒng)計(jì)指標(biāo)由大到小排列,也可按事物本身的自然順序排列。

(3)各直條的寬度要一致,各直條應(yīng)有相等的間隔,其寬度一般與直條的寬度相等或?yàn)橹睏l寬度的一半。

5、餅圖(pieChart):反映定性變量各個(gè)分類的構(gòu)成情況。

200名學(xué)生的血型血型OABAB合計(jì)觀測(cè)數(shù)657238252001046.散點(diǎn)圖1057.線圖106(8)統(tǒng)計(jì)地圖(statisticalmap)107統(tǒng)計(jì)地圖(statisticalmap):用于表示某現(xiàn)象的數(shù)量在地域上的分布。108第二部分

概率論、基本分布第一節(jié)概率的有關(guān)概念第二節(jié)隨機(jī)變量及其概率分布概述第三節(jié)常用的概率分布

二項(xiàng)分布、泊松分布、正態(tài)分布

第四節(jié)常用的抽樣分布

卡方分布、t分布、F分布109第一節(jié)概率的有關(guān)概念

樣本的實(shí)際發(fā)生率稱為頻率。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行n次試驗(yàn),事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。

概率:隨機(jī)事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。

一、頻率與概率

frequencyandprobability必然事件P=1隨機(jī)事件0<P<1不可能事件P=0

P≤0.05(5%)或P≤0.01(1%)稱為小概率事件(習(xí)慣),統(tǒng)計(jì)學(xué)上認(rèn)為不大可能發(fā)生。二、隨機(jī)事件

RandomeventsCertainImpossible0.501樣本空間(samplingspace):隨機(jī)試驗(yàn)的所有可能的結(jié)果稱為樣本空間。頻率與概率間的關(guān)系:

1.樣本頻率總是圍繞概率上下波動(dòng)

2.樣本含量n越大,波動(dòng)幅度越小,頻率越接近概率。隨著投擲次數(shù)n的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右112試驗(yàn)的次數(shù)正面/試驗(yàn)次數(shù)1.000.000.250.500.750255075100125表

玉米種子發(fā)芽試驗(yàn)結(jié)果種子總數(shù)(n)1020501002005001000發(fā)芽種子數(shù)(m)9194791186458920種子發(fā)芽率(m/n)0.9000.9500.9400.9100.9300.9180.920種子發(fā)芽與否是不能事先確定的,但從表中可以看出,試驗(yàn)隨著n值的不同,種子發(fā)芽率也不相同,當(dāng)n充分大時(shí),發(fā)芽率在0.92附近擺動(dòng)。例:頻率表明了事件頻繁出現(xiàn)的程度,因而其穩(wěn)定性說明了隨機(jī)事件發(fā)生的可能性大小,是其本身固有的客觀屬性,提示了隱藏在隨機(jī)現(xiàn)象中的規(guī)律性。概率一、隨機(jī)變量115每次拋兩個(gè)硬幣,記錄正、反面結(jié)果;結(jié)果可記錄為:硬幣1正面朝上,硬幣2正面朝上;2個(gè)正面硬幣1正面朝上,硬幣2反面朝上;1個(gè)正面硬幣1反面朝上,硬幣2正面朝上;1個(gè)正面硬幣1反面朝上,硬幣2反面朝上0個(gè)正面正面數(shù)就是一個(gè)隨機(jī)變量,記為x,我們通常對(duì)x的每個(gè)取值的概率感興趣。對(duì)于本例,x的取值為0、1、2。第二節(jié)隨機(jī)變量及其概率分布概述二、離散型隨機(jī)變量與連續(xù)型隨機(jī)變量116

離散型隨機(jī)變量(discreterandomvariable):數(shù)據(jù)間有縫隙,其取值可以列舉。

例如拋硬幣10次,正面的可能取值x為0、1、2、3、4、5、6、7、8、9、10

連續(xù)型隨機(jī)變量(continousrandomvariable)數(shù)據(jù)間無縫隙,其取值充滿整個(gè)區(qū)間,無法一一列舉每一可能值例如身高、體重、血清膽固醇含量三、概率分布(probabilitydistribution)離散型隨機(jī)變量概率分布連續(xù)型隨機(jī)變量概率分布117概率分布:描述隨機(jī)變量值xi及這些值對(duì)應(yīng)概率P(X=xi)的表格、公式或圖形。

1.離散型隨機(jī)變量的概率分布118離散型隨機(jī)變量的概率分布舉例1192.連續(xù)型隨機(jī)變量的概率分布120

變量的取值充滿整個(gè)數(shù)值區(qū)間,無法一一列出其每一個(gè)可能值。一般將連續(xù)型隨機(jī)變量整理成頻數(shù)表,對(duì)頻數(shù)作直方圖,直方圖的每個(gè)矩形頂端連接的階梯形曲線來描述連續(xù)型變量的頻數(shù)分布。

121

如果樣本量很大,組段很多,矩形頂端組成的階梯型曲線可變成光滑的分布曲線。大多數(shù)情況下,可采用一個(gè)函數(shù)擬合這一光滑曲線。這種函數(shù)稱為概率密度函數(shù)(probabilitydensityfunction)122如果連續(xù)型隨機(jī)變量X的密度函數(shù)記為:則在區(qū)間[x1,x2]范圍內(nèi)的概率可由微積分函數(shù)定義123第三節(jié)常用的概率分布

離散型隨機(jī)變量分布

一、二項(xiàng)分布

二、泊松分布

連續(xù)型隨機(jī)變量分布

三、正態(tài)分布124一、二項(xiàng)分布毒性試驗(yàn):白鼠死亡——生存臨床試驗(yàn):病人治愈——未愈臨床化驗(yàn):血清陽性——陰性事件成功(A)——失?。ǚ茿)這類“成功─失敗型”試驗(yàn)稱為Bernoulli試驗(yàn)。125Bernoulli試驗(yàn)序列n次Bernoulli試驗(yàn)構(gòu)成了Bernoulli試驗(yàn)序列。其特點(diǎn)(如拋硬幣)如下:(1)每次試驗(yàn)結(jié)果,只能是兩個(gè)互斥的結(jié)果之一(A或非A)。(2)每次試驗(yàn)的條件不變。即每次試驗(yàn)中,結(jié)果A發(fā)生的概率不變,均為π

。(3)各次試驗(yàn)獨(dú)立。即一次試驗(yàn)出現(xiàn)什么樣的結(jié)果與前面已出現(xiàn)的結(jié)果無關(guān)。126成功次數(shù)的概率分布─二項(xiàng)分布例設(shè)某毒理試驗(yàn)采用白鼠共3只,它們有相同的死亡概率π,相應(yīng)不死亡概率為1-π

。記試驗(yàn)后白鼠死亡的例數(shù)為X,分別求X=0、1、2和3的概率127128129二項(xiàng)分布的概率計(jì)算130二項(xiàng)分布的性質(zhì)131132133134135(二)樣本率與總體率的比較136二項(xiàng)分布的應(yīng)用137二項(xiàng)分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel表格界面中,直接點(diǎn)擊“f(x)”(粘貼函數(shù))命令第3步:在復(fù)選框“函數(shù)分類”中點(diǎn)擊“統(tǒng)計(jì)”選項(xiàng),在“函數(shù)名”中點(diǎn)擊“BINOMDIST”選項(xiàng),然后確定第4步:在Number_s后填入試驗(yàn)成功次數(shù)(本例為1)

在Trials后填入總試驗(yàn)次數(shù)(本例為5)

在Probability_s后填入試驗(yàn)的成功概率(本例為0.04)

在Cumulative后填入0(或FALSE),表示計(jì)算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值)138二、泊松分布當(dāng)二項(xiàng)分布中n很大,π很小時(shí),二項(xiàng)分布就變成為Poisson分布,所以Poisson分布實(shí)際上是二項(xiàng)分布的極限分布。由二項(xiàng)分布的概率函數(shù)可得到泊松分布的概率函數(shù)為:139140在m處的概率最大141在m處的概率最大Poisson分布主要用于描述在單位時(shí)間(空間)中稀有事件的發(fā)生數(shù)

例如:1.放射性物質(zhì)在單位時(shí)間內(nèi)的放射次數(shù);2.在單位容積充分搖勻的水中的細(xì)菌數(shù);3.野外單位空間中的某種昆蟲數(shù)等。142泊松分布的其它例子一定時(shí)間段內(nèi),某航空公司接到的訂票電話數(shù)一定時(shí)間內(nèi),到車站等候公共汽車的人數(shù)一定路段內(nèi),路面出現(xiàn)大損壞的次數(shù)一定時(shí)間段內(nèi),放射性物質(zhì)放射的粒子數(shù)一匹布上發(fā)現(xiàn)的疵點(diǎn)個(gè)數(shù)一定頁數(shù)的書刊上出現(xiàn)的錯(cuò)別字個(gè)數(shù)

143Poisson分布概率的計(jì)算144Poisson分布的性質(zhì)(1)一、Poisson分布的均數(shù)與方差相等即σ2=m

二、Poisson分布的可加性

145第五節(jié)Poisson分布的性質(zhì)(2)三、Poisson分布的正態(tài)近似

m相當(dāng)大(≥20)時(shí),近似服從正態(tài)分布:N(m,m)

四、二項(xiàng)分布的Poisson分布近似

146泊松分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel表格界面中,直接點(diǎn)擊“f(x)”(粘貼函數(shù))命令第3步:在復(fù)選框“函數(shù)分類”中點(diǎn)擊“統(tǒng)計(jì)”選項(xiàng),并在“函數(shù)名”中點(diǎn)擊“POISSON

”選項(xiàng),然后確定第4步:在X后填入事件出現(xiàn)的次數(shù)(本例為6)

在Means后填入泊松分布的均值(本例為7)

在Cumulative后填入0(或FALSE),表示計(jì)算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值)147三、正態(tài)分布

(NormalDistribution)1.概率密度函數(shù)1482.概率分布函數(shù)149正態(tài)分布特征(1)正態(tài)分布在橫軸上方均數(shù)μ處最高。(2)

正態(tài)分布以均數(shù)μ為中心,左右對(duì)稱。(3)正態(tài)分布由參數(shù)μ和σ確定。μ是位置參數(shù),當(dāng)σ不變時(shí),μ越大,則曲線沿橫軸越向右移動(dòng);反之,μ越小,曲線沿橫軸越向左移動(dòng)。σ是變異度參數(shù),當(dāng)μ不變時(shí),σ越大,表示數(shù)據(jù)越分散,曲線越平坦;σ越小,表示數(shù)據(jù)越集中,曲線越陡峭。(4)正態(tài)分布曲線與X軸所圍成的面積為1。(5)在μ±σ的區(qū)間內(nèi)占總面積的68.27%,在μ±1.96σ的區(qū)間內(nèi)占總面積的95%;在μ±2.58σ的區(qū)間內(nèi)占總面積的99%。150151

和對(duì)正態(tài)曲線的影響152xf(x)CAB=1/212=1正態(tài)分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel表格界面中,直接點(diǎn)擊“f(x)”(粘貼函數(shù))命令第3步:在復(fù)選框“函數(shù)分類”中點(diǎn)擊“統(tǒng)計(jì)”選項(xiàng),并在“函數(shù)名”中點(diǎn)擊“NORMDIST

”選項(xiàng),然后確定第4步:在X后填入正態(tài)分布函數(shù)計(jì)算的區(qū)間點(diǎn)(本例為70)

在Mean后填入正態(tài)分布的均值

(本例為50)

在PStandard_dev后填入標(biāo)準(zhǔn)差

(本例為10)

在Cumulative后填入1(或TRUE)表示計(jì)算事件出現(xiàn)次數(shù)小于或等于指定數(shù)值的累積概率值153標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)離差標(biāo)準(zhǔn)正態(tài)分布:N(0,1)154此概率密度函數(shù)實(shí)質(zhì)上就是正態(tài)分布的概率密度函數(shù)中μ=0,σ=1的情形。從幾何意義上說,此變換實(shí)質(zhì)上是作了一個(gè)坐標(biāo)軸的平移和尺度變換,使正態(tài)分布具有平均數(shù)為μ=0,標(biāo)準(zhǔn)差σ=1。這種變換稱為標(biāo)準(zhǔn)化正態(tài)變換。因此將這種具有平均數(shù)為μ=0,標(biāo)準(zhǔn)差σ=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布,記為N(0,1)。155156普通正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布XZΦ(Z)φ(Z)標(biāo)準(zhǔn)正態(tài)分布的累積概率函數(shù)正態(tài)分布概率密度曲線在-1~+1的區(qū)間內(nèi)占總面積的68.27%,在-1.96~+1.96的區(qū)間內(nèi)占總面積的95%;在-2.58~+2.58的區(qū)間內(nèi)占總面積的99%。157曲線下面積分布規(guī)律0-11-1.961.96-2.582.5868.27%95.00%99.00%μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%偏度系數(shù)和峰度系數(shù)正態(tài)分布的特征,歸納起來有兩點(diǎn):一是對(duì)稱性(symmetry)

若分布不對(duì)稱就是偏態(tài),長尾拖向右側(cè)(變量值較大的一側(cè))叫做正偏態(tài),或右偏態(tài);長尾拖向左側(cè)(變量值較小的一側(cè))叫做負(fù)偏態(tài),或左偏態(tài)。

二是正態(tài)峰(mesokurtosis)

峰態(tài)系數(shù)是描述隨機(jī)變量陡峭度的參數(shù),分為:正態(tài)峰、平闊峰、尖峭峰。159

a.尖峭峰

b.正態(tài)峰

c.平闊峰

正態(tài)分布:中間高、兩邊低、左右對(duì)稱正偏態(tài)分布:長尾向右延伸負(fù)偏態(tài)分布:長尾向左延伸常用的抽樣分布如果總體服從正態(tài)分布N(m,s2),則從該正態(tài)總體中抽取樣本,得到的樣本均數(shù)也服從正態(tài)分布,但該分布為N(m,s2/n

),此時(shí)的方差是總體的1/n倍,即有162中心極限定理如果總體不是正態(tài)總體,但其均數(shù)和標(biāo)準(zhǔn)差分別為μ和σ,則當(dāng)樣本含量n不斷增大時(shí),樣本均數(shù)的分布也趨近于正態(tài)分布,且其均數(shù)為μ,標(biāo)準(zhǔn)差為不論總體的分布形式如何,只要樣本含量n足夠大時(shí),樣本均數(shù)的分布就近似正態(tài)分布,此稱為中心極限定理。

163常用的三種抽樣分布一、分布二、t分布三、F

分布164均為連續(xù)型隨機(jī)變量分布,分布只與自由度,即樣本含量有關(guān)(一)、2分布

(也稱樣本方差的分布)165對(duì)于來自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)

2分布,即2分布(2distribution)由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導(dǎo)出來設(shè),則令,則Y服從自由度為1的2分布,即

當(dāng)總體,從中抽取容量為n的樣本,則1662分布的性質(zhì)和特點(diǎn)分布的變量值始終為正

分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布167c2分布(圖示)168

選擇容量為n的簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差S2計(jì)算卡方值2=(n-1)S2/σ2計(jì)算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20

ms總體1691701713.847.8112.59P=0.05的臨界值χ2分布(chi-squaredistribution)5.99172χ2分布

173χ2

f(χ2)

χ2分布曲線下的面積與概率174(二)

t分布(也稱Student分布)175

分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布Xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)Zt分布定義:設(shè)隨機(jī)變量X與Y獨(dú)立,且X服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),Y服從自由度為n

的分布,則稱統(tǒng)計(jì)量服從自由度為n的t分布,記為t~t(n)(2)t分布的概率密度為176177圖

不同自由度下的t分布圖t分布的特征

①以0為中心,左右對(duì)稱的單峰分布;

②t分布曲線是一簇曲線,其形態(tài)變化與自由度的大小有關(guān)。自由度越小,則t值越分散,曲線越低平;自由度逐漸增大時(shí),t分布逐漸逼近Z分布(標(biāo)準(zhǔn)正態(tài)分布);當(dāng)趨于∞時(shí),t分布即為Z分布。178179t界值表(附表3)1.8122.228-2.228tf(t)ν=10的t分布圖t分布曲線下面積雙側(cè)t0.05/2,9=2.262

=單側(cè)t0.025,9單側(cè)t0.05,9=1.833雙側(cè)t0.01/2,9=3.250

=單側(cè)t0.005,9單側(cè)t0.01,9=2.821雙側(cè)t0.05/2,∞=1.96

=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.64(三)

F分布(也稱兩個(gè)樣本方差比的抽樣分布)181

兩個(gè)總體都為正態(tài)分布,即X1~N(μ1,σ12)的一個(gè)樣本,Y1,Y2,…,Yn2是來自正態(tài)總體X2~N(μ2,σ22)從兩個(gè)總體中分別抽取容量為n1和n2的獨(dú)立樣本兩個(gè)樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1)F分布,即F分布(Fdistribution)由統(tǒng)計(jì)學(xué)家費(fèi)舍(R.A.Fisher)提出的,以其姓氏的第一個(gè)字母來命名則設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨(dú)立,則稱F為服從自由度n1和n2的F分布,記為182F分布曲線183四、樣本指標(biāo)分布律的應(yīng)用范圍

大樣本:通常將的樣本稱為大樣本小樣本:通常將的樣本稱為小樣本在大樣本下:當(dāng)總體分布為正態(tài)分布,則樣本指標(biāo)的分布也采用正態(tài)分布,即用Z分布來進(jìn)行統(tǒng)計(jì)推斷。當(dāng)總體分布為二項(xiàng)分布(n很大,P有很小),即當(dāng)時(shí),則樣本指標(biāo)的分布采用泊松分布來進(jìn)行統(tǒng)計(jì)推斷。反之,當(dāng)時(shí),可用正態(tài)分布近似代替二項(xiàng)分布,則樣本指標(biāo)的分布采用正態(tài)分布來進(jìn)行統(tǒng)計(jì)推斷。184在小樣本下:當(dāng)總體分布為正態(tài)分布,而總體方差已知,則樣本指標(biāo)的分布應(yīng)采用正態(tài)分布,即用Z分布來進(jìn)行統(tǒng)計(jì)推斷。當(dāng)總體分布為二項(xiàng)分布(n很小)時(shí),則樣本指標(biāo)的分布需要直接用二項(xiàng)分布來進(jìn)行統(tǒng)計(jì)推斷。其他當(dāng)總體分布為正態(tài)分布,而總體方差未知,則樣本指標(biāo)相應(yīng)地可采用t分布,分布和F分布來進(jìn)行統(tǒng)計(jì)推斷。185五、幾種后繼章節(jié)常用的統(tǒng)計(jì)量Z統(tǒng)計(jì)量:設(shè)是一個(gè)隨機(jī)變量,則Z應(yīng)服從N(0,1),記作186五、幾種后面常用的統(tǒng)計(jì)量t統(tǒng)計(jì)量:設(shè)是一個(gè)隨機(jī)變量,由于未知,而用估計(jì),則t應(yīng)服從k=n-1的t分布。187五、幾種后面常用的統(tǒng)計(jì)量統(tǒng)計(jì)量:設(shè)是一個(gè)隨機(jī)變量,則應(yīng)服從k=n-1的分布。188常用統(tǒng)計(jì)軟件統(tǒng)計(jì)分析軟件是數(shù)據(jù)分析的主要工具完整的數(shù)據(jù)分析過程包括:數(shù)據(jù)的收集數(shù)據(jù)的整理數(shù)據(jù)的分析結(jié)果的解釋和推論統(tǒng)計(jì)學(xué)為數(shù)據(jù)分析過程提供一套完整的科學(xué)的方法論。統(tǒng)計(jì)軟件為數(shù)據(jù)分析提供了實(shí)現(xiàn)手段。189統(tǒng)計(jì)分析軟件的一般特點(diǎn)功能全面,系統(tǒng)地集成了多種成熟的統(tǒng)計(jì)分析方法;有完善的數(shù)據(jù)定義、操作和管理功能;方便地生成各種統(tǒng)計(jì)圖形和統(tǒng)計(jì)表格;使用方式簡(jiǎn)單,有完備的聯(lián)機(jī)幫助功能;軟件開放性好,能方便地和其他軟件進(jìn)行數(shù)據(jù)交換。190常用統(tǒng)計(jì)軟件簡(jiǎn)介SAS--真正的巨無霸。被譽(yù)為國際上的標(biāo)準(zhǔn)統(tǒng)計(jì)軟件和最權(quán)威的組合式優(yōu)秀統(tǒng)計(jì)軟件。人機(jī)對(duì)話界面太不友好圖形操作界面比較欠缺一切圍繞編程設(shè)計(jì)學(xué)習(xí)起來較困難(編程)說明書不容易讀懂價(jià)格昂貴191常用統(tǒng)計(jì)軟件簡(jiǎn)介SPSS(Ver13)--統(tǒng)計(jì)軟件中的貴族操作界面極為友好所有統(tǒng)計(jì)軟件中最友好的精心設(shè)計(jì)的圖形操作界面美觀的結(jié)果輸出強(qiáng)大的輔助教學(xué)功能輸出結(jié)果與中文WORD尚存在一定兼容問題在國內(nèi)深受歡迎,特別是市場(chǎng)調(diào)研行業(yè)在歐洲各研究機(jī)構(gòu)中得到廣泛應(yīng)用192常用統(tǒng)計(jì)軟件簡(jiǎn)介S-Plus(Ver6)S語言(AT&T貝爾實(shí)驗(yàn)室)的后續(xù)發(fā)展極為強(qiáng)大的統(tǒng)計(jì)功能和繪圖能力應(yīng)用上以理論研究、統(tǒng)計(jì)建模為主需要有較好的數(shù)理統(tǒng)計(jì)背景對(duì)編程能力要求極高193常用統(tǒng)計(jì)軟件簡(jiǎn)介Stata(Ver7)軟件小巧繪圖美觀統(tǒng)計(jì)分析能力極強(qiáng)數(shù)據(jù)接口差不提供對(duì)話框界面,命令行方式操作194國產(chǎn)統(tǒng)計(jì)軟件的佼佼者-DPS(v6.05)一套通用多功能數(shù)據(jù)處理、數(shù)值計(jì)算、統(tǒng)計(jì)分析和模型建立軟件;較強(qiáng)的統(tǒng)計(jì)分析和數(shù)學(xué)模型模擬分析功能;是目前國內(nèi)功能最完整的統(tǒng)計(jì)軟件包。自稱:DPS=Excel+SPSS網(wǎng)站地址195學(xué)習(xí)使用統(tǒng)計(jì)分析軟件的基本方法弄清分析的目的正確收集待處理和分析的數(shù)據(jù)(目的、影響因素的剔除)。弄清統(tǒng)計(jì)概念和統(tǒng)計(jì)含義,知道統(tǒng)計(jì)方法的適用范圍,無需記憶公式。選擇一種或幾種統(tǒng)計(jì)分析方法探索性地分析數(shù)據(jù)。讀懂計(jì)算機(jī)分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論