版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025年大學(xué)統(tǒng)計(jì)學(xué)期末考試:統(tǒng)計(jì)推斷與假設(shè)檢驗(yàn)試題考試時(shí)間:______分鐘總分:______分姓名:______一、選擇題(本大題共15小題,每小題2分,共30分。在每小題列出的四個(gè)選項(xiàng)中,只有一項(xiàng)是最符合題目要求的,請(qǐng)將正確選項(xiàng)字母填在題后的括號(hào)內(nèi)。)1.小明老師,你想想啊,咱們統(tǒng)計(jì)學(xué)這門課,重點(diǎn)就是要教會(huì)學(xué)生怎么從數(shù)據(jù)里頭挖掘出點(diǎn)門道來,特別是統(tǒng)計(jì)推斷這塊兒。你瞧,這第一題,我就想考考大家對(duì)于總體參數(shù)估計(jì)這個(gè)基礎(chǔ)概念的掌握程度。某班級(jí)有50名學(xué)生,隨機(jī)抽取10名學(xué)生進(jìn)行身高測(cè)量,得到樣本平均身高為170厘米,標(biāo)準(zhǔn)差為5厘米。如果我們要用樣本均值來估計(jì)整個(gè)班級(jí)的平均身高,那么下面哪個(gè)選項(xiàng)最貼切地描述了這個(gè)估計(jì)量的性質(zhì)呢?A選項(xiàng)是說這個(gè)估計(jì)量一定等于總體均值,這顯然不對(duì),咱們只是抽樣估計(jì),哪能那么準(zhǔn)呢?B選項(xiàng)說這個(gè)估計(jì)量是總體均值的唯一估計(jì)方法,這也不對(duì),方法多著呢!D選項(xiàng)說這個(gè)估計(jì)量是總體均值的最大似然估計(jì),這倒是對(duì)的,但在小樣本情況下,我們更常用的是無偏估計(jì)。所以,小明老師覺得,C選項(xiàng)——這個(gè)估計(jì)量是總體均值的無偏估計(jì)——才是最符合咱們這題情境的答案。大家想想,無偏估計(jì)意味著什么呢?就是多次抽樣得到的樣本均值,平均來看是等于總體均值的,這就像咱們拿尺子量一堵墻,量十次,平均下來,誤差正負(fù)都可能有,但長(zhǎng)期看,平均值是墻的真正長(zhǎng)度。所以啊,選C。2.小明老師,咱們接著往下看,這統(tǒng)計(jì)推斷里頭,假設(shè)檢驗(yàn)可是個(gè)重頭戲。你想想,咱們?cè)趺粗酪粋€(gè)新藥是不是真比老藥效果好呢?或者咱們的生產(chǎn)線是不是真的穩(wěn)定了?都得靠假設(shè)檢驗(yàn)啊。來,看這第二題,咱們假設(shè)某個(gè)燈泡廠生產(chǎn)的燈泡壽命服從正態(tài)分布,以往經(jīng)驗(yàn)顯示均值壽命是1500小時(shí)?,F(xiàn)在,廠里改進(jìn)了工藝,隨機(jī)抽取了25個(gè)燈泡進(jìn)行檢測(cè),發(fā)現(xiàn)樣本平均壽命為1530小時(shí),樣本標(biāo)準(zhǔn)差為100小時(shí)。如果我們要檢驗(yàn)新工藝是否真的提高了燈泡壽命,應(yīng)該采用什么檢驗(yàn)方法呢?小明老師覺得啊,首先,咱們得明確檢驗(yàn)的原假設(shè)和備擇假設(shè)。原假設(shè),H0,就是咱們默認(rèn)沒變化,燈泡壽命還是1500小時(shí);備擇假設(shè),H1,就是新工藝起了作用,壽命提高了。你看這備擇假設(shè)是“壽命提高”,是個(gè)“大于”的關(guān)系,所以這是一個(gè)單尾檢驗(yàn)。其次,咱們知道總體方差是未知的,樣本量也不算特別大(25個(gè)),所以按照咱們學(xué)的知識(shí),應(yīng)該使用t檢驗(yàn),而不是z檢驗(yàn)。z檢驗(yàn)?zāi)鞘强傮w方差已知或者樣本量很大的時(shí)候用的。所以啊,小明老師判斷,這題的正確選項(xiàng)應(yīng)該是D——使用單尾t檢驗(yàn)。大家想想,t檢驗(yàn)是不是更像咱們拿著尺子量,雖然知道墻大概長(zhǎng)多少,但尺子本身可能還有點(diǎn)誤差,得用t分布這個(gè)更寬容一點(diǎn)的尺子來衡量咱們的樣本均值和原假設(shè)值之間差得“夠不夠離譜”。單尾檢驗(yàn),就是咱們特別關(guān)注壽命是不是“提高了”,而不是亂七八糟的變化。3.小明老師,你瞧,這第三題,又回到了咱們參數(shù)估計(jì)這塊兒。咱們知道,點(diǎn)估計(jì)挺直接的,但有時(shí)候它太扎眼了,不夠穩(wěn)當(dāng),這時(shí)候就得用區(qū)間估計(jì)來“兜個(gè)底”了。假設(shè)我們想估計(jì)一個(gè)城市成年男性的平均體重,隨機(jī)抽取了100名成年男性,測(cè)得樣本平均體重為70公斤,樣本標(biāo)準(zhǔn)差為10公斤。如果我們想要95%的置信水平來估計(jì)這個(gè)城市成年男性的平均體重,那么置信區(qū)間的上下限大概是多少呢?小明老師提醒大家,計(jì)算置信區(qū)間,得知道臨界值、樣本均值、樣本標(biāo)準(zhǔn)差和樣本量。95%的置信水平,意味著咱們犯第二類錯(cuò)誤的概率(也就是沒發(fā)現(xiàn)真問題,以為沒問題的概率)是5%,對(duì)于正態(tài)分布或者大樣本t分布,這個(gè)臨界值就是1.96(或者查t表,但100個(gè)樣本,t值和z值差不多)。所以,上限就是70+1.96*(10/sqrt(100))=70+1.96*1=71.96公斤;下限就是70-1.96*1=68.04公斤。所以,小明老師覺得,C選項(xiàng)——(68.04,71.96)公斤這個(gè)區(qū)間——最符合95%置信水平的估計(jì)結(jié)果。大家想想,這個(gè)區(qū)間告訴我們什么?它告訴我們,如果咱們反復(fù)抽樣,每次都算一個(gè)這樣的區(qū)間,大概有95%的區(qū)間會(huì)正好套住真實(shí)的總體均值。這就像咱們打靶,雖然每次射擊的彈著點(diǎn)不一樣,但咱們說有95%的把握,彈著點(diǎn)會(huì)在某個(gè)區(qū)域里。這個(gè)區(qū)間越窄,說明咱們估計(jì)越精確,但置信水平可能就得降低;區(qū)間越寬,咱們更保險(xiǎn),但估計(jì)就不那么精確了。4.小明老師,咱們繼續(xù)假設(shè)檢驗(yàn)的旅程。有時(shí)候啊,咱們面對(duì)的樣本量特別小,這時(shí)候用t檢驗(yàn)也得看樣本的分布是不是正態(tài)。如果樣本不滿足正態(tài)性假設(shè)呢?小明老師覺得,咱們可以考慮非參數(shù)檢驗(yàn)。看這第四題,咱們想檢驗(yàn)兩種不同教學(xué)方法對(duì)學(xué)生的考試成績(jī)是否有顯著影響,隨機(jī)抽取了8名學(xué)生,讓他們分別接受兩種不同的教學(xué)方法,一段時(shí)間后,他們的考試成績(jī)?nèi)缦拢▎挝唬悍郑旱谝环N方法:85,82,78,90,88,84,79,86;第二種方法:80,88,85,82,90,87,84,83。小明老師提醒大家,咱們的數(shù)據(jù)是成對(duì)出現(xiàn)的,也就是說,每個(gè)學(xué)生都接受了兩種方法,這叫配對(duì)樣本。咱們關(guān)心的是兩種方法下,學(xué)生成績(jī)的“差異”是否有顯著變化。這時(shí)候,咱們首先得計(jì)算每對(duì)數(shù)據(jù)的差值:5,6,7,8,-2,-3,-5,3。你看這差值,分布好像不太像正態(tài)分布,特別是有幾個(gè)負(fù)的差值,樣本量也小。如果咱們強(qiáng)行用t檢驗(yàn),結(jié)果可能不太靠譜。這時(shí)候,小明老師覺得,用非參數(shù)檢驗(yàn)更穩(wěn)妥,比如符號(hào)檢驗(yàn)或者Wilcoxon符號(hào)秩檢驗(yàn)。符號(hào)檢驗(yàn)只看差值的正負(fù)符號(hào),不考慮差值大??;Wilcoxon符號(hào)秩檢驗(yàn)則考慮了差值的大小,但不用正態(tài)分布假設(shè)??紤]到咱們有差值的大小信息,小明老師傾向于選Wilcoxon符號(hào)秩檢驗(yàn),它比符號(hào)檢驗(yàn)更精細(xì)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是B——使用Wilcoxon符號(hào)秩檢驗(yàn)。大家想想,非參數(shù)檢驗(yàn)是不是就像咱們不用尺子精確量長(zhǎng)度,而是用眼睛估估,這堵墻是變長(zhǎng)了還是變短了,雖然精度不高,但至少不依賴尺子準(zhǔn)不準(zhǔn)、線是不是直這種前提條件。5.小明老師,咱們來看第五題,這題考考大家對(duì)假設(shè)檢驗(yàn)中p值這個(gè)概念的理解。小明老師給大家講講p值吧,它可重要了!p值告訴你,如果原假設(shè)是真的,那么你觀察到這么極端(或者更極端)的樣本結(jié)果的可能性有多大。p值越小,說明你的樣本結(jié)果越不容易在原假設(shè)成立的情況下出現(xiàn),所以你越有理由拒絕原假設(shè)??搭},咱們假設(shè)一批產(chǎn)品的次品率不大于2%(原假設(shè)H0:p≤0.02),現(xiàn)在隨機(jī)抽查了200件產(chǎn)品,發(fā)現(xiàn)其中有6件是次品。如果咱們使用顯著性水平α=0.05來檢驗(yàn),那么這個(gè)檢驗(yàn)的p值大概是多少呢?小明老師覺得啊,咱們先算個(gè)樣本次品率,6/200=0.03。然后,假設(shè)次品率真的不大于2%,咱們看看抽到6個(gè)次品的概率有多大。這可以用二項(xiàng)分布或者正態(tài)近似來算。用正態(tài)近似,咱們計(jì)算標(biāo)準(zhǔn)正態(tài)分布的Z值,Z=(0.03-0.02)/sqrt(0.02*(1-0.02)/200)≈0.57。查標(biāo)準(zhǔn)正態(tài)分布表,或者用計(jì)算器,P(Z>0.57)≈0.2843。因?yàn)樵蹅兪菃挝矙z驗(yàn)(次品率“大于”2%),所以p值就是0.2843。小明老師覺得,這個(gè)p值明顯大于0.05的顯著性水平,所以咱們沒有足夠的證據(jù)拒絕原假設(shè)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是A——p值大于0.05。大家想想,p值是咱們做決定的一個(gè)量化依據(jù)。0.2843這個(gè)p值,意味著啊,就算這批產(chǎn)品的次品率真的只有2%,咱們隨機(jī)抽查200件,碰上6件甚至更多次品的可能性也還有差不多28.43%。這概率不算小吧?所以,小明老師覺得,咱們沒理由認(rèn)為次品率真的超過2%了。6.小明老師,咱們繼續(xù)假設(shè)檢驗(yàn)。這第六題,考察的是兩總體均值比較。小明老師記得,咱們學(xué)過獨(dú)立樣本t檢驗(yàn),就是兩組數(shù)據(jù)是互相獨(dú)立的。還有一種情況呢,就是兩組數(shù)據(jù)是相關(guān)的,比如同一個(gè)學(xué)生在兩種不同條件下測(cè)量的成績(jī)。這叫配對(duì)樣本t檢驗(yàn)??搭},為了比較兩種不同廣告方案的效果,隨機(jī)抽取了20位消費(fèi)者,讓他們先接觸第一種廣告方案,然后接觸第二種廣告方案,之后測(cè)量他們對(duì)兩種廣告的偏好評(píng)分(評(píng)分越高代表越偏好),數(shù)據(jù)如下:第一種廣告評(píng)分:75,80,78,82,85,77,79,81,83,76,84,80,78,82,77,79,81,83,76,84;第二種廣告評(píng)分:78,82,80,83,86,79,81,83,85,77,85,81,80,84,80,81,83,85,78,86。小明老師覺得啊,咱們關(guān)心的是兩種廣告方案下,消費(fèi)者的平均偏好評(píng)分是否有顯著差異。因?yàn)槊總€(gè)消費(fèi)者都接觸了兩種廣告,評(píng)分是成對(duì)比較的,所以這是典型的配對(duì)樣本t檢驗(yàn)。咱們先計(jì)算每對(duì)數(shù)據(jù)的差值,然后對(duì)差值進(jìn)行t檢驗(yàn)。計(jì)算差值(第二種減第一種):3,2,2,1,1,2,2,2,2,1,1,1,2,2,3,2,2,2,2,2。計(jì)算差值的樣本均值(大約1.4)和樣本標(biāo)準(zhǔn)差(大約0.9),然后計(jì)算t統(tǒng)計(jì)量,再查t分布表(自由度是19)。小明老師算了一下(或者讓學(xué)生用計(jì)算器/軟件算),t值大概在2.1左右,查表得p值大概在0.05附近。因?yàn)閜值接近顯著性水平0.05,如果咱們定0.05作為閾值,結(jié)果可能就在臨界點(diǎn)上,有點(diǎn)懸。但通常來說,如果p值小于或等于0.05,咱們就拒絕原假設(shè)。這里p值接近0.05,說明有弱弱的證據(jù)表明兩種廣告效果有差異,但不能完全肯定。但按標(biāo)準(zhǔn)選擇題,可能需要一個(gè)明確的選項(xiàng)。小明老師傾向于認(rèn)為,由于p值非常接近0.05,有些教材或老師可能會(huì)認(rèn)為達(dá)到了顯著性水平,所以選一個(gè)表示“有顯著差異”的選項(xiàng),比如D。但也要看具體教學(xué)要求,如果嚴(yán)格按0.05,可能就選“無顯著差異”。這里小明老師就選D吧,體現(xiàn)一點(diǎn)差異性。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是D——兩種廣告方案的偏好評(píng)分有顯著差異。大家想想,配對(duì)樣本t檢驗(yàn)是不是特別適合這種“前后對(duì)比”或者“配對(duì)比較”的情況?就像咱們測(cè)自己學(xué)英語前后的成績(jī),或者比較左手和右手的力量,這種一對(duì)一的比較,用配對(duì)t檢驗(yàn)最合適不過了。7.小明老師,咱們來看第七題,這題稍微有點(diǎn)繞,考察的是抽樣分布的基礎(chǔ)。咱們知道,樣本均值的抽樣分布,它的均值等于總體均值,標(biāo)準(zhǔn)差(也叫標(biāo)準(zhǔn)誤)是總體標(biāo)準(zhǔn)差除以樣本量的平方根??搭},已知總體X服從正態(tài)分布N(μ,16),從中隨機(jī)抽取樣本量為25的樣本,那么樣本均值X?的抽樣分布的方差是多少呢?小明老師覺得啊,首先,總體是正態(tài)分布,不管樣本量大不大,樣本均值的抽樣分布都是正態(tài)的。其次,總體方差是16,樣本量是25。所以,樣本均值的標(biāo)準(zhǔn)誤(也就是抽樣分布的標(biāo)準(zhǔn)差)是sqrt(16/25)=4/5=0.8。那么,抽樣分布的方差就是標(biāo)準(zhǔn)誤的平方,即0.8*0.8=0.64。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是C——0.64。大家想想,標(biāo)準(zhǔn)誤0.8是個(gè)啥意思呢?它就像咱們拿著尺子量墻,雖然尺子有誤差,但多次測(cè)量結(jié)果的平均值的標(biāo)準(zhǔn)差,就是0.8。這個(gè)0.8告訴我們,咱們估計(jì)的樣本均值,大概會(huì)偏離總體均值0.8個(gè)單位。方差0.64,就是0.8的平方,反映了這種偏離的程度。樣本量越大,標(biāo)準(zhǔn)誤越小,咱們估計(jì)就越精確,抽樣分布就越“聚攏”在總體均值附近。8.小明老師,咱們接著考考大家對(duì)置信區(qū)間理解的實(shí)際應(yīng)用。小明老師記得,置信區(qū)間的寬度,跟幾個(gè)因素有關(guān):置信水平、樣本量、總體標(biāo)準(zhǔn)差??催@第八題,咱們想估計(jì)一批零件的平均長(zhǎng)度,希望置信水平越高越好,誤差越小越好。那么,在不改變樣本量的前提下,以下哪個(gè)措施最有可能使置信區(qū)間變窄呢?小明老師覺得啊,置信區(qū)間變窄,意味著咱們估計(jì)得更精確了。在不改變樣本量的情況下,能影響精度的,主要是置信水平和總體標(biāo)準(zhǔn)差。置信水平越高,臨界值越大(比如95%用1.96,99%用2.58),區(qū)間就越寬。所以,要想?yún)^(qū)間變窄,就要降低置信水平。但是題目說“希望置信水平越高越好”,所以降低置信水平肯定不行。那只能是減小總體標(biāo)準(zhǔn)差了。怎么減小總體標(biāo)準(zhǔn)差呢?比如改進(jìn)生產(chǎn)流程,讓零件做得更一致,波動(dòng)更小。但題目沒給這個(gè)選項(xiàng)。那小明老師就考慮,在所有選項(xiàng)里,哪個(gè)更能“縮小區(qū)間寬度”這個(gè)概念。是不是選“提高樣本量”?不對(duì),題目說了“不改變樣本量”。是不是選“降低置信水平”?不行。那是不是選“使用更大的樣本均值”?樣本均值影響的是區(qū)間的中心,不影響寬度。小明老師覺得,這里可能出題人有點(diǎn)繞,但最符合“不改變樣本量”前提下,能讓區(qū)間變窄的,可能是指“總體方差變小了”,因?yàn)榉讲钚×耍瑯?biāo)準(zhǔn)誤就小了,區(qū)間自然就窄了。但這個(gè)選項(xiàng)可能不明確。如果非要從現(xiàn)有選項(xiàng)里選,小明老師覺得,可能題目本身有點(diǎn)問題,或者暗示了樣本均值計(jì)算得更準(zhǔn)了?這題有點(diǎn)繞,小明老師暫時(shí)沒找到最合適的選項(xiàng),如果必須選,可能需要看具體選項(xiàng)內(nèi)容。不過,考察核心概念,寬度由置信水平、標(biāo)準(zhǔn)誤決定,標(biāo)準(zhǔn)誤由標(biāo)準(zhǔn)差和樣本量決定。所以,降低置信水平或降低標(biāo)準(zhǔn)差或增大樣本量可窄。題目限制了增大樣本量和降低置信水平。剩下的就是減小標(biāo)準(zhǔn)差。這題可能有點(diǎn)瑕疵。9.小明老師,咱們來看第九題,這題考考大家對(duì)樣本量確定的理解。小明老師記得,確定樣本量,主要是考慮咱們想達(dá)到的精度(區(qū)間寬度)和置信水平,還得知道或者能估計(jì)出總體標(biāo)準(zhǔn)差??搭},咱們想估計(jì)一個(gè)城市居民對(duì)某項(xiàng)政策的支持率,要求估計(jì)的誤差范圍不超過3個(gè)百分點(diǎn),置信水平為95%。如果我們用歷史數(shù)據(jù)估計(jì),該政策的支持率的標(biāo)準(zhǔn)誤(基于比例的標(biāo)準(zhǔn)誤sqrt(p(1-p)/n))大約為2%。那么,根據(jù)這些信息,小明老師幫你算算,大概需要抽取多少居民樣本呢?小明老師覺得啊,咱們用公式來算。對(duì)于比例,誤差范圍E=3%,置信水平95%,查Z表得臨界值Z=1.96。標(biāo)準(zhǔn)誤σp=2%。根據(jù)公式n=(Z^2*σp^2)/E^2,代入數(shù)值:n=(1.96^2*2%^2)/3%^2=(3.8416*0.0004)/0.0009≈0.001536/0.0009≈1.706。小明老師覺得,樣本量必須是整數(shù),而且咱們要保證精度,所以得向上取整。這個(gè)1.706有點(diǎn)小,是不是計(jì)算哪里錯(cuò)了?再算一遍:(1.96^2*0.0004)/0.0009=(3.8416*0.0004)/0.0009=1.536/0.0009≈1706.67。向上取整,需要1711個(gè)樣本。小明老師覺得,這個(gè)樣本量有點(diǎn)大啊,是不是標(biāo)準(zhǔn)誤2%算高了?或者題目給的條件本身就不太現(xiàn)實(shí)?不管怎么說,根據(jù)公式計(jì)算出來的結(jié)果就是這樣。所以,小明老師認(rèn)為,這題的正確選項(xiàng)應(yīng)該是D——需要抽取大約1711個(gè)居民樣本。大家想想,樣本量確定這事兒,挺重要的。樣本量太大,浪費(fèi)資源;樣本量太小,結(jié)果不靠譜。怎么平衡精度、置信水平和成本,得好好琢磨琢磨。10.小明老師,咱們來看第十題,這題考察的是置信區(qū)間的理解。小明老師覺得啊,置信區(qū)間是個(gè)挺重要的概念,它告訴咱們估計(jì)的范圍和把握程度??搭},我們從某廠生產(chǎn)的燈泡中隨機(jī)抽取了36個(gè)燈泡,測(cè)得樣本平均壽命為1500小時(shí),樣本標(biāo)準(zhǔn)差為150小時(shí)。據(jù)此,我們構(gòu)造了一個(gè)95%的置信區(qū)間來估計(jì)這批燈泡的平均壽命。那么,這個(gè)置信區(qū)間的含義是什么呢?小明老師覺得,95%的置信區(qū)間,比如說是(1450,1550)小時(shí),它的含義應(yīng)該是這樣的:如果咱們反復(fù)抽樣,每次都構(gòu)造一個(gè)這樣的(樣本均值-臨界值*標(biāo)準(zhǔn)誤,樣本均值+臨界值*標(biāo)準(zhǔn)誤)區(qū)間,那么平均來說,有95%的這些區(qū)間會(huì)正好包含真實(shí)的總體平均壽命。換句話說,對(duì)于當(dāng)前這個(gè)特定的區(qū)間(1450,1550),咱們有95%的信心認(rèn)為,真實(shí)的總體平均壽命就在這個(gè)區(qū)間里。它不是“有95%的概率這個(gè)區(qū)間包含真值”,也不是“如果重復(fù)100次抽樣,有95次區(qū)間包含真值”,更不是“真值有95%的可能性在1450到1550之間”。后兩種說法都把概率和參數(shù)混淆了,參數(shù)是固定的,我們估計(jì)的是參數(shù)。所以,小明老師覺得,這題的正確選項(xiàng)應(yīng)該是B——如果反復(fù)抽樣,構(gòu)造很多這樣的置信區(qū)間,那么平均有95%的區(qū)間會(huì)包含真實(shí)的總體平均壽命。大家想想,這就像咱們打靶,雖然每次彈著點(diǎn)不同,但咱們說有95%的把握,彈著點(diǎn)會(huì)在某個(gè)區(qū)域里。這個(gè)區(qū)域,就是置信區(qū)間。咱們對(duì)“這個(gè)區(qū)域”有95%的信心。11.小明老師,咱們來看第十一題,這題考考對(duì)假設(shè)檢驗(yàn)中兩類錯(cuò)誤的理解。小明老師記得,拒絕原假設(shè),可能犯第一類錯(cuò)誤(α),不拒絕原假設(shè),可能犯第二類錯(cuò)誤(β)。看題,在某個(gè)假設(shè)檢驗(yàn)中,如果咱們?cè)O(shè)定的顯著性水平α是0.05,那么這意味著什么呢?小明老師覺得,這意味著什么呢?這意味著,即使原假設(shè)是真的,咱們由于樣本的隨機(jī)性,錯(cuò)誤地拒絕了原假設(shè)的概率最多是5%。換句話說,咱們控制住了“以真為假”的錯(cuò)誤發(fā)生的風(fēng)險(xiǎn),在5%以內(nèi)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)應(yīng)該是A——犯第一類錯(cuò)誤的概率最多是5%。大家想想,α就像是咱們?cè)O(shè)定的“門檻”,樣本結(jié)果得多極端,才夠資格讓咱們懷疑原假設(shè)。如果樣本結(jié)果沒過這個(gè)極端門檻,即使原假設(shè)是假的(咱們沒發(fā)現(xiàn)),咱們也忍了,不犯第一類錯(cuò)誤。如果樣本結(jié)果過了這個(gè)門檻,咱們就拒絕了原假設(shè),這時(shí)候如果運(yùn)氣不好,碰巧原假設(shè)其實(shí)是真的,那咱們就犯了一個(gè)第一類錯(cuò)誤。α就是咱們?cè)敢獬袚?dān)這種“冤枉好人”的風(fēng)險(xiǎn)上限。12.小明老師,咱們繼續(xù)看第十二題,這題考察的是統(tǒng)計(jì)推斷方法的選擇。小明老師覺得啊,選擇哪種統(tǒng)計(jì)推斷方法,得看咱們研究的問題是什么,數(shù)據(jù)的類型是什么,樣本的條件是什么??搭},咱們想比較兩個(gè)獨(dú)立治療組(比如治療組A和治療組B)在某個(gè)指標(biāo)上的平均效果是否有差異。我們收集了兩個(gè)獨(dú)立樣本的數(shù)據(jù),但不知道總體分布是否正態(tài),樣本量也比較?。ū热缰委熃MA有15個(gè)病人,治療組B有18個(gè)病人)。在這種情況下,小明老師覺得,首先,因?yàn)槭莾蓚€(gè)獨(dú)立樣本,不是配對(duì)樣本。其次,樣本量不大,而且不知道總體分布。這時(shí)候,如果咱們能假設(shè)兩個(gè)總體的方差是相等的(可以先用F檢驗(yàn)或者Levene檢驗(yàn)來檢驗(yàn)),那么可以使用兩獨(dú)立樣本t檢驗(yàn)(PooledVariancet-test)。但如果咱們不能假設(shè)方差相等,或者不確定是否相等,那就得用Welch'st-test(不等方差t檢驗(yàn))。這兩個(gè)都是t檢驗(yàn),因?yàn)闃颖玖坎淮?,t檢驗(yàn)比z檢驗(yàn)更合適。但是,如果咱們連總體是否正態(tài)都不確定,而且樣本量又小,t檢驗(yàn)的結(jié)果就很不穩(wěn)定,可能不靠譜。這時(shí)候,最穩(wěn)妥的選擇就是非參數(shù)檢驗(yàn)。比如Mann-WhitneyU檢驗(yàn)(也叫WilcoxonRank-Sum檢驗(yàn)),它不需要正態(tài)性假設(shè),只比較兩個(gè)分布的位置(哪個(gè)分布的數(shù)值更大)。所以,小明老師認(rèn)為,在這種情況下,最推薦的方法是Mann-WhitneyU檢驗(yàn)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)應(yīng)該是C——使用Mann-WhitneyU檢驗(yàn)。大家想想,非參數(shù)檢驗(yàn)是不是像咱們不用尺子精確量長(zhǎng)度,而是用眼睛估估,這組數(shù)據(jù)是不是整體上比另一組數(shù)據(jù)“強(qiáng)”或者“弱”,雖然不知道具體差多少,但能知道個(gè)大概趨勢(shì)。當(dāng)數(shù)據(jù)不滿足參數(shù)檢驗(yàn)的條件時(shí),非參數(shù)檢驗(yàn)就是咱們的“救命稻草”。13.小明老師,咱們來看第十三題,這題考考對(duì)p值大小與結(jié)論關(guān)系的理解。小明老師覺得啊,p值是咱們做統(tǒng)計(jì)推斷的關(guān)鍵依據(jù)。看題,在一次假設(shè)檢驗(yàn)中,計(jì)算得到的p值是0.03。如果咱們?cè)O(shè)定的顯著性水平α是0.05,那么我們應(yīng)該得出什么結(jié)論呢?小明老師覺得,p值0.03,小于顯著性水平α0.05,這意味著什么呢?這意味著,如果原假設(shè)是真的,那么咱們觀察到這么極端(或者更極端)的樣本結(jié)果的概率只有3%。這個(gè)概率小于咱們能容忍的“冤枉好人”的概率(5%)。所以,小明老師認(rèn)為,咱們有足夠的統(tǒng)計(jì)證據(jù)拒絕原假設(shè)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)應(yīng)該是D——拒絕原假設(shè)。大家想想,p值小于0.05,就像咱們打靶,中靶的概率小于5%,如果真中了,咱們就有理由相信這槍打得不錯(cuò),不是隨便胡亂射的。同樣,p值小于0.05,咱們就有理由相信咱們的樣本結(jié)果不是“碰巧”發(fā)生的,而是反映了某種真實(shí)的差異或效應(yīng)。14.小明老師,咱們來看第十四題,這題考察的是置信區(qū)間和假設(shè)檢驗(yàn)的關(guān)系。小明老師覺得啊,置信區(qū)間和假設(shè)檢驗(yàn),本質(zhì)上是一回事,只是表達(dá)方式不同??搭},咱們用95%的置信區(qū)間估計(jì)一個(gè)總體均值,得到了(100,110)這個(gè)區(qū)間。那么,關(guān)于原假設(shè)H0:μ=105(即總體均值等于105),我們能得出什么結(jié)論呢?小明老師覺得,根據(jù)置信區(qū)間的定義,如果咱們構(gòu)造的置信區(qū)間包含了原假設(shè)的值(這里是105),那么咱們就沒有足夠的證據(jù)拒絕原假設(shè)。換句話說,如果區(qū)間包含了105,就相當(dāng)于p值大于0.05。如果區(qū)間不包含105,就相當(dāng)于p值小于0.05。所以,小明老師看這個(gè)(100,110)區(qū)間,105正好在中間,屬于區(qū)間之內(nèi)。這意味著,如果咱們用95%的置信水平來檢驗(yàn)H0:μ=105,得到的結(jié)果將是不能拒絕原假設(shè)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)應(yīng)該是B——不能拒絕原假設(shè)H0。大家想想,這就像咱們畫一條線代表墻的“標(biāo)準(zhǔn)長(zhǎng)度”(105),然后咱們用尺子量了很多次,每次量得的長(zhǎng)度都在(100,110)這個(gè)范圍里波動(dòng)。既然尺子量得的長(zhǎng)度都離105不遠(yuǎn),咱們憑什么要斷定墻的真正長(zhǎng)度一定不是105呢?咱們可能就是認(rèn)為墻的長(zhǎng)度就是105,或者至少,咱們沒有足夠證據(jù)說它不是105。15.小明老師,咱們來看最后一題,第十五題,這題考考對(duì)總體方差未知時(shí)均值檢驗(yàn)方法的理解。小明老師覺得啊,這是統(tǒng)計(jì)推斷里最常見的情況之一,總體方差通常是未知的??搭},咱們想檢驗(yàn)一個(gè)包裝機(jī)的包裝重量是否符合標(biāo)準(zhǔn)(標(biāo)準(zhǔn)重量μ0),但不知道包裝重量的總體方差。為了檢驗(yàn)這個(gè)問題,隨機(jī)抽取了25個(gè)包裝件,測(cè)得樣本平均重量為50.5公斤,樣本標(biāo)準(zhǔn)差為0.8公斤。如果咱們想檢驗(yàn)包裝重量是否符合標(biāo)準(zhǔn)(μ=μ0),應(yīng)該使用什么檢驗(yàn)方法呢?小明老師覺得,首先,咱們檢驗(yàn)的是總體均值是否等于某個(gè)特定值(μ0)。其次,最重要的,總體方差是未知的。最后,樣本量25,不算特別小。在這種情況下,咱們唯一正確的選擇就是t檢驗(yàn)。用樣本標(biāo)準(zhǔn)差s來估計(jì)總體標(biāo)準(zhǔn)差σ,計(jì)算t統(tǒng)計(jì)量(X?-μ0)/(s/sqrt(n)),然后查t分布表(自由度是n-1)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)應(yīng)該是D——使用t檢驗(yàn)。大家想想,為什么不能用z檢驗(yàn)?因?yàn)閦檢驗(yàn)需要知道總體方差σ,但咱們不知道啊!這時(shí)候用樣本標(biāo)準(zhǔn)差s來替代σ,就會(huì)引入抽樣誤差,t分布就是為這種情況設(shè)計(jì)的,它比標(biāo)準(zhǔn)正態(tài)分布更“寬容”,考慮到這種不確定性。所以,當(dāng)總體方差未知時(shí),t檢驗(yàn)就是我們手中最可靠的武器。二、簡(jiǎn)答題(本大題共5小題,每小題6分,共30分。請(qǐng)將答案寫在答題卡上對(duì)應(yīng)的位置。)1.小明老師,你想想啊,咱們講點(diǎn)估計(jì)的時(shí)候,老師經(jīng)常說樣本均值是總體均值的一個(gè)無偏估計(jì)量。你能結(jié)合無偏估計(jì)的定義,簡(jiǎn)單解釋一下這句話是什么意思嗎?小明老師覺得啊,這得從統(tǒng)計(jì)量的期望值來說。一個(gè)估計(jì)量X?,如果它的期望值E(X?)等于它要估計(jì)的那個(gè)總體參數(shù)μ,那么咱們就說X?是μ的一個(gè)無偏估計(jì)量。這句話的意思是,如果我們反復(fù)抽樣,每次算一個(gè)樣本均值X?,然后把這些X?加起來,再除以抽樣次數(shù),得到的平均值,正好等于真實(shí)的總體均值μ。它就像咱們用尺子量一堵墻,尺子可能不準(zhǔn),有系統(tǒng)誤差,但尺子不準(zhǔn)不代表每次量出來的結(jié)果都偏大或者都偏小,平均下來,多次測(cè)量結(jié)果的平均值,能比較準(zhǔn)確地反映墻的真實(shí)長(zhǎng)度。所以,樣本均值這個(gè)“尺子”,雖然單次測(cè)量可能有誤差,但平均來看,是準(zhǔn)確的,不“偏向”任何一邊。這保證了用樣本均值來估計(jì)總體均值,從長(zhǎng)期來看是“公平”的。2.小明老師,咱們?cè)谥v假設(shè)檢驗(yàn)的時(shí)候,提到了顯著性水平α這個(gè)概念。你能用自己的話,簡(jiǎn)單解釋一下顯著性水平α是什么意思?小明老師覺得啊,顯著性水平α,就像是咱們?cè)诩僭O(shè)檢驗(yàn)這場(chǎng)“審判”中設(shè)定的“reasonabledoubt”(合理懷疑)的標(biāo)準(zhǔn)。咱們有兩個(gè)假設(shè),原假設(shè)H0(假設(shè)事情沒變,沒新意),備擇假設(shè)H1(假設(shè)事情有變化,有新意)。咱們得決定,看到什么樣的樣本證據(jù),才足夠讓我們“懷疑”并“拒絕”原假設(shè)H0。顯著性水平α,就代表了咱們?cè)敢獬袚?dān)的那種“冤枉好人”(也就是拒絕了H0,但H0其實(shí)是真的)的最大風(fēng)險(xiǎn)或者概率。比如α=0.05,咱們就愿意冒5%的風(fēng)險(xiǎn),犯了這種錯(cuò)誤。如果樣本結(jié)果算出的p值小于α,說明樣本結(jié)果太“極端”了,極端到即使H0是真的,發(fā)生的概率也只有那么一點(diǎn)點(diǎn)(比如小于5%),這就不太可能只是運(yùn)氣不好。這時(shí)候,咱們就有理由拒絕H0。如果p值大于α,說明樣本結(jié)果不那么極端,即使在H0真的情況下,這種結(jié)果發(fā)生的可能性還是挺大的(比如大于5%),那咱們就“沒有足夠證據(jù)”拒絕H0,只能暫時(shí)相信H0。所以,α就是咱們劃定的那個(gè)“證據(jù)足夠硬”的門檻,決定了咱們做決策的嚴(yán)格程度。3.小明老師,在實(shí)際應(yīng)用中,我們常常需要根據(jù)研究問題選擇合適的統(tǒng)計(jì)推斷方法。比如,比較兩組獨(dú)立樣本的均值時(shí),我們學(xué)習(xí)了獨(dú)立樣本t檢驗(yàn)。那么,獨(dú)立樣本t檢驗(yàn)適用于哪些基本條件呢?小明老師覺得啊,獨(dú)立樣本t檢驗(yàn),就是比較兩組來自不同總體的、互相獨(dú)立的樣本的均值差異。它主要依賴幾個(gè)條件:第一,兩組樣本是相互獨(dú)立的,也就是說,從第一組抽出來的樣本,不影響從第二組抽出來的樣本,反之亦然。第二,每個(gè)樣本都來自正態(tài)分布的總體。對(duì)于均值比較,正態(tài)分布是個(gè)挺強(qiáng)的假設(shè)。但是,當(dāng)樣本量足夠大(比如每組超過30個(gè)),根據(jù)中心極限定理,樣本均值的分布會(huì)趨向正態(tài),這時(shí)候?qū)傮w正態(tài)性的要求就不那么嚴(yán)格了。第三,兩個(gè)總體的方差相等(也叫同方差性)。也就是說,兩組樣本所來自的總體的標(biāo)準(zhǔn)差應(yīng)該差不多。如果不滿足這個(gè)條件,結(jié)果可能會(huì)有偏。所以,在做獨(dú)立樣本t檢驗(yàn)之前,得先檢查這些條件是否大致滿足。如果樣本量很大,正態(tài)性和方差相等的要求可以放寬;如果條件不滿足,可能就得考慮使用非參數(shù)檢驗(yàn),或者對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,或者使用不等方差t檢驗(yàn)(Welch'st-test)。4.小明老師,咱們知道,置信區(qū)間的寬度與幾個(gè)因素有關(guān)。請(qǐng)分別說明,在其他條件不變的情況下,增大樣本量、提高置信水平,會(huì)對(duì)置信區(qū)間的寬度產(chǎn)生什么影響?小明老師覺得啊,這得分別看。首先,增大樣本量。樣本量n越大,樣本均值的標(biāo)準(zhǔn)誤(σ/sqrt(n))就越小。因?yàn)榉帜竤qrt(n)變大了,整個(gè)分?jǐn)?shù)就變小了。標(biāo)準(zhǔn)誤小了,意味著樣本均值這個(gè)估計(jì)量更“集中”,圍繞總體均值的波動(dòng)更小。所以,用樣本均值加減一個(gè)固定倍數(shù)的標(biāo)準(zhǔn)誤來構(gòu)造的置信區(qū)間,寬度自然就變窄了。簡(jiǎn)單說,樣本量越大,咱們抽樣估計(jì)越精確,置信區(qū)間越窄。比如,用100個(gè)樣本算的區(qū)間,肯定比用10個(gè)樣本算的區(qū)間要窄。其次,提高置信水平。置信水平比如從90%提高到95%,意味著咱們要求有更高的把握程度,認(rèn)為區(qū)間包含了真實(shí)的總體參數(shù)。要達(dá)到更高的把握程度,置信區(qū)間的范圍就必須更寬。因?yàn)榕R界值(比如Z值或t值)變大了。臨界值越大,加減起來的那個(gè)“幅度”(臨界值*標(biāo)準(zhǔn)誤)就越大,置信區(qū)間的寬度自然就變寬了。簡(jiǎn)單說,咱們要求越保險(xiǎn)、越有把握,區(qū)間就拖得越長(zhǎng)。所以,置信水平越高,置信區(qū)間越寬。5.小明老師,假設(shè)我們想檢驗(yàn)一種新教學(xué)方法是否比傳統(tǒng)教學(xué)方法更能提高學(xué)生的數(shù)學(xué)成績(jī)。我們隨機(jī)抽取了40名學(xué)生,將他們隨機(jī)分成兩組,每組20人。一組使用新教學(xué)方法(實(shí)驗(yàn)組),另一組使用傳統(tǒng)教學(xué)方法(對(duì)照組)。一段時(shí)間后,我們分別測(cè)得兩組學(xué)生的平均數(shù)學(xué)成績(jī)和標(biāo)準(zhǔn)差如下:實(shí)驗(yàn)組:平均成績(jī)78分,標(biāo)準(zhǔn)差8分;對(duì)照組:平均成績(jī)73分,標(biāo)準(zhǔn)差9分。請(qǐng)問,在這種情況下,我們應(yīng)該使用哪種統(tǒng)計(jì)推斷方法來檢驗(yàn)這兩種教學(xué)方法的效果是否有顯著差異?為什么?小明老師覺得啊,這個(gè)問題得仔細(xì)分析。首先,咱們有兩個(gè)組,實(shí)驗(yàn)組和對(duì)照組,這是兩個(gè)獨(dú)立樣本。其次,我們關(guān)心的是兩組的平均成績(jī)是否有差異。所以,基本可以確定是兩總體均值比較的問題。但是,題目只給了均值和標(biāo)準(zhǔn)差,沒有說樣本量多大(雖然題目說了每組20人,但沒說這是原始樣本量還是計(jì)算了標(biāo)準(zhǔn)差后的樣本量,這有點(diǎn)小問題。不過我們按每組20人算)。關(guān)鍵是,題目沒說兩個(gè)總體的方差是否相等。如果咱們能比較肯定地說兩個(gè)總體的方差是相等的(比如通過前期研究或者理論分析知道方差差不多),那么可以使用兩獨(dú)立樣本t檢驗(yàn)(PooledVariancet-test),先合并計(jì)算一個(gè)共同的標(biāo)準(zhǔn)差,然后用這個(gè)標(biāo)準(zhǔn)差計(jì)算t統(tǒng)計(jì)量。但如果咱們不確定兩個(gè)總體的方差是否相等,或者通過檢驗(yàn)發(fā)現(xiàn)它們不相等,那就得使用不等方差t檢驗(yàn)(Welch'st-test),這種檢驗(yàn)不合并方差,直接用各自的方差和樣本量來計(jì)算t統(tǒng)計(jì)量。因?yàn)樵蹅儾恢揽傮w方差是否相等,也不知道原始樣本量(可能需要原始數(shù)據(jù)才能計(jì)算樣本方差),所以最穩(wěn)妥、最通用的方法是使用不等方差t檢驗(yàn)(Welch'st-test)。當(dāng)然,如果樣本量很大(比如都超過30),根據(jù)中心極限定理,樣本均值的分布會(huì)近似正態(tài),這時(shí)候?qū)傮w方差是否相等的敏感性會(huì)降低,即使用Pooledt檢驗(yàn),結(jié)果也差不太多。但按題目給的信息,最保險(xiǎn)的選擇是Welch'st-test。所以,小明老師認(rèn)為,應(yīng)該使用不等方差t檢驗(yàn)(Welch'st-test)來檢驗(yàn)這兩種教學(xué)方法的效果是否有顯著差異。因?yàn)椴恢揽傮w方差是否相等,需要用更穩(wěn)健的方法。三、小明老師,咱們接著聊聊假設(shè)檢驗(yàn)里的那些事兒。這題啊,是想考考大家對(duì)假設(shè)檢驗(yàn)結(jié)果解釋的理解??催@個(gè)場(chǎng)景:咱們想檢驗(yàn)一種新藥是否比現(xiàn)有藥物更有效地降低血壓。咱們把100名高血壓患者隨機(jī)分成兩組,每組50人。一組服用新藥(實(shí)驗(yàn)組),另一組服用現(xiàn)有藥物(對(duì)照組)。一個(gè)月后,咱們測(cè)得實(shí)驗(yàn)組的平均血壓降低了15毫米汞柱,標(biāo)準(zhǔn)差為5毫米汞柱;對(duì)照組的平均血壓降低了10毫米汞柱,標(biāo)準(zhǔn)差為6毫米汞柱?,F(xiàn)在,咱們進(jìn)行了獨(dú)立樣本t檢驗(yàn),得到的p值是0.03。如果咱們?cè)O(shè)定的顯著性水平α是0.05,那么對(duì)于這個(gè)檢驗(yàn)結(jié)果,以下哪種解釋是最恰當(dāng)?shù)模啃∶骼蠋熡X得啊,首先,咱們得看p值。p值是0.03,小于咱們?cè)O(shè)定的顯著性水平α0.05。這意味著什么呢?這意味著,如果新藥實(shí)際上和現(xiàn)有藥物效果一樣(也就是原假設(shè)H0是真的),那么咱們觀察到實(shí)驗(yàn)組平均血壓降低幅度(15mmHg)比對(duì)照組(10mmHg)大這么多的概率只有3%。這個(gè)概率小于咱們能容忍的“冤枉好人”的概率(5%)。所以,根據(jù)假設(shè)檢驗(yàn)的結(jié)論,當(dāng)p值小于α?xí)r,咱們應(yīng)該拒絕原假設(shè)H0。在這個(gè)例子中,拒絕H0就意味著咱們有足夠的統(tǒng)計(jì)證據(jù)認(rèn)為新藥的效果比現(xiàn)有藥物更好。所以,小明老師覺得,最恰當(dāng)?shù)慕忉寫?yīng)該是這樣的:有足夠的統(tǒng)計(jì)證據(jù)表明新藥比現(xiàn)有藥物更有效地降低血壓。大家想想,p值小于0.05,就像咱們打靶,中靶的概率小于5%,如果真中了,咱們就有理由相信這槍打得不錯(cuò),不是隨便胡亂射的。同樣,p值小于0.05,咱們就有理由相信咱們的樣本結(jié)果不是“碰巧”發(fā)生的,而是反映了新藥確實(shí)比老藥強(qiáng)。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。四、小明老師,咱們來看第四題,這題考察的是樣本量確定的理論基礎(chǔ)。小明老師記得,確定樣本量,主要是為了在給定的置信水平和顯著性水平下,達(dá)到想要的精度(比如誤差范圍)??搭},咱們想估計(jì)一個(gè)城市居民對(duì)某項(xiàng)政策的支持率,希望估計(jì)的誤差范圍(置信區(qū)間的半寬)不超過2個(gè)百分點(diǎn),置信水平為95%。如果我們用歷史數(shù)據(jù)估計(jì),該政策的支持率的標(biāo)準(zhǔn)誤(基于比例的標(biāo)準(zhǔn)誤sqrt/0.0004=0.00345424/0.0004=8.6356。向上取整,需要9個(gè)樣本。小明老師覺得,這個(gè)樣本量是不是有點(diǎn)小???是不是標(biāo)準(zhǔn)誤3%算高了?或者題目給的條件本身就不太現(xiàn)實(shí)?不管怎么說,根據(jù)公式計(jì)算出來的結(jié)果就是這樣。所以,小明老師認(rèn)為,這題的正確選項(xiàng)應(yīng)該是D——需要抽取大約9個(gè)居民樣本。大家想想,樣本量確定這事兒,挺重要的。樣本量太大,浪費(fèi)資源;樣本量太小,結(jié)果不靠譜。怎么平衡精度、置信水平和成本,得好好琢磨琢磨。雖然這個(gè)樣本量看起來很小,但題目給的條件(比如支持率標(biāo)準(zhǔn)誤3%)可能是個(gè)關(guān)鍵因素,現(xiàn)實(shí)中這個(gè)值可能需要根據(jù)經(jīng)驗(yàn)或小范圍預(yù)調(diào)查來估計(jì)。如果標(biāo)準(zhǔn)誤是3%,確實(shí)可能只需要9個(gè)樣本。這題可能在條件設(shè)定上讓老師覺得結(jié)果有點(diǎn)意外,但按公式計(jì)算,結(jié)果就是這樣。五、小明老師,咱們來看第五題,這題是綜合應(yīng)用題,考察對(duì)假設(shè)檢驗(yàn)全過程的理解。小明老師覺得啊,這種題最能看出學(xué)生是不是真的掌握了??催@個(gè)題目:咱們想檢驗(yàn)一種新的教學(xué)方法是否比傳統(tǒng)教學(xué)方法更能提高學(xué)生的數(shù)學(xué)成績(jī)。假設(shè)數(shù)學(xué)成績(jī)服從正態(tài)分布。我們隨機(jī)抽取了30名學(xué)生,將他們隨機(jī)分成兩組,每組15人。一組使用新教學(xué)方法(實(shí)驗(yàn)組),另一組使用傳統(tǒng)教學(xué)方法(對(duì)照組)。一段時(shí)間后,我們分別測(cè)得兩組學(xué)生的平均數(shù)學(xué)成績(jī)和標(biāo)準(zhǔn)差如下:實(shí)驗(yàn)組:平均成績(jī)75分,標(biāo)準(zhǔn)差8分;對(duì)照組:平均成績(jī)70分,標(biāo)準(zhǔn)差10分。請(qǐng)問,請(qǐng)按照假設(shè)檢驗(yàn)的標(biāo)準(zhǔn)步驟,完成以下任務(wù):根據(jù)你的檢驗(yàn)結(jié)論,請(qǐng)用通俗的語言解釋這個(gè)結(jié)果的實(shí)際意義。小明老師覺得啊,咱們得出結(jié)論是新方法確實(shí)更好,這個(gè)“更好”是多少呢?咱們看看均值差,實(shí)驗(yàn)組75分,對(duì)照組70分,高了5分。咱們用p值小于0.05來證明這個(gè)5分不是白來的,不是純屬巧合。這意味著什么呢?意味著,如果咱們大規(guī)模推廣新教學(xué)方法,很可能學(xué)生的平均成績(jī)會(huì)比傳統(tǒng)方法教出來的學(xué)生平均高5分左右。這5分,在數(shù)學(xué)成績(jī)里可能挺關(guān)鍵的,也許就能讓及格率提高不少。所以,小明老師通俗地解釋就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得想想,這5分在實(shí)際里頭到底有沒有用,但統(tǒng)計(jì)上講,咱們有證據(jù)說它確實(shí)有用。本次試卷答案如下:一、選擇題1.C無偏估計(jì)意味著樣本均值這個(gè)統(tǒng)計(jì)量在多次抽樣后,其平均值等于總體均值μ,即E(X?)=μ。換句話說,用樣本均值來估計(jì)總體均值,從長(zhǎng)期來看是“公平”的,不會(huì)系統(tǒng)性地高估或低估總體均值。比如,小明老師可以舉例,假設(shè)咱們想估計(jì)一個(gè)班級(jí)學(xué)生的平均身高,咱們隨機(jī)抽取了多個(gè)班級(jí),每次都算一個(gè)班級(jí)的平均身高,然后把這些平均身高加起來,再除以抽取的班級(jí)數(shù),得到的平均值,會(huì)非常接近這個(gè)學(xué)校所有學(xué)生的平均身高。這就體現(xiàn)了無偏估計(jì)的思想,樣本均值是個(gè)好估計(jì)量,因?yàn)樗鼪]有系統(tǒng)性的偏差。所以,這題的正確選項(xiàng)是C。2.D在小樣本(n<30)的情況下,如果不知道總體方差,應(yīng)該使用t檢驗(yàn)。因?yàn)閠檢驗(yàn)是用樣本標(biāo)準(zhǔn)差s來估計(jì)總體標(biāo)準(zhǔn)差σ,當(dāng)樣本量小的時(shí)候,樣本標(biāo)準(zhǔn)差s本身就有很大的抽樣誤差,這時(shí)候用t分布來計(jì)算t統(tǒng)計(jì)量,比用z分布更穩(wěn)健,因?yàn)樗紤]到了抽樣誤差的影響。z檢驗(yàn)要求總體方差已知或者樣本量很大(n>30),這時(shí)候樣本標(biāo)準(zhǔn)差s就非常接近總體標(biāo)準(zhǔn)差σ,這時(shí)候用z檢驗(yàn)也是可以的。但是,題目說了樣本量?。?5個(gè)),而且總體方差未知,所以應(yīng)該使用t檢驗(yàn)。t檢驗(yàn)的結(jié)果比z檢驗(yàn)更可靠,因?yàn)闃颖玖啃〉臅r(shí)候,樣本標(biāo)準(zhǔn)差s對(duì)總體標(biāo)準(zhǔn)差σ的估計(jì)誤差就比較大,這時(shí)候用t分布來計(jì)算t統(tǒng)計(jì)量,可以減小犯第一類錯(cuò)誤的概率。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是D。3.C置信區(qū)間表達(dá)了我們對(duì)總體參數(shù)的一個(gè)區(qū)間估計(jì),它告訴我們,如果咱們反復(fù)抽樣,每次都構(gòu)造一個(gè)這樣的區(qū)間,那么平均來看,有95%的這些區(qū)間會(huì)正好包含真實(shí)的總體均值。也就是說,對(duì)于當(dāng)前這個(gè)特定的區(qū)間,咱們有95%的信心認(rèn)為,真實(shí)的總體均值就在這個(gè)區(qū)間里。這就像咱們用尺子量一堵墻,尺子可能不準(zhǔn),有系統(tǒng)誤差,但尺子不準(zhǔn)不代表每次量出來的結(jié)果都偏大或者都偏小,平均下來,多次測(cè)量結(jié)果的平均值,能比較準(zhǔn)確地反映墻的真實(shí)長(zhǎng)度。這就體現(xiàn)了無偏估計(jì)的思想,樣本均值是個(gè)好估計(jì)量,因?yàn)樗鼪]有系統(tǒng)性的偏差。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是C。4.B假設(shè)檢驗(yàn)中的p值,就是指在原假設(shè)H0為真的情況下,觀察到這么極端(或者更極端)的樣本結(jié)果的概率。如果p值小于顯著性水平α,意味著觀察到這么極端的樣本結(jié)果的可能性小于咱們能容忍的“冤枉好人”的概率,這時(shí)候咱們就有理由拒絕原假設(shè)H0。如果p值大于α,意味著觀察到這么極端的樣本結(jié)果的可能性大于咱們能容忍的“冤枉好人”的概率,這時(shí)候咱們就沒有足夠證據(jù)拒絕原假設(shè)H0。所以,p值越小,咱們拒絕原假設(shè)H0的證據(jù)就越強(qiáng)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是B。5.A總體方差未知,小樣本,獨(dú)立樣本t檢驗(yàn),應(yīng)該用t分布。因?yàn)闃颖玖啃〉臅r(shí)候,樣本標(biāo)準(zhǔn)差s對(duì)總體標(biāo)準(zhǔn)差σ的估計(jì)誤差就比較大,這時(shí)候用t分布來計(jì)算t統(tǒng)計(jì)量,可以減小犯第一類錯(cuò)誤的概率。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是A。6.D兩獨(dú)立樣本t檢驗(yàn),要求兩組樣本來自正態(tài)分布的總體,但樣本量足夠大(比如每組超過30個(gè)),根據(jù)中心極限定理,樣本均值的分布會(huì)趨向正態(tài),這時(shí)候?qū)傮w正態(tài)性的要求就不那么嚴(yán)格了。但題目沒說樣本量多大,所以不能直接用中心極限定理。另外,題目沒說兩個(gè)總體的方差是否相等。如果咱們能比較肯定地說兩個(gè)總體的方差是相等的(比如通過前期研究或者理論分析知道方差差不多),那么可以使用兩獨(dú)立樣本t檢驗(yàn)(PooledVariancet-test)。但如果咱們不確定兩個(gè)總體的方差是否相等,或者通過檢驗(yàn)發(fā)現(xiàn)它們不相等,那就得使用不等方差t檢驗(yàn)(Welch'st-test)。因?yàn)闃颖玖坎淮?,正態(tài)性和方差相等的要求可以放寬。但是,題目沒說樣本量多大,也沒說方差是否相等,所以不能確定用哪種t檢驗(yàn)。所以,小明老師認(rèn)為,這題的信息不夠,無法確定用哪種t檢驗(yàn)。7.C樣本均值的抽樣分布,它的均值等于總體均值,標(biāo)準(zhǔn)差(也叫標(biāo)準(zhǔn)誤)是總體標(biāo)準(zhǔn)差除以樣本量的平方根。樣本量越大,標(biāo)準(zhǔn)誤越小,咱們估計(jì)就越精確,抽樣分布就越“聚攏”在總體均值附近。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是C。8.A樣本量越大,樣本均值的標(biāo)準(zhǔn)誤(σ/sqrt(n))就越小。因?yàn)榉帜竤qrt(n)變大了,整個(gè)分?jǐn)?shù)就變小了。標(biāo)準(zhǔn)誤小了,意味著樣本均值這個(gè)估計(jì)量更“集中”,圍繞總體均值的波動(dòng)更小。所以,用樣本均值加減一個(gè)固定倍數(shù)的標(biāo)準(zhǔn)誤來構(gòu)造的置信區(qū)間,寬度自然就變窄了。簡(jiǎn)單說,樣本量越大,咱們抽樣估計(jì)越精確,置信區(qū)間越窄。比如,用100個(gè)樣本算的區(qū)間,肯定比用10個(gè)樣本算的區(qū)間要窄。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是A。9.D樣本量不變,置信水平越高,置信區(qū)間就越寬。因?yàn)樵蹅円笤奖kU(xiǎn)、越有把握,區(qū)間就拖得越長(zhǎng)。簡(jiǎn)單說,咱們要求越保險(xiǎn)、越有把握,區(qū)間就拖得越長(zhǎng)。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是D。10.B置信區(qū)間包含了原假設(shè)的值(這里是105),就相當(dāng)于咱們用尺子量一堵墻,尺子不準(zhǔn),有系統(tǒng)誤差,但尺子不準(zhǔn)不代表每次量出來的結(jié)果都偏大或者都偏小,平均下來,多次測(cè)量結(jié)果的平均值,能比較準(zhǔn)確地反映墻的真實(shí)長(zhǎng)度。這就體現(xiàn)了無偏估計(jì)的思想,樣本均值是個(gè)好估計(jì)量,因?yàn)樗鼪]有系統(tǒng)性的偏差。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是B。11.A顯著性水平α,就像是咱們?cè)诩僭O(shè)檢驗(yàn)這場(chǎng)“審判”中設(shè)定的“合理懷疑”的標(biāo)準(zhǔn)。咱們有兩個(gè)假設(shè),原假設(shè)H0(假設(shè)事情沒變,沒新意),備擇假設(shè)H1(假設(shè)事情有變化,有新意)。咱們得決定,看到什么樣的樣本證據(jù),才足夠讓我們“懷疑”并“拒絕”原假設(shè)H0。顯著性水平α,就代表了咱們?cè)敢獬袚?dān)的那種“冤枉好人”(也就是拒絕了H0,但H0其實(shí)是真的)的最大風(fēng)險(xiǎn)或者概率。比如α=0.05,咱們就愿意冒5%的風(fēng)險(xiǎn),犯了這種錯(cuò)誤。如果樣本結(jié)果算出的p值小于α,說明樣本結(jié)果太“極端”了,極端到即使H0是真的,發(fā)生的概率也只有那么一點(diǎn)點(diǎn)(比如小于5%),這就不太可能只是運(yùn)氣不好。這時(shí)候,咱們就有理由拒絕H0。如果p值大于α,說明樣本結(jié)果不那么極端,即使在H0真的情況下,這種結(jié)果發(fā)生的可能性還是挺大的(比如大于5%),那咱們就“沒有足夠證據(jù)”拒絕H0,只能暫時(shí)相信H0。所以,α就是咱們劃定的那個(gè)“證據(jù)足夠硬”的門檻,決定了咱們做決策的嚴(yán)格程度。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是A。12.D獨(dú)立樣本t檢驗(yàn),就是比較兩組來自不同總體的、互相獨(dú)立的樣本的均值差異。對(duì)于均值比較,正態(tài)分布是個(gè)挺強(qiáng)的假設(shè)。但是,當(dāng)樣本量足夠大(比如每組超過30個(gè)),根據(jù)中心極限定理,樣本均值的分布會(huì)趨向正態(tài),這時(shí)候?qū)傮w正態(tài)性的要求就不那么嚴(yán)格了。但是,題目沒說樣本量多大,所以不能直接用中心極限定理。關(guān)鍵是,題目沒說兩個(gè)總體的方差是否相等。如果咱們能比較肯定地說兩個(gè)總體的方差是相等的(比如通過前期研究或者理論分析知道方差差不多),那么可以使用兩獨(dú)立樣本t檢驗(yàn)(PooledVariancet-test)。但如果咱們不確定兩個(gè)總體的方差是否相等,或者通過檢驗(yàn)發(fā)現(xiàn)它們不相等,那就得使用不等方差t檢驗(yàn)(Welch'st-test)。因?yàn)闃颖玖坎淮?,正態(tài)性和方差相等的要求可以放寬。但是,題目沒說樣本量多大,也沒說方差是否相等,所以不能確定用哪種t檢驗(yàn)。所以,小明老師認(rèn)為,這題的信息不夠,無法確定用哪種t檢驗(yàn)。13.B樣本均值的抽樣分布,它的均值等于總體均值,標(biāo)準(zhǔn)差(也叫標(biāo)準(zhǔn)誤)是總體標(biāo)準(zhǔn)差除以樣本量的平方根。樣本量越大,樣本均值的標(biāo)準(zhǔn)誤(σ/sqrt(n))就越小。因?yàn)榉帜竤qrt(n)變大了,整個(gè)分?jǐn)?shù)就變小了。標(biāo)準(zhǔn)誤小了,意味著樣本均值這個(gè)估計(jì)量更“集中”,圍繞總體均值的波動(dòng)更小。所以,用樣本均值加減一個(gè)固定倍數(shù)的標(biāo)準(zhǔn)誤來構(gòu)造的置信區(qū)間,寬度自然就變窄了。簡(jiǎn)單說,樣本量越大,咱們抽樣估計(jì)越精確,置信區(qū)間越窄。比如,用100個(gè)樣本算的區(qū)間,肯定比用10個(gè)樣本算的區(qū)間要窄。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是B。14.A獨(dú)立樣本t檢驗(yàn),就是比較兩組來自不同總體的、互相獨(dú)立的樣本的均值差異。對(duì)于均值比較,正態(tài)分布是個(gè)挺強(qiáng)的假設(shè)。但是,當(dāng)樣本量足夠大(比如每組超過30個(gè)),根據(jù)中心極限定理,樣本均值的分布會(huì)趨向正態(tài),這時(shí)候?qū)傮w正態(tài)性的要求就不那么嚴(yán)格了。但是,題目沒說樣本量多大,所以不能直接用中心極限定理。關(guān)鍵是,題目沒說兩個(gè)總體的方差是否相等。如果咱們能比較肯定地說兩個(gè)總體的方差是相等的(比如通過前期研究或者理論分析知道方差差不多),那么可以使用兩獨(dú)立樣本t檢驗(yàn)(PooledVariancet-test)。但如果咱們不確定兩個(gè)總體的方差是否相等,或者通過檢驗(yàn)發(fā)現(xiàn)它們不相等,那就得使用不等方差t檢驗(yàn)(Welch'st-test)。因?yàn)闃颖玖坎淮螅龖B(tài)性和方差相等的要求可以放寬。但是,題目沒說樣本量多大,也沒說方差是否相等,所以不能確定用哪種t檢驗(yàn)。所以,小明老師認(rèn)為,這題的信息不夠,無法確定用哪種t檢驗(yàn)。15.D樣本量確定這事兒,挺重要的。樣本量太大,浪費(fèi)資源;樣本量太小,結(jié)果不靠譜。怎么平衡精度、置信水平和成本,得好好琢磨琢磨。如果標(biāo)準(zhǔn)誤是3%,確實(shí)可能只需要9個(gè)樣本。這題可能在條件設(shè)定上讓老師覺得結(jié)果有點(diǎn)意外,但按公式計(jì)算,結(jié)果就是這樣。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是D。二、簡(jiǎn)答題1.小明老師,咱們講點(diǎn)估計(jì)的時(shí)候,老師經(jīng)常說樣本均值是總體均值的一個(gè)無偏估計(jì)量。你能結(jié)合無偏估計(jì)的定義,簡(jiǎn)單解釋一下這句話是什么意思嗎?小明老師覺得啊,這得從統(tǒng)計(jì)量的期望值來說。一個(gè)估計(jì)量X?,如果它的期望值E(X?)等于它要估計(jì)的那個(gè)總體參數(shù)μ,那么咱們就說X?是μ的一個(gè)無偏估計(jì)量。這句話的意思是,如果我們反復(fù)抽樣,每次都算一個(gè)樣本均值X?,然后把這些X?加起來,再除以抽樣次數(shù),得到的平均值,正好等于真實(shí)的總體均值μ。它就像咱們用尺子量一堵墻,尺子可能不準(zhǔn),有系統(tǒng)誤差,但尺子不準(zhǔn)不代表每次量出來的結(jié)果都偏大或者都偏小,平均下來,多次測(cè)量結(jié)果的平均值,能比較準(zhǔn)確地反映墻的真實(shí)長(zhǎng)度。這就體現(xiàn)了無偏估計(jì)的思想,樣本均值是個(gè)好估計(jì)量,因?yàn)樗鼪]有系統(tǒng)性的偏差。所以,小明老師覺得,這題的正確選項(xiàng)應(yīng)該是C。2.小明老師,咱們?cè)谥v假設(shè)檢驗(yàn)的時(shí)候,提到了顯著性水平α這個(gè)概念。你能用自己的話,簡(jiǎn)單解釋一下顯著性水平α是什么意思?小明老師覺得啊,顯著性水平α,就像是咱們?cè)诩僭O(shè)檢驗(yàn)這場(chǎng)“審判”中設(shè)定的“合理懷疑”的標(biāo)準(zhǔn)。咱們有兩個(gè)假設(shè),原假設(shè)H0(假設(shè)事情沒變,沒新意),備擇假設(shè)H1(假設(shè)事情有變化,有新意)。咱們得決定,看到什么樣的樣本證據(jù),才足夠讓我們“懷疑”并“拒絕”原假設(shè)H0。顯著性水平α,就代表了咱們?cè)敢獬袚?dān)的那種“冤枉好人”(也就是拒絕了H0,但H0其實(shí)是真的)的最大風(fēng)險(xiǎn)或者概率。比如α=0.05,咱們就愿意冒5%的風(fēng)險(xiǎn),犯了這種錯(cuò)誤。如果樣本結(jié)果算出的p值小于α,說明樣本結(jié)果太“極端”了,極端到即使H0是真的,發(fā)生的概率也只有那么一點(diǎn)點(diǎn)(比如小于5%),這就不太可能只是運(yùn)氣不好。這時(shí)候,咱們就有理由拒絕H0。如果p值大于α,說明樣本結(jié)果不那么極端,即使在H0真的情況下,這種結(jié)果發(fā)生的可能性還是挺大的(比如大于5%),那咱們就“沒有足夠證據(jù)”拒絕H0,只能暫時(shí)相信H0。所以,α就是咱們劃定的那個(gè)“證據(jù)足夠硬”的門檻,決定了咱們做決策的嚴(yán)格程度。所以,小明老師覺得,這題的正確選項(xiàng)應(yīng)該是A。3.小明老師,咱們?cè)谥v點(diǎn)估計(jì)的時(shí)候,老師經(jīng)常說樣本均值是總體均值的一個(gè)無偏估計(jì)量。你能結(jié)合無偏估計(jì)的定義,簡(jiǎn)單解釋一下這句話是什么意思嗎?小明老師覺得啊,這得從統(tǒng)計(jì)量的期望值來說。一個(gè)估計(jì)量X?,如果它的期望值E(X?)等于它要估計(jì)的那個(gè)總體參數(shù)μ,那么咱們就說X?是μ的一個(gè)無偏估計(jì)量。這句話的意思是,如果我們反復(fù)抽樣,每次都算一個(gè)樣本均值X?,然后把這些X?加起來,再除以抽樣次數(shù),得到的平均值,正好等于真實(shí)的總體均值μ。它就像咱們用尺子量一堵墻,尺子可能不準(zhǔn),有系統(tǒng)誤差,但尺子不準(zhǔn)不代表每次量出來的結(jié)果都偏大或者都偏小,平均下來,多次測(cè)量結(jié)果的平均值,能比較準(zhǔn)確地反映墻的真實(shí)長(zhǎng)度。這就體現(xiàn)了無偏估計(jì)的思想,樣本均值是個(gè)好估計(jì)量,因?yàn)樗鼪]有系統(tǒng)性的偏差。所以,小明老師覺得,這題的正確選項(xiàng)應(yīng)該是C。4.小明老師,咱們?cè)谥v樣本量確定的理論基礎(chǔ)。小明老師記得,確定樣本量,主要是為了在給定的置信水平和顯著性水平下,達(dá)到想要的精度(比如誤差范圍)。咱們想估計(jì)一個(gè)城市居民對(duì)某項(xiàng)政策的支持率,希望估計(jì)的誤差范圍(置信區(qū)間的半寬)不超過2個(gè)百分點(diǎn),置信水平為95%。如果我們用歷史數(shù)據(jù)估計(jì),該政策的支持率的標(biāo)準(zhǔn)誤(基于比例的標(biāo)準(zhǔn)誤sqrt(p(1-p)/n))大約為3%。那么,根據(jù)這些信息,小明老師幫你算算,大概需要抽取多少居民樣本呢?小明老師覺得啊,咱們用公式來算。對(duì)于比例,誤差范圍E=2%,置信水平95%,查Z表得臨界值Z=1.96。標(biāo)準(zhǔn)誤σp=3%。根據(jù)公式n=(Z^2*σp^2)/E^2,代入數(shù)值:n=(1.96^2*1%^2)/2%^2=(3.8416*0.0009)/0.0004=0.00345424/0.0004=8.6356。小明老師覺得,樣本量必須是整數(shù),而且咱們要保證精度,所以得向上取整。這個(gè)8.6356有點(diǎn)小,是不是計(jì)算哪里錯(cuò)了?再算一遍:(1.96^2*0.0009)/0.0004=(3.8416*0.0009)/0.0004=0.00345424/0.0004=8.6356。向上取整,需要9個(gè)樣本。小明老師覺得,這個(gè)樣本量是不是有點(diǎn)小???是不是標(biāo)準(zhǔn)誤3%算高了?或者題目給的條件本身就不太現(xiàn)實(shí)?不管怎么說,根據(jù)公式計(jì)算出來的結(jié)果就是這樣。所以,小明老師認(rèn)為,這題的正確選項(xiàng)應(yīng)該是D——需要抽取大約9個(gè)居民樣本。大家想想,樣本量確定這事兒,挺重要的。樣本量太大,浪費(fèi)資源;樣本量太小,結(jié)果不靠譜。怎么平衡精度、置信水平和成本,得好好琢磨琢磨。如果標(biāo)準(zhǔn)誤是3%,確實(shí)可能只需要9個(gè)樣本。這題可能在條件設(shè)定上讓老師覺得結(jié)果有點(diǎn)意外,但按公式計(jì)算,結(jié)果就是這樣。所以,小明老師認(rèn)為,這題的正確選項(xiàng)是D。5.小明老師,咱們想檢驗(yàn)一種新的教學(xué)方法是否比傳統(tǒng)教學(xué)方法更能提高學(xué)生的數(shù)學(xué)成績(jī)。假設(shè)數(shù)學(xué)成績(jī)服從正態(tài)分布。我們隨機(jī)抽取了30名學(xué)生,將他們隨機(jī)分成兩組,每組15人。一組使用新教學(xué)方法(實(shí)驗(yàn)組),另一組使用傳統(tǒng)教學(xué)方法(對(duì)照組)。一段時(shí)間后,我們分別測(cè)得兩組學(xué)生的平均數(shù)學(xué)成績(jī)和標(biāo)準(zhǔn)差如下:實(shí)驗(yàn)組:平均成績(jī)75分,標(biāo)準(zhǔn)差8分;對(duì)照組:平均成績(jī)70分,標(biāo)準(zhǔn)差10分。請(qǐng)問,按照假設(shè)檢驗(yàn)的標(biāo)準(zhǔn)步驟,完成以下任務(wù):(1)寫出原假設(shè)H0和備擇假設(shè)H1。咱們想檢驗(yàn)新方法是否“更能提高”成績(jī),也就是實(shí)驗(yàn)組平均成績(jī)是否高于對(duì)照組。所以,原假設(shè)H0就是“新方法不比傳統(tǒng)方法好”,也就是兩組平均成績(jī)相等,即μ1=μ2或者說μ1-μ2=也就是說實(shí)驗(yàn)組平均成績(jī)高于對(duì)照組。咱們想支持的“新方法確實(shí)更好”,也就是實(shí)驗(yàn)組平均成績(jī)高于對(duì)照組。咱們想找的證據(jù)指向的方向。咱們?cè)僭O(shè)H0:μ1=μ2,咱們備擇假設(shè)H1:μ1>μ2。大家想想,原假設(shè)永遠(yuǎn)說“沒變化”、“沒區(qū)別”、“沒效應(yīng)”,這是咱們一開始默認(rèn)的,得有強(qiáng)證據(jù)才能推翻它。備擇假設(shè)就是咱們想支持的“新方法確實(shí)更好”,也就是實(shí)驗(yàn)組平均成績(jī)高于對(duì)照組。咱們用新方法來估計(jì)這批零件的平均長(zhǎng)度,比傳統(tǒng)方法教出來的學(xué)生平均高5分左右。這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師給出你的檢驗(yàn)結(jié)論,并說明理由。小明老師覺得啊,咱們得出結(jié)論是新方法確實(shí)更好,這個(gè)“更好”是多少呢?咱們看看均值差,實(shí)驗(yàn)組75分,對(duì)照組70分,高了5分。咱們用p值小于0.05來證明這個(gè)5分不是白來的,不是純屬巧合。這意味著,如果咱們大規(guī)模推廣新教學(xué)方法,很可能學(xué)生的平均成績(jī)會(huì)比傳統(tǒng)方法教出來的學(xué)生平均高5分左右。這5分,在數(shù)學(xué)成績(jī)里可能挺關(guān)鍵的,也許就能讓及格率提高不少。所以,小明老師認(rèn)為,咱們有足夠的統(tǒng)計(jì)證據(jù)表明新教學(xué)方法比傳統(tǒng)教學(xué)方法更能提高學(xué)生的數(shù)學(xué)成績(jī)。理由就是p值小于α。咱們用新方法來估計(jì)這批零件的平均長(zhǎng)度,比傳統(tǒng)方法教出來的學(xué)生平均高5分左右。這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,根據(jù)你的檢驗(yàn)結(jié)論,請(qǐng)用通俗的語言解釋這個(gè)結(jié)果的實(shí)際意義。小明老師覺得啊,咱們得出結(jié)論是新方法確實(shí)更好,這個(gè)“更好”是多少呢?咱們看看均值差,實(shí)驗(yàn)組75分,對(duì)照組70分,高了5分。咱們用p值小于0.05來證明這個(gè)5分不是白來的,不是純屬巧合。這意味著,如果咱們大規(guī)模推廣新教學(xué)方法,很可能學(xué)生的平均成績(jī)會(huì)比傳統(tǒng)方法教出來的學(xué)生平均高5分左右。這5分,在數(shù)學(xué)成績(jī)里可能挺關(guān)鍵的,也許就能讓及格率提高不少。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5分左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5mmHg左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5mmHg左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmHg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們這次的測(cè)試結(jié)果,新教學(xué)方法確實(shí)能讓學(xué)生的數(shù)學(xué)成績(jī)比傳統(tǒng)教學(xué)方法好一些,這個(gè)好是統(tǒng)計(jì)上顯著的,不是碰巧碰上的。咱們有理由相信,用新方法,學(xué)生們平均能多考個(gè)5mmg左右。當(dāng)然,咱們也得考慮效應(yīng)量,也就是兩組均值差(5mmg)的實(shí)際意義大不大,但這超出了題目范圍。所以,小明老師認(rèn)為,這個(gè)結(jié)果的實(shí)際意義就是:根據(jù)咱們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年湖南都市職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試題庫參考答案詳解
- 2026年成都文理學(xué)院?jiǎn)握新殬I(yè)傾向性考試題庫參考答案詳解
- 2026年唐山職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫及答案詳解一套
- 2026年上海中醫(yī)藥大學(xué)單招職業(yè)技能考試題庫參考答案詳解
- 教師求職面試題及答案
- 電梯維保安全責(zé)任協(xié)議書范本
- 2025年昆明市呈貢區(qū)城市投資集團(tuán)有限公司及下屬子公司員工崗公開招聘11人備考題庫附答案詳解
- 2026年甘肅一市教育系統(tǒng)招聘37人備考題庫及一套答案詳解
- 廣州市海珠區(qū)人民政府辦公室2026年公開招聘雇員備考題庫及答案詳解一套
- 陜西郵政2026年度校園招聘200人備考題庫及1套參考答案詳解
- 交通銀行跨境人民幣業(yè)務(wù)介紹
- 2023QC小組活動(dòng)基礎(chǔ)知識(shí)培訓(xùn)
- GB/T 33636-2023氣動(dòng)用于塑料管的插入式管接頭
- 生理學(xué)期末考試復(fù)習(xí)試題庫及答案
- 旅游地理學(xué) 國家公園建設(shè)與管理
- JJF(石化)036-2020漆膜附著力測(cè)定儀(劃圈法)校準(zhǔn)規(guī)范
- 診所醫(yī)生聘用合同(3篇)
- JJG 693-2011可燃?xì)怏w檢測(cè)報(bào)警器
- 美拉德反應(yīng)課件
- 可再生能源領(lǐng)域:陽光電源企業(yè)組織結(jié)構(gòu)及部門職責(zé)
- 電腦節(jié)能環(huán)保證書
評(píng)論
0/150
提交評(píng)論