2025年統(tǒng)計學(xué)期末考試-統(tǒng)計推斷與檢驗習(xí)題及解析_第1頁
2025年統(tǒng)計學(xué)期末考試-統(tǒng)計推斷與檢驗習(xí)題及解析_第2頁
2025年統(tǒng)計學(xué)期末考試-統(tǒng)計推斷與檢驗習(xí)題及解析_第3頁
2025年統(tǒng)計學(xué)期末考試-統(tǒng)計推斷與檢驗習(xí)題及解析_第4頁
2025年統(tǒng)計學(xué)期末考試-統(tǒng)計推斷與檢驗習(xí)題及解析_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2025年統(tǒng)計學(xué)期末考試——統(tǒng)計推斷與檢驗習(xí)題及解析考試時間:______分鐘總分:______分姓名:______一、單項選擇題(本大題共20小題,每小題2分,共40分。在每小題列出的四個選項中,只有一項是最符合題目要求的,請將正確選項字母填在題后的括號內(nèi)。)1.在進行假設(shè)檢驗時,如果原假設(shè)為真,但拒絕了原假設(shè),這種錯誤稱為()A.第一類錯誤B.第二類錯誤C.系統(tǒng)誤差D.隨機誤差2.設(shè)總體X服從正態(tài)分布N(μ,σ2),其中σ2已知,要檢驗H?:μ=μ?,H?:μ≠μ?,應(yīng)選擇的檢驗統(tǒng)計量是()A.t統(tǒng)計量B.Z統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量3.在大樣本情況下,對于總體比例p的估計,置信區(qū)間公式為()A.p±Z_(α/2)√(p(1-p)/n)B.p±t_(α/2)√(p(1-p)/n)C.p±Z_(α/2)√(p(1-p)/n^2)D.p±t_(α/2)√(p(1-p)/n^2)4.設(shè)總體X的分布未知,但知道它是對稱的,要估計總體均值,應(yīng)使用()A.最大似然估計B.矩估計C.中位數(shù)D.均值5.在進行假設(shè)檢驗時,檢驗的顯著性水平α表示的是()A.原假設(shè)為真時拒絕原假設(shè)的概率B.原假設(shè)為假時拒絕原假設(shè)的概率C.原假設(shè)為真時接受原假設(shè)的概率D.原假設(shè)為假時接受原假設(shè)的概率6.設(shè)總體X服從二項分布B(n,p),要檢驗H?:p=p?,H?:p≠p?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量7.在進行區(qū)間估計時,置信區(qū)間的寬度主要取決于()A.樣本量的大小B.顯著性水平αC.總體標(biāo)準(zhǔn)差D.以上都是8.設(shè)總體X服從正態(tài)分布N(μ,σ2),其中σ2未知,要檢驗H?:μ=μ?,H?:μ≠μ?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量9.在進行假設(shè)檢驗時,如果原假設(shè)為假,但接受了原假設(shè),這種錯誤稱為()A.第一類錯誤B.第二類錯誤C.系統(tǒng)誤差D.隨機誤差10.設(shè)總體X的分布未知,但要估計其均值,應(yīng)使用()A.最大似然估計B.矩估計C.中位數(shù)D.均值11.在進行假設(shè)檢驗時,如果顯著性水平α越小,那么()A.第一類錯誤的概率越小B.第二類錯誤的概率越小C.檢驗的效力越大D.以上都對12.設(shè)總體X服從正態(tài)分布N(μ,σ2),其中σ2已知,要檢驗H?:μ=μ?,H?:μ>μ?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量13.在進行區(qū)間估計時,置信水平越高,置信區(qū)間的寬度()A.越小B.越大C.不變D.無法確定14.設(shè)總體X服從二項分布B(n,p),要檢驗H?:p=p?,H?:p>p?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量15.在進行假設(shè)檢驗時,如果檢驗統(tǒng)計量的p值小于顯著性水平α,那么()A.應(yīng)拒絕原假設(shè)B.應(yīng)接受原假設(shè)C.無法確定D.以上都對16.設(shè)總體X服從正態(tài)分布N(μ,σ2),其中σ2未知,要檢驗H?:μ=μ?,H?:μ<μ?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量17.在進行區(qū)間估計時,樣本量越大,置信區(qū)間的寬度()A.越小B.越大C.不變D.無法確定18.設(shè)總體X服從二項分布B(n,p),要檢驗H?:p=p?,H?:p<p?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量19.在進行假設(shè)檢驗時,如果原假設(shè)為真,但接受了原假設(shè),這種錯誤稱為()A.第一類錯誤B.第二類錯誤C.系統(tǒng)誤差D.隨機誤差20.設(shè)總體X服從正態(tài)分布N(μ,σ2),其中σ2已知,要檢驗H?:μ=μ?,H?:μ≠μ?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量二、多項選擇題(本大題共10小題,每小題3分,共30分。在每小題列出的五個選項中,有多項符合題目要求,請將正確選項字母填在題后的括號內(nèi)。每小題選出答案后,用鉛筆把答題卡上對應(yīng)題目的答案標(biāo)號涂黑。多涂、少涂、錯涂或未涂均無分。)1.在進行假設(shè)檢驗時,可能犯的錯誤有()A.第一類錯誤B.第二類錯誤C.系統(tǒng)誤差D.隨機誤差E.沒有錯誤2.設(shè)總體X服從正態(tài)分布N(μ,σ2),其中σ2已知,要檢驗H?:μ=μ?,H?:μ≠μ?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量E.以上都不是3.在進行區(qū)間估計時,置信區(qū)間的寬度主要取決于()A.樣本量的大小B.顯著性水平αC.總體標(biāo)準(zhǔn)差D.以上都是E.以上都不是4.設(shè)總體X服從正態(tài)分布N(μ,σ2),其中σ2未知,要檢驗H?:μ=μ?,H?:μ≠μ?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量E.以上都不是5.在進行假設(shè)檢驗時,如果原假設(shè)為假,但接受了原假設(shè),這種錯誤稱為()A.第一類錯誤B.第二類錯誤C.系統(tǒng)誤差D.隨機誤差E.以上都不是6.設(shè)總體X的分布未知,但要估計其均值,應(yīng)使用()A.最大似然估計B.矩估計C.中位數(shù)D.均值E.以上都不是7.在進行假設(shè)檢驗時,如果顯著性水平α越小,那么()A.第一類錯誤的概率越小B.第二類錯誤的概率越小C.檢驗的效力越大D.以上都對E.以上都不是8.設(shè)總體X服從正態(tài)分布N(μ,σ2),其中σ2已知,要檢驗H?:μ=μ?,H?:μ>μ?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量E.以上都不是9.在進行區(qū)間估計時,置信水平越高,置信區(qū)間的寬度()A.越小B.越大C.不變D.無法確定E.以上都不是10.設(shè)總體X服從二項分布B(n,p),要檢驗H?:p=p?,H?:p≠p?,應(yīng)選擇的檢驗統(tǒng)計量是()A.Z統(tǒng)計量B.t統(tǒng)計量C.χ2統(tǒng)計量D.F統(tǒng)計量E.以上都不是三、簡答題(本大題共5小題,每小題6分,共30分。)1.請簡述假設(shè)檢驗的基本步驟,并說明其中每一步的目的。在我們進行假設(shè)檢驗的時候,首先得有個明確的假設(shè),比如說你想知道這批產(chǎn)品的壽命是不是真的比標(biāo)準(zhǔn)的高。那你就得先設(shè)個原假設(shè),比如假設(shè)它們的壽命跟標(biāo)準(zhǔn)的一樣,這個就是你的原假設(shè)。然后你得有個備擇假設(shè),也就是你想找的證據(jù)指向的方向,比如壽命比標(biāo)準(zhǔn)的高。接下來就得選個檢驗方法,比如用Z檢驗還是t檢驗,這得看你手頭的數(shù)據(jù)是樣本還是總體,還有總體方差是不是已知。選好方法后,就得定個顯著性水平α,這就像是定個容忍錯誤的底線,一般選0.05或者0.01,表示你最多能接受5%或者1%的錯誤判斷。然后根據(jù)你選的方法算個檢驗統(tǒng)計量,這個統(tǒng)計量反映了你的樣本數(shù)據(jù)跟原假設(shè)的差距有多大。最后,你得算出這個統(tǒng)計量對應(yīng)的p值,p值就是如果原假設(shè)是真的,你能抽到這么極端樣本的概率。如果p值小于你的α,你就有了足夠的證據(jù)拒絕原假設(shè),說明你的備擇假設(shè)可能對。如果p值大于α,那你就沒足夠的證據(jù)拒絕原假設(shè),只能說目前證據(jù)不夠說明備擇假設(shè)是對的。整個過程,就是要用數(shù)據(jù)說話,判斷你的想法或者懷疑是不是有道理,當(dāng)然,也得接受可能判斷出錯的風(fēng)險。2.請解釋什么是第一類錯誤和第二類錯誤,并說明它們之間的關(guān)系。咱們在做假設(shè)檢驗的時候,總是有可能犯錯的,這就像打靶,要么打中了,要么打偏了。第一類錯誤,就是我本來打中了的靶子,結(jié)果我偏了,打偏了,但是我還以為打中了,這個錯誤在統(tǒng)計里就叫第一類錯誤,也叫做“棄真錯誤”。簡單說,就是原假設(shè)其實是真的,但我卻把它給拒絕了。比如說,這批產(chǎn)品其實質(zhì)量是合格的,但我檢驗后卻把它判為不合格,那就犯了個第一類錯誤。犯第一類錯誤的概率,就是我們前面說的顯著性水平α。第二類錯誤呢,就是我本來沒打中靶子,結(jié)果我打偏了,但這次我反而覺得好像打中了,這個錯誤就叫第二類錯誤,也叫做“取偽錯誤”。簡單說,就是原假設(shè)其實是不真的,但我卻把它給接受了。比如說,這批產(chǎn)品其實質(zhì)量是不合格的,但我檢驗后卻把它判為合格,那就犯了個第二類錯誤。犯第二類錯誤的概率,我們一般用β來表示。這兩類錯誤是相互影響的,你想要減少第一類錯誤的概率,也就是α,那往往就會增加第二類錯誤的概率β,反之亦然。這就像你打靶,如果你把靶圈劃得小一點,確實不容易打偏(減少了犯第一類錯誤的可能),但你卻更容易打在靶圈外(增加了犯第二類錯誤的可能)。所以,在實際做檢驗的時候,我們得根據(jù)具體情況,找到一個平衡點,不能只顧著減少一種錯誤,而忽略了另一種錯誤。3.在什么情況下,使用Z檢驗比使用t檢驗更合適?請說明理由。當(dāng)咱們做假設(shè)檢驗,特別是要檢驗總體均值的時候,用不用Z檢驗還是t檢驗,關(guān)鍵得看兩個條件:一是咱們知道不知道總體的標(biāo)準(zhǔn)差,二是咱們的樣本量是大是小。一般來說,如果咱們知道總體的標(biāo)準(zhǔn)差σ,不管樣本量大不大,咱們都可以用Z檢驗。比如說,我們知道全國成年男性的平均身高標(biāo)準(zhǔn)差是多少,那就算咱們只抽了一小部分男性來測身高,也可以用Z檢驗來推斷全國成年男性的平均身高。這是因為Z檢驗用的是已知的總體標(biāo)準(zhǔn)差,所以它的估計更精確。但是,如果咱們不知道總體的標(biāo)準(zhǔn)差,那這時候就得用t檢驗了。而且,t檢驗還有一個前提,那就是咱們得抽足夠大的樣本量,通常來說,樣本量大于等于30,咱們就可以用t檢驗了。這是因為樣本量越大,咱們對總體參數(shù)的估計就越準(zhǔn)確,這時候就算不知道總體標(biāo)準(zhǔn)差,用樣本標(biāo)準(zhǔn)差來代替,誤差也不會太大。所以,總結(jié)一下,當(dāng)咱們知道總體標(biāo)準(zhǔn)差,或者樣本量足夠大的時候,用Z檢驗更合適;當(dāng)咱們不知道總體標(biāo)準(zhǔn)差,且樣本量不太大的時候,用t檢驗更合適。當(dāng)然,如果樣本量特別小,而且咱們也不知道總體標(biāo)準(zhǔn)差,那這時候做假設(shè)檢驗就有點棘手了,可能就需要用一些其他的方法,或者干脆增加樣本量。4.請解釋置信區(qū)間的含義,并說明置信水平與置信區(qū)間寬度的關(guān)系。咱們搞統(tǒng)計推斷的時候,光知道個點估計,比如算出個平均數(shù),有時候還不夠,還得知道這個估計有多準(zhǔn),大概在哪個范圍內(nèi)。這時候,咱們就得用置信區(qū)間了。簡單說,置信區(qū)間就是在一定的置信水平下,我們估計總體參數(shù)可能落在的區(qū)間。比如說,咱們抽樣算出,這批產(chǎn)品的平均壽命可能在800到1000小時之間,而且咱們有95%的信心認為,真正的平均壽命就在這個800到1000小時之間。這個“95%的信心”就是置信水平,而“800到1000小時”就是置信區(qū)間。這里要特別理解一下,咱們說的“95%的信心”,并不是說這批產(chǎn)品的壽命有95%的可能性在這個區(qū)間里,而是說如果我們反復(fù)抽樣,每次都按這個方法算出一個置信區(qū)間,那么大約有95%的這些區(qū)間會包含真正的總體均值。置信水平,也就是咱們要求的把握程度,一般用1-α來表示,α就是顯著性水平。置信水平越高,咱們就越自信,但這個區(qū)間也就越寬,因為咱們得把可能的情況都包進來。反過來,如果咱們要求的置信水平低一點,比如只要求80%的信心,那這個置信區(qū)間就會窄一些,但咱們對估計的把握也就小了。所以,置信水平和置信區(qū)間寬度是成反比的,你想越有把握,就得犧牲精度(區(qū)間的寬度),想提高精度(區(qū)間的寬度),就得降低一點把握(置信水平)。5.請舉例說明如何在實際問題中應(yīng)用假設(shè)檢驗。假設(shè)檢驗這東西,在咱們現(xiàn)實生活中用地方可多了,它就像是咱們做決策的一個科學(xué)依據(jù),幫咱們判斷一下咱們的想法或者懷疑是不是有道理。比如說,咱們一個食品廠生產(chǎn)餅干,每一塊餅干的包裝上寫著凈含量是120克,那咱們得定期檢查一下,這餅干是不是真能達到這個標(biāo)準(zhǔn)。這時候,咱們就可以用假設(shè)檢驗來幫忙。首先,咱們得設(shè)個原假設(shè),比如假設(shè)這批餅干的平均凈含量就是120克,這是咱們希望成立的情況。然后,咱們得設(shè)個備擇假設(shè),比如假設(shè)這批餅干的平均凈含量不是120克,這可能是咱們懷疑的情況。接下來,咱們得抽一批餅干出來,稱一下它們的重量,算個樣本的平均凈含量。然后,咱們得選個檢驗方法,比如用t檢驗,因為咱們不知道生產(chǎn)過程中餅干重量的總體標(biāo)準(zhǔn)差,而且樣本量可能不大。咱們還得定個顯著性水平,比如0.05,表示咱們最多能接受5%的錯誤判斷。然后,咱們根據(jù)樣本數(shù)據(jù)算個檢驗統(tǒng)計量,看看它有多極端。最后,咱們得算出這個統(tǒng)計量對應(yīng)的p值,如果p值小于0.05,咱們就拒絕原假設(shè),認為這批餅干的平均凈含量可能不是120克,得趕緊檢查一下生產(chǎn)過程是不是出了問題。如果p值大于0.05,咱們就接受原假設(shè),認為這批餅干的平均凈含量可能是120克,生產(chǎn)過程還可以。再比如,咱們一個藥店銷售某種感冒藥,想推廣一種新的廣告策略,看能不能提高銷售額。這時候,咱們可以隨機選一段時間,用老策略賣,再選另一個時間段,用新策略賣,看看銷售額是不是真的提高了。咱們也可以用假設(shè)檢驗來分析,假設(shè)新策略的銷售額跟老策略一樣,然后根據(jù)兩個時間段的銷售額數(shù)據(jù),用Z檢驗或者t檢驗(看樣本量大小和總體標(biāo)準(zhǔn)差是否已知)來檢驗這個假設(shè),如果p值很小,咱們就有理由相信新策略真的能提高銷售額,就可以推廣了。四、計算題(本大題共4小題,每小題10分,共40分。)1.某燈泡廠生產(chǎn)的燈泡壽命X服從正態(tài)分布N(μ,1002),現(xiàn)隨機抽取16只燈泡,測得壽命的平均值為1500小時。在顯著性水平α=0.05下,檢驗該廠生產(chǎn)的燈泡壽命是否顯著高于1500小時。首先,咱們得明確一下問題,這里咱們想知道的是燈泡壽命是不是顯著高于1500小時,所以這是一個單邊檢驗的問題。咱們先設(shè)原假設(shè)H?:μ≤1500,備擇假設(shè)H?:μ>1500。因為總體標(biāo)準(zhǔn)差σ=100是已知的,而且樣本量n=16,所以咱們應(yīng)該使用Z檢驗。顯著性水平α=0.05,對于單邊檢驗,咱們要找的是Z_(1-α)的值,也就是Z_(0.95),查標(biāo)準(zhǔn)正態(tài)分布表,Z_(0.95)≈1.645。接下來,咱們得計算檢驗統(tǒng)計量Z的值,它的公式是Z=(x?-μ?)/(σ/√n),把數(shù)據(jù)代入,Z=(1500-1500)/(100/√16)=0。最后,咱們比較計算出的Z值和臨界值Z_(0.95),因為0<1.645,所以咱們不能拒絕原假設(shè)。也就是說,在顯著性水平α=0.05下,沒有足夠的證據(jù)表明該廠生產(chǎn)的燈泡壽命顯著高于1500小時。2.某農(nóng)場想比較兩種不同的肥料對作物產(chǎn)量的影響,隨機選擇10塊土地,平均分配使用這兩種肥料,測得作物產(chǎn)量如下(單位:公斤/畝):肥料A:90,95,100,105,110,115,120,125,130,135肥料B:85,90,95,100,105,110,115,120,125,130在顯著性水平α=0.05下,檢驗兩種肥料的平均產(chǎn)量是否有顯著差異。這個問題中,咱們要比較兩種肥料的平均產(chǎn)量,而且樣本量n=10比較小,而且總體標(biāo)準(zhǔn)差未知,所以咱們應(yīng)該使用t檢驗。首先,咱們得計算兩種肥料的樣本均值和樣本標(biāo)準(zhǔn)差。肥料A的樣本均值x?_A=(90+95+...+135)/10=112.5,樣本標(biāo)準(zhǔn)差s_A=√[(Σ(x_i-x?_A)2)/9]≈17.88。肥料B的樣本均值x?_B=(85+90+...+130)/10=107.5,樣本標(biāo)準(zhǔn)差s_B=√[(Σ(x_i-x?_B)2)/9]≈17.88。然后,咱們需要計算合并方差s_p2,它的公式是s_p2=[(n_A-1)s_A2+(n_B-1)s_B2]/(n_A+n_B-2),代入數(shù)據(jù),s_p2=[(10-1)×17.882+(10-1)×17.882]/(10+10-2)≈320.59,所以合并標(biāo)準(zhǔn)差s_p≈17.90。接下來,咱們計算t統(tǒng)計量,它的公式是t=(x?_A-x?_B)/(s_p√(1/n_A+1/n_B)),代入數(shù)據(jù),t=(112.5-107.5)/(17.90√(1/10+1/10))≈0.34。最后,咱們需要找到t分布的臨界值t_(α,df),自由度df=n_A+n_B-2=10+10-2=18,查t分布表,α=0.05,雙側(cè)檢驗,t_(0.025,18)≈2.101。因為計算出的t值0.34<2.101,所以咱們不能拒絕原假設(shè)。也就是說,在顯著性水平α=0.05下,沒有足夠的證據(jù)表明兩種肥料的平均產(chǎn)量有顯著差異。3.某公司生產(chǎn)一種產(chǎn)品,根據(jù)以往經(jīng)驗,該產(chǎn)品的次品率p不超過0.05?,F(xiàn)在隨機抽取100件產(chǎn)品,發(fā)現(xiàn)其中有8件次品。在顯著性水平α=0.01下,檢驗該產(chǎn)品的次品率是否顯著高于0.05。這個問題中,咱們要檢驗的是次品率p,而且次品率p服從二項分布,樣本量比較大,所以咱們可以使用Z檢驗。首先,咱們設(shè)原假設(shè)H?:p≤0.05,備擇假設(shè)H?:p>0.05。顯著性水平α=0.01,對于單邊檢驗,咱們要找的是Z_(1-α)的值,也就是Z_(0.99),查標(biāo)準(zhǔn)正態(tài)分布表,Z_(0.99)≈2.33。接下來,咱們得計算檢驗統(tǒng)計量Z的值,它的公式是Z=(p?-p?)/√(p?(1-p?)/n),這里p?是樣本次品率,p?是原假設(shè)中的次品率,n是樣本量。代入數(shù)據(jù),p?=8/100=0.08,p?=0.05,n=100,Z=(0.08-0.05)/√(0.05×0.95/100)=3/0.02236≈134.16。最后,咱們比較計算出的Z值和臨界值Z_(0.99),因為134.16>2.33,所以咱們拒絕原假設(shè)。也就是說,在顯著性水平α=0.01下,有足夠的證據(jù)表明該產(chǎn)品的次品率顯著高于0.05。4.某醫(yī)生想比較兩種不同的治療方法對某種疾病的治療效果,隨機選擇20位病人,平均分配使用這兩種治療方法,治療一段時間后,測得病人的康復(fù)時間如下(單位:天):治療方法A:5,7,9,11,13,15,17,19,21,23治療方法B:6,8,10,12,14,16,18,20,22,24在顯著性水平α=0.05下,檢驗兩種治療方法的平均康復(fù)時間是否有顯著差異。這個問題中,咱們要比較兩種治療方法的平均康復(fù)時間,而且樣本量n=10比較小,而且總體標(biāo)準(zhǔn)差未知,所以咱們應(yīng)該使用t檢驗。首先,咱們得計算兩種治療方法的樣本均值和樣本標(biāo)準(zhǔn)差。治療方法A的樣本均值x?_A=(5+7+...+23)/10=14,樣本標(biāo)準(zhǔn)差s_A=√[(Σ(x_i-x?_A)2)/9]≈5.83。治療方法B的樣本均值x?_B=(6+8+...+24)/10=15,樣本標(biāo)準(zhǔn)差s_B=√[(Σ(x_i-x?_B)2)/9]≈5.83。然后,咱們需要計算合并方差s_p2,它的公式是s_p2=[(n_A-1)s_A2+(n_B-1)s_B2]/(n_A+n_B-2),代入數(shù)據(jù),s_p2=[(10-1)×5.832+(10-1)×5.832]/(10+10-2)≈34.01,所以合并標(biāo)準(zhǔn)差s_p≈5.83。接下來,咱們計算t統(tǒng)計量,它的公式是t=(x?_A-x?_B)/(s_p√(1/n_A+1/n_B)),代入數(shù)據(jù),t=(14-15)/(5.83√(1/10+1/10))≈-0.34。最后,咱們需要找到t分布的臨界值t_(α,df),自由度df=n_A+n_B-2=10+10-2=18,查t分布表,α=0.05,雙側(cè)檢驗,t_(0.025,18)≈2.101。因為計算出的t值-0.34<-2.101,所以咱們不能拒絕原假設(shè)。也就是說,在顯著性水平α=0.05下,沒有足夠的證據(jù)表明兩種治療方法的平均康復(fù)時間有顯著差異。五、證明題(本大題共2小題,每小題10分,共20分。)1.請證明:當(dāng)總體X服從正態(tài)分布N(μ,σ2)時,樣本均值X?服從N(μ,σ2/n)。咱們知道,如果總體X服從正態(tài)分布N(μ,σ2),那X的均值就是μ,方差就是σ2?,F(xiàn)在咱們從總體中隨機抽取n個樣本,記這n個樣本為X?,X?,...,Xn。咱們知道,樣本均值X?=(X?+X?+...+Xn)/n。因為每個X_i都來自N(μ,σ2),而且它們之間是相互獨立的,所以根據(jù)正態(tài)分布的性質(zhì),它們的線性組合也服從正態(tài)分布。具體來說,X?的均值E(X?)=E[(X?+X?+...+Xn)/n]=(E(X?)+E(X?)+...+E(Xn))/n=(μ+μ+...+μ)/n=nμ/n=μ。X?的方差Var(X?)=Var[(X?+X?+...+Xn)/n]=(Var(X?)+Var(X?)+...+Var(Xn))/n2=(σ2+σ2+...+σ2)/n2=nσ2/n2=σ2/n。所以,X?服從N(μ,σ2/n)。2.請證明:當(dāng)總體X的分布未知,但知道它是對稱的,要估計總體均值,應(yīng)使用中位數(shù)作為估計量。當(dāng)咱們不知道總體X的分布是什么,但知道它是對稱的時候,咱們可以用中位數(shù)來估計總體均值。為什么呢?因為中位數(shù)是這樣一個值,它將數(shù)據(jù)分成兩半,一半的數(shù)據(jù)比它小,一半的數(shù)據(jù)比它大。在正態(tài)分布這種對稱分布里,均值、中位數(shù)和眾數(shù)是重合的,所以用中位數(shù)估計均值是很自然的。但是,為什么在更一般的對稱分布里,中位數(shù)也是好的均值估計量呢?我們可以這樣想:如果分布是對稱的,那么分布兩側(cè)的“尾巴”是對稱的,也就是說,離均值左邊多遠的地方,離均值右邊也有同樣多的數(shù)據(jù)。這意味著,如果咱們用均值作為估計量,那么正偏差和負偏差的總和應(yīng)該差不多相等。但是,中位數(shù)不受極端值的影響,即使分布兩側(cè)有長長的“尾巴”,中位數(shù)也不會改變。所以,用中位數(shù)作為估計量,可以避免極端值對均值的影響,使得估計更穩(wěn)健。因此,當(dāng)總體X的分布未知,但知道它是對稱的,用中位數(shù)來估計總體均值是一個不錯的選擇。本次試卷答案如下一、單項選擇題答案及解析1.A解析:原假設(shè)為真但被拒絕的錯誤,稱為第一類錯誤,犯第一類錯誤的概率用α表示。2.B解析:總體標(biāo)準(zhǔn)差已知且總體服從正態(tài)分布,檢驗均值時使用Z統(tǒng)計量。3.A解析:大樣本情況下,總體比例的置信區(qū)間公式為p±Z_(α/2)√(p(1-p)/n)。4.C解析:對于對稱分布,中位數(shù)是對總體均值的無偏估計,且在分布未知時較為穩(wěn)健。5.A解析:顯著性水平α表示原假設(shè)為真時拒絕原假設(shè)的概率,即第一類錯誤的概率。6.A解析:二項分布次品率的檢驗,在大樣本情況下使用Z統(tǒng)計量。7.D解析:置信區(qū)間的寬度取決于樣本量、顯著性水平和總體標(biāo)準(zhǔn)差,三者都會影響寬度。8.B解析:總體標(biāo)準(zhǔn)差未知且總體服從正態(tài)分布,檢驗均值時使用t統(tǒng)計量。9.B解析:原假設(shè)為假但被接受的錯誤,稱為第二類錯誤,犯第二類錯誤的概率用β表示。10.D解析:總體分布未知時,均值的最常用估計量是樣本均值,但中位數(shù)也可用于對稱分布。11.A解析:顯著性水平α越小,拒絕原假設(shè)的門檻越高,因此犯第一類錯誤的概率越小。12.A解析:總體標(biāo)準(zhǔn)差已知且總體服從正態(tài)分布,檢驗均值的單邊檢驗使用Z統(tǒng)計量。13.B解析:置信水平越高,對總體參數(shù)的把握越大,因此置信區(qū)間寬度越大。14.A解析:二項分布次品率的檢驗,在大樣本情況下使用Z統(tǒng)計量。15.A解析:p值小于α?xí)r,說明樣本數(shù)據(jù)與原假設(shè)差異過大,有足夠證據(jù)拒絕原假設(shè)。16.B解析:總體標(biāo)準(zhǔn)差未知且總體服從正態(tài)分布,檢驗均值的單邊檢驗使用t統(tǒng)計量。17.A解析:樣本量越大,樣本均值對總體均值的估計越精確,因此置信區(qū)間寬度越小。18.A解析:二項分布次品率的檢驗,在大樣本情況下使用Z統(tǒng)計量。19.B解析:原假設(shè)為假但被接受的錯誤,稱為第二類錯誤,犯第二類錯誤的概率用β表示。20.A解析:總體標(biāo)準(zhǔn)差已知且總體服從正態(tài)分布,檢驗均值的雙邊檢驗使用Z統(tǒng)計量。二、多項選擇題答案及解析1.AB解析:假設(shè)檢驗中可能犯第一類錯誤(棄真)和第二類錯誤(取偽),系統(tǒng)誤差和隨機誤差不是假設(shè)檢驗的錯誤類型。2.AB解析:總體標(biāo)準(zhǔn)差已知且總體服從正態(tài)分布,檢驗均值時使用Z統(tǒng)計量;t統(tǒng)計量用于總體標(biāo)準(zhǔn)差未知且總體服從正態(tài)分布的情況。3.ABD解析:置信區(qū)間的寬度受樣本量、顯著性水平和總體標(biāo)準(zhǔn)差影響,與以上三者均有關(guān)。4.AB解析:總體標(biāo)準(zhǔn)差已知且總體服從正態(tài)分布,檢驗均值時使用Z統(tǒng)計量;總體標(biāo)準(zhǔn)差未知且總體服從正態(tài)分布,檢驗均值時使用t統(tǒng)計量。5.AB解析:原假設(shè)為真但被拒絕的錯誤是第一類錯誤,原假設(shè)為假但被接受的錯誤是第二類錯誤。6.CD解析:總體分布未知時,中位數(shù)是對稱分布均值的穩(wěn)健估計量,樣本均值也是常用估計量,但矩估計和最大似然估計不適用于對稱分布均值的估計。7.AB解析:顯著性水平α越小,拒絕原假設(shè)的門檻越高,因此犯第一類錯誤的概率越??;α越小,檢驗效力越低,因此犯第二類錯誤的概率越大。8.A解析:總體標(biāo)準(zhǔn)差已知且總體服從正態(tài)分布,檢驗均值的單邊檢驗使用Z統(tǒng)計量。9.B解析:置信水平越高,對總體參數(shù)的把握越大,因此置信區(qū)間寬度越大。10.A解析:二項分布次品率的檢驗,在大樣本情況下使用Z統(tǒng)計量。三、簡答題答案及解析1.答案:假設(shè)檢驗的步驟包括:提出原假設(shè)和備擇假設(shè);選擇檢驗方法;確定顯著性水平;計算檢驗統(tǒng)計量;根據(jù)p值或臨界值做出決策。解析:首先,根據(jù)問題背景提出原假設(shè)H?和備擇假設(shè)H?,原假設(shè)通常是研究者想要挑戰(zhàn)的假設(shè),備擇假設(shè)是研究者想要支持的假設(shè)。然后,根據(jù)總體分布、樣本信息和已知條件選擇合適的檢驗方法,如Z檢驗、t檢驗、χ2檢驗等。接著,確定顯著性水平α,通常取0.05或0.01,表示研究者愿意承擔(dān)犯第一類錯誤的概率。然后,根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量的值,這個統(tǒng)計量反映了樣本數(shù)據(jù)與原假設(shè)的差異程度。最后,根據(jù)計算出的p值或與臨界值比較做出決策,如果p值小于α,則拒絕原假設(shè);如果p值大于α,則不能拒絕原假設(shè)。2.答案:第一類錯誤是原假設(shè)為真時拒絕原假設(shè)的錯誤,犯第一類錯誤的概率用α表示;第二類錯誤是原假設(shè)為假時接受原假設(shè)的錯誤,犯第二類錯誤的概率用β表示。它們之間的關(guān)系是:α和β是相互制約的,減小α?xí)黾应?,減小β會增加α。在實際應(yīng)用中,需要根據(jù)具體情況權(quán)衡兩類錯誤的成本,選擇合適的顯著性水平和檢驗方法。解析:第一類錯誤和第二類錯誤是假設(shè)檢驗中可能犯的兩種錯誤。第一類錯誤也稱為棄真錯誤,是指原假設(shè)實際上是正確的,但檢驗結(jié)果卻拒絕了原假設(shè)。犯第一類錯誤的概率用α表示,通常稱為顯著性水平。第二類錯誤也稱為取偽錯誤,是指原假設(shè)實際上是錯誤的,但檢驗結(jié)果卻接受了原假設(shè)。犯第二類錯誤的概率用β表示。α和β是相互制約的,因為減小α(即提高檢驗的嚴格程度)會增加β(即降低檢驗的效力),反之亦然。在實際應(yīng)用中,需要根據(jù)具體情況權(quán)衡兩類錯誤的成本,選擇合適的顯著性水平和檢驗方法。例如,如果第一類錯誤的成本很高,可能需要選擇較小的α值;如果第二類錯誤的成本很高,可能需要選擇較大的α值。3.答案:當(dāng)總體標(biāo)準(zhǔn)差已知且樣本量較大時,使用Z檢驗更合適。因為Z檢驗基于標(biāo)準(zhǔn)正態(tài)分布,當(dāng)總體標(biāo)準(zhǔn)差已知時,可以更精確地估計總體參數(shù),且樣本量較大時,樣本均值的分布接近正態(tài)分布,Z檢驗的假設(shè)條件更容易滿足。解析:Z檢驗和t檢驗都是用于檢驗均值的假設(shè)檢驗方法,但它們的適用條件不同。Z檢驗要求總體標(biāo)準(zhǔn)差已知,而t檢驗要求總體標(biāo)準(zhǔn)差未知。當(dāng)總體標(biāo)準(zhǔn)差已知時,Z檢驗可以直接使用總體標(biāo)準(zhǔn)差計算標(biāo)準(zhǔn)誤,因此更精確。此外,當(dāng)樣本量較大時,根據(jù)中心極限定理,樣本均值的分布接近正態(tài)分布,即使總體分布未知,Z檢驗的假設(shè)條件也更容易滿足。因此,當(dāng)總體標(biāo)準(zhǔn)差已知且樣本量較大時,使用Z檢驗更合適。4.答案:置信區(qū)間是在一定的置信水平下,我們估計總體參數(shù)可能落在的區(qū)間。置信水平與置信區(qū)間寬度的關(guān)系是:置信水平越高,置信區(qū)間寬度越大;置信水平越低,置信區(qū)間寬度越小。這是因為置信水平越高,對總體參數(shù)的把握越大,需要包含更多的可能值,因此置信區(qū)間寬度越大。解析:置信區(qū)間是用于估計總體參數(shù)的一種方法,它給出一個區(qū)間,在這個區(qū)間內(nèi),我們相信總體參數(shù)的真實值落在其中。置信水平是我們在構(gòu)造置信區(qū)間時希望達到的置信程度,通常用1-α表示,α是顯著性水平。置信區(qū)間寬度的計算公式為:置信區(qū)間=點估計值±(臨界值×標(biāo)準(zhǔn)誤)。其中,點估計值是總體參數(shù)的估計值,臨界值取決于置信水平和檢驗分布,標(biāo)準(zhǔn)誤取決于總體標(biāo)準(zhǔn)差和樣本量。從公式可以看出,置信水平越高,臨界值越大,因此置信區(qū)間寬度越大;置信水平越低,臨界值越小,因此置信區(qū)間寬度越小。這是因為置信水平越高,對總體參數(shù)的把握越大,需要包含更多的可能值,因此置信區(qū)間寬度越大。5.答案:例如,一個制藥公司想要知道一種新藥是否比現(xiàn)有藥物更有效。他們可以隨機選擇一組病人,一半人服用新藥,另一半人服用現(xiàn)有藥物,然后觀察一段時間后,比較兩組病人的康復(fù)情況。如果新藥組的康復(fù)情況顯著優(yōu)于現(xiàn)有藥物組,那么公司就可以得出結(jié)論,新藥更有效。解析:假設(shè)檢驗在醫(yī)學(xué)研究中應(yīng)用廣泛,例如,一個制藥公司想要知道一種新藥是否比現(xiàn)有藥物更有效。他們可以隨機選擇一組病人,一半人服用新藥,另一半人服用現(xiàn)有藥物,然后觀察一段時間后,比較兩組病人的康復(fù)情況。如果新藥組的康復(fù)情況顯著優(yōu)于現(xiàn)有藥物組,那么公司就可以得出結(jié)論,新藥更有效。具體來說,公司可以提出原假設(shè),即新藥和現(xiàn)有藥物的療效沒有差異,然后根據(jù)實驗數(shù)據(jù)計算檢驗統(tǒng)計量,如果p值小于α,則拒絕原假設(shè),認為新藥更有效;如果p值大于α,則不能拒絕原假設(shè),認為沒有足夠的證據(jù)表明新藥更有效。四、計算題答案及解析1.答案:Z=(1500-1500)/(100/√16)=0。因為0<1.645,所以不能拒絕原假設(shè)。在顯著性水平α=0.05下,沒有足夠的證據(jù)表明該廠生產(chǎn)的燈泡壽命顯著高于1500小時。解析:首先,提出原假設(shè)H?:μ≤1500,備擇假設(shè)H?:μ>1500。因為總體標(biāo)準(zhǔn)差σ=100是已知的,且樣本量n=16,所以選擇Z檢驗。顯著性水平α=0.05,單邊檢驗的臨界值為Z_(0.95)≈1.645。計算檢驗統(tǒng)計量Z=(x?-μ?)/(σ/√n)=(1500-1500)/(100/√16)=0。因為計算出的Z值0<1.645,所以不能拒絕原假設(shè)。即在顯著性水平α=0.05下,沒有足夠的證據(jù)表明該廠生產(chǎn)的燈泡壽命顯著高于1500小時。2.答案:肥料A的樣本均值x?_A=112.5,樣本標(biāo)準(zhǔn)差s_A≈17.88;肥料B的樣本均值x?_B=107.5,樣本標(biāo)準(zhǔn)差s_B≈17.88。合并方差s_p2=[(10-1)×17.882+(10-1)×17.882]/(10+10-2)≈320.59,合并標(biāo)準(zhǔn)差s_p≈17.90。t=(112.5-107.5)/(17.90√(1/10+1/10))≈0.34。自由度df=10+10-2=18,雙側(cè)檢驗的臨界值t_(0.025,18)≈2.101。因為0.34<2.101,所以不能拒絕原假設(shè)。在顯著性水平α=0.05下,沒有足夠的證據(jù)表明兩種肥料的平均產(chǎn)量有顯著差異。解析:因為樣本量n=10比較小,且總體標(biāo)準(zhǔn)差未知,所以選擇t檢驗。首先,計算兩種肥料的樣本均值和樣本標(biāo)準(zhǔn)差。肥料A的樣本均值x?_A=(90+95+...+135)/10=112.5,樣本標(biāo)準(zhǔn)差s_A=√[(Σ(x_i-x?_A)2)/9]≈17.88。肥料B的樣本均值x?_B=(85+90+...+130)/10=107.5,樣本標(biāo)準(zhǔn)差s_B=√[(Σ(x_i-x?_B)2)/9]≈17.88。然后,計算合并方差s_p2=[(n_A-1)s_A2+(n_B-1)s_B2]/(n_A+n_B-2)=[(10-1)×17.882+(10-1)×17.882]/(10+10-2)≈320.59,合并標(biāo)準(zhǔn)差s_p≈17.90。接下來,計算t統(tǒng)計量t=(x?_A-x?_B)/(s_p√(1/n_A+1/n_B))=(112.5-107.5)/(17.90√(1/10+1/10))≈0.34。最后,找到t分布的臨界值t_(α,df),自由度df=n_A+n_B-2=10+10-2=18,查t分布表,α=0.05,雙側(cè)檢驗,t_(0.025,18)≈2.101。因為計算出的t值0.34<2.101,所以不能拒絕原假設(shè)。即在顯著性水平α=0.05下,沒有足夠的證據(jù)表明兩種肥料的平均產(chǎn)量有顯著差異。3.答案:p?=8/100=0.08,p?=0.05,n=100。Z=(0.08-0.05)/√(0.05×0.95/100)=3/0.02236≈134.16。單邊檢驗的臨界值為Z_(0.99)≈2.33。因為134.16>2.33,所以拒絕原假設(shè)。在顯著性水平α=0.01下,有足夠的證據(jù)表明該產(chǎn)品的次品率顯著高于0.05。解析:因為次品率p服從二項分布,樣本量n=100比較大,所以選擇Z檢驗。首先,提出原假設(shè)H?:p≤0.05,備擇假設(shè)H?:p>0.05。顯著性水平α=0.01,單邊檢驗的臨界值為Z_(0.99)≈2.33。計算檢驗統(tǒng)計量Z=(p?-p?)/√(p?(1-p?)/n)=(0.08-0.05)/√(0.05×0.95/100)=0.03/0.02236≈134.16。因為計算出的Z值134.16>2.33,所以拒絕原假設(shè)。即在顯著性水平α=0.01下,有足夠的證據(jù)表明該產(chǎn)品的次品率顯著高于0.05。4.答案:治療方法A的樣本均值x?_A=14,樣本標(biāo)準(zhǔn)差s_A≈5.83;治療方法B的樣本均值x?_B=15,樣本標(biāo)準(zhǔn)差s_B≈5.83。合并方差s_p2=[(10-1)×5.832+(10-1)×5.832]/(10+10-2)≈34.01,合并標(biāo)準(zhǔn)差s_p≈5.83。t=(14-15)/(5.83√(1/10+1/10))≈-0.34。自由度df=10+10-2=18,雙側(cè)檢驗的臨界值t_(0.025,18)≈2.101。因為-0.34<-2.101,所以不能拒絕原假設(shè)。在顯著性水平α=0.05下,沒有足夠的證據(jù)表明兩種治療方法的平均康復(fù)時間有顯著差異。解析:因為樣本量n=10比較小,且總體標(biāo)準(zhǔn)差未知,所以選擇t檢驗。首先,計算兩種治療方法的樣本均值和樣本標(biāo)準(zhǔn)差。治療方法A的樣本均值x?_A=(5+7+...+23)/10=14,樣本標(biāo)準(zhǔn)差s_A=√[(Σ(x_i-x?_A)2)/9]≈5.83。治療方法B的樣本均值x?_B=(6+8+...+24)/10=15,樣本標(biāo)準(zhǔn)差s_B=√[(Σ(x_i-x?_B)2)/9]≈5.83。然后,計算合并方差s_p2=[(n_A-1)s_A2+(n_B-1)s_B2]/(n_A+n_B-2)=[(10-1)×5.832+(10-1)×5.832]/(10+10-2)≈34.01,合并標(biāo)準(zhǔn)差s_p≈5.83。接下來,計算t統(tǒng)計量t=(x?_A-x?_B)/(s_p√(1/n_A+1/n_B))=(14-15)/(5.83√(1/10+1/10))≈-0.34。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論