2025年統(tǒng)計(jì)學(xué)期末考試:統(tǒng)計(jì)推斷與檢驗(yàn)線性回歸試題試卷_第1頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試:統(tǒng)計(jì)推斷與檢驗(yàn)線性回歸試題試卷_第2頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試:統(tǒng)計(jì)推斷與檢驗(yàn)線性回歸試題試卷_第3頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試:統(tǒng)計(jì)推斷與檢驗(yàn)線性回歸試題試卷_第4頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試:統(tǒng)計(jì)推斷與檢驗(yàn)線性回歸試題試卷_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年統(tǒng)計(jì)學(xué)期末考試:統(tǒng)計(jì)推斷與檢驗(yàn)線性回歸試題試卷考試時(shí)間:______分鐘總分:______分姓名:______一、單項(xiàng)選擇題(本大題共20小題,每小題1分,共20分。在每小題列出的四個(gè)選項(xiàng)中,只有一項(xiàng)是最符合題目要求的,請(qǐng)將正確選項(xiàng)字母填在題后的括號(hào)內(nèi)。)1.在參數(shù)估計(jì)中,若我們希望估計(jì)值與真實(shí)值之間的偏差盡可能小,應(yīng)選擇哪種估計(jì)方法?A.最大似然估計(jì)B.矩估計(jì)C.貝葉斯估計(jì)D.最小二乘估計(jì)2.對(duì)于一個(gè)正態(tài)分布的總體,其均值和方差的估計(jì)值分別為多少?A.樣本均值和樣本方差B.樣本均值和總體方差C.總體均值和樣本方差D.總體均值和總體方差3.在假設(shè)檢驗(yàn)中,第一類錯(cuò)誤的概率是多少?A.αB.βC.1-αD.1-β4.對(duì)于一個(gè)雙尾檢驗(yàn),如果顯著性水平為0.05,那么拒絕域的面積是多少?A.0.05B.0.025C.0.10D.0.0255.在回歸分析中,殘差平方和(RSS)是如何計(jì)算的?A.實(shí)際值與預(yù)測(cè)值之差的平方和B.預(yù)測(cè)值與均值之差的平方和C.實(shí)際值與均值之差的平方和D.預(yù)測(cè)值與實(shí)際值之差的平方和6.在線性回歸模型中,如何檢驗(yàn)回歸系數(shù)的顯著性?A.F檢驗(yàn)B.t檢驗(yàn)C.χ2檢驗(yàn)D.Z檢驗(yàn)7.如果一個(gè)線性回歸模型的R2值為0.8,那么模型解釋了多少比例的因變量變異?A.80%B.20%C.100%D.無(wú)法確定8.在多重線性回歸中,如何處理多重共線性問(wèn)題?A.增加樣本量B.使用嶺回歸C.使用LASSO回歸D.以上都是9.在時(shí)間序列分析中,ARIMA模型通常用于什么情況?A.平穩(wěn)時(shí)間序列B.非平穩(wěn)時(shí)間序列C.季節(jié)性時(shí)間序列D.以上都是10.在假設(shè)檢驗(yàn)中,如果p值小于顯著性水平,我們應(yīng)該怎么做?A.接受原假設(shè)B.拒絕原假設(shè)C.無(wú)法確定D.重新收集數(shù)據(jù)11.在參數(shù)估計(jì)中,置信區(qū)間的寬度取決于什么?A.樣本量B.置信水平C.標(biāo)準(zhǔn)誤差D.以上都是12.在線性回歸中,如何檢驗(yàn)?zāi)P偷恼w顯著性?A.F檢驗(yàn)B.t檢驗(yàn)C.χ2檢驗(yàn)D.Z檢驗(yàn)13.在回歸分析中,如果殘差呈現(xiàn)異方差性,我們應(yīng)該怎么做?A.使用加權(quán)最小二乘法B.使用普通最小二乘法C.增加樣本量D.無(wú)法確定14.在時(shí)間序列分析中,ACF圖通常用于什么目的?A.檢驗(yàn)時(shí)間序列的平穩(wěn)性B.識(shí)別時(shí)間序列的階數(shù)C.估計(jì)時(shí)間序列的參數(shù)D.以上都是15.在假設(shè)檢驗(yàn)中,如果p值大于顯著性水平,我們應(yīng)該怎么做?A.接受原假設(shè)B.拒絕原假設(shè)C.無(wú)法確定D.重新收集數(shù)據(jù)16.在參數(shù)估計(jì)中,無(wú)偏估計(jì)量的特點(diǎn)是是什么?A.估計(jì)量的期望值等于真實(shí)值B.估計(jì)量的方差最小C.估計(jì)量的標(biāo)準(zhǔn)差最小D.以上都是17.在線性回歸中,如何處理自相關(guān)問(wèn)題?A.使用廣義最小二乘法B.使用普通最小二乘法C.增加樣本量D.無(wú)法確定18.在時(shí)間序列分析中,PACF圖通常用于什么目的?A.檢驗(yàn)時(shí)間序列的平穩(wěn)性B.識(shí)別時(shí)間序列的階數(shù)C.估計(jì)時(shí)間序列的參數(shù)D.以上都是19.在假設(shè)檢驗(yàn)中,如果樣本量較小,我們應(yīng)該怎么做?A.使用t檢驗(yàn)B.使用Z檢驗(yàn)C.增加樣本量D.無(wú)法確定20.在參數(shù)估計(jì)中,有效估計(jì)量的特點(diǎn)是是什么?A.估計(jì)量的方差最小B.估計(jì)量的標(biāo)準(zhǔn)差最小C.估計(jì)量的期望值等于真實(shí)值D.以上都是二、多項(xiàng)選擇題(本大題共10小題,每小題2分,共20分。在每小題列出的五個(gè)選項(xiàng)中,有多項(xiàng)符合題目要求,請(qǐng)將正確選項(xiàng)字母填在題后的括號(hào)內(nèi)。)1.在參數(shù)估計(jì)中,以下哪些方法可以用于估計(jì)總體參數(shù)?A.最大似然估計(jì)B.矩估計(jì)C.貝葉斯估計(jì)D.最小二乘估計(jì)E.矩估計(jì)2.在假設(shè)檢驗(yàn)中,以下哪些是常見(jiàn)的檢驗(yàn)方法?A.F檢驗(yàn)B.t檢驗(yàn)C.χ2檢驗(yàn)D.Z檢驗(yàn)E.卡方檢驗(yàn)3.在回歸分析中,以下哪些是常見(jiàn)的回歸模型?A.線性回歸B.邏輯回歸C.嶺回歸D.LASSO回歸E.多項(xiàng)式回歸4.在時(shí)間序列分析中,以下哪些是常見(jiàn)的時(shí)間序列模型?A.ARIMA模型B.指數(shù)平滑模型C.移動(dòng)平均模型D.自回歸模型E.季節(jié)性模型5.在參數(shù)估計(jì)中,以下哪些是常見(jiàn)的估計(jì)量?A.樣本均值B.樣本方差C.樣本標(biāo)準(zhǔn)差D.總體均值E.總體方差6.在假設(shè)檢驗(yàn)中,以下哪些是常見(jiàn)的假設(shè)檢驗(yàn)類型?A.雙尾檢驗(yàn)B.單尾檢驗(yàn)C.配對(duì)檢驗(yàn)D.獨(dú)立檢驗(yàn)E.非參數(shù)檢驗(yàn)7.在回歸分析中,以下哪些是常見(jiàn)的回歸診斷方法?A.殘差分析B.多重共線性檢驗(yàn)C.自相關(guān)檢驗(yàn)D.異方差性檢驗(yàn)E.正態(tài)性檢驗(yàn)8.在時(shí)間序列分析中,以下哪些是常見(jiàn)的ACF圖和PACF圖的應(yīng)用?A.檢驗(yàn)時(shí)間序列的平穩(wěn)性B.識(shí)別時(shí)間序列的階數(shù)C.估計(jì)時(shí)間序列的參數(shù)D.預(yù)測(cè)時(shí)間序列的未來(lái)值E.分析時(shí)間序列的結(jié)構(gòu)9.在假設(shè)檢驗(yàn)中,以下哪些是常見(jiàn)的樣本量選擇方法?A.根據(jù)研究問(wèn)題選擇B.根據(jù)統(tǒng)計(jì)功效選擇C.根據(jù)置信水平選擇D.根據(jù)顯著性水平選擇E.根據(jù)研究預(yù)算選擇10.在參數(shù)估計(jì)中,以下哪些是常見(jiàn)的估計(jì)量性質(zhì)?A.無(wú)偏性B.有效性C.一致性D.穩(wěn)健性E.效率三、簡(jiǎn)答題(本大題共5小題,每小題4分,共20分。請(qǐng)將答案寫在答題紙上。)1.簡(jiǎn)述假設(shè)檢驗(yàn)的基本步驟。在教學(xué)中,我會(huì)這樣跟同學(xué)們講:首先,你得有個(gè)明確的原假設(shè)H?,這就像是你一開(kāi)始堅(jiān)信的觀點(diǎn),得具體點(diǎn),比如“這個(gè)藥沒(méi)用”。然后呢,你得有個(gè)備擇假設(shè)H?,這就像是你要證明的那個(gè)新觀點(diǎn),也得具體,比如“這個(gè)藥有用”。接下來(lái),選個(gè)顯著性水平α,這就像是你要多大的把握才能推翻你的原假設(shè),一般咱們用0.05,就是有5%的概率會(huì)犯“想當(dāng)然”的錯(cuò)誤。然后,根據(jù)你的數(shù)據(jù),算個(gè)檢驗(yàn)統(tǒng)計(jì)量,這得看你用啥檢驗(yàn),比如t值或者z值。接著,根據(jù)這個(gè)統(tǒng)計(jì)量和你的α,找出拒絕域,這就像是劃個(gè)線,統(tǒng)計(jì)量要是跨過(guò)這條線,就說(shuō)明你的數(shù)據(jù)不太符合原假設(shè)。最后,看看你的統(tǒng)計(jì)量是不是在拒絕域里,如果在,你就拒絕原假設(shè),說(shuō)有足夠證據(jù)支持備擇假設(shè);如果不在,你就沒(méi)理由拒絕原假設(shè),得承認(rèn)你一開(kāi)始的觀點(diǎn)還站得住腳。整個(gè)過(guò)程,其實(shí)就是用數(shù)學(xué)語(yǔ)言,幫我們做“有罪推定”,得證據(jù)確鑿了才定罪,不能光憑感覺(jué)。2.解釋什么是置信區(qū)間,并說(shuō)明其寬度受哪些因素影響。咱們?cè)谡n堂上經(jīng)常用“投籃”來(lái)比喻這個(gè)。想象一下,你不是一個(gè)神射手,每次投籃可能偏左,可能偏右。你扔了十次,根據(jù)這十次,你大概知道你的投籃水平,你能畫個(gè)范圍,比如從籃筐旁邊到三分線遠(yuǎn),你敢說(shuō)下一次投籃會(huì)在這個(gè)范圍內(nèi)嗎?這個(gè)范圍就是置信區(qū)間。它不是說(shuō)你100%肯定投籃會(huì)在這個(gè)區(qū),而是說(shuō)你如果你重復(fù)做這個(gè)實(shí)驗(yàn)很多次,每次都畫個(gè)這樣的范圍,那么理論上,有95%(如果置信水平是95%)的這些范圍會(huì)正好套住真正的投籃水平(也就是總體參數(shù))。這個(gè)范圍寬窄,跟你扔的次數(shù)(樣本量)有關(guān),扔的次數(shù)越多,你越確定,范圍就越窄;跟你有多“自信”也有關(guān),你要是特別自信,要求99%的概率包含真值,那范圍肯定比只要求95%寬;還跟你扔得有多準(zhǔn)(標(biāo)準(zhǔn)差)有關(guān),如果每次都扔得東倒西歪,波動(dòng)大,那范圍肯定也寬。簡(jiǎn)單說(shuō),樣本量大、置信水平低、數(shù)據(jù)波動(dòng)小,范圍就窄。3.描述線性回歸模型中殘差平方和(RSS)和回歸平方和(TSS)的含義,并說(shuō)明總平方和(SST)是如何分解的。在教這個(gè)的時(shí)候,我可能會(huì)拿起一個(gè)籃球,說(shuō):“你看這個(gè)籃球,它有高度也有寬度,我們想研究的是它的高度(因變量)跟什么有關(guān),比如它被扔出去的角度(自變量)。我們根據(jù)角度預(yù)測(cè)了它的高度,但實(shí)際扔出來(lái),它可能比預(yù)測(cè)的高一點(diǎn),也可能低一點(diǎn),這個(gè)差就是我們說(shuō)的殘差。殘差平方和(RSS),就是把所有這些差都平方了,再把它們加起來(lái),這代表了我們預(yù)測(cè)多‘不靠譜’的總程度,就是誤差本身帶來(lái)的變異。而回歸平方和(TSS),就像是把籃球扔出去后,我們根據(jù)角度預(yù)測(cè)它應(yīng)該達(dá)到的高度,這個(gè)預(yù)測(cè)值和籃球?qū)嶋H平均高度(均值)之間的差距的總和,再平方加起來(lái),這代表了我們用角度這個(gè)因素能解釋掉的高度變異。那總平方和(SST),就是籃球?qū)嶋H高度和它平均高度之間的差距的總和,再平方加起來(lái),這代表了籃球高度總的變異量。你看,籃球的總變異(SST),要么是誤差引起的(RSS),要么是我們解釋掉的(TSS),這兩者加起來(lái),就應(yīng)該等于總變異量。這就是SST=RSS+TSS的由來(lái),它告訴我們,我們模型解釋的能力,就是看TSS里有多少是由RSS貢獻(xiàn)的。”4.解釋多重共線性對(duì)線性回歸模型有什么影響。講到多重共線性的時(shí)候,我可能會(huì)打個(gè)比方:想象一下,你在一個(gè)迷宮里找出口,你拿著兩個(gè)完全一樣的指南針,一個(gè)指向北,另一個(gè)也恰好指向北,你根據(jù)哪個(gè)指南針走呢?反正都一樣嘛。這個(gè)指南針,就有點(diǎn)像多重共線性。在回歸里,如果你有幾個(gè)自變量,它們高度相關(guān),比如你同時(shí)用‘身高’和‘臂長(zhǎng)’來(lái)預(yù)測(cè)‘腿長(zhǎng)’,那‘身高’和‘臂長(zhǎng)’這兩個(gè)“指南針”就差不多指向同一個(gè)方向,你的模型就搞不明白了,分不清是‘身高’還是‘臂長(zhǎng)’對(duì)‘腿長(zhǎng)’影響更大。這種情況下,你的回歸系數(shù)的估計(jì)值可能會(huì)變得非常不穩(wěn)定,一點(diǎn)風(fēng)吹草動(dòng)(比如換個(gè)樣本),系數(shù)的符號(hào)都可能變,甚至可能變得沒(méi)有意義。而且,你很難說(shuō)哪個(gè)自變量對(duì)因變量真的有顯著影響,因?yàn)樗鼈兌荚凇盎ハ嘀钢更c(diǎn)點(diǎn)”。所以,多重共線性雖然不會(huì)讓你的模型預(yù)測(cè)能力變差(RSS可能還是小的),但會(huì)讓你的模型解釋能力變得很糟糕,你無(wú)法從系數(shù)大小判斷自變量的重要性。5.簡(jiǎn)述時(shí)間序列分析中ACF圖和PACF圖的基本用途。在講解ACF和PACF圖的時(shí)候,我會(huì)說(shuō):“這兩個(gè)圖是時(shí)間序列分析里的‘偵探工具’,幫助我們看清時(shí)間序列的‘性格’。ACF圖,就像是看一個(gè)人的‘遠(yuǎn)期影響’。你今天心情不好,可能會(huì)影響你明天的心情,但也可能慢慢影響你一周后的心情,但肯定不可能影響到你一個(gè)月前的心情。ACF圖就是看當(dāng)前時(shí)間點(diǎn)上的值,與過(guò)去多個(gè)時(shí)間點(diǎn)上的值之間的‘相關(guān)性’逐漸減弱的速度。如果ACF圖顯示出一種明顯的衰減模式,比如拖得很長(zhǎng),那可能說(shuō)明這個(gè)時(shí)間序列有‘自相關(guān)性’,它的過(guò)去行為會(huì)影響它的現(xiàn)在。PACF圖呢,就像是看一個(gè)人的‘直接影響’。它專門看當(dāng)前時(shí)間點(diǎn)上的值,與過(guò)去某個(gè)特定時(shí)間點(diǎn)上的值之間的‘相關(guān)性’,并且已經(jīng)‘過(guò)濾掉了’所有中間時(shí)間點(diǎn)的影響。比如,PACF圖直接看今天和一個(gè)月前的相關(guān)性,是排除了中間兩周、三周等所有時(shí)間點(diǎn)相關(guān)性的結(jié)果。所以,PACF圖在哪個(gè)滯后處截?cái)啵ㄍ蝗蛔兊煤苄』蛘呓咏?),就暗示著時(shí)間序列可能是一個(gè)多少階的自回歸模型。這兩個(gè)圖合起來(lái)看,就像給時(shí)間序列做了個(gè)‘CT掃描’,能幫我們判斷它到底有啥‘內(nèi)部結(jié)構(gòu)’,是隨機(jī)亂晃還是有點(diǎn)規(guī)律,規(guī)律又是什么?!彼摹⒄撌鲱}(本大題共2小題,每小題10分,共20分。請(qǐng)將答案寫在答題紙上。)1.論述在假設(shè)檢驗(yàn)中,選擇顯著性水平α的意義和影響。在課堂上,我會(huì)這樣展開(kāi):選擇顯著性水平α,其實(shí)就像是咱們?cè)谧鰶Q策前,得定個(gè)“容忍錯(cuò)誤”的底線。咱們做假設(shè)檢驗(yàn),本質(zhì)上就是在跟不確定性較勁,要么是犯“棄真錯(cuò)誤”(本來(lái)假設(shè)是對(duì)的,咱們卻給否了,這就好比冤枉了好人),要么是犯“取偽錯(cuò)誤”(本來(lái)假設(shè)是錯(cuò)的,咱們卻沒(méi)否掉,這就好比放跑了壞人)。α,就是咱們?cè)敢饷暗淖畲蟆霸┩骱萌恕钡娘L(fēng)險(xiǎn),也就是犯第一類錯(cuò)誤的概率。這個(gè)α選多大,得看具體情況。比如,在醫(yī)學(xué)上檢驗(yàn)新藥,要是選了0.05,意味著有5%的概率把一個(gè)沒(méi)效果的藥當(dāng)成有效的,這可能是致命的,所以α得選小點(diǎn),比如0.01,甚至更小,咱們得更“謹(jǐn)慎”,需要更確鑿的證據(jù)才能說(shuō)藥有用。而在有些商業(yè)決策里,比如檢驗(yàn)新廣告效果,犯這種錯(cuò)的后果沒(méi)那么嚴(yán)重,α選大點(diǎn),比如0.10,咱們可能更“樂(lè)觀”,只要有稍微點(diǎn)苗頭,就覺(jué)得廣告可能有用,早點(diǎn)去推廣。α選小了,可能咱們就錯(cuò)過(guò)了很多機(jī)會(huì)(漏掉了有用的東西);α選大了,咱們又可能把很多沒(méi)用的東西當(dāng)成了有用的,浪費(fèi)資源,還可能做出錯(cuò)誤的決策。所以,選α是個(gè)權(quán)衡,得根據(jù)你研究的問(wèn)題、錯(cuò)誤的后果嚴(yán)重程度來(lái)定。它直接影響著你的拒絕域的大小,α越小,拒絕域越小,你越難拒絕原假設(shè);α越大,拒絕域越大,你越容易拒絕原假設(shè)。它就像是你設(shè)的“證據(jù)確鑿度”的標(biāo)準(zhǔn),標(biāo)準(zhǔn)定得越高(α越?。阍讲蝗菀住安萋省钡氐贸鼋Y(jié)論。2.結(jié)合實(shí)際案例,論述如何利用線性回歸模型進(jìn)行預(yù)測(cè),并說(shuō)明需要注意哪些問(wèn)題。我可能會(huì)舉一個(gè)咱們生活中常見(jiàn)的例子,比如預(yù)測(cè)房?jī)r(jià)。假設(shè)你想根據(jù)房屋的面積、房間數(shù)和建造年份來(lái)預(yù)測(cè)它的價(jià)格。這就是一個(gè)典型的線性回歸問(wèn)題。你先收集一堆房子的數(shù)據(jù),面積多少平米,有幾間房,建了幾年,以及它們當(dāng)前的價(jià)格。然后,你用這些數(shù)據(jù)來(lái)建立一個(gè)回歸模型,模型可能會(huì)告訴你,每增加一平米,價(jià)格大概漲多少;每多一間房,價(jià)格大概漲多少;房齡每增加一年,價(jià)格大概跌多少。建立好模型后,你就可以用它來(lái)預(yù)測(cè)一個(gè)“新”房子,比如一個(gè)100平米、3個(gè)房間、5年房齡的房子大概值多少錢了。你只需要把面積、房間數(shù)、年份代入模型公式,算出來(lái)的結(jié)果就是預(yù)測(cè)價(jià)格。但是,預(yù)測(cè)不是算命,咱們得知道可能出錯(cuò)。首先,模型是基于歷史數(shù)據(jù)建立的,未來(lái)的市場(chǎng)情況可能會(huì)變,比如政策調(diào)整、經(jīng)濟(jì)波動(dòng),模型可能就不靈光了。其次,咱們用的可能是線性關(guān)系,但現(xiàn)實(shí)世界往往不是線性的,比如面積超過(guò)一定點(diǎn),價(jià)格增長(zhǎng)可能就慢了。第三,模型可能沒(méi)考慮到其他重要因素,比如地理位置、裝修情況、學(xué)區(qū)等,這些沒(méi)加入模型,可能會(huì)影響預(yù)測(cè)準(zhǔn)確性。第四,數(shù)據(jù)質(zhì)量很重要,如果咱們收集的面積、價(jià)格數(shù)據(jù)有誤,預(yù)測(cè)結(jié)果肯定也差。所以,用線性回歸預(yù)測(cè)時(shí),得時(shí)刻記住:預(yù)測(cè)值是個(gè)“期望值”或“平均水平”,實(shí)際值可能會(huì)有波動(dòng);要看模型擬合得好不好(看R2等指標(biāo));要檢查殘差,看看有沒(méi)有系統(tǒng)性偏差;要考慮模型的適用范圍,別把模型用到它沒(méi)學(xué)過(guò)的地方去。預(yù)測(cè)前最好再問(wèn)問(wèn)自己,這些自變量(面積、房間數(shù)、年份)真的能完全解釋房?jī)r(jià)嗎?有沒(méi)有遺漏關(guān)鍵因素?這樣預(yù)測(cè)才更有意義,結(jié)論才更可靠。本次試卷答案如下一、單項(xiàng)選擇題1.A最大似然估計(jì)通常在樣本量較大時(shí)表現(xiàn)較好,且在正態(tài)分布假設(shè)下是無(wú)偏和有效的,更符合“偏差盡可能小”的要求。解析思路:最大似然估計(jì)在大概率意義上能找到最接近真實(shí)參數(shù)的估計(jì)值,尤其當(dāng)樣本量足夠大時(shí),其估計(jì)量性質(zhì)優(yōu)良,偏差相對(duì)較小。相比之下,矩估計(jì)和貝葉斯估計(jì)在某些情況下可能有偏,最小二乘估計(jì)主要用于回歸系數(shù)估計(jì),不一定適用于所有參數(shù)估計(jì)場(chǎng)景。2.A樣本均值是總體均值的無(wú)偏估計(jì)量,樣本方差是總體方差的無(wú)偏估計(jì)量(在樣本量大于1時(shí))。解析思路:根據(jù)大數(shù)定律和中心極限定理,樣本均值作為總體均值的估計(jì)量具有無(wú)偏性,即E(樣本均值)=總體均值。樣本方差(使用n-1分母)作為總體方差估計(jì)量也是無(wú)偏的。其他選項(xiàng)要么是總體參數(shù)本身,要么是有偏估計(jì)。3.A第一類錯(cuò)誤的概率即為顯著性水平α。解析思路:假設(shè)檢驗(yàn)中,第一類錯(cuò)誤是指原假設(shè)H?為真時(shí),錯(cuò)誤地拒絕了H?,犯這種錯(cuò)誤的概率被定義為α。這是研究者事先設(shè)定的風(fēng)險(xiǎn)控制線。4.B對(duì)于雙尾檢驗(yàn),α被平均分配到兩側(cè),每側(cè)面積為α/2。解析思路:雙尾檢驗(yàn)關(guān)注的是檢驗(yàn)統(tǒng)計(jì)量是否顯著偏離中心值(無(wú)論是過(guò)大還是過(guò)?。?。因此,將α均分到兩側(cè),每側(cè)拒絕域的面積為α/2,能更全面地捕捉異常值。5.A殘差平方和是衡量模型擬合優(yōu)度的重要指標(biāo),計(jì)算的是實(shí)際觀測(cè)值與模型預(yù)測(cè)值之間差異的平方和。解析思路:線性回歸的目標(biāo)是找到最佳擬合線,而殘差(e_i=y_i-?_i)代表實(shí)際值與預(yù)測(cè)值之間的誤差。將所有誤差平方并求和,得到RSS,它反映了未被模型解釋的變異量。其他選項(xiàng)描述的是不同統(tǒng)計(jì)量。6.Bt檢驗(yàn)用于檢驗(yàn)單個(gè)回歸系數(shù)的顯著性,即該自變量對(duì)因變量的影響是否統(tǒng)計(jì)上顯著。解析思路:在線性回歸模型中,每個(gè)回歸系數(shù)(β_i)都對(duì)應(yīng)一個(gè)t統(tǒng)計(jì)量,其計(jì)算公式為t=(β_i估計(jì)值-0)/SE(β_i估計(jì)值)。通過(guò)比較t值與t分布臨界值,可以判斷該系數(shù)是否顯著異于0。F檢驗(yàn)是檢驗(yàn)整個(gè)模型的整體顯著性,Z檢驗(yàn)通常用于大樣本情況。7.AR2表示模型中自變量解釋的因變量變異的比例。解析思路:R2=1-(SSE/SST),其中SSE是殘差平方和,SST是總平方和。這個(gè)公式表明R2是總變異中由模型解釋的部分所占的百分比。例如,R2=0.8意味著模型解釋了80%的因變量變異。8.B嶺回歸通過(guò)引入L2正則化項(xiàng)(系數(shù)平方和)來(lái)懲罰過(guò)大的系數(shù),能有效緩解多重共線性問(wèn)題。解析思路:多重共線性是指自變量之間高度相關(guān),導(dǎo)致回歸系數(shù)估計(jì)不穩(wěn)定、方差增大。嶺回歸通過(guò)添加λΣβ_i2項(xiàng)到最小二乘目標(biāo)函數(shù)中,強(qiáng)制系數(shù)向零收縮,即使某些系數(shù)的估計(jì)值有所偏差,也能得到更穩(wěn)健的系數(shù)估計(jì)。LASSO回歸使用L1正則化(系數(shù)絕對(duì)值和),可能將某些系數(shù)壓縮至精確為零,實(shí)現(xiàn)變量選擇。9.AARIMA模型(自回歸積分滑動(dòng)平均模型)主要用于對(duì)具有序列相關(guān)性的非平穩(wěn)時(shí)間序列數(shù)據(jù)進(jìn)行建模和預(yù)測(cè)。解析思路:ARIMA(p,d,q)模型包含自回歸項(xiàng)(AR,捕捉過(guò)去值對(duì)現(xiàn)在值的影響,p階)、差分項(xiàng)(I,使序列平穩(wěn),d階)和移動(dòng)平均項(xiàng)(MA,捕捉誤差項(xiàng)的自相關(guān)性,q階)。它適用于有明顯趨勢(shì)或季節(jié)性的時(shí)間序列數(shù)據(jù)。10.B當(dāng)p值小于顯著性水平α?xí)r,意味著觀測(cè)到的數(shù)據(jù)在原假設(shè)成立下的概率很小,因此有足夠證據(jù)拒絕原假設(shè)。解析思路:假設(shè)檢驗(yàn)的核心是概率判斷。p值表示在H?為真時(shí),出現(xiàn)當(dāng)前或更極端樣本結(jié)果的概率。如果這個(gè)概率(p值)非常?。ㄐ∮陬A(yù)設(shè)的α),說(shuō)明“這么極端的結(jié)果純粹偶然發(fā)生的可能性不大”,因此我們有理由懷疑H?的真實(shí)性,從而選擇拒絕它。11.D置信區(qū)間的寬度受樣本量、置信水平和標(biāo)準(zhǔn)誤差的影響。解析思路:置信區(qū)間(CI)的計(jì)算公式通常為點(diǎn)估計(jì)值±(臨界值×標(biāo)準(zhǔn)誤差)。樣本量越大,標(biāo)準(zhǔn)誤差越?。ㄒ?yàn)闃?biāo)準(zhǔn)誤差通常與樣本量的平方根成反比),臨界值(由置信水平?jīng)Q定,如95%對(duì)應(yīng)約1.96)也影響寬度。因此,所有三個(gè)因素都會(huì)影響區(qū)間的寬度。12.AF檢驗(yàn)用于檢驗(yàn)線性回歸模型的整體顯著性,即所有自變量聯(lián)合起來(lái)對(duì)因變量是否有顯著影響。解析思路:F統(tǒng)計(jì)量比較的是模型解釋的變異(回歸平方和SSR)與未解釋的變異(殘差平方和SSE)的比例,即F=(SSR/df?)/(SSE/df?),其中df?和df?分別是分子和分母的自由度。如果F值顯著大于其臨界值,則拒絕“所有回歸系數(shù)均為0”的零假設(shè),認(rèn)為模型整體有效。13.A當(dāng)殘差呈現(xiàn)異方差性時(shí),意味著殘差的方差隨預(yù)測(cè)值的變化而變化,這時(shí)應(yīng)使用加權(quán)最小二乘法(WLS)來(lái)改善模型。解析思路:普通最小二乘法(OLS)假設(shè)殘差方差恒定(同方差性)。如果存在異方差性,OLS估計(jì)雖然仍然是無(wú)偏和一致的,但不再是有效的(即存在更有效的估計(jì)方法),且標(biāo)準(zhǔn)誤估計(jì)偏誤,導(dǎo)致假設(shè)檢驗(yàn)和置信區(qū)間不準(zhǔn)確。WLS通過(guò)給方差較小的殘差賦予較大的權(quán)重,給方差較大的殘差賦予較小的權(quán)重,使所有殘差的方差盡可能相等,從而得到更有效的估計(jì)。14.DACF圖和PACF圖是識(shí)別時(shí)間序列模型(特別是ARIMA模型)階數(shù)的重要工具。解析思路:ACF圖顯示了當(dāng)前時(shí)間點(diǎn)上的值與過(guò)去多個(gè)時(shí)間點(diǎn)上的值的自相關(guān)系數(shù)隨滯后期的變化。PACF圖則顯示了當(dāng)前值與過(guò)去某個(gè)特定時(shí)間點(diǎn)值的自相關(guān)系數(shù),并已排除了中間滯后項(xiàng)的影響。通過(guò)觀察這兩個(gè)圖的模式(如拖尾、截尾),可以初步判斷時(shí)間序列的AR階數(shù)(看PACF圖截尾)和MA階數(shù)(看ACF圖截尾)。15.A當(dāng)p值大于顯著性水平α?xí)r,意味著觀測(cè)到的數(shù)據(jù)在原假設(shè)成立下出現(xiàn)的概率較大,因此沒(méi)有足夠證據(jù)拒絕原假設(shè)。解析思路:與第10題相反,如果p值大于α,說(shuō)明“這么極端的結(jié)果偶然發(fā)生的可能性還不算小”,不足以讓我們懷疑H?的真實(shí)性,因此沒(méi)有理由拒絕它,即接受H?(或者說(shuō)保留H?)。這體現(xiàn)了假設(shè)檢驗(yàn)中的“不輕易否定”原則。16.A無(wú)偏估計(jì)量的特點(diǎn)是其估計(jì)量的期望值等于被估計(jì)的總體參數(shù)。解析思路:一個(gè)良好的估計(jì)量,其抽樣分布的均值應(yīng)該等于它所估計(jì)的總體參數(shù)的真值。例如,樣本均值(μ?)是總體均值(μ)的無(wú)偏估計(jì)量,因?yàn)镋(μ?)=μ。而方差最?。ㄓ行裕⒁恢滦裕颖玖吭龃髸r(shí)收斂于真值)是其他重要的估計(jì)量性質(zhì)。17.A當(dāng)線性回歸模型中存在自相關(guān)時(shí)(即殘差之間存在序列相關(guān)),OLS估計(jì)量雖然仍然是無(wú)偏和一致的,但會(huì)變得有偏且無(wú)效,標(biāo)準(zhǔn)誤估計(jì)也會(huì)偏誤。解析思路:自相關(guān)意味著模型遺漏了重要的解釋變量,或者誤差項(xiàng)本身存在相關(guān)性。這種情況下,殘差不再獨(dú)立同分布,OLS估計(jì)的系數(shù)會(huì)扭曲真實(shí)關(guān)系,導(dǎo)致模型預(yù)測(cè)不準(zhǔn)確,且相關(guān)的統(tǒng)計(jì)推斷(如t檢驗(yàn)、置信區(qū)間)失去意義。使用廣義最小二乘法(GLS)或協(xié)方差最小二乘法(COVARIANCEMINIMUMLEASTSQUARES,CMLE)可以解決此問(wèn)題。18.DPACF圖顯示了在控制了中間滯后項(xiàng)的影響后,當(dāng)前時(shí)間點(diǎn)與過(guò)去某個(gè)特定時(shí)間點(diǎn)之間的直接自相關(guān)系數(shù),常用于識(shí)別MA階數(shù)。解析思路:PACF圖衡量的是滯后k的自相關(guān),已經(jīng)“去除”了1到k-1滯后項(xiàng)的影響。例如,PACF在滯后q處截尾,意味著MA(q)模型可能合適。ACF圖則顯示總的相關(guān)性,受AR和MA項(xiàng)共同影響。兩者結(jié)合使用是識(shí)別ARIMA模型階數(shù)的關(guān)鍵。19.A當(dāng)樣本量較小時(shí),t分布比標(biāo)準(zhǔn)正態(tài)分布(Z分布)有更多的尾部,這使得拒絕域更小,更難拒絕原假設(shè),檢驗(yàn)更保守。解析思路:在樣本量小的情況下,總體標(biāo)準(zhǔn)差未知,需要用樣本標(biāo)準(zhǔn)差代替,此時(shí)應(yīng)使用t檢驗(yàn)。t分布的自由度等于樣本量減1,隨著自由度減小,t分布逐漸逼近Z分布。因此,小樣本t檢驗(yàn)更“謹(jǐn)慎”,需要更強(qiáng)的證據(jù)(更大的t值)才能拒絕H?。20.A有效估計(jì)量是指在所有無(wú)偏估計(jì)量中,方差最小的那個(gè)估計(jì)量。解析思路:有效性是衡量估計(jì)量精確性的一個(gè)標(biāo)準(zhǔn)。在無(wú)偏估計(jì)量中,方差越小,說(shuō)明該估計(jì)量的抽樣分布越集中,圍繞真值的波動(dòng)越小,估計(jì)結(jié)果越穩(wěn)定、越精確。最小二乘估計(jì)在正態(tài)分布假設(shè)下是有效估計(jì)。二、多項(xiàng)選擇題1.A,B,C最大似然估計(jì)、矩估計(jì)和貝葉斯估計(jì)都是常見(jiàn)的總體參數(shù)估計(jì)方法。最小二乘估計(jì)主要用于回歸分析中的系數(shù)估計(jì)。解析思路:參數(shù)估計(jì)的目標(biāo)是用樣本信息推斷總體參數(shù)。最大似然估計(jì)基于最大化樣本出現(xiàn)的概率,矩估計(jì)基于樣本矩和總體矩相等,貝葉斯估計(jì)基于先驗(yàn)分布和似然函數(shù)。最小二乘估計(jì)則是通過(guò)最小化實(shí)際觀測(cè)值與模型預(yù)測(cè)值之間差異的平方和來(lái)估計(jì)回歸系數(shù)。2.A,B,C,D常見(jiàn)的假設(shè)檢驗(yàn)方法包括基于t分布的t檢驗(yàn)(用于小樣本均值檢驗(yàn)、回歸系數(shù)檢驗(yàn)等)、基于F分布的F檢驗(yàn)(用于方差分析、回歸模型整體顯著性檢驗(yàn)等)、基于χ2分布的χ2檢驗(yàn)(用于擬合優(yōu)度檢驗(yàn)、獨(dú)立性檢驗(yàn)等)和基于標(biāo)準(zhǔn)正態(tài)分布的Z檢驗(yàn)(用于大樣本均值檢驗(yàn)等)。解析思路:不同的檢驗(yàn)方法對(duì)應(yīng)不同的數(shù)據(jù)類型、樣本量和檢驗(yàn)?zāi)康?。t檢驗(yàn)適用于樣本量小且總體標(biāo)準(zhǔn)差未知的情況。F檢驗(yàn)常用于比較多個(gè)均值或模型整體效果。χ2檢驗(yàn)主要用于分類數(shù)據(jù)。Z檢驗(yàn)適用于大樣本(n足夠大)且總體標(biāo)準(zhǔn)差已知,或樣本標(biāo)準(zhǔn)差可替代總體標(biāo)準(zhǔn)差的情況。3.A,C,D,E線性回歸模型包括簡(jiǎn)單線性回歸(一個(gè)自變量)、多元線性回歸(多個(gè)自變量)、嶺回歸(正則化線性回歸,處理多重共線性)、LASSO回歸(正則化線性回歸,用于變量選擇)和多項(xiàng)式回歸(非線性回歸,通過(guò)添加多項(xiàng)式項(xiàng)使模型能擬合曲線關(guān)系)。解析思路:線性回歸的核心是尋找自變量和因變量之間的線性關(guān)系。簡(jiǎn)單線性回歸是最基礎(chǔ)形式。多元線性回歸擴(kuò)展到多個(gè)自變量。嶺回歸和LASSO回歸通過(guò)添加懲罰項(xiàng)解決共線性問(wèn)題和進(jìn)行變量選擇,本質(zhì)仍是線性關(guān)系。多項(xiàng)式回歸雖然模型形式(y=β?+β?x+β?x2+...)看似非線性,但通過(guò)變換(如x2)仍可納入線性回歸框架,保持系數(shù)估計(jì)的線性特性。4.A,B,C,D時(shí)間序列分析中常用的模型包括ARIMA(自回歸積分滑動(dòng)平均模型)、指數(shù)平滑模型(如Holt-Winters模型,捕捉趨勢(shì)和季節(jié)性)、移動(dòng)平均模型(MA模型,基于誤差項(xiàng)的自相關(guān)性)、自回歸模型(AR模型,基于過(guò)去值的自相關(guān)性)以及季節(jié)性模型(專門考慮時(shí)間序列中存在的固定周期性模式)。解析思路:時(shí)間序列分析的目標(biāo)是理解序列數(shù)據(jù)中的模式(趨勢(shì)、季節(jié)性、周期性、隨機(jī)性)并進(jìn)行預(yù)測(cè)。ARIMA模型綜合了自回歸、差分和移動(dòng)平均,適用性廣。指數(shù)平滑模型簡(jiǎn)單直觀,適合具有明顯趨勢(shì)和季節(jié)性的數(shù)據(jù)。MA和AR模型是更基礎(chǔ)的構(gòu)建塊。季節(jié)性模型則直接針對(duì)固定周期模式。5.A,B,C樣本均值、樣本方差和樣本標(biāo)準(zhǔn)差都是基于樣本數(shù)據(jù)計(jì)算得到的,可以用來(lái)估計(jì)相應(yīng)的總體參數(shù)(總體均值、總體方差和總體標(biāo)準(zhǔn)差)??傮w均值和總體方差是總體參數(shù)本身,不是估計(jì)量。解析思路:估計(jì)總體參數(shù)時(shí),我們通常使用樣本統(tǒng)計(jì)量。樣本均值(x?)是總體均值(μ)的估計(jì)量。樣本方差(s2=Σ(y_i-x?)2/(n-1))是總體方差(σ2)的無(wú)偏估計(jì)量。樣本標(biāo)準(zhǔn)差(s=√s2)是總體標(biāo)準(zhǔn)差(σ)的估計(jì)量??傮w參數(shù)是未知的固定值,而樣本統(tǒng)計(jì)量是變化的。6.A,B,C,D常見(jiàn)的假設(shè)檢驗(yàn)類型包括雙尾檢驗(yàn)(關(guān)注統(tǒng)計(jì)量是否顯著偏離中心值,不分方向)、單尾檢驗(yàn)(關(guān)注統(tǒng)計(jì)量是否顯著大于或小于某個(gè)值,有方向性)、配對(duì)檢驗(yàn)(比較同一組對(duì)象在兩種不同處理下的差異,或前后測(cè)差異)、獨(dú)立檢驗(yàn)(比較兩個(gè)獨(dú)立組之間的差異)以及非參數(shù)檢驗(yàn)(不依賴數(shù)據(jù)的具體分布形態(tài),適用于非正態(tài)數(shù)據(jù)或分類數(shù)據(jù))。解析思路:假設(shè)檢驗(yàn)的類型取決于研究問(wèn)題和數(shù)據(jù)性質(zhì)。雙尾和單尾檢驗(yàn)是最基本的檢驗(yàn)形式,用于連續(xù)變量。配對(duì)檢驗(yàn)和獨(dú)立檢驗(yàn)是t檢驗(yàn)和ANOVA的擴(kuò)展形式。非參數(shù)檢驗(yàn)提供了更靈活的檢驗(yàn)手段,但通常統(tǒng)計(jì)功效低于參數(shù)檢驗(yàn)。7.A,B,C,E線性回歸診斷方法包括殘差分析(檢查殘差是否滿足同方差性、正態(tài)性、獨(dú)立性假設(shè))、多重共線性檢驗(yàn)(檢查自變量之間是否存在高度相關(guān)性,如方差膨脹因子VIF)、自相關(guān)檢驗(yàn)(檢查殘差之間是否存在序列相關(guān),如DW檢驗(yàn))、異方差性檢驗(yàn)(檢查殘差方差是否隨預(yù)測(cè)值變化而變化)以及正態(tài)性檢驗(yàn)(檢查殘差是否服從正態(tài)分布)。解析思路:建立線性回歸模型后,需要通過(guò)各種診斷方法來(lái)評(píng)估模型的假設(shè)是否滿足,以及模型的有效性。殘差是診斷的核心,它直接反映了模型擬合的好壞以及假設(shè)的違背情況。其他診斷方法則針對(duì)具體的假設(shè)進(jìn)行檢驗(yàn)。8.A,B,CACF圖和PACF圖的主要用途是幫助識(shí)別時(shí)間序列模型(特別是ARIMA模型)的自回歸階數(shù)(p)和移動(dòng)平均階數(shù)(q)。ACF圖顯示總的相關(guān)性,PACF圖顯示直接的相關(guān)性。解析思路:ACF圖從當(dāng)前滯后開(kāi)始,逐步衰減,顯示了當(dāng)前值與過(guò)去所有滯后值的相關(guān)程度。PACF圖則“跳躍式”地顯示當(dāng)前值與某個(gè)特定滯后值的相關(guān)性,已經(jīng)“剔除”了中間滯后項(xiàng)的影響。通過(guò)觀察ACF和PACF圖的截尾(在某滯后后突然變?yōu)?)或拖尾(逐漸衰減至0)模式,可以推斷ARIMA模型的階數(shù)。例如,ACF拖尾PACF在k階截尾,可能適合AR(k)模型。9.A,B,C,D樣本量選擇需要考慮研究問(wèn)題的重要性(越重要問(wèn)題,越需大樣本確保結(jié)論可靠)、統(tǒng)計(jì)功效(需要足夠樣本才有足夠把握檢測(cè)到真實(shí)差異)、置信水平和顯著性水平(通常樣本量與α和1-β有關(guān),α越小或1-β要求越高,樣本量越大)以及研究預(yù)算和可行性(實(shí)際研究中受時(shí)間和資源限制)。解析思路:樣本量不是越大越好,也不是越小越好,需要在研究目標(biāo)、統(tǒng)計(jì)嚴(yán)謹(jǐn)性和實(shí)際可行性之間取得平衡。研究問(wèn)題越關(guān)鍵,越需要排除隨機(jī)誤差的影響,樣本量就要大。檢驗(yàn)效能(1-β)要求越高,也需要更多樣本。α和1-β是相互制約的,增大一個(gè)往往需要減小另一個(gè),而平衡它們通常需要增加樣本量。當(dāng)然,現(xiàn)實(shí)中經(jīng)費(fèi)和時(shí)間是硬約束。10.A,B,C,D無(wú)偏性是指估計(jì)量的期望值等于總體參數(shù),有效性是指估計(jì)量在無(wú)偏估計(jì)中有最小方差,一致性是指估計(jì)量隨著樣本量增大而收斂于總體參數(shù),穩(wěn)健性是指估計(jì)量在模型假設(shè)輕微偏離時(shí)仍能保持良好性質(zhì)。解析思路:這些都是評(píng)價(jià)統(tǒng)計(jì)估計(jì)量好壞的重要標(biāo)準(zhǔn)。無(wú)偏性是基本要求,但不是唯一要求。有效性衡量估計(jì)的精確度。一致性保證了大樣本下估計(jì)的可靠性。穩(wěn)健性則考慮了模型假設(shè)不完美時(shí)的表現(xiàn),一個(gè)穩(wěn)健的估計(jì)量不容易因小偏差而失效。三、簡(jiǎn)答題1.假設(shè)檢驗(yàn)的基本步驟是:首先,根據(jù)研究問(wèn)題提出原假設(shè)H?和備擇假設(shè)H?。原假設(shè)通常是“沒(méi)有效果”、“沒(méi)有差異”或“關(guān)系不存在”的陳述,備擇假設(shè)則是研究者想要證明的“有效果”、“有差異”或“關(guān)系存在”的陳述。然后,選擇一個(gè)顯著性水平α,這是犯第一類錯(cuò)誤(棄真錯(cuò)誤,即H?為真卻拒絕H?)的最大容忍概率。接著,根據(jù)樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,這個(gè)統(tǒng)計(jì)量反映了樣本結(jié)果與H?的偏離程度。然后,根據(jù)選定的α和檢驗(yàn)統(tǒng)計(jì)量的分布(如t分布、Z分布、F分布),確定拒絕域,即那些足夠極端、使得我們有理由懷疑H?成立的檢驗(yàn)統(tǒng)計(jì)量取值范圍。最后,比較計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量與拒絕域的臨界值。如果統(tǒng)計(jì)量落入拒絕域,就拒絕H?,認(rèn)為有足夠證據(jù)支持H?;如果統(tǒng)計(jì)量不落入拒絕域,就沒(méi)有足夠證據(jù)拒絕H?,不能得出支持H?的結(jié)論。整個(gè)過(guò)程就像是在法庭上做判決,需要證據(jù)(樣本數(shù)據(jù))來(lái)證明有罪(H?),而證明標(biāo)準(zhǔn)(α)決定了需要多強(qiáng)的證據(jù)。2.置信區(qū)間是一個(gè)根據(jù)樣本數(shù)據(jù)估計(jì)總體參數(shù)的可能范圍,它提供了一個(gè)包含真值的概率區(qū)間。例如,95%置信區(qū)間意味著如果我們重復(fù)抽取很多組樣本,并根據(jù)每組樣本計(jì)算一個(gè)置信區(qū)間,那么理論上大約有95%的這些區(qū)間會(huì)恰好包含真正的總體參數(shù)值。置信區(qū)間的寬度受三個(gè)主要因素影響:一是樣本量,樣本量越大,估計(jì)越精確,標(biāo)準(zhǔn)誤差越小,置信區(qū)間就越窄;二是置信水平,置信水平越高(如從90%提高到99%),我們希望區(qū)間包含真值的把握越大,但代價(jià)是區(qū)間變寬;三是標(biāo)準(zhǔn)誤差,標(biāo)準(zhǔn)誤差越大(通常由樣本方差和樣本量決定),置信區(qū)間就越寬,表示估計(jì)的不確定性越大。所以,置信區(qū)間的寬度反映了我們估計(jì)的精確性和信心程度之間的權(quán)衡。3.殘差平方和(RSS)是衡量線性回歸模型中所有實(shí)際觀測(cè)值與模型預(yù)測(cè)值之間差異的平方和,它代表了模型未能解釋的變異量,也就是誤差項(xiàng)的總平方和?;貧w平方和(TSS)是衡量所有實(shí)際觀測(cè)值與因變量均值之間差異的平方和,它代表了因變量總變異量中由模型解釋的那部分??偲椒胶停⊿ST)是衡量所有實(shí)際觀測(cè)值與因變量均值之間差異的平方和,它代表了因變量的總變異量。在線性回歸中,總變異量可以分解為兩部分:一部分是被模型解釋掉的,另一部分是模型未能解釋的。因此,總平方和SST就等于回歸平方和TSS加上殘差平方和RSS,即SST=TSS+RSS。這個(gè)分解關(guān)系反映了線性回歸模型的基本思想:總變異=可解釋變異+不可解釋變異。4.多重共線性是指線性回歸模型中的多個(gè)自變量之間存在高度線性相關(guān)關(guān)系。這會(huì)導(dǎo)致回歸系數(shù)的估計(jì)變得非常不穩(wěn)定:一點(diǎn)點(diǎn)的數(shù)據(jù)變動(dòng)或模型調(diào)整,都可能導(dǎo)致系數(shù)估計(jì)值發(fā)生劇烈變化,甚至符號(hào)相反。同時(shí),由于自變量高度相關(guān),模型很難區(qū)分每個(gè)自變量對(duì)因變量的獨(dú)立影響,使得單個(gè)系數(shù)的顯著性檢驗(yàn)結(jié)果不可靠,即使所有系數(shù)聯(lián)合起來(lái)對(duì)因變量有顯著影響,單個(gè)系數(shù)也可能不顯著。此外,多重共線性還會(huì)導(dǎo)致模型解釋能力差,我們無(wú)法從系數(shù)大小判斷哪個(gè)自變量更重要。解決多重共線性問(wèn)題,常用的方法包括:移除一些高度相關(guān)的自變量、合并相關(guān)的自變量、增加樣本量、使用嶺回歸或LASSO回歸等正則化方法,或者使用主成分回歸等方法來(lái)降維。5.在時(shí)間序列分析中,ACF圖(自相關(guān)函數(shù)圖)顯示了時(shí)間序列在當(dāng)前時(shí)刻與其過(guò)去不同滯后時(shí)刻之間的相關(guān)程度。它幫助我們判斷序列是否存在自相關(guān)性,即過(guò)去值對(duì)現(xiàn)在值的影響。如果ACF圖顯示相關(guān)系數(shù)隨著滯后期的增加而緩慢衰減,說(shuō)明序列存在較強(qiáng)的自相關(guān)性,可能適合用ARIMA模型中的自回歸項(xiàng)(AR)來(lái)建模。PACF圖(偏自相關(guān)函數(shù)圖)則顯

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論