版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
統(tǒng)計與決策在2025年應用案例分析,大學期末考試試題庫考試時間:______分鐘總分:______分姓名:______一、假設某電商平臺想要分析用戶購買行為,以提高轉(zhuǎn)化率。他們收集了一周內(nèi)1000名用戶的瀏覽數(shù)據(jù),其中包含用戶年齡(單位:歲)、頁面瀏覽量(PV,單位:頁)和最終是否購買(購買=1,未購買=0)。研究者想了解用戶年齡與頁面瀏覽量之間的關系,并希望根據(jù)這些數(shù)據(jù)建立一個模型來預測用戶購買的可能性。1.請簡述在分析用戶年齡與頁面瀏覽量關系時,選擇散點圖或相關系數(shù)矩陣這兩種可視化/統(tǒng)計方法的理由,并說明選擇線性相關系數(shù)時需要考慮的前提條件。2.假設經(jīng)過分析發(fā)現(xiàn)年齡與頁面瀏覽量之間存在一定的線性關系,研究者決定使用簡單線性回歸模型`PV=β?+β?Age+ε`來描述這種關系。請解釋回歸系數(shù)`β?`在此情境下的具體含義。如果模型估計得到的`β?`為負值,試解釋其可能的市場含義。3.在使用回歸模型預測時,研究者需要評估模型的擬合優(yōu)度。請說明決定系數(shù)R2的含義。若該回歸模型的R2為0.15,試評價該模型對頁面瀏覽量的解釋能力,并簡述R2值較低可能的原因。二、某制造企業(yè)生產(chǎn)一種關鍵零件,現(xiàn)有兩種不同的生產(chǎn)方法(方法A和方法B)。企業(yè)希望判斷兩種方法生產(chǎn)的零件平均強度是否存在顯著差異,以保證產(chǎn)品質(zhì)量。質(zhì)檢部門隨機抽取了50個零件,其中25個由方法A生產(chǎn),25個由方法B生產(chǎn)。測試得到零件強度數(shù)據(jù)(單位:MPa),初步計算結(jié)果顯示,方法A生產(chǎn)的零件樣本均值為720,樣本標準差為45;方法B生產(chǎn)的零件樣本均值為700,樣本標準差為50。1.為了檢驗兩種生產(chǎn)方法生產(chǎn)的零件平均強度是否存在差異,請寫出原假設H?和備擇假設H?。2.在進行假設檢驗時,選擇顯著性水平α=0.05。請解釋什么是顯著性水平α,并說明犯第一類錯誤(即拒絕H?時H?為真)的概率是多少。3.根據(jù)所給數(shù)據(jù),計算檢驗統(tǒng)計量的值(請說明是使用t檢驗還是z檢驗,并給出計算結(jié)果或公式推導過程的關鍵步驟)。4.根據(jù)計算出的檢驗統(tǒng)計量,判斷是否拒絕原假設H?。簡要說明你的結(jié)論依據(jù)。三、某公司正在考慮是否推出一款新產(chǎn)品。市場部提供了以下信息:如果推出產(chǎn)品成功,預計可帶來1000萬元的利潤;如果推出產(chǎn)品失敗,將損失200萬元。根據(jù)市場分析,預計產(chǎn)品成功的概率為30%,失敗的概率為70%。公司管理層需要基于這些信息做出決策。1.請計算該決策的期望收益(ExpectedValue,EV)。2.除了期望收益,決策者還可能考慮風險。請解釋什么是機會損失(OpportunityLoss),并計算該決策對應的機會損失表。3.如果公司管理層使用期望值法進行決策,他們應該選擇推出產(chǎn)品還是不推出產(chǎn)品?請說明理由。4.假設通過改進營銷策略,產(chǎn)品成功的概率提高到50%,失敗的概率降至50%。請重新計算期望收益,并說明這一概率變化對公司決策可能產(chǎn)生的影響。四、隨著大數(shù)據(jù)技術的發(fā)展,保險公司開始利用客戶的多種數(shù)據(jù)來評估其理賠風險。某保險公司希望建立一個模型來預測客戶在未來一年內(nèi)發(fā)生理賠的概率(即理賠風險)。他們收集了1000名客戶的樣本數(shù)據(jù),包括年齡(Age)、年收入(Income,單位:萬元)、過去三年理賠次數(shù)(Claims)、是否擁有房產(chǎn)(OwnHome,1=是,0=否)等變量。經(jīng)過數(shù)據(jù)探索和特征工程,他們決定使用邏輯回歸模型`log(p/(1-p))=β?+β?Age+β?Income+β?Claims+β?OwnHome`來構(gòu)建風險評估模型。1.請解釋邏輯回歸模型中,為什么使用`log(p/(1-p))`(即邏輯函數(shù)的逆,logit)作為因變量,以及模型估計出的系數(shù)`β?,β?,β?,β?`的含義。2.假設模型估計結(jié)果顯示`β?`為正,`β?`也為正,請解釋這兩個系數(shù)的正值分別說明了什么關于客戶特征與理賠風險關系的結(jié)論。3.在模型應用中,公司更關心將客戶正確分類(即準確預測是否會發(fā)生理賠)。請解釋什么是模型的混淆矩陣(ConfusionMatrix),并說明如何通過混淆矩陣計算準確率(Accuracy)、精確率(Precision)和召回率(Recall)這三個指標。這三個指標分別反映了模型的哪些方面性能?4.如果該公司設定,對于預測可能發(fā)生理賠的客戶,希望召回率達到至少80%(即真正例率TruePositiveRate≥80%),這意味著什么?在實際應用中,追求更高的召回率通常需要做出什么權衡?五、某公司倉庫使用線性規(guī)劃來規(guī)劃月度采購計劃,以最小化總成本,同時滿足生產(chǎn)和庫存需求。決策變量為:X?:每月采購A產(chǎn)品的數(shù)量(單位:件)X?:每月采購B產(chǎn)品的數(shù)量(單位:件)相關數(shù)據(jù)如下:*A產(chǎn)品單位采購成本:20元*B產(chǎn)品單位采購成本:30元*A產(chǎn)品單位生產(chǎn)成本:25元(采購后需加工)*B產(chǎn)品單位生產(chǎn)成本:28元(采購后需加工)*每月對A產(chǎn)品的生產(chǎn)需求下限:500件*每月對B產(chǎn)品的生產(chǎn)需求下限:800件*每月可用于采購的預算上限:20000元*每月倉庫最大存儲能力:1000件(A產(chǎn)品和B產(chǎn)品混合存儲,按需折算,假設A占1空間,B占1.5空間)假設每月生產(chǎn)需求是固定的,且倉庫存儲空間在月初為空。1.請寫出該問題的線性規(guī)劃模型,包括目標函數(shù)和所有約束條件。2.解釋約束條件`X?≥500`和`X?≥800`的實際意義。3.解釋約束條件`20X?+30X?≤20000`的實際意義。4.解釋約束條件`X?+1.5X?≤1000`的實際意義。5.假設通過求解該線性規(guī)劃模型得到最優(yōu)解為`X?=600`,`X?=800`。請計算該方案的最小總成本。試卷答案一、1.散點圖用于直觀展示兩個連續(xù)變量之間的關系形態(tài)和強弱,相關系數(shù)矩陣可以量化關系的線性程度和方向。選擇相關系數(shù)矩陣是因為需要量化年齡與頁面瀏覽量的線性關系強度。選擇線性相關系數(shù)的前提條件是:兩個變量之間的關系是線性的;數(shù)據(jù)是成對出現(xiàn)的;樣本數(shù)據(jù)來自正態(tài)分布總體或大樣本(中心極限定理);觀測值是獨立的;不存在顯著異常值。2.回歸系數(shù)`β?`表示在其他因素保持不變的情況下,用戶年齡每增加一個單位(歲),頁面瀏覽量(PV)平均變化的數(shù)值(單位:頁)。如果`β?`為負值,其市場含義可能是:隨著用戶年齡的增長,其在該平臺的頁面瀏覽量傾向于下降,可能表明年輕用戶更活躍或平臺內(nèi)容更符合年輕用戶偏好。3.決定系數(shù)R2表示因變量的變異中有多少百分比可以由自變量與因變量之間的線性關系來解釋。R2為0.15表示模型只能解釋頁面瀏覽量變異的15%。該模型對頁面瀏覽量的解釋能力較低。R2值較低的可能原因包括:年齡與頁面瀏覽量之間線性關系微弱,或者存在其他更重要的影響因素未被納入模型,或者數(shù)據(jù)測量誤差較大。二、1.原假設H?:兩種生產(chǎn)方法生產(chǎn)的零件平均強度沒有顯著差異,即μ_A=μ_B或μ_A-μ_B=0。備擇假設H?:兩種生產(chǎn)方法生產(chǎn)的零件平均強度存在顯著差異,即μ_A≠μ_B或μ_A-μ_B≠0。2.顯著性水平α=0.05是指在進行假設檢驗時,我們愿意承擔犯第一類錯誤(即錯誤地拒絕了實際上為真的原假設H?)的概率不超過5%。犯第一類錯誤的概率等于α。3.由于樣本量n_A=n_B=25較小,且總體標準差σ_A和σ_B未知,應使用t檢驗。檢驗統(tǒng)計量t的計算公式為`(x??-x??)/sqrt(s?2/n?+s?2/n?)`。代入數(shù)據(jù):`(720-700)/sqrt(452/25+502/25)=20/sqrt(810/25+2500/25)=20/sqrt(32.4+100)=20/sqrt(132.4)≈20/11.51≈1.73`。4.根據(jù)計算出的檢驗統(tǒng)計量t≈1.73。需要查找t分布表,自由度df=n?+n?-2=50-2=48,在α=0.05的顯著性水平下,雙側(cè)檢驗的臨界值t_crit≈±2.0096。由于|t|=1.73<2.0096,因此不能拒絕原假設H?。結(jié)論依據(jù)是檢驗統(tǒng)計量的值未落入拒絕域。三、1.期望收益EV=(成功收益×成功率)+(失敗損失×失敗率)=(1000萬元×0.3)+(-200萬元×0.7)=300-140=160萬元。2.機會損失是指因決策失誤而未能實現(xiàn)最佳收益的損失。機會損失表如下(單位:萬元):|決策|結(jié)果:成功|結(jié)果:失敗|最大機會損失||:---------|:--------|:--------|:----------||推出產(chǎn)品|0|-140|140||不推出產(chǎn)品|-100|0|100|(注:成功時,不推出產(chǎn)品的機會損失為100萬;失敗時,推出產(chǎn)品的機會損失為-200萬,絕對值為200萬,但表格中列的是每行決策對應的最大機會損失)更準確的機會損失表應對比決策與實際結(jié)果的收益差:|決策|若成功收益|若失敗損失|期望機會損失||:---------|:--------|:--------|:----------||推出產(chǎn)品|0|200|60||不推出產(chǎn)品|100|0|70|(期望機會損失=0.3×0+0.7×200+0.3×100+0.7×0=140+30=170。這里計算有誤,應根據(jù)收益對比。推出產(chǎn)品:若成功損失0,若失敗損失100(對比收益100),期望損失=0.3×0+0.7×100=70。不推出產(chǎn)品:若成功損失100(對比收益0),若失敗損失0,期望損失=0.3×100+0.7×0=30。)*修正機會損失計算*:對比推出產(chǎn)品(收益1000,損失-200)與不推出產(chǎn)品(收益0,損失0):-若結(jié)果成功,推出產(chǎn)品收益1000>不推出產(chǎn)品收益0,推出產(chǎn)品機會損失0。不推出產(chǎn)品機會損失1000。-若結(jié)果失敗,推出產(chǎn)品損失-200,不推出產(chǎn)品損失0。推出產(chǎn)品機會損失200。不推出產(chǎn)品機會損失0。期望機會損失:推出產(chǎn)品=0.3×0+0.7×200=140不推出產(chǎn)品=0.3×1000+0.7×0=300*再次修正*:機會損失是錯失的最大收益。推出產(chǎn)品:成功時錯失不推出產(chǎn)品的收益0,損失0。失敗時錯失不推出產(chǎn)品的收益0,損失200。期望機會損失=0.3×0+0.7×200=140。不推出產(chǎn)品:成功時錯失推出產(chǎn)品的收益1000,損失1000。失敗時錯失推出產(chǎn)品的收益0,損失0。期望機會損失=0.3×1000+0.7×0=300。*最終修正*:機會損失是選擇次優(yōu)方案本可獲得的收益。推出產(chǎn)品:若成功,選不推出產(chǎn)品可得0,損失0。若失敗,選不推出產(chǎn)品可得0,損失200。期望機會損失=0.3×0+0.7×200=140。不推出產(chǎn)品:若成功,選推出產(chǎn)品可得1000,損失1000。若失敗,選推出產(chǎn)品可得-200,損失-200。期望機會損失=0.3×1000+0.7×(-200)=300-140=160。*最簡表*:|決策|若成功(損失)|若失敗(損失)|期望損失||:---------|:------------|:------------|:-------||推出產(chǎn)品|0|200|60||不推出產(chǎn)品|1000|0|70|*重新核對*:期望損失=(成功概率×成功時損失)+(失敗概率×失敗時損失)推出產(chǎn)品:期望損失=0.3×0+0.7×200=140。不推出產(chǎn)品:期望損失=0.3×1000+0.7×0=300。*機會損失表*:|決策|成功(選A損失)|失?。ㄟxA損失)|期望機會損失||:---------|:--------------|:--------------|:-----------||推出產(chǎn)品|0|200|60||不推出產(chǎn)品|1000|0|70|3.使用期望值法決策,比較兩個方案的期望收益。推出產(chǎn)品的期望收益為160萬元,不推出產(chǎn)品的期望收益為0萬元。因為160>0,所以公司應該選擇推出產(chǎn)品。4.改進營銷后,產(chǎn)品成功概率P=0.5,失敗概率1-P=0.5。重新計算期望收益:EV=(1000萬元×0.5)+(-200萬元×0.5)=500-100=400萬元。概率變化使得產(chǎn)品的期望收益從160萬元大幅提高到400萬元。這一概率變化顯著增加了推出產(chǎn)品的吸引力,使得期望值法決策結(jié)果更有力地支持推出產(chǎn)品。決策者幾乎肯定會選擇推出產(chǎn)品。四、1.邏輯回歸模型的因變量是logit(p)=log(p/(1-p)),其中p是事件(如理賠)發(fā)生的概率。使用logit函數(shù)是因為它可以將[0,1]區(qū)間內(nèi)的概率值壓縮到整個實數(shù)軸上,便于進行線性建模。模型估計出的系數(shù)`β?,β?,β?,β?`分別表示自變量(Age,Income,Claims,OwnHome)每變化一個單位,logit(p)平均變化的數(shù)值。具體來說,`β?`表示年齡每增加1歲,logit(p)平均變化`β?`個單位;`β?`表示年收入每增加1萬元,logit(p)平均變化`β?`個單位,以此類推。系數(shù)的正負表示該自變量對logit(p)(進而對發(fā)生概率p)的促進作用或抑制作用。2.`β?`為正,表示年齡每增加1歲,logit(p)增加`β?`。因為logit(p)=log(p/(1-p)),所以log(p/(1-p))增加`β?`意味著p/(1-p)增大,進而p也增大。市場含義是:年齡越大,客戶發(fā)生理賠的概率越高。3.混淆矩陣是分類模型性能評估的基礎,它展示了模型預測結(jié)果與實際類別的關系,格式通常為:```實際\預測陽性陰性陽性TPFP陰性FNTN```其中,TP(TruePositives):真正例,模型正確預測為陽性的樣本數(shù)。FP(FalsePositives):假正例,模型錯誤預測為陽性的樣本數(shù)。FN(FalseNegatives):假負例,模型錯誤預測為陰性的樣本數(shù)。TN(TrueNegatives):真負例,模型正確預測為陰性的樣本數(shù)。準確率(Accuracy)=(TP+TN)/(TP+TN+FP+FN),表示模型所有預測中正確的比例。精確率(Precision)=TP/(TP+FP),表示被模型預測為陽性的樣本中,實際為陽性的比例。高精確率意味著模型預測的陽性結(jié)果很可靠。召回率(Recall)=TP/(TP+FN),表示實際為陽性的樣本中,被模型正確預測為陽性的比例。高召回率意味著模型能夠找出大部分真實的陽性樣本。這三個指標分別反映了模型的總體預測質(zhì)量(準確率)、預測結(jié)果的質(zhì)量(精確率)和查全能力(召回率)。4.預測可能發(fā)生理賠的客戶,召回率達到至少80%(TruePositiveRate≥80%),意味著在實際發(fā)生理賠的客戶中,模型至少正確預測出其中的80%。召回率是TP/(TP+FN)。要使召回率≥80%,即TP≥0.8×(TP+FN)。這通常意味著模型需要更關注查全真實正例(理賠客戶),可能會犧牲一些精確率(即可能會有更
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 土石方挖掘機司機崗前管理綜合考核試卷含答案
- 鑒定估價師變革管理模擬考核試卷含答案
- 2025年三峽電力職業(yè)學院輔導員考試筆試真題匯編附答案
- 漿絲機操作工操作技能水平考核試卷含答案
- 罐頭封裝工安全檢查水平考核試卷含答案
- 羽絨羽毛加工處理工誠信測試考核試卷含答案
- 松香蒸餾工崗前紀律考核試卷含答案
- 2025年上海紡織工業(yè)職工大學輔導員招聘備考題庫附答案
- 2024年湖州學院馬克思主義基本原理概論期末考試題附答案
- 2025年互助縣事業(yè)單位聯(lián)考招聘考試真題匯編附答案
- 電工承包簡單合同(2篇)
- 新能源電站單位千瓦造價標準值(2024版)
- 軍隊院校招生文化科目統(tǒng)一考試模擬試卷
- 03課題三-建筑運行大數(shù)據(jù)安全與數(shù)據(jù)質(zhì)量-20180703
- 工業(yè)區(qū)物業(yè)服務手冊
- 2024新能源集控中心儲能電站接入技術方案
- 河南省信陽市2023-2024學年高二上學期期末教學質(zhì)量檢測數(shù)學試題(含答案解析)
- 零售行業(yè)的店面管理培訓資料
- 培訓課件電氣接地保護培訓課件
- 污水管網(wǎng)工程監(jiān)理月報
- 安徽涵豐科技有限公司年產(chǎn)6000噸磷酸酯阻燃劑DOPO、4800噸磷酸酯阻燃劑DOPO衍生品、12000噸副產(chǎn)品鹽酸、38000噸聚合氯化鋁、20000噸固化劑項目環(huán)境影響報告書
評論
0/150
提交評論