高級(jí)統(tǒng)計(jì)師考試題目與答案_第1頁
高級(jí)統(tǒng)計(jì)師考試題目與答案_第2頁
高級(jí)統(tǒng)計(jì)師考試題目與答案_第3頁
高級(jí)統(tǒng)計(jì)師考試題目與答案_第4頁
高級(jí)統(tǒng)計(jì)師考試題目與答案_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

高級(jí)統(tǒng)計(jì)師考試題目與答案1.某省衛(wèi)健委為評估“分級(jí)診療”政策實(shí)施效果,從2018—2022年共60個(gè)季度面板數(shù)據(jù)中抽取12個(gè)地市、每地5家三級(jí)醫(yī)院、每家醫(yī)院隨機(jī)抽取300例門診病例,形成54000條就診記錄。變量包括:是否基層首診(binary)、患者年齡(連續(xù))、醫(yī)保報(bào)銷比例(0—1)、醫(yī)院等級(jí)(1=三甲,0=三乙)、地區(qū)人均GDP(萬元)、政策虛擬變量(2019Q4及以后取1)。研究者擬用雙向固定效應(yīng)Logit模型估計(jì)政策對基層首診概率的邊際效應(yīng),但發(fā)現(xiàn)存在“醫(yī)院—季度”層面聚類相關(guān)及政策實(shí)施內(nèi)生性問題。請回答:(1)寫出雙向固定效應(yīng)Logit模型的完整設(shè)定,并說明如何引入醫(yī)院與季度固定效應(yīng);(2)若懷疑政策變量與誤差項(xiàng)相關(guān),給出兩種可行的內(nèi)生性處理策略,比較其適用條件;(3)在聚類穩(wěn)健標(biāo)準(zhǔn)誤計(jì)算中,為什么“醫(yī)院—季度”層面聚類比“醫(yī)院”或“季度”單獨(dú)聚類更合理?給出數(shù)學(xué)解釋;(4)假設(shè)已得平均邊際效應(yīng)AME=0.087,聚類穩(wěn)健標(biāo)準(zhǔn)誤0.019,樣本量54000,請構(gòu)造95%置信區(qū)間,并解釋經(jīng)濟(jì)含義;(5)若進(jìn)一步發(fā)現(xiàn)2020Q1—2021Q2疫情沖擊可能干擾政策效應(yīng),設(shè)計(jì)一個(gè)“疫情沖擊異質(zhì)性”穩(wěn)健性檢驗(yàn),寫出回歸方程與識(shí)別假設(shè)。答案與解析:(1)模型設(shè)定:令y_{ihqt}=1表示患者i在醫(yī)院h、地區(qū)q、季度t就診時(shí)發(fā)生基層首診。雙向固定效應(yīng)LogitP(y_{ihqt}=1|X,α_h,γ_t)=Λ(α_h+γ_t+X_{ihqt}′β+δ·Post_t),其中Λ(z)=exp(z)/(1+exp(z)),α_h為醫(yī)院固定效應(yīng),γ_t為季度固定效應(yīng),Post_t為政策虛擬變量。Stata命令示例:xtlogityc.age##c.age報(bào)銷比例i.hospidi.quarter,fevce(clusterhosp_quarter)or“i.hospid”吸收醫(yī)院不隨時(shí)間變化的所有異質(zhì)性,“i.quarter”吸收全省共同時(shí)間沖擊,二者聯(lián)合構(gòu)成雙向固定效應(yīng)。(2)內(nèi)生性處理:策略A:工具變量法。利用“省內(nèi)其他11個(gè)地市同季度政策實(shí)施率”作為本地政策變量的IV。原理:其他地市政策實(shí)施率通過省級(jí)行政壓力影響本地政策timing,但不直接影響本地患者首診選擇。需通過兩階段殘差inclusiontest(IV–Logit的Rivers-Vuong估計(jì))或特殊回歸估計(jì)(條件混合過程CMP)。策略B:雙重差分—事件研究法。以2019Q4為事件點(diǎn),將2018Q1—2019Q3作為pre,2020Q1—2022Q4作為post,估計(jì)動(dòng)態(tài)效應(yīng)β_k,k=–7,…,+12。若pre趨勢為零,則支持平行趨勢,可緩解內(nèi)生。比較:IV需找到強(qiáng)相關(guān)且外生工具,對數(shù)據(jù)要求高;事件研究依賴pre趨勢檢驗(yàn),若pre有預(yù)期效應(yīng)則失效。(3)聚類數(shù)學(xué)解釋:令誤差項(xiàng)ε_(tái){ihqt},若corr(ε_(tái){ihqt},ε_(tái){jh′q′t′})≠0當(dāng)且僅當(dāng)h=h′且t=t′,則真實(shí)方差Var(β?)=(X′X)^{-1}Σ_{c}X_c′Σ_cX_c(X′X)^{-1},其中c為“醫(yī)院—季度”單元。若僅按醫(yī)院聚類,會(huì)低估同一醫(yī)院內(nèi)季度間相關(guān)性,導(dǎo)致標(biāo)準(zhǔn)誤偏小;若僅按季度聚類,會(huì)低估同一季度內(nèi)醫(yī)院間相關(guān)性。只有“醫(yī)院—季度”聚類維度與誤差相關(guān)結(jié)構(gòu)匹配,才能一致估計(jì)Σ_c。(4)置信區(qū)間:AME的95%CI=0.087±1.96×0.019=[0.0498,0.1242]。經(jīng)濟(jì)含義:政策使基層首診概率平均提升8.7個(gè)百分點(diǎn),區(qū)間下限5個(gè)百分點(diǎn),上限12.4個(gè)百分點(diǎn),以2022年全省1.2億門診量測算,意味著每年新增約1040萬人次基層首診,節(jié)約三級(jí)醫(yī)院8%門診負(fù)荷。(5)疫情異質(zhì)性檢驗(yàn):定義疫情沖擊虛擬變量Covid_{qt}=1若t∈[2020Q1,2021Q2]且q為疫情高爆發(fā)地區(qū)(累計(jì)確診率>中位數(shù)),交互項(xiàng)模型:y_{ihqt}=α_h+γ_t+β_1Post_t+β_2Post_t·Covid_{qt}+X′θ+ε_(tái){ihqt}.識(shí)別假設(shè):疫情沖擊對基層首診的影響僅通過Covid_{qt}體現(xiàn),且該沖擊與政策實(shí)施時(shí)間非完全重疊;若β_2不顯著,說明政策效應(yīng)未被疫情扭曲,結(jié)果穩(wěn)健。2.國家統(tǒng)計(jì)某司對31個(gè)省份2010—2022年季度GDP進(jìn)行修訂,發(fā)現(xiàn)官方初步核算值(firstrelease)與最終核實(shí)值(final)存在系統(tǒng)差異。設(shè)修訂誤差e_{it}=y_{it}^{final}?y_{it}^{first},建立動(dòng)態(tài)面板模型e_{it}=ρe_{i,t?1}+β_1|y_{it}^{first}|+β_2σ_{it}+β_3Crisis_t+μ_i+λ_t+υ_{it},其中σ_{it}為省份i季度t的12個(gè)行業(yè)增加值波動(dòng)標(biāo)準(zhǔn)差,Crisis_t為2015Q3—2016Q2的股災(zāi)虛擬變量。請回答:(1)說明為何OLS估計(jì)ρ會(huì)高估,并給出偏誤方向數(shù)學(xué)推導(dǎo);(2)采用系統(tǒng)GMM估計(jì)時(shí),如何構(gòu)造內(nèi)部工具變量?寫出一步與兩步GMM的矩條件;(3)若發(fā)現(xiàn)AR(2)檢驗(yàn)p=0.08,Sargan檢驗(yàn)p=0.002,應(yīng)如何判斷模型設(shè)定?給出后續(xù)調(diào)整方案;(4)假設(shè)已得β?_1=?0.14,其經(jīng)濟(jì)含義是什么?結(jié)合GDP規(guī)模解釋;(5)設(shè)計(jì)一個(gè)“修訂透明度”外生沖擊,利用該沖擊識(shí)別β_3的因果效應(yīng),寫出回歸方程與識(shí)別策略。答案與解析:(1)OLS偏誤:模型含個(gè)體效應(yīng)μ_i,e_{i,t?1}與μ_i相關(guān),導(dǎo)致Cov(e_{i,t?1},υ_{it}?ρe_{i,t?1})≠0。具體地,plimρ?_{OLS}=ρ+Cov(e_{i,t?1},μ_i)/Var(e_{i,t?1})>ρ,因修訂誤差具有持續(xù)性,μ_i越大e_{i,t?1}越大,Cov為正,故ρ高估。(2)系統(tǒng)GMM:內(nèi)部工具:對差分方程Δe_{it}=ρΔe_{i,t?1}+…+Δυ_{it},使用e_{i,t?2},e_{i,t?3},…作為Δe_{i,t?1}的工具;對水平方程,使用Δe_{i,t?1}作為e_{i,t?1}的工具。一步矩條件:E[Z′Δυ]=0;兩步權(quán)重矩陣W_N=(1/NΣZ′Δυ?Δυ?′Z)^{-1},迭代至收斂。(3)檢驗(yàn)判斷:AR(2)p=0.08>0.05,不能拒絕差分誤差無二階序列相關(guān),支持矩條件有效;但Sarganp=0.002,拒絕“所有工具變量有效”原假設(shè),存在過度識(shí)別問題。調(diào)整:縮減工具變量滯后階數(shù),僅使用t?2期工具;或采用Collapse選項(xiàng)減少工具維度;再行HansenC檢驗(yàn),若p>0.1則接受。(4)經(jīng)濟(jì)含義:β?_1=?0.14表明初步核算規(guī)模每擴(kuò)大1個(gè)百分點(diǎn),修訂誤差絕對值減少0.14個(gè)百分點(diǎn),呈現(xiàn)“規(guī)模越大核算越準(zhǔn)”特征。以廣東2022年季度GDP3萬億元為例,若初步值高估2%,則修訂下調(diào)約60億元;若規(guī)模擴(kuò)大10%,修訂誤差減少1.4個(gè)百分點(diǎn),下調(diào)幅度降至0.6%,即18億元,體現(xiàn)大省份統(tǒng)計(jì)基礎(chǔ)更好。(5)外生沖擊:2017年國家統(tǒng)計(jì)局推行“GDP統(tǒng)一核算改革”,規(guī)定2018年起各省GDP由國家核算后反饋,視為外生提升透明度。定義Reform_t=1若t≥2018Q1,三重差分:e_{it}=μ_i+λ_t+β_3Crisis_t·Reform_t+θX_{it}+υ_{it}.識(shí)別策略:股災(zāi)時(shí)段Crisis_t與Reform_t交集僅2018Q1—2018Q2,利用“改革前后×股災(zāi)與否”交叉,β_3捕捉透明度提升對修訂誤差的因果效應(yīng),假設(shè)改革時(shí)間不由各省誤差大小決定,具備外生性。3.某電商平臺(tái)的日活用戶(DAU)序列{y_t}_{t=1}^{1826}取自2018—2022年,呈現(xiàn)周內(nèi)效應(yīng)、春節(jié)漂移、結(jié)構(gòu)斷點(diǎn)(2020Q1疫情)、異方差與右偏?,F(xiàn)建立SARMAX模型:(1??_1B??_2B^2)(1?B^{7})logy_t=(1+θ_1B^7)ε_(tái)t+β_1x_{1t}+β_2x_{2t},其中x_{1t}為“居家辦公”百度指數(shù),x_{2t}為平臺(tái)補(bǔ)貼金額(百萬元),ε_(tái)t~N(0,σ_t^2),σ_t^2=exp(γ_0+γ_1|ε_(tái){t?1}|)。請回答:(1)寫出該模型的條件似然函數(shù),并說明如何數(shù)值最大化;(2)若QMLE估計(jì)后標(biāo)準(zhǔn)化殘差仍出現(xiàn)左尾厚尾,給出一種改進(jìn)分布并寫出對數(shù)似然增量;(3)進(jìn)行multi-step預(yù)測時(shí),為何需對解釋變量x_{1,t+h},x_{2,t+h}也建模?給出聯(lián)合預(yù)測流程;(4)假設(shè)已得β?_1=0.12,β?_2=0.08,解釋經(jīng)濟(jì)彈性;(5)設(shè)計(jì)一個(gè)“補(bǔ)貼外生實(shí)驗(yàn)”驗(yàn)證β_2的因果性,描述隨機(jī)化方案與估計(jì)量。答案與解析:(1)條件似然:令z_t=(1?B^7)logy_t,則z_t=?_1z_{t?1}+?_2z_{t?2}+β_1x_{1t}+β_2x_{2t}+η_t,η_t=(1+θ_1B^7)ε_(tái)t,ε_(tái)t~N(0,σ_t^2).聯(lián)合密度L(Θ)=∏_{t=8}^N(2πσ_t^2)^{-1/2}exp(?η_t^2/(2σ_t^2)),σ_t^2=exp(γ_0+γ_1|ε_(tái){t?1}|).采用數(shù)值BFGS最大化,梯度解析推導(dǎo):?L/?γ_1=∑(η_t^2/σ_t^2?1)|ε_(tái){t?1}|。(2)厚尾改進(jìn):采用標(biāo)準(zhǔn)化t分布,自由度ν待估。增量對數(shù)似然?_t=?1/2log(π(ν?2)σ_t^2)?(ν+1)/2log(1+η_t^2/(σ_t^2(ν?2))).ν→∞退化為正態(tài),ν越小尾越厚,用ML估計(jì)ν可捕捉左尾。(3)聯(lián)合預(yù)測:x_{1},x_{2}具有序列相關(guān),若外推常數(shù)將低估不確定性。流程:1)對x_{1t}建立VAR(3),x_{2t}建立帶漂移隨機(jī)游走;2)用bootstrap生成x_{1,t+h},x_{2,t+h}路徑;3)每條路徑代入SARMAX,模擬η_{t+h},得y_{t+h}分布;4)取5千次模擬中位數(shù)為點(diǎn)預(yù)測,2.5%—97.5%分為區(qū)間。(4)彈性解釋:β?_1=0.12表示“居家辦公”指數(shù)每增加1%,周日活對數(shù)差分增加0.12%,即DAU約增0.12%;β?_2=0.08表示補(bǔ)貼每增1百萬元,DAU增0.08%。以2022年日均DAU1億為例,補(bǔ)貼增1千萬,DAU增8萬,單用戶補(bǔ)貼成本125元,需與轉(zhuǎn)化率、客單價(jià)比較評估ROI。(5)外生實(shí)驗(yàn):選2023年6月6周,隨機(jī)抽50%活躍用戶進(jìn)入實(shí)驗(yàn)組,在每周三、五發(fā)放5元無門檻券,對照組不發(fā)放。隨機(jī)化單元為用戶ID,阻斷網(wǎng)絡(luò)溢出。估計(jì)量:Δ=log(DAU_{treat}/DAU_{control}),回歸Δ_t=α+β_2·Subsidy_t+ε_(tái)t,Subsidy_t為實(shí)驗(yàn)組補(bǔ)貼強(qiáng)度。因隨機(jī)分配,β_2捕捉因果彈性,與SARMAX結(jié)果互為驗(yàn)證。4.為估計(jì)中國280個(gè)地級(jí)市2011—2020年數(shù)字經(jīng)濟(jì)對綠色全要素生產(chǎn)率(GTFP)的非線性門檻效應(yīng),研究者構(gòu)建面板門檻模型:GTFP_{it}=μ_i+λ_t+β_1Dig_{it}·I(Dig_{it}≤γ)+β_2Dig_{it}·I(Dig_{it}>γ)+ΓX_{it}+ε_(tái){it},其中Dig_{it}為數(shù)字經(jīng)濟(jì)發(fā)展指數(shù),X_{it}含人力資本、FDI、環(huán)境規(guī)制等。請回答:(1)說明如何選取門檻變量與門檻值γ的估計(jì)步驟,并給出Bootstrap檢驗(yàn)統(tǒng)計(jì)量;(2)若發(fā)現(xiàn)存在三重門檻,寫出完整模型并說明自由度調(diào)整;(3)解釋為何固定效應(yīng)估計(jì)within變換會(huì)扭曲門檻識(shí)別,給出一致估計(jì)策略;(4)假設(shè)β?_1=0.18,β?_2=0.05,門檻值γ=62,樣本內(nèi)Dig均值55,給出經(jīng)濟(jì)解釋與政策含義;(5)設(shè)計(jì)一個(gè)“寬帶中國”示范城市政策作為工具變量,驗(yàn)證Dig的外生性,寫出兩階段回歸與識(shí)別假設(shè)。答案與解析:(1)門檻估計(jì):1)對γ網(wǎng)格搜索1—99分位,最小化殘差平方和SSR(γ);2)得γ?=argminSSR(γ);3)檢驗(yàn)H_0:無門檻,LM統(tǒng)計(jì)量F=(SSR_0?SSR_1)/σ?^2,σ?^2=SSR_1/(nT?2K?1)。Bootstrap300次,每次對ε_(tái){it}有放回抽樣重構(gòu)因變量,計(jì)算F^,p值為#(F^>F)/300。若p<0.05,拒絕無門檻。(2)三重門檻:GTFP=μ_i+λ_t+β_1Dig·I(Dig≤γ_1)+β_2Dig·I(γ_1<Dig≤γ_2)+β_3Dig·I(γ_2<Dig≤γ_3)+β_4Dig·I(Dig>γ_3)+ΓX+ε.自由度:每增一個(gè)門檻,多估計(jì)一個(gè)γ,需用Hansen(1999)修正,對γ_1,γ_2,γ_3聯(lián)合網(wǎng)格搜索,SSR最小化后,用Bootstrap檢驗(yàn)H_0:雙重vs三重,統(tǒng)計(jì)量類似,但約束模型為雙重。(3)Within扭曲:within變換y_{it}?y?_i使門檻變量也減去個(gè)體均值,導(dǎo)致γ估計(jì)偏向樣本中位數(shù)。一致策略:采用“組內(nèi)向前差分”+Hansen固定效應(yīng)門檻估計(jì),或直接最小化SSR時(shí)包含個(gè)體虛擬變量,使用LSDV迭代,避免within變換。(4)經(jīng)濟(jì)解釋:當(dāng)數(shù)字指數(shù)低于62時(shí),Dig每增1單位,GTFP提升0.18;超過62后邊際效應(yīng)降至0.05,呈遞減。均值55處于高效區(qū)間,政策應(yīng)優(yōu)先扶持Dig<62的城市,如西部地級(jí)市,通過數(shù)字基建跨越門檻,避免東部過度投資。(5)工具變量:2014、2015兩批“寬帶中國”示范城市由工信部分批公布,可視為外生。第一階段:Dig_{it}=α_i+λ_t+π_1Broadband_{it}+ΓZ_{it}+u_{it},Broadband_{it}=1若城市i在t年入選示范。第二階段用擬合值Dig?_{it}代入門檻模型。識(shí)別假設(shè):示范城市selection不受GTFP潛在水平影響,僅通過寬帶普及影響Dig,滿足排他性。5.某大型連鎖零售集團(tuán)擁有1200家門店,2019—2022年每日銷售額{y_{isd}}(s=店,d=日)與促銷信息、天氣、節(jié)假日等匹配。為評估“夜間燈光亮化”工程對夜間銷售額(18:00—24:00)的因果效應(yīng),公司選擇2021年7月對300家門店安裝LED燈帶,其余為對照。請回答:(1)若采用DID估計(jì),寫出回歸方程,并說明如何構(gòu)造標(biāo)準(zhǔn)誤以考慮店—月層面聚類;(2)發(fā)現(xiàn)處理組選取非隨機(jī),大店更易被選中,給出一種基于傾向得分的雙重穩(wěn)健估計(jì)量,寫出公式;(3)燈光工程可能通過“安全感知”與“停留時(shí)間”兩個(gè)渠道,設(shè)計(jì)一個(gè)中介效應(yīng)模型,說明如何識(shí)別;(4)假設(shè)已得ATT=8.7%,夜間銷售額占比從35%提升至38%,計(jì)算整體銷售額提升幅度,并解釋為何晝間可能無顯著變化;(5)若2021年8月局部疫情導(dǎo)致部分門店暫停營業(yè),如何調(diào)整樣本以保持識(shí)別有效性?給出具體步驟。答案與解析:(1)DID方程:log(Y_{sd})=α_s+λ_d+τ·Treat_s·Post_d+X_{sd}′β+ε_(tái){sd},Post_d=1若d≥2021-07-01。聚類:店—月層面1200×48=57600單元,Stata命令:areglnsalesc.T

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論