版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第頁國家開放大學《統(tǒng)計與數據分析基礎》測試題及答案形成性考核一一、選擇題1.以下關于統(tǒng)計含義的描述不正確的是()。C.統(tǒng)計研究的是確定性關系2.以產品的等級來衡量某種產品質量的好壞,則產品等級作為一種變量屬于()。C.分類變量3.在下列分組中,按照取值大小分組的是()。C.家庭按照年消費水平分組4.按照連續(xù)變量的定義,()一定不屬于連續(xù)變量。A.分類變量5.下列變量中,()屬于連續(xù)變量。B.雇員的年收入6.下列變量中,()屬于數值變量且屬于離散變量。B.產量7.假設某地區(qū)有800家工業(yè)企業(yè),要研究這些企業(yè)的產品生產情況,個體是()。D.每一件工業(yè)產品8.下列屬于時間序列數據的是()。A.股票的每日收盤價9.假設你是一家公司的數據分析員,下列數據來源中屬于一手數據的是()。D.在公司內部通過調查得到的數據10.工廠對生產的一批零件進行檢查,通常采用()。D.隨機抽樣調查11.()描述了變量在不同觀測值或不同觀測值區(qū)間上出現的頻數或頻率。A.分布12.()是滿足特定目標的所有觀測對象或要素的集合。D.總體13.在制作統(tǒng)計分布表時,將各組的頻數與個體總數的比值稱為()。B.頻率14.按照獲取數據的途徑不同,統(tǒng)計數據分為()。A.觀測數據C.實驗數據15.下列調查方法中,屬于概率抽樣的是()。A.簡單隨機抽樣B.分層抽樣D.等距抽樣16.下列屬于數據分析方法的是()。A.回歸分析B.時間序列分析C.指數分析D.對比分析17.數據審核關注的主要問題包括()。A.異常值B.缺失值C.邏輯錯誤D.重復值二、綜合應用題18.一家小微企業(yè)共有20位員工,員工的年齡數據如下。3947313342363836444748422942393946403440請結合數據和所學知識回答下列問題:(1)員工年齡的變量類型是()。A.數值變量(2)在制作員工年齡統(tǒng)計分布表時,第一步是()。B.根據變量的觀測值進行分組(3)在根據變量觀測值進行分組時,第一步是()。C.找到最大值和最小值(4)在Excel中,制作統(tǒng)計分布表用到的主要功能是()。A.數據透視表(5)請使用Excel制作員工年齡變量的頻率分布表(設置組距是4)。根據結果可知,占比最多的年齡組是()。C.37-40歲(6)請使用Excel制作員工年齡變量的頻率分布表(設置組距是4)。根據結果可知,占比最少的年齡組是()。A.29-32歲(7)請使用Excel制作員工年齡變量的頻率分布表(設置組距是4)。根據結果可知,年齡小于等于40歲的占比是()。B.0.6(8)請使用Excel制作員工年齡變量的頻率分布表(設置組距是4)。根據結果可知,年齡小于33歲的占比是()。B.0.1形成性考核二一、選擇題1.在柱形圖中,使用()代表每個類別對應的數值(頻數、頻率或其他數值結果)。C.高度2.在餅圖中,使用圓內扇形()表示數值大小。A.面積3.散點圖是描述()變量之間關系的圖形。B.兩個4.現在有關于兩支球隊的幾項關鍵數據,為了橫向對比兩支球隊的表現,適合采取的數據可視化方法是()。D.雷達圖5.在熱力圖中,用來反映變量取值變化規(guī)律的特征是()。A.顏色6.當數據中存在異常值時,不適合用于度量變量分布特征的指標是()。C.均值7.已知總體容量為N,抽取了一個樣本量是n的樣本,則在樣本方差的計算公式中,分母是()。A.n-18.變異系數的計算結果是一個()。A.相對數9.對于右偏分布而言,在箱線圖中,中位數更靠近()的位置。B.下四分位數10.對于對稱分布而言,直方圖的形狀呈現()特征。C.對稱11.度量事件發(fā)生可能性的測量指標是()。C.概率12.在正態(tài)分布中,共有()參數。A.213.假設z服從標準正態(tài)分布,請利用Excel或查表方式計算,P(Z<0.3),計算結果是()。D.0.6214.假設z服從標準正態(tài)分布,請利用Excel或查表方式計算,P(Z<?)=0.38,求解得到?的結果是()。B.-0.315.點估計方法背后的理論依據是()。A.大數定律16.在假設檢驗中,顯著性水平實質上代表的是()。C.犯第一類錯誤的概率二、綜合應用題17.為了解學習者在線學習情況,課題研究組從某校本科生和??粕蟹謩e各隨機抽取了1000人,調查每日在線學習時長(分鐘)。根據調查數據計算度量指標,結果如下表所示:(1)本次搜集數據的抽樣方法是()。A.簡單隨機抽樣(2)描述學習者每日學習時長分布的數據可視化方法是()。C.直方圖(3)下列數據可視化方法中,適合描述本科生每日平均學習時長與??粕咳掌骄鶎W習時長對比的是()。A.柱形圖(4)下列數據可視化方法中,適合用于對比分析本科生與??粕鄠€相關指標的是()。D.雷達圖(5)在Excel中,計算樣本方差的函數是()。C.VAR.S函數(6)根據偏度的計算結果可知,本科生組與專科生組的分布形狀分別屬于()。C.輕微右偏分布;嚴重右偏分布(7)在95%置信水平下,計算??粕M關于總體均值的置信區(qū)間,結果是()。C.(8)有研究顯示,該校本科生的平均在線學習時長等于200分鐘。現在需要使用假設檢驗方法基于樣本數據驗證這一結論是否正確,假設檢驗的拒絕域在()。C.抽樣分布的兩側(9)有研究顯示,該校本科生的平均在線學習時長為200分鐘?,F在需要使用假設檢驗方法基于樣本數據驗證這一結論是否正確,適合的檢驗統(tǒng)計量是()。A.Z統(tǒng)計量(10)在Excel中進行假設檢驗的計算時,計算臨界值會用到的函數是()。C.NORM.S.INV函數(11)在Excel中求解本科生組和??粕M區(qū)間估計結果時,用于計算估計誤差的函數是()。A.CONFIDENCE.NORM函數(12)在Excel中進行假設檢驗的計算時,計算P值會用到的函數是()。D.NORM.S.DIST函數形成性考核三一、選擇題1.下列屬于結構相對數的是()。A.恩格爾系數2.下列屬于比例相對數的是()。B.人口性別比3.通過將同類現象在同一時間、不同空間的指標數值進行對比,來分析不同空間之間的不平衡性的對比分析方法是()。B.空間比較分析4.一家企業(yè)2023年計劃生產商品1000件,實際完成500件,按照計劃完成度相對數的計算公式可得,產量的計劃完成相對數是()。C.0.55.線性相關系數的取值范圍是()。A.[-1,1]6.如果兩個變量的線性相關系數計算結果是0.7,則說明二者之間可能存在()。B.線性正相關7.下列屬于時點時間序列的是()。A.年末總資產8.平穩(wěn)時間序列只包含()成分。A.不規(guī)則性二、綜合應用題9.已知某商場三種商品的銷售資料,如下表所示,請根據表中信息回答問題。(1)拉氏銷售量指數屬于()。A.數量指標指數(2)帕氏價格指數屬于()。B.質量指標指數(3)在表格中,計算【1】位置上數值的方式包括()。A.600*12B.28700-18000-3500(4)根據表格數據計算帕氏銷售量指數,計算公式正確的是()。D.40600/32500(5)根據平均指數與綜合指數的關系,與報告期總值加權的銷售量調和平均指數結果一致的是()。D.帕氏銷售量指數10.表1給出了一組消費性支出和可支配收入的數據。為了探究兩個變量之間的聯系,基于Excel工具,使用相關分析、回歸分析等方法展開研究,結果如圖1所示。(1)從散點圖中,可以得到的初步結論是()。A.消費性支出和可支配收入之間的關系幾乎呈現線性特征(2)相關分析結果的含義是()。C.消費性支出和可支配收入之間存在高度線性正相關關系(3)從回歸分析的Excel輸出結果看,模型擬合優(yōu)度檢驗中R平方的值是()。B.0.9979(4)從回歸分析的Excel輸出結果看,F檢驗的P值遠遠小于0,說明模型的顯著性檢驗結論是()。B.兩個變量之間的線性關系顯著(5)根據回歸分析結果,可以寫出最終估計得到的一元線性回歸方程的表達式是()。A.y?=54+0.53x(6)回歸系數b的估計值的含義是()。D.每增加1元的可支配收入,消費性支出平均增加0.53元11.現有數據如下表所示,請結合數據回答下列問題:(1)現在需要使用數據可視化方法描述2015-2020年年末人口數變化情況,請選擇適合的數據可視化方法()。B.折線圖(2)現在需要使用數據可視化方法描述年末人口數與最終消費之間的關系,請選擇適合的數據可視化方法()。A.散點圖(3)計算2015-2020年最終消費序列平均發(fā)展水平的公式是()。D.2015-2020年最終消費數值的算術平均數(4)以2015年為基期,年末人口數2017年的環(huán)比發(fā)展速度等于()。B.140011/139232(5)2015-2020年最終消費的平均發(fā)展速度為()。A.(6)在使用Excel計算定基發(fā)展速度時,會用到絕對引用符號,表示正確的是()。A.$
形成性考核四共享單車騎行數據分析報告一.背景與目的1.行業(yè)背景
共享單車作為城市短途出行的重要方式,2023年全國用戶規(guī)模達3億人,日均訂單量超4000萬次。某城市共享單車企業(yè)面臨車輛調度效率低、用戶流失率高等問題。
2.業(yè)務問題
-高峰時段車輛供需失衡
-用戶單次騎行時長分布異常
-會員續(xù)費率低于行業(yè)平均水平(45%vs60%)
3.分析目標
-挖掘用戶騎行行為規(guī)律
-識別高價值用戶特征
-優(yōu)化車輛調度策略
4.分析意義
預計提升車輛周轉率15%,年增收約120萬元
二.分析思路分析方法組合:1.描述性統(tǒng)計:騎行時長分布、用戶類型占比
2.數據可視化:熱力圖(時段-區(qū)域需求)、折線圖(騎行趨勢)
3.假設檢驗:獨立樣本t檢驗(會員與非會員騎行差異)
三.分析過程(一)數據來源及變量說明數據概況:-來源:企業(yè)2023年Q2運營數據(脫敏處理)
-樣本量:50,000條騎行記錄
-核心變量:
|變量名|類型|Excel公式應用示例|
|騎行時長|數值型|`=TEXT(結束時間-開始時間,"h:mm")`|
|用戶類型|分類型|`=IF(會員標識=1,"會員","散客")`|
|起始區(qū)域|文本型|`=VLOOKUP(站點ID,區(qū)域對照表,2,FALSE)`|
(二)數據預處理1.異常值處理:
-刪除騎行時長<1分鐘或>4小時的記錄
-公式:`=FILTER(A2:E50000,(E2:E50000>0.0167)*(E2:E50000<0.1667))`
2.數據分箱:
-將騎行時長劃分為5個區(qū)間
-公式:`=FLOOR(騎行時長*24,0.5)`(單位:小時)
(三)數據分析1.描述性統(tǒng)計分析
(1)數據分布特征
|指標|計算公式|結果|
|平均騎行時長|`=AVERAGE(D2:D50000)`|18.6分鐘|
|會員占比|`=COUNTIF(B2:B50000,1)/COUNTA(B2:B50000)`|43.7%|
(2)可視化分析
①時段需求熱力圖(Excel操作):
-步驟:插入→條件格式→色階
-結論:早8-9點、晚18-19點形成雙高峰
②用戶類型對比柱狀圖(Excel操作):
-步驟:數據透視表→插入簇狀柱形圖
-結論:會員平均騎行次數是散客的2.3倍
2.假設檢驗分析
檢驗命題:會員與非會員騎行時長存在顯著差異-Excel操作:數據分析工具庫→t-檢驗:雙樣本異方差
-結果:t=4.32,p=0.00017<0.05
-結論:拒絕原假設,兩類用戶騎行行為差異顯著
四.結論與建議核心結論1.會員用戶貢獻65%的訂單量但僅占43.7%的用戶基數
2.工作日早高峰車輛缺口達23%
運營建議1.動態(tài)調度策略:
-依據熱力圖數據,在晚高峰前向商務區(qū)預調度車輛
-計算公式:`=FORECAST.ETS(未來時段需求
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河南鋼鐵集團數字應用研究院招聘備考題庫完整答案詳解
- 2025年中國水利水電科學研究院水力學所科研助理招聘備考題庫及答案詳解參考
- 楚雄州大姚縣教育體育局招聘高中教師筆試真題2024
- 2025年廣東外語外貿大學附屬科學城實驗學校臨聘教師招聘備考題庫及完整答案詳解1套
- 2025年江蘇宜公投藍藻資源開發(fā)有限公司公開招聘勞務派遣人員備考題庫及參考答案詳解一套
- 2025年中國藥科大學研究生院工作人員招聘備考題庫附答案詳解
- 2025年中國科學院大氣物理研究所鄭飛課題組科研財務助理招聘備考題庫帶答案詳解
- 2025年楚雄云植藥業(yè)有限公司招聘備考題庫及完整答案詳解1套
- 2025年首都文化科技集團有限公司招聘9人備考題庫及一套完整答案詳解
- 2025年廣西旅發(fā)集團廣西自貿區(qū)醫(yī)院管理有限公司招聘39人備考題庫及一套答案詳解
- 全球衛(wèi)生導論
- 骨科傷口感染護理查房
- 護理清潔消毒滅菌
- 工會財務知識課件
- 裝修工程質量保修服務措施
- 三維傷口掃描系統(tǒng):革新傷口評估模式的關鍵力量
- AI在體育領域的數據分析與預測
- 鈑金裝配調試工藝流程
- 腫瘤病人疼痛護理
- 醫(yī)療應用的輻射安全和防護課件
- 項目經理年底匯報
評論
0/150
提交評論