交通數(shù)據(jù)分析基礎(chǔ) 習(xí)題

上傳人：h*** IP屬地：山東上傳時(shí)間：2025-04-24 格式：DOCX 頁數(shù)：17 大?。?9.42KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩12頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章1-8，略。9.將特征status轉(zhuǎn)換為有序因子，等級(jí)依次為Poor、Improved、Excellent。#假設(shè)原始數(shù)據(jù)中的status列是字符型向量

status_ordered<-factor(

x=status,#原始數(shù)據(jù)向量

levels=c("Poor","Improved","Excellent"),#指定有序等級(jí)

ordered=TRUE#聲明為有序因子

)10.創(chuàng)建一個(gè)名為fruits的字符向量，包含以下水果名稱："apple"、"banana"、"cherry"、"date"、"elderberry"。將"fig"添加到這個(gè)向量的末尾。#創(chuàng)建初始向量

fruits<-c("apple","banana","cherry","date","elderberry")

#添加新元素到末尾

fruits<-c(fruits,"fig")11.創(chuàng)建一個(gè)名為matrixA的3×3矩陣，將其中所有元素均初始化為0，并將第1行第2列的元素設(shè)置為5。#創(chuàng)建全0的3x3矩陣

matrixA<-matrix(0,nrow=3,ncol=3)

#修改第1行第2列元素為5

matrixA[1,2]<-512.創(chuàng)建一個(gè)名為students的數(shù)據(jù)框，包含3列，分別為Name（字符型）、Age（整數(shù)型）、Score（數(shù)值型）；并添加3行數(shù)據(jù)，分別為("Alice",20,85)、("Bob",22,90)、("Charlie",19,88)。students<-data.frame(

Name=c("Alice","Bob","Charlie"),

Age=c(20L,22L,19L),#顯式聲明整數(shù)類型（L后綴）

Score=c(85,90,88),

stringsAsFactors=FALSE#關(guān)閉字符自動(dòng)轉(zhuǎn)因子（R4.0+默認(rèn)關(guān)閉）

)13.使用students數(shù)據(jù)框（習(xí)題12中創(chuàng)建的），篩選出年齡大于20歲且分?jǐn)?shù)高于87分的學(xué)生。filtered_students<-subset(

students,

Age>20&Score>87#邏輯條件：年齡>20且分?jǐn)?shù)>87

)14.使用plot()函數(shù)繪制students數(shù)據(jù)框（習(xí)題12中創(chuàng)建的）中Age和Score的散點(diǎn)圖，并給該散點(diǎn)圖添加標(biāo)題和坐標(biāo)軸標(biāo)題。plot(

x=students$Age,

y=students$Score,

main="StudentAgevs.Score",#標(biāo)題

xlab="Age(years)",#x軸標(biāo)簽

ylab="Score(%)",#y軸標(biāo)簽

pch=19#設(shè)置點(diǎn)的形狀（實(shí)心圓點(diǎn)）

)第二章1.將數(shù)據(jù)框ggplot2::diamonds中的特征color轉(zhuǎn)換為字符型特征。library(ggplot2)

diamonds$color<-as.character(diamonds$color)2.對(duì)數(shù)據(jù)框ggplot2::diamonds中的所有數(shù)值型特征進(jìn)行標(biāo)準(zhǔn)化。#方法1：使用基礎(chǔ)R的scale函數(shù)

diamonds_scaled<-as.data.frame(scale(diamonds[,sapply(diamonds,is.numeric)]))

#方法2：使用dplyr（需加載包）

#library(dplyr)

#diamonds_scaled<-diamonds%>%

#mutate(across(where(is.numeric),scale))3.篩選出數(shù)據(jù)框ggplot2::diamonds中x大于4，并且特征cut為"Fair"的樣本。filtered_diamonds<-subset(diamonds,x>4&cut=="Fair")4.為數(shù)據(jù)框ggplot2::diamonds增加一個(gè)日期型的列date_vec，其中，第1行的日期為"2023-01-01"，第2行的日期在第1行的基礎(chǔ)上加1天，依次類推。diamonds$date_vec<-seq.Date(

from=as.Date("2023-01-01"),

by="day",

length.out=nrow(diamonds)

)5.查看數(shù)據(jù)框ggplot2::diamonds的基本信息。str(diamonds)6.將數(shù)據(jù)框ggplot2::diamonds的特征cut、color、clarity的名稱改為大寫形式。colnames(diamonds)[colnames(diamonds)%in%c("cut","color","clarity")]<-

c("CUT","COLOR","CLARITY")7.對(duì)于數(shù)據(jù)框ggplot2::diamonds，根據(jù)特征cut對(duì)數(shù)據(jù)集進(jìn)行劃分，并分組統(tǒng)計(jì)各組信息。library(dplyr)

group_summary<-diamonds%>%

group_by(CUT)%>%

summarise(

count=n(),

avg_price=mean(price,na.rm=TRUE),

min_carat=min(carat),

max_carat=max(carat)

)8.根據(jù)特征price和carat對(duì)數(shù)據(jù)框ggplot2::diamonds進(jìn)行排序。sorted_diamonds<-diamonds%>%

arrange(price,carat)#先按price升序，再按carat升序第三章1.利用R語言計(jì)算數(shù)據(jù)框ggplot::diamonds中特征carat的均值、中位數(shù)、眾數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)、方差、標(biāo)準(zhǔn)差、變異系數(shù)、四分位數(shù)、偏度和峰度。library(ggplot2)

library(psych)#用于幾何平均和調(diào)和平均

library(e1071)#用于偏態(tài)和峰態(tài)

#計(jì)算統(tǒng)計(jì)量

stats<-list(

mean=mean(diamonds$carat),

median=median(diamonds$carat),

mode=names(which.max(table(diamonds$carat))),#眾數(shù)（可能有多個(gè)）

geometric_mean=geometric.mean(diamonds$carat),

harmonic_mean=harmonic.mean(diamonds$carat),

variance=var(diamonds$carat),

std_dev=sd(diamonds$carat),

coeff_variation=sd(diamonds$carat)/mean(diamonds$carat),

quantiles=quantile(diamonds$carat,probs=c(0.25,0.75)),

skewness=skewness(diamonds$carat),

kurtosis=kurtosis(diamonds$carat)-3#峰態(tài)（減去3調(diào)整）

)

#打印結(jié)果

print(stats)2.計(jì)算數(shù)據(jù)框ggplot::diamonds中特征color的頻數(shù)和頻率。color_freq<-table(diamonds$color)

color_prop<-prop.table(color_freq)

#打印結(jié)果

print(color_freq)

print(round(color_prop,3))3.繪制圖形查看數(shù)據(jù)框ggplot::diamonds中特征color的分布。library(ggplot2)

ggplot(diamonds,aes(x=color))+

geom_bar(fill="skyblue")+

labs(title="DistributionofDiamondColors",x="Color",y="Count")+

theme_minimal()4.繪制圖形查看數(shù)據(jù)框ggplot::diamonds中特征price的分布。ggplot(diamonds,aes(x=price))+

geom_histogram(bins=50,fill="lightgreen",color="black")+

labs(title="DistributionofDiamondPrices",x="Price(USD)",y="Count")+

scale_x_log10()+#對(duì)數(shù)轉(zhuǎn)換處理右偏分布

theme_minimal()5.繪制圖形查看數(shù)據(jù)框iris中特征Sepal.Length與Sepal.Width的關(guān)系，圖中要根據(jù)特征Species對(duì)點(diǎn)進(jìn)行類別劃分，并根據(jù)特征Petal.Length設(shè)置點(diǎn)的大小。ggplot(iris,aes(

x=Sepal.Length,

y=Sepal.Width,

color=Species,

size=Petal.Length

))+

geom_point(alpha=0.7)+

labs(

title="SepalDimensionsbySpecies",

x="SepalLength(cm)",

y="SepalWidth(cm)",

color="Species",

size="PetalLength(cm)"

scale_color_manual(values=c("setosa"="red","versicolor"="blue","virginica"="green"))+

theme_minimal()第四章1.有一信號(hào)交叉口，其信號(hào)周期為60s，經(jīng)測(cè)得該交叉口的一個(gè)進(jìn)口的平均交通流量為180輛/h，且車輛到達(dá)數(shù)n符合泊松分布n~Pλ解：一個(gè)周期（60s）內(nèi)到達(dá)的車輛數(shù)：m設(shè)一個(gè)周期到達(dá)k輛車的概率為Pk，則由遞推公式P當(dāng)k≤2時(shí)，Pk遞增；時(shí)，因此，當(dāng)k=2時(shí)，P2.某交叉口有25%的騎自行車的人不遵守交通規(guī)則，假設(shè)到達(dá)該交叉口的騎行者服從二項(xiàng)分布X~Bn,p解：不遵守交通規(guī)則的人數(shù)概率為p=0.25n將上述數(shù)據(jù)代入公式：P則有：PPP那么，8人中有3人及以上不遵守交通規(guī)則的概率是：P3.在平均交通量為120輛/h的道路上，觀測(cè)斷面上的車輛達(dá)到符合泊松分布n~Pλ，其中λ=120/3600，問30解：一個(gè)觀測(cè)周期（30s）內(nèi)到達(dá)的車輛數(shù)：m泊松分布計(jì)算公式：P在30s內(nèi)無車到達(dá)的概率為：P在30s內(nèi)有1輛車到達(dá)的概率為：P在30s內(nèi)有2輛車到達(dá)的概率為：P在30s內(nèi)有3輛車到達(dá)的概率為：P在30s內(nèi)有4輛及以上的車到達(dá)的概率為：P4.某信號(hào)交叉口設(shè)置了左轉(zhuǎn)信號(hào)相位，經(jīng)研究來車符合二項(xiàng)分布X~Bn,p，每一周期平均來車30輛，其中有30%（1）到達(dá)的5輛車中，有2輛左轉(zhuǎn)的概率；（2）到達(dá)的5輛車中，少于2輛左轉(zhuǎn)的概率；（3）到達(dá)的10輛車中，少于2輛左轉(zhuǎn)的概率；（4）某一信號(hào)周期內(nèi)無左轉(zhuǎn)車的概率。解：（1）左轉(zhuǎn)概率為p=0.3，將上述數(shù)據(jù)代入公式：P得：P（2）由（1）有：PPP（3）n=10Pk<2（4）n=30P5.對(duì)于單向平均流量為360veh/h的車流，其車頭時(shí)距h服從負(fù)指數(shù)分布?~Eλ，其中λ=3603600=0.1，求車頭時(shí)距大于10s的概率。解：車頭時(shí)距大于10s的概率也就是10s以內(nèi)無車的概率。由λ=PP同樣，車頭時(shí)距小于或等于10s的概率為：P6.在一條有隔離帶的雙向四車道道路上，單向流量為360veh/h，車頭時(shí)距h服從負(fù)指數(shù)分布?~Eλ，其中λ=3603600=0.1。單方向路寬7.5m，設(shè)行人步行解：行人橫過單向行車道所需要的時(shí)間：t=因此，只有當(dāng)?≥7.5s時(shí)，行人才能安全穿越，由于雙車道道路可以充分超車，車頭時(shí)距符合負(fù)指數(shù)分布，對(duì)于任意前后兩輛車而言，車頭時(shí)距大于7.5s的概率為:P對(duì)于Q=360veh/h的車流，1h車頭時(shí)距次數(shù)為360，其中h≥7.5s的車頭時(shí)距為可以安全橫穿的次數(shù):360×0.4724=170（次）第五章1、設(shè)某路口車輛到達(dá)數(shù)服從二項(xiàng)分布X~Bm,p，x1,x2解：EX=mp=2、在某一地區(qū)，一年發(fā)生的交通事故次數(shù)X，設(shè)X的密度函數(shù)為fx;θ=θ2xe?解：EX似然函數(shù)為：Lln令ddθlnL=3、某自動(dòng)駕駛公交車速度X服從正態(tài)分布Nμ,σ2，從某天中隨機(jī)抽取6輛自動(dòng)駕駛公交車測(cè)其速度（單位為km/h）分別為14.615.114.914.815.215.1（1）已知σ2=0.06，（2）σ2未知，α解：x=14.95，s（1）σ2已知，u0.025=1.96，均值μ在置信度為xu0.05=1.64，均值μ在置信度為x（2）σ2未知，t0.0255=2.571,均值μ在置信度為0.95t0.055=2.015,均值μ在置信度為0.904、某公司想探究職員乘坐汽車的暈車程度（數(shù)值為0-10，數(shù)值越大，暈車程度越重），現(xiàn)給出男、女職員暈車程度。設(shè)兩組數(shù)據(jù)分別來自正態(tài)總體Nμ1,σ12和Nμ2,σ22，兩樣本相互獨(dú)立，男性職員nx女性職員nx解：μ1?μ2x15、貨運(yùn)公司A、B從甲地到乙地運(yùn)輸貨物的時(shí)間分別服從正態(tài)分布Nμ1,σ12和Nμ2,σ22，兩總體方差相同，兩樣本相互獨(dú)立，μ1，μ2貨運(yùn)公司A：2.662.632.682.602.67貨運(yùn)公司B：2.582.572.632.592.60試求兩貨運(yùn)公司的運(yùn)輸時(shí)間均值差μ1解：x1=2.65，x2=2.59sμ1?μx6、隨機(jī)調(diào)查某路段100輛車的速度，測(cè)得其平均速度為45km/h，根據(jù)以往數(shù)據(jù)可知，該路段的車速標(biāo)準(zhǔn)差為42.5。試求該路段車輛平均速度的置信區(qū)間，α=0.1。解：均值μ的置信度為0.90的區(qū)間估計(jì)為：x7、為了解交通安全宣傳視頻的傳播效果，隨機(jī)調(diào)查了500人，其中有100人收看了該宣傳視頻，試在0.9的置信水平下估計(jì)該宣傳視頻收視率的置信區(qū)間。解：p=20%置信度90%總體比率P的置信區(qū)間為p8、為了調(diào)查兩條線路每輛公交車的日營業(yè)額（元），隨機(jī)抽取了兩條線路的公交車樣本。這兩個(gè)樣本相互獨(dú)立，設(shè)x1,x2分別為第一個(gè)和第二個(gè)總體的樣本均值，S12,S22分別是兩個(gè)總體的樣本方差。兩個(gè)總體均值分別為μ1和μ2，方差分別為σ12和σ22且未知，兩個(gè)樣本的數(shù)據(jù)量、均值、方差如下：n1解：μ1?μx9、某道路汽車的速度服從正態(tài)分布，方差σ2=1.21，現(xiàn)隨機(jī)抽取6輛汽車，測(cè)得的汽車速度（單位為km/h32.4631.5430.1029.7631.6731.32請(qǐng)問當(dāng)顯著性水平α=0.01時(shí)，能否認(rèn)為該道路汽車的平均速度為32.50km/h解：H0:μ=32.50H檢驗(yàn)統(tǒng)計(jì)量：z=x決策：拒絕H0結(jié)論：這條道路汽車的平均速度不是32.50km/h10、某自行車租賃公司聲稱其新推出的騎行套餐可以讓騎行者在兩個(gè)月內(nèi)減重8.5kg以上。為了驗(yàn)證這一聲稱是否屬實(shí)，有關(guān)研究人員抽檢了10名參與者，得知他們的減重（單位為kg）情況如下：9.511.58.57.51189.57.51114.5請(qǐng)問在α=0.05的顯著性水平下，解：H0:μ≥8.5H1檢驗(yàn)統(tǒng)計(jì)量：z決策：不拒絕H結(jié)論：該公司的聲稱可信。11、某地鐵公司想要了解乘客性別會(huì)不會(huì)顯著影響地鐵滿意度。于是，他們從女性乘客中抽取了50名，測(cè)得平均滿意度為8.2，從男性乘客中抽取了60名，測(cè)得平均滿意度為7.8，統(tǒng)計(jì)資料表明男性乘客和女性乘客的滿意度都服從正態(tài)分布，其標(biāo)準(zhǔn)差分別為0.73和1.16，請(qǐng)問在顯著性水平為0.05的條件下，女性乘客的地鐵滿意度是否比男性乘客的地鐵滿意度高？解：n1=50n2=60H檢驗(yàn)統(tǒng)計(jì)量：U決策：拒絕H結(jié)論：顯著性水平為0.05的條件下，女性乘客的地鐵滿意度比男性乘客的地鐵滿意度高。12、地鐵公司聲稱其某條地鐵線路主要服務(wù)于通勤族，其乘客中有70%為通勤族。為了驗(yàn)證這一聲稱是否屬實(shí)，某研究機(jī)構(gòu)隨機(jī)抽取了300人，發(fā)現(xiàn)有200名通勤族經(jīng)常通過該地鐵線路出行。取顯著性水平α=0.05，檢驗(yàn)該地鐵線路乘客群中通勤族的比率是否為70%。解：H檢驗(yàn)統(tǒng)計(jì)量：z決策:不拒絕H結(jié)論:該地鐵公司的說法屬實(shí)。13、隨機(jī)選取某條道路10個(gè)小時(shí)的交通流量（單位為pcu/h）：97.8532.55296.37561.652256.7599.54179.23782.16110.67540.53請(qǐng)繪制正態(tài)概率圖。解：這10個(gè)點(diǎn)不在正態(tài)概率圖上，因此可以認(rèn)為該道路交通量的分布不是正態(tài)分布，對(duì)數(shù)據(jù)進(jìn)行對(duì)數(shù)變換，結(jié)果如下：IXiLnxiXk132.553.4830.061297.854.5830.159399.544.6010.2564110.674.7070.3545179.235.1890.4516296.375.6920.5497540.536.2930.6468561.656.3310.7439782.166.6620.841將lnxi.xk在正態(tài)概率圖描點(diǎn)，點(diǎn)在一條直線附近，則認(rèn)為該批數(shù)據(jù)來自于正態(tài)總體。14、以下是40到83之間的24個(gè)隨機(jī)數(shù)，按從大到小排列：83,79,77,75,73,72,71,70,69,67,64,63,61,60,60,59,57,56,55,53,53,50,48,47。對(duì)此數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。解：xKXkXnDkAk14783360.449324879310.309835077270.255445375220.214555373200.180765572170.151275671150.124585770130.099795969100.076410606770.053911606440.032112616320.0107W若取α=0.05，在n=24時(shí)給出W0.0515、某收費(fèi)站觀察平時(shí)經(jīng)過的車輛司機(jī)的性別（用M代表男性，用F代表女性）依次如下：MMMMMMMMMFFFFFFFFFFM，請(qǐng)問男、女性司機(jī)出現(xiàn)的順序是否隨機(jī)？解：設(shè)男性為1，女性為0，得到樣本序列：11111111100000000001，其中0的個(gè)數(shù)為10,1的個(gè)數(shù)為10，R=3，取α=0.05，16、抽取A、B兩個(gè)品牌的自動(dòng)駕駛出租車在同一線路的平均速度如下（單位為km/h）。A品牌：34.333.537.238.432.429.835.0。B品牌：33.734.639.236.4。請(qǐng)問品牌B的自動(dòng)駕駛出租車速度是否不小于A品牌的自動(dòng)駕駛出租車的速度（α=解：要檢驗(yàn)的假設(shè)為：H0:首先混合兩組樣本，由小到大排序RX129.8232.4333.5433.7534.3634.6735.0836.4937.21038.41139.2得知m=7,n=第六章1、能見度會(huì)影響司機(jī)開車的速度，在同一條道路上測(cè)定能見度好、較好、一般、較差、差時(shí)車輛的速度，每種情況都隨機(jī)抽取了4輛車的速度（單位：km/h），測(cè)定的結(jié)果列于表6-11中。試比較不同能見度下的車輛速度是否有顯著差異。表6-11不同能見度下的車輛速度能見度好較好一般較差差132.029.225.223.322.3232.827.426.125.122.5331.226.325.825.122.9430.426.726.725.523.7解：其中，影響因素為不同的能見度，共有5個(gè)不同水平，分別為好、較好、一般、較差和差。則r=5,n方差來源平方和自由度均方MS因素ASSArMSA誤差SSEnMSE總和SSTn得到F比值為$F=\frac{{MSA}}{{MSE}}=\frac{{43.43}}{{0.866}}{\rm{=}}50.15$$F{\r

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

交通數(shù)據(jù)分析基礎(chǔ) 習(xí)題

文檔簡介

溫馨提示

最新文檔

評(píng)論

交通數(shù)據(jù)分析基礎(chǔ) 習(xí)題

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔