版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一章1-8,略。9.將特征status轉(zhuǎn)換為有序因子,等級(jí)依次為Poor、Improved、Excellent。#假設(shè)原始數(shù)據(jù)中的status列是字符型向量
status_ordered<-factor(
x=status,#原始數(shù)據(jù)向量
levels=c("Poor","Improved","Excellent"),#指定有序等級(jí)
ordered=TRUE#聲明為有序因子
)10.創(chuàng)建一個(gè)名為fruits的字符向量,包含以下水果名稱:"apple"、"banana"、"cherry"、"date"、"elderberry"。將"fig"添加到這個(gè)向量的末尾。#創(chuàng)建初始向量
fruits<-c("apple","banana","cherry","date","elderberry")
#添加新元素到末尾
fruits<-c(fruits,"fig")11.創(chuàng)建一個(gè)名為matrixA的3×3矩陣,將其中所有元素均初始化為0,并將第1行第2列的元素設(shè)置為5。#創(chuàng)建全0的3x3矩陣
matrixA<-matrix(0,nrow=3,ncol=3)
#修改第1行第2列元素為5
matrixA[1,2]<-512.創(chuàng)建一個(gè)名為students的數(shù)據(jù)框,包含3列,分別為Name(字符型)、Age(整數(shù)型)、Score(數(shù)值型);并添加3行數(shù)據(jù),分別為("Alice",20,85)、("Bob",22,90)、("Charlie",19,88)。students<-data.frame(
Name=c("Alice","Bob","Charlie"),
Age=c(20L,22L,19L),#顯式聲明整數(shù)類型(L后綴)
Score=c(85,90,88),
stringsAsFactors=FALSE#關(guān)閉字符自動(dòng)轉(zhuǎn)因子(R4.0+默認(rèn)關(guān)閉)
)13.使用students數(shù)據(jù)框(習(xí)題12中創(chuàng)建的),篩選出年齡大于20歲且分?jǐn)?shù)高于87分的學(xué)生。filtered_students<-subset(
students,
Age>20&Score>87#邏輯條件:年齡>20且分?jǐn)?shù)>87
)14.使用plot()函數(shù)繪制students數(shù)據(jù)框(習(xí)題12中創(chuàng)建的)中Age和Score的散點(diǎn)圖,并給該散點(diǎn)圖添加標(biāo)題和坐標(biāo)軸標(biāo)題。plot(
x=students$Age,
y=students$Score,
main="StudentAgevs.Score",#標(biāo)題
xlab="Age(years)",#x軸標(biāo)簽
ylab="Score(%)",#y軸標(biāo)簽
pch=19#設(shè)置點(diǎn)的形狀(實(shí)心圓點(diǎn))
)第二章1.將數(shù)據(jù)框ggplot2::diamonds中的特征color轉(zhuǎn)換為字符型特征。library(ggplot2)
diamonds$color<-as.character(diamonds$color)2.對(duì)數(shù)據(jù)框ggplot2::diamonds中的所有數(shù)值型特征進(jìn)行標(biāo)準(zhǔn)化。#方法1:使用基礎(chǔ)R的scale函數(shù)
diamonds_scaled<-as.data.frame(scale(diamonds[,sapply(diamonds,is.numeric)]))
#方法2:使用dplyr(需加載包)
#library(dplyr)
#diamonds_scaled<-diamonds%>%
#mutate(across(where(is.numeric),scale))3.篩選出數(shù)據(jù)框ggplot2::diamonds中x大于4,并且特征cut為"Fair"的樣本。filtered_diamonds<-subset(diamonds,x>4&cut=="Fair")4.為數(shù)據(jù)框ggplot2::diamonds增加一個(gè)日期型的列date_vec,其中,第1行的日期為"2023-01-01",第2行的日期在第1行的基礎(chǔ)上加1天,依次類推。diamonds$date_vec<-seq.Date(
from=as.Date("2023-01-01"),
by="day",
length.out=nrow(diamonds)
)5.查看數(shù)據(jù)框ggplot2::diamonds的基本信息。str(diamonds)6.將數(shù)據(jù)框ggplot2::diamonds的特征cut、color、clarity的名稱改為大寫形式。colnames(diamonds)[colnames(diamonds)%in%c("cut","color","clarity")]<-
c("CUT","COLOR","CLARITY")7.對(duì)于數(shù)據(jù)框ggplot2::diamonds,根據(jù)特征cut對(duì)數(shù)據(jù)集進(jìn)行劃分,并分組統(tǒng)計(jì)各組信息。library(dplyr)
group_summary<-diamonds%>%
group_by(CUT)%>%
summarise(
count=n(),
avg_price=mean(price,na.rm=TRUE),
min_carat=min(carat),
max_carat=max(carat)
)8.根據(jù)特征price和carat對(duì)數(shù)據(jù)框ggplot2::diamonds進(jìn)行排序。sorted_diamonds<-diamonds%>%
arrange(price,carat)#先按price升序,再按carat升序第三章1.利用R語言計(jì)算數(shù)據(jù)框ggplot::diamonds中特征carat的均值、中位數(shù)、眾數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)、方差、標(biāo)準(zhǔn)差、變異系數(shù)、四分位數(shù)、偏度和峰度。library(ggplot2)
library(psych)#用于幾何平均和調(diào)和平均
library(e1071)#用于偏態(tài)和峰態(tài)
#計(jì)算統(tǒng)計(jì)量
stats<-list(
mean=mean(diamonds$carat),
median=median(diamonds$carat),
mode=names(which.max(table(diamonds$carat))),#眾數(shù)(可能有多個(gè))
geometric_mean=geometric.mean(diamonds$carat),
harmonic_mean=harmonic.mean(diamonds$carat),
variance=var(diamonds$carat),
std_dev=sd(diamonds$carat),
coeff_variation=sd(diamonds$carat)/mean(diamonds$carat),
quantiles=quantile(diamonds$carat,probs=c(0.25,0.75)),
skewness=skewness(diamonds$carat),
kurtosis=kurtosis(diamonds$carat)-3#峰態(tài)(減去3調(diào)整)
)
#打印結(jié)果
print(stats)2.計(jì)算數(shù)據(jù)框ggplot::diamonds中特征color的頻數(shù)和頻率。color_freq<-table(diamonds$color)
color_prop<-prop.table(color_freq)
#打印結(jié)果
print(color_freq)
print(round(color_prop,3))3.繪制圖形查看數(shù)據(jù)框ggplot::diamonds中特征color的分布。library(ggplot2)
ggplot(diamonds,aes(x=color))+
geom_bar(fill="skyblue")+
labs(title="DistributionofDiamondColors",x="Color",y="Count")+
theme_minimal()4.繪制圖形查看數(shù)據(jù)框ggplot::diamonds中特征price的分布。ggplot(diamonds,aes(x=price))+
geom_histogram(bins=50,fill="lightgreen",color="black")+
labs(title="DistributionofDiamondPrices",x="Price(USD)",y="Count")+
scale_x_log10()+#對(duì)數(shù)轉(zhuǎn)換處理右偏分布
theme_minimal()5.繪制圖形查看數(shù)據(jù)框iris中特征Sepal.Length與Sepal.Width的關(guān)系,圖中要根據(jù)特征Species對(duì)點(diǎn)進(jìn)行類別劃分,并根據(jù)特征Petal.Length設(shè)置點(diǎn)的大小。ggplot(iris,aes(
x=Sepal.Length,
y=Sepal.Width,
color=Species,
size=Petal.Length
))+
geom_point(alpha=0.7)+
labs(
title="SepalDimensionsbySpecies",
x="SepalLength(cm)",
y="SepalWidth(cm)",
color="Species",
size="PetalLength(cm)"
)+
scale_color_manual(values=c("setosa"="red","versicolor"="blue","virginica"="green"))+
theme_minimal()第四章1.有一信號(hào)交叉口,其信號(hào)周期為60s,經(jīng)測(cè)得該交叉口的一個(gè)進(jìn)口的平均交通流量為180輛/h,且車輛到達(dá)數(shù)n符合泊松分布n~Pλ解:一個(gè)周期(60s)內(nèi)到達(dá)的車輛數(shù):m設(shè)一個(gè)周期到達(dá)k輛車的概率為Pk,則由遞推公式P當(dāng)k≤2時(shí),Pk遞增;時(shí),因此,當(dāng)k=2時(shí),P2.某交叉口有25%的騎自行車的人不遵守交通規(guī)則,假設(shè)到達(dá)該交叉口的騎行者服從二項(xiàng)分布X~Bn,p解:不遵守交通規(guī)則的人數(shù)概率為p=0.25n將上述數(shù)據(jù)代入公式:P則有:PPP那么,8人中有3人及以上不遵守交通規(guī)則的概率是:P3.在平均交通量為120輛/h的道路上,觀測(cè)斷面上的車輛達(dá)到符合泊松分布n~Pλ,其中λ=120/3600,問30解:一個(gè)觀測(cè)周期(30s)內(nèi)到達(dá)的車輛數(shù):m泊松分布計(jì)算公式:P在30s內(nèi)無車到達(dá)的概率為:P在30s內(nèi)有1輛車到達(dá)的概率為:P在30s內(nèi)有2輛車到達(dá)的概率為:P在30s內(nèi)有3輛車到達(dá)的概率為:P在30s內(nèi)有4輛及以上的車到達(dá)的概率為:P4.某信號(hào)交叉口設(shè)置了左轉(zhuǎn)信號(hào)相位,經(jīng)研究來車符合二項(xiàng)分布X~Bn,p,每一周期平均來車30輛,其中有30%(1)到達(dá)的5輛車中,有2輛左轉(zhuǎn)的概率;(2)到達(dá)的5輛車中,少于2輛左轉(zhuǎn)的概率;(3)到達(dá)的10輛車中,少于2輛左轉(zhuǎn)的概率;(4)某一信號(hào)周期內(nèi)無左轉(zhuǎn)車的概率。解:(1)左轉(zhuǎn)概率為p=0.3,將上述數(shù)據(jù)代入公式:P得:P(2)由(1)有:PPP(3)n=10Pk<2(4)n=30P5.對(duì)于單向平均流量為360veh/h的車流,其車頭時(shí)距h服從負(fù)指數(shù)分布?~Eλ,其中λ=3603600=0.1,求車頭時(shí)距大于10s的概率。解:車頭時(shí)距大于10s的概率也就是10s以內(nèi)無車的概率。由λ=PP同樣,車頭時(shí)距小于或等于10s的概率為:P6.在一條有隔離帶的雙向四車道道路上,單向流量為360veh/h,車頭時(shí)距h服從負(fù)指數(shù)分布?~Eλ,其中λ=3603600=0.1。單方向路寬7.5m,設(shè)行人步行解:行人橫過單向行車道所需要的時(shí)間:t=因此,只有當(dāng)?≥7.5s時(shí),行人才能安全穿越,由于雙車道道路可以充分超車,車頭時(shí)距符合負(fù)指數(shù)分布,對(duì)于任意前后兩輛車而言,車頭時(shí)距大于7.5s的概率為:P對(duì)于Q=360veh/h的車流,1h車頭時(shí)距次數(shù)為360,其中h≥7.5s的車頭時(shí)距為可以安全橫穿的次數(shù):360×0.4724=170(次)第五章1、設(shè)某路口車輛到達(dá)數(shù)服從二項(xiàng)分布X~Bm,p,x1,x2解:EX=mp=2、在某一地區(qū),一年發(fā)生的交通事故次數(shù)X,設(shè)X的密度函數(shù)為fx;θ=θ2xe?解:EX似然函數(shù)為:Lln令ddθlnL=3、某自動(dòng)駕駛公交車速度X服從正態(tài)分布Nμ,σ2,從某天中隨機(jī)抽取6輛自動(dòng)駕駛公交車測(cè)其速度(單位為km/h)分別為14.615.114.914.815.215.1(1)已知σ2=0.06,(2)σ2未知,α解:x=14.95,s(1)σ2已知,u0.025=1.96,均值μ在置信度為xu0.05=1.64,均值μ在置信度為x(2)σ2未知,t0.0255=2.571,均值μ在置信度為0.95t0.055=2.015,均值μ在置信度為0.904、某公司想探究職員乘坐汽車的暈車程度(數(shù)值為0-10,數(shù)值越大,暈車程度越重),現(xiàn)給出男、女職員暈車程度。設(shè)兩組數(shù)據(jù)分別來自正態(tài)總體Nμ1,σ12和Nμ2,σ22,兩樣本相互獨(dú)立,男性職員nx女性職員nx解:μ1?μ2x15、貨運(yùn)公司A、B從甲地到乙地運(yùn)輸貨物的時(shí)間分別服從正態(tài)分布Nμ1,σ12和Nμ2,σ22,兩總體方差相同,兩樣本相互獨(dú)立,μ1,μ2貨運(yùn)公司A:2.662.632.682.602.67貨運(yùn)公司B:2.582.572.632.592.60試求兩貨運(yùn)公司的運(yùn)輸時(shí)間均值差μ1解:x1=2.65,x2=2.59sμ1?μx6、隨機(jī)調(diào)查某路段100輛車的速度,測(cè)得其平均速度為45km/h,根據(jù)以往數(shù)據(jù)可知,該路段的車速標(biāo)準(zhǔn)差為42.5。試求該路段車輛平均速度的置信區(qū)間,α=0.1。解:均值μ的置信度為0.90的區(qū)間估計(jì)為:x7、為了解交通安全宣傳視頻的傳播效果,隨機(jī)調(diào)查了500人,其中有100人收看了該宣傳視頻,試在0.9的置信水平下估計(jì)該宣傳視頻收視率的置信區(qū)間。解:p=20%置信度90%總體比率P的置信區(qū)間為p8、為了調(diào)查兩條線路每輛公交車的日營業(yè)額(元),隨機(jī)抽取了兩條線路的公交車樣本。這兩個(gè)樣本相互獨(dú)立,設(shè)x1,x2分別為第一個(gè)和第二個(gè)總體的樣本均值,S12,S22分別是兩個(gè)總體的樣本方差。兩個(gè)總體均值分別為μ1和μ2,方差分別為σ12和σ22且未知,兩個(gè)樣本的數(shù)據(jù)量、均值、方差如下:n1解:μ1?μx9、某道路汽車的速度服從正態(tài)分布,方差σ2=1.21,現(xiàn)隨機(jī)抽取6輛汽車,測(cè)得的汽車速度(單位為km/h32.4631.5430.1029.7631.6731.32請(qǐng)問當(dāng)顯著性水平α=0.01時(shí),能否認(rèn)為該道路汽車的平均速度為32.50km/h解:H0:μ=32.50H檢驗(yàn)統(tǒng)計(jì)量:z=x決策:拒絕H0結(jié)論:這條道路汽車的平均速度不是32.50km/h10、某自行車租賃公司聲稱其新推出的騎行套餐可以讓騎行者在兩個(gè)月內(nèi)減重8.5kg以上。為了驗(yàn)證這一聲稱是否屬實(shí),有關(guān)研究人員抽檢了10名參與者,得知他們的減重(單位為kg)情況如下:9.511.58.57.51189.57.51114.5請(qǐng)問在α=0.05的顯著性水平下,解:H0:μ≥8.5H1檢驗(yàn)統(tǒng)計(jì)量:z決策:不拒絕H結(jié)論:該公司的聲稱可信。11、某地鐵公司想要了解乘客性別會(huì)不會(huì)顯著影響地鐵滿意度。于是,他們從女性乘客中抽取了50名,測(cè)得平均滿意度為8.2,從男性乘客中抽取了60名,測(cè)得平均滿意度為7.8,統(tǒng)計(jì)資料表明男性乘客和女性乘客的滿意度都服從正態(tài)分布,其標(biāo)準(zhǔn)差分別為0.73和1.16,請(qǐng)問在顯著性水平為0.05的條件下,女性乘客的地鐵滿意度是否比男性乘客的地鐵滿意度高?解:n1=50n2=60H檢驗(yàn)統(tǒng)計(jì)量:U決策:拒絕H結(jié)論:顯著性水平為0.05的條件下,女性乘客的地鐵滿意度比男性乘客的地鐵滿意度高。12、地鐵公司聲稱其某條地鐵線路主要服務(wù)于通勤族,其乘客中有70%為通勤族。為了驗(yàn)證這一聲稱是否屬實(shí),某研究機(jī)構(gòu)隨機(jī)抽取了300人,發(fā)現(xiàn)有200名通勤族經(jīng)常通過該地鐵線路出行。取顯著性水平α=0.05,檢驗(yàn)該地鐵線路乘客群中通勤族的比率是否為70%。解:H檢驗(yàn)統(tǒng)計(jì)量:z決策:不拒絕H結(jié)論:該地鐵公司的說法屬實(shí)。13、隨機(jī)選取某條道路10個(gè)小時(shí)的交通流量(單位為pcu/h):97.8532.55296.37561.652256.7599.54179.23782.16110.67540.53請(qǐng)繪制正態(tài)概率圖。解:這10個(gè)點(diǎn)不在正態(tài)概率圖上,因此可以認(rèn)為該道路交通量的分布不是正態(tài)分布,對(duì)數(shù)據(jù)進(jìn)行對(duì)數(shù)變換,結(jié)果如下:IXiLnxiXk132.553.4830.061297.854.5830.159399.544.6010.2564110.674.7070.3545179.235.1890.4516296.375.6920.5497540.536.2930.6468561.656.3310.7439782.166.6620.841將lnxi.xk在正態(tài)概率圖描點(diǎn),點(diǎn)在一條直線附近,則認(rèn)為該批數(shù)據(jù)來自于正態(tài)總體。14、以下是40到83之間的24個(gè)隨機(jī)數(shù),按從大到小排列:83,79,77,75,73,72,71,70,69,67,64,63,61,60,60,59,57,56,55,53,53,50,48,47。對(duì)此數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。解:xKXkXnDkAk14783360.449324879310.309835077270.255445375220.214555373200.180765572170.151275671150.124585770130.099795969100.076410606770.053911606440.032112616320.0107W若取α=0.05,在n=24時(shí)給出W0.0515、某收費(fèi)站觀察平時(shí)經(jīng)過的車輛司機(jī)的性別(用M代表男性,用F代表女性)依次如下:MMMMMMMMMFFFFFFFFFFM,請(qǐng)問男、女性司機(jī)出現(xiàn)的順序是否隨機(jī)?解:設(shè)男性為1,女性為0,得到樣本序列:11111111100000000001,其中0的個(gè)數(shù)為10,1的個(gè)數(shù)為10,R=3,取α=0.05,16、抽取A、B兩個(gè)品牌的自動(dòng)駕駛出租車在同一線路的平均速度如下(單位為km/h)。A品牌:34.333.537.238.432.429.835.0。B品牌:33.734.639.236.4。請(qǐng)問品牌B的自動(dòng)駕駛出租車速度是否不小于A品牌的自動(dòng)駕駛出租車的速度(α=解:要檢驗(yàn)的假設(shè)為:H0:首先混合兩組樣本,由小到大排序RX129.8232.4333.5433.7534.3634.6735.0836.4937.21038.41139.2得知m=7,n=第六章1、能見度會(huì)影響司機(jī)開車的速度,在同一條道路上測(cè)定能見度好、較好、一般、較差、差時(shí)車輛的速度,每種情況都隨機(jī)抽取了4輛車的速度(單位:km/h),測(cè)定的結(jié)果列于表6-11中。試比較不同能見度下的車輛速度是否有顯著差異。表6-11不同能見度下的車輛速度能見度好較好一般較差差132.029.225.223.322.3232.827.426.125.122.5331.226.325.825.122.9430.426.726.725.523.7解:其中,影響因素為不同的能見度,共有5個(gè)不同水平,分別為好、較好、一般、較差和差。則r=5,n方差來源平方和自由度均方MS因素ASSArMSA誤差SSEnMSE總和SSTn得到F比值為$F=\frac{{MSA}}{{MSE}}=\frac{{43.43}}{{0.866}}{\rm{=}}50.15$$F{\r
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 道路通行能力提升方案
- 地基承載力檢測(cè)與評(píng)估方案
- 建筑物排水系統(tǒng)維護(hù)方案
- 2026年人工智能在交通領(lǐng)域的應(yīng)用考試題庫答案
- 2026年游戲開發(fā)項(xiàng)目時(shí)間規(guī)劃專項(xiàng)試題
- 消防設(shè)施信息化建設(shè)方案
- 消防安全文化推廣方案
- 防腐蝕工程安全隱患排查方案
- 2026廣東東莞中學(xué)編外教師東莞春季招聘2人備考題庫帶答案詳解(模擬題)
- 2026四川治蜀興川教育管理有限公司招聘7人備考題庫帶答案詳解(精練)
- 2025-2026學(xué)年北京市西城區(qū)高三(上期)期末考試地理試卷(含答案詳解)
- 贛州市章貢區(qū)2026年社區(qū)工作者(專職網(wǎng)格員)招聘【102人】考試參考題庫及答案解析
- 江蘇高職單招培訓(xùn)課件
- 2026年山東理工職業(yè)學(xué)院單招綜合素質(zhì)考試參考題庫帶答案解析
- 2026年及未來5年市場(chǎng)數(shù)據(jù)中國氟樹脂行業(yè)發(fā)展?jié)摿Ψ治黾巴顿Y方向研究報(bào)告
- DB1331∕T 109-2025 雄安新區(qū)建設(shè)工程抗震設(shè)防標(biāo)準(zhǔn)
- DB37∕T 1317-2025 超細(xì)干粉滅火系統(tǒng)技術(shù)規(guī)范
- Scratch講座課件教學(xué)課件
- 《低碳醫(yī)院評(píng)價(jià)指南》(T-SHWSHQ 14-2025)
- 2025至2030中國砷化鎵太陽能電池外延片行業(yè)市場(chǎng)深度研究與戰(zhàn)略咨詢分析報(bào)告
- 質(zhì)量環(huán)境及職業(yè)健康安全三體系風(fēng)險(xiǎn)和機(jī)遇識(shí)別評(píng)價(jià)分析及控制措施表(包含氣候變化)
評(píng)論
0/150
提交評(píng)論