版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
2025人工智能領域計算機視覺算法技術考核試卷及答案一、單選題(每題2分,共20分)1.在YOLOv8中,若輸入圖像尺寸為640×640,主干網(wǎng)絡采用CSPDarknet53,則第3個CSP模塊輸出的特征圖尺寸為A.80×80×256?B.40×40×512?C.20×20×1024?D.10×10×2048答案:B解析:CSPDarknet53下采樣倍率為8,640/8=80,但第3個CSP位于第3次下采樣后,倍率為16,故640/16=40,通道數(shù)512。2.VisionTransformer中,若patchsize=16,輸入224×224×3,則Transformerencoder的序列長度(含clstoken)為A.196?B.197?C.198?D.199答案:B解析:(224/16)^2=196個patch,加1個clstoken,共197。3.使用FocalLoss訓練RetinaNet時,若γ=2,某正樣本pt=0.9,則其損失權重相對于pt=0.5的樣本縮小倍數(shù)約為A.0.04?B.0.25?C.0.5?D.1答案:A解析:權重系數(shù)(1pt)^γ,0.1^2=0.01,0.5^2=0.25,縮小0.01/0.25=0.04。4.在CenterNet中,若heatmap峰值響應為1,高斯核σ=2,則距峰值點3像素處的響應值約為A.0.105?B.0.325?C.0.605?D.0.825答案:B解析:高斯公式exp(32/2σ2)=exp(9/8)=0.325。5.使用RandAugment時,若N=2,M=9,則最多可生成的不同增強策略數(shù)為A.784?B.902?C.1024?D.1296答案:D解析:14種變換,每次選2種,順序有關,重復允許,14×14×(M+1)2=142×102=19600,但官方實現(xiàn)去重后為1296。6.在MaskRCNN的ROIAlign中,若ROI寬高均為7像素,采樣點數(shù)為4,則每個bin的采樣點坐標步長為A.0.5?B.1.0?C.1.75?D.2.0答案:C解析:7像素分2×2bin,每bin寬高3.5,采樣點2×2,步長3.5/2=1.75。7.使用KnowledgeDistillation,教師模型Softmax溫度T=4,學生模型T=1,則蒸餾損失中KL散度權重通常應A.與T2成正比?B.與T2成反比?C.與T成正比?D.固定0.5答案:A解析:梯度幅度隨T2增大而增大,故權重需乘以T2以平衡量級。8.在DeformableDETR中,若編碼器層數(shù)為6,每層參考點偏移量維度為2,則單頭注意力可學習偏移參數(shù)量占整個編碼器參數(shù)量的比例約為A.0.3%?B.1.2%?C.3.8%?D.8.5%答案:B解析:偏移僅兩層線性映射,參數(shù)量2×2×256=1024,編碼器總參數(shù)量約85M,占比≈1.2%。9.使用Mosaic數(shù)據(jù)增強時,若單張圖概率為0.5,則4張圖拼接的期望出現(xiàn)概率為A.0.0625?B.0.125?C.0.5?D.1.0答案:C解析:Mosaic開關由超控概率0.5決定,與內(nèi)部4圖無關,期望即0.5。10.在SwinTransformer中,若窗口大小為7×7,特征圖尺寸14×14,則ShiftedWindow后,需計算mask的窗口數(shù)為A.4?B.9?C.16?D.25答案:B解析:14/7=2,移位后3×3=9個窗口,其中4個完整,5個需mask。二、多選題(每題3分,共15分,多選少選均不得分)11.下列哪些操作可緩解目標檢測中小目標漏檢A.增加P2特征層?B.使用AnchorFree頭?C.引入CBAM注意力?D.提高NMS閾值至0.7答案:A、C解析:P2保留高分辨率,CBAM增強通道與空間權重;AnchorFree與NMS閾值對漏檢無直接增益。12.關于SelfSupervisedLearning對比方法,正確的是A.MoCov3采用ViT作為編碼器?B.SimSiam無需負樣本?C.BYOL使用動量編碼器?D.SwAV在線聚類答案:A、B、D解析:BYOL無需動量編碼器,其在線網(wǎng)絡即可。13.在TensorRT部署YOLOv7時,下列層可能導致重構失敗A.DynamicReLU?B.SiLU?C.ImplicitKnowledge?D.GridSampler答案:A、C、D解析:ImplicitKnowledge為Pytorch自定義,GridSampler動態(tài)形狀,DynamicReLU條件分支;SiLU已原生支持。14.關于VisionTransformer位置編碼,說法正確的是A.1D編碼無法泛化到任意分辨率?B.2D編碼可擴展至更大圖?C.相對位置編碼可插值?D.去掉位置編碼掉點<0.5%答案:A、B、C解析:去掉位置編碼ImageNet掉點約3%,非0.5%。15.在DeepLabv3+中,ASPP模塊包含A.1×1conv?B.3×3convrate=6?C.3×3convrate=18?D.GlobalAveragePooling答案:A、B、C、D解析:官方實現(xiàn)四項俱全。三、填空題(每空2分,共20分)16.在EfficientDet中,BiFPN第3層輸入分辨率為80×80,通道數(shù)________,重復堆疊次數(shù)________。答案:160;3解析:EfficientDetD0配置,通道160,BiFPN重復3次。17.使用CutMix時,若λ~Beta(1,1)采樣得0.7,則圖像A占比________,標簽平滑后交叉熵權重為________。答案:0.7;0.7解析:Beta(1,1)即Uniform,λ=0.7直接作面積比與損失權重。18.在FairMOT中,ReID維度設為________,采用________損失度量特征。答案:128;CircleLoss解析:官方開源默認128維,CircleLoss優(yōu)于Triplet。19.當使用SyncBN訓練Mask2Former,BatchSizePerGPU=2,GPU=8,則實際等效BN批量為________。答案:16解析:SyncBN跨卡同步,2×8=16。20.在DINO中,教師模型EMA更新系數(shù)默認________,學生溫度________。答案:0.996;0.1解析:DINO自監(jiān)督設定。四、判斷改錯題(每題2分,共10分,先判對錯,若錯則給出正確表述)21.DeiT訓練時,使用HardDistillation默認將clstoken替換為distillationtoken。答案:錯。正確:DeiT仍保留clstoken,額外添加distillationtoken,兩者并列。22.YOLOv5的anchor設置通過kmeans++聚類COCOtrain2017自動獲得。答案:錯。正確:YOLOv5作者直接手工設定9組anchor,未重新聚類。23.ConvNeXt將ResNet的3×3卷積全部替換為7×7深度可分離卷積。答案:錯。正確:ConvNeXt使用7×7depthwise,但非“全部”,下采樣層仍為4×4stride=2。24.在ViT微調(diào)時,若圖像分辨率從224提至384,需對絕對位置編碼進行2D線性插值。答案:對。25.FCOS的centerness分支采用BCE損失,標簽為0~1連續(xù)值。答案:對。五、簡答題(每題8分,共24分)26.描述MaskDINO相較于Mask2Former的三項核心改進,并給出在COCOval2017上的maskAP增益。答案:1)統(tǒng)一檢測與分割query,共享decoder,減少冗余;2)引入對比式去噪訓練,加速收斂;3)使用混合匹配cost,結(jié)合maskcost與boxcost,提升正樣本質(zhì)量。增益:maskAP+1.8(49.2→51.0)。27.解釋為何在自監(jiān)督學習中,BYOL不會出現(xiàn)模型坍塌,并給出其關鍵組件。答案:關鍵組件:1)在線網(wǎng)絡+目標網(wǎng)絡雙分支;2)目標網(wǎng)絡用EMA更新;3)預測器僅在線分支;4)不使用負樣本,但通過EMA與預測器構成隱式對比,阻止常數(shù)輸出;5)歸一化保持方差。梯度分析表明,若在線輸出恒定,預測器梯度為零,無法更新,故系統(tǒng)被迫學習有意義特征。28.列舉三種可在邊緣端部署的INT8量化誤差校正方法,并比較其計算開銷。答案:1)CrossLayerEqualization:逐通道縮放,無數(shù)據(jù),開銷<1s;2)BiasCorrection:用1024張校準圖估計均值偏移,開銷≈30s;3)AdaRound:優(yōu)化取整閾值,需反向傳播,開銷≈10min;開銷排序:CLE<BiasCorr<AdaRound。六、計算與推導題(共31分)29.(10分)給定RetinaNet輸出特征圖尺寸32×32×9×80,batch=8,采用FocalLossα=0.25,γ=2。若某正樣本pt=0.95,負樣本pt=0.05,分別計算其FocalLoss值,并給出整圖正負樣本比例1:3時的期望損失。答案:正樣本:FL=0.25×(10.95)^2×log(0.95)=0.25×0.0025×(0.051)=3.19×10??負樣本:FL=0.75×(0.05)^2×log(0.95)=0.75×0.0025×(0.051)=9.56×10??期望:E[FL]=(1/4)×3.19e5+(3/4)×9.56e5=7.96×10??30.(11分)在DETR中,設匹配costL=λ_cls·L_cls+λ_L1·L_box+λ_giou·L_giou,其中λ_cls=2,λ_L1=5,λ_giou=2。對某預測框(bx,by,bw,bh)=(0.5,0.5,1.2,1.2),真值(0.4,0.55,1.0,1.0),計算L1損失與GIoU損失,并給出最終cost。答案:L1=|0.50.4|+|0.50.55|+|1.21.0|+|1.21.0|=0.1+0.05+0.2+0.2=0.55GIoU:交集面積=1×1=1,并集=1.2×1.2+1×11=1.44,IoU=1/1.44=0.694,GIoU=IoU(CA∪B)/C,C=(max(1.2,1))2=1.44,GIoU=0.694(1.441.44)/1.44=0.694,故L_giou=10.694=0.306cost=2×L_cls+5×0.55+2×0.306=2L_cls+2.75+0.612=2L_cls+3.362(L_cls視具體類別概率而定,此處保留表達式)。31.(10分)給定SwinTiny模型,輸入224×224,patch=4×4,窗口=7×7,嵌入維96,層數(shù)[2,2,6,2],自注意力頭數(shù)[3,6,12,24]。計算整個模型WMSA與SWMSA的乘法次數(shù)(FLOPs)近似值,忽略偏置與激活。答案:階段1:特征56×56,窗口數(shù)8×8=64,每窗口492×96×3×2=6912×96×2=1.33e6FLOPs,共1.33e6×64×2=1.70e8階段2:28×28,窗口4×4=16,頭6,每窗口492×192×6×2=2.66e6,共2.66e6×16×2=8.52e7階段3:14×14,窗口2×2=4,頭12,每窗口492×384×12×2=1.06e7,共1.06e7×4×6=2.55e8階段4:7×7,窗口1×1=1,頭24,每窗口492×768×24×2=8.51e7,共8.51e7×1×2=1.70e8總FLOPs≈1.70e8+8.52e7+2.55e8+1.70e8=6.8e8,乘2為SWMSA相同,故總1.36e9FLOPs。七、編程實現(xiàn)題(共30分)32.閱讀下列PyTorch代碼片段,補全缺失部分,實現(xiàn)“可變形卷積v2”前向,要求支持自定義步長與padding,且返回mask分支。```pythonimporttorchimporttorch.nnasnnfromtorchvision.opsimportdeform_conv2dclassDCNv2(nn.Module):def__init__(self,c_in,c_out,k=3,s=1,p=1,g=1):super().__init__()self.c_in,self.c_out,self.k,self.s,self.p,self.g=c_in,c_out,k,s,p,gself.conv_offset=nn.Conv2d(c_in,2kk,k,s,p,bias=True)self.conv_mask=nn.Conv2d(c_in,kk,k,s,p,bias=True)self.conv=nn.Conv2d(c_in,c_out,k,s,p,groups=g,bias=False)self.init_weights()definit_weights(self):nn.init.constant_(self.conv_offset.weight,0.)nn.init.constant_(self.conv_offset.bias,0.)nn.init.constant_(self.conv_mask.weight,0.)nn.init.constant_(self.conv_mask.bias,0.)defforward(self,x):offset=self.conv_offset(x)mask=torch.sigmoid(self.conv_mask(x))out=deform_conv2d(x,offset,self.conv.weight,self.conv.bias,stride=self.s,padding=self.p,dilation=1,mask=mask)returnout```答案:如上代碼已完整,缺失部分為deform_conv2d調(diào)用中傳入mask參數(shù)。33.實現(xiàn)“在線困難樣本挖掘”(OHEM)交叉熵,要求topk比例=0.3,支持多卡同步。```pythonclassOhemCELoss(nn.Module):def__init__(self,topk=0.3,ignore_index=255):super().__init__()self.topk=topkself.ignore_index=ignore_indexself.crit=nn.CrossEntropyLoss(reduction='none')defforward(self,logits,labels):loss=self.crit(logits,labels)mask=labels!=self.ignore_indexloss=loss[mask]ifloss.numel()==0:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第30課《系統(tǒng)安全需升級》測試題2025-2026學年人教版八年級信息科技全一冊
- 《GB-T 24438.3-2012自然災害災情統(tǒng)計 第3部分:分層隨機抽樣統(tǒng)計方法》專題研究報告
- 《GBT 21595-2008 危險品便攜式罐體撞擊試驗方法》專題研究報告
- 《GBT 14993-2008轉(zhuǎn)動部件用高溫合金熱軋棒材》專題研究報告
- 《GB 4706.85-2008家用和類似用途電器的安全 紫外線和紅外線輻射皮膚器具的特殊要求》專題研究報告
- 道路危險運輸安全培訓課件
- 道路交通安全培訓素材課件
- 道路交通培訓課件
- 2025-2026年蘇教版八年級語文上冊期末題庫試題附答案
- 迪奧項鏈介紹
- 器官移植術后排斥反應的風險分層管理
- 2026年湛江日報社公開招聘事業(yè)編制工作人員備考題庫及完整答案詳解
- 2025-2026學年人教版數(shù)學三年級上學期期末仿真模擬試卷一(含答案)
- 2025年涼山教師業(yè)務素質(zhì)測試題及答案
- 2026年昭通市威信縣公安局第一季度輔警招聘(14人)筆試模擬試題及答案解析
- 氫能技術研發(fā)協(xié)議
- 2025交管12123學法減分整套試題帶答案解析(全國適用)
- 經(jīng)皮內(nèi)鏡下胃造瘺術護理配合
- 2025年國企管理人員能力測評試卷及答案
- 電動車裝配作業(yè)指導書1
- 財務部2025年總結(jié)及2026年工作計劃
評論
0/150
提交評論