版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
2025年人工智能工程師計算機視覺考核試卷及答案一、單項選擇題(每題2分,共20分)1.在YOLOv8中,若輸入圖像尺寸為640×640,下采樣倍數(shù)為32,則最終特征圖的空間分辨率是A.10×10??B.20×20??C.40×40??D.80×80答案:B解析:640÷32=20,故特征圖尺寸為20×20。2.使用FocalLoss訓練目標檢測模型時,若γ=2,某正樣本的預測概率p=0.9,則其損失值約為A.0.001??B.0.01??C.0.1??D.1答案:B解析:FocalLoss=?(1?p)^γ·log(p)=?(0.1)^2·log(0.9)≈0.01。3.在VisionTransformer中,位置編碼采用二維正弦余弦函數(shù)而非可學習參數(shù)的主要優(yōu)點是A.減少顯存占用??B.支持任意分辨率微調(diào)??C.提升收斂速度??D.增強非線性答案:B解析:正弦余弦編碼具有外推性,可在不同分辨率間插值,無需重新訓練。4.當使用DeepLabV3+時,若output_stride=16,則ASPP模塊中3×3空洞卷積的dilationrate組合為A.6,12,18??B.12,24,36??C.6,12,18,24??D.1,6,12,18答案:A解析:output_stride=16時,標準ASPP采用6,12,18。5.在MMPose中,HRNetw32的“32”指A.網(wǎng)絡深度??B.高分辨率分支寬度??C.最低分辨率分支寬度??D.參數(shù)量32M答案:B解析:HRNetw32表示高分辨率分支的寬度(通道數(shù))為32。6.若將BatchNorm替換為GroupNorm,在訓練batch_size=2的極端場景下,最可能觀察到A.梯度爆炸??B.損失震蕩??C.收斂變慢但穩(wěn)定??D.顯存占用下降答案:C解析:GroupNorm不依賴batch統(tǒng)計量,小batch下更穩(wěn)定,但收斂速度略慢。7.在TensorRT8.6中,若某INT8量化層出現(xiàn)精度驟降,優(yōu)先檢查的校準算法是A.Entropy??B.Legacy??C.MinMax??D.Percentile答案:A解析:Entropy校準對長尾分布敏感,常導致精度下降,可嘗試Percentile。8.使用RandAugment時,若M=10,N=2,則單張圖像最大可能疊加的變換次數(shù)為A.2??B.10??C.20??D.100答案:A解析:N=2表示隨機選2種變換,每種只應用一次。9.在CenterNet中,若heatmap峰值響應被NMS抑制,最可能原因是A.峰值小于閾值??B.高斯核σ過大??C.峰值間距小于3像素??D.學習率過高答案:C解析:CenterNetNMS采用3×3最大池化,間距小于3像素會被合并。10.將PyTorch模型導出ONNX后,若出現(xiàn)“Resize11”算子不支持,最簡修復方案是A.降級opset=9??B.替換為adaptive_pool??C.固定輸入尺寸??D.使用torch1.12答案:A解析:Resize11在opset=11引入,降級到opset=9可避開。二、多項選擇題(每題3分,共15分)11.下列哪些操作會降低ViT的推理延遲(多選)A.將GELU替換為ReLU??B.使用LinearGQA??C.減少patchsize??D.采用Winograd卷積答案:A、B解析:GELU計算量大,ReLU更快;GQA減少KV頭數(shù),降低訪存。patchsize減小反而增加序列長度;Winograd僅適用于CNN。12.關于Mask2Former,下列說法正確的是(多選)A.支持實例、語義、全景三分支統(tǒng)一??B.使用learnablequery??C.訓練時maskloss權(quán)重高于分類損失??D.解碼器采用crossattention答案:A、B、D解析:maskloss權(quán)重通常0.5,低于分類1.0,C錯誤。13.在FP16混合精度訓練時,下列哪些情況需手動放大梯度(多選)A.使用AdamW+clip_grad_norm??B.出現(xiàn)梯度下溢??C.損失縮放因子>8192??D.模型含LayerNorm答案:B、C解析:梯度下溢需lossscaling;縮放因子過大也需手動干預。14.下列哪些數(shù)據(jù)增強策略對小目標檢測有效(多選)A.Mosaic??B.CopyPaste??C.RandomCrop??D.MixUp答案:A、B、C解析:Mosaic與CopyPaste增加小目標正樣本;RandomCrop可裁剪出小目標。MixUp對定位精度不利。15.在部署階段,下列哪些技術可緩解模型漂移(多選)A.TestTimeAugmentation??B.ExponentialMovingAverage??C.OnlineHardExampleMining??D.DomainspecificBN答案:A、D解析:TTA提升魯棒性;DomainBN緩解域漂移。EMA與OHEM屬訓練階段。三、填空題(每空2分,共20分)16.在SwinTransformer中,連續(xù)兩個ShiftedWindow之間的偏移量為________像素。答案:?M/2?,其中M=7,故填3。17.若RetinaNet的anchor面積設置為322到5122,共5級,則面積增長因子為________。答案:2。解析:512÷32=16,16^(1/4)=2。18.使用TensorRT的INT8校準,若校準集圖片不足,導致KL散度大于________bit,則判定校準失敗。答案:0.1。解析:官方建議KL<0.1bit。19.在OpenCV中,cv2.remap的插值方式INTER_LINEAR對應的枚舉值為________。答案:1。20.當使用PyTorch的torchvision.ops.nms,若IoU閾值設為0.6,則重疊度大于0.6的框會被________。答案:抑制(或丟棄)。21.在MMDetection配置中,optimizer_config的grad_clip字段若設置dict(max_norm=35,norm_type=2),表示采用________范數(shù)裁剪。答案:L2。22.若EfficientNetB0的compoundcoefficientφ=1,則深度倍率為________。答案:1.2^φ=1.2。23.在DINO中,teacher模型的EMA更新系數(shù)默認隨訓練進程從________線性升至1。答案:0.996。24.使用ONNXRuntimeGPU推理時,若provider選“CUDAExecutionProvider”,需先調(diào)用________接口綁定顯存。答案:IOBinding。25.在Cityscapes數(shù)據(jù)集上,DeepLabV3+×ception模型輸出stride=16,需將預測上采樣________倍至原圖。答案:16。四、判斷題(每題1分,共10分)26.DeiT引入distillationtoken后,分類頭僅對clstoken做softmax。答案:錯。解析:DeiT對clstoken與distillationtoken分別預測,再融合。27.在YOLOv5中,SPPF模塊相比SPP,在相同感受野下計算量更低。答案:對。解析:SPPF用串行MaxPool,減少重復卷積。28.使用Albumentations時,DualTransform可同時處理圖像與mask,但無法處理bboxes。答案:錯。解析:DualTransform支持mask,BboxTransform支持bboxes。29.在MMRotate中,旋轉(zhuǎn)框的表示方式默認是“xywhθ”,θ∈[?90°,0°)。答案:對。30.當使用PyTorch的DataLoader,num_workers>0時,多進程啟動方式在Windows默認為spawn。答案:對。31.在VisionTransformer中,patchembedding的卷積核大小必須等于patchsize。答案:錯??捎胹tride=patchsize,核可更大。32.若將ReLU替換為SiLU,模型MACs不變,但激活顯存占用增加。答案:錯。SiLU需保存輸入用于反向,顯存略增,但MACs相同。33.在CenterNet2中,采用DIoU損失替代L1損失,可直接提升AP0.5。答案:錯。DIoU主要提升AP0.75與AR。34.使用TorchScript導出模型時,tracing無法處理控制流,scripting可以。答案:對。35.在MMDeploy中,若后端為ncnn,則必須將模型轉(zhuǎn)換為ONNX中間格式。答案:錯。ncnn可直接轉(zhuǎn)換PyTorch→param/bin。五、簡答題(每題8分,共24分)36.描述DeformableDETR中multiscaledeformableattention的計算流程,并說明其復雜度相對原始DETR的改進。答案:1.對多尺度特征圖{F_l},每個查詢q采樣K個偏移點,偏移量由線性層預測并歸一化到[0,1]。2.采用雙線性插值獲取采樣點特征,并通過attention權(quán)重加權(quán)求和。3.復雜度從O(HW·N_q)降至O(K·N_q),K≈4,與特征圖尺寸無關,顯存下降約80%,訓練速度提升5×。37.給出在JetsonOrinNano上部署YOLOv8s的完整優(yōu)化鏈路,含量化、圖優(yōu)化、內(nèi)存池配置,并說明各環(huán)節(jié)收益。答案:1.訓練后量化:使用NVIDIA的PTQwithpercentile=99.99%,INT8精度下降0.3mAP。2.TensorRT8.6:啟用DLAcore0加載FP16backbone,GPU加載INT8head,延遲從42ms降至19ms。3.圖優(yōu)化:fuseconv+bn+relu,生成engine時開啟preview=fp16+int8,減少kernellaunch35%。4.內(nèi)存池:創(chuàng)建IGpuAllocator,預分配1GB固定顯存,避免malloc碎片,端到端吞吐提升22FPS→31FPS。38.解釋為何在自監(jiān)督學習MAE中,maskratio高達75%仍有效,并給出兩種可能的失效場景及對應緩解策略。答案:1.有效性:ViT的冗余性高,patch間相關性大,75%mask仍保留全局結(jié)構(gòu);decoder僅處理可見patch,計算量小,易優(yōu)化。2.失效場景:a.細粒度分類(CUB200),mask過高丟失關鍵局部。策略:maskratio隨訓練逐步從30%升至75%。b.小目標檢測,mask后目標完全不可見。策略:采用blockwisemask,確保目標至少保留一個完整patch。六、編程題(共41分)39.(13分)閱讀下列YOLOv8s部分配置文件,補全缺失的anchor設置,并寫出計算anchor與gt框匹配過程的Python偽代碼(不含NMS)。配置片段:```yamlanchors:[10,13,16,30,33,23]P3/8[30,61,62,45,59,119]P4/16[___]P5/32```答案:缺失行:[116,90,156,198,373,326]偽代碼:```pythondefassign_anchor(anchors,gts,thr=4.0):anchors:list[Tensor(K,2)],gts:Tensor(N,4)fori,ancinenumerate(anchors):wh_anc=anc.view(1,2)K,2wh_gt=gts[:,2:4].unsqueeze(1)N,1,2ratio=torch.max(wh_gt/wh_anc,wh_anc/wh_gt).max(1)[0]N,Kmatch=ratio<thrN,Kboolidx=torch.nonzero(match,as_tuple=False)[M,2]returnidx返回(N,K)匹配索引```40.(14分)給定一個自定義算子“DeformPSROIAlign”,輸入特征圖[N,C,H,W]、rois[N,5]、offset[N,2,K,H,W],輸出池化后特征[N,C,K,7,7]。請寫出CUDAkernel的launch配置、線程索引映射,并計算共享內(nèi)存需求。答案:launch配置:```cppdim3block(7,7,8);//7x7spatial,8channelsperblockdim3grid(NK,(C+7)/8);```線程索引:```cppintn=blockIdx.x/K;intk=blockIdx.x%K;intc0=blockIdx.y8;intph=threadIdx.x,pw=threadIdx.y;inttc=threadIdx.z;intc=c0+tc;```共享內(nèi)存:每個線程塊需緩存9×9輸入?yún)^(qū)域(雙線性插值),float大小=9×9×8×4B≈2.6KB,小于48KB上限。41.(14分)基于MMDetection框架,實現(xiàn)一個自定義數(shù)據(jù)增強“RandomPerspectiveRotate”,要求:1.同時處理img、bboxes、masks;2.旋轉(zhuǎn)角度θ~U(?15°,15°),透視系數(shù)p~U(0.8,1.2);3.輸出保持原圖尺寸,空白區(qū)域用灰色填充。給出完整類代碼與注冊方式。答案:```pythonfrommmdet.datasets.transformsimportRandomAffineimportcv2importnumpyasnpfrommmcv.transformsimportBaseTransform,TRANSFORMS@TRANSFORMS.register_module()classRandomPerspectiveRotate(BaseTransform):def__init__(self,rotate_range=15,perspect_range=0.2,pad_val=114):self.rotate_range=rotate_rangeself.perspect_range=perspect_rangeself.pad_val=pad_valdeftransform(self,results):h,w=results['img_shape'][:2]angle=np.random.uniform(self.rotate_range,self.rotate_range)p=np.random.uniform(1self.perspect_range,1+self.perspect_range)透視矩陣pts1=np.float32([[0,0],[w,0],[w,h],[0,h]])pts2=pts1p+np.random.uniform(10,10,pts1.shape)M=cv2.getPerspectiveTransform(pts1,pts2)旋轉(zhuǎn)中心center=(w//2,h//2)MR=cv2.getRotationMatrix2D(center,angle,1)MR=np.vstack([MR,[0,0,1]])組合M=M@MRwarpimg=cv2.warpPerspective(results['img'],M,(w,h),borderValue=(self.pad_val,)3)results['img']=imgwarpbboxesif'gt_bboxes'inresults:bboxes=results['gt_bboxes'].tensor.numpy()pts=self.bboxes2corners(bboxes)pts=cv2.perspectiveTransform(pts,M)bboxes=self.corners2bboxes(pts)results['gt_bboxes'].tensor=torch.from_numpy(bboxes)warpmasksif'gt_masks'inresults:masks=result
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護理專業(yè)PDCA循環(huán)的實踐與護理執(zhí)行
- 2026年神經(jīng)形態(tài)計算芯片項目可行性研究報告
- 2026年食品加工行業(yè)創(chuàng)新報告及3D打印食品技術發(fā)展報告
- 2026年汽車自動駕駛傳感器行業(yè)創(chuàng)新報告
- 中學地理與生物跨學科教學研究:人工智能支持下的教學模式創(chuàng)新教學研究課題報告
- 建筑安全資料培訓課件
- 區(qū)域教育均衡發(fā)展中人工智能技術應用與教育公平保障體系構(gòu)建教學研究課題報告
- 2025年城市環(huán)境治理服務標準操作
- 銀行卡業(yè)務處理與風險管理手冊
- 山東省城鄉(xiāng)規(guī)劃設計研究院有限公司2026年校園招聘備考題庫及參考答案詳解一套
- DZ∕T 0248-2014 巖石地球化學測量技術規(guī)程(正式版)
- JTJ-T-257-1996塑料排水板質(zhì)量檢驗標準-PDF解密
- 殘疾人法律維權(quán)知識講座
- 瀝青維護工程投標方案技術標
- 水電站建筑物課程設計
- 兒童行為量表(CBCL)(可打印)
- 硒功能與作用-課件
- 《英語教師職業(yè)技能訓練簡明教程》全冊配套優(yōu)質(zhì)教學課件
- DB53∕T 1034-2021 公路隧道隱蔽工程無損檢測技術規(guī)程
- 同步工程的內(nèi)涵、導入和效果
- DB32∕T 2349-2013 楊樹一元立木材積表
評論
0/150
提交評論