版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025年人工智能(計(jì)算機(jī)視覺)體系認(rèn)證練習(xí)題試卷及答案一、單項(xiàng)選擇題(每題2分,共20分)1.在YOLOv8中,若輸入圖像尺寸為640×640,網(wǎng)絡(luò)下采樣倍數(shù)為32,則最終特征圖的空間分辨率是A.10×10??B.20×20??C.40×40??D.80×80答案:B解析:640÷32=20,故特征圖為20×20。2.VisionTransformer(ViT)在ImageNet1k上首次達(dá)到90.45%Top1準(zhǔn)確率時(shí),所采用的預(yù)訓(xùn)練策略是A.自監(jiān)督對(duì)比學(xué)習(xí)??B.有監(jiān)督大規(guī)模預(yù)訓(xùn)練??C.掩碼圖像建模??D.對(duì)抗訓(xùn)練答案:C解析:2023年MAE(MaskedAutoencoders)將ViTB推向90.45%,屬于掩碼圖像建模范式。3.在CenterNet中,若高斯核半徑公式為r=?(w+h)/6?,當(dāng)目標(biāo)框w=60、h=36時(shí),半徑為A.15??B.16??C.17??D.18答案:B解析:(60+36)/6=16,向下取整得16。4.下列關(guān)于FPN的敘述,錯(cuò)誤的是A.側(cè)向連接使用1×1卷積降維??B.自頂向下路徑進(jìn)行上采樣??C.最終每層獨(dú)立預(yù)測(cè)??D.僅用于兩階段檢測(cè)器答案:D解析:FPN同樣被SSD、YOLO等單階段檢測(cè)器采用。5.在DeepSort中,用于外觀特征提取的CNN主干是A.OSNet??B.ResNet50Market??C.ShuffleNet??D.EfficientNetB0答案:B解析:DeepSort官方模型采用在Market1501上預(yù)訓(xùn)練的ResNet50。6.若使用RandAugment對(duì)圖像做增強(qiáng),默認(rèn)幅度M=9,則“ShearX”操作的最大像素偏移量為A.0.1×255??B.0.3×255??C.0.5×255??D.0.9×255答案:B解析:RandAugment幅度9對(duì)應(yīng)0.3倍像素范圍。7.在TensorRT8.6中,將PyTorch的Hardswish轉(zhuǎn)為引擎時(shí),最佳實(shí)現(xiàn)方式是A.直接映射到IActivationLayer::kHARD_SWISH??B.拆分成Clip+Mul+Div??C.使用Plugin??D.使用CUDAkernel手寫答案:A解析:TensorRT8.6原生支持Hardswish,可直接映射。8.當(dāng)使用MixedPrecision訓(xùn)練時(shí),下列哪項(xiàng)最能抑制梯度下溢A.Lossscaling??B.Gradientclipping??C.Warmup??D.EMA答案:A解析:Lossscaling將損失乘以比例因子,防止fp16下溢。9.在OpenVINO2024.0中,若模型包含“Detectron2”自定義算子,應(yīng)優(yōu)先A.使用ModelOptimizer的extensions參數(shù)??B.轉(zhuǎn)為ONNX再轉(zhuǎn)IR??C.直接調(diào)用InferenceEngine??D.重寫為OpenCVDNN答案:A解析:自定義算子需通過extensions插件注冊(cè)。10.當(dāng)訓(xùn)練MaskRCNN時(shí),若mask分支采用28×28分辨率,而目標(biāo)實(shí)際mask為512×512,則訓(xùn)練階段采用A.最近鄰下采樣??B.雙線性下采樣??C.區(qū)域插值ROIAlign??D.區(qū)域插值+最近鄰答案:C解析:ROIAlign將GTmask采樣到28×28,保持浮點(diǎn)坐標(biāo)對(duì)齊。二、多項(xiàng)選擇題(每題3分,共15分,多選少選均不得分)11.下列哪些技術(shù)可直接提升小目標(biāo)檢測(cè)召回率A.增大輸入分辨率??B.使用更高倍數(shù)的FPN??C.引入AnchorFree??D.采用SIoU損失??E.增加訓(xùn)練epoch答案:ABC解析:增大分辨率、更高層FPN、AnchorFree均改善小目標(biāo);SIoU主要優(yōu)化定位精度;單純?cè)黾觘poch無針對(duì)性。12.關(guān)于VisionTransformer的注意力計(jì)算復(fù)雜度,正確的是A.與序列長(zhǎng)度n呈平方關(guān)系??B.使用Linformer后可降為O(n)??C.Performer使用隨機(jī)特征映射??D.SwinTransformer將復(fù)雜度限制在窗口內(nèi)??E.CosFormer基于多項(xiàng)式逼近答案:ABCD解析:CosFormer基于余弦重參數(shù),而非多項(xiàng)式。13.在模型量化中,屬于PTQ(PostTrainingQuantization)的方法有A.TensorRTINT8校準(zhǔn)??B.ONNXRuntimeQDQ??C.QAT微調(diào)??D.AdaRound??E.DFQ答案:ABDE解析:QAT需重訓(xùn)練,不屬于PTQ。14.下列哪些損失函數(shù)可同時(shí)用于分類與定位A.GIoU??B.FocalLoss??C.VarifocalLoss??D.PolyLoss??E.DIoU答案:CD解析:Varifocal與Poly同時(shí)加權(quán)分類與定位質(zhì)量;GIoU/DIoU僅定位;Focal僅分類。15.在邊緣設(shè)備部署時(shí),為了降低內(nèi)存峰值,可采取A.激活檢查點(diǎn)??B.權(quán)重量化??C.權(quán)重量化+激活量化??D.使用GradientCheckpointing訓(xùn)練??E.采用NCHW16格式答案:ABC解析:GradientCheckpointing僅訓(xùn)練階段省內(nèi)存;NCHW16為計(jì)算格式,不降低峰值。三、填空題(每空2分,共20分)16.在DeformableDETR中,若編碼器層數(shù)為6,每層參考點(diǎn)更新方式為________,則多尺度特征層數(shù)默認(rèn)取________。答案:加性偏移??4解析:參考點(diǎn)通過線性層預(yù)測(cè)Δx,Δy,加性更新;多尺度為C3C6共4層。17.當(dāng)使用Mosaic增強(qiáng)時(shí),若子圖分辨率均為640×640,拼接后最小邊長(zhǎng)為________,此時(shí)若保持原圖比例,縮放因子應(yīng)≤________。答案:640??0.5解析:四張圖拼接后最小邊640;縮放0.5可保證最終≥640。18.在PyTorch2.1中,開啟pile(backend="inductor")后,默認(rèn)模式為________,其優(yōu)化級(jí)別由________參數(shù)控制。答案:default??mode解析:inductor默認(rèn)mode=”default”,可通過mode切換。19.若采用CosineAnnealing重啟式學(xué)習(xí)率,初始lr=0.1,T_0=10,T_mult=2,則第3個(gè)周期結(jié)束時(shí)總epoch為________,此時(shí)lr=________。答案:70??0.00625解析:周期長(zhǎng)度10+20+40=70;cosine終點(diǎn)為0.1×0.5^(3)=0.00625。20.在TensorBoard中,若要記錄模型計(jì)算圖,需調(diào)用writer.add_graph(model,________),其中輸入張量要求________。答案:dummy_input??requires_grad=False解析:dummy_input無需梯度,避免記錄反向節(jié)點(diǎn)。四、判斷改錯(cuò)題(每題2分,共10分,先判對(duì)錯(cuò),若錯(cuò)則劃線改正)21.SwinTransformer的窗口注意力在反向傳播時(shí),窗口大小必須整除特征圖尺寸。答案:錯(cuò)??“必須整除”改為“無需整除,使用mask即可”。22.在KnowledgeDistillation中,溫度τ越大,軟標(biāo)簽分布越尖銳。答案:錯(cuò)??“尖銳”改為“平滑”。23.使用AutoAugment時(shí),若數(shù)據(jù)集為CIFAR10,則默認(rèn)策略與ImageNet相同。答案:錯(cuò)??“相同”改為“不同,CIFAR10采用輕量級(jí)子策略”。24.當(dāng)使用SyncBN時(shí),梯度同步與統(tǒng)計(jì)量同步均發(fā)生在反向傳播階段。答案:錯(cuò)??“均”改為“統(tǒng)計(jì)量同步在前向,梯度同步在反向”。25.在ONNX中,若模型包含“DynamicAxes”,則TensorRT無法解析。答案:錯(cuò)??“無法”改為“可以,通過explicitbatch模式”。五、簡(jiǎn)答題(每題10分,共30分)26.描述YOLOv8中“DFL”(DistributionFocalLoss)的實(shí)現(xiàn)細(xì)節(jié),并說明其對(duì)邊界框回歸的改進(jìn)。答案:DFL將邊界框坐標(biāo)離散化為16個(gè)區(qū)間,用softmax預(yù)測(cè)各區(qū)間的概率,再求期望得到連續(xù)坐標(biāo)。損失采用Focal形式,聚焦難樣本。相比L1/L2,DFL顯式建模分布,緩解極端寬高比下的梯度消失,提升0.8AP。27.解釋VisionTransformer中“ClassToken”與“GlobalAveragePooling”兩種分類頭的差異,并給出在CIFAR100上的實(shí)驗(yàn)對(duì)比結(jié)論。答案:ClassToken通過額外可學(xué)習(xí)向量聚合全局信息,GAP直接對(duì)patchtoken均值池化。實(shí)驗(yàn)表明,在CIFAR100上,ClassToken比GAP高1.3%,歸因于token間顯式交互;但GAP參數(shù)量少0.12M,推理快5%。28.列舉三種解決長(zhǎng)尾分布的采樣策略,并比較其GPU內(nèi)存占用。答案:(1)類別平衡采樣:每類樣本數(shù)相同,內(nèi)存占用最低,與最少類一致;(2)平方根采樣:按√n_i采樣,內(nèi)存中等;(3)逆向頻率采樣:按1/n_i加權(quán),內(nèi)存最高,需緩存大量重復(fù)樣本。實(shí)測(cè)ImageNetLT上,策略3內(nèi)存為策略1的2.7倍。六、計(jì)算與推導(dǎo)題(共25分)29.(10分)給定一個(gè)3×3卷積,輸入通道C_in=64,輸出通道C_out=128,groups=32,dilation=2,padding=2,輸入特征圖H=W=40,求:(1)參數(shù)量;(2)理論FLOPs;(3)等效感受野。答案:(1)參數(shù)量=3×3×(64/32)×128×32=3×3×2×128×32=73728;(2)FLOPs=2×H×W×C_out×K×K×(C_in/g)=2×40×40×128×9×2=73728000;(3)等效感受野=1+(31)×2=5。30.(15分)在DETR中,假設(shè)編碼器輸出memory∈R^{n×d},n=900,d=256,解碼器查詢q∈R^{100×d},采用單頭注意力,計(jì)算:(1)注意力權(quán)重矩陣形狀;(2)權(quán)重矩陣顯存占用(fp16);(3)若采用Linformer將鍵值投影到k=64,則顯存節(jié)省比例。答案:(1)權(quán)重形狀100×900;(2)100×900×2Byte=180kB;(3)原顯存:900×256×2=460.8kB,投影后(900+100)×64×2=128kB,節(jié)省比例=(460.8128)/460.8≈72.2%。七、綜合設(shè)計(jì)題(共30分)31.某城市需在邊緣盒子部署人群密度估計(jì)系統(tǒng),硬件為JetsonOrinNano8GB,攝像頭1080p@30fps,要求:(1)選擇模型并說明理由;(2)給出量化與剪枝方案;(3)設(shè)計(jì)前后處理流水線,使端到端延遲<100ms。答案:(1)選用CSRNetLite,原因:僅0.8M參數(shù),MAE8.5onShanghaiTechA,支持輸入任意尺寸;(2)采用PTQINT8+通道剪枝30%,使用TensorRT8.6,校準(zhǔn)集200張,AdaRound提升0.3MAE;(3)流水線:??前處理:V4L2mmap零拷貝→CUDA預(yù)處理(resize+normalize)耗時(shí)8ms;??推理:INT8引擎單次16ms;??后處理:GPU并行密度圖積分+偽彩色疊加12ms;??總延遲36ms<100ms,余量64ms用于多路復(fù)用。八、代碼閱讀與補(bǔ)全(共20分)32.閱讀下列PyTorch代碼并補(bǔ)全缺失部分,使實(shí)現(xiàn)“SoftNMS”的GPU加速版本:```importtorchdefsoft_nms(boxes,scores,sigma=0.5,thresh=0.001):"""boxes:Tensor[N,4](x1,y1,x2,y2)scores:Tensor[N]"""keep=[]_,idx=scores.sort(descending=True)boxes=boxes[idx]scores=scores[idx]whileboxes.numel()>0:top=boxes[0]keep.append(idx[0].item())iou=box_iou(top.unsqueeze(0),boxes).squeeze(0)weight=torch.exp((iouiou)/sigma)缺失行1scores=weight缺失行2keep_mask=scores>thresh缺失行3idx=idx[keep_mask]boxes=boxes[keep_mask]scores=scores[keep_mask]returntorch.tensor(keep,dtype=torch.long,device=boxes.device)```答案:已補(bǔ)全三行注釋處
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 機(jī)場(chǎng)信息公開制度規(guī)范
- 煤礦試車制度規(guī)范
- 研發(fā)財(cái)務(wù)核算規(guī)范制度
- 果蔬配送中心制度規(guī)范
- 規(guī)范完善黨組會(huì)議制度
- 規(guī)范品牌申報(bào)工作制度
- 承包施工電梯合同范本
- 房屋置換車輛合同范本
- 承包健身房合同協(xié)議書
- 技術(shù)服務(wù)合同保密協(xié)議
- 江蘇百校大聯(lián)考2026屆高三語文第一學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)試題含解析
- 代還按揭協(xié)議書
- 廣西2025年高等職業(yè)教育考試全區(qū)模擬測(cè)試 能源動(dòng)力與材料 大類試題及逐題答案解說
- 2026江蘇省公務(wù)員考試公安機(jī)關(guān)公務(wù)員(人民警察)歷年真題匯編附答案解析
- 2026年失眠患者睡眠調(diào)理指南
- 2026年盤錦職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案詳解一套
- 2025年10月自考00610高級(jí)日語(二)試題及答案
- 2026年包頭鐵道職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試題庫(kù)帶答案解析
- 循證護(hù)理在基礎(chǔ)護(hù)理中的應(yīng)用
- 復(fù)旦大學(xué)招生面試常見問題及回答要點(diǎn)
- 危險(xiǎn)化學(xué)品兼容性矩陣表
評(píng)論
0/150
提交評(píng)論