版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2025年人工智能技術(shù)應(yīng)用考核試卷及答案一、單項(xiàng)選擇題(每題2分,共20分)1.在聯(lián)邦學(xué)習(xí)框架中,為防止模型更新泄露用戶隱私,最常用的安全聚合協(xié)議是A.Paillier同態(tài)加密B.DiffieHellman密鑰交換C.SecureAggregationwithDoubleMaskingD.ElGamal簽名答案:C解析:SecureAggregationwithDoubleMasking(Bonawitzetal.CCS2017)通過雙重掩碼與秘密共享,在服務(wù)器僅看到聚合結(jié)果而看不到單個客戶端梯度,是目前工業(yè)級聯(lián)邦學(xué)習(xí)默認(rèn)方案。A雖可同態(tài)加梯度,但計算開銷大;B、D與聚合無關(guān)。2.當(dāng)使用VisionTransformer(ViT)時,若輸入圖像分辨率為224×224,patchsize為16,則序列長度為A.196B.197C.784D.785答案:B解析:224/16=14,14×14=196個patch,再加1個clstoken,共197。3.在DiffusionModel訓(xùn)練階段,對圖像x?施加T步噪聲后得到x_T,若采用DDPM的線性噪聲表,則x_T的分布近似A.N(0,1)B.N(0,I)C.N(0,α?_TI)D.N(0,(1α?_T)I)答案:B解析:DDPM中α?_T→0,故x_T≈N(0,I)。4.在RLHF(ReinforcementLearningfromHumanFeedback)中,用于獎勵模型訓(xùn)練的損失函數(shù)通常采用A.MSEB.CrossEntropyC.BradleyTerry負(fù)對數(shù)似然D.HingeLoss答案:C解析:獎勵模型輸出標(biāo)量r_θ(x,y),用BradleyTerry模型建模人類偏好概率,損失為負(fù)對數(shù)似然。5.當(dāng)把LLaMA27B模型在單張A10080GB上做int4量化推理時,理論上權(quán)重占用顯存約為A.3.3GBB.6.7GBC.13.4GBD.26.8GB答案:A解析:7B參數(shù)×0.5Byte/int4≈3.3GB,kvcache與激活另計。6.在自動駕駛感知棧中,將激光雷達(dá)點(diǎn)云投影到圖像平面后,為緩解稀疏性,最常用的深度補(bǔ)全網(wǎng)絡(luò)是A.PoinNet++B.SalsaNextC.DepthCompletionNetD.CSPN答案:C解析:DepthCompletionNet(ICRA2018)采用RGB引導(dǎo)上采樣,兼顧邊緣與實(shí)時性,已成為nuScenes基準(zhǔn)常用模塊。7.當(dāng)使用LoRA微調(diào)GPT時,若原模型維度為4096,LoRA秩r=16,則可訓(xùn)練參數(shù)量占比約為A.0.078%B.0.78%C.1.56%D.3.12%答案:A解析:LoRA參數(shù)量=2×4096×16≈131k,原模型約175B,占比≈0.078%。8.在StableDiffusion中,ClassifierFreeGuidance(CFG)系數(shù)為7.5時,生成圖像的FID相比無guidance通常A.上升23點(diǎn)B.下降23點(diǎn)C.下降57點(diǎn)D.基本不變答案:C解析:CFG可顯著提升樣本質(zhì)量,F(xiàn)ID在COCO30k上平均下降約57。9.在NeRF加速方法中,InstantNGP采用的空間數(shù)據(jù)結(jié)構(gòu)為A.八叉樹B.稀疏體素哈希表C.KdtreeD.規(guī)則3D網(wǎng)格答案:B解析:稀疏體素哈希表允許自適應(yīng)分配顯存,實(shí)現(xiàn)秒級訓(xùn)練。10.當(dāng)在邊緣設(shè)備上部署TinyML模型時,CMSISNN庫中用于int8卷積的函數(shù)名是A.arm_convolve_HWC_q7_basicB.arm_convolve_HWC_q15_fastC.arm_depthwise_conv_u8_basicD.arm_convolve_HWC_q7_fast答案:A解析:q7表示int7/int8,basic版本無im2col,內(nèi)存最小,適合MCU。二、多項(xiàng)選擇題(每題3分,共15分,多選少選均不得分)11.以下哪些技術(shù)可直接用于提升大模型推理吞吐(tokens/s)A.ContinuousBatchingB.PagedAttentionC.FlashAttentionv2D.GradientCheckpointing答案:A、B、C解析:D用于訓(xùn)練省顯存,與推理吞吐無關(guān)。12.關(guān)于DPO(DirectPreferenceOptimization)相比PPObasedRLHF,下列說法正確的是A.無需獎勵模型B.訓(xùn)練更穩(wěn)定C.顯存占用更低D.可處理成對偏好數(shù)據(jù)答案:B、C、D解析:DPO仍需偏好數(shù)據(jù),只是將獎勵模型隱式集成到策略中,A錯誤。13.在醫(yī)療影像聯(lián)邦學(xué)習(xí)中,為滿足HIPAA合規(guī),需同時采用A.本地差分隱私B.安全聚合C.梯度壓縮D.可驗(yàn)證刪除答案:A、B、D解析:C僅減少通信,與合規(guī)無直接關(guān)聯(lián)。14.以下哪些算子屬于ONNXRuntimeWeb后端支持的WebGPU原生算子A.Conv2DB.LayerNormalizationC.GELUD.NonMaxSuppression答案:A、B、C解析:截至2024Q2,WebGPU后端尚未支持NMS。15.在自動駕駛規(guī)劃模塊中,采用強(qiáng)化學(xué)習(xí)時,狀態(tài)空間若包含A.自車速度B.他車預(yù)測軌跡C.紅綠燈剩余時長D.高精地圖語義答案:A、B、C、D解析:四項(xiàng)均為典型狀態(tài)分量。三、判斷題(每題1分,共10分,正確打“√”,錯誤打“×”)16.MoE(MixtureofExperts)模型在推理時所有專家都會被激活。答案:×解析:僅Topk專家被激活,其余稀疏。17.在StableDiffusionXL中,引入refiner模型是為了在1024×1024階段進(jìn)一步去噪。答案:√解析:refiner在高分階段做二次去噪,提升細(xì)節(jié)。18.使用INT8量化后,模型精度必然下降。答案:×解析:PTQ+KL校準(zhǔn)可在多數(shù)CV模型上保持<0.2%下降,甚至無損。19.在NeRF中,位置編碼(PositionalEncoding)可提升高頻細(xì)節(jié)。答案:√解析:高頻函數(shù)映射幫助MLP學(xué)習(xí)高頻變化。20.Transformer中的AttentionIsAllYouNeed原文使用了RoPE位置編碼。答案:×解析:原文用sinusoidal,RoPE是2021年提出。21.在聯(lián)邦學(xué)習(xí)中,模型參數(shù)級別的差分隱私比樣本級別差分隱私隱私預(yù)算更小。答案:×解析:模型級需更大預(yù)算,因敏感度更高。22.LLM的KVcache在解碼階段隨序列長度線性增長。答案:√解析:每層緩存2×h×s×d/h,正比于s。23.在DALL·E3中,采用了T5XXL文本編碼器。答案:√解析:OpenAI技術(shù)報告確認(rèn)。24.使用PyTorch2.0pile時,GPU利用率一定提升。答案:×解析:小模型或動態(tài)shape場景可能下降。25.在自動駕駛感知中,BEVFormer僅用攝像頭即可生成BEV特征。答案:√解析:BEVFormer通過crossattention實(shí)現(xiàn)純視覺BEV。四、填空題(每空2分,共20分)26.在LLaMA2中,RMSNorm的eps取值為________。答案:1e6解析:官方代碼默認(rèn)值。27.若采用cosinelearningrateschedule,初始lr=1e4,最小lr=1e6,總步數(shù)1000,warmup步數(shù)100,則第500步的lr為________×1e4。答案:0.5解析:cosine曲線在500/1000=0.5處恰好為0.5。28.在DDIM采樣中,若跳步數(shù)為50,總步數(shù)1000,則采樣速度提升約________倍。答案:20解析:1000/50=20。29.當(dāng)使用DeepSpeedZeRO3訓(xùn)練175B模型,dp=128,則每張GPU可節(jié)省顯存約________%。答案:99.2解析:ZeRO3將參數(shù)、梯度、優(yōu)化器狀態(tài)全分片,顯存≈1/dp。30.在StableDiffusion中,VAE的latent通道數(shù)為________。答案:4解析:SD1.x/2.x均用4通道,XL用4通道但分辨率加倍。31.若在某MCU上運(yùn)行8bitCNN,MAC數(shù)為1M,運(yùn)行頻率為100MHz,理論峰值算力為________GMACS。答案:0.1解析:1MMAC=0.001GMAC,100MHz下0.1GMACS。32.在RLHF獎勵模型訓(xùn)練中,若人類標(biāo)注員一致性Krippendorffα<________,需重新標(biāo)注。答案:0.67解析:α<0.67認(rèn)為不可信。33.在NeRF中,若采用coarse+fine兩級采樣,coarse采樣64點(diǎn),fine采樣128點(diǎn),每條射線總采樣點(diǎn)為________。答案:192解析:64+128=192。34.當(dāng)使用FlashAttention時,內(nèi)存復(fù)雜度從O(n2)降至________。答案:O(n)解析:通過分塊+softmax重縮放實(shí)現(xiàn)線性。35.在自動駕駛高精地圖中,OpenDRIVE格式中道路參考線的幾何類型“spiral”對應(yīng)數(shù)學(xué)上的________曲線。答案:Clothoid解析:曲率線性變化,即Clothoid。五、簡答題(每題8分,共24分)36.描述LoRA與QLoRA在微調(diào)大模型時的顯存差異,并給出單卡A10080GB可微調(diào)的最大模型規(guī)模。答案:LoRA需存儲原模型fp16權(quán)重≈2Byte×P,優(yōu)化器狀態(tài)2Byte×P,梯度2Byte×P,激活與緩存≈batch×s×h×l×4Byte,總顯存≈6P+激活。QLoRA采用4bit量化基模型,基模型權(quán)重0.5Byte×P,再存一份nf4量化常數(shù)≈0.1Byte×P,優(yōu)化器與梯度僅LoRA部分≈0.01P,激活同LoRA,總顯存≈0.6P+激活。A10080GB下,QLoRA可微調(diào)65B模型(0.6×65≈39GB,留30GB給激活與kvcache),而LoRA僅可微調(diào)30B(6×30=180GB>80GB,需ZeRO+offload)。解析:QLoRA通過nf4+雙量化+分頁優(yōu)化,實(shí)現(xiàn)單卡65B微調(diào),成為開源社區(qū)主流方案。37.解釋DiffusionModel中的“ClassifierFreeGuidance”原理,并推導(dǎo)其采樣公式。答案:CFG同時訓(xùn)練條件與無條件模型,令ε_θ(x_t,t,c)與ε_θ(x_t,t,?)共享參數(shù),訓(xùn)練時以概率p_drop隨機(jī)丟棄條件c。采樣時,修正噪聲:ε?=ε_θ(x_t,t,?)+w·(ε_θ(x_t,t,c)?ε_θ(x_t,t,?))=(w+1)ε_θ(x_t,t,c)?wε_θ(x_t,t,?)其中w為guidancescale。推導(dǎo):由貝葉斯,?logp(c|x_t)=?logp(x_t|c)??logp(x_t),近似用ε表示即可得上式。解析:CFG無需額外分類器,避免梯度爆炸,w=7.5為SD默認(rèn)。38.列舉三種NeRF訓(xùn)練加速方法,并對比其速度與質(zhì)量tradeoff。答案:1.InstantNGP:采用稀疏體素哈希+多分辨率編碼,訓(xùn)練時間從hours→5min,PSNR持平,顯存<4GB,但表面略平滑。2.MipNeRF360+TRIPS:引入積分位置編碼+proposal網(wǎng)絡(luò),訓(xùn)練30min,PSNR+1dB,抗鋸齒好,但速度不及NGP。3.Plenoxels:用稀疏體素網(wǎng)格存儲密度與球諧,無需神經(jīng)網(wǎng)絡(luò),訓(xùn)練15min,PSNR0.5dB,速度最快,但內(nèi)存峰值高。解析:若追求實(shí)時捕捉選NGP,若追求高質(zhì)量選MipNeRF360,若硬件內(nèi)存充裕選Plenoxels。六、綜合設(shè)計題(31分)39.某市衛(wèi)健委計劃聯(lián)合10家醫(yī)院訓(xùn)練一個多模態(tài)醫(yī)療大模型,數(shù)據(jù)為院內(nèi)PACS影像與文本報告,單院數(shù)據(jù)平均2TB,影像分辨率1024×1024,DICOM格式。要求:(1)滿足《個人信息保護(hù)法》與HIPAA;(2)模型參數(shù)量不少于30B;(3)訓(xùn)練時間≤1周;(4)推理單次延遲≤3s,GPU顯存≤24GB。請給出完整技術(shù)方案,包括:數(shù)據(jù)預(yù)處理、隱私保護(hù)、分布式訓(xùn)練、模型結(jié)構(gòu)、量化部署、推理優(yōu)化,并估算資源。答案與解析:1.數(shù)據(jù)預(yù)處理:影像脫敏:使用DICOM標(biāo)簽清洗工具刪除burntinPHI,像素級匿名化。統(tǒng)一分辨率:512×512,窗寬窗位歸一化,int16→int8節(jié)省存儲50%。文本脫敏:基于PHIBERT的CRF識別18類敏感實(shí)體,替換為[PHI]。拆分訓(xùn)練/驗(yàn)證:按患者級別劃分,避免泄漏。2.隱私保護(hù):本地差分隱私:對CNN特征圖加噪,ε=1,δ=1e5。安全聚合:采用DoubleMasking,每院分配獨(dú)立密鑰,服務(wù)器僅見聚合梯度??尚艌?zhí)行環(huán)境:在院內(nèi)GPU節(jié)點(diǎn)啟用AMDSEVSNP,內(nèi)存加密。3.分布式訓(xùn)練:采用聯(lián)邦+ZeRO3混合:院內(nèi)用ZeRO3節(jié)省顯存,跨院用聯(lián)邦。模型結(jié)構(gòu):視覺編碼器使用ViTG/14,文本編碼器使用PubMedBERT,融合模塊為CrossAttention,總參數(shù)30B。訓(xùn)練策略:–預(yù)訓(xùn)練:院內(nèi)先訓(xùn)練ViT與BERT,共享權(quán)重上傳。–聯(lián)邦微調(diào):每院本地epoch=1,batch=32,梯度裁剪1.0,學(xué)習(xí)率2e5,cosinedecay。–通信:每100步聚合一次,采用梯度壓縮(TopK0.1%),通信量減少90%。算力估算:–單院8×A10080GB,30B模型fp16需60GB,ZeRO3分片后每卡<5GB,激活用activationcheckpointing,單卡峰值42GB。–總數(shù)據(jù)20TB,token≈2T,30B模型訓(xùn)練1Ttoken需約3000GPUdays,聯(lián)邦10院并行,每院承擔(dān)0.2Ttoken,300GPUdays,8卡×7天≈392GPUdays,滿足≤1周。4.量化部署:采用GPTQint4,權(quán)重壓縮至0.5Byte×30B=15GB,再存kvcache8GB,留1GB余量,總<24GB。推理框架:TensorRTLLM+PagedAttention,continuousbatching,batch=16,輸入512tokens,輸出256tokens,實(shí)測延遲2.1s。5.推理優(yōu)化:影像編碼緩存:對同一影像預(yù)提取ViT特征,存Redis,避免重復(fù)計算。動態(tài)批處理:當(dāng)影像特征已緩存,僅文本走LLM,延遲降至0.9s。負(fù)載均衡:使用Knative自動擴(kuò)縮容,GPU池化,峰值QPS=100時維持P99<3s。七、編程題(30分)40.請用PyTorch實(shí)現(xiàn)一個帶RoPE位置編碼的GroupQueryAttention(GQA),要求:(1)支持任意偶數(shù)維度d_k,head數(shù)h,group數(shù)g,且h%g==0;(2)前向返回attention矩陣供可視化;(3)使用einops,禁止for循環(huán);(4)附帶單元測試:batch=2,seq=128,d_k=64,h=8,g=2,驗(yàn)證輸出形狀與數(shù)值正確性。答案:```pythonimporttorch,mathfromeinopsimportrearrangefromtorchimportnndefprecompute_rope_freq(dim,seq_len,theta=10000.0):inv_freq=1.0/(theta(torch.arange(0,dim,2).float()/dim))t=torch.arange(seq_len,dtype=inv_freq.dtype)freqs=torch.outer(t,inv_freq)(seq,dim/2)freqs_cos=torch.cos(freqs)freqs_sin=torch.sin(freqs)returnfreqs_cos,freqs_sinboth(seq,dim/2)defapply_rope(x,freqs_cos,freqs_sin):x:(...,seq,dim)x1,x2=x[...,::2],x[...,1::2]cos=freqs_cos.unsqueeze(0).unsqueeze(0)(1,1,seq,dim/2)sin=freqs_sin.unsqueeze(0).unsqueeze(0)x1_rot=x1cosx2sinx2_rot=x1sin+x2cosx_rot=torch.stack((x1_rot,x2_rot),dim=1)(...,seq,dim/2,2)returnrearrange(x_rot,'...dtwo>...(dtwo)')classGQA_RoPE(nn.Module):def__init__(self,d_model,h,g,dropout=0.0):super().__init__()asserth%g==0self.h,self.g=h,gself.d_k=d_model//hself.qkv=nn.Linear(d_model,d_model+2self.d_kg)qh+kg+vgself.out_proj=nn.Linear(d_model,d_model)self.dropout=nn.Dropout(dropout)self.scale=1.0/math.sqrt(self.d_k)defforward(self,x,mask=None,return_attn=True):B,S,_=x.shapeqkv=self.qkv(x)(B,S,d_model+2d_kg)q,kv=torch.split(qkv,[self.hself.d_k,2self.gself.d_k],dim=1)q=rearrange(q,'BS(hdk)>BhSdk',h=self.h)kv=rearrange(kv,'BS(kvgdk)>kvBgSdk',kv=2,g=self.g)k,v=kv[0],kv[1]repeatk,vtomatchqheadsk=k.repeat_interleave(self.h//self.g,dim=1)v=v.repeat_interleave(self.h//self.g,dim=1)applyRoPEcos,sin=precompute_rope_freq(self.d_k,S)q,k=apply_rope(q,cos,sin),apply_rope(k,cos,sin)scores=torch.e
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025公共基礎(chǔ)知識考試題庫帶答案
- 道路交通安全檢查與執(zhí)法操作規(guī)程(標(biāo)準(zhǔn)版)
- 2024年湖南外國語職業(yè)學(xué)院輔導(dǎo)員招聘考試真題匯編附答案
- 2024年湘南幼兒師范高等專科學(xué)校輔導(dǎo)員考試筆試真題匯編附答案
- 2025上海工藝美術(shù)職業(yè)學(xué)院招聘6人歷年題庫含答案解析(奪冠)
- 2025安徽蚌埠懷遠(yuǎn)縣教育局所屬事業(yè)單位緊缺專業(yè)人才引進(jìn)22人參考題庫新版
- 2025年北??叼B(yǎng)職業(yè)學(xué)院輔導(dǎo)員招聘考試真題匯編附答案
- 2025年寧波海曙區(qū)鼓樓街道編外用工人員招聘1人考試備考題庫附答案
- 2025年晉中健康學(xué)院輔導(dǎo)員考試筆試題庫附答案
- 2025湖南華菱線纜股份有限公司招聘17人考試備考題庫附答案
- 安全帽使用規(guī)范制度
- 2026國家電投集團(tuán)蘇州審計中心選聘15人筆試模擬試題及答案解析
- 2026年桐城師范高等專科學(xué)校單招職業(yè)技能考試題庫及答案1套
- 霧化吸入操作教學(xué)課件
- 2025年小學(xué)圖書館自查報告
- 【語文】廣東省佛山市羅行小學(xué)一年級上冊期末復(fù)習(xí)試卷
- 2025年醫(yī)療器械注冊代理協(xié)議
- 新疆三校生考試題及答案
- 2025新疆亞新煤層氣投資開發(fā)(集團(tuán))有限責(zé)任公司第三批選聘/招聘筆試歷年參考題庫附帶答案詳解
- 圍手術(shù)期心肌梗塞的護(hù)理
- 超市門口鑰匙管理制度
評論
0/150
提交評論