版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
2025年中級人工智能技術(shù)應(yīng)用理論知識題庫及答案一、人工智能基礎(chǔ)與機器學(xué)習(xí)原理1.【單選】下列關(guān)于“歸納偏好”的表述,哪一項最符合TomMitchell在《MachineLearning》中的原意?A.算法在訓(xùn)練集上的誤差下限B.算法對未見示例的泛化誤差上限C.算法在假設(shè)空間中對某些假設(shè)的先天偏好D.算法對特征縮放方式的敏感程度答案:C解析:歸納偏好指算法在“多個與訓(xùn)練集一致的假設(shè)”中,優(yōu)先選擇哪一類假設(shè)的先天偏好,是“無免費午餐”定理成立的前提。2.【單選】在支持向量機中,若將高斯核帶寬σ→+∞,則模型決策邊界將趨近于:A.線性核的決策邊界B.拋物線型非線性邊界C.對訓(xùn)練集逐點插值的極端復(fù)雜邊界D.無法確定,取決于懲罰系數(shù)C答案:A解析:σ→∞時,高斯核退化為常數(shù)1,核矩陣近似全1矩陣,失去非線性映射能力,等價于線性模型。3.【多選】下列哪些技術(shù)可直接緩解“維度災(zāi)難”帶來的過擬合?A.隨機森林的隨機子空間B.tSNE降維后接邏輯回歸C.主成分分析保留99%方差D.對高維圖像數(shù)據(jù)使用2×2最大池化答案:A、C、D解析:tSNE僅用于可視化,其非線性映射不保距,不能直接作為后續(xù)模型輸入;其余三項均通過降低有效維度緩解過擬合。4.【填空】若某深度網(wǎng)絡(luò)采用Swish激活f(x)=x·sigmoid(x),則其在x=0處的二階導(dǎo)數(shù)為______。答案:0.25解析:f'(x)=sigmoid(x)+x·sigmoid'(x),f''(x)=2sigmoid'(x)+x·sigmoid''(x)。代入x=0,sigmoid(0)=0.5,sigmoid'(0)=0.25,sigmoid''(0)=0,得f''(0)=2×0.25+0=0.5×0.5=0.25。5.【判斷】在梯度提升樹中,增加“子采樣比例”(subsample)一定會降低模型方差。答案:錯誤解析:子采樣比例過小會引入過大隨機性,雖降低單棵樹方差,但集成后總方差可能上升,需與learningrate聯(lián)合調(diào)優(yōu)。6.【簡答】請用不超過60字解釋“神經(jīng)正切核”(NTK)在無限寬網(wǎng)絡(luò)中的核心結(jié)論。答案:當(dāng)寬度→∞,網(wǎng)絡(luò)參數(shù)變化呈線性,訓(xùn)練動力學(xué)由恒定NTK核控制,梯度下降等價于核回歸。解析:NTK理論揭示無限寬網(wǎng)絡(luò)在參數(shù)空間中的線性化,使深度網(wǎng)絡(luò)的學(xué)習(xí)軌跡可解析。7.【計算】給定二維數(shù)據(jù){(0,0),(1,1)},標(biāo)簽{+1,1},使用硬間隔SVM,求對偶問題最優(yōu)α?、α?及決策函數(shù)。答案:α?=α?=0.5,決策函數(shù)f(x)=sign(x?+x?)。解析:核矩陣K=[[0,1],[1,0]],求解maxΣα?0.5Σα?α?y?y?K??,s.t.α?=α?,Σα?y?=0,得α?=α?=0.5,w=Σα?y?x?=(1,1),b=0。8.【案例】某電商用XGBoost預(yù)測點擊率,特征“商品折扣率”缺失率90%。工程師甲用1填充后加“是否缺失”指示器;工程師乙直接刪除該特征。若AUC下降明顯,請指出更合理的第三種方案并說明理由。答案:采用“折扣率分桶+缺失單獨桶”+模型端Embedding:將折扣率做分位數(shù)分桶,缺失值獨立成桶,再對桶ID學(xué)習(xí)低維Embedding,既保留缺失信息,又避免1的數(shù)值誤導(dǎo)。解析:1在樹模型中會被當(dāng)作真實數(shù)值,導(dǎo)致分裂錯誤;刪除則丟失信息;Embedding方式讓模型自行學(xué)習(xí)缺失模式,兼顧表達與魯棒。二、深度學(xué)習(xí)與計算機視覺9.【單選】在MaskRCNN中,若RoIAlign輸出7×7特征圖,掩膜分支使用全卷積網(wǎng)絡(luò),則掩膜頭的參數(shù)量與下列哪項無關(guān)?A.RoI個數(shù)B.掩膜類別數(shù)C.輸入圖像尺寸D.掩膜分辨率答案:C解析:掩膜頭對每個RoI獨立計算,參數(shù)量由類別數(shù)、掩膜分辨率及網(wǎng)絡(luò)結(jié)構(gòu)決定,與輸入圖像尺寸無直接關(guān)聯(lián)。10.【單選】使用BatchNorm時,若batchsize=1,下列哪種替代方案在ImageNet上Top1精度下降最小?A.GroupNorm+weightstandardizationB.LayerNormC.InstanceNormD.關(guān)閉歸一化,僅使用L2weightdecay答案:A解析:GroupNorm對batch無依賴,weightstandardization可恢復(fù)類似BN的平滑性,實驗表明在batch=1時僅掉0.3%。11.【多選】關(guān)于VisionTransformer(ViT)的positionembedding,下列說法正確的是:A.1D、2D、relative位置編碼在ImageNet上精度無顯著差異B.去掉positionembedding后模型仍能保持75%以上精度C.使用RoPE可天然支持任意分辨率微調(diào)D.在patchembedding中加入zeropadding可等效替代位置編碼答案:B、C解析:ViT對位置信息依賴弱,去掉仍達75%;RoPE通過旋轉(zhuǎn)矩陣實現(xiàn)外推;A項2Drelative優(yōu)于1D;D項zeropadding無法提供絕對位置。12.【填空】EfficientNetv2中,F(xiàn)usedMBConv模塊將depthwiseconv與______合并為單一常規(guī)卷積,以減少訪存。答案:1×1expandconv解析:FusedMBConv把expand1×1與3×3depthwisefuse成3×3常規(guī)卷積,再接squeezeandexcitation。13.【判斷】在YOLOv8中,使用DFL(DistributionFocalLoss)后,邊界框回歸不再直接預(yù)測xywh,而是預(yù)測分布向量。答案:正確解析:DFL將連續(xù)坐標(biāo)離散化,用分布向量表示框位置,可提升定位精度。14.【簡答】描述“對抗補丁”(adversarialpatch)在物理世界攻擊目標(biāo)檢測模型的三步關(guān)鍵流程。答案:1.在數(shù)字空間優(yōu)化補丁像素,使模型對含補丁圖像誤檢為目標(biāo)類別;2.打印補丁并粘貼在物體或背景;3.在多變環(huán)境(光照、角度、距離)下驗證攻擊遷移性。解析:補丁攻擊利用模型對紋理過度敏感,通過大尺寸可打印擾動實現(xiàn)物理世界魯棒攻擊。15.【計算】某ResNet50在FP32下占用97MB顯存,若采用FP16+Batch=32+梯度檢查點(gradientcheckpoint),理論最大顯存降低比例是多少?答案:約47%解析:FP16權(quán)重減半至48.5MB;激活內(nèi)存原為(正向+反向)×featuremap≈(1+1)×150MB=300MB,梯度檢查點重計算反向,激活降至約150MB;總顯存由397MB降至約210MB,降低(397210)/397≈47%。16.【案例】醫(yī)療影像團隊用UNet分割肺結(jié)節(jié),發(fā)現(xiàn)小結(jié)節(jié)召回率僅62%。請給出兩項數(shù)據(jù)層面改進并附預(yù)期指標(biāo)提升。答案:1.采用oversample+copypaste小結(jié)節(jié):在訓(xùn)練時以80%概率隨機復(fù)制小結(jié)節(jié)粘貼到同圖隨機位置,使小結(jié)節(jié)樣本增3倍,預(yù)期召回+8%;2.引入unsharpmask增強:對原圖做高通濾波后加權(quán)疊加,突出邊緣,預(yù)期召回+5%,假陽略升+1%。解析:數(shù)據(jù)增廣+邊緣銳化可緩解小目標(biāo)信噪比低問題,實驗已在LUNA16驗證。三、自然語言處理與大模型17.【單選】在Transformer中,若將softmax改為ReLU,理論上selfattention的權(quán)重矩陣將失去哪一性質(zhì)?A.非負性B.稀疏性C.行隨機性D.對稱性答案:C解析:ReLU輸出非負但行和≠1,失去概率歸一化。18.【單選】使用AdamW時,下列哪組超參在10B參數(shù)大模型預(yù)訓(xùn)練中通常采用“熱身+線性衰減”?A.lr=1e3,β?=0.9,β?=0.999,weightdecay=0.1B.lr=3e4,β?=0.9,β?=0.95,weightdecay=0.1C.lr=1e2,β?=0.9,β?=0.999,weightdecay=1.0D.lr=6e4,β?=0.95,β?=0.99,weightdecay=0.01答案:B解析:大模型常用低lr、高β?=0.95防止早期梯度方差過大,weightdecay=0.1為GPT3同款。19.【多選】關(guān)于LoRA微調(diào),下列說法正確的是:A.可將秩r設(shè)為1仍保持90%下游精度B.推理時可與原權(quán)重合并,不增加延遲C.需保存的參數(shù)量與r×(d_input+d_output)成正比D.在Embedding層插入LoRA可提升文本生成多樣性答案:B、C解析:r=1通常掉點>5%;Embedding層LoRA主要減少內(nèi)存,不直接提升多樣性;推理合并后無額外計算。20.【填空】GPT3采用BPE編碼,若詞表大小50k,出現(xiàn)新詞“????”,則最可能將其拆分為______。答案:??+??解析:BPE按頻次合并,??已單字成token,重復(fù)出現(xiàn)則拆成相同子詞。21.【判斷】在BERT預(yù)訓(xùn)練中,若將NSP任務(wù)替換為SOP(SentenceOrderPrediction),模型在問答數(shù)據(jù)集上EM下降。答案:錯誤解析:ALBERT實驗表明SOP優(yōu)于NSP,EM提升+1.7%。22.【簡答】用不超過50字說明“旋轉(zhuǎn)位置編碼(RoPE)”相比絕對位置編碼的兩點優(yōu)勢。答案:1.外推長度友好;2.顯式編碼相對位置,提升自注意力插值能力。解析:RoPE通過旋轉(zhuǎn)矩陣將位置信息注入query/key,支持更長序列的零樣本泛化。23.【計算】給定句子“AI賦能”被tokenizer分詞為[“AI”,“?en”,“power”],id=[314,128,64],若使用絕對位置編碼,位置3的向量維數(shù)為768,請寫出第3維(0index)的值,假設(shè)使用正弦編碼:PE(pos=3,2i)=sin(3/10000^(2i/768))。答案:sin(3/10000^(4/768))≈0.063解析:i=1對應(yīng)2i=2,指數(shù)4/768,10000^(4/768)=e^(4ln10000/768)≈1.05,3/1.05≈2.857,sin(2.857rad)≈0.063。24.【案例】某企業(yè)用LLM做客服,發(fā)現(xiàn)模型頻繁調(diào)用“查詢訂單”插件卻返回空結(jié)果。日志顯示用戶已提供訂單號,但插件入?yún)⑹冀K為空。請給出根因與修復(fù)方案。答案:根因:Prompt模板將訂單號放在system字段,模型未識別需提??;修復(fù):在Promptuser段顯式寫“請?zhí)崛∮唵翁枺?2345并調(diào)用插件”,并給出fewshot示例,插件描述增加“入?yún)rder_id為11位數(shù)字”的regex,強制functioncalling格式。解析:LLM對system指令遵循度低,需把關(guān)鍵信息放user段并示例化,同時用schema約束。四、人工智能工程與MLOps25.【單選】KubeflowPipelines中,哪個組件負責(zé)在Kubernetes上自動橫向擴展訓(xùn)練Pod?A.TFJobB.PyTorchJobC.KatibD.MPIOperator答案:B解析:PyTorchJob通過CustomResource定義Worker、Master,支持彈性伸縮;Katib負責(zé)超參搜索。26.【單選】在Prometheus監(jiān)控中,衡量GPU顯存碎片率的合理指標(biāo)是:A.nvidia_gpu_memory_free_bytes/nvidia_gpu_memory_total_bytesB.(nvidia_gpu_memory_totalnvidia_gpu_memory_usednvidia_gpu_memory_free)/totalC.container_gpu_memory_usage/container_gpu_memory_limitD.rate(nvidia_gpu_memory_alloc_failures_total[5m])答案:B解析:碎片率=(totalusedfree)/total,可反映無法分配的碎片。27.【多選】下列哪些做法可降低TensorRT引擎的build時間?A.使用預(yù)編譯的timingcacheB.降低workspacesizeC.啟用FP16但關(guān)閉INT8校準D.采用NVIDIA官方提供的PlanCache答案:A、C、D解析:降低workspace會限制算法選擇,反而可能增加搜索時間;timingcache與PlanCache均可復(fù)用優(yōu)化記錄。28.【填空】在RayTrain中,若使用Horovod后端,通過______接口可將單進程代碼擴展至多節(jié)點。答案:horovod.torch.run解析:ray.train.horovod.HorovodTrainer內(nèi)部調(diào)用horovodrun,用戶只需寫單進程train_func。29.【判斷】MLflow的ModelRegistry支持通過Webhooks觸發(fā)JenkinsCI,但無法觸發(fā)GitHubActions。答案:錯誤解析:MLflow2.8+支持GenericWebhooks,可配置GitHubActions端點。30.【簡答】說明“影子模式”(shadowdeployment)在推薦系統(tǒng)上線時的三步實施流程。答案:1.復(fù)制線上流量寫入Kafka雙份;2.新模型消費影子流量,不寫回線上;3.對比日志,評估AUC、延遲、資源,確認無差異后切流。解析:影子模式零風(fēng)險驗證新模型,對實時推薦尤為關(guān)鍵。31.【計算】某服務(wù)QPS=2000,平均推理延遲=120ms,P99=300ms。若采用batch=8動態(tài)批處理,平均延遲升至180ms,P99降至200ms,GPU利用率由35%提升至70%,問:所需GPU實例數(shù)下降比例?答案:50%解析:原需實例=ceil(2000×0.3/0.35)≈1714;批處理后實例=ceil(2000×0.18/0.7)≈514;下降(1714514)/1714≈70%,考慮batch=8帶來的吞吐提升,實際測算后下降約50%。32.【案例】自動駕駛團隊用CI/CD自動訓(xùn)練感知模型,發(fā)現(xiàn)每晚數(shù)據(jù)集擴增10%,訓(xùn)練時長線性增長,已影響次日迭代。請給出兩項工程優(yōu)化并附量化收益。答案:1.引入增量學(xué)習(xí):每夜僅訓(xùn)練新增10%數(shù)據(jù),使用EWC正則,訓(xùn)練時間由8h降至1.5h,精度掉點<0.3%;2.啟用StochasticWeightAveraging+混合精度,配合DALI加速數(shù)據(jù)加載,整體提速1.8倍,顯存節(jié)省30%,可支持雙倍batch。解析:增量學(xué)習(xí)避免全量重訓(xùn);DALIGPU解碼+FP16加速,已在nuScenes驗證。五、人工智能倫理、安全與合規(guī)33.【單選】歐盟AIAct草案將“實時生物識別系統(tǒng)”歸為哪一類風(fēng)險?A.最小風(fēng)險B.有限風(fēng)險C.高風(fēng)險D.不可接受風(fēng)險答案:D解析:除少數(shù)例外,公共場所實時生物識別被認定為不可接受風(fēng)險,禁止投放。34.【單選】在模型可解釋性中,SHAP值滿足“局部準確性”與“缺失性”,下列哪項不是其公理?A.局部準確性B.一致性C.對稱性D.單調(diào)性答案:D解析:SHAP三大公理:局部準確、一致性、對稱性;單調(diào)性不是。35.【多選】關(guān)于聯(lián)邦學(xué)習(xí)安全,下列哪些攻擊可導(dǎo)致“模型投毒”?A.拜占庭攻擊B.后門攻擊C.成員推理攻擊D.梯度反轉(zhuǎn)攻擊答案:A、B解析:成員推理與梯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 院慶手工活動方案策劃(3篇)
- 2025年健康監(jiān)測手環(huán)政策影響分析報告
- 2025年工業(yè)機器人五年產(chǎn)銷量與制造業(yè)自動化報告
- 2025年智慧物流無人配送行業(yè)創(chuàng)新報告
- 企業(yè)銷售渠道建設(shè)與拓展策略(標(biāo)準版)
- 2025年清潔能源行業(yè)創(chuàng)新報告及光伏發(fā)電技術(shù)分析報告
- 護理教學(xué)課件的設(shè)計趨勢
- 房地產(chǎn)經(jīng)紀與交易規(guī)范指南(標(biāo)準版)
- 2026年度開封市市直機關(guān)公開遴選公務(wù)員44人參考題庫完美版
- 2026西安西京初級中學(xué)教師招聘參考題庫必考題
- 排水管網(wǎng)清淤疏通方案(技術(shù)方案)
- 安全文明施工措施費用支付計劃三篇
- GB/T 30564-2023無損檢測無損檢測人員培訓(xùn)機構(gòu)
- 人教版九年級化學(xué)導(dǎo)學(xué)案全冊
- 國開電大商業(yè)銀行經(jīng)營管理形考作業(yè)3參考答案
- 陳獨秀早期社會建設(shè)思想的形成、淵源及啟迪,東方哲學(xué)論文
- GB/T 1865-2009色漆和清漆人工氣候老化和人工輻射曝露濾過的氙弧輻射
- GB/T 11945-2019蒸壓灰砂實心磚和實心砌塊
- 2023年自考高級財務(wù)會計真題和答案
- 2022年貴陽市法院書記員招聘筆試試題及答案解析
- 防水班日常安全教育登記表
評論
0/150
提交評論