版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2025年大學(xué)《數(shù)字人文》專業(yè)題庫及答案一、數(shù)字人文基礎(chǔ)與學(xué)科史1.【單項(xiàng)選擇】“數(shù)字人文”一詞首次被正式寫入國際頂級期刊標(biāo)題的年份是A.1992?B.2001?C.2004?D.2011答案:C解析:2004年《DigitalHumanitiesQuarterly》創(chuàng)刊號明確采用該詞,標(biāo)志學(xué)科命名完成。2.【單項(xiàng)選擇】下列哪項(xiàng)技術(shù)突破直接催生了“文本編碼倡議”TEIP1的發(fā)布?A.Unicode1.0?B.SGML標(biāo)準(zhǔn)發(fā)布?C.HTML2.0?D.XMLSchema1.0答案:B解析:1986年ISO8879SGML標(biāo)準(zhǔn)確立后,1987年TEIP1迅速跟進(jìn)。3.【多項(xiàng)選擇】關(guān)于RobertoBusa的IndexThomisticus項(xiàng)目,下列說法正確的是A.使用IBM705主機(jī)?B.采用穿孔卡片輸入拉丁文?C.輸出成果為80列紙帶?D.首次引入lemmatization算法?E.全部語料已開源至公有領(lǐng)域答案:ABD解析:C項(xiàng)輸出為磁帶;E項(xiàng)版權(quán)仍受梵蒂岡圖書館限制。4.【判斷改錯】“數(shù)字人文”與“人文計(jì)算”僅僅是英美學(xué)術(shù)話語差異,二者研究對象完全一致。答案:錯誤。研究對象雖重疊,但“數(shù)字人文”更強(qiáng)調(diào)公共文化介入與批判理論視角。5.【名詞解釋】AlgorithmicCriticism答案:由StephenRamsay提出,指將算法視為闡釋行為主體,通過故意“變形”文本數(shù)據(jù)生成新批評視角的方法論。6.【簡答】列舉數(shù)字人文被質(zhì)疑的三類“本體論陷阱”,并各舉一例。答案:1.數(shù)據(jù)本質(zhì)主義——將《紅樓夢》人物關(guān)系簡化為無向圖,忽略敘事時(shí)間性;2.算法中立神話——用LDA主題模型推導(dǎo)“唐代邊塞詩”主題,卻未揭示訓(xùn)練集過度代表高適、岑參;3.可視化凝視——把奴隸貿(mào)易航線做成美觀球體投影,弱化苦難敘事倫理。7.【材料分析】閱讀Busa1950年致IBM信節(jié)選(英文),指出其說服IBM資助的修辭策略。答案:1.強(qiáng)調(diào)“神圣語料”的普世價(jià)值;2.承諾機(jī)器詞典可反哺科技翻譯;3.將天主教知識傳統(tǒng)與冷戰(zhàn)信息競賽并置,迎合IBM公關(guān)需求。8.【論述】結(jié)合中國“數(shù)字人文”命名史,評析“數(shù)字”與“人文”在中文語境中的張力。答案:須觸及“數(shù)字”被誤讀為“數(shù)碼/數(shù)值”而非“數(shù)字化”、“人文”在當(dāng)代漢語中的學(xué)科邊界漂移,以及2016年《數(shù)字人文宣言》中文版引發(fā)的“科學(xué)vs儒學(xué)”論戰(zhàn)。二、文本編碼與語義標(biāo)注9.【單項(xiàng)選擇】TEI<choice>元素不能用于下列哪組對立?A.繁簡字?B.英美拼寫?C.異體字?D.韻書反切答案:D解析:反切屬于音韻信息,應(yīng)使用<pron>或<phr>。10.【填空】在TEIP5中,用____屬性標(biāo)記“”為添加,用____元素標(biāo)記“”為刪除。答案:@hand;<del>11.【多項(xiàng)選擇】關(guān)于Unicode對西夏文的支持,正確的是A.位于U+17000–U+187FF?B.2020年TUS13.0發(fā)布?C.使用四字節(jié)UTF8?D.與契丹小字同區(qū)段?E.字體“TangutYigchun”由日本制作答案:ABC解析:D項(xiàng)契丹小字位于U+18B00–U+18CFF;E項(xiàng)字體由中國學(xué)者主導(dǎo)。12.【簡答】說明OHCO模型(OrderedHierarchyofContentObjects)如何解釋“重疊層級”難題,并指出兩種軟件層解決方案。答案:模型將文本視為有序內(nèi)容對象樹,重疊即多父節(jié)點(diǎn);解決方案:1.TrojanHorseMarkup(如MILE);2.Standoff標(biāo)注(如CATMA、TEIODD自定義)。13.【編程】給出Python代碼片段,將一段含<noteplace="margin">的TEI文件轉(zhuǎn)為Markdown,要求保留邊注編號并插入腳注語法。答案:```pythonimportre,htmltei=open("ms.xml").read()md=re.sub(r'<noteplace="margin"n="(\d+)">(.?)</note>',r'[^\\1]:\\2',tei)print(html.unescape(md))```14.【案例分析】某項(xiàng)目將《資治通鑒》按年、月、日三層嵌套,但出現(xiàn)“閏月”與“干支”交叉。請用TEIODD設(shè)計(jì)一種非破壞性擴(kuò)展,使機(jī)器可讀且保留史學(xué)傳統(tǒng)。答案:采用<calendarDesc>定義“閏月”為@type="intercalary",并在<date>內(nèi)嵌@whencustom與@datingMethod="chineselunar",通過<fs>特征結(jié)構(gòu)外掛干支值。三、文本挖掘與遠(yuǎn)讀15.【單項(xiàng)選擇】在Jockers提出的“宏分析”流程中,哪一步驟明確反對使用停用詞表?A.分詞?B.向量化?C.主題建模?D.分類答案:C解析:他認(rèn)為停用詞表會抹去19世紀(jì)小說文體特征信號。16.【多項(xiàng)選擇】中文分詞工具中,支持用戶自定義詞典且以CRF為后端的是A.jieba?B.HanLP1.x?C.THULAC?D.PKUSeg?E.LTP4.0答案:BCD17.【填空】當(dāng)使用word2vecSkipgram訓(xùn)練《全唐詩》時(shí),若窗口大小=5,向量維度=300,最小詞頻=5,則“黃河”詞向量與“銀河”余弦相似度大于0.6,說明二者在____空間出現(xiàn)語境重疊。答案:隱喻天文/水文18.【簡答】解釋“詞匯包模型”為何在明清奏折情感分類任務(wù)中失效,并給出兩種緩解方案。答案:奏折高度程式化,詞匯包忽略句法敬謙;方案:1.引入ngram與句法特征;2.使用預(yù)訓(xùn)練文言文BERT并微調(diào)。19.【編程】用Rtidyverse寫出計(jì)算“魯迅短篇小說平均段落長度(字符數(shù))”的完整腳本,并返回中位數(shù)。答案:```rlibrary(tidyverse)library(cnTextSplit)lu_xun<readLines("luxun.txt")%>%str_split("\n\n")%>%unlist()tibble(len=str_length(lu_xun))%>%summarise(median=median(len))```20.【論述】結(jié)合Moretti《遠(yuǎn)讀》與中文“詩話”傳統(tǒng),論證“遠(yuǎn)讀”是否必然排斥“細(xì)讀”。答案:需援引Moretti2013年“可證偽文體學(xué)”訪談,指出遠(yuǎn)讀提供假設(shè)、細(xì)讀負(fù)責(zé)證偽;并引《六一詩話》“句法譜”示例,說明宋代詩話已用統(tǒng)計(jì)眼光。四、時(shí)空數(shù)據(jù)與歷史GIS21.【單項(xiàng)選擇】CHGIS項(xiàng)目采用的基準(zhǔn)坐標(biāo)系是A.WGS84?B.Xian1980?C.CGCS2000?D.Beijing1954答案:A22.【多項(xiàng)選擇】下列哪些空間數(shù)據(jù)模型支持“隨時(shí)間變化的行政區(qū)劃”表達(dá)?A.簡單要素模型?B.時(shí)空立方體?C.對象字段模型?D.離散格網(wǎng)模型?E.事件驅(qū)動模型答案:BCE23.【填空】在PostGIS中,用函數(shù)____將“江南道”多邊形公元742年邊界與公元1078年邊界做____運(yùn)算,可提取新增墾田面積。答案:ST_Union;ST_Difference24.【簡答】說明“地名詞典消歧”在歷代地理志數(shù)據(jù)庫中的關(guān)鍵步驟,并給出一種基于BERT的排序損失函數(shù)。答案:步驟:1.候選鏈接生成(字符串+空間緩沖);2.上下文編碼;3.排序;損失:使用ListNet,損失=?∑P(y_i)logP_θ(z_i),其中z_i為BERT[CLS]經(jīng)全連接后的得分。25.【案例分析】給出QGIS操作截圖描述(文字),展示如何將《水經(jīng)注》河流矢量與SRTMDEM進(jìn)行“地形陰影”疊加,以驗(yàn)證酈道元對“伏流”記述的可信度。答案:1.導(dǎo)入SRTM,設(shè)定投影為CGCS2000/3degreeGaussKrugerCM114E;2.使用“地形陰影”工具,方位角315°,高度45°;3.河流層設(shè)置20%透明度,顏色漸變按海拔;4.觀察溶洞出口與陰影谷地吻合度,計(jì)算Kappa=0.72。26.【論述】歷史GIS如何回應(yīng)“空間轉(zhuǎn)向”批判?請引用Soja與中文“山河”話語。答案:須討論第三空間、地方感與GIS“層”隱喻的張力,并引王弼“得意忘象”說明GIS可視化并非終極歷史真實(shí)。五、數(shù)字考古與3D重建27.【單項(xiàng)選擇】在AgisoftMetashape中,下列哪項(xiàng)參數(shù)最直接影響紋理貼圖UV利用率?A.關(guān)鍵點(diǎn)限制?B.紋理圖集尺寸?C.深度圖過濾?D.相機(jī)內(nèi)參優(yōu)化答案:B28.【多項(xiàng)選擇】關(guān)于LiDAR在瑪雅考古中的應(yīng)用,正確的是A.2012年Caracal項(xiàng)目首次發(fā)現(xiàn)梯田?B.可穿透熱帶雨林樹冠?C.使用近紅外波段?D.點(diǎn)云密度≥30pts/m2可識別祭臺?E.需配合Groundtruthexcavation答案:BCDE29.【填空】在Blender中,將光度立體法得到的____貼圖連接至PrincipledBSDF的____通道,可增強(qiáng)陶片紋飾細(xì)節(jié)。答案:Normal;Normal30.【簡答】說明“多光譜成像”如何輔助解讀敦煌遺書被刮削文字,并給出波段組合公式。答案:使用960nm近紅外減去可見光R通道,公式I_enhance=(NIR?R)/(NIR+R),可凸顯被刮削墨跡與纖維對比度。31.【編程】用Python+Open3D寫一段腳本,自動計(jì)算陶罐碎片點(diǎn)云“口沿”圓心,并輸出半徑。答案:```pythonimportopen3daso3d,numpyasnppcd=o3d.io.read_point_cloud("rim.pcd")plane_model,inliers=pcd.segment_plane(distance_threshold=0.5,ransac_n=3,num_iterations=1000)rim=pcd.select_by_index(inliers)xyz=np.asarray(rim.points)[:,:2]center,radius=cv2.minEnclosingCircle(xyz)print(center,radius)```32.【案例分析】某團(tuán)隊(duì)用NeRF重建云岡第20窟,結(jié)果佛像背面出現(xiàn)“黑洞”。請指出采集環(huán)節(jié)的三類可能錯誤,并給出基于COLMAP的補(bǔ)救策略。答案:錯誤:1.相機(jī)環(huán)狀分布未覆蓋后壁;2.曝光鎖定導(dǎo)致逆光欠曝;3.閃光燈與環(huán)境光混用;補(bǔ)救:補(bǔ)拍+使用COLMAP“patchmatchstereo”擴(kuò)展深度,再運(yùn)行NeRFacto重訓(xùn)練。六、數(shù)據(jù)可視化與交互敘事33.【單項(xiàng)選擇】在D3.js中,下列哪個縮放事件對象屬性可直接獲取當(dāng)前縮放比k?A.d3.event.scale?B.d3.zoomTransform(this).k?C.this.transform.k?D.d3.zoomIdentity.k答案:B34.【多項(xiàng)選擇】關(guān)于“文化組學(xué)”(Culturomics)的ngramViewer,正確的是A.2010年Science論文使用6種語言?B.中文子庫含5%繁體中文?C.支持正則檢索?D.元數(shù)據(jù)含出版地?E.2022年停止更新答案:ABD35.【填空】在ObservablePlot中,用____標(biāo)記函數(shù)繪制“時(shí)間情感”折線,并設(shè)置____曲線方法可平滑乾隆朝奏折情感波動。答案:Plot.line;window36.【簡答】解釋“可視化修辭”概念,并分析“用紅色熱力圖標(biāo)示抗戰(zhàn)傷亡”可能引發(fā)的倫理爭議。答案:可視化修辭指通過顏色、形狀、動畫引導(dǎo)情感判斷;紅色在中國語境既象征勝利又暗示鮮血,可能遮蔽個體苦難,造成“情感消費(fèi)”。37.【編程】用VegaLiteJSON寫出“明代進(jìn)士空間分布”交互圖:點(diǎn)擊省份可聯(lián)動下方“朝代錄取人數(shù)”柱狀圖。答案:```json{"data":{"url":"jinshi.csv"},"vconcat":[{"mark":"geoshape","projection":{"type":"mercator"},"selection":{"province":{"type":"single","fields":["province"],"on":"click"}}},{"mark":"bar","transform":[{"filter":{"selection":"province"}}],"encoding":{"x":{"field":"dynasty","type":"ordinal"},"y":{"aggregate":"count"}}}]}```38.【論述】結(jié)合“批判數(shù)據(jù)研究”(CriticalDataStudies)與故宮“數(shù)字文物”策展,論證“高分辨率”是否等于“高真實(shí)性”。答案:需討論像素級復(fù)制與“靈暈”(aura)消失、數(shù)字孿生中的權(quán)力凝視、以及觀眾對“可放大”的心理補(bǔ)償機(jī)制。七、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)應(yīng)用39.【單項(xiàng)選擇】在訓(xùn)練“古典詩詞自動生成”時(shí),若使用GPT2Chinese,最需要手工清洗的噪聲是A.現(xiàn)代簡體插入?B.異體字?C.句讀符號?D.缺字框□答案:A40.【多項(xiàng)選擇】下列哪些模型原生支持文言文掩碼語言建模?A.GuwenBERT?B.RoBERTawwmext?C.SikuBERT?D.Mengzi?E.EryaBERT答案:ACE41.【填空】在PyTorch中,若自定義Dataset加載《四庫全書》圖像文本對,需實(shí)現(xiàn)____、____和____三個魔術(shù)方法。答案:__init__;__len__;__getitem__42.【簡答】說明“歷史人名鏈接”任務(wù)與“實(shí)體消歧”任務(wù)在訓(xùn)練目標(biāo)上的差異,并給出一種基于對比學(xué)習(xí)的損失。答案:人名鏈接需對齊到知識庫唯一ID,目標(biāo)為ranking;實(shí)體消歧可允許多義。損失:InfoNCE,L=?logexp(sim(h,q)/τ)/∑exp(sim(h,q?)/τ)。43.【編程】用TensorFlowKeras寫出“朝代分類”微調(diào)SikuBERT的完整代碼(含EarlyStopping),要求在驗(yàn)證集F1≥0.92。答案:```pythonfromtransformersimportTFBertModelinputs=Input(shape=(128,),dtype='int32')bert=TFBertModel.from_pretrained('SikuBERT')x=bert(inputs)[1]x=Dense(24,activation='softmax')(x)model=Model(inputs,x)pile(loss='sparse_categorical_crossentropy',optimizer=Adam(2e5),metrics=['sparse_categorical_accuracy'])EarlyStopping(monitor='val_loss',patience=3,restore_best_weights=True)```44.【案例分析】某團(tuán)隊(duì)用StyleGAN2生成“北宋山水”高分辨率圖像,卻被批評“皴法雷同”。請指出訓(xùn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鄉(xiāng)鎮(zhèn)項(xiàng)目管理內(nèi)控制度
- 市動監(jiān)所內(nèi)控制度
- 稅務(wù)系統(tǒng)基層內(nèi)控制度
- 扎牢制度籠子內(nèi)控制度
- 招標(biāo)投標(biāo)內(nèi)控制度
- 大連社保內(nèi)控制度
- 淺析公司內(nèi)部內(nèi)控制度
- 中科院內(nèi)控制度
- xx燃?xì)夤緝?nèi)控制度
- 內(nèi)控制度審核實(shí)施細(xì)則
- 2026年哈爾濱職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性考試題庫參考答案詳解
- 2025云南昆明巫家壩建設(shè)發(fā)展有限責(zé)任公司及下屬公司第四季度社會招聘31人歷年真題匯編帶答案解析
- 66kV及以下架空電力線路設(shè)計(jì)標(biāo)準(zhǔn)
- 生鮮聯(lián)營合同范本
- 2025重慶川儀自動化股份有限公司招聘56人筆試參考題庫附帶答案詳解(3卷合一版)
- 2025年浙江乍浦經(jīng)濟(jì)開發(fā)區(qū)(嘉興港區(qū))區(qū)屬國有公司公開招聘28人筆試考試備考試題及答案解析
- 論文發(fā)表合同協(xié)議
- 《SJT 11319-2005錫焊料動態(tài)條件氧化渣量定量試驗(yàn)方法》(2025年)實(shí)施指南
- 2025年長者教育與培訓(xùn)項(xiàng)目可行性研究報(bào)告
- 全國園林綠化養(yǎng)護(hù)概算定額(2018版)
- 2025年秋季學(xué)期國家開放大學(xué)《理工英語4》形考任務(wù)綜合測試完整答案(不含聽力部分)
評論
0/150
提交評論