版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025年數(shù)字人文與社會(huì)科學(xué)研究專業(yè)考試題及答案一、單項(xiàng)選擇題(每題2分,共20分)1.數(shù)字人文研究中,用于分析文本中高頻詞匯及其共現(xiàn)關(guān)系的核心技術(shù)是()A.地理信息系統(tǒng)(GIS)B.社會(huì)網(wǎng)絡(luò)分析(SNA)C.文本挖掘(TextMining)D.情感分析(SentimentAnalysis)2.以下哪項(xiàng)不屬于社會(huì)科學(xué)研究中數(shù)字技術(shù)帶來的新數(shù)據(jù)類型?()A.社交媒體用戶互動(dòng)日志B.歷史檔案的OCR識(shí)別文本C.人口普查的統(tǒng)計(jì)報(bào)表D.移動(dòng)設(shè)備的GPS軌跡數(shù)據(jù)3.計(jì)算社會(huì)科學(xué)中“小數(shù)據(jù)”與“大數(shù)據(jù)”的根本區(qū)別在于()A.數(shù)據(jù)量的絕對(duì)大小B.數(shù)據(jù)采集的主動(dòng)性與被動(dòng)性C.數(shù)據(jù)存儲(chǔ)的介質(zhì)類型D.數(shù)據(jù)分析師的專業(yè)背景4.數(shù)字人文項(xiàng)目中,為確保歷史文獻(xiàn)數(shù)字化的學(xué)術(shù)嚴(yán)謹(jǐn)性,關(guān)鍵步驟是()A.提高掃描分辨率B.建立元數(shù)據(jù)標(biāo)準(zhǔn)C.開發(fā)可視化界面D.增加用戶交互功能5.社會(huì)網(wǎng)絡(luò)分析中,衡量節(jié)點(diǎn)在網(wǎng)絡(luò)中“中介”作用的指標(biāo)是()A.度中心性(DegreeCentrality)B.緊密中心性(ClosenessCentrality)C.中介中心性(BetweennessCentrality)D.特征向量中心性(EigenvectorCentrality)6.以下哪項(xiàng)是數(shù)字人文研究中“計(jì)算轉(zhuǎn)向”的典型表現(xiàn)?()A.用Excel統(tǒng)計(jì)歷史文獻(xiàn)中的人名出現(xiàn)次數(shù)B.通過Python編寫程序分析古典詩詞的韻腳分布C.制作某歷史街區(qū)的3D模型用于展示D.在數(shù)據(jù)庫中錄入地方志的基本信息7.處理社交媒體數(shù)據(jù)時(shí),“去匿名化”操作可能引發(fā)的主要倫理問題是()A.數(shù)據(jù)存儲(chǔ)成本增加B.用戶隱私泄露風(fēng)險(xiǎn)C.數(shù)據(jù)格式不統(tǒng)一D.分析結(jié)果準(zhǔn)確性下降8.數(shù)字檔案建設(shè)中,“語義網(wǎng)”技術(shù)的核心作用是()A.提升檔案檢索速度B.實(shí)現(xiàn)跨數(shù)據(jù)庫的知識(shí)關(guān)聯(lián)C.壓縮數(shù)字文件大小D.增強(qiáng)檔案的可視化效果9.傳統(tǒng)社會(huì)科學(xué)研究與數(shù)字人文研究的關(guān)鍵差異在于()A.研究問題的提出方式B.對(duì)研究對(duì)象的價(jià)值判斷C.數(shù)據(jù)獲取與分析的技術(shù)手段D.學(xué)術(shù)成果的發(fā)表形式10.在數(shù)字人文項(xiàng)目中,“用戶生成內(nèi)容(UGC)”最主要的應(yīng)用價(jià)值是()A.降低項(xiàng)目開發(fā)成本B.豐富研究數(shù)據(jù)來源C.提升技術(shù)實(shí)現(xiàn)難度D.簡(jiǎn)化成果傳播流程二、名詞解釋(每題5分,共25分)1.數(shù)字人文(DigitalHumanities)2.社會(huì)網(wǎng)絡(luò)分析(SocialNetworkAnalysis,SNA)3.文本數(shù)據(jù)清洗(TextDataCleaning)4.計(jì)算社會(huì)科學(xué)(ComputationalSocialScience)5.數(shù)字檔案可視化(DigitalArchiveVisualization)三、簡(jiǎn)答題(每題10分,共30分)1.簡(jiǎn)述數(shù)字人文研究中“量化分析”與“質(zhì)性研究”的融合路徑。2.舉例說明社會(huì)網(wǎng)絡(luò)分析在社會(huì)學(xué)研究中的具體應(yīng)用場(chǎng)景。3.從數(shù)據(jù)采集、處理到分析,說明數(shù)字技術(shù)如何拓展了傳統(tǒng)田野調(diào)查的研究邊界。四、論述題(每題15分,共30分)1.結(jié)合具體案例,論述數(shù)字人文研究中“技術(shù)工具”與“人文價(jià)值”的平衡問題。2.大數(shù)據(jù)時(shí)代的社會(huì)科學(xué)研究面臨哪些方法論挑戰(zhàn)?如何通過數(shù)字人文的跨學(xué)科視角應(yīng)對(duì)?五、實(shí)踐操作題(共35分)假設(shè)你負(fù)責(zé)某高校“地方戲曲文化數(shù)字化保護(hù)”項(xiàng)目,需完成以下任務(wù):(1)設(shè)計(jì)一套包含數(shù)據(jù)采集、處理、分析與展示的完整技術(shù)方案(15分);(2)針對(duì)“地方戲曲觀眾年齡結(jié)構(gòu)變遷”研究子課題,設(shè)計(jì)具體的數(shù)據(jù)分析流程,并說明可能使用的工具(10分);(3)列舉項(xiàng)目實(shí)施中需要注意的倫理與學(xué)術(shù)規(guī)范問題(10分)。參考答案一、單項(xiàng)選擇題1.C2.C3.B4.B5.C6.B7.B8.B9.C10.B二、名詞解釋1.數(shù)字人文(DigitalHumanities):以數(shù)字技術(shù)為工具,以人文社會(huì)科學(xué)問題為導(dǎo)向的交叉研究領(lǐng)域。通過數(shù)據(jù)挖掘、可視化、計(jì)算建模等技術(shù)手段,重新審視傳統(tǒng)人文研究中的文本、圖像、聲音等材料,拓展研究維度(如大規(guī)模文本分析、歷史空間重建),同時(shí)關(guān)注技術(shù)應(yīng)用的人文價(jià)值與倫理邊界。2.社會(huì)網(wǎng)絡(luò)分析(SNA):通過圖論方法研究社會(huì)關(guān)系結(jié)構(gòu)的量化分析技術(shù)。將社會(huì)行動(dòng)者(個(gè)體、組織等)視為節(jié)點(diǎn),將行動(dòng)者間的關(guān)系(合作、互動(dòng)、影響等)視為邊,通過中心性、社群檢測(cè)、結(jié)構(gòu)洞等指標(biāo),揭示網(wǎng)絡(luò)中的權(quán)力分布、信息傳播路徑及群體特征,廣泛應(yīng)用于社會(huì)學(xué)、傳播學(xué)等領(lǐng)域。3.文本數(shù)據(jù)清洗:對(duì)原始文本數(shù)據(jù)進(jìn)行預(yù)處理以提高質(zhì)量的過程。主要步驟包括去除噪聲(如亂碼、廣告)、統(tǒng)一格式(如全角轉(zhuǎn)半角)、糾正錯(cuò)誤(如OCR識(shí)別錯(cuò)誤)、標(biāo)準(zhǔn)化處理(如分詞、去停用詞)等,是后續(xù)文本挖掘、情感分析等任務(wù)的基礎(chǔ),直接影響分析結(jié)果的可靠性。4.計(jì)算社會(huì)科學(xué):利用計(jì)算技術(shù)(如機(jī)器學(xué)習(xí)、復(fù)雜系統(tǒng)建模)研究社會(huì)現(xiàn)象的交叉學(xué)科。通過分析大規(guī)模數(shù)字痕跡數(shù)據(jù)(如社交媒體、通信記錄),探索社會(huì)行為的模式與規(guī)律,突破傳統(tǒng)社會(huì)科學(xué)依賴小樣本調(diào)查的局限,強(qiáng)調(diào)數(shù)據(jù)驅(qū)動(dòng)的假設(shè)驗(yàn)證與動(dòng)態(tài)模擬。5.數(shù)字檔案可視化:將數(shù)字檔案中的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為圖形、圖表等可視化形式的技術(shù)。通過時(shí)間軸、熱力圖、知識(shí)圖譜等工具,直觀呈現(xiàn)檔案內(nèi)容的關(guān)聯(lián)(如人物關(guān)系、事件脈絡(luò))、分布特征(如地域集中性)或演變趨勢(shì)(如關(guān)鍵詞頻率變化),提升檔案信息的可理解性與研究效率。三、簡(jiǎn)答題1.數(shù)字人文中“量化分析”與“質(zhì)性研究”的融合路徑包括:(1)數(shù)據(jù)層面:通過數(shù)字技術(shù)將質(zhì)性材料(如歷史文本、訪談?dòng)涗洠┺D(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)(如詞頻統(tǒng)計(jì)、情感分值),為量化分析提供基礎(chǔ);(2)方法層面:先用量化方法發(fā)現(xiàn)模式(如某時(shí)期小說中“愛情”一詞出現(xiàn)頻率異常升高),再通過質(zhì)性解讀探究背后的社會(huì)文化動(dòng)因(如當(dāng)時(shí)婚戀觀念的變遷);(3)驗(yàn)證層面:以量化結(jié)果驗(yàn)證質(zhì)性假設(shè)(如通過社交媒體數(shù)據(jù)驗(yàn)證“代際溝通障礙”的理論),或用質(zhì)性案例補(bǔ)充量化結(jié)論的解釋力(如用具體訪談?dòng)涗浾f明某統(tǒng)計(jì)規(guī)律的特殊情境);(4)工具層面:借助混合方法工具(如Nvivo同時(shí)支持文本編碼與統(tǒng)計(jì)分析)實(shí)現(xiàn)兩種方法的協(xié)同操作。2.社會(huì)網(wǎng)絡(luò)分析在社會(huì)學(xué)中的應(yīng)用案例:以“企業(yè)創(chuàng)新團(tuán)隊(duì)知識(shí)傳播”研究為例:(1)構(gòu)建網(wǎng)絡(luò):將團(tuán)隊(duì)成員視為節(jié)點(diǎn),成員間的知識(shí)共享行為(如郵件、會(huì)議討論)視為邊;(2)計(jì)算指標(biāo):分析個(gè)體的中介中心性(判斷誰是知識(shí)傳遞的關(guān)鍵橋梁)、社群結(jié)構(gòu)(識(shí)別非正式的知識(shí)傳播小團(tuán)體)、結(jié)構(gòu)洞(發(fā)現(xiàn)信息斷層區(qū)域);(3)結(jié)論應(yīng)用:若某成員中介中心性極高,可能成為團(tuán)隊(duì)知識(shí)傳播的瓶頸,需加強(qiáng)其與其他成員的互動(dòng);若存在多個(gè)孤立社群,需設(shè)計(jì)跨組合作機(jī)制以促進(jìn)知識(shí)流動(dòng)。3.數(shù)字技術(shù)對(duì)傳統(tǒng)田野調(diào)查的拓展:(1)數(shù)據(jù)采集:傳統(tǒng)田野依賴觀察記錄、訪談錄音,數(shù)字技術(shù)可補(bǔ)充GPS定位(記錄調(diào)查對(duì)象活動(dòng)范圍)、可穿戴設(shè)備(監(jiān)測(cè)生理指標(biāo)反映情緒)、社交媒體數(shù)據(jù)(獲取調(diào)查對(duì)象線上行為),形成多源數(shù)據(jù);(2)數(shù)據(jù)處理:用語音轉(zhuǎn)文字工具(如Whisper)快速轉(zhuǎn)錄訪談內(nèi)容,用NLP工具(如Python的jieba分詞)自動(dòng)提取訪談中的高頻主題,用情感分析模型識(shí)別受訪者的隱含態(tài)度,提高處理效率;(3)數(shù)據(jù)分析:通過社會(huì)網(wǎng)絡(luò)分析呈現(xiàn)調(diào)查對(duì)象的關(guān)系網(wǎng)絡(luò),用地理信息系統(tǒng)(GIS)繪制“社會(huì)空間圖譜”(如某社區(qū)內(nèi)不同群體的活動(dòng)區(qū)域重疊度),用時(shí)間序列分析追蹤特定行為的長(zhǎng)期變化,突破傳統(tǒng)定性描述的局限。四、論述題1.數(shù)字人文中“技術(shù)工具”與“人文價(jià)值”的平衡需避免兩種極端:技術(shù)至上或忽視技術(shù)。以“《全唐詩》數(shù)字分析項(xiàng)目”為例:(1)技術(shù)應(yīng)用:通過文本挖掘統(tǒng)計(jì)全唐詩中“月”“酒”等意象的出現(xiàn)頻率,用空間分析繪制詩人活動(dòng)軌跡,用主題模型(LDA)自動(dòng)識(shí)別詩歌主題,這些技術(shù)工具極大拓展了傳統(tǒng)文學(xué)研究的廣度(如發(fā)現(xiàn)中唐時(shí)期“邊塞詩”主題占比下降);(2)人文價(jià)值審視:需警惕技術(shù)簡(jiǎn)化人文復(fù)雜性。例如,單純統(tǒng)計(jì)“月”的出現(xiàn)次數(shù)可能忽略其象征意義的變遷(初唐的“月”多表思鄉(xiāng),晚唐的“月”可能含末世情懷),因此需結(jié)合具體詩作的語境分析;此外,技術(shù)選擇需服務(wù)于研究問題——若研究“詩歌情感基調(diào)演變”,情感分析模型的訓(xùn)練語料需包含古典漢語情感詞典,而非直接使用現(xiàn)代通用模型,避免文化誤讀;(3)平衡路徑:項(xiàng)目團(tuán)隊(duì)?wèi)?yīng)包含文學(xué)研究者(提出人文問題)、技術(shù)專家(提供方法支持)、倫理學(xué)者(評(píng)估技術(shù)風(fēng)險(xiǎn)),在每一步技術(shù)應(yīng)用前明確“為何用”“如何用”“可能的局限”,確保技術(shù)為人文研究服務(wù),而非主導(dǎo)研究方向。2.大數(shù)據(jù)時(shí)代社會(huì)科學(xué)研究的方法論挑戰(zhàn)及應(yīng)對(duì):(1)挑戰(zhàn):①數(shù)據(jù)偏差:大數(shù)據(jù)多為“被動(dòng)留下的數(shù)字痕跡”(如社交媒體數(shù)據(jù)),可能遺漏不使用網(wǎng)絡(luò)的群體(如老年人),導(dǎo)致樣本代表性不足;②因果推斷困難:大數(shù)據(jù)擅長(zhǎng)發(fā)現(xiàn)相關(guān)性(如某地區(qū)奶茶銷量與離婚率正相關(guān)),但難以證明因果關(guān)系(需結(jié)合實(shí)驗(yàn)或理論機(jī)制分析);③倫理風(fēng)險(xiǎn):用戶隱私保護(hù)(如通過定位數(shù)據(jù)追蹤個(gè)體行為)、數(shù)據(jù)所有權(quán)(如企業(yè)數(shù)據(jù)的獲取權(quán)限)等問題突出;④解釋力局限:機(jī)器學(xué)習(xí)模型(如深度學(xué)習(xí))可能得出“黑箱”結(jié)論(如預(yù)測(cè)某政策支持率的模型無法解釋關(guān)鍵變量),與社會(huì)科學(xué)強(qiáng)調(diào)的“可解釋性”沖突。(2)數(shù)字人文的應(yīng)對(duì)路徑:①多源數(shù)據(jù)融合:結(jié)合傳統(tǒng)調(diào)查數(shù)據(jù)(如問卷調(diào)查)與大數(shù)據(jù)(如社交媒體),用小數(shù)據(jù)補(bǔ)充大數(shù)據(jù)的偏差(如用老年群體訪談數(shù)據(jù)修正社交媒體樣本的年齡失衡);②混合研究設(shè)計(jì):在發(fā)現(xiàn)相關(guān)性后,通過控制實(shí)驗(yàn)(如隨機(jī)對(duì)照試驗(yàn))或定性訪談驗(yàn)證因果關(guān)系(如發(fā)現(xiàn)“短視頻使用時(shí)長(zhǎng)與孤獨(dú)感正相關(guān)”后,訪談?dòng)脩籼骄渴恰肮陋?dú)導(dǎo)致刷視頻”還是“刷視頻導(dǎo)致孤獨(dú)”);③倫理框架構(gòu)建:遵循“最小必要”原則(僅采集研究所需數(shù)據(jù))、“去標(biāo)識(shí)化”處理(刪除能識(shí)別個(gè)體的信息)、“透明化”告知(向數(shù)據(jù)貢獻(xiàn)者說明用途),建立跨學(xué)科倫理審查委員會(huì);④可解釋性技術(shù)應(yīng)用:使用可解釋機(jī)器學(xué)習(xí)方法(如LIME、SHAP)分解模型決策過程,或結(jié)合質(zhì)性研究解讀量化結(jié)果(如用個(gè)案訪談?wù)f明模型中某變量的作用機(jī)制),提升結(jié)論的人文可理解性。五、實(shí)踐操作題(1)技術(shù)方案設(shè)計(jì):①數(shù)據(jù)采集:-文本類:收集地方戲曲的劇本、演出記錄、老藝人訪談錄音(通過田野調(diào)查錄制)、報(bào)刊中的戲曲評(píng)論(掃描歷史報(bào)紙并OCR識(shí)別);-多媒體類:拍攝現(xiàn)存戲曲演出視頻(4K高清錄制)、收集老唱片音頻(數(shù)字化轉(zhuǎn)碼)、整理戲曲臉譜/戲服的照片(多角度拍攝);-元數(shù)據(jù):記錄數(shù)據(jù)來源(如訪談對(duì)象姓名、演出時(shí)間地點(diǎn))、格式(如MP4、WAV)、權(quán)限(如是否開放訪問)等信息。②數(shù)據(jù)處理:-清洗:去除訪談錄音中的環(huán)境噪音(用Audacity軟件)、糾正OCR識(shí)別錯(cuò)誤(人工校對(duì)+規(guī)則匹配)、統(tǒng)一視頻格式為MP4(用FFmpeg);-結(jié)構(gòu)化:建立數(shù)據(jù)庫(如MySQL),將劇本按“劇種-朝代-角色”分類,將演出記錄按“時(shí)間-地點(diǎn)-劇團(tuán)”標(biāo)注,為多媒體文件添加標(biāo)簽(如“京劇”“武戲”);-標(biāo)準(zhǔn)化:制定元數(shù)據(jù)標(biāo)準(zhǔn)(參考DublinCore),確保所有數(shù)據(jù)包含“標(biāo)題、創(chuàng)建者、日期、描述”等核心字段。③數(shù)據(jù)分析:-文本分析:用Python的TextBlob(需定制戲曲領(lǐng)域情感詞典)分析報(bào)刊評(píng)論的情感傾向(判斷不同時(shí)期公眾對(duì)地方戲曲的態(tài)度變化);-社會(huì)網(wǎng)絡(luò)分析:構(gòu)建“戲曲藝人合作網(wǎng)絡(luò)”(節(jié)點(diǎn)為藝人,邊為共同演出記錄),分析核心藝人及其代際傳承關(guān)系;-多媒體分析:用OpenCV提取演出視頻中的動(dòng)作特征(如武戲中的打戲頻率),用音樂信息檢索(MIR)技術(shù)分析老唱片的旋律模式(識(shí)別劇種特色)。④展示:-可視化平臺(tái):開發(fā)Web應(yīng)用(前端用React,后端用Django),包含時(shí)間軸(展示戲曲發(fā)展關(guān)鍵事件)、地圖(標(biāo)注戲曲流行區(qū)域)、知識(shí)圖譜(呈現(xiàn)劇種-藝人-經(jīng)典劇目關(guān)聯(lián));-交互功能:允許用戶搜索特定劇目、播放演出視頻、下載劇本原文,設(shè)置“用戶貢獻(xiàn)”模塊(鼓勵(lì)戲迷上傳家庭收藏的老照片)。(2)“觀眾年齡結(jié)構(gòu)變遷”子課題分析流程:①數(shù)據(jù)收集:-歷史數(shù)據(jù):整理劇院1980-2020年的售票記錄(若紙質(zhì)需數(shù)字化)、老觀眾訪談中關(guān)于“同期觀眾年齡”的回憶;-現(xiàn)代數(shù)據(jù):通過劇院電子售票系統(tǒng)獲取2021-2024年的購票者年齡數(shù)據(jù)(需用戶授權(quán))、社交媒體中戲曲相關(guān)話題的用戶年齡標(biāo)簽(如微博用戶資料)。②數(shù)據(jù)處理:-歷史數(shù)據(jù)標(biāo)準(zhǔn)化:將訪談中的模糊描述(如“大多是中老年人”)轉(zhuǎn)化為年齡區(qū)間(如45歲以上占比80%),用插值法填補(bǔ)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 家裝買門合同范本
- 慶典雙方合同范本
- 帶牌轉(zhuǎn)讓合同范本
- 廉政潔合同范本
- 微信欠錢合同范本
- 就業(yè)居間合同范本
- 托管車輛合同范本
- 家教中介合同范本
- 工地機(jī)械合同范本
- 庭院綠化合同范本
- 鄭伯克段于鄢-2
- TCSUS-智能水表技術(shù)標(biāo)準(zhǔn)
- TSG特種設(shè)備安全技術(shù)規(guī)范TSGD-202工業(yè)管道安全技術(shù)規(guī)程
- 利用EXCEL畫風(fēng)機(jī)特性曲線-模版
- 人體工效評(píng)估程序
- 西南大學(xué)PPT 04 實(shí)用版答辯模板
- 國家開放大學(xué)電大《政治學(xué)原理》形考任務(wù)1及4網(wǎng)考題庫答案
- 管理百年智慧樹知到答案章節(jié)測(cè)試2023年
- 國家開放大學(xué)《刑法學(xué)(1)》形成性考核作業(yè)1-4參考答案
- 工藝美術(shù)專業(yè)課程配套練習(xí)二
- 2022“博學(xué)杯”全國幼兒識(shí)字與閱讀大賽選拔試卷
評(píng)論
0/150
提交評(píng)論