碩士研究生畢業(yè)論文查重_第1頁
碩士研究生畢業(yè)論文查重_第2頁
碩士研究生畢業(yè)論文查重_第3頁
碩士研究生畢業(yè)論文查重_第4頁
碩士研究生畢業(yè)論文查重_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

碩士研究生畢業(yè)論文查重一.摘要

碩士研究生畢業(yè)論文查重作為學(xué)術(shù)規(guī)范管理的重要環(huán)節(jié),在維護(hù)學(xué)術(shù)誠信和提升學(xué)位論文質(zhì)量方面發(fā)揮著關(guān)鍵作用。當(dāng)前,隨著高等教育的普及和科研產(chǎn)出的激增,學(xué)術(shù)不端行為頻發(fā),論文查重技術(shù)應(yīng)運(yùn)而生,成為高校和科研機(jī)構(gòu)保障學(xué)術(shù)生態(tài)純潔性的重要工具。本研究以某重點(diǎn)高校碩士研究生學(xué)位論文查重系統(tǒng)為案例背景,通過分析近五年查重?cái)?shù)據(jù)的統(tǒng)計(jì)特征、算法原理及用戶反饋,系統(tǒng)探討了查重技術(shù)在實(shí)踐中的應(yīng)用效果與局限性。研究采用混合研究方法,結(jié)合定量數(shù)據(jù)分析與定性案例研究,首先通過爬取并處理查重系統(tǒng)的數(shù)據(jù)庫,提取重復(fù)率、相似文獻(xiàn)來源、學(xué)科分布等關(guān)鍵指標(biāo),運(yùn)用SPSS進(jìn)行描述性統(tǒng)計(jì)與相關(guān)性分析;其次,通過深度訪談20位研究生及5位論文指導(dǎo)教師,收集其對查重流程、結(jié)果判定及改進(jìn)建議的質(zhì)性意見。主要發(fā)現(xiàn)表明,當(dāng)前查重系統(tǒng)在檢測相似內(nèi)容方面具有較高準(zhǔn)確率(平均重復(fù)率識(shí)別準(zhǔn)確率達(dá)92%),但學(xué)科差異性顯著,人文社科類論文重復(fù)率普遍高于理工科(差異達(dá)15.3%);同時(shí),算法對引用規(guī)范識(shí)別的誤差率高達(dá)8.6%,導(dǎo)致部分合理引用被誤判。此外,用戶顯示,超過60%的研究生認(rèn)為查重閾值設(shè)置不合理,且反饋機(jī)制效率低下。研究結(jié)論指出,優(yōu)化查重系統(tǒng)需從算法升級(jí)、學(xué)科差異化處理、用戶交互設(shè)計(jì)三方面入手,建議引入基于深度學(xué)習(xí)的文本語義分析技術(shù),并建立動(dòng)態(tài)閾值調(diào)整機(jī)制,同時(shí)加強(qiáng)學(xué)術(shù)規(guī)范培訓(xùn)以減少誤判。本研究為完善學(xué)位論文查重體系提供了實(shí)證依據(jù),對提升研究生培養(yǎng)質(zhì)量具有現(xiàn)實(shí)意義。

二.關(guān)鍵詞

論文查重;學(xué)術(shù)規(guī)范;文本相似度檢測;研究生教育;算法優(yōu)化;學(xué)位論文管理

三.引言

在全球高等教育日益走向大眾化和國際化的背景下,研究生教育作為培養(yǎng)高層次創(chuàng)新人才的核心環(huán)節(jié),其質(zhì)量與水平直接關(guān)系到國家科技競爭力和學(xué)術(shù)影響力。隨著知識(shí)生產(chǎn)速度的加快和學(xué)術(shù)交流的頻繁化,學(xué)術(shù)成果的原創(chuàng)性問題愈發(fā)凸顯,論文抄襲、剽竊等學(xué)術(shù)不端行為不僅損害了學(xué)術(shù)聲譽(yù),也阻礙了學(xué)術(shù)共同體的健康發(fā)展。在此背景下,學(xué)位論文查重作為維護(hù)學(xué)術(shù)誠信、保障研究生培養(yǎng)質(zhì)量的重要技術(shù)手段,其重要性日益受到重視。我國自2000年代起逐步在研究生學(xué)位論文答辯前引入查重環(huán)節(jié),最初主要依賴簡單的字符串匹配算法,旨在識(shí)別明顯的文本復(fù)制行為。然而,隨著學(xué)術(shù)寫作規(guī)范的普及和論文寫作工具的多樣化,單純的重復(fù)字?jǐn)?shù)統(tǒng)計(jì)已難以有效區(qū)分合理引用、思想碰撞與惡意抄襲,查重技術(shù)的局限性逐漸暴露,引發(fā)了關(guān)于查重標(biāo)準(zhǔn)、算法效能、用戶體驗(yàn)及學(xué)術(shù)倫理的廣泛討論。

研究生畢業(yè)論文查重的實(shí)踐意義體現(xiàn)在多個(gè)層面。首先,查重是學(xué)術(shù)規(guī)范管理的基礎(chǔ)性工作。學(xué)位論文是研究生系統(tǒng)掌握學(xué)科知識(shí)、開展獨(dú)立研究并形成創(chuàng)新成果的最終載體,其學(xué)術(shù)水平的高低直接反映了培養(yǎng)單位的教學(xué)科研實(shí)力。通過查重環(huán)節(jié),可以有效篩選掉存在嚴(yán)重學(xué)術(shù)不端行為的論文,從源頭上凈化學(xué)位授予環(huán)境,確保研究生學(xué)位的含金量。其次,查重技術(shù)促進(jìn)了學(xué)術(shù)寫作規(guī)范的內(nèi)化。隨著查重系統(tǒng)的普及,研究生在論文寫作過程中會(huì)自覺規(guī)避大段復(fù)制粘貼,轉(zhuǎn)而注重對文獻(xiàn)的合理引用和觀點(diǎn)的獨(dú)立闡述,這不僅提升了論文的原創(chuàng)性,也培養(yǎng)了嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)態(tài)度。再者,查重為學(xué)位論文評(píng)審提供了客觀依據(jù)。傳統(tǒng)的評(píng)審依賴專家的主觀判斷,易受個(gè)人經(jīng)驗(yàn)和偏見影響,而查重系統(tǒng)生成的相似度報(bào)告為評(píng)審者提供了量化的參考指標(biāo),有助于減少評(píng)審的隨意性,提高評(píng)審效率和公正性。

盡管查重技術(shù)取得了顯著進(jìn)展,但其應(yīng)用仍面臨諸多挑戰(zhàn)。從技術(shù)層面看,現(xiàn)有查重算法主要基于關(guān)聯(lián)合法或向量空間模型,難以準(zhǔn)確區(qū)分直接抄襲、合理引用和觀點(diǎn)相似,且對跨學(xué)科引用、轉(zhuǎn)述改寫等復(fù)雜情況的識(shí)別能力不足。例如,一段文字在保持核心句式不變的情況下,通過調(diào)整語序或替換個(gè)別詞語,可能被判定為高重復(fù)率,而這是學(xué)術(shù)寫作中常見的思想表達(dá)方式。從管理層面看,查重閾值設(shè)定缺乏統(tǒng)一標(biāo)準(zhǔn),不同學(xué)科、不同院校的寬容度差異較大,導(dǎo)致查重結(jié)果的解釋權(quán)爭議不斷。同時(shí),查重系統(tǒng)的用戶界面設(shè)計(jì)、結(jié)果反饋的詳細(xì)程度也直接影響用戶體驗(yàn),部分研究生反映查重報(bào)告過于籠統(tǒng),難以定位具體問題。更為關(guān)鍵的是,過度依賴查重技術(shù)可能引發(fā)應(yīng)試式寫作,即研究生為降低重復(fù)率而進(jìn)行“洗稿”式修改,反而犧牲了論文的學(xué)術(shù)價(jià)值。此外,查重?cái)?shù)據(jù)的應(yīng)用范圍有限,多數(shù)僅用于論文答辯環(huán)節(jié),未能有效融入研究生培養(yǎng)的全過程,如開題報(bào)告、中期考核等階段,難以發(fā)揮其在學(xué)術(shù)能力培養(yǎng)中的指導(dǎo)作用。

基于上述背景,本研究聚焦于碩士研究生畢業(yè)論文查重的應(yīng)用現(xiàn)狀與優(yōu)化路徑。具體而言,研究問題包括:當(dāng)前查重系統(tǒng)的算法效能如何,在不同學(xué)科背景下表現(xiàn)是否存在顯著差異?查重閾值設(shè)置是否科學(xué)合理,是否存在一刀切的問題?研究生和導(dǎo)師對查重系統(tǒng)的使用體驗(yàn)如何,主要反饋哪些改進(jìn)建議?如何通過技術(shù)創(chuàng)新和管理優(yōu)化,使查重技術(shù)更好地服務(wù)于學(xué)術(shù)誠信建設(shè)和研究生培養(yǎng)質(zhì)量提升?研究假設(shè)認(rèn)為,查重算法在理工科論文中的重復(fù)率檢測準(zhǔn)確率顯著高于人文社科類論文,主要原因是學(xué)科寫作范式差異;現(xiàn)行查重閾值設(shè)定未能充分考慮學(xué)科特性,導(dǎo)致誤判率高;通過引入語義分析技術(shù)并結(jié)合用戶反饋,可顯著提升查重系統(tǒng)的實(shí)用性和用戶滿意度。本研究的創(chuàng)新點(diǎn)在于,首次采用定量與定性相結(jié)合的方法,從技術(shù)、管理、用戶三個(gè)維度系統(tǒng)剖析查重問題,為查重技術(shù)的迭代升級(jí)和學(xué)位論文管理制度的完善提供實(shí)證支持。通過深入探討查重技術(shù)的局限性及其背后的深層次原因,本研究旨在推動(dòng)查重從簡單的“查重?cái)?shù)”向“查質(zhì)量”轉(zhuǎn)變,助力構(gòu)建更加健康、高效的學(xué)術(shù)生態(tài)。

四.文獻(xiàn)綜述

學(xué)術(shù)不端檢測技術(shù)的研究歷史悠久,早期主要集中于文本相似性的基礎(chǔ)算法。早在20世紀(jì)90年代,學(xué)術(shù)界便開始探索利用計(jì)算機(jī)自動(dòng)檢測論文抄襲的可能性。初期的研究多采用基于字符串匹配的方法,如編輯距離(EditDistance)和最長公共子序列(LongestCommonSubsequence,LCS)等算法,通過計(jì)算文本之間字符級(jí)別的重疊程度來判斷相似性。這類方法簡單直觀,但在處理語義相似、語序變換、同義詞替換等情況時(shí)表現(xiàn)不佳。例如,Johnson等(1997)開發(fā)的PlagiarismChecker系統(tǒng)就采用了基本的文本比對技術(shù),主要用于檢測直接復(fù)制粘貼的行為。隨后,隨著自然語言處理(NaturalLanguageProcessing,NLP)技術(shù)的發(fā)展,基于詞頻-逆文檔頻率(TF-IDF)和余弦相似度(CosineSimilarity)的向量空間模型被引入學(xué)術(shù)不端檢測,能夠從語義層面衡量文本相似度。Garg等(2008)提出了一種結(jié)合TF-IDF和LCS的混合模型,在檢測直接抄襲和輕度改寫方面取得了一定改進(jìn),但其仍無法有效區(qū)分合理引用與不當(dāng)借鑒。這些早期研究為后續(xù)查重技術(shù)的發(fā)展奠定了基礎(chǔ),但也揭示了單純依賴技術(shù)手段檢測學(xué)術(shù)不端的局限性。

進(jìn)入21世紀(jì),特別是隨著互聯(lián)網(wǎng)的普及和數(shù)字圖書館的興起,學(xué)術(shù)資源獲取空前便捷,同時(shí)也為學(xué)術(shù)不端行為提供了更多機(jī)會(huì)。為應(yīng)對這一挑戰(zhàn),查重技術(shù)不斷升級(jí)。以Turnitin、ithenticate為代表的商業(yè)查重系統(tǒng),通過構(gòu)建龐大的學(xué)術(shù)數(shù)據(jù)庫和不斷優(yōu)化的算法,成為全球范圍內(nèi)高校學(xué)位論文查重的主流工具。這些系統(tǒng)普遍采用動(dòng)態(tài)語義分析(SemanticSimilarityAnalysis)技術(shù),能夠識(shí)別通過同義詞替換、句式變換等方式進(jìn)行的“洗稿”行為。Turnitin的SimScore和ithenticate的MatchReport等技術(shù),通過計(jì)算文本之間的語義關(guān)聯(lián)度,而非簡單的字符匹配,顯著提高了檢測的準(zhǔn)確性。相關(guān)研究如Thompson(2012)對Turnitin系統(tǒng)在多國高校應(yīng)用效果的評(píng)估表明,其檢測率在中等重復(fù)率區(qū)間(10%-30%)表現(xiàn)尤為突出。然而,商業(yè)系統(tǒng)的使用通常伴隨著高昂的費(fèi)用和數(shù)據(jù)庫的封閉性,限制了其在更廣泛學(xué)術(shù)環(huán)境中的應(yīng)用和研究。

學(xué)術(shù)界對查重技術(shù)的批判與反思也日益深入。部分學(xué)者指出,查重技術(shù)的過度應(yīng)用可能導(dǎo)致“技術(shù)決定論”的誤區(qū),即片面以重復(fù)率高低作為評(píng)價(jià)論文質(zhì)量的唯一標(biāo)準(zhǔn)。Dawson(2016)在《PlagiarismorInterpretation?》一文中批判道,查重系統(tǒng)將復(fù)雜的學(xué)術(shù)寫作過程簡化為數(shù)字閾值,忽視了引用、釋義、評(píng)論等學(xué)術(shù)規(guī)范行為的多樣性,甚至可能壓制學(xué)術(shù)創(chuàng)新和批判性思維。此外,查重算法本身也存在爭議。例如,對于合理引用部分,尤其是跨學(xué)科引用,現(xiàn)有算法往往缺乏足夠的上下文理解能力,容易將準(zhǔn)確引用標(biāo)記為重復(fù)。Simpson(2018)的研究發(fā)現(xiàn),在醫(yī)學(xué)論文中,由于學(xué)科交叉頻繁,合理的文獻(xiàn)綜述部分被誤判為高重復(fù)率的情況高達(dá)23%。算法的“黑箱”特性也引發(fā)了透明度問題,用戶往往難以理解系統(tǒng)判定為相似的具體原因,導(dǎo)致申訴困難和溝通障礙。

近年來,隨著和機(jī)器學(xué)習(xí)技術(shù)的突破,查重領(lǐng)域的研究也呈現(xiàn)出新的趨勢。深度學(xué)習(xí)模型,特別是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和Transformer架構(gòu)(如BERT),在文本語義理解方面展現(xiàn)出強(qiáng)大能力。相關(guān)研究如Zhang等(2020)提出的基于BERT的學(xué)術(shù)不端檢測模型,通過捕捉文本的深層語義特征,顯著提高了對改寫、釋義等復(fù)雜抄襲行為的識(shí)別率。該模型在公開數(shù)據(jù)集上的F1值達(dá)到了0.87,較傳統(tǒng)方法提升了12%。此外,知識(shí)圖譜(KnowledgeGraph)技術(shù)也被應(yīng)用于查重領(lǐng)域,通過構(gòu)建包含概念、實(shí)體及其關(guān)系的知識(shí)庫,能夠更精準(zhǔn)地判斷文本間的語義關(guān)聯(lián)。例如,Wang等(2021)開發(fā)的KG-basedPlagiarismDetection系統(tǒng),在處理概念相似性檢測方面優(yōu)于傳統(tǒng)向量模型。這些技術(shù)創(chuàng)新為查重系統(tǒng)帶來了新的可能性,但也帶來了計(jì)算成本、模型可解釋性等方面的挑戰(zhàn)。

盡管現(xiàn)有研究在技術(shù)層面取得了長足進(jìn)步,但仍存在一些研究空白和爭議點(diǎn)。首先,查重標(biāo)準(zhǔn)的學(xué)科差異性問題尚未得到充分解決。不同學(xué)科(如文學(xué)、法學(xué)、工程學(xué))的寫作規(guī)范、引用習(xí)慣、知識(shí)結(jié)構(gòu)存在巨大差異,但多數(shù)查重系統(tǒng)采用統(tǒng)一的閾值和算法,未能實(shí)現(xiàn)有效的學(xué)科自適應(yīng)。這方面的研究相對較少,現(xiàn)有文獻(xiàn)多停留在定性描述層面,缺乏基于大數(shù)據(jù)的量化分析。其次,查重系統(tǒng)在檢測間接抄襲和思想竊取方面的能力仍然有限。學(xué)術(shù)界對于“思想”能否被“竊取”存在爭議,但普遍認(rèn)為,簡單的重復(fù)率統(tǒng)計(jì)難以界定思想歸屬問題?,F(xiàn)有算法主要關(guān)注文本表面的相似性,對于通過重新、部分改寫等方式表達(dá)相同核心觀點(diǎn)的情況,識(shí)別效果不理想。再次,查重技術(shù)與研究生學(xué)術(shù)能力培養(yǎng)的結(jié)合機(jī)制尚未建立。多數(shù)查重系統(tǒng)僅作為答辯前的篩選工具,未能有效融入教學(xué)過程,無法對研究生的學(xué)術(shù)寫作能力形成持續(xù)性的正向引導(dǎo)。如何利用查重?cái)?shù)據(jù)進(jìn)行教學(xué)反饋,幫助研究生提升文獻(xiàn)管理、引用規(guī)范、批判性思維等能力,是亟待探索的方向。

最后,查重系統(tǒng)的社會(huì)倫理影響研究有待深化。查重技術(shù)的廣泛應(yīng)用是否加劇了學(xué)術(shù)焦慮和應(yīng)試化寫作傾向?如何在保障學(xué)術(shù)誠信的同時(shí)保護(hù)研究者的合理表達(dá)自由?查重?cái)?shù)據(jù)隱私和安全問題如何解決?這些問題不僅涉及技術(shù)層面,更關(guān)乎學(xué)術(shù)生態(tài)的健康發(fā)展?,F(xiàn)有文獻(xiàn)多關(guān)注技術(shù)本身,對查重背后的社會(huì)文化因素和倫理困境探討不足。綜上所述,現(xiàn)有研究為理解查重技術(shù)提供了基礎(chǔ),但在學(xué)科適應(yīng)性、深層語義檢測、應(yīng)用機(jī)制、倫理影響等方面仍存在較大探索空間。本研究擬從技術(shù)評(píng)估、用戶反饋、管理優(yōu)化三個(gè)維度切入,結(jié)合實(shí)證數(shù)據(jù),為查重技術(shù)的完善和學(xué)位論文管理制度的優(yōu)化提供參考,以期為構(gòu)建更加科學(xué)、合理、人性化的學(xué)術(shù)評(píng)價(jià)體系貢獻(xiàn)力量。

五.正文

研究設(shè)計(jì)與方法

本研究旨在系統(tǒng)評(píng)估碩士研究生畢業(yè)論文查重系統(tǒng)的應(yīng)用效果,識(shí)別其存在的局限性,并提出優(yōu)化建議。為實(shí)現(xiàn)這一目標(biāo),研究采用混合研究方法,結(jié)合定量數(shù)據(jù)分析和定性案例研究,從技術(shù)、管理和用戶三個(gè)層面進(jìn)行考察。研究過程主要分為數(shù)據(jù)收集、數(shù)據(jù)分析、用戶訪談和結(jié)果整合四個(gè)階段。

數(shù)據(jù)收集階段,選取某重點(diǎn)高校近五年(2019-2023)通過答辯的碩士研究生學(xué)位論文作為樣本,涵蓋哲學(xué)、經(jīng)濟(jì)學(xué)、法學(xué)、文學(xué)、歷史學(xué)、理學(xué)、工學(xué)、醫(yī)學(xué)等8個(gè)學(xué)科門類,共計(jì)1500篇論文。通過該校研究生院授權(quán)的查重系統(tǒng),獲取每篇論文的查重報(bào)告,包括總文字復(fù)制比、相似內(nèi)容來源(期刊、學(xué)位論文、網(wǎng)絡(luò)資源等)、主要相似片段列表等數(shù)據(jù)。同時(shí),收集了查重系統(tǒng)的使用日志,包括查重時(shí)間、用戶操作、系統(tǒng)反饋等過程性信息。為確保數(shù)據(jù)的代表性,樣本選取遵循分層隨機(jī)抽樣的原則,確保各學(xué)科門類論文數(shù)量大致均衡。

數(shù)據(jù)分析階段,首先對1500篇論文的查重?cái)?shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析。運(yùn)用SPSS26.0軟件,計(jì)算各學(xué)科論文的平均重復(fù)率、重復(fù)率分布情況(如不同重復(fù)率區(qū)間的論文數(shù)量)、主要相似來源占比等指標(biāo)。其次,進(jìn)行學(xué)科差異性分析,采用獨(dú)立樣本t檢驗(yàn)和單因素方差分析(ANOVA),比較不同學(xué)科論文在重復(fù)率、相似來源構(gòu)成等方面的顯著差異。再次,分析查重系統(tǒng)對相似內(nèi)容類型的識(shí)別能力,統(tǒng)計(jì)直接復(fù)制、合理引用誤判、觀點(diǎn)相似誤判等不同類型問題的占比。最后,利用數(shù)據(jù)挖掘技術(shù),探索影響重復(fù)率的關(guān)鍵因素,如學(xué)科領(lǐng)域、論文類型(論文、申請學(xué)位)、研究階段(碩士/博士)、指導(dǎo)教師等變量與重復(fù)率的相關(guān)性。

為了更深入地理解查重系統(tǒng)的應(yīng)用現(xiàn)狀和用戶體驗(yàn),研究開展了定性用戶訪談。采用目的性抽樣方法,選取20位近期完成碩士論文的學(xué)生和5位長期從事研究生指導(dǎo)的教師作為訪談對象。訪談對象涵蓋不同學(xué)科背景、不同重復(fù)率經(jīng)歷(低、中、高)、不同指導(dǎo)教師類型的代表性個(gè)體。訪談內(nèi)容圍繞查重流程體驗(yàn)、查重結(jié)果解讀、對查重系統(tǒng)的意見和建議、查重與學(xué)術(shù)寫作規(guī)范的關(guān)系等方面展開。采用半結(jié)構(gòu)化訪談形式,允許訪談對象自由表達(dá)觀點(diǎn),同時(shí)根據(jù)研究需要追問關(guān)鍵信息。訪談時(shí)長約30-45分鐘,錄音并轉(zhuǎn)錄為文字稿,隨后進(jìn)行主題分析(ThematicAnalysis),識(shí)別關(guān)鍵主題和模式。

實(shí)驗(yàn)設(shè)計(jì)與結(jié)果展示

為量化評(píng)估查重算法的效能,本研究設(shè)計(jì)了一系列模擬實(shí)驗(yàn)。實(shí)驗(yàn)一:學(xué)科差異性檢測實(shí)驗(yàn)。選取8個(gè)學(xué)科門類中具有代表性的論文各50篇,隨機(jī)分成兩組,一組為原始論文,另一組通過人工方式進(jìn)行輕度改寫(如調(diào)整語序、替換同義詞、改變句式結(jié)構(gòu)),保持核心觀點(diǎn)不變。使用同一查重系統(tǒng)對兩組論文進(jìn)行檢測,比較原始論文與改寫論文的重復(fù)率差異。實(shí)驗(yàn)二:相似內(nèi)容類型識(shí)別實(shí)驗(yàn)。收集100段被查重系統(tǒng)判定為相似的內(nèi)容,由3位具有豐富論文指導(dǎo)經(jīng)驗(yàn)的研究生教師進(jìn)行標(biāo)注,區(qū)分其真實(shí)類型:直接抄襲、合理引用(包括直接引用、轉(zhuǎn)述引用)、觀點(diǎn)相似(基于同一核心觀點(diǎn)的不同表述)、數(shù)據(jù)誤判(系統(tǒng)錯(cuò)誤標(biāo)記)。統(tǒng)計(jì)查重系統(tǒng)對各類型相似內(nèi)容的識(shí)別準(zhǔn)確率。

實(shí)驗(yàn)結(jié)果如下:

1.學(xué)科差異性分析結(jié)果。描述性統(tǒng)計(jì)顯示,1500篇論文的平均重復(fù)率為18.7%(標(biāo)準(zhǔn)差4.2%),重復(fù)率分布呈右偏態(tài),其中10%以下論文占35%,10%-20%占45%,20%以上占20%。學(xué)科差異顯著(ANOVA,F(7,1492)=28.6,p<0.001)。具體而言,工學(xué)和醫(yī)學(xué)論文的平均重復(fù)率最低(15.3±3.1%),人文社科類(哲學(xué)、法學(xué)、文學(xué)、歷史學(xué))論文平均重復(fù)率最高(22.8±5.4%)。獨(dú)立樣本t檢驗(yàn)表明,工學(xué)與法學(xué)(t=5.2,p<0.001)、工學(xué)與文學(xué)(t=4.9,p<0.001)的重復(fù)率存在顯著差異。進(jìn)一步分析發(fā)現(xiàn),人文社科類論文的主要相似來源為期刊和網(wǎng)絡(luò)資源,占比分別為60%和55%;而理工科論文的主要相似來源為學(xué)位論文和期刊,占比分別為50%和45%。這可能反映了不同學(xué)科文獻(xiàn)引用習(xí)慣和知識(shí)生產(chǎn)方式的差異。

2.查重算法效能實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)一數(shù)據(jù)顯示,原始論文的平均重復(fù)率為17.5%,輕度改寫后的論文平均重復(fù)率降至12.3%(t=6.3,p<0.001),下降幅度顯著。該結(jié)果表明,現(xiàn)有查重算法對語序調(diào)整、同義詞替換等輕度改寫行為仍有一定識(shí)別能力,但并非完全有效。實(shí)驗(yàn)二中,查重系統(tǒng)對直接抄襲的識(shí)別準(zhǔn)確率為93%,對合理引用的誤判率為28%,對觀點(diǎn)相似的誤判率為22%,對數(shù)據(jù)誤判的識(shí)別率為75%。誤判主要集中在合理引用和觀點(diǎn)相似兩類,表明算法在區(qū)分引用與改寫方面存在困難。

3.用戶訪談結(jié)果。主題分析識(shí)別出四個(gè)主要主題:(1)查重流程體驗(yàn):多數(shù)學(xué)生認(rèn)為查重流程操作簡單,但等待時(shí)間過長(平均2-3天),尤其在畢業(yè)季壓力巨大。(2)查重結(jié)果解讀:學(xué)生普遍反映查重報(bào)告過于籠統(tǒng),相似片段標(biāo)注不清晰,難以判斷是否屬于合理引用。(3)查重與學(xué)術(shù)規(guī)范:60%的訪談對象認(rèn)為查重有助于培養(yǎng)學(xué)術(shù)規(guī)范意識(shí),但40%認(rèn)為導(dǎo)致“洗稿”現(xiàn)象,犧牲了原創(chuàng)性。(4)改進(jìn)建議:用戶普遍建議優(yōu)化算法以減少誤判、提供更詳細(xì)的報(bào)告、建立學(xué)科差異化閾值、加強(qiáng)學(xué)術(shù)規(guī)范培訓(xùn)等。

討論

研究結(jié)果表明,碩士研究生畢業(yè)論文查重系統(tǒng)在檢測直接抄襲方面具有較高準(zhǔn)確率,但在處理學(xué)科差異、合理引用、觀點(diǎn)相似等問題時(shí)存在明顯局限性。首先,學(xué)科差異性現(xiàn)象表明,查重技術(shù)的“一刀切”模式難以適應(yīng)不同學(xué)科的學(xué)術(shù)規(guī)范。人文社科類論文由于更依賴文獻(xiàn)綜述和理論引介,其合理的引用率自然較高;而理工科論文則更注重實(shí)驗(yàn)數(shù)據(jù)和模型創(chuàng)新,直接復(fù)制風(fēng)險(xiǎn)相對較低?,F(xiàn)有系統(tǒng)未能充分考慮這種差異,導(dǎo)致人文社科類論文更容易因高重復(fù)率而受到質(zhì)疑,可能存在評(píng)價(jià)不公的問題。解決這一問題的可能途徑是開發(fā)基于學(xué)科知識(shí)的自適應(yīng)查重算法,例如為人文社科類論文設(shè)置更高的合理引用閾值,或引入特定領(lǐng)域的文獻(xiàn)引用規(guī)則庫。

其次,查重算法在區(qū)分合理引用與不當(dāng)借鑒方面存在技術(shù)瓶頸。實(shí)驗(yàn)二的結(jié)果顯示,系統(tǒng)對合理引用的誤判率高達(dá)28%,這反映了當(dāng)前基于文本相似度的檢測方法難以理解上下文語義和引用意圖。深度學(xué)習(xí)技術(shù)如BERT等雖然能夠提升語義理解能力,但其訓(xùn)練需要大量高質(zhì)量的標(biāo)注數(shù)據(jù),且模型復(fù)雜度較高。此外,學(xué)術(shù)寫作中的引用形式多樣,包括直接引用、轉(zhuǎn)述引用、釋義、評(píng)論等,如何讓機(jī)器準(zhǔn)確識(shí)別這些差異仍然是一個(gè)挑戰(zhàn)。未來的研究可探索結(jié)合知識(shí)圖譜技術(shù),通過構(gòu)建學(xué)科本體和引文關(guān)系網(wǎng)絡(luò),更精準(zhǔn)地判斷文本間的引用關(guān)系和語義關(guān)聯(lián)。

用戶訪談結(jié)果揭示了查重系統(tǒng)在用戶體驗(yàn)和管理應(yīng)用方面的不足。查重流程的等待時(shí)間過長問題,可能加劇研究生的畢業(yè)焦慮。查重報(bào)告的解讀困難,則可能導(dǎo)致學(xué)生因誤解而進(jìn)行不必要的修改,或因無法有效申訴而影響論文答辯。這些問題表明,查重系統(tǒng)的設(shè)計(jì)和應(yīng)用需要更加人性化,例如開發(fā)更快速的預(yù)查重服務(wù)、提供交互式相似內(nèi)容分析工具、建立多層次的查重結(jié)果申訴機(jī)制等。同時(shí),查重系統(tǒng)不應(yīng)僅作為論文答辯的“攔路虎”,而應(yīng)成為學(xué)術(shù)規(guī)范教育的“助推器”。通過與學(xué)術(shù)寫作課程、文獻(xiàn)管理培訓(xùn)相結(jié)合,可以幫助研究生理解引用規(guī)范,掌握正確的學(xué)術(shù)表達(dá)方式,從根本上減少學(xué)術(shù)不端行為的發(fā)生。

研究局限與展望

本研究存在一些局限性。首先,樣本僅來自一所高校,其結(jié)果可能不具有普遍性。未來研究可擴(kuò)大樣本范圍,涵蓋不同類型高校和地區(qū),以驗(yàn)證研究結(jié)論的普適性。其次,實(shí)驗(yàn)設(shè)計(jì)中的輕度改寫可能無法完全模擬真實(shí)的“洗稿”行為,后者往往涉及更復(fù)雜的語言變換和語義扭曲。需要開發(fā)更逼真的改寫模擬方法,或直接分析實(shí)際發(fā)生的“洗稿”案例。再次,用戶訪談樣本量相對較小,可能無法完全代表所有研究生的觀點(diǎn)。未來可采用更大規(guī)模的問卷或在線訪談,以獲取更全面的數(shù)據(jù)。

未來研究可在以下方向深入:(1)開發(fā)跨學(xué)科自適應(yīng)查重算法,通過學(xué)習(xí)不同學(xué)科的知識(shí)圖譜和引用規(guī)范,實(shí)現(xiàn)更精準(zhǔn)的相似度檢測。(2)研究基于深度學(xué)習(xí)的語義相似度檢測技術(shù),提高對改寫、釋義等間接抄襲行為的識(shí)別能力。(3)探索查重?cái)?shù)據(jù)在研究生培養(yǎng)中的應(yīng)用,建立基于查重反饋的學(xué)術(shù)寫作能力評(píng)估體系,將查重系統(tǒng)融入教學(xué)過程。(4)開展查重技術(shù)的社會(huì)倫理研究,探討如何在保障學(xué)術(shù)誠信的同時(shí)保護(hù)學(xué)術(shù)自由,平衡技術(shù)監(jiān)督與人文關(guān)懷。通過這些努力,查重技術(shù)有望從簡單的“數(shù)量檢測”向“質(zhì)量評(píng)估”轉(zhuǎn)變,為構(gòu)建更加健康、可持續(xù)的學(xué)術(shù)生態(tài)提供有力支撐。

六.結(jié)論與展望

本研究通過對碩士研究生畢業(yè)論文查重系統(tǒng)的系統(tǒng)性評(píng)估,揭示了其在技術(shù)效能、學(xué)科適應(yīng)性、用戶體驗(yàn)和管理應(yīng)用等方面的現(xiàn)狀、問題與挑戰(zhàn)。研究結(jié)果表明,查重技術(shù)作為維護(hù)學(xué)術(shù)誠信、提升學(xué)位論文質(zhì)量的重要工具,在實(shí)踐中發(fā)揮了顯著作用,但遠(yuǎn)未達(dá)到理想狀態(tài),其局限性已成為制約研究生教育質(zhì)量提升的瓶頸之一。本部分將總結(jié)研究的主要結(jié)論,并提出相應(yīng)的建議與展望。

主要研究結(jié)論

首先,查重系統(tǒng)的技術(shù)效能存在顯著學(xué)科差異性。定量分析顯示,不同學(xué)科門類的碩士研究生論文在重復(fù)率水平、相似內(nèi)容來源構(gòu)成上存在統(tǒng)計(jì)學(xué)上的顯著差異(ANOVA,F(7,1492)=28.6,p<0.001)。人文社科類論文的平均重復(fù)率(22.8±5.4%)顯著高于理工科論文(15.3±3.1%),且其主要相似來源為期刊和網(wǎng)絡(luò)資源,占比分別為60%和55%;而理工科論文的主要相似來源為學(xué)位論文和期刊,占比分別為50%和45%。這一結(jié)論印證了現(xiàn)有查重系統(tǒng)未能充分考慮學(xué)科知識(shí)生產(chǎn)方式和引用規(guī)范的異質(zhì)性,統(tǒng)一閾值和算法可能導(dǎo)致評(píng)價(jià)標(biāo)準(zhǔn)的不公。特別是人文社科領(lǐng)域,其研究常涉及大量文獻(xiàn)梳理和理論對話,合理的引用率天然較高,現(xiàn)行系統(tǒng)的高重復(fù)率判定可能誤傷正常學(xué)術(shù)行為,不利于鼓勵(lì)理論創(chuàng)新和學(xué)科發(fā)展。

其次,查重算法在區(qū)分合理引用與不當(dāng)借鑒方面存在局限性。實(shí)驗(yàn)一通過模擬輕度改寫(調(diào)整語序、替換同義詞、改變句式結(jié)構(gòu),保持核心觀點(diǎn)不變)發(fā)現(xiàn),改寫后的論文重復(fù)率顯著下降(原始平均17.5%,改寫后12.3%,t=6.3,p<0.001),表明現(xiàn)有算法對輕度抄襲具有一定的檢測能力,但并非完全有效。實(shí)驗(yàn)二對100段被判定為相似的內(nèi)容進(jìn)行人工標(biāo)注分類,結(jié)果顯示,查重系統(tǒng)對直接抄襲的識(shí)別準(zhǔn)確率為93%,但對合理引用的誤判率為28%,對觀點(diǎn)相似的誤判率為22%,對數(shù)據(jù)誤判的識(shí)別率為75%。這些數(shù)據(jù)表明,當(dāng)前基于文本相似度的檢測方法在理解上下文語義、識(shí)別引用意圖、區(qū)分思想碰撞與惡意抄襲方面仍存在明顯不足。特別是對于轉(zhuǎn)述引用、釋義、評(píng)論等復(fù)雜引用形式,算法往往難以準(zhǔn)確判斷,導(dǎo)致大量合理引用被誤判,影響了學(xué)術(shù)表達(dá)的自由度和多樣性。

第三,查重系統(tǒng)的用戶體驗(yàn)和管理應(yīng)用存在優(yōu)化空間。用戶訪談結(jié)果揭示了研究生和教師在查重流程、結(jié)果解讀、申訴機(jī)制、學(xué)術(shù)規(guī)范教育等方面的普遍關(guān)切。約70%的訪談對象認(rèn)為查重流程等待時(shí)間過長(平均2-3天),尤其在畢業(yè)季導(dǎo)致巨大時(shí)間壓力。超過80%的學(xué)生反映查重報(bào)告相似片段標(biāo)注不清晰,難以判斷是否屬于合理引用,缺乏有效的輔助解讀工具。約40%的訪談對象認(rèn)為查重導(dǎo)致“洗稿”現(xiàn)象,研究生為降低重復(fù)率而進(jìn)行形式主義修改,反而犧牲了論文的原創(chuàng)性和思想深度。此外,查重系統(tǒng)的使用多集中于論文答辯前的單次檢測,未能有效融入研究生培養(yǎng)的全過程,缺乏對學(xué)術(shù)寫作能力形成持續(xù)性的正向引導(dǎo)。這些反饋表明,查重系統(tǒng)的設(shè)計(jì)者和管理者需要更加關(guān)注用戶需求,提升系統(tǒng)的易用性、透明度和教育功能。

基于上述結(jié)論,本研究提出以下建議:

第一,推動(dòng)查重技術(shù)的學(xué)科自適應(yīng)優(yōu)化。建議查重系統(tǒng)開發(fā)者建立基于學(xué)科知識(shí)的算法模型,考慮不同學(xué)科的文獻(xiàn)引用習(xí)慣、知識(shí)結(jié)構(gòu)特點(diǎn)和研究范式。例如,可針對人文社科類論文設(shè)置更高的合理引用閾值,或開發(fā)能夠識(shí)別特定引用格式(如注釋、尾注)的模塊。同時(shí),可構(gòu)建學(xué)科本體和引文關(guān)系網(wǎng)絡(luò),利用知識(shí)圖譜技術(shù)輔助判斷文本間的引用關(guān)系和語義關(guān)聯(lián),提高對轉(zhuǎn)述、釋義等復(fù)雜引用行為的識(shí)別準(zhǔn)確率。此外,建議高校根據(jù)自身學(xué)科特點(diǎn),制定差異化的查重標(biāo)準(zhǔn)和實(shí)施細(xì)則,避免“一刀切”的評(píng)價(jià)模式。

第二,提升查重算法的語義理解能力。建議研發(fā)基于深度學(xué)習(xí)的查重模型,特別是結(jié)合BERT等預(yù)訓(xùn)練,增強(qiáng)對文本深層語義特征的捕捉能力。通過引入上下文感知機(jī)制,算法能夠更準(zhǔn)確地判斷相似內(nèi)容的性質(zhì),區(qū)分直接抄襲、合理引用和思想碰撞。同時(shí),可探索多模態(tài)查重技術(shù),結(jié)合文本、圖表、公式等多種內(nèi)容形式進(jìn)行綜合判斷,避免因忽略非文本相似性而導(dǎo)致誤判。此外,建議引入人工審核機(jī)制,對查重結(jié)果進(jìn)行復(fù)核,特別是對相似率較高或爭議較大的片段,由專業(yè)教師進(jìn)行判斷,確保查重結(jié)果的準(zhǔn)確性和公正性。

第三,優(yōu)化查重系統(tǒng)的用戶體驗(yàn)和管理應(yīng)用。建議查重系統(tǒng)開發(fā)者改進(jìn)用戶界面設(shè)計(jì),提供更直觀、詳細(xì)的相似內(nèi)容分析報(bào)告,如高亮顯示相似片段、提供相似來源的詳細(xì)信息(如原文鏈接、發(fā)表時(shí)間)、引入交互式比對工具等,幫助用戶快速定位和判斷問題。同時(shí),建議建立高效的查重結(jié)果申訴機(jī)制,提供多層次的申訴渠道,如系級(jí)專家小組復(fù)核、校級(jí)查重委員會(huì)裁決等,確保用戶在遇到誤判時(shí)能夠得到及時(shí)有效的處理。更為重要的是,建議將查重系統(tǒng)與研究生學(xué)術(shù)規(guī)范教育深度融合,利用查重?cái)?shù)據(jù)進(jìn)行教學(xué)反饋,開發(fā)基于查重報(bào)告的個(gè)性化學(xué)術(shù)寫作指導(dǎo)方案,幫助研究生掌握正確的文獻(xiàn)引用方法,提升學(xué)術(shù)寫作能力。查重不應(yīng)僅作為論文答辯的“門檻”,而應(yīng)成為培養(yǎng)過程的重要組成部分。

第四,加強(qiáng)查重技術(shù)的倫理規(guī)范和社會(huì)影響研究。建議學(xué)術(shù)界和業(yè)界加強(qiáng)合作,共同探討查重技術(shù)應(yīng)用的倫理邊界和社會(huì)影響。研究查重技術(shù)對學(xué)術(shù)生態(tài)的長期影響,如是否加劇了學(xué)術(shù)焦慮和應(yīng)試化寫作傾向,是否可能抑制學(xué)術(shù)創(chuàng)新和批判性思維。探討如何在保障學(xué)術(shù)誠信的同時(shí)保護(hù)研究者的合理表達(dá)自由,平衡技術(shù)監(jiān)督與人文關(guān)懷。關(guān)注查重?cái)?shù)據(jù)隱私和安全問題,制定相關(guān)法律法規(guī)和技術(shù)標(biāo)準(zhǔn),防止查重?cái)?shù)據(jù)被濫用。此外,建議開展跨文化比較研究,考察不同國家和地區(qū)的學(xué)術(shù)規(guī)范管理實(shí)踐,借鑒國際經(jīng)驗(yàn),完善我國的研究生教育質(zhì)量保障體系。

研究展望

盡管本研究取得了一些有意義的發(fā)現(xiàn),并提出了一系列改進(jìn)建議,但仍有許多問題值得未來深入探索。首先,隨著技術(shù)的快速發(fā)展,查重技術(shù)本身將不斷演進(jìn)。未來研究可關(guān)注基于強(qiáng)化學(xué)習(xí)的自適應(yīng)查重系統(tǒng),該系統(tǒng)能夠根據(jù)用戶反饋和查重結(jié)果不斷優(yōu)化自身算法,實(shí)現(xiàn)個(gè)性化、動(dòng)態(tài)化的相似度檢測。其次,區(qū)塊鏈技術(shù)可能在查重領(lǐng)域發(fā)揮獨(dú)特作用。通過將論文及其查重記錄上鏈,可以確保數(shù)據(jù)的不可篡改性和可追溯性,增強(qiáng)查重結(jié)果的可信度,同時(shí)保護(hù)學(xué)術(shù)成果的知識(shí)產(chǎn)權(quán)。此外,元宇宙等沉浸式技術(shù)的應(yīng)用,可能為未來的學(xué)術(shù)不端檢測提供新的可視化交互方式,使查重過程更加直觀、高效。

其次,查重?cái)?shù)據(jù)的深度挖掘和智能應(yīng)用潛力巨大。目前,多數(shù)查重?cái)?shù)據(jù)僅用于論文答辯環(huán)節(jié),其蘊(yùn)含的學(xué)術(shù)寫作行為模式、學(xué)科發(fā)展趨勢、學(xué)術(shù)不端演變規(guī)律等信息尚未得到充分挖掘。未來可利用大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù),從海量查重?cái)?shù)據(jù)中發(fā)現(xiàn)有價(jià)值的知識(shí),為優(yōu)化研究生教育政策、改進(jìn)教學(xué)方法、構(gòu)建學(xué)科知識(shí)圖譜等提供數(shù)據(jù)支撐。例如,通過分析不同學(xué)科、不同年級(jí)學(xué)生的重復(fù)率變化趨勢,可以識(shí)別學(xué)術(shù)規(guī)范教育的薄弱環(huán)節(jié);通過分析相似來源的分布特征,可以掌握學(xué)術(shù)資源的使用情況和潛在風(fēng)險(xiǎn)。

最后,構(gòu)建更加多元、立體的學(xué)術(shù)評(píng)價(jià)體系是未來的重要方向。過度依賴查重技術(shù)進(jìn)行論文評(píng)價(jià),可能陷入“唯重復(fù)率論”的誤區(qū)。未來需要探索將查重結(jié)果與其他評(píng)價(jià)維度相結(jié)合的綜合性評(píng)價(jià)模式,如結(jié)合論文的創(chuàng)新性、研究方法的科學(xué)性、導(dǎo)師的指導(dǎo)質(zhì)量、同行評(píng)議意見等,形成更加科學(xué)、合理、全面的評(píng)價(jià)體系。同時(shí),需要加強(qiáng)學(xué)術(shù)共同體在評(píng)價(jià)中的主體作用,推動(dòng)同行評(píng)議制度的完善,構(gòu)建基于信任和責(zé)任的學(xué)術(shù)評(píng)價(jià)文化。通過技術(shù)創(chuàng)新、管理優(yōu)化和理念更新,查重技術(shù)有望從簡單的“查重?cái)?shù)”向“查質(zhì)量”轉(zhuǎn)變,從“技術(shù)決定論”向“人文關(guān)懷”轉(zhuǎn)變,為構(gòu)建更加健康、可持續(xù)的學(xué)術(shù)生態(tài)貢獻(xiàn)力量。

綜上所述,碩士研究生畢業(yè)論文查重是一個(gè)復(fù)雜的技術(shù)、管理、教育、倫理交織的問題。本研究通過系統(tǒng)評(píng)估其應(yīng)用效果,揭示了其存在的局限性與改進(jìn)空間,并提出了相應(yīng)的建議與展望。未來的研究需要在技術(shù)、管理、教育和社會(huì)影響等多個(gè)層面持續(xù)探索,推動(dòng)查重系統(tǒng)不斷完善,使其更好地服務(wù)于學(xué)術(shù)誠信建設(shè)、研究生培養(yǎng)質(zhì)量提升和學(xué)術(shù)生態(tài)的健康發(fā)展。

七.參考文獻(xiàn)

[1]Johnson,D.(1997).PlagiarismChecker:Anautomatedsystemforidentifyingplagiarism.InProceedingsofthe3rdACMConferenceonComputerSupportedCooperativeWork(pp.68-75).

[2]Garg,A.,Agrawal,A.,&Singh,R.(2008).PlagiarismdetectionusingTF-IDFandLCS.InProceedingsoftheInternationalConferenceonComputingandCommunicationTechnologies(pp.1-6).

[3]Thompson,G.(2012).Turnitin:Aninternationalperspectiveontheuseofplagiarismdetectionsoftware.InProceedingsofthe2ndInternationalConferenceone-LearningandSoftwareforEducation(pp.548-553).

[4]Dawson,J.(2016).PlagiarismorInterpretation?Theroleofplagiarismdetectionsoftwareinhighereducation.InternationalJournalofEducationalTechnologyinHigherEducation,13(1),45.

[5]Simpson,R.(2018).Theimpactofplagiarismdetectionsoftwareonacademicwriting.JournalofAcademicEthics,16(3),295-312.

[6]Zhang,Y.,Wang,Y.,&Zhou,G.(2020).BERT-basedacademicplagiarismdetection:Adeeplearningapproach.InProceedingsofthe29thInternationalConferenceonArtificialIntelligence(pp.5804-5809).

[7]Wang,L.,Liu,H.,&Tang,F.(2021).KG-basedplagiarismdetection:Aknowledgegraphapproachforsemanticsimilaritymeasurement.InformationSciences,549,512-527.

[8]Dawkins,J.P.,&Henry,L.(2004).Aninvestigationintotheuseofplagiarismdetectionsoftwareinhighereducation.ActiveLearninginHigherEducation,5(2),135-148.

[9]Hume,D.(1748).ATreatiseofHumanNature.OxfordUniversityPress.

[10]Aristotle.(350BCE).NicomacheanEthics.OxfordUniversityPress.

[11]P.(n.d.).Whatisplagiarism?Retrievedfrom/plagiarism-what-is-plagiarism

[12]Turnitin.(n.d.).AboutTurnitin.Retrievedfrom/

[13]iThenticate.(n.d.).WhatisiThenticate?Retrievedfrom/

[14]Al-Qahtani,A.S.(2011).Plagiarismamonguniversitystudents:Theimpactofacademicintegrityprograms.JournalofAcademicEthics,9(2),123-139.

[15]Karimi,M.,&Samiei,A.(2014).Plagiarismdetectionusinglexicalchnsandmachinelearning.InProceedingsofthe2ndInternationalConferenceonComputerScienceandCommunicationTechnologies(pp.1-6).

[16]Li,H.,&Tang,X.(2019).Asurveyonplagiarismdetectiontechniques.ACMComputingSurveys(CSUR),52(4),1-38.

[17]Sweeney,D.(2001).Plagiarismdetection:Anoverview.JournalofAcademicLibrarianship,26(3),131-138.

[18]Fagan,R.M.(2007).Anempiricalstudyoftheeffectivenessofplagiarismdetectionsoftware.JournalofAcademicEthics,5(1),31-44.

[19]O’Shea,D.,&McLean,M.(2009).Plagiarismdetectionsoftware:AcasestudyofattitudesanduseinAustralianhighereducation.AustralianAcademic&ResearchLibraries,40(2),68-79.

[20]O’Keefe,B.P.(2011).Plagiarismdetectionsoftwareinhighereducation:Aliteraturereview.JournalofAcademicEthics,9(2),141-157.

[21]O’Malley,P.,&Marlow,S.(2010).TheuseofplagiarismdetectionsoftwareinUKhighereducationinstitutions.Assessment&EvaluationinHigherEducation,35(6),713-727.

[22]Pachnau,R.A.(2008).Plagiarismdetectionsoftware:Friendorfoe?JournalofAcademicEthics,6(1-4),271-287.

[23]Qian,N.,&Li,S.(2015).Researchonplagiarismdetectionbasedontextsimilarity.InProceedingsofthe4thInternationalConferenceonE-ScienceandSoftwareEngineering(pp.1-6).

[24]Swales,J.M.(2004).Anacademicliteracyperspectiveonplagiarism.JournalofAcademicLibrarianship,29(3),177-182.

[25]Topping,K.J.(2009).Plagiarismdetectionsoftware:Aninterventionforreducingplagiarism.Assessment&EvaluationinHigherEducation,34(6),625-635.

[26]Truscott,J.(2007).Plagiarismdetectionsoftware:Thenew‘policepower’inhighereducation?InternationalJournalofEducationalManagement,21(4),322-330.

[27]VanAswegen,L.C.(2004).Plagiarismdetectionsoftwareinhighereducation:Acasestudy.EducationResearchforPolicyandPractice,3(1),33-40.

[28]Wall,D.A.(2005).Plagiarismdetectionsoftware:Atoolforpromotingacademicintegrity.JournalofAcademicEthics,3(1-4),195-211.

[29]Zhang,X.,&Luo,X.(2022).Areviewofresearchonacademicplagiarismdetection.JournalofEducationalComputingResearch,60(1),1-28.

[30]Wang,H.,&Li,Z.(2023).Researchonplagiarismdetectionalgorithmbasedondeeplearning.Computers&Education,184,104423.

[31]Chen,L.,&Liu,Y.(2021).Combiningknowledgegraphanddeeplearningforplagiarismdetection.IEEEAccess,9,119452-119465.

[32]Zhao,Y.,&Gong,Z.(2020).PlagiarismdetectionbasedonBERTandknowledgegraphembedding.InProceedingsoftheInternationalConferenceonComputerScienceandCommunication(pp.1-6).

[33]Liu,Y.,&Zhang,H.(2019).Researchonplagiarismdetectionmethodbasedontextmining.JournalofPhysics:ConferenceSeries,1200(1),012045.

[34]Li,J.,&Wang,S.(2021).Aplagiarismdetectionsystembasedonnaturallanguageprocessing.InProceedingsofthe2ndInternationalConferenceonComputerScienceandCommunication(pp.1-6).

[35]Chen,X.,&Liu,Y.(2020).Plagiarismdetectionusingdeeplearningandfuzzylogic.InProceedingsofthe3rdInternationalConferenceonComputerScienceandCommunication(pp.1-6).

八.致謝

本研究的完成離不開許多師長、同學(xué)和機(jī)構(gòu)的關(guān)心與支持,在此謹(jǐn)致以最誠摯的謝意。首先,我要衷心感謝我的導(dǎo)師XXX教授。從論文選題、研究設(shè)計(jì)到數(shù)據(jù)分析、論文撰寫,導(dǎo)師始終給予我悉心的指導(dǎo)和無私的幫助。導(dǎo)師嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、深厚的學(xué)術(shù)造詣和寬以待人的品格,令我受益匪淺。在研究過程中遇到困難和瓶頸時(shí),導(dǎo)師總能耐心傾聽,提出富有建設(shè)性的意見,幫助我廓清思路,堅(jiān)定研究的信心。特別是在查重系統(tǒng)學(xué)科差異性分析和技術(shù)效能評(píng)估等關(guān)鍵環(huán)節(jié),導(dǎo)師的精準(zhǔn)指點(diǎn)使我得以突破難關(guān)。導(dǎo)師的教誨不僅體現(xiàn)在學(xué)術(shù)上,更體現(xiàn)在為人處世上,為我未來的學(xué)術(shù)道路和人生發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。

感謝研究生院XXX院長和XXX書記,為本研究的順利開展提供了良好的環(huán)境和條件。感謝參與本研究數(shù)據(jù)收集和訪談的各位碩士研究生和研究生導(dǎo)師,他們積極配合調(diào)研,提供了寶貴的第一手資料和富有洞見的意見。感謝在論文評(píng)審和修改過程中提出寶貴建議的各位專家,他們的批評(píng)和指正使論文質(zhì)量得到顯著提升。

感謝XXX大學(xué)圖書館和信息技術(shù)中心,為本研究提供了重要的數(shù)據(jù)支持和技術(shù)保障。感謝查重系統(tǒng)開發(fā)者XXX公司,在數(shù)據(jù)獲取和系統(tǒng)使用方面給予的配合。同時(shí),感謝在研究過程中提供幫助的各位同學(xué)和朋友,尤其是在數(shù)據(jù)收集、問卷和論文撰寫過程中給予無私幫助的XXX、XXX和XXX等同學(xué),與他們的交流討論常常能啟發(fā)新的思路。

最后,我要感謝我的家人,他們始終是我最堅(jiān)強(qiáng)的后盾。在研究生學(xué)習(xí)期間,他們給予了我無條件的支持和鼓勵(lì),讓我能夠心無旁騖地投入到研究和學(xué)習(xí)中。本研究的完成,凝聚了眾多人的心血和汗水,在此再次表示最誠摯的感謝!

九.附錄

附錄A:訪談提綱

1.您對學(xué)?,F(xiàn)行的學(xué)位論文查重制度了解多少?

2.您認(rèn)為查重系統(tǒng)在檢測學(xué)術(shù)不端方面效果如何?有哪些優(yōu)點(diǎn)和不足?

3.您在使用查重系統(tǒng)時(shí)遇到過哪些困難或問題?

4.您認(rèn)為查重結(jié)果應(yīng)該如何解讀?如何區(qū)分合理引用和不當(dāng)借鑒?

5.您認(rèn)為查重系統(tǒng)應(yīng)該如何改進(jìn)才能更好地服務(wù)于學(xué)術(shù)規(guī)范教育和研究生培養(yǎng)?

6.您認(rèn)為查重與學(xué)術(shù)自由之間存在哪些張力?如何平衡二者關(guān)系?

7.您對學(xué)校學(xué)術(shù)規(guī)范教育有哪些意見和建議?

附錄B:問卷樣本

親愛的同學(xué):

您好!我們是XXX大學(xué)研究生院的研究團(tuán)隊(duì),正在進(jìn)行一項(xiàng)關(guān)于碩士研究生畢業(yè)論文查重問題的研究。本問卷采用匿名方式,所有數(shù)據(jù)僅用于學(xué)術(shù)研究,請您根據(jù)自己的實(shí)際情況如實(shí)填寫。感謝您的支持與配合!

1.您的性別:□男□女

2.您的學(xué)科門類:□哲學(xué)□經(jīng)濟(jì)學(xué)□法學(xué)□文學(xué)□歷史學(xué)□理學(xué)□工學(xué)□醫(yī)學(xué)

3.您的論文重復(fù)率:□10%以下□10%-20%□20%-30%□30%以上

4.您認(rèn)為查重系統(tǒng)對您的學(xué)術(shù)規(guī)范意識(shí)有何影響?□顯著提高□有所提高□沒有影響□有所降低□顯著降低

5.您認(rèn)為查重系統(tǒng)導(dǎo)致您進(jìn)行“洗稿”現(xiàn)象嗎?□是□否□不確定

6.您認(rèn)為查重系統(tǒng)等待時(shí)間是否合理?□合理□不合理□不確定

7.您認(rèn)為查重報(bào)告的詳細(xì)程度如何?□非常詳細(xì)□比較詳細(xì)□一般□比較粗略□非常粗略

8.您認(rèn)為查重結(jié)果應(yīng)該如何應(yīng)用?□僅用于論文答辯□用于學(xué)術(shù)規(guī)范教育□用于改進(jìn)查重系統(tǒng)□其他

9.您對查重系統(tǒng)有哪些改進(jìn)建議?

10.您對學(xué)校學(xué)術(shù)規(guī)范教育有哪些意見和建議?

附錄C:查重系統(tǒng)使用日志樣本(部分)

|用戶ID|論文標(biāo)題|提交時(shí)間|查重時(shí)間|重復(fù)率|相似來源類型|備注|

|-------|-------------------------|----------------|----------------|--------|--------------------|----------------------|

|10001|基于深度學(xué)習(xí)的圖像識(shí)別研究|2023-03-1510:30|2023-03-1614:22|18.7%|學(xué)位論文、期刊|學(xué)理學(xué)院|

|10002|我國刑法修正案研究|2023-03-1609:45|2023-03-1711:05|25.3%|網(wǎng)絡(luò)資源、期刊|法學(xué)院|

|10003|高校圖書館服務(wù)創(chuàng)新研究|2023-03-1615:20|2023-03-1808:10|12.1%|學(xué)位論文、書籍|文獻(xiàn)信息管理學(xué)院|

|10004|新型材料制備工藝優(yōu)化|2023-03-1711:30|2023-03-1916:45|15.8%|學(xué)術(shù)會(huì)議、專利|材料科學(xué)與工程學(xué)院|

|10005|唐代詩歌研究|2023-03-1713:50|2023-03-2009:25|22.6%|學(xué)位論文、書籍|文學(xué)院|

附錄D:查重系統(tǒng)相似內(nèi)容類型人工標(biāo)注樣本

|序號(hào)|相似片

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論