版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
資料內(nèi)容僅供您學(xué)習(xí)參考,如有不當(dāng)或者侵權(quán),請聯(lián)系改正或者刪除。學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)研制介紹與使用方法第一章系統(tǒng)簡介1.1系統(tǒng)概述學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)(簡稱”AMLC”)以《中國學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫》為全文比對數(shù)據(jù)庫,實(shí)現(xiàn)了對抄襲與剽竊、偽造、篡改等學(xué)術(shù)不端行為的快速檢測,可供用戶檢測學(xué)位論文,并支持用戶自建比對庫。其系統(tǒng)示意圖如圖1所示。圖1檢測系統(tǒng)示意圖1.2系統(tǒng)技術(shù)路線介紹AMLC采用CNKI自主研發(fā)的自適應(yīng)多階指紋(AMLFP)特征檢測技術(shù),具有檢測速度快,準(zhǔn)確率,召回率較高,抗干擾性強(qiáng)等特征。
支持篇章、段落、句子各層級檢測;
支持文獻(xiàn)改寫,多篇文獻(xiàn)組合等各種文獻(xiàn)變形檢測;
支持論文、圖書專著等超長文獻(xiàn)的學(xué)術(shù)不端檢測。
CNKI自適應(yīng)多階指紋技術(shù)原理如圖2所示:圖2CNKI自適應(yīng)多階指紋技術(shù)原理圖對任意一篇需要檢測的文獻(xiàn),系統(tǒng)首先對其進(jìn)行分層處理,按照篇章、段落、句子等層級分別創(chuàng)立指紋,而比對資源庫中的比對文獻(xiàn),也采取同樣技術(shù)創(chuàng)立指紋索引。這樣的分層多階指紋結(jié)構(gòu),不但能夠滿足我們對超長文獻(xiàn)的快速檢測,而且,因?yàn)槲覀兊淖钚≈讣y粒度為句子,因此,也滿足了系統(tǒng)對檢準(zhǔn)率和檢全率的高要求。原則上,只要檢測文獻(xiàn)與比對文獻(xiàn)存在一個(gè)相同的句子,就能被檢測系統(tǒng)發(fā)現(xiàn)。1.3系統(tǒng)功能概述系統(tǒng)主要功能包括:已發(fā)表文獻(xiàn)檢測、論文檢測、問題庫查詢、自建比對庫管理等?!粢寻l(fā)表文獻(xiàn)檢測:指檢測系統(tǒng)能夠自動將屬于用戶的已正式發(fā)表的學(xué)位論文檢索出來,并對每一篇已發(fā)表文獻(xiàn)進(jìn)行實(shí)時(shí)檢測,快速給出檢測結(jié)果?!粽撐臋z測:主要實(shí)現(xiàn)論文實(shí)時(shí)在線檢測功能?!魡栴}庫查詢:指用戶能夠?qū)z測結(jié)果中確認(rèn)有問題的文獻(xiàn)放入到問題庫,便于用戶集中管理?!糇越ū葘?指管理人員能夠選擇將檢測文獻(xiàn)放入個(gè)人比對庫或者批量上傳文獻(xiàn)作為個(gè)人比對庫,該個(gè)人比對庫即可作為以后學(xué)術(shù)不端文獻(xiàn)檢測的比對數(shù)據(jù)庫,該自建個(gè)人比對庫完全屬于用戶,其它用戶無權(quán)使用。1.4系統(tǒng)目的AMLC的目的是輔助各研究生培養(yǎng)單位對學(xué)位論文質(zhì)量進(jìn)行評估,為審查論文提供技術(shù)服務(wù)。檢測系統(tǒng)在對論文進(jìn)行檢測之后,生成檢測報(bào)告,為判斷論文性質(zhì)提供相關(guān)依據(jù)。第二章檢測原理及方法2.1支撐技術(shù)CNKI擁有強(qiáng)大的技術(shù)研發(fā)隊(duì)伍,當(dāng)前已經(jīng)擁有了具有國際或國內(nèi)領(lǐng)先水準(zhǔn)的全面的數(shù)字出版的相關(guān)技術(shù),包括資源采集技術(shù),文本數(shù)據(jù)庫加工技術(shù),文本數(shù)據(jù)庫技術(shù),數(shù)字資源版權(quán)保護(hù)技術(shù),知識挖掘技術(shù),自然語言處理技術(shù)、快速比對技術(shù)等。在海量的全文數(shù)據(jù)的基礎(chǔ)上實(shí)現(xiàn)快速準(zhǔn)確的檢測,上述技術(shù)是基本的保證。2.2支撐資源AMLC需要一個(gè)盡可能完備的全文數(shù)據(jù)比對資源庫,而CNKI的《中國學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫》則正好滿足這一要求。到當(dāng)前為止,CNKI擁有學(xué)術(shù)期刊7000余種,期刊全文文獻(xiàn)2480萬篇,期刊期數(shù)和文獻(xiàn)收錄完整率都大于99.9%,文獻(xiàn)量居國際國內(nèi)同類產(chǎn)品之首;出版503家碩士學(xué)位點(diǎn)的72萬篇優(yōu)秀碩士學(xué)位論文,368家博士學(xué)位點(diǎn)的9.6萬篇博士學(xué)位論文;1286家重要會議論文106萬篇;515家重要報(bào)紙500多萬篇;1376種重要年鑒787萬篇;600多種工具書220多萬條;學(xué)術(shù)引文索引數(shù)據(jù)600多萬條;這些出版物做到平均日更新0條記錄;國家標(biāo)準(zhǔn)、專利、SPRINGER數(shù)據(jù)庫也集成到CNKI網(wǎng)絡(luò)出版平臺中;另外,出版平臺還集成整合出版了各類第三方數(shù)據(jù)庫資源1020種。在收錄資源種類上,CNKI在國內(nèi)具有明顯優(yōu)勢,收錄了期刊、學(xué)位論文、會議論文、報(bào)紙、年鑒、工具書、專利、外文文獻(xiàn)、學(xué)術(shù)文獻(xiàn)引文等與科學(xué)研究、學(xué)習(xí)相關(guān)的主要資源。在資源收錄數(shù)量上,CNKI明顯優(yōu)于同類產(chǎn)品,各個(gè)資源庫收錄年限長,期刊等主要資源庫回溯到創(chuàng)刊。在資源更新速度上,CNKI產(chǎn)品除了第三方合作的外文文獻(xiàn)以外,其它資源都做到了日更新,單日更新數(shù)量大,這是推行產(chǎn)業(yè)化、標(biāo)準(zhǔn)化運(yùn)作的結(jié)果。2.3系統(tǒng)架構(gòu)模式2.3.1系統(tǒng)架構(gòu)圖圖3系統(tǒng)架構(gòu)圖2.3.2系統(tǒng)示意圖檢測系統(tǒng)提供整套的文獻(xiàn)學(xué)術(shù)不端行為檢測,系統(tǒng)服務(wù)器位于CNKI中心網(wǎng)站,用戶將待檢測的學(xué)位論文經(jīng)過網(wǎng)絡(luò)在線提交到中心網(wǎng)站服務(wù)器,服務(wù)器在檢測完成后,自動將檢測結(jié)果返回給用戶。整套系統(tǒng)架構(gòu)為B/S結(jié)構(gòu),客戶端不需要安裝任何軟件。其系統(tǒng)示意如圖4所示:圖4系統(tǒng)示意圖2.3.3系統(tǒng)流程圖圖5系統(tǒng)核心流程圖2.4用戶提供的資源實(shí)現(xiàn)學(xué)術(shù)不端檢測,用戶需要提供的資源包括:1.論文全文內(nèi)容論文全文內(nèi)容是檢測論文是否存在學(xué)術(shù)不端行為的基礎(chǔ)數(shù)據(jù)。本檢測系統(tǒng)是對提交的論文全文內(nèi)容進(jìn)行分析,在內(nèi)容分析的基礎(chǔ)上,生成各項(xiàng)檢測指標(biāo)。因此,全文數(shù)據(jù)是系統(tǒng)所需要的必要資源。2.元數(shù)據(jù)信息元數(shù)據(jù)指論文相應(yīng)的作者、作者單位、發(fā)表時(shí)間、支持基金項(xiàng)目等信息。元數(shù)據(jù)是檢測系統(tǒng)對學(xué)術(shù)不端類型進(jìn)行判斷所需的基礎(chǔ)數(shù)據(jù),為了更準(zhǔn)確的便于系統(tǒng)做出預(yù)判,用戶能夠在提交檢測文獻(xiàn)的同時(shí),一并提交文獻(xiàn)的元數(shù)據(jù)信息。特別提到的是:在進(jìn)行論文檢測的時(shí)候,作者信息是非常必要的。輸入作者信息,在后續(xù)的檢測過程中,系統(tǒng)能夠自動根據(jù)作者信息區(qū)分比對資源中的文獻(xiàn)是屬于該作者已發(fā)表的文獻(xiàn),還是她人的文獻(xiàn),為用戶快速甄別論文是否存在學(xué)術(shù)不端行為提供更直觀的印象。因?yàn)樵趯W(xué)位論文中,引用自己以前發(fā)表過的文獻(xiàn)是合理的。注意:元數(shù)據(jù)不是系統(tǒng)必須的數(shù)據(jù),用戶在使用檢測系統(tǒng)的時(shí)候,能夠選擇不填寫元數(shù)據(jù)。但我們建議最好輸入作者信息。2.5檢測結(jié)果內(nèi)容在對用戶提交的檢測文獻(xiàn)檢測之后,系統(tǒng)生成的檢測結(jié)果包括:1.重合文字來源文獻(xiàn)信息。系統(tǒng)詳細(xì)列出重合文字來源文獻(xiàn)信息,這些文獻(xiàn)都是真實(shí)存在,而且應(yīng)是公開發(fā)表或得到發(fā)表確認(rèn)的。2.比對信息。檢測文獻(xiàn)和來源文獻(xiàn)的詳細(xì)比對信息,用戶能夠快速選擇重合文字部分查閱。3.總檢測指標(biāo)。該指標(biāo)體系從多個(gè)角度對檢測文獻(xiàn)中的文字復(fù)制情況進(jìn)行了概括性描述。4.子檢測指標(biāo)。因?yàn)檎撐囊话爿^長,因此,系統(tǒng)一般按章檢索,而且每一章給出子檢測指標(biāo),該檢測指標(biāo)從多個(gè)角度對該章內(nèi)容的檢測情況進(jìn)行了詳細(xì)描述。5.診斷類型。系統(tǒng)根據(jù)指標(biāo)參數(shù)以及其它元數(shù)據(jù)相關(guān)信息,自動給出一個(gè)預(yù)判的診斷類型,供審查人員參考。6.檢測報(bào)告。檢測系統(tǒng)自動生成一個(gè)檢測報(bào)告單,詳細(xì)列出檢測文獻(xiàn)的學(xué)術(shù)不端行為檢測情況,用戶能夠?qū)υ搱?bào)告單進(jìn)行修改,生成終審報(bào)告。注意:系統(tǒng)只對疑似存在學(xué)術(shù)不端行為的論文生成檢測報(bào)告。第三章檢測指標(biāo)體系學(xué)術(shù)不端行為檢測系統(tǒng)采用的指標(biāo)體系分為兩個(gè)部分:3.1總檢測指標(biāo)論文一般文獻(xiàn)篇幅較大,字?jǐn)?shù)多,碩士論文一般為3~5萬字,博士論文則多達(dá)十多萬字。因此,為了讓用戶對整個(gè)論文有一個(gè)快速的概況了解,特制定了以下指標(biāo)體系:總重合字?jǐn)?shù)(CCA)總文字復(fù)制比(TTR)總文字?jǐn)?shù)(TCA)疑似章節(jié)數(shù)(QCA)總章節(jié)數(shù)(TCA)首部重合文字?jǐn)?shù)(HCCA)尾部重合文字?jǐn)?shù)(ECCA)上述指標(biāo)從整體情況描述了論文的檢測情況,便于用戶快速了解該論文總的檢測概況。下面對上述指標(biāo)分別進(jìn)行說明。3.1.1總重合字?jǐn)?shù)(CCA)論文一般篇幅大,少則3~5萬字,多則十多萬字,若以文字復(fù)制比來衡量一篇論文的文字重合情況,則不太合適。因?yàn)閷τ谝黄畮兹f字的博士論文來說,10%就已達(dá)到1萬字,文字復(fù)制情況已經(jīng)非常嚴(yán)重。因此,對于博碩士論文檢測,檢測系統(tǒng)使用絕對字?jǐn)?shù)即總重合字?jǐn)?shù)作為檢測結(jié)果的核心指標(biāo)。如圖6所示:圖6總重合字?jǐn)?shù)示例3.1.2總文字復(fù)制比(TTR)總文字復(fù)制比則是指論文中總的重合字?jǐn)?shù)在總的論文字?jǐn)?shù)中所占的比例。經(jīng)過該指標(biāo),我們能夠直觀了解到重合字?jǐn)?shù)在該檢測論文中所占的比例情況。3.1.3總文字?jǐn)?shù)(TCA)總文字?jǐn)?shù)是指該檢測論文所有包含的字?jǐn)?shù),文字復(fù)制比與總文字?jǐn)?shù)的乘積即為重合字?jǐn)?shù)。3.1.4疑似章節(jié)數(shù)(QCA)、總章節(jié)數(shù)(TCA)疑似章節(jié)數(shù)是則檢測論文疑似存在學(xué)術(shù)不端行為的章節(jié)的數(shù)量。總章節(jié)數(shù)則是指論文總的章節(jié)數(shù)(對于不按章節(jié)顯示,而是按照固定長度切分的論文,每一段落為一章節(jié))。3.1.5首部重合文字?jǐn)?shù)(HCCA)、尾部重合文字?jǐn)?shù)(ECCA)首部重合文字?jǐn)?shù)指學(xué)位論文前1萬字中重合的文字?jǐn)?shù)量。尾部重合文字?jǐn)?shù)是指除去前1萬字,剩下的部分中重合的文字?jǐn)?shù)量。對于論文,一般開頭部分均是綜述性的報(bào)告介紹,其重要性遠(yuǎn)低于論文尾部。3.2子檢測指標(biāo)對于論文的每一章節(jié),又制定了如下檢測指標(biāo)來反映該章節(jié)的檢測情況,對于一篇論文來說,每一章的內(nèi)容各異,重點(diǎn)也不一樣,其核心工作內(nèi)容一般主要存在某幾章中,子檢測指標(biāo)能夠讓用戶迅速了解每一章節(jié)的檢測情況。子檢測指標(biāo)包括:文字復(fù)制比(TR)重合字?jǐn)?shù)(CNW)最大段長(LPL)平均段長(APL)段落數(shù)(PN)段文字比(PR)首部復(fù)制比(HR)尾部復(fù)制比(ER)引用復(fù)制比(RR)*上述指標(biāo)從多個(gè)角度反映了檢測文獻(xiàn)的檢測情況,便于用戶進(jìn)行針對性審核。下面對各項(xiàng)指標(biāo)分別進(jìn)行說明。3.2.1文字復(fù)制比(TR)因?yàn)檎撐囊话阄淖至枯^多,為了便于用戶快速瀏覽檢測結(jié)果。系統(tǒng)會自動對論文進(jìn)行切分處理。有如下兩種處理方式:1.若用戶提交的論文是MSWord格式,且按照MSWord格式生成了文檔目錄,檢測系統(tǒng)會自動識別論文章節(jié),按論文實(shí)際章節(jié)信息顯示論文內(nèi)容。2.若論文不存在明顯的章節(jié)信息,或者不是MSWord格式論文,則系統(tǒng)會自動按照每段1萬余字符切分論文,按照切分后的結(jié)果顯示。文字復(fù)制比即指論文切分后每一章節(jié)段落的文字復(fù)制情況。文字復(fù)制比即指論文的某一章節(jié)與比對文獻(xiàn)比較后,重合文字部分在該章節(jié)中所占的比例。比例越高,反映該章節(jié)越多的文字來自于其它已發(fā)表文獻(xiàn)。文字復(fù)制比反映了文章”抄襲”的文字?jǐn)?shù)量比例,一般來說,文字復(fù)制比越高,存在學(xué)術(shù)不端行為的可能性越大。文字復(fù)制比情況如圖7所示。圖7文字復(fù)制比示例3.2.2重合字?jǐn)?shù)(CNW)重合字?jǐn)?shù)指論文該章節(jié)與比對文獻(xiàn)比較后,重合部分的字?jǐn)?shù)。一般來說,不論文字復(fù)制比如何,重合字?jǐn)?shù)越多,存在學(xué)術(shù)不端行為的可能性越大。如圖8所示,在圖中,雖然文字復(fù)制比只有16%,比例不高,但圖中左文標(biāo)紅部分實(shí)際上是抄襲了右文的標(biāo)紅部分。圖8重合字?jǐn)?shù)示例3.2.3最大段長(LPL)、平均段長(APL)、段落數(shù)(PN)在論文檢測中,當(dāng)連續(xù)文字超過一定比例時(shí),稱之為段。在本系統(tǒng)中,一般認(rèn)為,連續(xù)200以上文字稱為段。與比對文獻(xiàn)重合的最大段長度即為最大段長。最大段長反映成段抄襲特征。連續(xù)的文字越長,抄襲的可能性越大。在論文中,所有段的長度的平均值即為平均段長。在論文中,所有段的數(shù)量為段落數(shù)。平均段長和段落數(shù)反映了重合文字在論文中的分布情況,一般來說,指標(biāo)參數(shù)越高,存在學(xué)術(shù)不端行為的可能性越大。如圖9所示,標(biāo)紅部分的連續(xù)文字構(gòu)成了段,而且它是算法設(shè)計(jì)的抄襲,審查人員比較容易判斷;而在圖10中,標(biāo)紅文字不構(gòu)成段,連續(xù)文字較少,對它的性質(zhì)判斷則可能需要更多的信息。圖9段落復(fù)制示例圖10句子復(fù)制示例3.2.4段文字比(PR)在論文的某一章節(jié)中,所有該章節(jié)文字重合段的字?jǐn)?shù)之和占該章節(jié)文字?jǐn)?shù)的比例為段文字比。段文字比反映了抄襲連續(xù)特征。一般來說,連續(xù)文字出現(xiàn)的越多,比文字分散出現(xiàn)的情況更可能存在學(xué)術(shù)不端行為。3.2.5首部復(fù)制比(HR)論文某一章節(jié)的前20%稱之為章節(jié)首部,首部的文字復(fù)制比為首部復(fù)制比。就中文文獻(xiàn)來說,一般每一章節(jié)正文開頭部分出現(xiàn)的是綜述性語言,重要性相對偏低。如圖11所示,左文和右文開頭大段相同,但文字內(nèi)容基本都是綜述性的介紹。圖11首部復(fù)制比示例3.2.6尾部復(fù)制比(ER)每一章節(jié)的后80%稱之為章節(jié)尾部,尾部的文字復(fù)制比為尾部復(fù)制比。一般情況下,尾部文字內(nèi)容就重要性來說,比前部文字內(nèi)容要高。如圖12所示,我們仔細(xì)查閱比較圖11和圖12的內(nèi)容發(fā)現(xiàn),圖11中首部文獻(xiàn)是綜述她人工作,而圖12中尾部文獻(xiàn)則是闡述自己的研究工作的目的和意義,應(yīng)該是作者個(gè)人工作的體現(xiàn),在這部分直接抄襲她文,性質(zhì)要嚴(yán)重得多。圖12尾部復(fù)制比示例3.2.7引用復(fù)制比(RR)引用復(fù)制比指與存在引證關(guān)系的文獻(xiàn)的文字重合部分的比例。對于論文來說,存在引證關(guān)系與不存在引證關(guān)系的復(fù)制部分應(yīng)區(qū)別對待。復(fù)制了她文內(nèi)容,而不注明引用,性質(zhì)要更加嚴(yán)重。同時(shí)我們也認(rèn)為,不是所有的注明了引用的,就不存在抄襲,引用也應(yīng)有一個(gè)度和范圍的限制。第四章類型及實(shí)例介紹按照上面的檢測方法和指標(biāo)體系,TMLC能夠處理多種的學(xué)術(shù)不端類型。在論文檢測中,一般不存在不當(dāng)署名、一稿多投等學(xué)術(shù)不端行為。對于論文檢測中的各類學(xué)術(shù)不端行為,按照性質(zhì)的嚴(yán)重性由低到高排序,主要包括:抄襲、篡改、偽造等。下面分別進(jìn)行介紹。4.1抄襲按照重合字符數(shù)量與文字復(fù)制比例能夠?qū)⒊u劃分為:類型重合文字條件總文字復(fù)制比例輕度句子抄襲各連續(xù)重合文字均<10%句子抄襲各連續(xù)重合文字均<200>=10%輕度段落抄襲存在連續(xù)重合文字<30%段落抄襲存在連續(xù)重合文字>=30%且<50%整體抄襲>=(總字符數(shù)/2)>=50%針對各種類型,下面分別舉例說明:1.輕度句子抄襲圖13輕度句子抄襲示例2.句子抄襲圖14句子抄襲示例3.輕度段落抄襲圖15輕度段落抄襲示例4.段落抄襲圖16段落抄襲示例5.整體抄襲圖17整體抄襲示例另外,按照抄襲來源還能夠?qū)⒊u劃分為:l)單源抄襲:重合文字全部來自于一篇文獻(xiàn);2)多源抄襲:重合文字來源于兩篇及以上文獻(xiàn)。如圖18所示,重合文字來源有13篇文獻(xiàn),屬多源抄襲。圖18多源抄襲示例4.2篡改篡改是指按照期望值隨意篡改或取舍數(shù)據(jù),以符合自己的研究結(jié)論,一般有主觀取舍數(shù)據(jù)和篡改原始數(shù)據(jù)等形式。對于篡改,系統(tǒng)也具有一定的手段進(jìn)行檢測,首先來看一個(gè)例子,在一篇文獻(xiàn)中提到:分詞的準(zhǔn)確率為99.66%,詞性標(biāo)注的準(zhǔn)確率為99.07%,利用CNKI已有的相關(guān)技術(shù),系統(tǒng)能夠快速檢測與分詞準(zhǔn)確率和詞性標(biāo)注準(zhǔn)確率有關(guān)的數(shù)值信息,供審查人員參考,對文獻(xiàn)中數(shù)據(jù)值遠(yuǎn)高于當(dāng)前公布的數(shù)據(jù)值的情況,提醒審查人員仔細(xì)核查,如圖19所示。圖19篡改檢測示例在圖中,上面黃色標(biāo)示的是檢測文獻(xiàn)中描述的分詞準(zhǔn)確率和詞性標(biāo)注準(zhǔn)確率,下面部分則是在CNKI特色搜索功能——數(shù)值搜索中檢索到的當(dāng)前關(guān)于分詞準(zhǔn)確率和詞性標(biāo)注準(zhǔn)確率的描述。我們能夠觀察到,當(dāng)前檢測到的所有關(guān)于分詞準(zhǔn)確率和詞性標(biāo)注準(zhǔn)確率的描述文字中,其數(shù)值均低于檢測文獻(xiàn)中所描述的數(shù)值,因此,我們有理由對檢測文獻(xiàn)中的分詞準(zhǔn)確率產(chǎn)生懷疑,提示審查人員進(jìn)一步核查。4.3偽造偽造的特點(diǎn):新研究成果中提供的材料、方法、數(shù)據(jù)、推理等方面不符合實(shí)際,無法經(jīng)過重復(fù)試驗(yàn)再次取得,有些甚至連原始數(shù)據(jù)都被刪除或丟棄,無法查證。偽造包括的方面很多,能夠偽造數(shù)據(jù)、偽造基金、偽造項(xiàng)目、偽造數(shù)值、表格、圖形等。偽造基金/偽造項(xiàng)目:有些論文中虛設(shè)基金、項(xiàng)目支持,這種情況可經(jīng)過查詢政府相關(guān)基金項(xiàng)目庫能夠快速驗(yàn)證;偽造數(shù)值、圖表等知識元,則能夠經(jīng)過CNKI已有的成熟的數(shù)值搜索技術(shù)、圖表搜索技術(shù)進(jìn)行查證,起到警示作用。注意:偽造是檢測難度最高的不端行為,還需要做進(jìn)一步、更深的研究。4.4其它類型學(xué)術(shù)不端類型肯定不止上面列出的幾種,其它當(dāng)前能夠有所處理的類型還包括:1.引用杜撰別人根本沒有說過的話,自己編造,卻作為她人的話引用。特別是杜撰引用國外學(xué)者。2.引文杜撰根本就不存在的文獻(xiàn),杜撰一篇引文。第五章系統(tǒng)功能及實(shí)例分析TMLC主要功能包括:已發(fā)表文獻(xiàn)檢測、論文檢測、問題庫查詢、自建比對庫管理等,下面分別結(jié)合例子進(jìn)行介紹。5.1已發(fā)表文獻(xiàn)檢測各注冊用戶可在權(quán)限范圍內(nèi)查看本單位已被CNKI正式收錄論文的檢測結(jié)果。對于確定有問題的文獻(xiàn),還能夠?qū)⑵渲苯臃湃雴栴}記錄庫。其流程圖如圖20所示:圖20已發(fā)表文獻(xiàn)檢測流程圖用戶能夠選擇具體某一年的論文進(jìn)行查閱檢測,也能夠經(jīng)過頁面提供的檢索功能,檢索某一個(gè)作者的論文或者按照論文篇名檢索具體的某一篇文獻(xiàn),如圖21所示。圖21已發(fā)表文獻(xiàn)檢測列表注意:因?yàn)橄嚓P(guān)原因,所有示例中涉及具體單位和個(gè)人的信息基本都隱去。選擇某一篇論文,點(diǎn)擊論文標(biāo)題,進(jìn)入下一個(gè)頁面,對于論文來講,一般會被切分成幾個(gè)到十幾個(gè)段落,用戶能夠依次點(diǎn)擊查閱,如圖22所示。圖22已發(fā)表文獻(xiàn)切分段落點(diǎn)擊每一段落查看詳細(xì)的檢測結(jié)果,包括:檢測指標(biāo),重合文字來源文獻(xiàn)的信息以及與其文字復(fù)制比,在頁面下部還標(biāo)紅了所有重合的文字。讓用戶快速了解到選擇文獻(xiàn)大約有多少文字與其它文獻(xiàn)重合以及重合文字所處的位置等,如圖23所示。圖23檢測結(jié)果頁面(1)再選擇點(diǎn)擊某篇重合文字來源文獻(xiàn)篇名,進(jìn)入下一頁面,該頁面顯示了檢測文獻(xiàn)與重合文字來源文獻(xiàn)具體的比對信息,兩篇文獻(xiàn)所有重合文字部分均有藍(lán)色字體標(biāo)示,用戶能夠選擇左文的任意藍(lán)色文字點(diǎn)擊,其字體顏色變?yōu)榧t色,同時(shí),右文中與之相同的文字段將自動標(biāo)紅,并自動定位到頁面的上部,便于用戶查閱,如圖24所示。圖24已發(fā)表文獻(xiàn)檢測頁面(2)點(diǎn)擊圖24頁面中的”查看原版比對”按鈕,還能夠查看論文的原版比對,原版是指文獻(xiàn)發(fā)表時(shí)的排版樣式,這使得用戶能夠快速的確定網(wǎng)頁所指文獻(xiàn)是否與原版文獻(xiàn)文字一致,如圖25所示。圖25原版比對頁面5.2論文檢測該項(xiàng)功能提供對論文的實(shí)時(shí)在線檢測。將待檢測文獻(xiàn)經(jīng)過互聯(lián)網(wǎng)提交到檢測系統(tǒng)服務(wù)器,系統(tǒng)根據(jù)論文長度大小將在數(shù)秒內(nèi)返回檢測結(jié)果給用戶。包括以下特點(diǎn):(1)多手段論文提交方式。在線提交論文的方式包括三種:
一是單篇論文在線提交,能夠選擇需要檢測的某一論文直接上傳提交;
二是批量論文在線提交,能夠?qū)⑿枰獧z測的多篇論文壓縮為一個(gè)zip格式或rar格式的壓縮文件,然后提交壓縮文件至檢測服務(wù)器,系統(tǒng)將自動處理壓縮文件,完成壓縮文件內(nèi)所有論文的檢測;
三是手工錄入方式,能夠在線錄入一段文字進(jìn)行檢測,如圖26所示。(2)多格式論文處理能力。系統(tǒng)能夠自動處理MSWord、PDF、CAJ、HTML、TXT等多種格式文檔,如圖26所示。圖26提交文獻(xiàn)頁面(3)文件夾式管理方式。為便于用戶管理,系統(tǒng)采取了用戶完全自主的文件夾式管理方法。用戶能夠創(chuàng)立文件夾,設(shè)定文件夾的各項(xiàng)系數(shù),包括:比對專業(yè)范圍選擇、檢測時(shí)間選擇、比對數(shù)據(jù)庫類型選擇等。在創(chuàng)立文件夾之后,當(dāng)用戶將文獻(xiàn)提交到選擇的文件夾之后,系統(tǒng)將自動根據(jù)該文件夾設(shè)定的各項(xiàng)系數(shù)進(jìn)行檢測,而用戶無需每次都進(jìn)行系數(shù)設(shè)置操作。而且用戶能夠隨時(shí)對文件夾系數(shù)進(jìn)行修改,重新設(shè)定文件夾系數(shù),如圖27所示。圖27文件夾式管理頁面(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年甘肅省臨夏回族自治州單招職業(yè)適應(yīng)性考試題庫及參考答案詳解
- 2026年安徽省淮北市單招職業(yè)傾向性考試題庫及答案詳解1套
- 2026年濮陽石油化工職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫帶答案詳解
- 牙醫(yī)護(hù)理面試題庫及答案
- 國考電動車面試題及答案
- 南康護(hù)士面試題庫及答案
- 人保財(cái)險(xiǎn)昆明市分公司2026屆校園招聘8人的備考題庫參考答案詳解
- 2025年芒市國富文化旅游產(chǎn)業(yè)開發(fā)有限公司招聘備考題庫含答案詳解
- 2025年紹興市文化市場執(zhí)法指導(dǎo)中心招聘編制外工作人員備考題庫及參考答案詳解
- 2025年武漢市卓刀泉中學(xué)建和分校招聘備考題庫帶答案詳解
- 小品聰明的小明小明同學(xué)臺詞
- 2022年銅陵市義安區(qū)檢察院招聘考試真題
- 高中英語語法過去完成時(shí)優(yōu)秀公開課課件
- 《思想道德與法治》材料分析題
- CQI-12特殊過程:涂裝系統(tǒng)評估表(中文第三版)
- 云南省地方課程四年級上冊《源遠(yuǎn)流長話云南》期末試卷
- 套筒窯工藝控制
- 任良天集體備課基本不等式
- GB/T 2975-2018鋼及鋼產(chǎn)品 力學(xué)性能試驗(yàn)取樣位置及試樣制備
- GB/T 21254-2017呼出氣體酒精含量檢測儀
- GB/T 11334-2005產(chǎn)品幾何量技術(shù)規(guī)范(GPS)圓錐公差
評論
0/150
提交評論