信息分析 第2版 課件 第9、10講 信息計量方法;專利信息分析_第1頁
信息分析 第2版 課件 第9、10講 信息計量方法;專利信息分析_第2頁
信息分析 第2版 課件 第9、10講 信息計量方法;專利信息分析_第3頁
信息分析 第2版 課件 第9、10講 信息計量方法;專利信息分析_第4頁
信息分析 第2版 課件 第9、10講 信息計量方法;專利信息分析_第5頁
已閱讀5頁,還剩338頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1第9講

定量分析方法(四)

信息計量學方法知行合一、經(jīng)世致用CentralSouthUniversity知行合一、經(jīng)世致用CentralSouthUniversity2信息+計量計量對象:信息(事實或現(xiàn)象描述、數(shù)據(jù)、知識)計量標準:計量單元(物理、信息、知識單元)

計量內(nèi)容:數(shù)量特征與規(guī)律、數(shù)據(jù)處理計量方式:計量方法、工具、模型(如何計量)計量應用:不同領(lǐng)域和對象的數(shù)量特征與規(guī)律、

定量描述與分析(文獻、科學、網(wǎng)絡)3內(nèi)容提綱

1信息計量基礎(chǔ)

2信息計量定律3引文分析4網(wǎng)絡計量5科學計量1978年,美國著名科學家、科學學和文獻計量學家普賴斯曾說過:引文之于文獻計量學勝于貨幣之于經(jīng)濟學。知識產(chǎn)生知識與同錢生錢。普賴斯獎—計量學領(lǐng)域的最高獎;引子湯森路透每年公布諾獎預測名單。自2002年以來,已成功預測了近半數(shù)據(jù)以上諾貝爾獎得主。該獎項通過對WebofScience中科研論文及其引文遴選出在化學、物理學、生理學或醫(yī)學、以及經(jīng)濟學領(lǐng)域全球最具影響力的研究人員。遴選依據(jù):發(fā)文量、被引量、影響因子(篇均被引)、熱點論文、頂尖論文(TOP1%、TOP千分之一)。ESI指標:一流高校、一流學科。引子諾貝爾獎獲得者預測1961~1975年間諾貝爾獎獲得者被引證次數(shù):162位中最高的是L.D.Landau18888,最低的是J.H.Jensen79。只有6位低于200次,平均為2877次。一般學者50次1961~1975年間引文數(shù)最高的250位中,42位(17%)諾貝爾獎,151位(60%)為國家科學院院士。1967年引文數(shù)最高的50人中,6位獲諾貝爾獎,后又有6人獲獎。引子7信息計量基礎(chǔ)1.1三計學、五計學及其他1.2信息計量學的概念1.3信息計量學的研究對象1.4信息計量學的研究內(nèi)容1.5信息計量學的發(fā)展史1.6信息計量的方法與工具1.7信息計量學的主要應用1信息計量基礎(chǔ)1.1三計學、五計學及其他20世紀60年代以來,在圖書館學、文獻學、科學學和情報學領(lǐng)域相繼出現(xiàn)了3個類似的術(shù)語:

Bibliometrics、Scientometrics、Informetrics,分別

代表著三個十分相似的定量性的分支學科,即文獻計量學、科學計量學和信息計量學(情報計量學)20世紀80年代之后,由“三計學”又相繼出現(xiàn)網(wǎng)絡計量學、知識計量學并拓展為“五計學”。文獻計量學和科學計量學是三計學、五計學的基礎(chǔ),三計學和五計學的主要對象是文獻信息的計量,隨后擴展到非文獻信息的計量(如網(wǎng)絡、數(shù)據(jù)、知識、事實等)。學科名稱起止年代提出者國家書目計量學(StatisticalBibliography)1922-1969年休姆(E.W.Hulme)英國文獻計量學(Bibliometrics)1969年至今阿倫?普里查德(AlanPritchard)英國科學計量學(Scientometrics)1969年至今納利莫夫和穆利欽科蘇聯(lián)信息計量學(Informetrics)1979年至今奧托?納克(OttoNacke)德國網(wǎng)絡信息計量學(Webometrics)1997年至今阿曼德(T.C.Almid)丹麥知識計量學(Knowmetrics)1998年至今劉則淵中國1.1“三計學”與“五計學”及其他1.2信息計量學的概念信息計量學原稱“情報計量學(Imformetrics)”,由德國學者昂托·納克(OttoNacke)教授最先提出。1980年9月,在德國法蘭克福召開的第一次情報計量學(含科學計量學)研討會,納克教授在會上提出了“情報計量學”,并進行了宣傳。其目的在于試圖用以概括數(shù)學在情報學領(lǐng)域的應用。納克教授:情報(信息)計量學是采用定量方法來描述和研究情報(信息)的現(xiàn)象、過程和規(guī)律的一門學科。邱均平教授:信息計量學分為廣義信息計量學和狹義信息計量學。前者主要探討以廣義信息論為基礎(chǔ)的廣義信息計量問題(信息是用來減少或消除系統(tǒng)的不確定性的東西-香農(nóng)),信息科學界認為信息是可以度量(計量)的,通常以系統(tǒng)不確定性的變化程度來度量信息,信息計量的關(guān)鍵在于認識信息計量原理和方法以及確定信息計量標準。1.2信息計量學的概念1948年香農(nóng)在《通信的數(shù)學理論》中提出:一個系統(tǒng)所接收

的“信息是能夠用來消除不確定性的東西”,奠定了廣義信息計量的基礎(chǔ)(概率信息)。維納在1948年發(fā)表的《控制論》和1950年著作《人當作人來使用/人有人的用處》中拓展了信息的概念,提出了信息量的定義和計算公式。香農(nóng)、維納、費希爾3位美國數(shù)學同時提出了單位信息量度量的基本思想。1964年卡爾納普提出了語義信息及度量問題(前為語法信息)。查德1965年、1968年發(fā)表《模糊集合》和《通信:模糊算法》,提出模糊數(shù)學可用于信息處理,模糊集合可以反映信息語義。1968年貝里斯和高艾斯提出對信息的量和質(zhì)(信息效用)進行計量,1978年夏爾馬把“量-質(zhì)”統(tǒng)一量度推廣為廣義有效信息。1.2信息計量學的概念狹義的信息計量學(情報計量學)主要研究情報信息(文獻情報、文獻信息)的計量問題,主要是應用數(shù)學、統(tǒng)計學等定量方法來分析和處理信息過程中的矛盾,從定量的角度分析和研究信息的動態(tài)特性,并找出其內(nèi)在規(guī)律。信息計量學(Informetrics)是采用數(shù)學、統(tǒng)計學等各種定量方法,對社會化的信息交流過程中的信息的組織、存儲、分布、傳遞、相互引證和開發(fā)利用等進行定量描述和統(tǒng)計,以便揭示社會信息交流過程的數(shù)量特征和內(nèi)在規(guī)律的一門新興學科。1.3信息計量學的研究對象20世紀90年代,巴克蘭(Buckland)對信息的概念進行了較為全面的解釋,認為信息有三種含義:信息作為過程(過程信息)、信息作為知識(知識信息)、信息作為事物(事物信息)。信息作為物事(事物信息)包括實物(Object)、事件(Events)、數(shù)據(jù)(Data)、文本(Text)、文獻(Documents)。信息計量學的研究對象大于科學計量學和文獻計量學(核心是文獻),目前計量的核心是事物信息的數(shù)量。信息科學家塔格·薩克利夫(TagneSutcliffe)認為,原來部分地被包括在信息中的信息的定義和測度也屬于信息計量學。1.3信息計量學的研究對象文獻信息可計量的特征書目特征:文獻量、期刊、相關(guān)論文、論文數(shù)、作者等引文特征:引文量、年代、語種、學科、國家、被引(作者、期刊、論文、國家)、耦合、共引、自引等收錄特征:書目、文摘、索引、數(shù)據(jù)庫收錄量詞頻特征:出現(xiàn)頻次其他特征:閱讀量、借閱量、館藏量(利用和保障率)、讀者量、流通量、拒絕量等信息可計量的特征:物理特征和內(nèi)容特征,量、質(zhì)和價值特征,關(guān)系和網(wǎng)絡特征。信息的數(shù)量、結(jié)構(gòu)與關(guān)系信息的數(shù)量信息計量單位:廣義(比特)、狹義(文獻單元、信息單元、

知識單元、數(shù)據(jù)單元、知識基因、元知識、知識元、元概念)信息載體單元量:物理量(文獻計量、專利計量、網(wǎng)絡計量)信息內(nèi)容單元量:內(nèi)容量、知識量、思想量(知識計量)信息的結(jié)構(gòu)信息載體的物理結(jié)構(gòu):文獻結(jié)構(gòu)-鏈式、線性信息內(nèi)容的邏輯結(jié)構(gòu):知識體系-網(wǎng)絡信息的關(guān)系時間、空間(分布)、邏輯(數(shù)理)、共現(xiàn)、引證、鏈接1.3信息計量學的研究對象1.4信息計量學的研究內(nèi)容基本問題:概念、對象、內(nèi)容、發(fā)展史、學科關(guān)系、方法、工具、應用五大定律—信息增長定律:指數(shù)增長、邏輯指數(shù)增長、分級增長模型—信息老化定律:半衰期、普賴斯指數(shù)、負指數(shù)增長模型—布拉德福定律:信息集中與分散分布定律、期刊與載文量—洛特卡定律:生產(chǎn)率定律、平方反比定律、作者與發(fā)文量—齊普夫定律:齊夫定律、詞頻與等級引文分析—引文結(jié)構(gòu)分析:時間、文獻類型、語種等;—引文分析指標:影響因子、被引頻次、被引率等;—引證關(guān)系分析:引文鏈、引文網(wǎng)絡、鏈接分析等。網(wǎng)絡環(huán)境下的信息計量研究:網(wǎng)絡計量學、替代計量學歷時定律共時定律首創(chuàng)了文獻統(tǒng)計方法,并在一些學科領(lǐng)域進行了文獻計量分析,拉開了文獻計量學的序幕。萌芽時期(1917年-1933年)以文獻統(tǒng)計調(diào)查為基礎(chǔ),歸納出具有普遍指導意義的結(jié)論,取得了許多重要的理論成果,奠定了文獻計量學的理論基礎(chǔ)。。奠定時期(1934年-1960年)結(jié)合文獻工作實際,著重開展應用研究。文獻計量學確立為一門獨立的分支學科。發(fā)展時期(1964年-1978年)情報學出現(xiàn)了專有的計量研究領(lǐng)域,信息計量學逐步發(fā)展成為一門獨立的科學學科。確立時期(1979年以后)1.5信息計量學的發(fā)展史1.5信息計量學的發(fā)展史1980年,[德]OttoNacke(納克),首次提出了“Informetrics”,用以概括數(shù)學方法在情報學領(lǐng)域的應用。1987年,B.C.Brookes,提議將“Informetrics”加入到ISSI舉辦的國際學術(shù)研討會的名稱中?!癐nformetrics”開始出現(xiàn)在會議論文集的標題中,標志著這一學科被正式承認。1.5信息計量學的發(fā)展史1.6信息計量學的工具與方法信息計量工具(1)WebofScience(WoS):SCI、SSCI、A&HCI及其他①SCI即科學引文索引(ScienceCitationIndex);②SSCI即社會科學引文索引(SocialSciencesCitationIndex);③A&HCI即藝術(shù)與人文引文索引(Arts&HumanitiesCitationIndex)。④ESI即基本科學指標數(shù)據(jù)庫(EssentialScienceIndicators);⑤EI即工程索引(EngineeringIndex);⑥ISTP即科技會議錄索引(IndextoScientific&TechnicalProceedings);(2)國內(nèi)常用數(shù)據(jù)庫⑦CSCI即中國科學引文索引(ChinaScienceCitationIndex);⑧CSTPC即中國科技論文與引文數(shù)據(jù)庫(ChineseScienceandTechnologyPaperandCitationDatabase);⑨中國科學引文數(shù)據(jù)庫(ChineseScienceCitationDatabase,簡稱CSCD);⑩CSSCI即中文社會科學引文索引數(shù)據(jù)庫(ChineseSocialScienceCitationIndex);還有中國引文數(shù)據(jù)庫(ChineseCitationDatabase,簡稱CCD)。1.6信息計量學的方法與工具(3)信息計量軟件①MATLAB(MatrixLaboratory):是Mathworks公司開發(fā)的集計算、圖形可視化和編輯功能于一體的功能強大、操作簡便、易于擴充的語言,是國際上公認的優(yōu)秀的數(shù)學應用軟件之一。其系統(tǒng)的強大功能是由其核心內(nèi)容(語言系統(tǒng)、開發(fā)環(huán)境、圖形系統(tǒng)、數(shù)學函數(shù)庫、應用程序接口等)和輔助工具箱(符號計算、圖象處理、優(yōu)化、統(tǒng)計和控制等工具箱)兩大部分構(gòu)成。②SAS(StatisticalAnalysisSystem):中文譯名為統(tǒng)計分析系統(tǒng),最初由美國北卡羅來納州立大學兩名研究生開始研制,1976年創(chuàng)立SAS公司。SAS系統(tǒng)具有十分完備的數(shù)據(jù)訪問、數(shù)據(jù)管理、數(shù)據(jù)分析功能。在國際上,SAS被譽為數(shù)據(jù)統(tǒng)計分析的標準軟件。③SPSS(StatisticalPackagefortheSocialScience):中文譯名為社會科學應用軟件包,是世界上著名的統(tǒng)計分析軟件之一。它和SAS(StatisticalAnalysisSystem,統(tǒng)計分析系統(tǒng))、BMDP(BiomedicalPrograms,生物醫(yī)學程序)并稱為國際上最有影響的三大統(tǒng)計軟件。④文獻計量和可視化軟件:SATI、Bibexcel、Citespace、VOSviewer、Ucinet等。1.6信息計量學的方法與工具信息計量方法統(tǒng)計分析法:包括兩個部分,一是信息計量的一些專業(yè)統(tǒng)計術(shù)語。比如館藏量、流通量、引文量、時差系數(shù)和詞頻分析等;二是數(shù)理統(tǒng)計。主要包括隨機樣本、抽樣分布、參數(shù)估計、假設檢驗、回歸分析、方差分析和聚類分析等。數(shù)學模型分析法:數(shù)學模型是用某種數(shù)學語言描述系統(tǒng)的結(jié)構(gòu)和行為而構(gòu)造出來的,它除了從宏觀的角度模擬出系統(tǒng)的結(jié)構(gòu)和運動規(guī)律外,主要是從微觀上、從量的方面描述出系統(tǒng)的結(jié)構(gòu)、聯(lián)系以及運動規(guī)律。引文分析法:利用各種數(shù)學及統(tǒng)計學的方法和比較、歸納、抽象、概括等邏輯方法,對科學期刊、論文、著者等各種分析對象的引證與被引證現(xiàn)象進行分析,以便揭示其數(shù)量特征和內(nèi)在規(guī)律的一種文獻計量分析方法。計算機輔助信息計量分析法:包括計算機輔助信息計量軟件的設計與開發(fā)工作,實現(xiàn)了套錄資料重組建庫以及多種資料統(tǒng)計分析功能;計算機輔助計量分析方法的建立和成熟,標志著我國信息計量研究的方法體系已基本形成,并日趨完善。1.6信息計量學的方法與工具閱讀資料2.1馬太效應2.2文獻增長定律2.3文獻老化定律2.4布拉德福定律2.5洛特卡定律2.6齊普夫定律2.7布-齊-洛的一致性:信息計量對象的集中與分散分布規(guī)律“當前,已發(fā)表文章的增長、老化和離散規(guī)律,理所當然地被視為標志科學文獻發(fā)展的最根本的規(guī)律?!保╗蘇]米哈依洛夫)2信息計量定律2.1馬太效應:《新約全書·馬太福音》:誰若有,就給他,并不斷增加;而誰沒有,則連已有的都要被奪走(用以描述社會中的評價和獎勵機制)。SCI中80%的引文集中在15%~20%的期刊中等,即信息產(chǎn)生和分布中的“馬太效應”(MatthewEffect)。馬太效應也稱為:二八定律、累積優(yōu)勢分布定律、集中與分散分布定律、成功產(chǎn)生成功原理。2信息計量定律表現(xiàn)形式:富集與貧集現(xiàn)象。描述了優(yōu)勢和劣勢的積累過程:一經(jīng)存在有優(yōu)勢,這種優(yōu)勢就會不斷加強,反之若處于劣勢,則這種不利條件也會繼續(xù)加劇。積極作用:信息管理(重點關(guān)注核心資源和對象),突出優(yōu)勢。負面影響:不利于人才成長,特別是年輕人;馬太效應描述信息對象的優(yōu)勢和劣勢過度積累,容易使信息工作者按簡單的優(yōu)劣進行信息的選擇、評價、傳播和利用,走入極端,使信息工作者因循守舊、不思進取,不求變革創(chuàng)新,按經(jīng)驗和簡單的規(guī)則從事復雜多變的信息管理工作(雙向評價:作者選期刊,期刊選作者)。2信息計量定律2.2文獻增長定律科學文獻增長(GrowthofScientificliterature)隨著時間的推延文獻數(shù)量的增長情況。實例:美國《化學文摘》的增長情況:第一個100萬篇32年(1907—1938),第二個100萬篇18年,第三個100萬篇8年,第四個100萬篇4.75年,第五個100萬篇3.3年……2信息計量定律科學知識量的急劇增長是科學文獻激增的主要原因其他原因:社會、教育、材料和加工技術(shù)等因素第一次翻番從公元初一1750年歷時1750年第二次翻番從1750年一1900年歷時150年第三次翻番從1900年一1950年歷時50年第四次翻番從1950年一1960年歷時10年科學知識量的翻番情況2信息計量定律科學的發(fā)展同前一代人遺留下的知識量成比例。(恩格斯)文獻增長:“似乎沒有理由懷疑任何正常的、日益增長的科學領(lǐng)域內(nèi)的文獻是按指數(shù)增加的,每隔大約10年到15年時間增加一倍”;“每年增長約5-7%”。(Price,《巴比倫以來的科學》,1961)普賴斯曲線:文獻指數(shù)增長模型100200300400tF(t)2信息計量定律指數(shù)曲線的存在,顯然具有普遍性和長期性。(Price)德里克.普賴斯(DerekJohndeSollaPrice,1921-1983),英國著名科學史家、科學學家、情報學家。1946年獲倫敦大學實驗物理學博士學位,后在新加坡拉費爾斯學院任教。1954年,獲劍橋大學科學史博士學位。1962年,任美國耶魯大學科學史客座教授,后任該校醫(yī)學和科學史系主任。1976年,榮獲國際技術(shù)史學會授予的達芬奇獎;1981年,榮獲國際科學社會研究學會授予的貝爾納獎;1983年,被遴選為瑞典皇家科學院國外院士。在他去世后不久,《Scientometrics》設立“普賴斯紀念獎”;美國耶魯大學設立“普賴斯科學學獎”。一生共發(fā)表論著240多件,主要有:《巴比倫以來的科學》(SciencesinceBabylon,1961);《小科學,大科學》(LittleScience,BigScience,1963);《科學論文網(wǎng)絡》(NetworksofScientificPapers,1965)。普賴斯為科學計量學和文獻計量學的發(fā)展、為科學學的成長作出了重要的貢獻,并在許多交叉領(lǐng)域都取得了顯著的成就。2信息計量定律2信息計量定律“指數(shù)增長規(guī)律”反映了事物“持續(xù)生產(chǎn)自我”的過程。當一個量在一個既定的時間周期中,其百分比增長是一個常量時,這個量就顯示出指數(shù)增長。只有當事物的“持續(xù)增長率”為常數(shù)時,才滿足“指數(shù)增長規(guī)律”。持續(xù)增長率=總量增加速度/總量F(t)=aebt

(a>0,b>0)F(t):時刻t的文獻累積量;t:時間(一般以年為單位);a:條件常數(shù),即統(tǒng)計的初始時刻(t=0)的文獻量;e:自然對數(shù)的底(e=2.7183……,有時可近似地取為2);b:時間常數(shù),即持續(xù)增長率。2信息計量定律34文獻翻倍時間dd=ln2/b≈0.693/b“翻倍時間”與“持續(xù)增長率”成反比。F(t1)=aebt1,F(t2)=aebt2F(t2)=2F(t1),得出d=t2-t1增長到K倍所需的時間ΔTΔT=lnK/bF(t1)=aebt1,F(t2)=aebt2F(t2)=KF(t1),得出⊿T=t2-t12信息計量定律問題:設某一時刻,某一學科的文獻量為10000件,文獻年增長率為10%,那么10年以后的文獻量是多少?100年以后呢?2信息計量定律2信息計量定律(1)問題一:文獻增長量的計算。(2)問題二:文獻增長翻番時間的計算。(3)問題三:文獻采購經(jīng)費的計算。(4)問題四:文獻收藏空間的計算。2信息計量定律求解:(1)(2)根據(jù)文獻指數(shù)增長模型:

F(t)=aebt

設初始時間t0的文獻量為:F(t0)=aebt0

經(jīng)過t1時間后文獻量為:F(t1)=aebt1

設文獻翻番時間為:d=t1-t0

經(jīng)過t1時間后文獻量翻一番則有:

F(t1)=2F(t0),即aebt1=2aebt0

兩邊取自然對數(shù)則有:㏑2+bt0=bt1∴d=t1-t0=㏑2/b2信息計量定律(3)采購經(jīng)費計算:設某高校圖書館每年需采購全部新增圖書的0.1%,以平均每本書30元計算,大約需要多少購書經(jīng)費?計算初始時間、10年后和100年后圖書館的圖書采購經(jīng)費。(4)文獻收藏空間計算:設平均每本書占用空間長30cm,寬20cm,厚5cm,估算圖書館每年需增加多少陳列書架(高2米,寬1米,厚0.5米,分五層)。科學文獻增長的指數(shù)型規(guī)律終將成為邏輯型。(Price,《小科學,大科學》,1963)文獻邏輯增長模型[蘇]弗·納里莫夫&格·弗萊杜茨首次提出了文獻信息的邏輯增長模型。某個時期,指數(shù)增長變?yōu)檫壿嬊€增長。

2信息計量定律

F(t)=k/(1+ae-kbt)(k,a,b>0)F(t):t年的文獻累積量;k:當t→∞時文獻的累積量,即文獻累積量之最大值;a,b:條件參數(shù)yF(t)ABTt0k/2F(t)ABLna/bkt0k2信息計量定律從哲學層次來看,文獻邏輯增長規(guī)律具有必然性和合理性。恩格斯指出:“宇宙的運動是在有限地循環(huán)上的無限地發(fā)展?!睆难芯繉嵺`來看,大量實證結(jié)果證明了邏輯增長規(guī)律的正確性。D.J.Frame等人發(fā)現(xiàn):1965~1975年間的“煤的氣化”方面的文獻,其增長曲線就能很好地符合邏輯曲線增長模型。2信息計量定律科學文獻邏輯增長的原因:科學文獻的“持續(xù)增長率”隨著文獻數(shù)量的增加而減小。(持續(xù)增長率=總量增加速度/總量)線性增長模型:F(t)=a+bt(a,b>0)

F(t):時間t時的文獻累積數(shù),一般指t年的文獻累積數(shù);b:單位時間內(nèi)的文獻增長量,一般指年增長量;a:初始時刻的文獻數(shù)量。年增長量為常數(shù)。2信息計量定律“我們將從文獻指數(shù)增長的過去,迎向線性增長的未來?!保≧escher)2信息計量定律每篇文獻對科學進步所做的貢獻都具有相同的價值嗎?“在計數(shù)時,存在一個根本性的問題,即把《物理學評論》與《布加勒斯特制革者協(xié)會年報》都當作具有同等重要意義的一個期刊計量單位……?!?/p>

(Price,《巴比倫以來的科學》,1961)“根據(jù)科學工作者發(fā)表論文的多寡來評價他們的勞動效率,給我們帶來了很大的害處,科學工作者們都致力于盡可能多地發(fā)表文章,結(jié)果導致在科技文獻中充斥著為數(shù)不少水平不高甚至質(zhì)量低劣的文章?!保˙urnal)2信息計量定律“出版物的數(shù)量增長與其質(zhì)量有關(guān),不同質(zhì)量的出版物的增長速度是不相同的?!保╗美]Rescher

,《科學的進步》)質(zhì)量等級指標λ:λ=1:起碼是常規(guī)文獻(實際代表了全部文獻)λ=?:起碼是有意義的文獻λ=?:起碼是重要的文獻λ=?:起碼是非常重要的文獻λ=0:第一級(頭等重要的)文獻分級指數(shù)增長模型表達式一:F(t):時刻t的文獻累積量;t:時間(一般以年為單位);a,b:條件常數(shù);λ:質(zhì)量等級指標F(t)=[aebt]λ

(λ=1,?,?,?)ln(aebt)

(λ=0)2信息計量定律計算例題:設某一時刻,某一學科的文獻量為1,000,000件,請計算各級別文獻的數(shù)量。λ=1(全部文獻):1,000,000(件)λ=?(有意義的文獻):31,623(件)λ=?(重要的文獻):1,000(件)λ=?(非常重要的文獻):32(件)λ=0(最重要的文獻):14(件)2信息計量定律分級指數(shù)增長模型表達式二:F(t):時刻t的文獻累積量;t:時間(一般以年為單位);a,b:條件常數(shù);λ:質(zhì)量等級指標F(t)=aλeλbt

(λ=1,?,?,?)lna+bt(λ=0)2信息計量定律“最重要的文獻”遵循“線性增長規(guī)律”;其余等級的文獻遵循“指數(shù)增長規(guī)律”,且等級越高(λ越?。┑奈墨I增長越慢。λ級文獻的持續(xù)增長率:bλ=b·λb為文獻總數(shù)(λ=1)的“持續(xù)增長率”,(λ=1,?,?,?)λ級文獻的翻倍時間:

dλ=ln2/bλ=ln2/(b·λ)=d/λd為文獻總數(shù)(λ=1)的翻倍時間,(λ=1,?,?,?)

計算例題:設某一學科文獻量的年增長率為10%,請計算各級別(λ=1,?,?,?)文獻數(shù)量的翻倍時間。λ=1(全部文獻):6.93(年)λ=?(有意義的文獻):9.24(年)λ=?(重要的文獻):13.86(年)λ=?(非常重要的文獻):27.72(年)2信息計量定律科學學和科學史研究以科學文獻數(shù)量增長規(guī)律來模擬科學技術(shù)的發(fā)展過程。情報研究掌握科技發(fā)展動態(tài),進行科學預測的可靠手段。文獻信息管理科學文獻的數(shù)量及未來的增長趨勢是文獻工作重要的決策依據(jù)。2信息計量定律文獻增長定律的主要應用2.3文獻老化定律文獻老化的理解“文獻內(nèi)容逐漸變得過時”(becomingoutofdate)“文獻被使用得越來越少”(Somethingislessandlessused)文獻老化的類型文獻老化:科學文獻隨其“年齡”的增長,失去了作為科學情報源的價值,以及因此越來越少被科學家和專家們利用的過程。([蘇]米哈依洛夫)情報老化:情報的有效價值隨時間流逝而衰減的現(xiàn)象。(M.B.Line&A.Sandison)2信息計量定律文獻老化的衡量指標半衰期(Half-Life):某學科正在利用的全部文獻中較新的一半是在多長一段時間內(nèi)發(fā)表的。1958年,[英]J.D.Bernal,在《科技情報傳遞:用戶分析》一文中首次提出:某學科已發(fā)表的文獻中有一半已不再使用的時間。1960年,[美]R.E.Burton&R.W.Kebler,在《一些科技文獻的“半衰期”》一文中改進半衰期:某學科正在利用的全部文獻中較新的一半是在多長一段時間內(nèi)發(fā)表的。也被稱為“中值引文年限”(MedianCitationage)。2信息計量定律1944年,[美]C.F.Gosnell,在《大學圖書館中文獻老化問題》一文中正式提出?!?00%=被引文獻總量≤5年的被引文獻數(shù)量Pr普賴斯指數(shù)(Price’sIndex):不老于5年的引文占全部引文的比例1971年,D.J.Price首次提出。2信息計量定律文獻信息老化的主要原因:科學技術(shù)的發(fā)展所帶來的科學知識的更新。1970年,[英]B.C.Brookes,提出了文獻老化的“負指數(shù)模型”。科學文獻的被引用數(shù)量隨時間的推移而衰減的過程服從負指數(shù)規(guī)律。負指數(shù)模型表達式:C(t)=Ke-at

(k>0,a>0)t:文獻的出版年齡(一般以年為單位);C(t):出版年齡=t年的文獻的被引用次數(shù);e:自然對數(shù)的底(e=2.7183……);a:文獻的老化率(又被稱為“相對衰減率”);K:常數(shù),隨不同學科而異。實質(zhì):已發(fā)表了的科技文獻的價值將在某一時間范圍內(nèi)均勻地減少。(“相對衰減率”為常數(shù))2信息計量定律半衰期簡易計算生物化學文獻引文分布表總引文量An=80005An/2=40002.5A4=37331<An/2A5=43866>An/2則:i=4半衰期T2信息計量定律半衰期簡易計算方法設i為引文年齡,某學科的引文中第i年的引文量為ai,i=0,1,2,…,n。令:A0=a0,A1=a0+a1,…,An=a0+a1+…+an,An為總引文量總存在一個i,使得:

Ai≤An/2<Ai+1則半衰期T一定落在區(qū)間[i,i+1]內(nèi)假設各年度引文量隨時間均勻分布,令T=i+b(0<b<1)

則有:

2信息計量定律科學學和科學史研究文獻信息管理指導剔出陳舊、無用的文獻,優(yōu)化館藏為制定合理的文獻工作原則提供依據(jù)用于評價文獻指導閱讀來揭示科學技術(shù)的發(fā)展過程和規(guī)律。文獻老化定律的主要應用2信息計量定律2.4布拉德福定律:文獻集中與分散分布定律1934年,[英]S.C.Bradford,在《專門學科的情報源》(SourcesofInformationonSpecificSubject)一文中首次提出了定量描述文獻分散規(guī)律的經(jīng)驗定律。假設:任何一學科的絕大部分專業(yè)文獻都集中于少數(shù)的相應專業(yè)期刊內(nèi),但是同時也散布于其它的相關(guān)期刊中。其散布的態(tài)勢則與該學科研究范圍的大小有關(guān)。2信息計量定律布氏定律區(qū)域表示法(ZonalExpression)

——又稱為“文字表示法”(VerbalExpression)假設一定時間內(nèi)(通常為一年)共有N種期刊刊載了某學科的論文(簡稱為“相關(guān)論文”)K篇,將這N種期刊按照所載“相關(guān)論文”的數(shù)量降序排列,然后,將該序列劃分為三個區(qū),使得每個區(qū)所包含的”相關(guān)論文“的數(shù)量相等(即“K/3篇”),則各區(qū)的期刊數(shù)量滿足下列關(guān)系:

n1:n2:n3=1:a:a2

(a>1)n1,n2,n3分別為“各個區(qū)的期刊數(shù)量”,顯然n1+n2+n3=N;a為“布拉德福常數(shù)”(或稱“比例系數(shù)”)。三個區(qū)分別稱為:“核心區(qū)、相關(guān)區(qū)、外圍區(qū)”2信息計量定律分區(qū)期刊載文數(shù)量(篇/年)應用地球物理學潤滑期刊數(shù)量論文數(shù)量期刊數(shù)量論文數(shù)量核心區(qū)x>494298110相關(guān)區(qū)4≥x圍區(qū)1≥x258404127152計算實例:布拉德福的統(tǒng)計數(shù)據(jù)(1934年)結(jié)論:n1:n2:n3≈1:5:52圖像表示法(GraphicalExpression)

——又稱為“經(jīng)驗表示法”(EmpiricalExpression)假設一定時間內(nèi)(通常為一年)共有N種期刊刊載了某學科的論文(簡稱為“相關(guān)論文”)K篇,將這N種期刊按照所載“相關(guān)論文”的數(shù)量降序排列,然后,以期刊累積數(shù)量的對數(shù)(lgn)為橫坐標,以相應的“相關(guān)論文”累積數(shù)量(R(n))為縱坐標作圖如下:AlgnR(n)CB0核心區(qū)相關(guān)區(qū)外圍區(qū)(經(jīng)典)布拉德福分散曲線2信息計量定律1948年,[英]B.C.Vickery,發(fā)表論文正式提出了“布拉德福分布”和“布拉德福定律”的概念,并提出了自己的修正和補充,為該定律的確立和發(fā)展作出了重要貢獻。推論:期刊的分區(qū)數(shù)目是任意的。假設:一定時間內(nèi)(通常為一年)共有N種期刊刊載了某學科的論文(簡稱為“相關(guān)論文”)K篇,將這N種期刊按照所載“相關(guān)論文”的數(shù)量降序排列,然后,將該序列劃分為m個區(qū),使得每個區(qū)所包含的”相關(guān)論文“的數(shù)量相等(即“K/m篇”),則:維氏公式:n1:n1-2:n1-3:…:n1-m=1:V:V2:…:

Vm-1

(V>1)ni為第i區(qū)的期刊數(shù)量,n1-i為“第1區(qū)到第i區(qū)的期刊累積數(shù)量”,即:n1-i=n1+n2+

…+ni,(i=1,2,3,…,m);V為“維氏(分散)系數(shù)”。2信息計量定律“(布拉德福)沒有用數(shù)學公式的形式去表現(xiàn)。結(jié)果,由于這個疏忽,使人們認識到該定律的重要意義,整整多花了20年時間?!保╗英]B.C.Brookes,1969)1968年,[英]B.C.Brookes,首次提出了布拉德福定律的數(shù)學表達式,并在1969年進行了修正,最終確立了“布魯克斯公式”。2信息計量定律布魯克斯公式:R(n)=α:等于載文量最多的期刊的載文量R(1);(一般隨統(tǒng)計年限的增加而增大)β:等于“曲線部分”的曲率;(大小與核心區(qū)的期刊數(shù)量有關(guān),且總小于1,在較短時間(二至五年)內(nèi)可視為常數(shù),但在較長時間里將會發(fā)生變化)n:期刊按載文量遞減順序排列的等級序號,即期刊累積數(shù);R(n):對應于前n種期刊的相關(guān)論文累積數(shù);C:核心區(qū)的期刊數(shù),即曲線拐點對應的n值;N:樣本期刊總數(shù);K:等于“直線部分”的斜率;(可用實驗方法求得,當N足夠大時,K=N×ln10

)s:等于“直線部分”反向延伸與橫軸交點的n值;(大小與所屬學科、專業(yè)范圍有關(guān),在學科范圍較窄時,s≤1,s越大,說明專業(yè)研究范圍越寬。此外,也與學科發(fā)展階段有關(guān)。而且,C值與s值相關(guān))2信息計量定律1967年,[美]Q.V.Groos,指出布拉德福曲線中存在“格魯斯下垂”(GrossDroop)-統(tǒng)計不全(學科交叉、統(tǒng)計工具、期刊變化)。AlgnR(n)CB0(經(jīng)典)布拉德福分散曲線lgnR(n)CB0DA(現(xiàn)代)布拉德福分散曲線2信息計量定律布氏定律的主要應用:確定核心期刊;用于文獻檢索:估計全檢某專業(yè)論文和相應期刊總數(shù);根據(jù)檢索要求,估計被檢期刊的最小數(shù)量;計算檢索效率和評價檢索工具的完整性。指導讀者利用期刊(確定核心期刊);指導期刊訂購工作(確定核心期刊);考察專著的分布(確定核心出版社);動態(tài)館藏的維護(確定核心期刊和確定核心讀者);學科幅度的比較和學科的重疊程度(比較核心區(qū));2信息計量定律布氏定律用于測定核心期刊的方法區(qū)域分析法:根據(jù)具體情況將這些期刊分成若干個區(qū)(一般為3個區(qū)),使每個區(qū)的文獻數(shù)量大致相等。這時,第一區(qū)的期刊即為該學科(或?qū)I(yè))的核心期刊。

分區(qū)期刊載文數(shù)量(篇/年)應用地球物理學潤滑期刊數(shù)量論文數(shù)量期刊數(shù)量論文數(shù)量核心區(qū)x>494298110相關(guān)區(qū)4≥x圍區(qū)1≥x258404127152實例:布拉德福的統(tǒng)計數(shù)據(jù)(1934年)2信息計量定律圖像分析法:將所得數(shù)據(jù)累計,得到兩組數(shù)據(jù):“期刊等級n”和“論文累積量R(n)”;其次,用lgn作橫坐標,R(n)為縱坐標作圖,繪制出布拉德福曲線;然后,找到曲線部分與直線部分的交點C,其橫坐標為lgnc,則nc為核心期刊數(shù);最后,列出排在前面的nc種期刊,即為該學科(或?qū)I(yè))的核心期刊。lgnR(n)CB0DA布拉德福曲線lgnc2信息計量定律期刊數(shù)每種期刊的載文量期刊等級n論文累積數(shù)量R(n)126112611259252012203740…………1134101953…………14024776834534110117368計算實例:A.Pope的統(tǒng)計數(shù)據(jù)(“情報學”)lgnR(n)CB0DA布拉德福曲線lg10N=1011,R(N)=7368;nc=10,R(nc)=1953

2信息計量定律布氏定律用于圖書情報機構(gòu)期刊訂購問題:任何一個信息機構(gòu)的經(jīng)費都是有限的,不可能將某一學科領(lǐng)域的全部文獻采購齊全,只能訂購其中一部分。以期刊為例,如果想要獲得某一領(lǐng)域所有期刊論文的f份額,需要訂購多少種期刊才能達到要求呢?求解:設n種期刊所載論文占該領(lǐng)域總論文數(shù)的f份額,則有:R(n)/R(N)=f(如果忽略學科系數(shù))那么,N㏑n/N㏑N=f,則n=Nf

(可以推廣至有學科參數(shù)S的情形n=S(N/S)f當N為某一給定數(shù)值時,可分別求出f=1/2,f=1/3時的期刊種數(shù)和訂購經(jīng)費。2信息計量定律從布拉德福分布中抽出n種載文率最高的期刊由于布拉德福分布中的N、S已知,對于確定的學科、專業(yè)來說可求得n。若N=600,S=1.5,P%=50%時,則n=30,若P%=76%,則n=90。也就是說,要搜集該學科50%的論文,只要訂購相關(guān)論文載文量最高的30種期刊就夠了。2信息計量定律假設某一學科領(lǐng)域有500種期刊,現(xiàn)要求收藏該領(lǐng)域中相關(guān)論文數(shù)量的一半,即f=1/2,若S=5則應訂的期刊數(shù)量為:即訂購載文率最高的50種期刊便可滿足要求。若每種期刊的平均年度訂費為11元,則訂50種期刊需550元。反之,如果知道訂費和期刊數(shù)量,利用上式同樣可以求出其論文比例。2信息計量定律2.5齊普夫定律——文獻中的詞頻分布規(guī)律1932年,哈佛大學的語言學專家齊普夫在研究英文單詞出現(xiàn)的頻率時,發(fā)現(xiàn)如果把單詞出現(xiàn)的頻率按由大到小的順序排列,則每個單詞出現(xiàn)的頻率與它的名次的常數(shù)次冪存在簡單的反比關(guān)系,這種分布就稱為齊普夫定律。它表明在英語單詞中,只有極少數(shù)的詞被經(jīng)常使用,而絕大多數(shù)詞很少被使用。實際上,包括漢語在內(nèi)的許多國家的語言都有這種特點。喬治·齊普夫(GeorgeZipf)指出,使用最多的英語單詞“the”占到了人們所有會話量的7%,排名第二的“of”的使用頻率正好是“the”的一半,依此類推,第100個最常用單詞的使用頻率是“the”的百分之一。齊普夫定律暗示,在任何序列中,后繼者的價值會定量地減少。2信息計量定律2信息計量定律1935年,齊普夫出版《動態(tài)語言學導論》,對詞頻分布規(guī)律進行了系統(tǒng)研究,初步確立了“齊普夫定律”。1949年,出版《人類行為與最省力法則——人類生態(tài)學引論》,系統(tǒng)論述了“最省力法則”,奠定了“齊普夫定律”的理論基礎(chǔ),標志著該定律正式形成。最省力法則與詞頻分布規(guī)律說話者以只用一個詞表達所有概念為最省力(“單一化的力”);聽話者以每個概念都用一個詞表達為最省力(“多樣化的力”);“單一化的力”與“多樣化的力”取得平衡,使自然語言詞匯的頻次分布呈雙曲線。齊普夫第一定律文字表述:設有一篇文獻包含N個詞(N≥5000),統(tǒng)計其中每個詞出現(xiàn)的頻次Fr

,按照頻次遞減的順序排列,并用自然數(shù)給這些詞編上等級序號r(L≥r≥1),則有:Fr×r=C(齊普夫公式一)

或者

fr=c×r-1

(齊普夫公式二)

其中:fr=Fr/N,c=C/N(N為總頻次)參數(shù)c的性質(zhì):c等于“最高頻詞的相對頻率”;一個與文獻性質(zhì)有關(guān)的參數(shù),且0<C<0.1。由可得:;2信息計量定律2信息計量定律信息管理領(lǐng)域:圖書館學、情報學、文獻學、科技管理等。其他社會科學領(lǐng)域:語言學、科學學、經(jīng)濟學、社會學等?!都t樓夢》前后章節(jié)的一致性分析在文獻標引和詞表編制中的應用;在情報檢索中的應用;在科學評價中的應用。齊普夫定律的主要應用2信息計量定律2信息計量定律問題:已知某學科領(lǐng)域的文獻集合共使用詞匯N頻次,假設每個詞匯的使用頻次都不相同,求:C≈0.1時(1)該學科領(lǐng)域共使用了多少個不同的詞匯?(2)若適于標引的詞匯出現(xiàn)頻次范圍為[n1,n2],那么該學科領(lǐng)域的專業(yè)詞表規(guī)模是多少?2信息計量定律求解:(1)該學科領(lǐng)域使用的不同詞匯數(shù)量等于其按遞減順序排列中的使用頻次最低的序號數(shù)D。由齊普夫定律:fr=nr/r,可得,

nr=CN/r或r=CN/nr

因詞頻最低的詞匯最少出現(xiàn)一次,即nD=1,∴D=CN/nD=CN2信息計量定律(2)該學科領(lǐng)域的專業(yè)詞表規(guī)模即詞頻次數(shù)在[n1,n2]之間適合標引的詞匯數(shù)量(用X表示)由齊普夫定律有:r=CN/nr,可寫成:

r(n)=CN/n(n詞頻,r(n)詞序)

則:r(n1)=CN/n1>r(n2)=CN/n2∴X=r(n1)-r(n2)+1=CN/n1-CN/n2+1=CN(1/n1-1/n2)+1(N較大時1可略去)=CN(1/n1-1/n2)當有同頻詞出現(xiàn)時:可將1替換成I(n2)=r(n2)-r(n2+1)

2信息計量定律1926年,[美]AlfredJamesLotka,發(fā)表“科學生產(chǎn)的頻率分布”(TheFrequencyDistributionofScientificProductivity)一文,首次提出了“洛特卡定律”。美國人口統(tǒng)計學家“科學生產(chǎn)率(ScientificProductivity)”:亦稱作“作者生產(chǎn)率(AuthorProductivity)”,指“科學工作者在科學研究上所表現(xiàn)出來的能力和工作效果,通常用其在一定時期內(nèi)所發(fā)表的科學論文數(shù)量來衡量”。2.6洛特卡定律——科研生產(chǎn)的平方反比定律研究對象:科學工作者的“生產(chǎn)能力”“洛特卡定律”——“科學工作者”與“科學論文產(chǎn)量”之間的數(shù)學規(guī)律”81洛特卡定律——科研生產(chǎn)的平方反比定律

y(x)=y(1)/x2x:發(fā)表論文數(shù)量;y(x):某領(lǐng)域中發(fā)表了x篇論文的作者數(shù)量;y(1):等于在該領(lǐng)域中發(fā)表了1篇論文的作者數(shù)量檢驗發(fā)現(xiàn),生產(chǎn)2篇文章的作者大約是生產(chǎn)1篇文章作者數(shù)的1/4,生產(chǎn)3篇文章的作者大約是生產(chǎn)1文章作者的1/9...;且生產(chǎn)1篇文章的作者數(shù)是全體作者的60%左右。[美]洛特卡,1926核心思想:“發(fā)表x篇文章的作者數(shù)量”是“發(fā)表1篇文章作者數(shù)量”的1/x2;(平方反比定律、倒平方定律,theinversesquarelaw)2信息計量定律2信息計量定律洛特卡定律的主要應用:反映科技勞動成果狀況利用洛特卡定律可以考察在某一學科領(lǐng)域內(nèi),科研人員一定時期內(nèi)以科學文獻形式出現(xiàn)的科研成果狀況??茖W估計勞動規(guī)模通過研究科學論文作者分布態(tài)勢,可以改善科學勞動組織、增加科研成果、提高勞動生產(chǎn)率,進而改善勞動規(guī)模的組織架構(gòu)。掌握科學論文的作者隊伍通過對科學論文作者結(jié)構(gòu)的統(tǒng)計和計量分析,可以了解科學活動的特點,掌握科學發(fā)展的規(guī)律,預測學科發(fā)展趨勢的前景,從而合理地組織科研隊伍,加快科學發(fā)展的速度。2信息計量定律2信息計量定律問題:已知某學科領(lǐng)域的學者總數(shù)為K,假設每一個學者都有文獻發(fā)表,求:(1)發(fā)表1篇文獻的學者數(shù)?(2)最大科學生產(chǎn)率(作者的最高文獻發(fā)表量)(3)發(fā)表文獻總數(shù)?(4)科學生產(chǎn)率(文獻發(fā)表量)大于m篇(某一閥值)的杰出科學家人數(shù)?2信息計量定律求解:(1)令F(x)為發(fā)表X篇文獻的作者數(shù)由洛特卡定律有:

F(x)=Kf(x)=KC/x2∴F(1)=KC/12=KC(C≈0.6)(2)令最大科學生產(chǎn)率為N,則由F(x)=KC/x2

可得:F(N)=KC/N2

F(N)為科學生產(chǎn)率最大的作者數(shù),故有:

F(N)=1(即發(fā)表論文最多的作者只可能有一個人)

∴KC/N2=12信息計量定律(3)令科學生產(chǎn)率為X篇的作者們共發(fā)表R(x)篇文獻,則有:R(x)=X·F(x)=X·KC/x2=KC/x∴該學科領(lǐng)域發(fā)表的文獻總數(shù)為:

=KC(1+1/2+…+1/N)

≈KC(㏑N+β)(4)令生產(chǎn)率大于m篇的作者數(shù)為Y,則:

∴Y=K-=K–Y=K-KC(1+1/22+1/32+…+1/m2)2信息計量定律2.7“布-齊-洛分布”的一致性分析布拉德福定律:“如果將科學期刊按其刊載某個學科領(lǐng)域的論文數(shù)量以遞減順序排列起來,就可以在所有這些期刊中區(qū)分出載文量最多的‘核心’區(qū)和包含著與核心區(qū)同等數(shù)量論文的隨后幾個區(qū),這時核心區(qū)和后繼各區(qū)中所含的期刊數(shù)成1:a:a2……的關(guān)系(a>1)?!辈剪斂怂构剑簄:期刊按載文量遞減順序排列的等級序號,即期刊累積數(shù);R(n):對應于前n種期刊的相關(guān)論文累積數(shù)R(n)=2信息計量定律齊普夫定律:如果將一篇達到一定長度的文章中的詞按其出現(xiàn)頻率遞減排序,根據(jù)頻率高低編上相應的等順序號,如果用f表示詞在文章中出現(xiàn)的頻率,用r表示詞的等級序號,則有:

f*r=c或f=c/r(c為常數(shù))

lgf=-clgx或y=-cx2信息計量定律洛特卡定律:作者要數(shù)與其發(fā)表的論文數(shù)成平方反比關(guān)系,稱為科學生產(chǎn)率的平方反比分布規(guī)律或“倒平方定律”。其經(jīng)典公式為:

f(x)=C/x2lgf(x)=-2Clgx或y=-2Cx2信息計量定律“布拉德福-齊普夫-洛特卡分布”的一致性定量表達式的一致性:對數(shù)函數(shù)或一元線性函數(shù)都是在一個簡單的函數(shù),一個變量與另一個變量相關(guān)聯(lián);都是采取將觀察值以及所涉及的主體進行特殊排列而得到一相關(guān)模型(倒序排列);都可以歸結(jié)為反映某種主體與其所表現(xiàn)的特征之間的數(shù)量對應關(guān)系。2信息計量定律“布-齊-洛分布”中的“Source”和“Item”:SourceItem布拉德福分布期刊(n)文獻數(shù)(R(n))齊普夫分布詞匯(r)詞頻(f(r))洛特卡分布作者(f(x))論文數(shù)(x)共性:反映了某種特定的“Item”在“Source”中的“集中與分散”規(guī)律。(負冪函數(shù))數(shù)學表達模型的一致性:對三個數(shù)學模型兩邊分別求對數(shù)或求導數(shù),換元后都是一元線性函數(shù)。2信息計量定律“布-齊-洛分布”的理論解釋人類行為的目的性與競爭原則人類行為出現(xiàn)和選擇的結(jié)果并不具有隨機性,而更多地受其目的的控制。成功產(chǎn)生成功的原則(thesuccess-breeds-successprinciple)“一篇經(jīng)常被引用的論文比一篇很少被引用的論文更容易再次被引用;一個發(fā)表過許多論文的作者比一個很少發(fā)表論文的作者更容易再次發(fā)表論文;一種經(jīng)常討論某一課題的期刊比一種很少討論這一課題的期刊更容易再次回到這個課題。”(Price,1965)最省力法則(thePrincipleofLeastEffort)一個人在解決面臨的問題時,將盡量使自己付出的“力”最小。3引文分析3.1引文分析概述3.2引分析分析的前提與假設3.3引文分析發(fā)展簡史3.4引用動機分析3.5引文分析工具3.6引文分析指標3.7引文分析應用3.8引文分析的局限3引文分析之所以我比別人看得更遠,是因為我站在巨人的肩膀上。牛頓沒有一篇科學論文是孤立存在的,它是被深嵌在整個學科的文獻體系之中的。[英]J.M.Ziman,19683引文分析文獻之間的“引用與被引用”關(guān)系如何稱呼“A和B”?(這種混用)是對這兩個極好的技術(shù)詞匯的可悲浪費(Price)“著文”和“引文”,“來源文獻”和“參考文獻”,“來源文獻”和“引用文獻”,“引文”和“被引文”,“施引文獻”和“受引文獻”等等。Price的定義:“如果文獻A將文獻B作為參考文獻,則文獻A就有了一篇參考文獻B,而文獻B就有了一篇引用文獻A。換言之,B是A的參考文獻,A是B的引用文獻?!?引文分析3.1引文分析概述:文獻之間的“引用與被引用”關(guān)系,

也稱為文獻之間的引證關(guān)系A(chǔ):引用文獻(Citation)或施引文獻(CitingPaper)

引證文獻或來源文獻B:參考文獻(Reference)或受引文獻(CitedPaper

被引證文獻或引文3引文分析引文鏈(CitationLink)與引文網(wǎng)絡(CitationNetwork)科學文獻之間通過相互引證所形成的一種關(guān)系結(jié)構(gòu)。引文分析(CitationAnalysis):“利用各種數(shù)學及統(tǒng)計學的方法和比較、歸納、抽象、概括等邏輯方法,對科學期刊、論文、專著、著者等各種分析對象的引證與被引證現(xiàn)象進行分析,以便揭示其數(shù)量特征和內(nèi)在規(guī)律的一種文獻計量分析方法?!?0041993199119951980200320032004199620051994200419982004200420043引文分析3引文分析3.2引文分析的前提與假設?文獻的引用表示作者確實使用過該文獻?文獻的引用是文獻價值、重要性及影響力的指標?好的文獻才會被引用?原始文獻和引用文獻之間必然有相關(guān)性?所有的引用都是同等重要?期刊文數(shù)據(jù)庫收錄的期刊能正確代表整個學科領(lǐng)域并支援其研究目標與目的?引用次數(shù)是評量引用文獻是否有意義的有效工作3引文分析1873年,“謝潑德引文(Shepard’sCitation)”在美國出版,是引文分析最早的雛形。1911年,[俄]瓦爾金,利用“引文分析法”研究一些國家的化學家所做的貢獻。1927年,P.L.K.Gross等人,首次利用“引文分析”評價期刊的重要性,被認為是文獻學史上的第一次引文分析。1956年,C.H.Brown;1957年,K.E.Clack;1962年,R.L.Dhalig;1967年,R.Tagliacozzo等等。3.3引文分析發(fā)展簡史3引文分析E.Garfield的貢獻:引文分析之父、SCI之父1955年,發(fā)表了《引文索引用于科學》一文,系統(tǒng)地提出了用引文索引檢索科技文獻的方法;1961年,編撰科學引文索引(ScienceCitationIndex,SCI),并于1964年正式出版;此后陸續(xù)出版了社會科學引文索引(SocialScienceCitationIndex,SSCI)(1973年)、藝術(shù)與人文科學引文索引(Arts&HumanitiesCitationIndex,A&HCI)(1978年)等一系列科學引文索引;極大地促進了“引文分析”乃至整個“三計學”的發(fā)展。3引文分析3.4引用動機分析1971年,M.Weinstock的總結(jié):對開拓者表示尊重;對有關(guān)著作給予肯定;驗證其所用的方法及儀器;提供背景性材料;對自己的著作予以更正;對別人的著作予以更正;評價以前的著作;為自己的論點尋求充分的論證;提供研究者現(xiàn)有的著作;對未被傳播,很少被引或未被引證的文獻提供向?qū)?;驗證數(shù)據(jù)及物理常數(shù)等;核查原始資料中某個觀點或概念是否被討論過;核查原始資料或其他著作中的起因人物的某個概念或名詞;否定他人的著作或觀點;對他人的優(yōu)先權(quán)提出異議。1977年,F(xiàn).C.Thorne的補充:為阿諛某人而引證;為互相吹捧而帶有偏見的引證;以自詡為目的的引證;為支持某一學術(shù)研究派別利益的不正當引證;迫于權(quán)威壓力的引證。(有價值)(無價值)3引文分析SCI(ScienceCitationIndex)

SSCI(SocialSciencesCitationIndex)

A&HCI(Arts&HumanitiesCitationIndex)ESI(EssentialScienceIndicators)EI(EngineeringIndex)ISTP(IndextoScientific&TechnicalProceedings)CSCD(ChinaScienceCitationDatabase)CSTPC(ChineseScienceandTechnologyPaperandCitationDatabase))CSSCI(ChineseSocialScienceCitationIndex)CCD(ChineseCitationDatabase)3.5引文分析工具3引文分析3.6引文分析指標引證率和引證頻次(citingrateofjournal)定義:“在特定的時間范圍內(nèi),期刊上刊載的論文的全部參考文獻數(shù)量”。(反映“信息吸收能力”)被引率和被引頻次(citedrateofjournal)定義:“在特定的時間范圍內(nèi),期刊上刊載的論文被引用的次數(shù)”。(反映“被利用的程度”)載文量(numberofarticlespublished)定義:“在特定的時間范圍內(nèi),期刊上所刊載的全部論文數(shù)量”。(反映“信息輸出能力”)3引文分析4.平均引文率(meancitationrate)定義1:“平均引證率”=“引證率

/載文量”。定義2:“平均被引率”=“被引率

/載文量”。5.影響因子(ImpactFactor,IF)

某期刊前兩年刊載的論文在當年的被引用次數(shù)

影響因子=

該期刊前兩年刊載論文的總數(shù)1972年,[美]E.Garfield,提出了“期刊影響因子”。“科學論文一般在其發(fā)表1~2年后達到被引用的峰值階段”(Price)3引文分析6.即年指標(ImmediacyIndex)

某期刊當年刊載的論文在當年的被引用次數(shù)

即年指標=

該期刊當年刊載論文的總數(shù)7.引文關(guān)系指標引文耦合:當兩篇文章同時引用一篇或多篇相同的文獻時,這種現(xiàn)象稱引文耦合,這兩篇文獻就具有耦合關(guān)系。引文耦合的文獻之間總存在著這樣或那樣的聯(lián)系,其聯(lián)系的程度稱為耦合強度。同被引:兩篇或多篇論文同時被后來的一篇或多篇論文所引證,則稱這兩篇論文具有同被引關(guān)系。

引證關(guān)系來源文獻施引文獻引用文獻參考文獻被引文獻引證文獻來源文獻施引文獻引用文獻參考文獻被引文獻引證文獻3引文分析引文耦合與同被引的差異分析引文耦合:靜態(tài)關(guān)系同被引:動態(tài)關(guān)系8.引文分布指標(1)引文量按頻次的分布;(2)引文按年代的分布;(3)引文按學科或主題的分布;(4)引文按文獻類型的分布;(5)引文按語種的分布;(6)引文按國別的分布;(7)引文按作者的分布;(8)引文按期刊的分布。3引文分析9.自引指標(1)學科自引率=引證本學科次數(shù)/引證文獻總次數(shù)*100%;(2)國家自引率=引證本國文獻次數(shù)/引證文獻總次數(shù)*100%;(3)期刊自引率=該刊自引的引文次數(shù)/該刊所有引文總次數(shù)*100%;(4)著者自引率=引證本人或與他人合作發(fā)表的論文次數(shù)/被引證文獻的總次數(shù)*100%。3引文分析3.7引文分析的主要應用引文分析法自上世紀二十年代產(chǎn)生以來,獲得了普遍重視和應用。特別是《科學引文索引》和《期刊引證報告》的問世,為引文分析法的應用提供了極為有利的條件和工具。

(1)測定學科的影響和重要性(學科期刊和論文被引);(2)研究學科結(jié)構(gòu)(同被引、耦合與學科交叉);(3)研究學科情報源分布(核心期刊、相關(guān)期刊、外圍期刊);(4)確定核心期刊(影響因子);(5)研究科學交流和情報傳遞規(guī)律(引用關(guān)系、引用網(wǎng)絡);(6)研究文獻老化和情報利用規(guī)律(普賴斯指數(shù)、引文中值年齡);(7)研究情報用戶的需求特點(引用動機、行為和特點);(8)科學水平和人才的評價(評選優(yōu)秀人才、預測獲獎者)。3引文分析3引文分析3.8引文分析的局限3引文分析3.8引文分析的局限3引文分析網(wǎng)絡信息計量文庭孝中南大學TEL-mail:wtxsomebody@知行合一、經(jīng)世致用CentralSouthUniversity

4.1網(wǎng)絡信息計量學概述

4.2網(wǎng)絡數(shù)據(jù)的獲取與處理

4.3網(wǎng)絡信息計量學的應用

4.4網(wǎng)絡信息計量的發(fā)展趨勢與研究方向

4網(wǎng)絡信息計量4.1網(wǎng)絡信息計量學概述

20世紀60年代以來,在圖書館學、文獻學、科學學和情報學領(lǐng)域相繼出現(xiàn)了3個類似的術(shù)語:Bibliometrics、Scientometrics、Informetrics,分別代表著三個十分相似的定量性的分支學科,即文獻計量學、科學計量學和信息計量學(情報計量學),之后由“三計學”又拓展為“五計學”(網(wǎng)絡計量學、知識計量學)。隨著現(xiàn)代信息技術(shù)的迅速發(fā)展以及互聯(lián)網(wǎng)的普及應用,信息資源由早期的實物化、紙質(zhì)化階段進入到電子化、數(shù)字化和網(wǎng)絡化階段,網(wǎng)絡信息交流活動迅速激增,原有的信息計量指標已不再適用于測度網(wǎng)絡信息資源,導致了信息計量學進一步發(fā)展成為“互聯(lián)網(wǎng)上的信息計量分析”(Webmetrics或Cybermetrics),之后又拓展為“在線科學交流的計量分析”,即補充計量學(Altmetrics)。網(wǎng)絡信息計量學的誕生,是三計學在數(shù)字網(wǎng)絡信息時代發(fā)展的必然結(jié)果。1、網(wǎng)絡信息計量學的產(chǎn)生與發(fā)展:產(chǎn)生背景4.1網(wǎng)絡信息計量學概述

1、網(wǎng)絡信息計量學的產(chǎn)生與發(fā)展:產(chǎn)生過程1990年P(guān)aisley提出將信息計量方法應用于電子通信領(lǐng)域,明確指出:電子信息將成為文獻計量學研究的主流。1996年,Mckiernan提出了Citedsites(被引網(wǎng)站)的概念,用以研究網(wǎng)頁之間的引用關(guān)系。1997年Almind等人在“JournalofDocumentation”上發(fā)表了《萬維網(wǎng)上的信息計量學:網(wǎng)絡計量方法門徑》(ImformationAnalysisonthe

WWW:MethodologicalApproachesto

“Webometrics”),首先提出了網(wǎng)絡信息計量學一詞。隨后,Larson提出了“Co-link(共鏈分析)”的概念。1997年,Rousseau提出了描述網(wǎng)站鏈接關(guān)系的專用術(shù)語“Sitations(網(wǎng)站引用)”。2004年,Thelwall進一步發(fā)展了共鏈分析方法。4.1網(wǎng)絡信息計量學概述1997年,網(wǎng)絡電子期刊Cybermetrics創(chuàng)刊。在每隔兩年召開的國際文獻計量學、信息計量學與科學計量學研討會上,從1997年開始加入了網(wǎng)絡計量學這個論題。1998年,Ingwersen基于鏈接分析和引用原理提出了“網(wǎng)絡影響因子”的概念,Thelwall、Smith等進一步發(fā)展了網(wǎng)絡影響因子。2001年,Born和Ingwersen進一步拓展了網(wǎng)絡計量學的研究領(lǐng)域。2004年,Born和Ingwersen在文獻計量學和信息計量學的基礎(chǔ)上構(gòu)建了網(wǎng)絡計量學的概念體系,標志著網(wǎng)絡計量學的正式誕生。4.1網(wǎng)絡信息計量學概述目前國際上有六本計量學專業(yè)期刊:比利時:Scientometrics(科學計量學)主編:魯汶大學RonaldRousseau(羅納德·魯索)-普賴斯獎美國:JournalofInformetrics(信息計量學雜志)主編:德雷塞爾大學

陳超美美國:QuantitativeScien

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論