網(wǎng)絡(luò)信息分類法_第1頁(yè)
網(wǎng)絡(luò)信息分類法_第2頁(yè)
網(wǎng)絡(luò)信息分類法_第3頁(yè)
網(wǎng)絡(luò)信息分類法_第4頁(yè)
網(wǎng)絡(luò)信息分類法_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第五章第五章 網(wǎng)絡(luò)信息分類法網(wǎng)絡(luò)信息分類法 第一節(jié)第一節(jié) 概述概述第二節(jié)第二節(jié) 網(wǎng)絡(luò)信息分類法的編制網(wǎng)絡(luò)信息分類法的編制第三節(jié)第三節(jié) 網(wǎng)絡(luò)信息分類組織和著錄網(wǎng)絡(luò)信息分類組織和著錄第一節(jié)第一節(jié) 概述概述v網(wǎng)絡(luò)信息的特點(diǎn):數(shù)量巨大而繁雜;網(wǎng)絡(luò)信息的特點(diǎn):數(shù)量巨大而繁雜;內(nèi)容范圍廣泛;信息類型眾多;動(dòng)內(nèi)容范圍廣泛;信息類型眾多;動(dòng)態(tài)性高;超文本鏈接;有序與無(wú)序。態(tài)性高;超文本鏈接;有序與無(wú)序。v網(wǎng)絡(luò)信息用戶的特點(diǎn):用戶范圍極網(wǎng)絡(luò)信息用戶的特點(diǎn):用戶范圍極廣;受教育程度差別極大;利用網(wǎng)廣;受教育程度差別極大;利用網(wǎng)絡(luò)信息的目的和類型存在明顯差異;絡(luò)信息的目的和類型存在明顯差異;用戶使用的網(wǎng)絡(luò)服務(wù)不同

2、。用戶使用的網(wǎng)絡(luò)服務(wù)不同。 v網(wǎng)絡(luò)信息技術(shù)環(huán)境的特點(diǎn):網(wǎng)絡(luò)信息技術(shù)環(huán)境的特點(diǎn):TCP/IPTCP/IP、數(shù)字技術(shù)、多媒體技術(shù)、超文本、數(shù)字技術(shù)、多媒體技術(shù)、超文本、WWWWWW、人工智能、數(shù)據(jù)庫(kù)技術(shù)及相應(yīng)人工智能、數(shù)據(jù)庫(kù)技術(shù)及相應(yīng)的硬件等。的硬件等。 網(wǎng)絡(luò)信息的組織和網(wǎng)絡(luò)網(wǎng)絡(luò)信息的組織和網(wǎng)絡(luò)信息分類法的編制,只有與當(dāng)時(shí)網(wǎng)信息分類法的編制,只有與當(dāng)時(shí)網(wǎng)絡(luò)信息環(huán)境技術(shù)相適應(yīng),才能最大絡(luò)信息環(huán)境技術(shù)相適應(yīng),才能最大限度地發(fā)揮信息組織的作用。限度地發(fā)揮信息組織的作用。網(wǎng)絡(luò)信息分類法與傳統(tǒng)分類法比較網(wǎng)絡(luò)信息分類法與傳統(tǒng)分類法比較1. 分類對(duì)象:傳統(tǒng)分類法以物理的、分類對(duì)象:傳統(tǒng)分類法以物理的、實(shí)體的文獻(xiàn)

3、,如印刷型文獻(xiàn)、磁帶、實(shí)體的文獻(xiàn),如印刷型文獻(xiàn)、磁帶、光盤等為主要處理對(duì)象,對(duì)文獻(xiàn)的光盤等為主要處理對(duì)象,對(duì)文獻(xiàn)的內(nèi)容進(jìn)行標(biāo)引和整序。網(wǎng)絡(luò)信息分內(nèi)容進(jìn)行標(biāo)引和整序。網(wǎng)絡(luò)信息分類法以數(shù)百萬(wàn)計(jì)服務(wù)器上的信息資類法以數(shù)百萬(wàn)計(jì)服務(wù)器上的信息資源為處理對(duì)象,對(duì)它們進(jìn)行組織篩源為處理對(duì)象,對(duì)它們進(jìn)行組織篩選,信息數(shù)字式、多媒體、動(dòng)態(tài)、選,信息數(shù)字式、多媒體、動(dòng)態(tài)、虛擬的。虛擬的。2. 信息的知識(shí)范圍:傳統(tǒng)分類法以文獻(xiàn)收信息的知識(shí)范圍:傳統(tǒng)分類法以文獻(xiàn)收藏部門為使用對(duì)象,文獻(xiàn)的出版是受控藏部門為使用對(duì)象,文獻(xiàn)的出版是受控制的、內(nèi)容是經(jīng)過(guò)一定篩選的,分類體制的、內(nèi)容是經(jīng)過(guò)一定篩選的,分類體系具有穩(wěn)定性。網(wǎng)絡(luò)信

4、息分類法以搜索系具有穩(wěn)定性。網(wǎng)絡(luò)信息分類法以搜索引擎或大型網(wǎng)站為使用對(duì)象,網(wǎng)絡(luò)信息引擎或大型網(wǎng)站為使用對(duì)象,網(wǎng)絡(luò)信息總體上是不受控制的,幾乎包含了人類總體上是不受控制的,幾乎包含了人類一切知識(shí)領(lǐng)域,要求其具有高度的靈活一切知識(shí)領(lǐng)域,要求其具有高度的靈活性和適應(yīng)網(wǎng)絡(luò)信息的動(dòng)態(tài)性。性和適應(yīng)網(wǎng)絡(luò)信息的動(dòng)態(tài)性。3. 分類法的功能:傳統(tǒng)分類法通過(guò)對(duì)分類法的功能:傳統(tǒng)分類法通過(guò)對(duì)全部文獻(xiàn)標(biāo)引,編制分類檢索工具,全部文獻(xiàn)標(biāo)引,編制分類檢索工具,組織分類排架,分類標(biāo)引基本是手組織分類排架,分類標(biāo)引基本是手工的。網(wǎng)絡(luò)分類法通過(guò)對(duì)網(wǎng)絡(luò)信息工的。網(wǎng)絡(luò)分類法通過(guò)對(duì)網(wǎng)絡(luò)信息的標(biāo)引,建立網(wǎng)絡(luò)信息分類導(dǎo)航系的標(biāo)引,建立網(wǎng)絡(luò)

5、信息分類導(dǎo)航系統(tǒng),提供瀏覽式檢索手段,分類導(dǎo)統(tǒng),提供瀏覽式檢索手段,分類導(dǎo)航系統(tǒng)的建立和維護(hù)主要是手工式航系統(tǒng)的建立和維護(hù)主要是手工式的,也有人機(jī)結(jié)合。的,也有人機(jī)結(jié)合。4. 分類標(biāo)記:是傳統(tǒng)分類法不可缺少分類標(biāo)記:是傳統(tǒng)分類法不可缺少的組成部分。網(wǎng)絡(luò)分類法組織虛擬的組成部分。網(wǎng)絡(luò)分類法組織虛擬信息,一個(gè)類目就是一類相關(guān)信息信息,一個(gè)類目就是一類相關(guān)信息的節(jié)點(diǎn),不涉及物理排列,用戶不的節(jié)點(diǎn),不涉及物理排列,用戶不需要根據(jù)分類標(biāo)記索取信息,也無(wú)需要根據(jù)分類標(biāo)記索取信息,也無(wú)須使用分類標(biāo)記,但作為網(wǎng)絡(luò)分類須使用分類標(biāo)記,但作為網(wǎng)絡(luò)分類法的后臺(tái)運(yùn)作,分類標(biāo)記有用。法的后臺(tái)運(yùn)作,分類標(biāo)記有用。 5.

6、編制方法:編制方法:1) 知識(shí)框架。前者以文獻(xiàn)內(nèi)容的學(xué)科知識(shí)框架。前者以文獻(xiàn)內(nèi)容的學(xué)科屬性為主要的聚類標(biāo)準(zhǔn),形成學(xué)科屬性為主要的聚類標(biāo)準(zhǔn),形成學(xué)科分類和高校專業(yè)設(shè)置為基礎(chǔ),兼顧分類和高校專業(yè)設(shè)置為基礎(chǔ),兼顧文獻(xiàn)特點(diǎn)的分類大綱。后者以主題文獻(xiàn)特點(diǎn)的分類大綱。后者以主題為主要標(biāo)準(zhǔn),把相關(guān)的信息加以集為主要標(biāo)準(zhǔn),把相關(guān)的信息加以集中,構(gòu)成符合各類用戶查詢習(xí)慣的中,構(gòu)成符合各類用戶查詢習(xí)慣的大綱。大綱。2) 前者體系是唯一的。后者可以有兩前者體系是唯一的。后者可以有兩個(gè)以上的分類體系,主從并用,滿個(gè)以上的分類體系,主從并用,滿足不同查詢需要。足不同查詢需要。3) 類目劃分:前者線性體系。后者的類目劃分

7、:前者線性體系。后者的劃分不嚴(yán)格按等級(jí)進(jìn)行,如跳躍式劃分不嚴(yán)格按等級(jí)進(jìn)行,如跳躍式劃分;主題多重屬性關(guān)系和相關(guān)關(guān)劃分;主題多重屬性關(guān)系和相關(guān)關(guān)系采用交叉列類、超文本連接和多系采用交叉列類、超文本連接和多窗口顯示,網(wǎng)狀體系。窗口顯示,網(wǎng)狀體系。4) 類目排列:前者強(qiáng)調(diào)類目之間的內(nèi)類目排列:前者強(qiáng)調(diào)類目之間的內(nèi)容聯(lián)系和邏輯關(guān)系,科學(xué)性、規(guī)律容聯(lián)系和邏輯關(guān)系,科學(xué)性、規(guī)律性強(qiáng)。后者為了方便、快速、自動(dòng)性強(qiáng)。后者為了方便、快速、自動(dòng)地排列眾多同位類,也廣泛使用字地排列眾多同位類,也廣泛使用字順、重要性排列法。順、重要性排列法。5) 說(shuō)明和注釋:前者將其作為標(biāo)引人說(shuō)明和注釋:前者將其作為標(biāo)引人員的重要參

8、考。后者不設(shè)參照注釋,員的重要參考。后者不設(shè)參照注釋,有選擇地列舉下位類,便于鏈接有選擇地列舉下位類,便于鏈接。6) 類名:前者力求科學(xué)、準(zhǔn)確、規(guī)范,類名:前者力求科學(xué)、準(zhǔn)確、規(guī)范,穩(wěn)定性高。后者選擇類名更注意面穩(wěn)定性高。后者選擇類名更注意面向用戶,力求通俗易懂、時(shí)新、簡(jiǎn)向用戶,力求通俗易懂、時(shí)新、簡(jiǎn)練,準(zhǔn)確性不如前者,面向用戶和練,準(zhǔn)確性不如前者,面向用戶和面向后臺(tái)技術(shù)運(yùn)作的類名可以不一面向后臺(tái)技術(shù)運(yùn)作的類名可以不一致。致。7) 維護(hù):前者修訂很慎重。后者可隨維護(hù):前者修訂很慎重。后者可隨時(shí)修訂,但更復(fù)雜、繁重。時(shí)修訂,但更復(fù)雜、繁重。 傳統(tǒng)分類法在網(wǎng)絡(luò)信息組織中的應(yīng)用傳統(tǒng)分類法在網(wǎng)絡(luò)信息組

9、織中的應(yīng)用v應(yīng)用現(xiàn)狀。一些著名的分類法被網(wǎng)應(yīng)用現(xiàn)狀。一些著名的分類法被網(wǎng)站或搜索引擎用來(lái)組織網(wǎng)絡(luò)信息。站或搜索引擎用來(lái)組織網(wǎng)絡(luò)信息。例如,加拿大的主題信息系統(tǒng)例如,加拿大的主題信息系統(tǒng)“Canadian Information by Subject”應(yīng)用應(yīng)用DDC的分類系統(tǒng);美的分類系統(tǒng);美國(guó)依阿華洲立大學(xué)應(yīng)用國(guó)依阿華洲立大學(xué)應(yīng)用LCC開(kāi)發(fā)開(kāi)發(fā)“Cyber Stacks”等。等。v分類法在網(wǎng)絡(luò)信息上的應(yīng)用,大體分類法在網(wǎng)絡(luò)信息上的應(yīng)用,大體有兩種類型:一是以某個(gè)分類法為有兩種類型:一是以某個(gè)分類法為依據(jù),經(jīng)過(guò)必要的改造后作為組織依據(jù),經(jīng)過(guò)必要的改造后作為組織網(wǎng)絡(luò)信息的主體,多數(shù)建立瀏覽結(jié)網(wǎng)絡(luò)信

10、息的主體,多數(shù)建立瀏覽結(jié)構(gòu),應(yīng)用的主要范圍是大學(xué)、圖書構(gòu),應(yīng)用的主要范圍是大學(xué)、圖書館、學(xué)術(shù)性網(wǎng)站;館、學(xué)術(shù)性網(wǎng)站;二是在設(shè)計(jì)分類導(dǎo)航系統(tǒng)時(shí),在整體二是在設(shè)計(jì)分類導(dǎo)航系統(tǒng)時(shí),在整體上或局部上參考一個(gè)或幾個(gè)文獻(xiàn)分上或局部上參考一個(gè)或幾個(gè)文獻(xiàn)分類法的類目體系,這是主要應(yīng)用形類法的類目體系,這是主要應(yīng)用形式。文獻(xiàn)分類法直接用于網(wǎng)絡(luò)信息式。文獻(xiàn)分類法直接用于網(wǎng)絡(luò)信息組織(網(wǎng)站、搜索引擎),目前處組織(網(wǎng)站、搜索引擎),目前處于起步階段,影響微乎其微。于起步階段,影響微乎其微。文獻(xiàn)分類法用于網(wǎng)絡(luò)信息組織的優(yōu)勢(shì)文獻(xiàn)分類法用于網(wǎng)絡(luò)信息組織的優(yōu)勢(shì)1. 文獻(xiàn)分類法幾乎都是綜合性分類法,文獻(xiàn)分類法幾乎都是綜合性分

11、類法,涵蓋人類知識(shí)的各學(xué)科領(lǐng)域,具有涵蓋人類知識(shí)的各學(xué)科領(lǐng)域,具有很高的通用性。很高的通用性。2. 文獻(xiàn)分類法的編制和運(yùn)用既有成熟文獻(xiàn)分類法的編制和運(yùn)用既有成熟的理論和技術(shù)支持,也積累了豐富的理論和技術(shù)支持,也積累了豐富的實(shí)踐經(jīng)驗(yàn),嚴(yán)格的詞匯控制和完的實(shí)踐經(jīng)驗(yàn),嚴(yán)格的詞匯控制和完善的語(yǔ)義網(wǎng)絡(luò),有助于網(wǎng)絡(luò)信息的善的語(yǔ)義網(wǎng)絡(luò),有助于網(wǎng)絡(luò)信息的篩選和組織。篩選和組織。3. 文獻(xiàn)分類法是一個(gè)完整的知識(shí)分類等級(jí)文獻(xiàn)分類法是一個(gè)完整的知識(shí)分類等級(jí)體系,類目之間嚴(yán)密的邏輯關(guān)系,全面體系,類目之間嚴(yán)密的邏輯關(guān)系,全面揭示了知識(shí)的內(nèi)在聯(lián)系,非常適合于瀏揭示了知識(shí)的內(nèi)在聯(lián)系,非常適合于瀏覽檢索和對(duì)主題進(jìn)行分類控制

12、,是目前覽檢索和對(duì)主題進(jìn)行分類控制,是目前搜索引擎所不能達(dá)到的。搜索引擎所不能達(dá)到的。4. 文獻(xiàn)分類法正向電子化和分類文獻(xiàn)分類法正向電子化和分類-主題一體主題一體化方向發(fā)展,更適合于對(duì)網(wǎng)絡(luò)信息的組化方向發(fā)展,更適合于對(duì)網(wǎng)絡(luò)信息的組織織文獻(xiàn)分類法適應(yīng)網(wǎng)絡(luò)信息組織的改造文獻(xiàn)分類法適應(yīng)網(wǎng)絡(luò)信息組織的改造n增加必要的非學(xué)術(shù)信息類目,包容增加必要的非學(xué)術(shù)信息類目,包容網(wǎng)絡(luò)上的各類信息和多媒體資源,網(wǎng)絡(luò)上的各類信息和多媒體資源,適當(dāng)突出信息量大、利用率高的類適當(dāng)突出信息量大、利用率高的類目。目。n把按學(xué)科聚類和按主題聚類結(jié)合起把按學(xué)科聚類和按主題聚類結(jié)合起來(lái),滿足不同出發(fā)點(diǎn)的瀏覽查詢需來(lái),滿足不同出發(fā)點(diǎn)的

13、瀏覽查詢需要。要。n簡(jiǎn)化類目劃分層次,讓全部類目為列簡(jiǎn)化類目劃分層次,讓全部類目為列舉式的,歸并一些不合適網(wǎng)絡(luò)信息組舉式的,歸并一些不合適網(wǎng)絡(luò)信息組織的類目。織的類目。n把類目的線性結(jié)構(gòu)改造成網(wǎng)狀結(jié)構(gòu),把類目的線性結(jié)構(gòu)改造成網(wǎng)狀結(jié)構(gòu),滿足多途徑瀏覽檢索的需要。以交叉滿足多途徑瀏覽檢索的需要。以交叉列類方式和超文本鏈接把相關(guān)主題聯(lián)列類方式和超文本鏈接把相關(guān)主題聯(lián)系起來(lái);通過(guò)分面分析和多重列類,系起來(lái);通過(guò)分面分析和多重列類,實(shí)現(xiàn)對(duì)一個(gè)類目的多標(biāo)準(zhǔn)劃分。實(shí)現(xiàn)對(duì)一個(gè)類目的多標(biāo)準(zhǔn)劃分。n類目注釋要突出內(nèi)容含義的說(shuō)明和類目注釋要突出內(nèi)容含義的說(shuō)明和類目關(guān)系的指引,刪除與網(wǎng)絡(luò)檢索類目關(guān)系的指引,刪除與網(wǎng)絡(luò)

14、檢索用戶無(wú)關(guān)的注釋。用戶無(wú)關(guān)的注釋。n提高對(duì)網(wǎng)絡(luò)信息多屬性、多視角的提高對(duì)網(wǎng)絡(luò)信息多屬性、多視角的揭示。揭示。n分類法的界面要適應(yīng)網(wǎng)絡(luò)環(huán)境的特分類法的界面要適應(yīng)網(wǎng)絡(luò)環(huán)境的特點(diǎn)。點(diǎn)。網(wǎng)絡(luò)信息分類法的功能網(wǎng)絡(luò)信息分類法的功能1. 滿足對(duì)互聯(lián)網(wǎng)上各種類型信息組織滿足對(duì)互聯(lián)網(wǎng)上各種類型信息組織的需要;的需要;2. 滿足對(duì)互聯(lián)網(wǎng)上各個(gè)知識(shí)領(lǐng)域信息滿足對(duì)互聯(lián)網(wǎng)上各個(gè)知識(shí)領(lǐng)域信息組織的需要;組織的需要;3. 具有科學(xué)性、實(shí)用、能滿足各類用具有科學(xué)性、實(shí)用、能滿足各類用戶瀏覽查詢的動(dòng)態(tài)分類體系;戶瀏覽查詢的動(dòng)態(tài)分類體系;4. 充分揭示信息知識(shí)的內(nèi)容相關(guān)性;充分揭示信息知識(shí)的內(nèi)容相關(guān)性;5. 能對(duì)搜索的信息進(jìn)行

15、有效的控制和能對(duì)搜索的信息進(jìn)行有效的控制和過(guò)濾;過(guò)濾;6. 面向最終用戶;面向最終用戶;7. 能與主題檢索相互配合;能與主題檢索相互配合;8. 有豐富的信息輸出。有豐富的信息輸出。網(wǎng)絡(luò)信息分類組織與主題組織的關(guān)系網(wǎng)絡(luò)信息分類組織與主題組織的關(guān)系nWWWWWW的問(wèn)世的問(wèn)世,使世界的信息傳播和利,使世界的信息傳播和利用進(jìn)入了一個(gè)嶄新的時(shí)代;用進(jìn)入了一個(gè)嶄新的時(shí)代;1994年年后搜索引擎異軍突起,給人們的信后搜索引擎異軍突起,給人們的信息查詢帶來(lái)巨大的便利,但單純的息查詢帶來(lái)巨大的便利,但單純的自然語(yǔ)言檢索經(jīng)常會(huì)給你提供許多自然語(yǔ)言檢索經(jīng)常會(huì)給你提供許多風(fēng)馬牛不相及的信息。表明信息數(shù)風(fēng)馬牛不相及的信

16、息。表明信息數(shù)量越大,越需要受到控制。量越大,越需要受到控制。信息的分類查詢和主題查詢是最基本的查詢需要信息的分類查詢和主題查詢是最基本的查詢需要1. 信息的檢索離不開(kāi)分類和主題兩種信息的檢索離不開(kāi)分類和主題兩種基本方法;基本方法;2. 互聯(lián)網(wǎng)上需要分類查詢與主題查詢互聯(lián)網(wǎng)上需要分類查詢與主題查詢的一體化。在特定知識(shí)范圍內(nèi)進(jìn)行的一體化。在特定知識(shí)范圍內(nèi)進(jìn)行字順檢索;用特定的類限定字順檢字順檢索;用特定的類限定字順檢索。索。n分類法在網(wǎng)絡(luò)信息組織中的地位日分類法在網(wǎng)絡(luò)信息組織中的地位日益重要。益重要。網(wǎng)絡(luò)信息的自動(dòng)分類問(wèn)題網(wǎng)絡(luò)信息的自動(dòng)分類問(wèn)題n搜索引擎或門戶網(wǎng)站的分類導(dǎo)航系搜索引擎或門戶網(wǎng)站的

17、分類導(dǎo)航系統(tǒng)人工標(biāo)引和維護(hù)與網(wǎng)絡(luò)信息增長(zhǎng)統(tǒng)人工標(biāo)引和維護(hù)與網(wǎng)絡(luò)信息增長(zhǎng)的矛盾,要求分類導(dǎo)航系統(tǒng)的自動(dòng)的矛盾,要求分類導(dǎo)航系統(tǒng)的自動(dòng)標(biāo)引和維護(hù)。標(biāo)引和維護(hù)。n我們所講的網(wǎng)絡(luò)信息自動(dòng)分類,是我們所講的網(wǎng)絡(luò)信息自動(dòng)分類,是針對(duì)針對(duì)網(wǎng)站網(wǎng)站的整體,針對(duì)文本信息而的整體,針對(duì)文本信息而言。言。自動(dòng)分類的類型和程序自動(dòng)分類的類型和程序n 類型:兩種。類型:兩種。1. 自動(dòng)聚類,就是由計(jì)算機(jī)系統(tǒng)對(duì)待自動(dòng)聚類,就是由計(jì)算機(jī)系統(tǒng)對(duì)待分類文本進(jìn)行分析并提取有關(guān)特征,分類文本進(jìn)行分析并提取有關(guān)特征,然后對(duì)提取的特征進(jìn)行比較,根據(jù)然后對(duì)提取的特征進(jìn)行比較,根據(jù)一定的規(guī)則將具有相同或相近特征一定的規(guī)則將具有相同或相近特

18、征的對(duì)象定義為一類。的對(duì)象定義為一類。2. 自動(dòng)歸類,就是計(jì)算機(jī)系統(tǒng)對(duì)待分自動(dòng)歸類,就是計(jì)算機(jī)系統(tǒng)對(duì)待分類文本進(jìn)行分析并提取有關(guān)的特征,類文本進(jìn)行分析并提取有關(guān)的特征,然后與既定分類體系中對(duì)象所具有然后與既定分類體系中對(duì)象所具有的公共特征進(jìn)行相關(guān)性比較,將對(duì)的公共特征進(jìn)行相關(guān)性比較,將對(duì)象歸入與其特征最相近的類中?;髿w入與其特征最相近的類中?;谠~的自動(dòng)分類和基于專家系統(tǒng)的于詞的自動(dòng)分類和基于專家系統(tǒng)的自動(dòng)分類。自動(dòng)分類。n 程序,大體包括信息采集、文檔表程序,大體包括信息采集、文檔表示、抽取分類特征、相似性匹配、示、抽取分類特征、相似性匹配、網(wǎng)站信息整理等步驟。網(wǎng)站信息整理等步驟。1. 網(wǎng)

19、絡(luò)機(jī)器人網(wǎng)絡(luò)機(jī)器人robot按一定規(guī)則和策按一定規(guī)則和策略循環(huán)運(yùn)行搜集信息。略循環(huán)運(yùn)行搜集信息。2. 加工網(wǎng)站主頁(yè)信息,分析結(jié)構(gòu)布局,加工網(wǎng)站主頁(yè)信息,分析結(jié)構(gòu)布局,判斷網(wǎng)站主題范圍。判斷網(wǎng)站主題范圍。3. 對(duì)文本進(jìn)行分詞,抽取表達(dá)網(wǎng)站主對(duì)文本進(jìn)行分詞,抽取表達(dá)網(wǎng)站主題內(nèi)容的語(yǔ)詞;分析語(yǔ)詞的重要程題內(nèi)容的語(yǔ)詞;分析語(yǔ)詞的重要程度、詞頻統(tǒng)計(jì),給出權(quán)值,以確定度、詞頻統(tǒng)計(jì),給出權(quán)值,以確定哪些可作為網(wǎng)站主題內(nèi)容的特征項(xiàng)。哪些可作為網(wǎng)站主題內(nèi)容的特征項(xiàng)。4. 將抽取的特征項(xiàng)與分類知識(shí)庫(kù)所形將抽取的特征項(xiàng)與分類知識(shí)庫(kù)所形成的矢量空間模型進(jìn)行相似性匹配,成的矢量空間模型進(jìn)行相似性匹配,以能涵蓋各特征項(xiàng)的

20、類目為主要類以能涵蓋各特征項(xiàng)的類目為主要類目,其他為次要類目。目,其他為次要類目。5. 編制網(wǎng)站的提要及其他說(shuō)明標(biāo)識(shí)。編制網(wǎng)站的提要及其他說(shuō)明標(biāo)識(shí)。6. 經(jīng)過(guò)標(biāo)引、著錄的網(wǎng)站存入索引數(shù)經(jīng)過(guò)標(biāo)引、著錄的網(wǎng)站存入索引數(shù)據(jù)庫(kù)。據(jù)庫(kù)。7. 把網(wǎng)站加進(jìn)分類導(dǎo)航系統(tǒng),并自動(dòng)把網(wǎng)站加進(jìn)分類導(dǎo)航系統(tǒng),并自動(dòng)進(jìn)行排序。進(jìn)行排序。第二節(jié)第二節(jié) 網(wǎng)絡(luò)信息分類法的編制網(wǎng)絡(luò)信息分類法的編制n 網(wǎng)絡(luò)信息分類導(dǎo)航系統(tǒng)中查詢界網(wǎng)絡(luò)信息分類導(dǎo)航系統(tǒng)中查詢界面、類目體系、各級(jí)類目及其鏈面、類目體系、各級(jí)類目及其鏈接的網(wǎng)絡(luò)信息是它的分類法部分。接的網(wǎng)絡(luò)信息是它的分類法部分。n 知識(shí)分類體系的構(gòu)建。綜合性搜知識(shí)分類體系的構(gòu)建。綜合性

21、搜索引擎與專業(yè)性搜索引擎或網(wǎng)站索引擎與專業(yè)性搜索引擎或網(wǎng)站不同。不同。1. 聚類的標(biāo)準(zhǔn)。主要標(biāo)準(zhǔn)聚類的標(biāo)準(zhǔn)。主要標(biāo)準(zhǔn)“主題和專主題和專題題”,學(xué)科和專業(yè)作為輔助標(biāo)準(zhǔn);,學(xué)科和專業(yè)作為輔助標(biāo)準(zhǔn);專業(yè)分類法可以學(xué)科或?qū)I(yè)為主要專業(yè)分類法可以學(xué)科或?qū)I(yè)為主要聚類標(biāo)準(zhǔn),或二者結(jié)合。聚類標(biāo)準(zhǔn),或二者結(jié)合。2. 大類的設(shè)置。數(shù)量大類的設(shè)置。數(shù)量1520個(gè);大個(gè);大類設(shè)置要有較高的穩(wěn)定性,通常一、類設(shè)置要有較高的穩(wěn)定性,通常一、二級(jí)類目構(gòu)成網(wǎng)絡(luò)信息分類法組織二級(jí)類目構(gòu)成網(wǎng)絡(luò)信息分類法組織的核心框架。的核心框架。3. 分類體系展開(kāi)的層次。它決定著分分類體系展開(kāi)的層次。它決定著分類導(dǎo)航系統(tǒng)、知識(shí)地圖的詳略程度;

22、類導(dǎo)航系統(tǒng)、知識(shí)地圖的詳略程度;36級(jí)之間。級(jí)之間。4. 類目的種類:包括子類和網(wǎng)站兩種。類目的種類:包括子類和網(wǎng)站兩種。網(wǎng)站是分類系統(tǒng)展開(kāi)的最末級(jí),點(diǎn)網(wǎng)站是分類系統(tǒng)展開(kāi)的最末級(jí),點(diǎn)擊后進(jìn)入不屬于分類系統(tǒng)的網(wǎng)頁(yè)。擊后進(jìn)入不屬于分類系統(tǒng)的網(wǎng)頁(yè)。GoogleG網(wǎng)頁(yè)目錄網(wǎng)頁(yè)目錄kids and teenspre-schoolCategories: ABCs and 123s(56) games(33) shapes and colors(32)Web pages: noggin-http:/ kidsCom Jr-http:/ 類目名稱。準(zhǔn)確、通用和精練。類目名稱。準(zhǔn)確、通用和精練。6. 多分類體系

23、的運(yùn)用。多分類體系的運(yùn)用?!爸髦?從分類體從分類體系系”。例如,。例如, 主分類體系主分類體系 娛樂(lè)休閑、求職與招聘、藝術(shù)、生活服務(wù)、娛樂(lè)休閑、求職與招聘、藝術(shù)、生活服務(wù)、文學(xué)、計(jì)算機(jī)與互聯(lián)網(wǎng)、教育就業(yè)、體育健文學(xué)、計(jì)算機(jī)與互聯(lián)網(wǎng)、教育就業(yè)、體育健身、醫(yī)療健康、社會(huì)文化、科學(xué)技術(shù)、社會(huì)身、醫(yī)療健康、社會(huì)文化、科學(xué)技術(shù)、社會(huì)科學(xué)、政治軍事、新聞媒體、參考資料、個(gè)科學(xué)、政治軍事、新聞媒體、參考資料、個(gè)人主頁(yè)、商業(yè)經(jīng)濟(jì)、少兒搜索人主頁(yè)、商業(yè)經(jīng)濟(jì)、少兒搜索SinaS cn 的從分類體系的從分類體系新聞、財(cái)經(jīng)、娛樂(lè)、房產(chǎn)、女性游戲、旅新聞、財(cái)經(jīng)、娛樂(lè)、房產(chǎn)、女性游戲、旅游、校園、動(dòng)漫、同學(xué)錄、企業(yè)、短信

24、游、校園、動(dòng)漫、同學(xué)錄、企業(yè)、短信體育、科技、音樂(lè)、汽車、體育、科技、音樂(lè)、汽車、類目的劃分與設(shè)置類目的劃分與設(shè)置1. 分類標(biāo)準(zhǔn)及使用次序。主題分類法,分類標(biāo)準(zhǔn)及使用次序。主題分類法,以事物為主要聚類標(biāo)準(zhǔn);以事物為主要聚類標(biāo)準(zhǔn);“多重列多重列類類”為網(wǎng)絡(luò)分類法類目劃分的重要為網(wǎng)絡(luò)分類法類目劃分的重要方法。方法。2. 類目的均衡性。同一級(jí)的各個(gè)類目類目的均衡性。同一級(jí)的各個(gè)類目包含的信息不應(yīng)相差太懸殊,否則包含的信息不應(yīng)相差太懸殊,否則增加不必要的瀏覽路徑,影響分類增加不必要的瀏覽路徑,影響分類導(dǎo)航的效果。導(dǎo)航的效果。Dir.S(2005.9)n搜索分類搜索分類 文學(xué)文學(xué)小說(shuō)小說(shuō)(1544115

25、441)網(wǎng)上書庫(kù)網(wǎng)上書庫(kù)(193)(193)網(wǎng)上書店網(wǎng)上書店(125125)散文雜著散文雜著(1325)(1325)作家作品作家作品(10617)(10617)校園文學(xué)校園文學(xué)(2212)(2212)影視文學(xué)影視文學(xué)(33)(33)古典文學(xué)古典文學(xué)(994)(994)藝術(shù)藝術(shù)( (93418459341845) )組織機(jī)構(gòu)組織機(jī)構(gòu)(19)(19)論壇聊天論壇聊天(6464)3. 突出重點(diǎn)的類目。把信息量大、點(diǎn)突出重點(diǎn)的類目。把信息量大、點(diǎn)擊頻率高的知識(shí)范疇突出列類。擊頻率高的知識(shí)范疇突出列類。4. 類目設(shè)置的規(guī)律性。某些形式類目類目設(shè)置的規(guī)律性。某些形式類目如果再按知識(shí)的內(nèi)容細(xì)分,要盡量如果再

26、按知識(shí)的內(nèi)容細(xì)分,要盡量采取與傳統(tǒng)分類法一致的做法。采取與傳統(tǒng)分類法一致的做法。類目交叉關(guān)系的處理類目交叉關(guān)系的處理1. 縱向等級(jí)關(guān)系的處理。從大類到各縱向等級(jí)關(guān)系的處理。從大類到各級(jí)類目均可設(shè)置必要的平行體系。級(jí)類目均可設(shè)置必要的平行體系。2. 橫向相關(guān)關(guān)系的處理。設(shè)置橫向相關(guān)關(guān)系的處理。設(shè)置“交叉交叉類目類目”。類目與信息的排列類目與信息的排列n原則和方法。原則和方法。n類目排列:類目排列:“內(nèi)容相關(guān)內(nèi)容相關(guān)”、“邏輯邏輯相關(guān)相關(guān)”、“形式相關(guān)形式相關(guān)”。n網(wǎng)站信息排列:重要程度、點(diǎn)擊頻網(wǎng)站信息排列:重要程度、點(diǎn)擊頻率、字順。率、字順。n 類目注釋和說(shuō)明:兩種方式。類目注釋和說(shuō)明:兩種方式

27、。1. 簡(jiǎn)練的文字指明該類所含簡(jiǎn)練的文字指明該類所含/不包含不包含內(nèi)容范圍;內(nèi)容范圍;2. 列舉下位類揭示本類內(nèi)容范圍,或列舉下位類揭示本類內(nèi)容范圍,或提示重點(diǎn)、熱點(diǎn)、隱藏較深的內(nèi)容。提示重點(diǎn)、熱點(diǎn)、隱藏較深的內(nèi)容。用戶界面基本要求用戶界面基本要求1. 視覺(jué)感覺(jué)友好;視覺(jué)感覺(jué)友好;2. 不同的類目區(qū)分排列;不同的類目區(qū)分排列;3. 劃分的子類與網(wǎng)站信息分別排列;劃分的子類與網(wǎng)站信息分別排列;4. 設(shè)置路徑指示;設(shè)置路徑指示;5. 大類跳轉(zhuǎn)要方便:固定欄目、下拉大類跳轉(zhuǎn)要方便:固定欄目、下拉菜單、窗口等形式列出大類目錄。菜單、窗口等形式列出大類目錄。6. 設(shè)置設(shè)置“幫助幫助”:把用戶查詢中可能:

28、把用戶查詢中可能遇到的問(wèn)題以及檢索技巧等做成幫遇到的問(wèn)題以及檢索技巧等做成幫助文件,在檢索界面設(shè)置,供用戶助文件,在檢索界面設(shè)置,供用戶在查詢中隨時(shí)調(diào)用。在查詢中隨時(shí)調(diào)用。S 軍事軍事武器裝備武器裝備 戰(zhàn)爭(zhēng)戰(zhàn)爭(zhēng) 軍事演習(xí)軍事演習(xí) 戰(zhàn)略戰(zhàn)術(shù)戰(zhàn)略戰(zhàn)術(shù)軍事理論軍事理論 軍事論壇軍事論壇 軍事文學(xué)軍事文學(xué) 軍事院校軍事院校新聞媒體新聞媒體 組織機(jī)構(gòu)組織機(jī)構(gòu) 活動(dòng)活動(dòng) web directoriesEducationhigher educationCategories_Academic competitions booksCollege and university planning(457)Site listing by popularity_ Mailbase-electronic mailing list service for research in higher edu

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論