版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
信息檢索說(shuō)到搜索,你會(huì)想到什么?WhatisInformationRetrieval3(60)S(ogou)B(aidu)大戰(zhàn)360產(chǎn)品簡(jiǎn)單、免費(fèi)、親民,流氓與否不重要,用戶用得爽就好!你的桌面有多少360應(yīng)用?搜索入口更改跳轉(zhuǎn)集成其他內(nèi)容資源元搜索引擎(聚合)朝陽(yáng)發(fā)話,我們也參戰(zhàn)搜狗成炮灰搜索不是一天建成的搜索的冰山一角界面的力量1997年Yahoo問(wèn)題1:分類(lèi)組織對(duì)于搜索的意義何在?問(wèn)題2:Google搜索界面為何十余年一成不變,背后的原因是什么?Keywordssearchkillsubjectcategory!!搜索結(jié)果頁(yè)面包含哪些元素?Pre-2012搜索對(duì)電子商務(wù)的意義何在?淘寶的起家現(xiàn)在淘寶的搜索快速交友檢索系統(tǒng)元數(shù)據(jù)揭示查詢限定動(dòng)態(tài)交互實(shí)時(shí)性愛(ài)情連連看逐輪檢索男選女50->10從信息資源集合中找到滿足用戶信息需求的相關(guān)信息的過(guò)程。信息檢索本質(zhì)實(shí)例的共同特征Match匹配找對(duì)象廣義信息檢索包含信息組織和檢索兩部分。信息檢索隨著信息技術(shù)和信息環(huán)境的發(fā)展,其內(nèi)涵不斷豐富和變化著。Web搜索引擎是信息檢索IR中的一種類(lèi)型信息檢索IR這一術(shù)語(yǔ)是1950年由CalvinMooers首先提出的。延時(shí)性通訊形式。發(fā)發(fā)送者在某一時(shí)刻發(fā)出信息,接受者可以在晚一些時(shí)刻才收到該信息;發(fā)送者必須發(fā)出一切可能的信息,而接受者必須有某種檢索裝置以便從大量發(fā)送的信息中篩選出適合自己需要的信息。信息檢索Aninformationretrievalsystemwilltendnottobeusedwheneveritismorepainfulandtroublesomeforacustomertohaveinformationthanforhimnottohaveit.--Mooers’Law,1959InformationRetrieval
計(jì)算機(jī)出現(xiàn)之前計(jì)算機(jī)出現(xiàn)之后
WWW出現(xiàn)之后在網(wǎng)絡(luò)出現(xiàn)之前,計(jì)算信息檢索僅僅面向少數(shù)高學(xué)歷用戶群體,如律師助手、圖書(shū)館員和其他搜索中介、以及記者。這些人搜索高度專(zhuān)業(yè)化、高質(zhì)量、文本型的信息資料,例如大學(xué)圖書(shū)館書(shū)目記錄、法律案件和觀點(diǎn)以及通訊社文章。大多只能搜索文檔替代物Surrogate。
聯(lián)機(jī)檢索價(jià)格昂貴通訊費(fèi)+數(shù)據(jù)服務(wù)費(fèi)雙高,時(shí)間就是金錢(qián)對(duì)檢索技能要求高委托經(jīng)驗(yàn)豐富的檢索員代查信息檢索發(fā)展Web讓搜索走向大眾化日?;ㄆ夸浌翊┛卓ㄆ鎯?chǔ)檢索一體化復(fù)雜需求很難充分轉(zhuǎn)化為查尋表達(dá)取決于用戶自身的判斷,是主觀的不同用戶對(duì)同一事物的相關(guān)度判斷并不一致同一用戶在不同時(shí)期、不同環(huán)境下所作的判斷也是不盡相同相關(guān)度Relevance信息檢索IR核心問(wèn)題ThekeygoalofanIRsystemistoretrievealltheitemsthatarerelevanttoauserquery,whileretrievingasfewnonrelevantitemsaspossible.信息檢索流程信息檢索典型技術(shù)架構(gòu)所需文檔黑箱魔術(shù)內(nèi)涵更加豐富的信息檢索研究貫通信息搜索整個(gè)過(guò)程,算法與技術(shù)只占其中一部分PeterMorville《搜索模式》信息檢索可以看作是計(jì)算機(jī)科學(xué)與信息管理學(xué)為主的交叉學(xué)科,現(xiàn)代信息檢索主要以計(jì)算機(jī)技術(shù)為手段來(lái)處理信息對(duì)象,也包括和其他一些學(xué)科的融合:(計(jì)算)語(yǔ)言學(xué)、認(rèn)知、心理學(xué)等。雖然搜索引擎非常普遍了,但作為商業(yè)搜索引擎其技術(shù)是保密的。開(kāi)源搜索引擎提供了學(xué)習(xí)和實(shí)現(xiàn)組織內(nèi)部搜索功能的可能。開(kāi)源搜索工具學(xué)會(huì)部署,實(shí)現(xiàn)企業(yè)組織站內(nèi)搜索功能教學(xué)資料《搜索引擎技術(shù)基礎(chǔ)》.清華大學(xué)出版社,2010《ModernInformationRetrieval(2nd)》英文版.機(jī)械工業(yè)出版社,2011《SearchEngine:InformationRetrievalinPractice》英文版.機(jī)械工業(yè)出版社,2009談?wù)勊阉魉阉鳠o(wú)處不在熱門(mén)主題Web搜索早期1990-2000s當(dāng)前搜索格局2010-我們的目標(biāo)是讓你越來(lái)越快的找到答案,在你的問(wèn)題和尋找的信息之間建立無(wú)縫的連接。這意味著其實(shí)你不必知道我們最近添加了什么功能,只要在搜索框中輸入你要找的東西就可以了。——Google的搜索理念/2011/11/evolution-of-search-in-six-minutes.html更快地找到所需的答案,而不是一大堆相關(guān)的信息精準(zhǔn)性、個(gè)性化提升上市十年GOOGLE的十大里程碑式貢獻(xiàn)自動(dòng)補(bǔ)全翻譯工具路線和交通全局搜索移動(dòng)化和多屏化語(yǔ)音搜索語(yǔ)音助手知識(shí)圖譜個(gè)性化搜索未為先答搜索框的“陰謀”信息自由公開(kāi)政府干預(yù)審查李彥宏2009年8月18日提出框計(jì)算(BoxComputing)用戶只要在“框”中輸入服務(wù)需求,系統(tǒng)就能明確識(shí)別這種需求,并將該需求分配給最優(yōu)的內(nèi)容資源或應(yīng)用提供商處理,最終精準(zhǔn)高效地返回給用戶相匹配的結(jié)果。這種高度智能的互聯(lián)網(wǎng)需求交互模式,以及“最簡(jiǎn)單可依賴”的信息交互實(shí)現(xiàn)機(jī)制與過(guò)程,稱之為“框計(jì)算”。英國(guó)數(shù)學(xué)家沃利斯在17世紀(jì)發(fā)明的無(wú)窮大符號(hào)∞的形狀2010初Google退出中國(guó)事件變?yōu)?hk1.首先是“框”:
框是提供用戶需求的輸入端口和媒介;
框是框計(jì)算運(yùn)行的外在平臺(tái);
框是一個(gè)功能強(qiáng)大的需求收集器和分析器;
框又是一個(gè)強(qiáng)大的泛操作系統(tǒng)和應(yīng)用兼容平臺(tái)。2.其次是“計(jì)算”:
計(jì)算實(shí)現(xiàn)對(duì)用戶需求的精準(zhǔn)識(shí)別分析,須完全智能化,這是框計(jì)算最核心的技術(shù)。
計(jì)算還需實(shí)現(xiàn)對(duì)用戶需求資源的對(duì)接整合、精準(zhǔn)匹配與調(diào)度,要求準(zhǔn)、快、穩(wěn)。3.再者是“資源”和“平臺(tái)”:
框計(jì)算要求有精準(zhǔn)、穩(wěn)定、可靠而豐富的優(yōu)質(zhì)資源,包括數(shù)據(jù)資源和各種應(yīng)用等。
框計(jì)算提供有專(zhuān)業(yè)的資源對(duì)接合作與運(yùn)營(yíng)平臺(tái),即百度開(kāi)放平臺(tái),其中包括:百度數(shù)據(jù)開(kāi)放平臺(tái)、百度應(yīng)用開(kāi)放平臺(tái)等。4.最后是“機(jī)制”:
簡(jiǎn)單可依賴:框計(jì)算以用戶需求為導(dǎo)向,旨在為用戶提供“即搜即得、即搜即用”最簡(jiǎn)單可依賴的信息需求服務(wù)模式及服務(wù)平臺(tái)。搜索不公百度聯(lián)盟,自家的孩子排名在前/搜索巨頭投資和收購(gòu)了哪些公司?試分析緣由GoogleKnowledgeGraph過(guò)去很多年,包括未來(lái)很多年,主流搜索引擎主要著眼于改善排名,為用戶提供最有價(jià)值的網(wǎng)頁(yè)。但搜索的形式并沒(méi)有太大變化,輸入關(guān)鍵詞-頁(yè)面顯示十個(gè)結(jié)果,結(jié)果由標(biāo)題、鏈接以及關(guān)鍵詞相關(guān)的簡(jiǎn)短內(nèi)文片段組成。雖然現(xiàn)在搜索頁(yè)面也會(huì)插入圖片等結(jié)果,不過(guò)搜索結(jié)果大體上依然通過(guò)文字簡(jiǎn)介的形式提供。知識(shí)圖譜則不同,它在搜索頁(yè)面右欄集成了更直接的答案。2012以后
幕后英雄知識(shí)圖譜的背后是龐大的信息庫(kù)。Google高級(jí)副總裁AmitSinghal在接受SearchEngineLand采訪時(shí)說(shuō)知識(shí)圖譜的信息搜集工作始于2010年收購(gòu)Metaweb。人們對(duì)同一種東西有很多種描述方法,Metaweb專(zhuān)注于將不同文字表述與同一個(gè)實(shí)體連接起來(lái),并探索這些實(shí)體的屬性(例如明星的年齡)以及彼此之間的聯(lián)系,最終提供一種新的搜索形式。雖然不能完全替代關(guān)鍵詞搜索,但Metaweb的索引、搜索方法在處理諸如“身高小于160cm的女星”、“馬丁大叔害死的所有配角”之類(lèi)的搜索時(shí)更高效。/88981實(shí)體搜索語(yǔ)義搜索知識(shí)引擎模仿Worldcat、Google知識(shí)圖譜做法國(guó)內(nèi)搜索引擎開(kāi)始試水,直接給答案GraphSearch社交網(wǎng)站的搜索逆襲對(duì)搜索產(chǎn)生影響語(yǔ)音搜索,LBS搜索入口的侵蝕Siri智能助理人工智能語(yǔ)音識(shí)別蘋(píng)果的Siri是一個(gè)巨大的發(fā)展。這是一種基于語(yǔ)音的方式,能幫助用戶通過(guò)iPhone獲得答案。這意味著搜索的創(chuàng)新。--谷歌CEOEricSchmidt問(wèn)題:背后誰(shuí)來(lái)驅(qū)動(dòng)?搜索要的是答案還是相關(guān)文檔,onestop?wolframAlpha你怎么看待國(guó)產(chǎn)語(yǔ)音助手的跟進(jìn)?下去試一試機(jī)器人小圖躥紅人人網(wǎng)人人網(wǎng)上出現(xiàn)了一款清華大學(xué)圖書(shū)館提供的應(yīng)用——智能機(jī)器人小圖,引起眾多關(guān)注。據(jù)圖書(shū)館系統(tǒng)部主任張成昱介紹,小圖是由圖書(shū)館姚菲老師和一個(gè)計(jì)算機(jī)系的同學(xué)共同研發(fā)的,是集自動(dòng)化咨詢、自動(dòng)問(wèn)答和查閱圖書(shū)等功能為一體的虛擬圖書(shū)館館員?!靶D的理念是把圖書(shū)館的服務(wù)放到社區(qū)、社交網(wǎng)絡(luò)上,通過(guò)不同的環(huán)境和信息獲取方式,采取適合社交網(wǎng)絡(luò)的形式,把圖書(shū)館的一些自動(dòng)化咨詢服務(wù)放在其中,來(lái)代替真人的工作?!薄娫掆忢憰r(shí),屋里的音響正大聲播放著甲殼蟲(chóng)的“WeCanWorkItOut”。彼得拿起電話,電話給帶音量控制的本地設(shè)備發(fā)出信號(hào),音樂(lè)聲降低了。彼得的姐姐露西正從醫(yī)生的辦公室打來(lái)電話:“媽媽需要找一位專(zhuān)家看看,然后得進(jìn)行一系列的理療,大約是兩周一次。我會(huì)讓我的代理來(lái)安排這些預(yù)約的?!北说昧⒖掏鈳兔﹂_(kāi)車(chē)接送。在醫(yī)生的辦公室里,露西在手持網(wǎng)絡(luò)瀏覽器上給她的智能代理下指令。代理立即從醫(yī)生的代理處查到了媽媽的治療處方,在診所清單中進(jìn)行查找,從中找出那些在母親家方圓20英里的范圍內(nèi),在信用評(píng)級(jí)服務(wù)中評(píng)級(jí)為出色或很好,在母親的保險(xiǎn)計(jì)劃范圍之內(nèi)的診所。然后,它嘗試將可能的預(yù)約時(shí)間(由各家診所通過(guò)其網(wǎng)頁(yè)提供)和彼得及露西的繁忙的日程進(jìn)行匹配。幾分鐘之后,代理給他們提供了一個(gè)方案。彼得對(duì)此不太滿意。從母親家到這個(gè)醫(yī)院要橫穿整個(gè)城鎮(zhèn),而他從醫(yī)院返回的時(shí)間又恰好是交通高峰時(shí)間。他設(shè)置了更多的時(shí)間和地點(diǎn)方面的限制,讓自己的代理重新進(jìn)行搜索。在這個(gè)任務(wù)的執(zhí)行過(guò)程中,露西的代理充分信任彼得的代理。幾乎一瞬間,新的方案又出來(lái)了:醫(yī)院離家近了,時(shí)間也提前了。但是,同時(shí)有兩點(diǎn)警告。首先,彼得要重新安排他的一些不太重要的預(yù)約。彼得查了一下,沒(méi)什么問(wèn)題。另一點(diǎn)是,這家醫(yī)院不在保險(xiǎn)公司的理療醫(yī)院的清單上。代理為解除彼得的顧慮,說(shuō),“通過(guò)其他方式,可以保證予以確認(rèn)服務(wù)類(lèi)型和保險(xiǎn)計(jì)劃,需要細(xì)節(jié)內(nèi)容嗎?”彼得表示同意,“給我提供所有的細(xì)節(jié)”。幾乎同時(shí),露西也登記表示贊同,事情就這么定下來(lái)了。(當(dāng)然,彼得為了了解細(xì)節(jié)安排,晚上又讓代理解釋它怎么找到那家診所的,因?yàn)槟羌也⒉辉谕ǔ5那鍐紊稀?互聯(lián)網(wǎng)之父TimBernersLee科學(xué)美國(guó)人2001家庭智能控制系統(tǒng)SPIMES,aformofubiquitouscomputingthatgivessmartsand'searchabiliity'toeventhemostmundaneofphysicalproducts.搜索的調(diào)色盤(pán)多元化泛在化搜索是一個(gè)復(fù)雜研究主題WickedProblem沒(méi)有確定的模式或公式極不確定又相互依存需求不完整、相互矛盾、處在不斷變化中搜索者往往有著不同的目標(biāo)的世界觀,沒(méi)有統(tǒng)一尺度衡量搜索不是目的,僅是手段和過(guò)程搜索是一個(gè)遠(yuǎn)沒(méi)有被解決的問(wèn)題開(kāi)放問(wèn)題如何獲得高質(zhì)量的搜索結(jié)果,更全面和更準(zhǔn)確之間的權(quán)衡。海量數(shù)據(jù)的快速索引與查尋。如何理解用戶需求和行為,將其用于檢索系統(tǒng)支持的搜索任務(wù)當(dāng)中。帶著這些問(wèn)題學(xué)習(xí),試圖尋找新思路與新方法搜索是好比一個(gè)萬(wàn)花
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)保密規(guī)范制度
- 2026湖南懷化國(guó)際陸港經(jīng)濟(jì)開(kāi)發(fā)區(qū)內(nèi)國(guó)有企業(yè)招聘4人備考題庫(kù)附答案
- 2026福建省福清市向陽(yáng)幼兒園招聘考試備考題庫(kù)附答案
- 2026西安工業(yè)大學(xué)招聘?jìng)淇碱}庫(kù)附答案
- 2026貴州湄潭縣人民醫(yī)院招聘編制外緊缺醫(yī)務(wù)人員參考題庫(kù)附答案
- 2026重慶醫(yī)科大學(xué)編外聘用人員招聘1人(2026年第1輪)備考題庫(kù)附答案
- 2026陜西選調(diào)生哪些學(xué)校有資格參加參考題庫(kù)附答案
- 中共南充市委社會(huì)工作部關(guān)于公開(kāi)招聘南充市新興領(lǐng)域黨建工作專(zhuān)員的(6人)考試備考題庫(kù)附答案
- 中國(guó)農(nóng)業(yè)科學(xué)院2026年度第一批統(tǒng)一公開(kāi)招聘參考題庫(kù)附答案
- 樂(lè)山職業(yè)技術(shù)學(xué)院2025年下半年公開(kāi)考核招聘工作人員備考題庫(kù)附答案
- 甲狀腺癌醫(yī)學(xué)知識(shí)講座
- ABAQUS在隧道及地下工程中的應(yīng)用
- 【郎朗:千里之行我的故事】-朗朗千里之行在線閱讀
- 工作匯報(bào)PPT(山與海之歌動(dòng)態(tài))大氣震撼模板
- 義務(wù)消防員培訓(xùn)課件的課件
- 市政施工圍擋施工圍擋方案
- 病原生物與免疫學(xué)試題(含答案)
- 尼帕病毒專(zhuān)題知識(shí)宣講
- 液化石油氣重大危險(xiǎn)源事故專(zhuān)項(xiàng)應(yīng)急救援預(yù)案
- 現(xiàn)代企業(yè)管理制度
- GB/T 24312-2022水泥刨花板
評(píng)論
0/150
提交評(píng)論