版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
2024年AI搜索行業(yè)深度報告:大模型催生搜索行業(yè)變革機遇_產(chǎn)品百花齊放效果幾何_1.AI搜索產(chǎn)品涌現(xiàn),攻克傳統(tǒng)搜索痛點搜索引擎發(fā)展歷程:信息檢索效率逐步提升搜索引擎:根據(jù)用戶需求與一定算法,運用特定策略從互聯(lián)網(wǎng)檢索出指定信息反饋給用戶的一門檢索技術(shù),縱觀搜索引擎發(fā)展歷程,隨著信息量的不斷膨脹,搜索引擎的發(fā)展趨勢就是更為高效、精準檢索并返回匹配用戶需求的內(nèi)容。隨著AI等技術(shù)的加入,我們認為當前搜索引擎已逐步進入下一階段,即以用戶為中心,更好理解用戶語義,并支持個性化推薦和跨模態(tài)、跨語言檢索、交互等。搜索引擎鼻祖:Archie。Archie搜索的信息資源不是網(wǎng)頁,而是FTP服務(wù)器上的文件名信息,用戶需輸入精確文件名進行檢索。分類目錄階段:以Yahoo為代表,特點是人工分類存放網(wǎng)站的各種目錄。文本檢索階段:以谷歌、百度為代表,隨著網(wǎng)絡(luò)信息爆炸,用戶需要高效檢索內(nèi)容,因此出現(xiàn)了以谷歌為代表的,建立在網(wǎng)頁鏈接分析技術(shù)基礎(chǔ)上,使用關(guān)鍵字對網(wǎng)頁進行搜索。鏈接分析階段:仍以谷歌、百度等為代表,在文本檢索基礎(chǔ)上,深入分析網(wǎng)頁連接中的信息,對網(wǎng)頁重要性進行篩選。搜索引擎使用場景:以信息檢索、資訊獲取、網(wǎng)站導航入口等為主,近年來垂類應(yīng)用的增長,用戶移動端的購物、視頻、攻略等搜索需求被分流至特定垂類應(yīng)用內(nèi)。搜索引擎市場:谷歌為全球龍頭,國內(nèi)百度穩(wěn)坐第一搜索引擎商業(yè)化變現(xiàn)以廣告為主:在搜索界面展示廣告,以用戶瀏覽、點擊等數(shù)量作為廣告價值依據(jù)。以谷歌和Bing為例,2023年全球搜索市占率第一的谷歌網(wǎng)站廣告收入(主要為搜索和YouTube,以搜索為主)達2065億美元,2023財年微軟搜索廣告收入達122.1億美元(主要來自Bing搜索和微軟廣告業(yè)務(wù))。國內(nèi)方面,根據(jù)易觀分析數(shù)據(jù),2020年中國搜索引擎廣告市場規(guī)模達1063億元。以國內(nèi)搜素引擎市占率第一百度為例,其2020、2023年在線營銷服務(wù)收入(主要來自百度網(wǎng)站、百度聯(lián)盟等)分別為728、812億元。AI搜索引擎:去除廣告及冗余信息,高效簡潔反饋內(nèi)容傳統(tǒng)搜索引擎的檢索包括處理數(shù)據(jù)——檢索——匹配并返回結(jié)果。傳統(tǒng)搜索引擎的工作流程可以分為:1)收集并處理互聯(lián)網(wǎng)上的海量數(shù)據(jù);2)為數(shù)據(jù)建立索引并設(shè)計檢索算法,以便快速找到相關(guān)數(shù)據(jù);3)收到用戶發(fā)出的檢索指令后,拆解指令,將指令中的核心信息與海量數(shù)據(jù)進行匹配,最終呈現(xiàn)相關(guān)度最高的結(jié)果。傳統(tǒng)搜索引擎用戶使用體驗逐步下降。隨著數(shù)據(jù)的不斷膨脹,以及廣告商業(yè)模式的開啟,傳統(tǒng)搜索引擎的內(nèi)容冗余、搜索獲得感及效率低下的問題開始顯現(xiàn),比如,當用戶檢索某個問題時,希望得到的是全而準確的答案,但由于傳統(tǒng)搜索引擎根據(jù)匹配結(jié)果返回的是多個網(wǎng)頁內(nèi)容,中間還參雜廣告,用戶需點擊進入多個網(wǎng)頁進行信息獲取。AI搜索通過AI理解用戶意圖、高效召回內(nèi)容、生成全而準的內(nèi)容,有效解決傳統(tǒng)搜索痛點。檢索增強生成(RAG)技術(shù)是目前AI搜索的核心技術(shù)之一,包括信息檢索和答案生成兩部分,即在數(shù)據(jù)庫中檢索用戶問題的相關(guān)內(nèi)容,并形成總結(jié)輸入大模型,并由大模型輸出最終答案,且答案具備索引功能,能對外部信息來源進行標記。通過RAG技術(shù),一方面可以規(guī)避大模型“胡說八道”信息不準確無法溯源、時效性不足的問題,另一方面輸出結(jié)果比傳統(tǒng)搜索引擎信息濃度更高。百度文心一言:用戶規(guī)模平穩(wěn),聯(lián)網(wǎng)搜索能力有限文心一言于2023年3月16日首次亮相,并在同年8月31日正式開放,目前具有網(wǎng)頁版和APP版。文心一言具備文本分類、情感分析、智能問答等自然語言處理任務(wù)的能力。兩個亮點:1)多模態(tài)生成能力,能夠生成文本、圖片、音頻甚至視頻內(nèi)容。2)支持大量的插件和百寶箱功能。缺點在于,免費版不提供搜索結(jié)果的網(wǎng)址。免費版基于文心大模型3.5,開通會員可切換為文心大模型4.0,并支持來源參考展示,更長的輸入輸出字數(shù)、圖片生成、視頻生成等功能。秘塔AI搜索:無廣告的學術(shù)研究利器,自動生成思維導圖與大綱秘塔AI搜索:基于自研MetaLLM大模型的搜索工具,提供無廣告、高質(zhì)量的搜索結(jié)果。產(chǎn)品亮點:1)包含引用源。2)自動生成大綱、思維導圖、相關(guān)事件和人物。3)在數(shù)億篇文獻中篩選有用信息,助力學術(shù)研究。秘塔AI搜索在2023年3月的總流量環(huán)比上升512.6%,在國內(nèi)AIGC產(chǎn)品中領(lǐng)先。上海秘塔網(wǎng)絡(luò)科技有限公司成立于2018年4月,是AI領(lǐng)域的一家新銳科技公司,致力于打造AI生產(chǎn)力產(chǎn)品。目前,秘塔科技已經(jīng)擁有上千萬用戶,總部位于上海市徐匯區(qū),并成立北京和成都兩大研發(fā)中心。公司在AI搜索、AI寫作、法律翻譯等方向上開展研發(fā)與產(chǎn)品落地。公司基于自身業(yè)務(wù)特點和技術(shù)積累自主研發(fā)了大語言模型MetaLLM,該模型于2023年通過《生成式大模型備案》(第二批)、《大模型算法備案》(第二批)。秘塔搭建了一個圍繞自研大模型技術(shù)輸出到產(chǎn)品落地的正循環(huán):秘塔科技基于自研的MetaLLM大模型,在應(yīng)用層做了各種嘗試。自研大模型給自有產(chǎn)品提供了底層能力支撐,在具體應(yīng)用場景中服務(wù)b端和c端用戶,并產(chǎn)生新的數(shù)據(jù)反饋,幫助大模型實現(xiàn)迭代。除了秘塔AI搜索,秘塔科技的其他產(chǎn)品包括:1)秘塔寫作貓:一款A(yù)I寫作輔助工具,具備改錯、改寫和插件功能,旨在提升文章質(zhì)量和工作效率。2)秘塔翻譯:專為法律人訓練的機器翻譯系統(tǒng),專注于法律文書翻譯,提供安全、專業(yè)和快捷的服務(wù)。3)MetaLaw:通過技術(shù)簡化文檔工作流程,提供高效、減少錯漏和知識管理的解決方案。2.AI搜索測評:重構(gòu)搜索,但仍有較大優(yōu)化空間AI搜索能力測評當前(2024年4月)海內(nèi)外已涌現(xiàn)較多AI搜索產(chǎn)品,產(chǎn)品形態(tài)及宣傳特色點均有所不同,我們認為各個AI搜索產(chǎn)品都在持續(xù)迭代、完善功能,產(chǎn)品力有望不斷提升。出于研究目的,我們將以一套相同的測試題,對前述主流AI搜索產(chǎn)品進行測評,分析其能否準確識別用戶意圖,以及能否完成基礎(chǔ)的準確檢索功能,以及是否具備高階功能,如追問、識圖、圖表繪制、音樂等。問題設(shè)置方面,我們以2023年谷歌最常被搜索的問題作為模板,將搜索的基礎(chǔ)需求分為:網(wǎng)址導航、常識性問題、強時效性的新聞問題、本地搜索,并基于這些搜索內(nèi)容,設(shè)置了相關(guān)測試問題。AI搜索能力測評總結(jié)我們以上述問題集進行測評,基于搜索結(jié)果,我們認為AI搜索在常識科普性、開放探索性問題上表現(xiàn)已優(yōu)于傳統(tǒng)引擎,但在網(wǎng)址導航、本地化和操作指導上表現(xiàn)欠佳。AI搜索基礎(chǔ)能力測評結(jié)果——科普性問題科普性問題:以“什么是做空、軋空?”為例,相比傳統(tǒng)搜索,AI搜索回答內(nèi)容完整且更為結(jié)構(gòu)化,無需點擊單個網(wǎng)頁瀏覽。AI搜索中,豆包解釋不足,360搜索AI內(nèi)容延申豐富,秘塔文字分段略微遜色。AI搜索基礎(chǔ)能力測評結(jié)果——簡單時效性+本地化問題簡單時效性+本地化問題:“今天天氣如何”,搜索引擎需識別今天、用戶所處地點,文心一言、360搜索AI、豆包、天工均準確回答,ChatGPT追加地點后回答錯誤,通義千問未詢問直接回答北京天氣,Perplexity未詢問用戶直接回答未知地點天氣,但在追問地點后,智譜、通義千問、Perplexity等均能回答正確。而秘塔、kimi無法識別用戶所處地點,概括回答各地區(qū)天氣,也需追問。AI搜索基礎(chǔ)能力測評結(jié)果——意圖理解及時效性問題意圖理解及時效性問題:輸入“美股下跌原因”、“周五美股下跌原因”后,搜索引擎應(yīng)理解用戶意圖,包括周五所指日期2024/4/12,并返回對應(yīng)股評。測試結(jié)果中,傳統(tǒng)搜索引擎—百度在最新相關(guān)信息中羅列相關(guān)鏈接并提供日期,供用戶篩選點擊;AI搜索針對“美股下跌原因”返回的是探索性回答,時間跨度長,限定“周五”后,Perplexity、天工、秘塔、豆包能識別具體日期并反饋正確結(jié)果,有效內(nèi)容含量(日期正確條數(shù)/參考結(jié)果條數(shù))分別為8/8、4/4、6/11、4/10,Kimi、360搜索AI有效內(nèi)容含量較低,通義千問、智譜無法理解周五的日期,文心一言無溯源,此處不予評價。AI搜索高級能力測評結(jié)果——追問相比于傳統(tǒng)搜索引擎,AI搜索的連續(xù)對話功能使得用戶無
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 邊坡作業(yè)安全培訓課件
- 施工場地治安保衛(wèi)管理計劃
- 車險培訓課件2021
- 車隊安全運營培訓內(nèi)容課件
- 民族運動會征集宣傳口號方案
- 機器人高級技師實操試題題庫
- 車間頂崗安全培訓內(nèi)容課件
- 2026年山東檔案職稱考試(檔案高級管理理論與工作實務(wù))歷年題及答案
- 酒店客房用品采購與驗收制度
- 2025年小程序開發(fā)與私域流量轉(zhuǎn)化工作總結(jié)(2篇)
- GB 20101-2025涂裝有機廢氣凈化裝置安全技術(shù)要求
- 熔鋁爐施工方案及流程
- 折彎工技能等級評定標準
- 全屋定制家具合同
- 2025年數(shù)字印刷可行性報告
- 國際道路運輸安全生產(chǎn)管理制度文本
- 食堂消防安全制度培訓課件
- 2025-2030房地產(chǎn)行業(yè)人才結(jié)構(gòu)轉(zhuǎn)型與復合型培養(yǎng)體系構(gòu)建
- 電力通信安全培訓資料課件
- 上海國安面試題庫及答案
- 2025年財務(wù)共享服務(wù)模式白皮書方案
評論
0/150
提交評論