版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
RAG
的開放性及企業(yè)落地姜勇Dify
架構師建設
RAG
目前的困境RAG
發(fā)展史Enterprise
RAGRAG
的展望1.2.3.4.from:
FP1MissingContentFP2MissedtheTopRanked
DocumentsFP3NotinContext-ConsolidationstrategyLimitationsFP4NotExtractedFP5WrongFormatFP6Incorrect
SpecificityFP7
Iplete第一階段:Basic
RAGAnswerRetrievebasedonvector
searchBasicRAGPipeline:Indexing&
Querying第二階段:Advanced
RAGHybrid
RetrieveAnswerResult
ProcessQuery
typeKeyword[NDCG@3]Vector[NDCG@3]Hybrid[NDCG@3]Hybrid+SemanticRanker[]Conceptseeking
queries39.045.846.359.6Factseeking
queries37.849.049.163.4Exactsnippet
search51.141.551.060.8Websearch-like
queries41.846.350.058.9Keywordqueries79.211.761.066.9Lowqueryterm
overlap23.036.135.949.1Querieswith
misspellings28.839.140.654.6Long
queries42.741.648.159.4Mediumqueries38.144.746.759.9Short
queries53.138.853.063.9Hybird
RetrieveAnswerResult
ProcessQuery
Transform“GarbageInGarbage
Out.”類型示例問題與語料不相關詢問產品配置庫關于貨物運輸?shù)膯栴}問題模糊“這篇文章的不是關于事實召回“總結一下這篇文章的主要內容”包含多個子問題"今年的歐洲杯在哪里舉辦,什么時候開始?"需要多跳邏輯“Whowonthe2023superbowlandwherewastheirheadcoach
from?”包含非語義組成(結構化)“Whataremoviesaboutaliensin1980”-shouldfilterby
year=1980問題包含比較某省市房貸利率政策從2022年至2023年有哪些調整?”Howtodealwithbelowqueries
?類型解決方案問題與語料不相關檢索前增加問題分類或檢查步驟,如查詢路由(Queryrouting)問題模糊基于歷史的問題重寫(Rewrite)不是關于事實召回(總結)索引過程中實現(xiàn)摘要(Summary
Index),分層檢索(Recrusive)長文本窗口模型(LongContext
Model)包含多個子問題子問題拆分(sub-question)后并行查詢需要多跳邏輯問題規(guī)劃(Question
Planing)迭代召回(Iterative
Retrieval)包含非語義組成(結構化)元數(shù)據(jù)過濾器(Metadata
Filter)問題包含比較問題規(guī)劃(Question
Planing)ModelMax
Tokengpt-4o128Kclaude-3200KGemini1.5
Pro1Mqwen-long10Mdeepseek-chat32KERNIE
Speed128Kglm-4128Kdoubao-lite-128k128Kmoonshot-v1-128k128K第三階段:Multiple-mode
with
longcontextRAGThemodel’s
contextsizeis
huge,so,RAGis
notrequired
???機會:分塊算法更靈活,可以達到文檔級別文檔之間的分析和比較更容易總結更容易更容憶管理,減少壓縮技巧的使用減少幻覺為大模型支持無限
Context前的過濾手段,減少成本Long-context&
RAGParentchunkforlong-context,childchunkforretrivalRAGSemantic
CacheModerationAuthenticationObservationEvaluationLoad
BalancingRAG
系統(tǒng)的本質是基于自然語言的開放域問答系統(tǒng),難點也在于“開放域”。要想獲得符合預期的召回效果,需要對應用情景進行概括和收斂,尋找合適的檢索模式或組合。在動手設計一個
RAG
系統(tǒng)之前,最好先考慮好你的用戶是哪些人,以及他們最可能問出什么樣的問題?!兑牖旌蠙z索(Hybrid
Search)和重排序(Rerank)改進
RAG系統(tǒng)召回效果》沒有最好的,只有最適合場景的策略Nooneisbetterthantheotherbutjustwhenonefitsmoreincertaintypeofquestions.RAGPiplineDify.AI
官方如果你喜歡Dify,歡迎:在
GitHub
上貢獻代碼,與我們一同共建更好的Dify;通過線上線下活動、社交媒體向你的朋友們分享
Dify,以及你的使用經(jīng)驗;在GitHub上給我們點亮?
yDify.AI
官方小助手麥某著名企業(yè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 短劇賬號運營方案策劃書
- 淘寶客活動運營方案
- 高端白酒品牌運營方案設計
- 物流碼頭運營方案設計
- 閥門賬號運營方案設計
- 迪士尼抖音運營方案策劃
- 淘寶新店產品運營方案
- 海晏產業(yè)園運營方案
- 工廠推廣運營布局方案
- 秀場pk直播運營方案
- 退役軍人之家管理制度
- 陜西省2025屆高考 英語適應性檢測(二) 英語試卷(含解析)
- 室外及綠化工程技術難點及質量控制關鍵點
- 施工合作協(xié)議書
- 四川省綿陽市涪城區(qū)2024-2025學年九年級上學期1月期末歷史試卷(含答案)
- 兒童故事繪本愚公移山課件模板
- IIT臨床研究培訓
- 中國消化內鏡內痔診療指南及操作共識(2023年)
- GB/T 20568-2022金屬材料管環(huán)液壓試驗方法
- JJF 1798-2020隔聲測量室校準規(guī)范
- GB/T 29516-2013錳礦石水分含量測定
評論
0/150
提交評論