2024電力知識智能檢索流程規(guī)范_第1頁
2024電力知識智能檢索流程規(guī)范_第2頁
2024電力知識智能檢索流程規(guī)范_第3頁
2024電力知識智能檢索流程規(guī)范_第4頁
2024電力知識智能檢索流程規(guī)范_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

目 次前言 II1范引文件 1語定義 1略語 22力識本本2存格要求 2命要求 2質(zhì)要求 2電知文描文要求 3安管控 3力識構(gòu)基3文內(nèi)拆要求 3文向化法3向數(shù)庫擇3力識索程要求 4總要求 4問文內(nèi)向要求 4向相度配4檢結(jié)生要求 5檢結(jié)安管控 5附錄A 6電力識能索示版應(yīng)示例 6IPAGEPAGE1電力知識智能檢索流程規(guī)范范圍下列文件對于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T5271.28信息技術(shù)詞匯第28部分:人工智能基本概念與專家系統(tǒng)T/CESA1040-2019信息技術(shù)人工智能面向機器學(xué)習(xí)的數(shù)據(jù)標注規(guī)程T/CES128-2022電力人工智能平臺總體架構(gòu)及技術(shù)要求T/CES156-2022電力智能交互文本訓(xùn)練語料標注規(guī)范下列術(shù)語和定義適用于本文件。3.1電力知識electricityknowledge指與電能的產(chǎn)生、傳輸和利用過程中所涉及的知識和技術(shù)。3.2知識庫knowledgebase是知識工程中結(jié)構(gòu)化、易操作、易利用、全面有組織的知識集群。3.3文本向量化textvectorization指將文本信息表示成能夠表達文本語義的向量,即用數(shù)值向量來表示文本的語義。3.4向量相似度vectorsimilarity指衡量兩個向量在數(shù)值上的接近程度的度量。3.5智能檢索intelligentretrieval指計算機根據(jù)用戶的檢索詞和檢索要求,運用人工智能技術(shù)自動擴展檢索詞和構(gòu)造檢索式,以滿足用戶檢索要求的過程。3.6提示模版prompttemplate指在AI大模型訓(xùn)練或應(yīng)用過程中,用來引導(dǎo)模型生成特定類型文本或解決特定任務(wù)的一種預(yù)設(shè)語現(xiàn)。3.7提示prompt在AI大模型中,prompt主要是用來給模型提供提示輸入信息的上下文和輸入模型的參數(shù)信息。下列縮略語適用于本文件。LLM:大語言模型(LargeLanguageModel),也稱大型語言模型??倓t:1:圖1內(nèi)容組織框架txtdocx、md、pdfexceltxt電力知識文本文件名稱應(yīng)由三個部分組成:1100();_2023-10-11_1。電力知識文本文件的質(zhì)量要求如下。a)確保一個文件中的知識都是屬于同一個細分領(lǐng)域、同一權(quán)限等級,且不同細分領(lǐng)域、不同權(quán)限的知識不能混雜在同一個文件中;HTML標簽等;每批次電力知識文本文件應(yīng)有一個描述文件,且描述文件應(yīng)滿足下述要求:txt格式;YYYY-MM-DD;12023-10-12_1。電力知識文件存儲環(huán)境應(yīng)滿足安全管控要求。具體要求包括:USB接口功能;電力知識文本內(nèi)容的拆分方法應(yīng)采用規(guī)則拆分或語義拆分,具體要求如下:10001000內(nèi)。對拆分的文本內(nèi)容進行向量化時選擇的向量化方法要求如下:a)應(yīng)選擇可以對中文文本進行向量化的方法;c)向量化應(yīng)存儲向量數(shù)據(jù)庫中,選擇向量數(shù)據(jù)庫的具體要求如下:2圖2電力知識檢索流程基本要求對用戶輸入的問題文本內(nèi)容進行向量化操作的基本要求具體如下:對用戶輸入的問題文本內(nèi)容進行向量化時選擇文本向量化方法的要求應(yīng)與第7章中文本向量化7進行向量相似度匹配的具體要求如下:(kk3;k檢索結(jié)果生成應(yīng)按照如下要求:1)LLM(如顯卡GPU)模型LLMLLM檢索結(jié)果需進行安全管控,具體要求如下::{“”:“”}附錄A資料性附錄電力知識智能檢索提示模版應(yīng)用示例應(yīng)用場景:電力知識智能檢索步驟一:用戶輸入問題,具體問題(question)具體為:根據(jù)絕緣子的制成材料分類,絕緣子的類型有哪些?步驟二:從電力知識庫匹配相關(guān)文本內(nèi)容并進行文本內(nèi)容拼接,匹配到的具體內(nèi)容(context)為:線軸絕緣子和布線絕緣子等。此外,按照絕緣件擊穿可能性不同,又可分為A型即不可擊穿型絕緣子和B型即可擊穿型絕緣子兩類。prompt_template="""{context}“根據(jù)已知信息無法回答該問題”或

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論