版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
股票代碼688031股票代碼688031星環(huán)科技星環(huán)科技大模型技術(shù)及其在金融行業(yè)的應(yīng)用探索星環(huán)科技:東方星環(huán)信息科技(上海)股份有限公司Copyright?2024Transwarp.AllRightsReserved.股票代股票代碼688031星環(huán)科技02大模型應(yīng)用體系建設(shè)03大模型在金融行業(yè)的應(yīng)用探索/wuya7Copyright?2024Transwarp.AllRightsReserved.7股票股票代碼688031星環(huán)科技背景知識(shí)Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技2022年11月30日,OpenAI的生成式對(duì)話模型服務(wù)ChatGPT股票代碼688031星環(huán)科技2022年11月30日,OpenAI的生成式對(duì)話模型服務(wù)ChatGPT發(fā)布GPT-4接受圖靈測(cè)試生成毀滅人類計(jì)劃引關(guān)注和對(duì)于大語言模型的思考《DoesGPT-4passtheTuringtest?》arXiv.2310.20216《PeoplecannotdistinguishGPT-4fromahumaninTuringtest》arXiv.2405.080071.技術(shù)突破:基于大規(guī)模預(yù)訓(xùn)練技術(shù)和更長(zhǎng)的上下文長(zhǎng)度,這使得它在對(duì)話流暢性、多輪對(duì)話、復(fù)雜語義理解等多個(gè)傳統(tǒng)的NLP任務(wù)上取得了巨大的進(jìn)展。2.用戶體驗(yàn):ChatGPT的交互體驗(yàn)非常接近人類,它能夠理解和生成自然語言,這使得用戶感覺與一個(gè)真正有邏輯思維和語言交流能力的真人進(jìn)行交流。3.研究范式改變:它的出現(xiàn)改變了NLP的研究范式,從傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)方法和詞嵌入方法,到預(yù)訓(xùn)練加微調(diào)范式,再到如今的大語言模型。4.應(yīng)用潛力:其展示出了在眾多領(lǐng)域的應(yīng)用潛力。產(chǎn)業(yè)界積極進(jìn)行場(chǎng)景實(shí)踐。5.社會(huì)影響:引發(fā)了對(duì)AI技術(shù)的廣泛討論,包括其在倫理、安全和隱私方面的挑戰(zhàn)。甚至已經(jīng)符號(hào)化。1.埃隆·馬斯克和比爾·蓋茨都對(duì)ChatGPT表示了高度評(píng)價(jià)。馬斯克認(rèn)為2.英偉達(dá)CEO黃仁勛也對(duì)ChatGPT給予了高度評(píng)價(jià),他盛贊ChatGPT的誕生堪3.澎湃新聞將2022年11月30日視為可能改變?nèi)祟悮v史的日子,他們認(rèn)為ChatGPT不僅催生了人工智能界的又一輪高光期,還并不常見地被譽(yù)為“蒸9Copyright?2024Transwarp.AllRightsReserved.9股票代碼股票代碼688031星環(huán)科技Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星股票代碼688031星環(huán)科技通常包含數(shù)十億甚至數(shù)千億個(gè)參數(shù),這些參數(shù)在訓(xùn)練為了訓(xùn)練這些模型,需要大量的數(shù)據(jù)。這些數(shù)據(jù)可以------------------?由于模型的規(guī)模和數(shù)據(jù)量,大模型通常需要大量的計(jì)------------------?大模型由于其復(fù)雜性,通常具有很強(qiáng)的泛化能力,能------------------?處理和理解多種不同類型的數(shù)據(jù)輸入和輸出,例如文-----------------?本、圖像、視頻和音頻等。使得模型可以跨不同領(lǐng)域大模型通??梢栽谝粋€(gè)任務(wù)上預(yù)訓(xùn)練,然后在其他相-----------------?關(guān)任務(wù)上進(jìn)Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星股票代碼688031星環(huán)科技n廣泛的常識(shí):大模型通過在大規(guī)模文本數(shù)據(jù)上的預(yù)訓(xùn)練,學(xué)習(xí)到了語言的潛在結(jié)構(gòu)、語法規(guī)則和語義關(guān)系,因此具備了廣泛的常識(shí)。例如,它們可以理解和生成涉及各種主n理解能力:大模型能夠理解復(fù)雜的指令和上下文信息,這使得它們?cè)趫?zhí)行任務(wù)時(shí)更加精準(zhǔn)。例如,它們可以根據(jù)郵件的主題自動(dòng)撰寫回復(fù),理解用戶的需求并生成合適的內(nèi)n上下文學(xué)習(xí):大模型能夠根據(jù)上下文信息進(jìn)行學(xué)習(xí)和預(yù)測(cè),這使得它們?cè)谔幚砭哂猩蟦多任務(wù)能力:大模型在預(yù)訓(xùn)練后能夠泛化到多個(gè)下游任務(wù),無需大量針對(duì)特定任務(wù)的n多模態(tài)理解能力:最新的大模型如GPT-4展示了更強(qiáng)的推理與多模態(tài)理解能力,能夠Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技大模型產(chǎn)業(yè)發(fā)展-政策端:各級(jí)對(duì)大模型技術(shù)應(yīng)用的支股票代碼688031星環(huán)科技《關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見》:由科技部等六部門于2022年印發(fā),目的是落實(shí)《新一代人工智能發(fā)展規(guī)劃》,系統(tǒng)指導(dǎo)各地方和各主體加快人工智能場(chǎng)景應(yīng)用,推動(dòng)經(jīng)《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》:該政策旨在充分發(fā)揮政府引導(dǎo)作用和創(chuàng)新平臺(tái)催化作用,整合創(chuàng)新資源,加強(qiáng)要素配置,營(yíng)造創(chuàng)新生態(tài),重視風(fēng)險(xiǎn)防范,推動(dòng)本《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025年)》:該方案的目標(biāo)是高水平建設(shè)北京國(guó)家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)和國(guó)家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū),加快建設(shè)具有全球影響力《北京市推動(dòng)“人工智能+”行動(dòng)計(jì)劃(2024-2025年)》:這個(gè)行動(dòng)計(jì)劃的目標(biāo)是通過實(shí)施標(biāo)桿型應(yīng)用工程、示范性應(yīng)用項(xiàng)目和商業(yè)化應(yīng)用成果,力爭(zhēng)到2025年底形成3至5個(gè)先進(jìn)可用、自主可控的基礎(chǔ)大模型產(chǎn)品、《上海市推動(dòng)人工智能大模型創(chuàng)新發(fā)展若干措施(2023-2025年)》:這份通知由上海市經(jīng)濟(jì)和信息化委員會(huì)、上海市發(fā)展和改革委員會(huì)、上海市科學(xué)技術(shù)委員會(huì)、中共上海市委網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室、上?!锻苿?dòng)區(qū)塊鏈、大模型技術(shù)賦能生產(chǎn)性互聯(lián)網(wǎng)服務(wù)平臺(tái)發(fā)展實(shí)施方案》:由上海市經(jīng)濟(jì)和信息化委員會(huì)、上海市商務(wù)委員會(huì)聯(lián)合發(fā)布,目的是推動(dòng)區(qū)塊鏈、大模型等前沿技術(shù)與平臺(tái)深度融合,促進(jìn)生產(chǎn)性互聯(lián)網(wǎng)服務(wù)《上海市推進(jìn)“人工智能+”行動(dòng)打造“智慧好辦”政務(wù)服務(wù)實(shí)施方案》:各地AI大模型產(chǎn)業(yè)支持政策還有:北京、上海、山東、廣東、安徽、福建和深圳、杭州、成都等地均發(fā)布了AI大模型的相關(guān)產(chǎn)業(yè)政策,以加速大模型應(yīng)用落地。Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技大模型產(chǎn)業(yè)發(fā)展-需求端:企業(yè)端對(duì)生成式股票代碼688031星環(huán)科技場(chǎng)景,全球市場(chǎng)、中國(guó)市場(chǎng)及美國(guó)市場(chǎng)受訪企業(yè)對(duì)此場(chǎng)景的期待應(yīng)用分別占到了52%、5上表引用自上表引用自-艾瑞咨詢-《2023年中國(guó)人工智能產(chǎn)業(yè)研究報(bào)告》第23頁本主要內(nèi)容引用自-創(chuàng)業(yè)邦《2024AIGC創(chuàng)新應(yīng)用洞察報(bào)告》第19頁Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技大模型產(chǎn)業(yè)發(fā)展-供給端:在大模型帶動(dòng)下的AI產(chǎn)業(yè)蓬勃股票代碼688031星環(huán)科技本頁內(nèi)容來自于艾瑞咨詢-《2023年中國(guó)人工智能產(chǎn)業(yè)研究報(bào)告》第22頁Copyright?2024Transwarp.AllRightsReserved股票代碼688031星環(huán)科技688031大模型應(yīng)用體系建設(shè)大模型應(yīng)用體系建設(shè)Copyright?2024Transwarp.AllRightsReserved.股票代股票代碼688031星環(huán)科技利用企業(yè)自身數(shù)據(jù),快速搭建,構(gòu)建Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技五種方法快速構(gòu)建大模型股票代碼688031星環(huán)科技?快速搭建企業(yè)領(lǐng)域知識(shí)平臺(tái),構(gòu)建專家級(jí)領(lǐng)域大模型應(yīng)用。比如直接提問 大模型LLM(Gneral)Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技五種方法快速構(gòu)建大模型商股票代碼688031星環(huán)科技 2提示工程假設(shè)你是一位金融投研領(lǐng)域的專家,請(qǐng)你從產(chǎn)業(yè)鏈的角度分析并回答該問題。 大模型提示詞工程(思維鏈)LLM(Gneral)LLM(General)Prompt(CoT)Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技五種方法快速構(gòu)建大模型商股票代碼688031星環(huán)科技 3檢索增強(qiáng)召回囚檢索增強(qiáng)&代理大模型檢索增強(qiáng)&代理大模型LLM(GneralLLM(Gneral)LLM(General)Prompt(Prompt(CoT)LLM(General)Prompt(CoT)RAG&AgentCopyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技五種方法快速構(gòu)建大模型商股票代碼688031星環(huán)科技 2提示工程(思維鏈)假設(shè)你是一位金融投研領(lǐng)域的專家,請(qǐng)你從產(chǎn)業(yè)鏈的角度分析并回答該問題。 檢索增強(qiáng)3檢索增強(qiáng)3召回Agent工具集 召回Agent工具集檢索增強(qiáng)&代理大模型檢索增強(qiáng)&代理大模型LLM(GneralLLM(Gneral)LLM(General)Prompt(Prompt(CoT)LLM(General)Prompt(CoT)RAG&AgentCopyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技五種方法快速構(gòu)建大模型商股票代碼688031星環(huán)科技22提示工程(思維鏈)假設(shè)你是一位金融投研領(lǐng)域的專家, 33請(qǐng)你從產(chǎn)業(yè)鏈的角度分析并回答該問題。 3344有監(jiān)督微調(diào)LLM檢索增強(qiáng)選擇工具Agent工具集召回檢索增強(qiáng)選擇工具Agent工具集檢索增強(qiáng)&代理有監(jiān)督微調(diào)大模型檢索增強(qiáng)&代理有監(jiān)督微調(diào)大模型LLM(General)LLMLLM(General)LLM(General)LLM(General)Prompt(CoT)Prompt(CoT)RAG&AgentLLM(Gneral)Prompt(CoT)RAG&AgentCopyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技五種方法快速構(gòu)建大模型商股票代碼688031星環(huán)科技 2提示工程(思維鏈)假設(shè)你是一位金融投研領(lǐng)域的專家, 33檢索增強(qiáng)召回Agent工具集 檢索增強(qiáng)召回Agent工具集檢索增強(qiáng)&代理預(yù)訓(xùn)練Pre-training有監(jiān)督微調(diào)檢索增強(qiáng)&代理預(yù)訓(xùn)練Pre-training有監(jiān)督微調(diào)大模型LLM(GneralLLM(Gneral)LLM(General)Prompt(CoT)LLM(General)LLM(General)Prompt(CoT)RAG&AgentPrompt(CoT)RAG&AgentPrompt(CoT)RAG&AgentLLM(Pre-Trained)Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星股票代碼688031星環(huán)科技申請(qǐng)授信的單一客戶進(jìn)行詳細(xì)的調(diào)查??赡苌婕暗絻?nèi)部數(shù)據(jù)、外采數(shù)據(jù)、注:上文LLMOps為L(zhǎng)argeLanguageModelO24Copyright?2024Transwarp.AllRightsReserved.24股票代碼688031星環(huán)科技大模型應(yīng)用體系架構(gòu)–星環(huán)股票代碼688031星環(huán)科技Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技金融行業(yè)垂直大模型在金融領(lǐng)域具有專業(yè)的理解能力,更精熟于金融術(shù)語和概念更適合解決金融行業(yè)的具體問題,與行業(yè)需求和合規(guī)性要求相匹配提供更精確、可信賴的金融信息和建議,同時(shí)符合行業(yè)規(guī)定由于主要針對(duì)金融領(lǐng)域,因此在其他領(lǐng)域的適用性可能有限金融政策和法規(guī)的變化可能要求模型頻繁更新以保持準(zhǔn)確性和合規(guī)性垂直領(lǐng)域模型的訓(xùn)練數(shù)據(jù)相對(duì)較少,模型的準(zhǔn)確率可能會(huì)受影響股票代碼688031星環(huán)科技金融行業(yè)垂直大模型在金融領(lǐng)域具有專業(yè)的理解能力,更精熟于金融術(shù)語和概念更適合解決金融行業(yè)的具體問題,與行業(yè)需求和合規(guī)性要求相匹配提供更精確、可信賴的金融信息和建議,同時(shí)符合行業(yè)規(guī)定由于主要針對(duì)金融領(lǐng)域,因此在其他領(lǐng)域的適用性可能有限金融政策和法規(guī)的變化可能要求模型頻繁更新以保持準(zhǔn)確性和合規(guī)性垂直領(lǐng)域模型的訓(xùn)練數(shù)據(jù)相對(duì)較少,模型的準(zhǔn)確率可能會(huì)受影響通用語言大模型由于在多樣化的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,通用模型能夠處理各種話題和領(lǐng)域的問題大量數(shù)據(jù)訓(xùn)練提高了模型的準(zhǔn)確率,并可以應(yīng)用于多種任務(wù)中在數(shù)據(jù)量較少的特定任務(wù)上,通用模型也可以通過微調(diào)進(jìn)行有效的遷移學(xué)習(xí),大大減少模型的訓(xùn)練時(shí)間和計(jì)算資源可能不具備特定領(lǐng)域(如金融)的深入理解和專業(yè)知識(shí)通用大模型的結(jié)構(gòu)非常復(fù)雜,使得模型的解釋性變得困難,導(dǎo)致模型的計(jì)算量增加,影響模型的效率通用大模型的訓(xùn)練需要大量的計(jì)算資源和時(shí)間,這對(duì)于一些小型企業(yè)來說是一個(gè)挑戰(zhàn)訓(xùn)練數(shù)據(jù)難以覆蓋所有金融知識(shí),以偏概全對(duì)模型來說是“毒藥”26Copyright?2024Transwarp.AllRightsReserved.26股票代碼688031星環(huán)科技股票代碼688031星環(huán)科技垂直領(lǐng)域大模型則專注于特定領(lǐng)域或任務(wù),使用特定領(lǐng)域的垂直領(lǐng)域大模型需要整合領(lǐng)域特定的知識(shí)庫或數(shù)據(jù),以提高垂直領(lǐng)域大模型的預(yù)訓(xùn)練則更側(cè)重于學(xué)習(xí)特定領(lǐng)域的知識(shí)和垂直領(lǐng)域大模型在參數(shù)量上通常小于通用大模型,還可能會(huì)涉及到對(duì)模型的某些組件或網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行定制27Copyright?2024Transwarp.AllRightsReserved.27股票代碼688031星環(huán)科技2.1大模型管理與運(yùn)營(yíng):模型訓(xùn)練的必股票代碼688031星環(huán)科技知識(shí)邊界知識(shí)邊界數(shù)據(jù)難點(diǎn)私域數(shù)據(jù)私域數(shù)據(jù)管理成本高管理成本高算力稀缺需要模型運(yùn)營(yíng)模型架構(gòu)和推理機(jī)制28Copyright?2024Transwarp.AllRightsReserved.28股票代碼688031星環(huán)科技2.2大模型管理與運(yùn)營(yíng):大模型股票代碼688031星環(huán)科技0104·多模型對(duì)比ReservedReserved02模型訓(xùn)練0302模型訓(xùn)練0529·安全對(duì)齊·認(rèn)知對(duì)齊29股票代碼688031星環(huán)科技2.3大模型管理與運(yùn)營(yíng):Agent也許是大模型應(yīng)用的股票代碼688031星環(huán)科技以人類為主的AI應(yīng)用,AI以信息提供的形式服務(wù)人類決策。以人類為主的AI應(yīng)用,AI以信息提供的形式服務(wù)人類決策。代表場(chǎng)景與服務(wù):Chatbot廣泛應(yīng)用于客服、訂票、娛樂聊天等多個(gè)領(lǐng)域。它們能夠通過自然語言與用戶進(jìn)行交互,提供信息查詢、任務(wù)處理等服務(wù)。代表場(chǎng)景與服務(wù):Coding-Copilot主要服務(wù)于開發(fā)者,通過預(yù)測(cè)和補(bǔ)全代碼段來提高編程效率。它可以在編寫代碼時(shí)提供實(shí)時(shí)的代碼建議,幫助開發(fā)者快速完成任務(wù)。AI全權(quán)代理,自主承擔(dān)工作任務(wù)的分配、拆解與執(zhí)行。代表場(chǎng)景與服務(wù):Agents模式可以應(yīng)用于個(gè)人助理、智能家居、企業(yè)自動(dòng)化等多個(gè)場(chǎng)景。它們能夠根據(jù)用戶的指令或環(huán)境變化自主執(zhí)行任務(wù)。Agent/智能體:為一個(gè)能夠感知環(huán)境、做出決策并執(zhí)從而實(shí)現(xiàn)精準(zhǔn)的意圖識(shí)別和決策制定。此外,大模型作為AI代理的“智能核心”,為其提供了規(guī)劃、記憶、執(zhí)行和工具等四項(xiàng)關(guān)鍵能力,使其能夠決策任務(wù)。AI代理能夠自主進(jìn)行任務(wù)規(guī)劃、環(huán)境感知、行動(dòng)選擇和觀察糾錯(cuò),這一系列行動(dòng)都是以任務(wù)目標(biāo)為導(dǎo)向的。這樣的能力提升不僅增強(qiáng)了大模型解決實(shí)際問題的能行動(dòng)。信息做出響應(yīng)。30Copyright?2024Transwarp.AllRightsReserved.30股票代碼688031星環(huán)科技2.4大模型管理與運(yùn)營(yíng):Ag股票代碼688031星環(huán)科技②智能體②智能體(大語言模型)解析用戶指令,將任務(wù)分解成多個(gè)子任務(wù)并進(jìn)行規(guī)劃和編排工具1任務(wù)分解成多個(gè)子任務(wù)并進(jìn)行規(guī)劃和編排工具1工具2③調(diào)用其它工具完成每個(gè)小模塊任務(wù)①接受用戶自然語言指令工具2③調(diào)用其它工具完成每個(gè)小模塊任務(wù)Agent最終Agent最終工具3④執(zhí)行完所有小模塊的任務(wù)后,將處理結(jié)果返回給用戶工具3記憶規(guī)劃②②思考:需要發(fā)送郵件使用工具:send_email輸入:{“to”使用工具:send_email輸入:{“to”:”san.zhang@transwarp.io”,“content”:”張三,您好,歡迎加入星環(huán)科技”}①給待入職員工發(fā)送歡迎郵件,并提醒需要攜帶的入職材料Agent③輸出:發(fā)送成功④Agent③輸出:發(fā)送成功Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技2.5大模型管理與運(yùn)營(yíng):例如使用Agents模式構(gòu)建股票代碼688031星環(huán)科技32Copyright?2024Transwarp.AllRightsReserved.32股票代碼688031星環(huán)科技2.6大模型管理與運(yùn)營(yíng):大模型應(yīng)用股票代碼688031星環(huán)科技Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技3.1知識(shí)管理與構(gòu)建:高質(zhì)量語料獲取的必要股票代碼688031星環(huán)科技?高質(zhì)量語料是在大模型不同階段對(duì)“價(jià)值”和“效果”既決定了地板有多“低”,也決定了天花板有多“高”?高質(zhì)量語料是解決大模型“幻覺”、“可信可控”等核心落地覺”、“可信可控”等核心落地難點(diǎn)的重要手段?高質(zhì)量行業(yè)專用語料是企業(yè)、機(jī)構(gòu)獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)和天然壁壘??合法性?無偏見?多樣性?大規(guī)模?真實(shí)性?連貫性?無害?模型預(yù)訓(xùn)練?模型微調(diào)對(duì)齊?模型應(yīng)用?文本:無格式、代碼、特殊表格、有篇章結(jié)構(gòu)?圖像:含文字圖像、趨勢(shì)圖/餅圖、高級(jí)語義圖像?語音:?jiǎn)我唤巧胀ㄔ挕⒍嘟巧窖?、多語言多情感?圖譜:E-R關(guān)系、屬性圖、本體庫、多模態(tài)業(yè)務(wù)圖譜34Copyright?2024Transwarp.AllRightsReserved.34股票代碼688031星環(huán)科技3.2知識(shí)管理與構(gòu)建:語料股票代碼688031星環(huán)科技采購(gòu)數(shù)據(jù)抽樣人工評(píng)估開放數(shù)據(jù)CommonCrawl數(shù)據(jù)Crawler合作方領(lǐng)域數(shù)據(jù)訓(xùn)練集洗規(guī)則json格式處理敏感&廣告詞過濾樣本間&樣本內(nèi)去重?cái)?shù)據(jù)集質(zhì)量評(píng)估知識(shí)庫數(shù)據(jù)清洗洗規(guī)則小模型驗(yàn)證百科類電子書采購(gòu)數(shù)據(jù)抽樣人工評(píng)估開放數(shù)據(jù)CommonCrawl數(shù)據(jù)Crawler合作方領(lǐng)域數(shù)據(jù)訓(xùn)練集洗規(guī)則json格式處理敏感&廣告詞過濾樣本間&樣本內(nèi)去重?cái)?shù)據(jù)集質(zhì)量評(píng)估知識(shí)庫數(shù)據(jù)清洗洗規(guī)則小模型驗(yàn)證百科類電子書網(wǎng)頁數(shù)據(jù)…清洗階段3:1.大數(shù)據(jù)平臺(tái)樣本間去重:計(jì)算hash,去重2.樣本內(nèi)去重:清洗階段3:1.大數(shù)據(jù)平臺(tái)樣本間去重:計(jì)算hash,去重2.樣本內(nèi)去重:n-gram算法清洗階段1:處理方式:分布式大數(shù)據(jù)處理平臺(tái)效率:處理1TCC原始數(shù)據(jù),耗時(shí)約2小時(shí),可以得到約5GB清洗階段4:1.用語言模型進(jìn)行ppl過濾2.人工抽樣評(píng)估2.敏感詞過濾:基于快速字符串匹配對(duì)敏感信息進(jìn)行過濾訓(xùn)練小模型訓(xùn)練小模型,在下游任務(wù)上做效果評(píng)估中文質(zhì)量一般的數(shù)據(jù)加工流程示例(預(yù)訓(xùn)練/微調(diào)/RAG)按需配置中文質(zhì)量一般的數(shù)據(jù)Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技4.1知識(shí)存儲(chǔ):向量數(shù)據(jù)的存儲(chǔ)與檢索-Hippo分布股票代碼688031星環(huán)科技應(yīng)用場(chǎng)景Hippo技術(shù)優(yōu)勢(shì)應(yīng)用場(chǎng)景分布式分布式全面容器化部署,具備多租戶和強(qiáng)大的資源管控能力,支持服務(wù)的彈性擴(kuò)縮容大規(guī)模分布式集群部署經(jīng)驗(yàn)和能力;Raft算法確保數(shù)據(jù)強(qiáng)一致性;提供故障遷移,數(shù)據(jù)修復(fù)等數(shù)據(jù)保障能力全面容器化部署,具備多租戶和強(qiáng)大的資源管控能力,支持服務(wù)的彈性擴(kuò)縮容混合檢索跨模態(tài)檢索混合檢索跨模態(tài)檢索具有全文檢索+向量稀疏向量+稠密向量的能力不同模態(tài)數(shù)據(jù)(文本/圖片/音頻等)通過Embedding導(dǎo)入后,支持跨模態(tài)檢索(如文搜圖等)具有全文檢索+向量稀疏向量+稠密向量的能力高性能檢索高性能檢索安全性基于SASL的用戶認(rèn)證能力基于SSL/安全性基于SASL的用戶認(rèn)證能力基于SSL/TLS數(shù)據(jù)加密傳輸非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用日益增多多進(jìn)程架構(gòu)與GPU加速,充分發(fā)揮并行檢索能力;10+類索引支持,滿足不同需求及體量的業(yè)務(wù)場(chǎng)景非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用日益增多 信創(chuàng)界面化管理,指標(biāo)監(jiān)控,標(biāo)準(zhǔn)界面化管理,指標(biāo)監(jiān)控,標(biāo)準(zhǔn)接口:Python/Restful/JavaEmbeddingSDK支持Arm/X86平臺(tái)支持信創(chuàng)服務(wù)器/系統(tǒng)適配36Copyright?2024Transwarp.AllRightsReserved.36股票代碼688031星環(huán)科技股票代碼688031星環(huán)科技構(gòu)建知識(shí)圖譜后,再通過圖嵌入算法模塊將用戶輸入提問文本,結(jié)合知識(shí)模型、NLP、大模型等相關(guān)技相似子圖生成相應(yīng)提示詞后供大模型生成內(nèi)容并進(jìn)行回產(chǎn)業(yè)鏈知識(shí)模型產(chǎn)業(yè)鏈知識(shí)模型交易行為知識(shí)模型Graphembedding知識(shí)圖譜構(gòu)建Graphembedding知識(shí)圖譜構(gòu)建原始數(shù)據(jù)子圖嵌入子圖嵌入實(shí)體/關(guān)系搜索子圖召回問題示例:與A公司具有相似交易行為的公司有哪些?相關(guān)提問文本識(shí)別引擎識(shí)別引擎基礎(chǔ)大模型基于圖譜的產(chǎn)業(yè)鏈和交易行為信息回復(fù)回答示例:A公司的交易行為特點(diǎn)是1.高頻小金額交召回子圖向量召回相似子圖易...2....;與它具有相似交易行為的公司是B公司,它的行為特點(diǎn)是:...;C公司,它的行為特點(diǎn)是...37Copyright?2024Transwarp.AllRightsReserved.37股票代碼688031星環(huán)科技5.1應(yīng)用:智能問答/增強(qiáng)股票代碼688031星環(huán)科技基本面分析新聞資訊分析法律法規(guī)問答回回音視頻總結(jié)產(chǎn)業(yè)圖譜分析智能寫作圖片檢索AAA私有知識(shí)上傳AA財(cái)報(bào)研報(bào)法律法規(guī)實(shí)時(shí)新聞財(cái)報(bào)研報(bào)法律法規(guī)實(shí)時(shí)新聞互聯(lián)網(wǎng)38Copyright?2024Transwarp.AllRightsReserved.38股票代碼股票代碼688031星環(huán)科技688031大模型在金融行業(yè)的應(yīng)用探索Copyright?2024Transwarp.AllRightsReserved.股票代碼股票代碼688031星環(huán)科技 預(yù)計(jì)在辦公、投顧、數(shù)據(jù)提取等其它方40Copyright?2024Transwarp.AllRightsReserved.40股票代股票代碼688031星環(huán)科技消貫者議益護(hù)消貫者議益護(hù)落地優(yōu)先級(jí)落地優(yōu)先級(jí)專業(yè)、精準(zhǔn)的應(yīng)答話術(shù),給坐席人員提供參考,提以經(jīng)過大量行業(yè)預(yù)料訓(xùn)練后的行業(yè)大模型為專業(yè)、精準(zhǔn)的應(yīng)答話術(shù),給坐席人員提供參考,提業(yè)務(wù)價(jià)值Copyright?2024Transwarp.AllRightsReserved.股票代碼688031星環(huán)科技金融行業(yè)大模型應(yīng)用案例股票代碼688031星環(huán)科技?模板化“填空”在[起始日期]至[結(jié)束日期],?模板化“填空”....自然流暢美聯(lián)儲(chǔ)貨幣政策調(diào)整暫無新進(jìn)展,美元指數(shù)維持高位回落態(tài)勢(shì),對(duì)貴金屬形成利好影響,貴金屬維持高位偏強(qiáng)運(yùn)行態(tài)1847-1865美元/盎司區(qū)間偏強(qiáng)運(yùn)行;現(xiàn).自然流暢近期,美聯(lián)儲(chǔ)貨幣政策加速收緊預(yù)期逐步被市場(chǎng)所計(jì)價(jià),歐洲央行7月開啟加息周期確定性強(qiáng)...42Copyright?2024Transwarp.AllRightsReserved.42股票代碼688031星環(huán)科技金融行業(yè)大模型應(yīng)用案例-股票代碼688031星環(huán)科技復(fù)盤推演分析知識(shí)圖譜與圖分析知識(shí)抽取及庫構(gòu)建復(fù)盤推演分析知識(shí)圖譜與圖分析功能迭代43Copyright?2024Transwarp.AllRightsReserved.43股票代碼688031星環(huán)科技金融行業(yè)大模型應(yīng)用案例-股票代碼688031星環(huán)科技合規(guī)知識(shí)問答場(chǎng)景合規(guī)場(chǎng)景中涉及各類知識(shí)問答場(chǎng)景:相關(guān)法律法規(guī)的法條查詢通過問答模式對(duì)比歷史判決案例為當(dāng)前案例提供相似案例通過問答方式進(jìn)行相關(guān)類型案例的推薦等等智能文本生成場(chǎng)景02涉及各類文本生成的工作:調(diào)查報(bào)告、處罰書、整改措施發(fā)文的撰寫等等-44Copyright?2024Transwarp.AllRightsReserved.44股票代碼688031星環(huán)科技金融行業(yè)大模型應(yīng)用案例-4:股票代碼688031星環(huán)科技問題分析階段結(jié)果生45Copyright?2024Transwarp.AllRightsReserved.45股票代碼688031星環(huán)科技金融行業(yè)大模型應(yīng)用案例-4:股票代碼688031星環(huán)科技46Copyright?2024Transwarp.AllRightsReserved.46股票代碼688031星環(huán)科技金融行業(yè)大模型應(yīng)用案例-4:股票代碼688031星環(huán)科技模型模型調(diào)用返回SQL執(zhí)行模型模型調(diào)用返回SQL執(zhí)行分析場(chǎng)景發(fā)布分析場(chǎng)景發(fā)布↑查詢結(jié)果返回查詢結(jié)果返回整合指標(biāo)、標(biāo)簽查詢結(jié)果更準(zhǔn)確回答可解釋、可調(diào)整整合指標(biāo)、標(biāo)簽查詢結(jié)果更準(zhǔn)確回答可解釋、可調(diào)整智能提示、問答糾錯(cuò)47Copyright?2024Transwarp.AllRightsReserved.47股票代碼688031星環(huán)科技金融行業(yè)大模型應(yīng)用案例-5:智能股票代碼688031星環(huán)科技客戶信貸數(shù)據(jù)客戶信貸數(shù)據(jù)客戶標(biāo)簽客戶標(biāo)簽/客戶洞察成向量數(shù)據(jù)庫相關(guān)寫作素材成向量數(shù)據(jù)庫相關(guān)寫作素材48gh48ght?2024Transwarp.AllRightsReserved.金融行業(yè)大模型應(yīng)用案例-5:智能盡調(diào)報(bào)告生成星環(huán)科技股票代星環(huán)科技49Copyright?2024Transwarp.AllRightsReserved.49股票代碼688031星環(huán)科技金融行業(yè)大模型應(yīng)用案例-5:智能股票代碼688031星環(huán)科技大綱模板:一、公司基本情況(一)公司基本信息(二)公司管理能力現(xiàn)狀二、行業(yè)狀況評(píng)價(jià)(一)客戶行業(yè)相關(guān)信息(二)行業(yè)政策(三)行業(yè)內(nèi)企業(yè)對(duì)比三、經(jīng)營(yíng)情況(一)經(jīng)營(yíng)概況(二)經(jīng)營(yíng)模式分析(三)核心競(jìng)爭(zhēng)力(四)公司戰(zhàn)略及策略分析四、財(cái)務(wù)評(píng)價(jià)(一)財(cái)務(wù)報(bào)表及人行征信情況(二)財(cái)務(wù)指標(biāo)分析(三)異動(dòng)科目分析(四)主要會(huì)計(jì)科目明細(xì)分析五、ESG情況(一)申請(qǐng)人ESG風(fēng)險(xiǎn)分類及碳排放情況(二)ESG風(fēng)險(xiǎn)相關(guān)情況六、重大事項(xiàng)(一)申請(qǐng)人及其主要成員單位發(fā)行上市情況(二)申請(qǐng)人及其主要成員單位重大資產(chǎn)/業(yè)務(wù)重組、重大資產(chǎn)處置情況(三)申請(qǐng)人及其主要管理者涉訴及糾紛情況(四)申請(qǐng)人及其主要成員涉及的擔(dān)保圈、互保情況(五)關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)內(nèi)部保密知識(shí)培訓(xùn)制度
- 2026浙江臺(tái)州市溫嶺市嶺安物業(yè)有限公司招聘20人考試備考題庫附答案
- 2026湖南長(zhǎng)沙市實(shí)驗(yàn)小學(xué)北園學(xué)校春季教師(含實(shí)習(xí)教師)招聘?jìng)淇碱}庫附答案
- 2026福建省面向西南政法大學(xué)選調(diào)生選拔工作備考題庫附答案
- 2026紹興新昌縣教體系統(tǒng)校園招聘教師27人參考題庫附答案
- 2026貴州臺(tái)江縣人民醫(yī)院(醫(yī)共體)總院第一階段招聘臨聘人員參考題庫附答案
- 2026遼寧鐵嶺市鐵嶺縣消防救援大隊(duì)政府專職隊(duì)員招聘?jìng)淇碱}庫附答案
- 2026陜西省面向西安電子科技大學(xué)招錄選調(diào)生參考題庫附答案
- 2026黑龍江齊齊哈爾市建華區(qū)消防大隊(duì)政府專職消防員招聘11人參考題庫附答案
- 北京市海淀區(qū)中關(guān)村第三小學(xué)教育集團(tuán)幼兒園招聘參考題庫附答案
- 傳染病疫情報(bào)告制度及報(bào)告流程
- 語文學(xué)科建設(shè)實(shí)施方案
- 【高考真題】重慶市2024年普通高中學(xué)業(yè)水平等級(jí)考試 歷史試卷
- 2024-2025學(xué)年滬科版九年級(jí)(上)物理寒假作業(yè)(四)
- 建筑制造施工圖設(shè)計(jì)合同模板
- 經(jīng)典版雨污分流改造工程施工組織設(shè)計(jì)方案
- 第4節(jié) 密度的應(yīng)用 (說課稿)2024-2025學(xué)年人教八年級(jí)物理上冊(cè)
- 月經(jīng)不調(diào)中醫(yī)護(hù)理常規(guī)
- 2024年天津駕駛員客運(yùn)從業(yè)資格證考試題及答案
- TCASME 1598-2024 家族辦公室架構(gòu)師職業(yè)技能等級(jí)
- 股骨粗隆骨折并發(fā)癥
評(píng)論
0/150
提交評(píng)論