T-CSPSTC 155-2025 軌道交通人工智能大模型技術(shù)應用規(guī)范_第1頁
T-CSPSTC 155-2025 軌道交通人工智能大模型技術(shù)應用規(guī)范_第2頁
T-CSPSTC 155-2025 軌道交通人工智能大模型技術(shù)應用規(guī)范_第3頁
T-CSPSTC 155-2025 軌道交通人工智能大模型技術(shù)應用規(guī)范_第4頁
T-CSPSTC 155-2025 軌道交通人工智能大模型技術(shù)應用規(guī)范_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

軌道交通人工智能大模型技術(shù)應用規(guī)范2025-06-17發(fā)布2025-07-10實施中國科技產(chǎn)業(yè)化促進會發(fā)發(fā)出布版I Ⅲ 12規(guī)范性引用文件 13術(shù)語和定義 14參考架構(gòu) 24.1模型參考架構(gòu) 24.2模型構(gòu)建流程 45技術(shù)能力體系 56通用能力要求 66.1總體要求 66.2理解能力 66.3生成能力 76.4推理能力 76.5工具調(diào)用能力 77場景服務能力要求 7 77.2通用場景領(lǐng)域服務能力 87.3勘察設(shè)計領(lǐng)域服務能力 87.4建設(shè)管理領(lǐng)域服務能力 97.5運維管理領(lǐng)域服務能力 98服務要求 8.1數(shù)據(jù)安全性 8.2穩(wěn)定性 8.3魯棒性 8.4運行性能 8.5開放性 附錄A(規(guī)范性)軌道交通智能知識問答場景服務能力 A.1行業(yè)需求和目標任務 A.2研發(fā)內(nèi)容 A.3軌道交通大模型應用 參考文獻 Ⅲ本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔識別專利的責任。本文件由中電建鐵路建設(shè)投資集團有限公司。本文件由中國科技產(chǎn)業(yè)化促進會歸口。本文件起草單位:中電建鐵路建設(shè)投資集團有限公司、中國電建集團華東勘測設(shè)計研究院有限公司、浙江數(shù)宇交通科技有限公司、中國電建集團國際工程有限公司、中國水利水電第七工程局有限公司、中國電建市政建設(shè)集團有限公司、北京城建智控科技有限公司、中鐵一局集團城市軌道交通工程有限公司、中鐵六局集團有限公司、西咸新區(qū)軌道交通投資建設(shè)有限公司、杭州杭港地鐵有限公司、西安市軌道交通集團有限公司、福州軌道交通設(shè)計院有限公司、無錫地鐵集團有限公司、重慶市測繪科學技術(shù)研究院、中鐵上海設(shè)計院集團有限公司、中鐵寶橋集團有限公司、中國公路工程咨詢集團有限公司、中車(重慶)智慧軌道交通技術(shù)有限公司、廣州地鐵集團有限公司、中鐵工程設(shè)計咨詢集團有限公司、廣州地鐵設(shè)計研究院股份有限公司、北京城建勘測設(shè)計研究院有限責任公司、中建交通建設(shè)集團有限公司、重慶市軌道交通(集團)有限公司、青島地鐵集團有限公司、南京地鐵建設(shè)有限責任公司、中鐵七局集團有限公司、中鐵科學研究院集團有限公司、深圳市地鐵集團有限公司、南寧軌道交通投資集團有限公司、寧波市測繪和遙感技術(shù)研究院、江西交信科技有限公司、中國標準化研究院、中鐵第四勘察設(shè)計院集團有限公司、中國建設(shè)基礎(chǔ)設(shè)施有限公司、北京城建設(shè)計發(fā)展集團股份有限公司。本文件主要起草人:曹玉新、張宏偉、姜永濤、閆自海、嚴佳佳、李金武、陳詩、王莞舒、李斯勝、謝世超、郭柏里、季奇、張輝、黨西峰、張志安、高昂、楊驍、湯可、任冬生、胡賢國、曾敏、高樂財、馮鑠、張軍、莫振澤、滕德貴、李超、劉建紅、朱德榮、袁銘、李利軍、馬鵬、方恩權(quán)、農(nóng)興中、資利軍、王子昂、閆向陽、崔庭瓊、劉瀚文、劉建友、郭蘇銳、廖景、翟利華、于淼、荊虹波、于木里、賽菡、劉宏偉、蘆睿泉、1軌道交通人工智能大模型技術(shù)應用規(guī)范本文件給出了面向軌道交通行業(yè)的大模型的參考架構(gòu)和技術(shù)能力體系,規(guī)定了通用能力要求、場景服務能力要求和服務要求。本文件適用于模型提供方、應用服務方對城市軌道交通行業(yè)大模型的能力進行研發(fā)和應用,也為鐵路和城際軌道交通行業(yè)的大模型能力建設(shè)提供參考。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T41867—2022信息技術(shù)人工智能術(shù)語GB/T45225人工智能深度學習算法評估3術(shù)語和定義GB/T41867—2022界定的以及下列術(shù)語和定義適用于本文件。結(jié)合軌道交通行業(yè)中的勘測設(shè)計、建設(shè)管理、運維管理領(lǐng)域的數(shù)據(jù)和基礎(chǔ)大模型訓練得到與軌道交通行業(yè)上下游任務及場景的適配度較高的定制化模型。人工智能系統(tǒng)相關(guān)理論、方法、機制和應用的研究和開發(fā)。[來源:GB/T41867—2022,3.1.2,有修改]模型訓練modeltraining利用訓練數(shù)據(jù),基于機器學習算法,確定或改進機器學習模型參數(shù)的過程。預訓練模型pre-trainedmodel使用大規(guī)模數(shù)據(jù)集在自監(jiān)督學習訓練基礎(chǔ)上得到的,具備大參數(shù)量的深度學習模型。2提升模型執(zhí)行速度,泛化能力,或改善利益相關(guān)方所關(guān)心的其他特性的方法。注:如神經(jīng)網(wǎng)絡模型優(yōu)化的方式包含剪枝、量化、調(diào)整參數(shù)、調(diào)整模型深度和寬度、增減特征或根據(jù)硬件平臺具體特性重新安排聚合算子等。用于訓練機器學習模型的輸入數(shù)據(jù)樣本子集。為提升人工智能模型的預測精確度,一種先以大型廣泛領(lǐng)域數(shù)據(jù)集訓練,再以小型專門領(lǐng)域數(shù)據(jù)集繼續(xù)訓練的附加訓練技術(shù)。注:常用于解決過擬合問題。深度神經(jīng)網(wǎng)絡學習deepneuralnetworklearning通過訓練具有許多隱層的神經(jīng)網(wǎng)絡來創(chuàng)建豐富層次表示的方法。注:深度學習是機器學習的一個子集。將深度學習模型中的參數(shù)和計算從高精度數(shù)據(jù)類型轉(zhuǎn)換為低精度數(shù)據(jù)類型的過程,以減少模型的增量預訓練incrementalpre在已有預訓練模型的基礎(chǔ)上,通過添加新的數(shù)據(jù)或任務進行進一步預訓練的技術(shù)方法,使模型能夠更好地適應新的場景、任務或數(shù)據(jù)分布變化。檢索增強生成retrieval-augmentedgeneration;RAG將外部知識檢索與生成式模型相結(jié)合,在利用豐富的外部知識來增強文本生成的質(zhì)量和效果,使生成的文本更具準確性、相關(guān)性和豐富性。4參考架構(gòu)軌道交通行業(yè)的大模型參考架構(gòu)主要包括計算資源池、工具層、數(shù)據(jù)資源層、交通行業(yè)應用等層次架構(gòu),軌道交通行業(yè)的大模型參考架構(gòu)見圖1。3軌道交通行業(yè)應用程質(zhì)量智熊工程風險管理程監(jiān)測程投資智能工智能工智熊工應用開發(fā)智能客智能客運服務運維管理場景智能票備維保智能人歷資源管理智能物資管理軌道交通大模型服務平臺/組件工具數(shù)據(jù)資源計算資源池4——軌道交通行業(yè)應用為各類軌道交通用戶提供預訓練模型下游任務匹配服務;——服務平臺/組件貫穿各層次提供支持大模型和相關(guān)服務的編排、部署、模型推理、運維和管理。4.2模型構(gòu)建流程大模型構(gòu)建流程主要包括:行業(yè)需求和目標任務確定、基座大模型選擇、數(shù)據(jù)收集與處理、模型訓練圖2軌道交通行業(yè)大模型構(gòu)建流程軌道交通行業(yè)大模型構(gòu)建流程詳述如下。a)行業(yè)需求和目標任務確定:明確軌道交通行業(yè)需求、領(lǐng)域特性及目標任務。b)基座大模型選擇:應綜合考慮通用大模型的性能、規(guī)模、社區(qū)支持度、可擴展性和兼容性以及自身成本等多個因素。c)數(shù)據(jù)收集與處理:1)應規(guī)定數(shù)據(jù)來源的合法性和質(zhì)量要求,明確數(shù)據(jù)收集的層級、方法和程序;3)應制定數(shù)據(jù)集存儲和管理安全措施,保護公司私域數(shù)據(jù)安全。d)模型訓練與調(diào)優(yōu),宜具備以下過程:1)模型預訓練:在預訓練模型基礎(chǔ)上,利用軌道交通行業(yè)數(shù)據(jù)進行增量預訓練,增強其在特2)模型指令微調(diào):利用專業(yè)構(gòu)建的指令數(shù)據(jù)進行有監(jiān)督微調(diào)(SFT)或部分參數(shù)微調(diào)(LoRA)等技術(shù),進一步彌合大模型與特定應用需求之間的差距;3)對齊微調(diào):通過獎勵模型和強化學習等技術(shù)進行對齊微調(diào),確保模型輸出符合預期。e)模型測評與驗證:使用大模型測評框架等測評框架對已訓練模型的通用性能和專業(yè)性能進行測試評估,并驗證其在實際場景下的表現(xiàn)。f)模型部署與應用:1)應明確大模型部署的環(huán)境和部署框架要求,確保模型能在實際應用中穩(wěn)定運行;2)應說明大模型接口的設(shè)計和調(diào)用方式,便于其他系統(tǒng)的集成和應用;3)描述大模型應用的場景和限制條件,注意模型的適用范圍和局限性。g)模型監(jiān)控與更新,應具備以下過程:1)制定模型性能的監(jiān)控機制,實時監(jiān)測模型的運行狀態(tài)和性能指標;2)根據(jù)用戶反饋和新數(shù)據(jù)進行模型的持續(xù)迭代和優(yōu)化;5根據(jù)軌道交通行業(yè)應用特點以及行業(yè)應用所需的模型能力和服務需求,對能力域能力子域能力項理解能力圖像理解圖文理解生成能力圖文生成圖文音生成推理能力工具調(diào)用能力工具使用智能設(shè)計咨詢智能設(shè)計審查智能設(shè)計報告智能出圖6表1軌道交通大模型技術(shù)能力體系(續(xù))能力域能力子域能力項智能行車組織智能客運組織知識檢索圖表生成方案策劃一6通用能力要求軌道交通大模型在場景應用中主要具備理解、生成、推理和工具調(diào)用這四個維度的基礎(chǔ)能力。6.2理解能力軌道交通大模型應具備包括但不限于以下理解能力:a)文本理解:針對軌道交通工程全周期場景中涉及的文本數(shù)據(jù),提供文本識別、文本分類、命名實7b)圖像理解:針對軌道交通工程全周期場景中涉及的圖像數(shù)據(jù),提供人臉識別、行為識別、靜態(tài)圖像分類、靜態(tài)圖像分割、目標檢測、動態(tài)圖像分類等c)語音理解:針對軌道交通工程全周期場景中涉及的音頻數(shù)據(jù),提供語音喚醒、語音識別、音頻問答、環(huán)境音分類等語音領(lǐng)域理解能力支持;d)圖文理解:針對軌道交通工程全周期場景中涉及的圖文數(shù)據(jù),提供圖文檢索、圖片問答、視覺空e)表格理解:針對軌道交通工程全周期場景中涉及的表格數(shù)據(jù),提供表格檢索、表格問答聯(lián)關(guān)系、表格推理等表格跨模態(tài)理解能力支持。軌道交通大模型應具備包括但不限于以下生成能力:a)文本生成:針對軌道交通工程全周期場景中涉及的文本數(shù)據(jù),提供摘要總結(jié)、機器b)圖文生成:針對軌道交通工程全周期場景中涉及的圖像和文本數(shù)據(jù),提供文本生成圖片(圖c)文音生成:針對軌道交通工程全周期場景中涉及的音頻和文本數(shù)據(jù),提供語音合成、語音識別、語音翻譯等能力支持;d)圖文音生成:針對軌道交通工程全周期場景中涉及的圖像、文本和音頻數(shù)據(jù),提供文本生成有聲視頻、視頻生成文本描述等能力支持;e)表格生成:針對軌道交通工程全周期場景中涉及的圖像、文本和音頻數(shù)據(jù),提供文本生成表格、表格描述等能力支持。軌道交通大模型應具備包括但不限于以下推理能力:a)智能分析:針對軌道交通工程全周期場景中涉及的客流、軌跡、行車、調(diào)度、應急和異常事件等b)輔助決策:針對軌道交通工程全周期場景中涉及的客流、軌跡、行車、調(diào)度、應急和異常事件等軌道交通大模型應具備包括但不限于以下工具調(diào)用能力:a)工具使用:針對軌道交通工程全周期場景中涉及各個業(yè)務系統(tǒng)API,提供調(diào)用API、檢索API、規(guī)劃API等工具調(diào)用能力支持;b)任務規(guī)劃:針對軌道交通工程全周期場景中涉及復雜任務,提供任務分解、自我反思、思維鏈等任務規(guī)劃能力。7場景服務能力要求87.2通用場景領(lǐng)域服務能力在規(guī)劃設(shè)計、建設(shè)管理、運維管理領(lǐng)域,軌道交通大模型應提供包括但不限于以下通用場景服務換和存儲。提供文檔版本管理功能,確保用戶能夠訪問到最新的文檔版本。b)知識檢索:支持提供快速準確的軌道交通行業(yè)各領(lǐng)域知識檢索功能,幫助用戶快速找到所需信c)智能問答:支持智能問答功能,解答用戶在軌道交通領(lǐng)域的各種問題。支持提供個性化推薦,根據(jù)用戶的歷史問題和偏好,推薦相關(guān)問題和答案。d)報告生成:支持根據(jù)用戶需求和數(shù)據(jù)輸入,自動生成各種類型的報告,如項目進展報告、技術(shù)評估報告等。支持報告的自定義和編輯功能,以滿足不同用戶的需求。e)圖表生成:支持根據(jù)用戶需求和數(shù)據(jù)輸入,自動生成各種圖表,如工程進度圖、設(shè)備狀態(tài)圖等。支持圖表的編輯和導出功能,方便用戶在不同場景中使用。f)測評考試:支持軌道交通各領(lǐng)域?qū)I(yè)崗位的測評考試,包括題庫管理、在線考試、成績統(tǒng)計等功能。提供個性化的學習推薦和測評報告,幫助用戶提升專業(yè)技能。g)合成數(shù)據(jù):支持軌道交通各領(lǐng)域的仿真測試與算法模型訓練提供無限的合成數(shù)據(jù)和場景,支持數(shù)據(jù)增強和變換功能,以增加數(shù)據(jù)的多樣性和復雜性。h)應用開發(fā):支持根據(jù)用戶的需求和輸入,自動生成軌道交通各領(lǐng)域相關(guān)應用所需的代碼,支持多種編程語言和開發(fā)框架,用戶可以通過簡單的描述或輸入示例數(shù)據(jù),指導大模型生成所需的代碼提高工作效率。i)方案策劃:理解用戶提出的需求、目標和約束條件,考慮軌道交通相關(guān)領(lǐng)域的專業(yè)知識、最佳實踐、法規(guī)標準等,生成滿足要求的方案,不限于事前預防措施方案、事中處置與應急措施方案、事后改進措施方案等??商峁┒喾N可能的方案選項,并對每個方案進行初步評估。j)任務執(zhí)行:理解用戶提出的需求和任務描述,將復雜的用戶需求分解為一系列可執(zhí)行的具體任務,并為每個任務確定合適的執(zhí)行順序和依賴關(guān)系,根據(jù)任務需求,自動調(diào)用相關(guān)的外部工具或軟件(如仿真模擬軟件、數(shù)據(jù)分析工具、CAD設(shè)計軟件等)來執(zhí)行任務。監(jiān)控任務的執(zhí)行進度,收集執(zhí)行結(jié)果,并將結(jié)果整合后呈現(xiàn)給用戶,確保用戶需求的準確實現(xiàn)。7.3勘察設(shè)計領(lǐng)域服務能力在勘測設(shè)計領(lǐng)域,軌道交通大模型應提供包括但不限于以下專項場景服務能力:a)智能設(shè)計咨詢:具備勘測設(shè)計規(guī)范問答、項目案例問答、技術(shù)難題問答、工程知識問答、文檔上傳問答以及專家意見問答等服務能力;b)智能方案設(shè)計:具備針對線路設(shè)計、車站布局、管線布置等方面提供智能輔助方案生成、優(yōu)化與比選的服務能力;c)智能深化設(shè)計:具備針對預制加工、預留預埋等方面提供智能輔助施工圖及施工深化設(shè)計方案生成、優(yōu)化與比選的服務能力;d)智能設(shè)計審查:具備智能輔助基于建筑信息模型(BIM)的專業(yè)設(shè)計合規(guī)性和建模合標性審查的服務能力;大綱及模板自動生成,并提供知識問答助手,輔助報告內(nèi)容和結(jié)論的編寫;f)智能出圖:基于設(shè)計標準規(guī)范庫、案例經(jīng)驗庫、構(gòu)件庫、符號庫、線型庫、標注庫等知識庫建設(shè),實現(xiàn)智能輔助基于BIM模型或設(shè)計方案數(shù)據(jù)自動生成可交付的圖紙;9g)智能建模:具備智能輔助基于二維CAD圖紙、設(shè)計方案或鉆孔數(shù)據(jù)自動進行勘測設(shè)計建模的服務能力;h)智能算量:具備智能輔助基于二維CAD圖紙或BIM模型自動算量的服務能力。軌道交通智能知識問答場景服務能力示例的完整展現(xiàn)描述應符合附錄A的規(guī)定。7.4建設(shè)管理領(lǐng)域服務能力在建設(shè)管理領(lǐng)域,軌道交通大模型應提供包括但不限于以下專項場景服務能力:a)智能工程進度管理:通過實時監(jiān)控工程進度、聯(lián)動材料等業(yè)務數(shù)據(jù),具備快速編排生成進度計劃方案并比選、參數(shù)化進度計劃快速調(diào)優(yōu)建議、預測分析及預警播報等能力;b)智能工程質(zhì)量管理:具備質(zhì)量控制點智能識別分析、施工材料合規(guī)率及需求分析、施工現(xiàn)場質(zhì)量缺陷識別及預警、施工質(zhì)量問題原因分析定位等能力;c)智能工程風險管理:具備施工前潛在的風險源智能預測識別及風險應對方案智能生成、施工期間動態(tài)跟蹤并實時分析風險情況等能力;d)智能工程監(jiān)測管理:通過對工程監(jiān)測數(shù)據(jù)進行讀取、對比,智能輸出監(jiān)測報告,并通過建立預測分析快速評估模型,具備工程監(jiān)測評估及預警能力;e)智能工程應急管理:基于應急知識庫、氣象庫、地質(zhì)庫輔助應急智能分析,具備事前應急預案生成及優(yōu)化、事中應急智能輔助處置、事后智能復盤調(diào)優(yōu)應急預案能力;f)智能工程投資管理:具備成本趨勢分析并提供優(yōu)化方案、成本潛在風險分析并提供應對方案、投資分析報告智能生成等能力;g)智能工程監(jiān)理:通過智能分析巡視檢查數(shù)據(jù)并聯(lián)動進度、質(zhì)量、安全等業(yè)務數(shù)據(jù),具備巡察事前智能提醒、事中智能輔助及復核、事后智能整改及復測等能力;h)智能工程方案管理:基于案例向量庫并聯(lián)動工程概況、進度、資源等業(yè)務數(shù)據(jù),具備施工前組織設(shè)計、施工期間專項方案、施工后總結(jié)報告的智能生成及審查能力;i)智能工程檔案管理:具備檔案歸檔及移交方面的風險與合規(guī)性檢查、檔案查詢方面的高效問答及自動化報告生成、檔案階段性維護方面的預測性檢查、合同智能分析方面的條款分析與法律法規(guī)核查等能力。7.5運維管理領(lǐng)域服務能力在運維管理領(lǐng)域,軌道交通大模型應提供包括但不限于以下專項場景服務能力:a)智能行車組織:通過列車運行情況、客流情況等數(shù)據(jù),具備針對行車調(diào)度、b)智能客運組織:根據(jù)車站歷年客流數(shù)據(jù)、季節(jié)性變化規(guī)律數(shù)據(jù)、周邊環(huán)境數(shù)據(jù)等信息,具備針對實時客流數(shù)據(jù)進行輔助分析預判、預警,大客流應急管控方案生成等管理的能力;c)智能客運服務:通過可互動大屏、手機APP等多種方式,具備為乘客提供智能問詢,智能導乘,遺失物品查找、運營相關(guān)問題解答等多種智能服務能力;退改簽、智能票務信息查詢等智能服務能力;e)智能設(shè)施維保維修:通過實時采集和分析交通設(shè)施的檢測監(jiān)測數(shù)據(jù),整合歷史維保資料,具備對設(shè)施狀態(tài)評估、識別潛在病害、維護維修計劃制定等功能的服務能力;f)智能設(shè)備維保維修:通過實時采集和分析交通設(shè)備的運行監(jiān)測數(shù)據(jù),整合歷史維保資料,具備對設(shè)備狀態(tài)評估、識別潛在故障、維護維修計劃制定等功能的服務能力;g)智能安全管理:具備運維安全風險源智能預測識別、風險應對方案智能生成、風險管控實施與安全監(jiān)測預警報告智能生成等服務能力;h)智能人力資源管理:具備智能人員排班交班管理、智能人員培訓管理等能力;i)智能物資管理:具備智能物資采購計劃生成、采購方案生成比選、智能物資報表整合、智能物資盤點等能力。8服務要求8.1數(shù)據(jù)安全性在數(shù)據(jù)安全性方面,主要包括以下要求:a)數(shù)據(jù)來源:應建立數(shù)據(jù)來源評估機制,確保數(shù)據(jù)來源符合具備法律效力的授權(quán)文件、許可協(xié)議等要求;b)數(shù)據(jù)采集:應具備數(shù)據(jù)采集記錄機制,不應采集他人已明確不可采集的數(shù)據(jù);c)數(shù)據(jù)分類分級:應具備數(shù)據(jù)分類分級管理機制,針對軌道交通行業(yè)業(yè)務特性和技術(shù)需求,按照數(shù)據(jù)的類型和級別,對采集的數(shù)據(jù)進行管理和使用;d)數(shù)據(jù)標注:應建立數(shù)據(jù)標注安全管理機制,組織數(shù)據(jù)標注人員安全培訓,明確數(shù)據(jù)標注規(guī)則,確保數(shù)據(jù)標注結(jié)果符合數(shù)據(jù)安全相關(guān)法律法規(guī)和標準要求;e)數(shù)據(jù)加密:應建立數(shù)據(jù)加密機制,根據(jù)數(shù)據(jù)分類分級情況,針對數(shù)據(jù)傳輸、加密等數(shù)據(jù)處理活動采用不同強度的加密措施,例如采用在數(shù)據(jù)傳輸過程中采用加密通信協(xié)議、對敏感數(shù)據(jù)進行加密存儲等;和國個人信息保護法》的要求開展數(shù)據(jù)內(nèi)容合規(guī)檢查,并依據(jù)《生成式人工智能服務管理暫行辦法》要求,對生成式人工智能大模型開展安全評估,并依據(jù)《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)在穩(wěn)定性方面,主要包括以下要求:a)故障恢復力:應具備模型故障檢測和處理能力,包括模型失效檢測、推理故障檢測及容災等問題;b)網(wǎng)絡穩(wěn)定性:應具備重點業(yè)務分區(qū)隔離、業(yè)務鏈路加固以及安全組織策略等措施,對通信網(wǎng)絡進行統(tǒng)一規(guī)劃和分析;c)服務穩(wěn)定性:所采用的芯片以及硬件資源宜支持安全啟動、可信啟動流程及安全性驗證,保障服務的安全可靠運行。在魯棒性方面,主要包括以下要求:a)異常樣本識別:應支持對異常樣本、噪聲數(shù)據(jù)的識別能力,包括霧化效果、高斯噪聲、水平位移等;b)對抗性攻擊防御:應具備一定的對抗性攻擊防御機制,包括提示注入攻擊、對抗性樣本攻擊和模型竊取攻擊等;c)能按照人工智能服務能力成熟度評估要求開展評估并到達系統(tǒng)魯棒性要求。在運行性能方面,主要包括以下要求:a)生成內(nèi)容準確性:應具備一定的生成內(nèi)容保障機制,檢測虛假、違規(guī)生成內(nèi)容,保b)服務響應時間:應根據(jù)軌道交通行業(yè)特性需求,應采用一定的技術(shù)措施優(yōu)化服務響應時間,提升服務的運行效果,包括模型輸入信息響應時間、生成所有內(nèi)容的平均響應時間等;c)服務并發(fā)量:應根據(jù)軌道交通行業(yè)特性需求,結(jié)合GB/T45225給出的深度學習算法評估要求,在給定計算資源和運行環(huán)境的條件下,有效提升服務的并發(fā)量,保障輸入信息以及用戶請求的正確處理。8.5開放性在開放性方面,主要包括以下要求:a)部署方式:根據(jù)軌道交通行業(yè)特性,應具備一種以上的模型部署形式,包括云端部署、邊端部b)開發(fā)工具:針對軌道交通行業(yè)進行開發(fā)時,應提供多種模型開發(fā)工具,包括模型訓練工具以及相關(guān)模型訓練、推理工具鏈等;c)兼容性:應提供與軌道交通行業(yè)其他子系統(tǒng)、組件的兼容能力,包括業(yè)務系統(tǒng)、內(nèi)網(wǎng)環(huán)境、操作系統(tǒng)等兼容性。(規(guī)范性)軌道交通智能知識問答場景服務能力A.1行業(yè)需求和目標任務隨著交通行業(yè)業(yè)務模式和管理體系的快速變革,知識更新迭代加速,信息量爆炸式增長,知識獲取和利用效率亟待提升。軌道交通行業(yè)相關(guān)標準體系較為冗雜,技術(shù)報告種類繁多,知識專業(yè)性較強,隨著存儲內(nèi)容增多,傳統(tǒng)紙質(zhì)文檔或數(shù)字知識庫,不便于知識的檢索與應用,不利于數(shù)字資產(chǎn)的傳遞。通過軌道交通智能知識檢索,可實現(xiàn)信息快速檢索、提升查詢速度,實現(xiàn)全面、快速、準確的問答功為建設(shè)軌道交通智能知識檢索服務,需要具備知識庫建設(shè)、軌道交通大模型訓練、知識檢索和問答開發(fā)三個過程。A.2研發(fā)內(nèi)容A.2.1軌道交通大模型訓練A.2.1.1基座大模型選擇具體而言,模型選型主要有以下考慮因素。a)性能:評估大模型在特定自然語言處理(NLP)任務上的表現(xiàn),包括但不限于自然語言理解、文本生成和知識密集型任務。性能評估應涵蓋模型的準確性、效率和泛化能力,這些能力是模型適應不同行業(yè)場景和定制化需求的關(guān)鍵。b)規(guī)模:根據(jù)任務需求和預算限制,選擇參數(shù)規(guī)模適中的模型。不同規(guī)模的模型在性能和成本上存在差異,應尋求性價比最優(yōu)的解決方案。c)社區(qū)支持度:是否有強大的技術(shù)支持和活躍的社區(qū),這對于解決技術(shù)問題和模型的持續(xù)改進至關(guān)重要。d)可擴展性和兼容性:模型是否能夠輕松地在現(xiàn)有架構(gòu)上擴展或縮減能力,以及是否容易集成到現(xiàn)有的系統(tǒng)中,同時開源協(xié)議是否寬松等。行業(yè)大模型訓練數(shù)據(jù)的收集與處理是一個復雜而細致的過程,涉及數(shù)據(jù)的合法性、質(zhì)量、預處理、構(gòu)建流程以及數(shù)據(jù)集的存儲和管理安全等多個方面,具體如下。a)數(shù)據(jù)收集——數(shù)據(jù)來源:收集公司內(nèi)部數(shù)據(jù)、網(wǎng)絡公開數(shù)據(jù)集和采購收集的工程書籍資料。公司內(nèi)部數(shù)——合法性:應確保數(shù)據(jù)來源的合法性,遵守相關(guān)的法律法規(guī),不應通過非法手段獲取數(shù)據(jù)。在數(shù)據(jù)收集過程中,應根據(jù)數(shù)據(jù)安全級別采取相應的安全措施,并且對——質(zhì)量要求:數(shù)據(jù)質(zhì)量是影響大模型效果的關(guān)鍵因素。應建立數(shù)據(jù)質(zhì)量管理標準,包括數(shù)據(jù)質(zhì)量評價指標、評價方法、管理要求等。數(shù)據(jù)應滿足完整性、準確性原則,確保數(shù)據(jù)的可用性和可靠性。b)數(shù)據(jù)預處理和構(gòu)建流程——文件格式解析:PDF文檔:利用版面分析技術(shù)和光學字符識別(OCR)技術(shù)將圖像中的文字內(nèi)容轉(zhuǎn)換為可編輯文本;Word和TXT文檔:直接提取文本內(nèi)容及其相關(guān)元數(shù)據(jù);——信息提?。簩⑽谋景炊温淝蟹郑?nèi)容按照專業(yè)分類?!獢?shù)據(jù)校核:通過人工校核,確保解析和清洗后的數(shù)據(jù)與原始文檔保持一致性和高質(zhì)量。——數(shù)據(jù)轉(zhuǎn)換:將校核完成的文本語料轉(zhuǎn)換為問答對形式,構(gòu)建指令集,為行業(yè)大模型訓練SFT做準備。c)數(shù)據(jù)集存儲和管理安全措施——存儲安全:應采用校驗技術(shù)、密碼技術(shù)等措施進行安全存儲,并實施數(shù)據(jù)容災備份和存儲介質(zhì)安全管理,定期開展數(shù)據(jù)恢復測試?!L問控制:加強訪問控制,確保只有授權(quán)人員才能訪問敏感數(shù)據(jù)?!獢?shù)據(jù)安全教育和培訓:定期對從業(yè)人員開展數(shù)據(jù)安全教育和培訓,提高全員的數(shù)據(jù)意識和——應急預案:制定應急預案,并開展應急演練,以應對可能的數(shù)據(jù)安全事件。在選定的基座大模型基礎(chǔ)上,利用軌道交通行業(yè)數(shù)據(jù)進行增量預訓練,增強其在特定場景和任務上的表現(xiàn),使其能夠更好地理解和處理行業(yè)特有的術(shù)語和上下文,同時為了保證訓練后大模型通用能力不會遺忘太多,還需配比一定的通用語料。在增量預訓練階段,需要合理設(shè)置學習率等超參數(shù),包括初始學習的選擇、簡單偏好優(yōu)化預熱(warm-up)的步數(shù)、學習率衰減的方式等。大模型有監(jiān)督微調(diào)是在增量預訓練的大語言模型的基礎(chǔ)上,通過在軌道交通行業(yè)特定任務上進行額外的訓練來優(yōu)化模型的性能,可以使模型更好地適應軌道交通行業(yè)特定的應用場景,提高其在特定任務上的準確性和效率,從而在處理相關(guān)任務時表現(xiàn)得更加出色。SFT的數(shù)據(jù)通常以指令的形式構(gòu)建,指令包含單輪對話和多輪對話,在進行微調(diào)時,指令數(shù)據(jù)應盡可能多樣化、數(shù)據(jù)質(zhì)量要盡可能高。除了全量的SFT,還有針對部分參數(shù)進行微調(diào)的參數(shù)高效微調(diào)(PEFT),如LoRA等。A.2.1.3.3對齊微調(diào)通過強化學習等技術(shù)對大模型進行對齊微調(diào),確保大模型輸出符合預期,使模型輸出與人類的倫理和價值觀對齊。人類對齊方法很多,包括通過獎勵模型和近端策略優(yōu)化(PPO)訓練優(yōu)化的基于人類反饋的強化學習(RLHF)、直接偏好優(yōu)化(DPO)、自我博弈偏好優(yōu)化(SPPO)和簡單偏好優(yōu)化(SimPO)等。A.2.1.3.4模型測評與驗證使用大模型測評框架等測評框架對已訓練軌道交通大模型的通用性能和專業(yè)性能進行測試評a)通用能力:使用大模型測評框架根據(jù)知識、語言、理解、推理、考試5大能力維度對大模型進行全面的通用能力測評。大模型在這些維度上的表現(xiàn)都可以得到量化指標,例如,知識維度可能涉及模型對特定領(lǐng)域信息的記憶和應用能力,而推理維度則考察模型在邏輯推理和問題解決方面的能力。b)專業(yè)能力:設(shè)計包含軌道交通行業(yè)專業(yè)知識的問答、案例分析、故障診斷在軌道交通行業(yè)的專業(yè)能力。使用自動評估+人工評估的方式,結(jié)合大模型測評框架提供的評測框架,對模型在軌道交通行業(yè)的應用能力進行量化評估。c)實際表現(xiàn):通過使用真實用戶提問和專業(yè)業(yè)務人員撰寫的標準答案,從多個維度反映模型在文A.2.1.3.5.1大模型部署的環(huán)境和部署框架要求大模型的部署需要考慮多個方面,包括硬件資源、軟件型需要強大的計算能力,特別是圖形處理器(GPU)資源,以處理大量的數(shù)據(jù)和復雜的計算任務。第二,軟件環(huán)境方面,需要安裝合適的操作系統(tǒng)和深度學習框架以及相關(guān)的依賴庫。此外,還需要考慮網(wǎng)絡配置,確保模型可以訪問所需的數(shù)據(jù)源和外部服務。大模型的接口設(shè)計通常遵循一定的標準,以便于其他系統(tǒng)的集成和應用。例如支持OpenAI的接口,這已成為業(yè)內(nèi)的一種標準,這種接口設(shè)計具有通用性,使得一套適配OpenAI的代碼可以用于調(diào)用各種其他大模型。調(diào)用方式通常包括單輪會話和多輪會話兩種模式,用戶的每輪問題和模型的輸出會存儲在messages列表中,之后的輸出會參考前面的內(nèi)容,體現(xiàn)了大模型的記憶性。A.3軌道交通大模型應用軌道交通行業(yè)經(jīng)過多年的業(yè)務發(fā)展,積淀了數(shù)量眾多的行業(yè)數(shù)據(jù),這些數(shù)據(jù)形式多樣存儲分散,結(jié)構(gòu)化程度較低。知識庫的建設(shè)是對行業(yè)內(nèi)部知識資源的重新規(guī)整,形成對內(nèi)的知識服務,充分利用知識構(gòu)建交通行業(yè)智能知識庫,區(qū)別于數(shù)字知識庫,并非簡單地將知識文檔按文件夾分類進行儲存,而是需要對電子文檔進行一系列清洗處理,或變成結(jié)構(gòu)化知識庫,或變成向量化數(shù)據(jù)庫,是應用大模型技術(shù)開展包括知識問答在內(nèi)的各類人工智能生成內(nèi)容(AIGC)應用的基礎(chǔ)。在這個過程中,首先需要進行數(shù)據(jù)收集工作,軌道交通智能知識檢索的知識來源包括但不限于:各專業(yè)設(shè)計規(guī)范、各專業(yè)技術(shù)報告文件、各專業(yè)項目案例(包括圖紙、設(shè)計說明、計算書)、專業(yè)證書考試題在數(shù)據(jù)處理過程中,按照文件類型對數(shù)據(jù)的異常字符處理,去除噪聲,消除數(shù)據(jù)中冗余、錯誤和不一致等問題,最后得到純凈的文本語料;其次將大塊文本進行分片,并將相應片段錄入數(shù)據(jù)庫和向量庫中,最終將散亂的專業(yè)知識全部錄入數(shù)據(jù)庫中,搭建出專業(yè)領(lǐng)域知識庫。A.3.2知識檢索和問答結(jié)合軌道交通智能知識庫和軌道交通行業(yè)大模型,實現(xiàn)軌道交通智能知識檢索和問答能力。檢索增強生成(Retrieval-AugmentedGeneration,RAG)是一種目前使用較普遍的商業(yè)化解決方案。它通過檢索外部垂域知識庫中的相關(guān)信息,結(jié)合基礎(chǔ)大語言模型生成答案。這種方法可以有效利用外部垂域知識,提升回答的準確性和豐富性。通俗理解,RAG就是給大語言模型(LLM)外掛一個“實時可更新的知識庫”,是一種使用外部數(shù)據(jù)來提高LLM的準確性和可靠性的技術(shù)。RAG給大模型提供了巨大的知識擴展能力,該方法無需對大模型進行訓練,成本低效益高,且能夠增強模型輸出的可信度、準確性和專業(yè)性。當然,它也存在一些弊端,RAG技術(shù)不會改變模型本身的推理能力和大模型參數(shù),如果大模型本身參數(shù)不足、在理解和推理上存在固有缺陷,單純用RAG技術(shù)也無法提高模型的輸出能力。RAG流程大致可分為以下兩步?!斎胩幚恚菏紫?,系統(tǒng)接收一個輸入查詢,這可能是一個問題、一段文本自然語言輸入?!蜻x生成:系統(tǒng)使用檢索模塊,如倒排索引、向量搜索或神經(jīng)網(wǎng)絡模型,相關(guān)的候選文檔或信息片段。這些文檔和片段就是來自事先構(gòu)建好了的軌道交通知識庫。——候選篩選:從檢索到的候選文檔中,系統(tǒng)會根據(jù)相關(guān)性對它們進行排序和篩選,以確定哪些文檔最有可能包含對輸入查詢有用的信息。——上下文融合:一旦確定了最相關(guān)的候選文檔,系統(tǒng)會將這些文檔的內(nèi)容作為上下文信息輸入到生成模塊中?!谋旧桑捍竽P蜁褂眠@些上下文信息來生成響應或完成文本生成任務,軌道交通大模型能夠更好地理解上下文信息,并據(jù)此生成連貫、相關(guān)且準確的輸出?!敵鰞?yōu)化:生成的文本會經(jīng)過進一步的優(yōu)化和細化,以提高其自然度、準確性和相關(guān)性。A.3.3評價指標A.3.3.1軌道交通行業(yè)指令理解軌道交通大模型宜支持語義識別、語義解析、業(yè)務意圖理解等軌道交通行業(yè)指令理解任務。評估目的為評估軌道交通大模型對指令理解任務的支持度以及在任務上的效果。評估方法包括以下內(nèi)容。a)構(gòu)建測試數(shù)據(jù)集并測試軌道交通大模型對軌道交通行業(yè)指令理解類任務的覆蓋程度,正確完成測試數(shù)據(jù)對應子任務類型則判定覆蓋該子任務,包括但不限于以下子任務:語音識別、語義b)構(gòu)建行業(yè)指令理解測試數(shù)據(jù)集,數(shù)據(jù)集包括本節(jié)中定義的任務子類,應根據(jù)待評估軌道交通大模型適配效果選擇至少一類子任務進行測試,并選擇合適的評價指標,測試工業(yè)大模型在工業(yè)指令理解任務的效果。句識別準確率、意圖識別率、上下文識別正確率計算方法分別參見下列公式:1)句識別準確率(對比識別序列與標準序列,計算其語音識別的句準確率)見式(A.1):SCR——句識別準確率;H——識別正確的無誤句子數(shù);N——總句數(shù)。2)意圖識別率見式(A.2):PF——單輪問答意圖識別率;F?——意圖正確的問答數(shù);F——單輪問答數(shù)據(jù)總數(shù)。3)下文識別正確率(即多輪問答某個輪次正確則視為下文識別正確)見式(A.3):式中:PD——下文識別率;D?——正確識別的輪次量;D——測試總輪次量。A.3.3.2軌道交通智能知識問答對話能力A.3.3.2.1軌道交通知識單輪問答軌道交通大模型宜支持概念解釋、常識問答等軌道交通知識單輪問答任務。評估目的:評估軌道交通大模型的單輪知識問答任務支持度及性能優(yōu)越度。評估方法包括以下內(nèi)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論