T-CICC 31006-2025 智能兵棋推演系統(tǒng)設計要求_第1頁
T-CICC 31006-2025 智能兵棋推演系統(tǒng)設計要求_第2頁
T-CICC 31006-2025 智能兵棋推演系統(tǒng)設計要求_第3頁
T-CICC 31006-2025 智能兵棋推演系統(tǒng)設計要求_第4頁
T-CICC 31006-2025 智能兵棋推演系統(tǒng)設計要求_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

T/CICC31006—2025智能兵棋推演系統(tǒng)設計要求RequirementsforthedesignofanintelligentwargamI 12規(guī)范性引用文件 13術語和定義 14智能兵棋推演系統(tǒng)總體架構 34.1總體架構 34.2業(yè)務邏輯層(服務層) 44.2.1對抗推演引擎 44.2.2業(yè)務管理 44.3應用層(客戶端) 54.3.1管理員及導演客戶端 54.3.2觀摩客戶端 54.3.3推演交互客戶端 54.3.4兵棋智能體框架(兵棋智能體客戶端) 54.3.5復盤觀看客戶端 64.4數據層 64.4.1決策總線 64.4.2復盤數據存儲、回放 75智能兵棋推演系統(tǒng)接口 75.1推演環(huán)境接口 75.1.1用戶授權驗證接口 75.1.2數據回傳系列接口 75.2兵棋訓練環(huán)境接口 75.3兵棋智能體接口 8 8 95.5.1算子和編成區(qū) 95.5.2態(tài)勢區(qū) 95.5.3數據區(qū) 95.5.4指令下達區(qū) 96智能兵棋推演系統(tǒng)主要流程 96.1智能體本地高速訓練流程 96.2網絡對抗流程 附錄A示例 A.1推演環(huán)境接口相關示例 A.1.1用戶授權驗證接口示例 A.1.2數據回傳系列接口示例 A.2兵棋訓練環(huán)境接口相關示例 A.3兵棋智能體接口相關示例 A.4兵棋智能體開發(fā)SDK示例 I本文件按照GB/T1.1-2020《標準化工作導則第1部分:標準化文件的結構和起草規(guī)則》的規(guī)定起草。本文充分考慮通用智能體、大模型等技術的近期發(fā)展趨勢,通過擴展接口、優(yōu)化決策總線架構、完善開發(fā)工具鏈等方式,為未來異構智能實體的接入預留適配空間,確保系統(tǒng)具備技術前瞻性與擴展請注意本文件的某些內容可能涉及專利。本文件的發(fā)布機構不承擔識別專利的責任。本文件由中國科學院自動化研究所提出。由中國指揮與控制學會歸口。本文件起草參與單位:組長單位:中國科學院自動化研究所;副組長單位:南開大學人工智能學院、北京理工大學機電學院;成員單位:中國電子科技集團有限公司電子科學研究院、中國人民解放軍國防科技大學試驗訓練基地、紫光恒越技術有限公司。本文件主要起草人:倪晚成、于海濤、黃凱奇、張雪波、趙銘慧、楊成偉、楊宇、凌艷香、支烽耀、楊俊強、林暉、郭慶浪、劉建勛、李偉、許曉龍、何進、劉鳳鳴、湯再江、徐享忠、楊海波(注:排名不分先后)。本文件規(guī)定了智能兵棋推演系統(tǒng)設計要求,明確了智能兵棋推演系統(tǒng)的接口,達成異構系統(tǒng)間的互操作,為通用智能體的研發(fā)及多環(huán)本文件適用于智能兵棋推演系統(tǒng)在國防教育、應急救援演練、商業(yè)博下列文件中的內容通過文中的規(guī)范性引用而構成本文件必不件,僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適GB/T5271.6—2006數據處理詞匯T/CICC31008-2025智能兵棋推演系統(tǒng)是指符合人工智能博弈框架的計算機兵棋系上具備智能體開放接口(包含人機,機機,人機混合),支持第三方智能體接入并實現態(tài)勢信息與推演指令的交互以實施在線推演,同時可為學習型智能體提供訓練環(huán)境并支持兵棋推演環(huán)境是指依據推演方(含推演人員、兵棋AI、導演人員等)的輸入,按照兵棋規(guī)則的推由總線控制器通過mGBC消息授權具備總線調度能力的RT終端。工2用智能體接口指用于實現通用智能體(具備跨場景決策能力的智能實體)與智能兵棋推演系統(tǒng)集成的標準化接口,支持多模態(tài)輸入(態(tài)勢文本描述、圖像化態(tài)勢等)與靈活輸出(結構化指令、自然語言指令轉換),兼容通用智能體的異步交互特性。大模型接口是指為大模型(如通用大語言模型、多模態(tài)大模型)接入智能兵棋推演系統(tǒng)提供的適配層機制,包括數據格式轉換(態(tài)勢數據→模型輸入格式)、指令解析(模型輸出自然語言→結構化動作指令)、性能優(yōu)化(批量推理、緩存機制)等功能。兵棋智能體接口是指用于實現兵棋智能體、通用智能體、大模型等與演訓練交互的接口,包含基礎交互規(guī)范及擴展適配層,支持同步/異步交互、單步/批量決策等模總線是指系統(tǒng)中標準化、模塊化的信息交互與調度協(xié)調機制,決策總線是指智能兵棋推演系統(tǒng)中實現推演人員、智能體、智能體訓練的標準化、模塊化中樞信息基礎架構,其分為消息總線軟件開發(fā)工具包SDK指為開發(fā)者提供編寫應用程序所需各類資源與工具JSON是指一種輕量級的數據交換格式,以純文本形析的特點,廣泛應用于Web開發(fā)、API數據交互、配置文件等場景。3態(tài)勢是指在一定時間和空間范圍內,涉及各方力量對比、環(huán)境條件、行應用層:包括管理員及導演客戶端、觀摩客戶端、推演交互客戶端、復盤業(yè)務邏輯層:包括服務端的對抗推演引擎(含推演房間、調度模塊)、業(yè)務管理;數據服務層:包括應用層和業(yè)務邏輯層之間的決策總線(消息總線+數據總線)實現狀態(tài)信息與智能兵棋推演系統(tǒng)總體架構如圖1所示。(客戶端)消息總線一業(yè)務邏輯層數據總線一(復盤數據)44.2業(yè)務邏輯層(服務層)對抗推演引擎程序負責調度系統(tǒng)資源、控制兵棋推演環(huán)境的啟動與停止,并兵棋推演環(huán)境模塊實現某一兵棋推演棋盤、算子、規(guī)則的計算機程1)兵棋規(guī)則實現:實現兵棋推演規(guī)則并判斷指令動作能否執(zhí)行,再根據可執(zhí)行指令執(zhí)行規(guī)2)單步推進:在推演過程中按推進時間步長,基于所有推演參與方的指令/動作調用兵棋3)態(tài)勢初始化:在推演開始前依據推演參數初始化態(tài)勢信息,包括加載想定數據、配置內4)復盤記錄:同步單步推進過程持續(xù)記錄推演中的所有態(tài)勢和指令動作以形成復盤數據;5)狀態(tài)重置:在推演結束后清空內部狀態(tài),為下一場推演做準備。b)兵棋推演房間模塊兵棋推演房間模塊創(chuàng)建并封裝兵棋推演環(huán)境,處理推演中各方通信、業(yè)務,從兵棋推演環(huán)境獲取復盤數據并形成持久化存儲,且單個推演房間僅創(chuàng)建1)創(chuàng)建、控制、停止兵棋推演環(huán)境:創(chuàng)建并控制兵棋推演環(huán)境的啟動與停止;2)通信建立:與參與推演各方建立可靠通信方式以確保數據實時準確傳輸;3)時間控制:推動推演時間步進并按預設規(guī)則控制時間節(jié)奏;4)態(tài)勢信息廣播:廣播推演環(huán)境模塊生成的態(tài)勢信息以確保所有參與者同步知曉當前態(tài)勢;5)決策收集:收集參與方決策產生的動作集合作為推演環(huán)境模塊單步推進的參數;6)異常處理:在推演環(huán)境出現異常時執(zhí)行相應處置邏輯以保障推演的連續(xù)性與穩(wěn)定性;7)信息流向控制:控制態(tài)勢信息流向以實現紅、藍、導演各方分別獲取各自態(tài)勢并防止信8)推演方身份認證:標記認證推演方身份以防止非法控制。1)資源分配:依據推演需求合理分配計算資源、存儲資源等推演資源;2)流程控制:控制推演各階段流程以確保按既定規(guī)則進行;4)結果統(tǒng)計:收集推演結果并進行統(tǒng)計分析以為后續(xù)推演提供參考;5)日志記錄:記錄推演過程中的關鍵信息以便復盤和分析。5e)數據備份與恢復:定期備份業(yè)務數據以確保數據4.3應用層(客戶端)管理員及導演客戶端是提供給推演管理者使用的操作界面,允許管理者對推演過程進行監(jiān)控、控f)日志查看:查看包括態(tài)勢變化、參與者動作等的推演日志。觀摩客戶端是在兵棋推演過程中為觀摩者提供實時觀察推演過程并從不同b)態(tài)勢可視化:將態(tài)勢信息解析為3D模型和圖像并以可視化形式展示;f)進度條調整:允許觀摩者調整推演進度并定位推演交互客戶端是為推演人員提供的用于接收態(tài)勢信息、發(fā)送動作指令及b)動作指令發(fā)送:允許用戶通過鼠標點擊、鍵盤輸入等方式向兵棋推演房間模塊發(fā)送動作指4.3.4兵棋智能體框架(兵棋智能體客戶端)兵棋智能體客戶端是用于替換兵棋智能體決策模塊的兵棋智能體框架智能體代碼,實現智能體接入兵棋推演環(huán)境實施機機對抗推演、人推演,其框架代碼完成通信、流程控制以及異常處理,具體用于將兵棋推演房傳入兵棋智能體決策模塊,并將兵棋智能體決策模塊生成的動作集合發(fā)送至兵棋推a)接入推演房間:提供接入正確的推演房間功能,接收本方態(tài)勢信息,并執(zhí)行智能體模塊中的b)決策函數調用:在訓練過程中主進程調用智能體的決策函數,在網絡對抗中收到新態(tài)勢后調c)流程控制與異常處理:控制單場推演中智能體的執(zhí)行流程,集成異常處理機制,捕獲決策函d)動作集合生成與發(fā)送:生成動作集合并向推演房間發(fā)送,等待下一輪態(tài)勢信息,循環(huán)執(zhí)行直6e)集成與兼容性:通過定義標準接口使不同智能體無需修改即可接入平臺,實現異構智能體的f)生命周期管理:對智能體運行的生命周期進行管控,確保智能體在推演過程中的穩(wěn)定性和可g)通用智能體接口:支持通用智能體的接入協(xié)議(如RESTful、gRPC),提供態(tài)勢數據標準化轉換模塊(將兵棋結構化態(tài)勢轉換為通用智能體可理解的文本/多模態(tài)格式)。h)大模型接口適配:集成大模型交互適配層,支持大模型的異步決策調用(適應大模型推理延遲特性),提供自然語言指令到兵棋動作指令的解析引擎。i)多模型協(xié)同接口:支持多智能體(含通用智能體、大模型)的協(xié)同決策接入,提供決策結果復盤觀看客戶端是用于可視化回放復盤文件并可擴展推演數據b)態(tài)勢可視化模塊:將推演數據轉換為可視化態(tài)勢圖和3D模型;c)播放控制:提供包含暫停、播放拖動、時間跳轉和交互式查看界面數據等功能的用戶交互界決策總線由消息總線和數據總線組成,借助高效通信機制智能兵棋推演系統(tǒng)通過消息總線和數據總線作為連接異構對抗環(huán)境(仿真進程)與不同決策智能體(含AI和人)的通道,形成開放式系統(tǒng)整體架構。消息總線是智能兵棋推演系統(tǒng)中負責實時信息傳遞、分發(fā)與路由并確保對抗推演過程中系統(tǒng)信息1)消息傳遞:負責不同系統(tǒng)組件間的消息傳遞,支持多Agent系統(tǒng)中的數據交換,實現人2)消息分發(fā):按特定路由規(guī)則將消息分發(fā)至目標系統(tǒng)或組件;3)消息路由:確保消息按預定路徑到達目的地;4)擴展性:在多智能體和多仿真平臺環(huán)境下保障系統(tǒng)的靈活擴展與適應;5)支持動態(tài)消息格式適配:兼容JSON、ProtocolBuffers等數據格式,滿足大模型對高效6)新增批量消息處理機制:支持通用智能體批量態(tài)勢請求的并發(fā)處理。數據總線是智能兵棋推演系統(tǒng)中負責持久化數據傳輸、同步與共享并支1)連接對抗推演引擎:實現與對抗推演引擎的數據交互;2)支持多Agent系統(tǒng)中的數據交換:實現人/機智能體接入與協(xié)3)為AI訓練計算框架提供數據支持:確保AI模型獲取訓練和推理所需的數據;74)擴展持久化數據類型:支持存儲大模型訓練所需的歷史態(tài)勢序列、多模態(tài)復盤數據,提5)集成數據壓縮與分片傳輸:針對大模型輸入的大規(guī)模歷史數據,提供自動分片與壓縮功智能兵棋推演系統(tǒng)中的復盤數據,指特定推演實例執(zhí)行過程中a)初始態(tài)勢數據(戰(zhàn)場環(huán)境配置、參演實體部署、規(guī)則集及勝利條件設定);b)動態(tài)推演過程數據(各智能體及其他參演方的指令、系統(tǒng)裁決事件及結果、智能體與其他實體的狀態(tài)演化、環(huán)境變更、關鍵交互事件及其精確時間戳);c)必要的元數據(推演標識、智能體屬性信息、參與者信息、時間范圍、最終結果)。復盤數據存儲需以人類操作數據集與智能體數據為雙核心,采a)基礎靜態(tài)數據(含人類操作員初始配置、智能體初始屬性、初始態(tài)勢及元數據);b)動態(tài)過程數據流(人類操作指令序列、行為軌跡日志,智能體決策指令、狀態(tài)演化記錄,以及兩類主體交互事件與環(huán)境關聯(lián)數據)。智能兵棋推演系統(tǒng)的復盤數據回放功能,旨在基于存儲的人類一體化機制精確、可控地重現推演全過程,為多維度分析提供融合視角同的確定性狀態(tài)重建引擎:該引擎加載含人類與智能體初始狀態(tài)的初始態(tài)勢,嚴格按照原始輯,同步重放人類操作指令與智能體決策指令,聯(lián)動執(zhí)行兩類主體關聯(lián)的裁決回放需提供基礎控制(播放、暫停、變速、跳轉)與深度融合的高級分析能力。用戶授權驗證系列接口用于實現智能化環(huán)境平臺的單點登錄,應包含登錄口令獲取接口(含Web系統(tǒng)口令獲取接口、客戶端系統(tǒng)口令獲取接口)和登錄驗證接口。接口實例詳見《附錄A示例A.1用戶授權驗證接口示例》。數據回傳接口用于各訓練子系統(tǒng)將完成對抗后的對抗成績記錄(包括對抗雙方、對抗ID、對抗成績、對抗時間信息等)回傳給平臺,并將對應的復盤文件傳遞至平臺,該接口應包含對抗成績回傳和為了保證復盤文件傳輸和解析的建議,復盤文件大小應控制在一定大小(如≤100MB)。接口實例詳見《附錄A示例A.1.2數據回傳系列接口示例》。a)功能定義8兵棋訓練環(huán)境接口為智能體提供包含戰(zhàn)場空間拓撲、兵力部署、對抗類以實現對抗系統(tǒng)的推演裁決邏輯,且開發(fā) 方法接口實例詳見《附錄A示例A.2.1init方法》,《附錄A示例A.2.2setup方法》,《附錄A示例A.2.3step方法》,《附錄A示例A.2.4reset方法》,《附錄A示例A.2.5a)功能定義兵棋智能體接口用于將推演環(huán)境產生的對抗態(tài)勢以合適數據結構發(fā)送產生的對抗操作指令(或稱“動作”)在推演中做出響應。兵棋智能體接口遵循強化學習OODA環(huán)模型,要求通過定義'BaseAgent'作為所有AI智能體開發(fā)AI智能體時必須繼承'BaseAgent'基類且必須實現set參數(如陣營、想定ID),加載預訓練模型或規(guī)則庫;方法接口實例詳見《附錄A示例A.3.1setup方法》,《附錄A示例A.3.2step方法》,《附錄A示例A.3.3reset方法》,《附錄A示例A.3.4load_llm_model方法》,《附錄A示例A.3.5兵棋智能體開發(fā)SDK是基于5.3兵棋智能體接口為智能體(Agent)開發(fā)提供的工具集合,其將創(chuàng)建、測試和部署智能體的必要組件及接口封裝為程序d)多模態(tài)數據處理e)大模型微調f)智能體標準的接入結構9g)標準的開發(fā)文檔具體的兵棋智能體開發(fā)SDK結構示例參見《附錄A示例A.4兵棋智能體開發(fā)SDK示例》。算子和編成區(qū)在于提供一個集成化、直觀化的操作平臺,以實現兵棋推a)算子顯示:用于展示參與推演的各個棋子或單位,如士兵d)資源分配:為編隊分配資源,如態(tài)勢區(qū)在于提供一個直觀、實時反映戰(zhàn)場狀況的視覺界面,幫助推演者a)態(tài)勢展示:實時展示戰(zhàn)場上的所有棋子、單位及其g)2D和3D地形切換:支持2D和3D地形的一鍵切兵棋推演系統(tǒng)中推演界面的數據區(qū)是為了集中展示和管理推演過程中推演者能夠快速獲取、分析和利用這些數據,以支持推演方快速獲取、分析數a)信息集中展示:將推演相關的關鍵數據,如單位屬性、行動日志、得分統(tǒng)計(如奪控制點得分,剩余算子得分,戰(zhàn)斗得分,凈勝分以及總分)等,集中在一個區(qū)域展示;b)數據實時更新:隨著推演的進行,數據指令下達區(qū)在于提供一個用戶友好的界面,使得推演者能夠方便、高效地觀察已經下達的指令序列以及指令的執(zhí)行過程,確保推演的流程順暢,同時模擬真實戰(zhàn)場中的指揮與控制過程,該區(qū)域應包智能體本地高速訓練流程是將系統(tǒng)的兵棋智能體決策模塊和兵棋推演環(huán)境模塊采用單進程串行模式實現的無界面內存運行高速推演,該流程通過避免進程和網絡間通智能體本地高速訓練流程如圖2所示,其流程如下:步驟T1:是否加載大模型,如是則執(zhí)行步驟T2;否則執(zhí)行步驟T3;步驟T3:實例化推演環(huán)境和智能體,確定推演想定、局數等參數,依次實例化推演環(huán)境模塊及紅步驟T4:初始化推演環(huán)境生成初始態(tài)勢,執(zhí)行推演環(huán)境模塊初始化函數得到初始態(tài)勢,并執(zhí)行所步驟T5,推演方1智能體決策得到動作集合,執(zhí)行推演方1兵棋智能體決策模塊的單步決策函數,傳入態(tài)勢信息,得到推演方1動作集合;步驟T6:推演方2智能體決策得到動作集合,執(zhí)行推演方2兵棋智能體決策模塊的單步決策函數,傳入態(tài)勢信息,得到推演方2動作集合;步驟T7:推演方n智能體決策得到動作集合,順序執(zhí)行推演方n兵棋智能體決策模塊的單步決策步驟T8:推演環(huán)境單步推進生成新的態(tài)勢,執(zhí)行推演環(huán)境模塊的單步推進函數,傳入多方的動作步驟T9:推演是否結束判斷,判斷推演是否結束,若是,則結束對抗,執(zhí)行步驟T10,否則,返回步驟T5,循環(huán)執(zhí)行步驟T5~T8。步驟T10:推演環(huán)境保存復盤,執(zhí)行推演環(huán)境模塊的保存復盤函數,生成復盤文件;步驟T11:重置智能體和推演環(huán)境,執(zhí)行各智能體和推演環(huán)境模塊的重置函數完成環(huán)境重置。T/CICC…是步驟S5:收到態(tài)勢后執(zhí)行智能體單步決策,收到態(tài)勢信息后,執(zhí)行兵棋智能體決策模塊的單步決策函數,傳入當前態(tài)勢,得到動作集合;步驟S6:向推演房間發(fā)送動作集合,向兵棋推演房間模塊發(fā)送動作集合;步驟S7:推演是否結束,判斷推演是否結束,若是,則結束對抗,執(zhí)行步驟S8,否則,返回步驟S4,循環(huán)執(zhí)行步驟S4~S7;步驟S8:重置智能體,執(zhí)行兵棋智能體決策模塊的重置函數。是千圖3兵棋智能體網絡對抗過程b)請求參數(具體參數見表A.1);參數名時間戳*時間戳為當前時間戳,子系統(tǒng)請驗證時間戳為10分鐘以內的為合法口令。c)響應參數(具體參數見表A.2)參數名登錄口令的過期時間b)請求參數(具體參數見表A.3);表A.3客戶端系統(tǒng)口令獲取請求參數參數名時間戳*時間戳為當前時間戳,子系統(tǒng)請驗證時間戳為10分鐘以內的為合法口令。c)響應參數(具體參數見表A.4);表A.4客戶端系統(tǒng)口令獲取響應參數參數名登錄口令的過期時間用戶從頁面手工復制口令后開啟本地客戶端,在客戶端入口輸入從門戶網站拷貝的驗證口令進行登錄。a)通信協(xié)議:采用HTTP,HTTPS協(xié)議的POST方法進行數據傳輸;b)請求參數(具體參數見表A.5);表A.5登錄驗證接口-請求參數時間戳c)響應參數(具體參數見表A.6)。表A.6登錄驗證接口-響應參數消息b)請求參數(具體參數見表A.7);比賽識別碼比賽開始時間比賽結束時間c)響應消息格式(具體參數見表A.8)。表A.8對抗成績回傳接口-響應參數消息采用基類TrainEnv實現對抗系統(tǒng)的推演裁決邏輯,智能體是與TrainEnv互動,并產生結果。b)形式:TrainEnv::init(_->TrainEnv;d)輸出參數(具體參數見表A.9)。參數名環(huán)境實例A.2.2s方法b)形式:TrainEnv::setup(setup_info:Dict)->List[Dict];c)輸入參數(具體參數見表A.10)參數名setup_info['annual_version']:strind)輸出參數(具體參數見表A.11)。參數名返回參與對抗方的態(tài)勢隊列a)功能:正常推進推演,向環(huán)境輸入b)形式:TrainEnv::step(actions:List[Dict])->(List[Dict],Boolean);c)輸入參數(具體參數見表A.12);參數名d)輸出參數(具體參數見表A.13)。參數名返回參與對抗方的態(tài)勢隊列推演是否結束,True:推演結束;Fala)功能:重置環(huán)境,清空環(huán)境中的變量,釋放b)形式:TrainEnv::reset()->Boolean;d)輸出參數(具體參數見表A.14)。參數名a)功能:獲取包含文本描述、簡化態(tài)勢圖像等多模態(tài)數據,為大模型的訓練與推理提供適配的b)形式:TrainEnv::get_multimodal_situation()d)輸出參數(具體參數見表A.15)。參數名多模態(tài)數據multiModal_data包含文本描述、簡化態(tài)勢圖像等多模態(tài)數據。部署、關鍵行動狀態(tài)、環(huán)境要素等核心信息;空間拓撲、兵力分布等可視化信息;multiModal_data['timestamp']:string類型,態(tài)勢數據生成的時間戳;multiModal_data['situation_id]:string類型,當前態(tài)勢的唯一標識符,用于關聯(lián)歷史態(tài)勢數據。A.3兵棋智能體接口相關示例a)功能:初始化智能體參數(如陣營、想定ID),加載預訓練模型或規(guī)則庫;b)形式:BaseAgent::setup(setup_info:Dict)->None;c)輸入參數(具體參數見表A.16);表A.16兵棋智能體接口-setup函數輸入參數參數名此場對局相關的詳細信息setup_info:Dict類型,包含整個環(huán)境參數,包含以下信息:setup_info['scenario']:int類型,為環(huán)境的想定id;setup_info['seat']:int類型,表示本場對局的席位數;setup_info['faction']:int類型,表示陣營id,0為紅,1為藍;setup_info['role']:int類型,表示角色,可根據對抗級別進行設定。d)輸出參數:無。A.3.2step方法a)功能:接收環(huán)境態(tài)勢,返回動作指令隊列;b)形式:BaseAgent::step(observation:Dict)->List[Dict];c)輸入參數(具體參數見表A.17);表A.17兵棋智能體接口-step函數輸入參數參數名態(tài)勢信息d)輸出參數(具體參數見表A.18)。參數名動作指令隊列(如機動路徑、打擊動作等)b)形式:BaseAgent::reset()->Booled)輸出參數(具體參數見表A.19)。參數名A.3.4load_llm_model方法a)功能:加載大模型,配置大模型模參數(如推理精度、最大上下文長度);b)形式:BaseAgent::load_llm_model(model_path:str,config:Dict)->Boc)輸入參數(具體參數見表A.20);參數名config['device']:string類型,運行設備(如"cpu"、"cuda");config['batch_size']:setup_info['seat']:int類型,批量推理大小。d)輸出參數(具體參數見表A.21)。參數名是否成功加載大模型A.3.5parse_natural_language_command方法a)功能:將大模型輸出的自然語言決策指令解析為兵棋系統(tǒng)可執(zhí)行的結構化動作指令,實現自b)形式:BaseAgent::parse_natural_language_command(command:str)->List[c)輸入參數(具體參數見表A.22);參數名自然語言決策字符串d)輸出參數(具體參數見表A.23)。表A.23兵棋智能體接口-parse_natural_language_command函數輸出參數參數名ActionList:List[Di

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論