CN120086266B 基于行業(yè)大模型的智能數(shù)據(jù)分析方法及系統(tǒng) (國投智能(南京)信息科技有限公司)_第1頁
CN120086266B 基于行業(yè)大模型的智能數(shù)據(jù)分析方法及系統(tǒng) (國投智能(南京)信息科技有限公司)_第2頁
CN120086266B 基于行業(yè)大模型的智能數(shù)據(jù)分析方法及系統(tǒng) (國投智能(南京)信息科技有限公司)_第3頁
CN120086266B 基于行業(yè)大模型的智能數(shù)據(jù)分析方法及系統(tǒng) (國投智能(南京)信息科技有限公司)_第4頁
CN120086266B 基于行業(yè)大模型的智能數(shù)據(jù)分析方法及系統(tǒng) (國投智能(南京)信息科技有限公司)_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利(10)授權(quán)公告號CN120086266B(65)同一申請的已公布的文獻(xiàn)號(73)專利權(quán)人國投智能(南京)信息科技有限公司(74)專利代理機(jī)構(gòu)南京佰騰智信知識產(chǎn)權(quán)代理GO6F16/248(2019.01)(56)對比文件統(tǒng)本發(fā)明公開了基于行業(yè)大模型的智能數(shù)據(jù)采集業(yè)務(wù)事件數(shù)據(jù),根據(jù)數(shù)據(jù)類型進(jìn)行特征向量提取,并采用自注意力機(jī)制計算縮放點積注意力得分矩陣,進(jìn)行加權(quán)輸出多模態(tài)融合向量,構(gòu)建行業(yè)知識數(shù)據(jù)庫確定嵌入向量;計算相關(guān)度值篩選多模態(tài)融合向量與知識片段的組合,組成門控輸入向量進(jìn)行融合向量計算。本發(fā)明所述方法通過多模態(tài)特征融合與知識片段檢索方案,可以實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)、文本信息與圖像等異質(zhì)信息的統(tǒng)一表達(dá)和相關(guān)性挖掘,通過自注意力機(jī)制,模型能夠根據(jù)業(yè)務(wù)場景自適應(yīng)調(diào)整各模態(tài)特征的關(guān)采集業(yè)務(wù)事件數(shù)據(jù),根據(jù)數(shù)據(jù)類型進(jìn)行特征向量提取,并采用自注意力機(jī)制計算縮放點積注意力得分矩陣,進(jìn)行加權(quán)輸出多模態(tài)融合向量,構(gòu)建行業(yè)知識數(shù)據(jù)庫確定嵌入向量計算相關(guān)度值篩選多模態(tài)融合向量與知識片段的組合,組成門控輸入向量進(jìn)行融合向量計算,并計算知識片段與融合向量的關(guān)系強(qiáng)度值,獲得完整業(yè)務(wù)流程的增強(qiáng)融合向量序列確定業(yè)務(wù)事件所屬的類別標(biāo)簽生成事件有向圖,提取類別異常狀態(tài)特征集合,整理模板路徑和實際業(yè)務(wù)的歸因路徑,使用LCS算法確定路徑重合長度,并篩選高度相似對齊的歸因路徑根據(jù)異常狀態(tài)特征生成歸因路徑與模板的直接索引表,統(tǒng)計周期未能對齊的歸因路徑計算對齊偏差率,生成異常歸因路徑列表2采集業(yè)務(wù)事件數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)以及圖形數(shù)據(jù),根據(jù)數(shù)據(jù)類型進(jìn)行特征向量提取,并采用自注意力機(jī)制計算縮放點積注意力得分矩陣,進(jìn)行加權(quán)輸出多模態(tài)融合向量,構(gòu)建行業(yè)知識數(shù)據(jù)庫確定嵌入向量;計算相關(guān)度值篩選多模態(tài)融合向量與知識片段的組合,組成門控輸入向量進(jìn)行融合向量計算,并計算知識片段與融合向量的關(guān)系強(qiáng)度值,獲得完整業(yè)務(wù)流程的增強(qiáng)融合向量序確定業(yè)務(wù)事件所屬的類別標(biāo)簽生成事件有向圖,提取類別異常狀態(tài)特征集合,整理模板路徑和實際業(yè)務(wù)的歸因路徑,使用LCS算法確定路徑重合長度,并篩選高度相似對齊的歸根據(jù)異常狀態(tài)特征生成歸因路徑與模板的直接索引表,統(tǒng)計周期未能對齊的歸因路徑計算對齊偏差率,生成異常歸因路徑列表。2.如權(quán)利要求1所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法,其特征在于:所述根據(jù)數(shù)據(jù)類型進(jìn)行特征向量提取,構(gòu)建行業(yè)知識數(shù)據(jù)庫確定嵌入向量,包括,采集業(yè)務(wù)事件數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)以及圖形數(shù)據(jù),對采集數(shù)據(jù)進(jìn)行預(yù)處理,對處理后的結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)以及圖形數(shù)據(jù)分別進(jìn)行數(shù)據(jù)降維;其中對結(jié)構(gòu)化數(shù)據(jù)采用多層感知器MLP,通過ReLU非線性激活函數(shù)進(jìn)行特征向量提取,對文本數(shù)據(jù)使用預(yù)訓(xùn)練的BERT模型進(jìn)行編碼,并選取輸出文本特征向量,對圖形數(shù)據(jù)利用預(yù)訓(xùn)練ResNet50模型提取特征,取其全局平均池化層的輸出得到圖像特征向量;對三個采集數(shù)據(jù)的特征向量采用線性變化進(jìn)行標(biāo)準(zhǔn)化處理,堆疊構(gòu)成模態(tài)特征矩陣,采用自注意力機(jī)制計算Query、Key、Value,并計算縮放點積注意力得分矩陣,應(yīng)用softmax歸一化,得到注意力矩陣并對Value進(jìn)行隨后采用平均池化,將三個模態(tài)的信息融合為單一向量,輸出多模態(tài)融合向量并根據(jù)行業(yè)業(yè)務(wù)流程進(jìn)行序列化,組成融合多模態(tài)向量序列;基于企業(yè)規(guī)程和專家文檔構(gòu)建行業(yè)知識數(shù)據(jù)庫,對知識庫中每條知識片段統(tǒng)一使用文本編碼器Enc進(jìn)行嵌入得到對應(yīng)的嵌入向量,整個知識庫對應(yīng)一組嵌入矩陣;針對業(yè)務(wù)事件的多模態(tài)融合向量,在知識庫嵌入矩陣E中檢索其最相關(guān)的K條知識片段組成知識向量集,采用余弦相似度計算相關(guān)度值篩選K組多模態(tài)融合向量與知識片段的組合。3.如權(quán)利要求2所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法,其特征在于:所述計算相關(guān)度值篩選多模態(tài)融合向量與知識片段的組合,組成門控輸入向量進(jìn)行融合向量計算,獲得完整業(yè)務(wù)流程的增強(qiáng)融合向量序列,包括,根據(jù)多模態(tài)融合向量與知識片段的組合進(jìn)行拼接作為門控輸入向量,基于前饋全連接神經(jīng)網(wǎng)絡(luò)構(gòu)建知識門控融合模型,對門控輸入向量單層神經(jīng)網(wǎng)絡(luò)獲得門控因子;選擇交叉熵?fù)p失函數(shù)計算門控因子與訓(xùn)練集實際標(biāo)簽的差異,使用Adam優(yōu)化器進(jìn)行梯度下降優(yōu)化,更新參數(shù)包括權(quán)重和偏置項,在連續(xù)迭代過程中計算的損失差異不再明顯下降則停止迭代;用門控因子權(quán)衡兩個來源信息進(jìn)行融合向量計算,同時針對每個知識片段利用點積形式獲得與初始融合向量的關(guān)系強(qiáng)度值,并進(jìn)行Softmax處理得到歸一化權(quán)重,用所有K個候3選增強(qiáng)向量和對應(yīng)的歸一化權(quán)重確定最終增強(qiáng)融合向量;對業(yè)務(wù)流程中的每個事件t均重復(fù)上述操作,最終獲得完整業(yè)務(wù)流程的增強(qiáng)融合向量序列。4.如權(quán)利要求3所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法,其特征在于:所述確定業(yè)務(wù)事件所屬的類別標(biāo)簽生成事件有向圖,提取類別異常狀態(tài)特征集合,使用LCS算法確定路根據(jù)增強(qiáng)融合向量序列的不同事件確定事件的時間點,并確定業(yè)務(wù)事件所屬的類別標(biāo)簽以及事件現(xiàn)場元數(shù)據(jù),構(gòu)建成時間節(jié)點,并確定所有業(yè)務(wù)事件的節(jié)點集合;根據(jù)工藝標(biāo)準(zhǔn)表明確獲得行業(yè)業(yè)務(wù)流程主線,根據(jù)業(yè)務(wù)流程中事件i直接流向事件j的標(biāo)準(zhǔn)流轉(zhuǎn)關(guān)系進(jìn)行有向邊構(gòu)建,對于每個相鄰業(yè)務(wù)事件依據(jù)真實業(yè)務(wù)發(fā)生順序以及理論規(guī)定的節(jié)點間銜接順序,分別生成候選有向邊集,將標(biāo)準(zhǔn)流程產(chǎn)生的邊和實際業(yè)務(wù)流程采集的邊合并起來生成事件有向圖;根據(jù)行業(yè)知識庫給出的細(xì)致領(lǐng)域標(biāo)簽,遍歷全部事件節(jié)點,將具有相同領(lǐng)域標(biāo)簽且在有向圖中連通的節(jié)點,確定為業(yè)務(wù)子流程,并將所有業(yè)務(wù)子流程構(gòu)建子流程集合;對于子流程內(nèi)每條有向邊提取類別異常狀態(tài)特征集合,包括時序特征、狀態(tài)跳變度量、突變幅度、工藝流程標(biāo)準(zhǔn)違規(guī)標(biāo)簽、實時監(jiān)控報警標(biāo)志,對每條有向邊的每項異常狀態(tài)特征進(jìn)行統(tǒng)計并進(jìn)行歸一化求和,作為每條有向邊的歸因性分值,并統(tǒng)計每個子流程的總歸因性分值;基于經(jīng)驗法設(shè)置的得分閾值,并將高于得分閾值得分的子流程作為主要歸因路徑,基于行業(yè)知識數(shù)據(jù)庫,收集并整理企業(yè)歷年的歸檔路徑作為模板路徑,同步采集歸因路徑中節(jié)點步驟邊的異常狀態(tài)特征,生成標(biāo)準(zhǔn)路徑模板庫;對實際業(yè)務(wù)中獲得的每一條歸因路徑和行業(yè)知識數(shù)據(jù)庫中每一條模板路徑,將節(jié)點順序與每條有向邊的異常狀態(tài)特征,編碼為一組有序特征序列向量,分別為歸因路徑的結(jié)構(gòu)化特征序列和專家知識模板路徑的結(jié)構(gòu)化特征序列;對每一條待歸因路徑,遍歷模板庫,逐一對比特征序列,采用最長公共子序列LCS算法,根據(jù)歸因路徑P的前i步和模板路徑T的前j步之間的最長公共子序列的長度,作為二維數(shù)組若歸因路徑第i步和模板路徑第j步的所有字段完全一致,則確定一致重合長度,否則,選擇排除歸因路徑和模板路徑不匹配的節(jié)點邊,并選擇最大重合長度;根據(jù)確定的LCS重合長度與路徑的總長度的比值作為結(jié)構(gòu)相似度分?jǐn)?shù);基于歷史數(shù)據(jù)的均值與標(biāo)準(zhǔn)差的和作為結(jié)構(gòu)相似度閾值,若結(jié)構(gòu)相似度分?jǐn)?shù)大于等于結(jié)構(gòu)相似度閾值,則判斷歸因路徑與模板路徑高度相似對齊。5.如權(quán)利要求4所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法,其特征在于:所述根據(jù)異常狀態(tài)特征生成歸因路徑與模板的直接索引表,包括,對篩選的高度相似對齊歸因路徑,將歸因路徑的異常狀態(tài)特征與模板路徑的異常狀態(tài)特征項進(jìn)行映射并以結(jié)構(gòu)化格式存儲,形成歸因路徑和模板路徑的直接索引表。6.如權(quán)利要求5所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法,其特征在于:所述統(tǒng)計周期未能對齊的歸因路徑計算對齊偏差率,生成異常歸因路徑列表,包括,統(tǒng)計周期內(nèi)歸因路徑中未能與任何模板路徑對齊的歸因路徑數(shù)量,以及本周期歸因路4徑總數(shù),計算當(dāng)前周期的對齊偏差率,若偏差率高于偏差閾值,輸出異常歸因路徑列表,形成反饋報告。7.如權(quán)利要求6所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法,其特征在于:所述采集業(yè)務(wù)事件數(shù)據(jù),包括,根據(jù)行業(yè)業(yè)務(wù)流程進(jìn)行業(yè)務(wù)事件的數(shù)據(jù)采集,其中結(jié)構(gòu)化數(shù)據(jù)包括生產(chǎn)傳感器、設(shè)備日志以及業(yè)務(wù)系統(tǒng)數(shù)據(jù),文本數(shù)據(jù)包括工作記錄、故障報告以及原始文本數(shù)據(jù),圖形數(shù)據(jù)包括現(xiàn)場設(shè)備監(jiān)控、產(chǎn)品圖像數(shù)據(jù)。8.基于行業(yè)大模型的智能數(shù)據(jù)分析方法的系統(tǒng),基于權(quán)利要求1~7任一所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法,其特征在于:包括,多源數(shù)據(jù)采集模塊,采集業(yè)務(wù)事件數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)以及圖形數(shù)據(jù);多模態(tài)融合模塊,對采集數(shù)據(jù)進(jìn)行特征提取,輸出單一多模態(tài)融合向量;嵌入管理模塊,以統(tǒng)一文本編碼器方法,將專家文檔和歷史知識片段轉(zhuǎn)化為向量化嵌入庫;門控賦權(quán)模塊,根據(jù)門控輸入獲得動態(tài)門控因子,實現(xiàn)融合向量與知識嵌入間的自適應(yīng)加權(quán)融合,針對全流程事件輸出增強(qiáng)融合向量序列;異常特征編碼模塊,生成事件節(jié)點集合與有向邊,形成復(fù)合事件有向圖;模板匹配模塊,遍歷整理的歸因路徑與模板路徑,對路徑序列實行LCS算法計算結(jié)構(gòu)重合長度,篩選高度相似對齊的關(guān)鍵歸因路徑;偏差反饋模塊,建立可溯源的直接索引表,輸出異常歸因路徑列表和報告。9.一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,其特征在于:所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)權(quán)利要求1~7任一所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法的步驟。10.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于:所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1~7任一所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法的步5基于行業(yè)大模型的智能數(shù)據(jù)分析方法及系統(tǒng)技術(shù)領(lǐng)域[0001]本發(fā)明涉及數(shù)據(jù)分析技術(shù)領(lǐng)域,特別是基于行業(yè)大模型的智能數(shù)據(jù)分析方法及系統(tǒng)。背景技術(shù)[0002]隨著信息化基礎(chǔ)設(shè)施的持續(xù)完善和企業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程的深入,行業(yè)各領(lǐng)域積累了大量結(jié)構(gòu)化、非結(jié)構(gòu)化和多模態(tài)的業(yè)務(wù)數(shù)據(jù),涵蓋了生產(chǎn)傳感器信號、設(shè)備運行日志、業(yè)務(wù)操作數(shù)據(jù)、工藝文本記錄、監(jiān)控影像等多種類型,隨著人工智能技術(shù)特別是深度學(xué)習(xí)模型、自然語言處理算法和計算機(jī)視覺工具逐步被引入工業(yè)數(shù)據(jù)分析場景,提升了對復(fù)雜業(yè)務(wù)數(shù)據(jù)的處理能力;[0003]但現(xiàn)有方法仍以單一數(shù)據(jù)模態(tài)處理或弱關(guān)聯(lián)分析為主,尚未實現(xiàn)針對多模態(tài)信息的深度融合,行業(yè)知識庫的建設(shè)和應(yīng)用亦多停留于靜態(tài)文檔化或有限案例推理水平,缺乏與實時業(yè)務(wù)數(shù)據(jù)相結(jié)合的動態(tài)知識挖掘與智能歸因支撐,面對結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)多源共存的現(xiàn)實,傳統(tǒng)技術(shù)在特征抽取、表示和融合層面缺乏統(tǒng)一且高效的處理框架;采用簡單拼接、靜態(tài)權(quán)重加權(quán)等手段難以挖掘各模態(tài)之間的隱含關(guān)聯(lián)和上下文依賴,導(dǎo)致分析結(jié)果準(zhǔn)確性與可解釋性偏弱,其次,關(guān)于行業(yè)知識的利用,相關(guān)技術(shù)大多僅支持基于關(guān)鍵詞或淺層語義的檢索,無法根據(jù)多模態(tài)業(yè)務(wù)事件的實際組合動態(tài)、準(zhǔn)確地檢索最貼切的專家知識片段,此外,歸因分析方法多采用模板匹配或淺層序列比較,既不能客觀度量各事件與標(biāo)準(zhǔn)流程的相似度,也難以適配快速變化的業(yè)務(wù)場景。發(fā)明內(nèi)容[0005]因此,本發(fā)明提供了基于行業(yè)大模型的智能數(shù)據(jù)分析方法解決面對結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)多源共存的現(xiàn)實,傳統(tǒng)技術(shù)在特征抽取、表示和融合層面缺乏統(tǒng)一且高效的處理框架;采用簡單拼接、靜態(tài)權(quán)重加權(quán)等手段難以挖掘各模態(tài)之間的隱含關(guān)聯(lián)和上下文依賴,導(dǎo)致分析結(jié)果準(zhǔn)確性與可解釋性偏弱,其次,關(guān)于行業(yè)知識的利用,相關(guān)技術(shù)大多僅支持基于關(guān)鍵詞或淺層語義的檢索,無法根據(jù)多模態(tài)業(yè)務(wù)事件的實際組合動態(tài)、準(zhǔn)確地檢索最貼切的專家知識片段,此外,歸因分析方法多采用模板匹配或淺層序列比較,既不能客觀度量各事件與標(biāo)準(zhǔn)流程的相似度,也難以適配快速變化的業(yè)務(wù)場景的問題。[0008]采集業(yè)務(wù)事件數(shù)據(jù),根據(jù)數(shù)據(jù)類型進(jìn)行特征向量提取,并采用自注意力機(jī)制計算縮放點積注意力得分矩陣,進(jìn)行加權(quán)輸出多模態(tài)融合向量,構(gòu)建行業(yè)知識數(shù)據(jù)庫確定嵌入[0009]計算相關(guān)度值篩選多模態(tài)融合向量與知識片段的組合,組成門控輸入向量進(jìn)行融合向量計算,并計算知識片段與融合向量的關(guān)系強(qiáng)度值,獲得完整業(yè)務(wù)流程的增強(qiáng)融合向6量序列;[0010]確定業(yè)務(wù)事件所屬的類別標(biāo)簽生成事件有向圖,提取類別異常狀態(tài)特征集合,整理模板路徑和實際業(yè)務(wù)的歸因路徑,使用LCS算法確定路徑重合長度,并篩選高度相似對齊的歸因路徑;[0011]根據(jù)異常狀態(tài)特征生成歸因路徑與模板的直接索引表,統(tǒng)計周期未能對齊的歸因路徑計算對齊偏差率,生成異常歸因路徑列表。[0012]作為本發(fā)明所述基于行業(yè)大模型的智能數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述根據(jù)數(shù)據(jù)類型進(jìn)行特征向量提取,構(gòu)建行業(yè)知識數(shù)據(jù)庫確定嵌入向量,包括,[0013]采集業(yè)務(wù)事件數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)以及圖形數(shù)據(jù),對采集數(shù)據(jù)進(jìn)行預(yù)處理,對處理后的結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)以及圖形數(shù)據(jù)分別進(jìn)行數(shù)據(jù)降維;[0014]其中對結(jié)構(gòu)化數(shù)據(jù)采用多層感知器MLP,通過ReLU非線性激活函數(shù)進(jìn)行特征向量提取,對文本數(shù)據(jù)使用預(yù)訓(xùn)練的BERT模型進(jìn)行編碼,并選取輸出文本特征向量利用預(yù)訓(xùn)練ResNet50模型提取特征,取其全局平均池化層的輸出得到圖像特征向量;[0015]對三個采集數(shù)據(jù)的特征向量采用線性變化進(jìn)行標(biāo)準(zhǔn)化處理,堆疊構(gòu)成模態(tài)特征矩陣,采用自注意力機(jī)制計算Query、Key、Value,并計算縮放點積注意力得分矩陣,應(yīng)用softmax歸一化,得到注意力矩陣并對Value進(jìn)行加權(quán);[0016]隨后采用平均池化,將三個模態(tài)的信息融合為單一向量,輸出多模態(tài)融合向量并根據(jù)行業(yè)業(yè)務(wù)流程進(jìn)行序列化,組成融合多模態(tài)向量序列;[0017]基于企業(yè)規(guī)程和專家文檔構(gòu)建行業(yè)知識數(shù)據(jù)庫,對知識庫中每條知識片段統(tǒng)一使用文本編碼器Enc進(jìn)行嵌入得到對應(yīng)的嵌入向量,整個知識庫對應(yīng)一組嵌入矩陣;[0018]針對業(yè)務(wù)事件的多模態(tài)融合向量,在知識庫嵌入矩陣E中檢索其最相關(guān)的K條知識片段組成知識向量集,采用余弦相似度計算相關(guān)度值篩選K組多模態(tài)融合向量與知識片段的組合。[0019]作為本發(fā)明所述基于行業(yè)大模型的智能數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述計算相關(guān)度值篩選多模態(tài)融合向量與知識片段的組合,組成門控輸入向量進(jìn)行融合向量[0020]根據(jù)多模態(tài)融合向量與知識片段的組合進(jìn)行拼接作為門控輸入向量,基于前饋全連接神經(jīng)網(wǎng)絡(luò)構(gòu)建知識門控融合模型,對門控輸入向量單層神經(jīng)網(wǎng)絡(luò)獲得門控因子;[0021]選擇交叉熵?fù)p失函數(shù)計算門控因子與訓(xùn)練集實際標(biāo)簽的差異,使用Adam優(yōu)化器進(jìn)行梯度下降優(yōu)化,更新參數(shù)包括權(quán)重和偏置項,在連續(xù)迭代過程中計算的損失差異不再明顯下降則停止迭代;[0022]用門控因子權(quán)衡兩個來源信息進(jìn)行融合向量計算,同時針對每個知識片段利用點積形式獲得與初始融合向量的關(guān)系強(qiáng)度值,并進(jìn)行Softmax處理得到歸一化權(quán)重,用所有K個候選增強(qiáng)向量和對應(yīng)的歸一化權(quán)重確定最終增強(qiáng)融合向量;[0023]對業(yè)務(wù)流程中的每個事件t均重復(fù)上述操作,最終獲得完整業(yè)務(wù)流程的增強(qiáng)融合向量序列。[0024]作為本發(fā)明所述基于行業(yè)大模型的智能數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述確定業(yè)務(wù)事件所屬的類別標(biāo)簽生成事件有向圖,提取類別異常狀態(tài)特征集合,使用LCS算法確定路徑重合長度,并篩選高度相似對齊的歸因路徑,包括,7[0025]根據(jù)增強(qiáng)融合向量序列的不同事件確定事件的時間點,并確定業(yè)務(wù)事件所屬的類別標(biāo)簽以及事件現(xiàn)場元數(shù)據(jù),構(gòu)建成時間節(jié)點,并確定所有業(yè)務(wù)事件的節(jié)點集合;[0026]根據(jù)工藝標(biāo)準(zhǔn)表明確獲得行業(yè)業(yè)務(wù)流程主線,根據(jù)業(yè)務(wù)流程中事件i直接流向事件j的標(biāo)準(zhǔn)流轉(zhuǎn)關(guān)系進(jìn)行有向邊構(gòu)建,對于每個相鄰業(yè)務(wù)事件依據(jù)真實業(yè)務(wù)發(fā)生順序以及理論規(guī)定的節(jié)點間銜接順序,分別生成候選有向邊集,將標(biāo)準(zhǔn)流程產(chǎn)生的邊和實際業(yè)務(wù)流程采集的邊合并起來生成事件有向圖;[0027]根據(jù)行業(yè)知識庫給出的細(xì)致領(lǐng)域標(biāo)簽,遍歷全部事件節(jié)點,將具有相同領(lǐng)域標(biāo)簽且在有向圖中連通的節(jié)點,確定為業(yè)務(wù)子流程,并將所有業(yè)務(wù)子流程構(gòu)建子流程集合;[0028]對于子流程內(nèi)每條有向邊提取類別異常狀態(tài)特征集合,包括時序特征、狀態(tài)跳變度量、突變幅度、工藝流程標(biāo)準(zhǔn)違規(guī)標(biāo)簽、實時監(jiān)控報警標(biāo)志,對每條有向邊的每項異常狀態(tài)特征進(jìn)行統(tǒng)計并進(jìn)行歸一化求和,作為每條有向邊的歸因性分值,并統(tǒng)計每個子流程的總歸因性分值;[0029]基于經(jīng)驗法設(shè)置的得分閾值,并將高于得分閾值得分的子流程作為主要歸因路徑,基于行業(yè)知識數(shù)據(jù)庫,收集并整理企業(yè)歷年的歸檔路徑作為模板路徑,同步采集歸因路徑中節(jié)點步驟邊的異常狀態(tài)特征,生成標(biāo)準(zhǔn)路徑模板庫;[0030]對實際業(yè)務(wù)中獲得的每一條歸因路徑和行業(yè)知識數(shù)據(jù)庫中每一條模板路徑,將節(jié)點順序與每條有向邊的異常狀態(tài)特征,編碼為一組有序特征序列向量,分別為歸因路徑的結(jié)構(gòu)化特征序列和專家知識模板路徑的結(jié)構(gòu)化特征序列;[0031]對每一條待歸因路徑,遍歷模板庫,逐一對比特征序列,采用最長公共子序列LCS算法,根據(jù)歸因路徑P的前i步和模板路徑T的前j步之間的最長公共子序列的長度,作為二維數(shù)組L;[0032]若歸因路徑第i步和模板路徑第j步的所有字段完全一致,則確定一致重合長度,否則,選擇排除歸因路徑和模板路徑不匹配的節(jié)點邊,并選擇最大重合長度;[0033]根據(jù)確定的LCS重合長度與路徑的總長度的比值作為結(jié)構(gòu)相似度分?jǐn)?shù);[0034]基于歷史數(shù)據(jù)的均值與標(biāo)準(zhǔn)差的和作為結(jié)構(gòu)相似度閾值,若結(jié)構(gòu)相似度分?jǐn)?shù)大于等于結(jié)構(gòu)相似度閾值,則判斷歸因路徑與模板路徑高度相似對齊。[0035]作為本發(fā)明所述基于行業(yè)大模型的智能數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述根據(jù)異常狀態(tài)特征生成歸因路徑與模板的直接索引表,包括,[0036]對篩選的高度相似對齊歸因路徑,將歸因路徑的異常狀態(tài)特征與模板路徑的異常狀態(tài)特征項進(jìn)行映射并以結(jié)構(gòu)化格式存儲,形成歸因路徑和模板路徑的直接索引表。[0037]作為本發(fā)明所述基于行業(yè)大模型的智能數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所述統(tǒng)計周期未能對齊的歸因路徑計算對齊偏差率,生成異常歸因路徑列表,包括,[0038]統(tǒng)計周期內(nèi)歸因路徑中未能與任何模板路徑對齊的歸因路徑數(shù)量,以及本周期歸因路徑總數(shù),計算當(dāng)前周期的對齊偏差率,若偏差率高于偏差閾值,輸出異常歸因路徑列[0039]作為本發(fā)明所述基于行業(yè)大模型的智能數(shù)據(jù)分析方法的一種優(yōu)選方案,其中:所[0040]根據(jù)行業(yè)業(yè)務(wù)流程進(jìn)行業(yè)務(wù)事件的數(shù)據(jù)采集,其中結(jié)構(gòu)化數(shù)據(jù)包括生產(chǎn)傳感器、設(shè)備日志以及業(yè)務(wù)系統(tǒng)數(shù)據(jù),文本數(shù)據(jù)包括工作記錄、故障報告以及原始文本數(shù)據(jù),圖形數(shù)8據(jù)包括現(xiàn)場設(shè)備監(jiān)控、產(chǎn)品圖像數(shù)據(jù)。[0041]第二方面,本發(fā)明提供了基于行業(yè)大模型的智能[0043]多模態(tài)融合模塊,對采集數(shù)據(jù)[0044]嵌入管理模塊,以統(tǒng)一文本編碼器方法,將專家文檔和歷史知識片段轉(zhuǎn)化為向量化嵌入庫;[0045]門控賦權(quán)模塊,根據(jù)門控輸入獲得動態(tài)門控因子,實現(xiàn)融合向量與知識嵌入間的自適應(yīng)加權(quán)融合,針對全流程事件輸出增強(qiáng)融合向量序列;[0046]異常特征編碼模塊,生成事件節(jié)點集合與有向邊,形成復(fù)合事件有向圖;[0047]模板匹配模塊,遍歷整理的歸因路徑與模板路徑,對路徑序列實行LCS算法計算結(jié)構(gòu)重合長度,篩選高度相似對齊的關(guān)鍵歸因路徑;[0048]偏差反饋模塊,建立可溯源的直接索引表,輸[0049]第三方面,本發(fā)明提供了一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,其中:所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如本發(fā)明第一方面所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法的任一步驟。[0050]第四方面,本發(fā)明提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其中:所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如本發(fā)明第一方面所述的基于行業(yè)大模型的智能數(shù)據(jù)分析方法的任一步驟。[0051]本發(fā)明有益效果為:通過多模態(tài)特征融合與知識片段檢索方案,可以實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)、文本信息與圖像等異質(zhì)信息的統(tǒng)一表達(dá)和相關(guān)性挖掘,通過自注意力機(jī)制,模型能夠根據(jù)業(yè)務(wù)場景自適應(yīng)調(diào)整各模態(tài)特征的關(guān)注度,實現(xiàn)信息互補(bǔ),自動突出與當(dāng)前任務(wù)最相關(guān)的多模態(tài)維度,通過余弦相似度篩選,讓每個業(yè)務(wù)事件融合向量自動關(guān)聯(lián)到歷史積累下來的最相似且最具參考價值的知識片段,門控因子的引入使模型能動態(tài)根據(jù)當(dāng)前業(yè)務(wù)事件與檢索到的知識片段的匹配情況調(diào)整融合策略,從而按需放大或抑制知識輸入,通過重合序列長度與總長度比值得到的結(jié)構(gòu)相似度分?jǐn)?shù),為歸因路徑與模板路徑的動態(tài)對齊提供了客觀、量化的標(biāo)準(zhǔn),并抑制了表層噪聲或局部波動造成的偽匹配。附圖說明[0052]為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其它的[0053]圖1為實施例1中基于行業(yè)大模型的智能數(shù)據(jù)分析方法的流程示意圖。[0054]圖2為實施例1中基于行業(yè)大模型的智能數(shù)據(jù)分析系統(tǒng)的結(jié)構(gòu)示意圖。具體實施方式[0055]為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合說明書附圖對本發(fā)明的具體實施方式做詳細(xì)的說明。[0056]在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明,但是本發(fā)明還可以9采用其他不同于在此描述的其它方式來實施,本領(lǐng)域技術(shù)人員可以在不違背本發(fā)明內(nèi)涵的情況下做類似推廣,因此本發(fā)明不受下面公開的具體實施例的限制。式中的特定特征、結(jié)構(gòu)或特性。在本說明書中不同地方出現(xiàn)的“在一個實施例中”并非均指同一個實施例,也不是單獨的或選擇性的與其他實施例互相排斥的實施例。[0058]實施例1,參照圖1到圖2,為本發(fā)明第一個實施例,該實施例提供了基于行業(yè)大模型的智能數(shù)據(jù)分析方法,包括以下步驟:[0059]S1,采集業(yè)務(wù)事件數(shù)據(jù),根據(jù)數(shù)據(jù)類型進(jìn)行特征向量提取,并采用自注意力機(jī)制計算縮放點積注意力得分矩陣,進(jìn)行加權(quán)輸出多模態(tài)融合向量,構(gòu)建行業(yè)知識數(shù)據(jù)庫確定嵌入向量;[0061]根據(jù)行業(yè)業(yè)務(wù)流程進(jìn)行業(yè)務(wù)事件的數(shù)據(jù)采集,采集業(yè)務(wù)事件數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)以及圖形數(shù)據(jù),其中結(jié)構(gòu)化數(shù)據(jù)包括生產(chǎn)傳感器、設(shè)備日志以及業(yè)務(wù)系統(tǒng)數(shù)據(jù),文本數(shù)據(jù)包括工作記錄、故障報告以及原始文本數(shù)據(jù),圖形數(shù)據(jù)包括現(xiàn)場設(shè)備監(jiān)控、產(chǎn)品圖像數(shù)據(jù)。[0062]通過對結(jié)構(gòu)化數(shù)據(jù)的采集,使生產(chǎn)傳感器、設(shè)備日志和業(yè)務(wù)系統(tǒng)數(shù)據(jù)得以全面還原生產(chǎn)運行狀態(tài)及各環(huán)節(jié)動態(tài),便于后續(xù)細(xì)粒度過程分析、異常定位與性能追蹤,文本數(shù)據(jù)的采集,則為對業(yè)務(wù)現(xiàn)場的主觀描述、問題報告和事件細(xì)節(jié)提供了豐富語義支撐,有助于還原現(xiàn)場操作、故障發(fā)生與處理經(jīng)過,增強(qiáng)自動分析與自然語言解析能力,為知識抽取與根因推理提供了扎實基礎(chǔ)。圖形數(shù)據(jù)的采集,使得現(xiàn)場設(shè)備運行、產(chǎn)品狀態(tài)和視覺異常能直觀反映在數(shù)據(jù)流程中,為自動視覺檢測、異常預(yù)警和流程監(jiān)督鋪平了數(shù)據(jù)通路,實現(xiàn)了對復(fù)雜現(xiàn)場情況的多角度多模態(tài)感知。三類數(shù)據(jù)的同步獲得極大增強(qiáng)了后續(xù)多模態(tài)關(guān)聯(lián)分析、知識融合與高維數(shù)據(jù)驅(qū)動的歸因效果,使業(yè)務(wù)流程的透明化與智能化達(dá)到更高水平。[0063]進(jìn)一步的,根據(jù)數(shù)據(jù)類型進(jìn)行特征向量提取,構(gòu)建行業(yè)知識數(shù)據(jù)庫確定嵌入向量,[0064]對采集數(shù)據(jù)進(jìn)行預(yù)處理,對處理后的結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)以及圖形數(shù)據(jù)分別進(jìn)行數(shù)據(jù)降維;[0065]其中對結(jié)構(gòu)化數(shù)據(jù)采用多層感知器MLP,通過ReLU非線性激活函數(shù)進(jìn)行特征向量提取,對文本數(shù)據(jù)使用預(yù)訓(xùn)練的BERT模型進(jìn)行編碼,并利用預(yù)訓(xùn)練ResNet50模型提取特征,取其全局平均池化層的輸出得到圖像特征向量;[0066]對三個采集數(shù)據(jù)的特征向量采用線性變化進(jìn)行標(biāo)準(zhǔn)化處理,基于歷史經(jīng)驗確定統(tǒng)一緯度值D,堆疊構(gòu)成模態(tài)特征矩陣,采用自注意力機(jī)制計算Query、Key、Value,并計算縮放[0068]其中S;表示第i和第j個模態(tài)之間的注意力得分,Q表示第i個模態(tài)的Query值,K表[0069]應(yīng)用softmax歸一化,確保softmax的維度設(shè)置為每一行,使得每個模態(tài)的注意力[0072]其中Aij表示第i和第j個模態(tài)的注意力權(quán)重,Sik表示第i和第k個模態(tài)之間的注意力[0073]隨后采用平均池化,將三個模態(tài)的信息融合為單一向量,輸出多模態(tài)融合向量并根據(jù)行業(yè)業(yè)務(wù)流程進(jìn)行序列化,組成融合多模態(tài)向量序列;[0074]基于企業(yè)規(guī)程和專家文檔構(gòu)建行業(yè)知識數(shù)據(jù)庫,對知識庫中每條知識片段統(tǒng)一使用文本編碼器Enc進(jìn)行嵌入得到對應(yīng)的嵌入向量,整個知識庫對應(yīng)一組嵌入矩陣;[0075]針對業(yè)務(wù)事件的多模態(tài)融合向量,在知識庫嵌入矩陣E中檢索其最相關(guān)的K條知識片段組成知識向量集,采用余弦相似度計算相關(guān)度值篩選K組多模態(tài)融合向量與知識片段[0076]通過多模態(tài)特征融合與知識片段檢索方案,可以實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)、文本信息與圖像等異質(zhì)信息的統(tǒng)一表達(dá)和相關(guān)性挖掘,通過預(yù)處理與降維,確保各類原始數(shù)據(jù)的有效壓縮與冗余去除,提高了下游特征利用率,不同類型數(shù)據(jù)分別采用適合其語義結(jié)構(gòu)的神經(jīng)網(wǎng)文與語義,圖像用ResNet50提煉復(fù)雜空間結(jié)構(gòu),能夠最大限度保留各自信息優(yōu)勢,線性映射標(biāo)準(zhǔn)化解決了多模態(tài)特征異尺度、異分布問題,為后續(xù)統(tǒng)一融合打下基礎(chǔ);[0077]通過自注意力機(jī)制,模型能夠根據(jù)業(yè)務(wù)場景自適應(yīng)調(diào)整各模態(tài)特征的關(guān)注度,實現(xiàn)信息互補(bǔ),自動突出與當(dāng)前任務(wù)最相關(guān)的多模態(tài)維度;softmax逐行歸一和加權(quán)處理確保計算的注意力分布具物理及業(yè)務(wù)合理性,這種融合方式消除了主觀加權(quán)或人工特征工程所帶來的不確定性與低效,為不同來源的信息實現(xiàn)深層耦合;[0078]采用平均池化方式,最終得到穩(wěn)定、信息整合度極高的單一向量,同時與業(yè)務(wù)流程自動對齊,形成標(biāo)準(zhǔn)的融合特征序列表達(dá),便于后續(xù)業(yè)務(wù)序列建模和溯源,對知識庫內(nèi)容進(jìn)行統(tǒng)一文本嵌入、使用向量表示后,能夠打通結(jié)構(gòu)化業(yè)務(wù)數(shù)據(jù)與領(lǐng)域知識之間的關(guān)聯(lián),極大提升了知識檢索的精度和上下文業(yè)務(wù)貼合度;[0079]通過余弦相似度篩選,讓每個業(yè)務(wù)事件融合向量自動關(guān)聯(lián)到歷史積累下來的最相似且最具參考價值的知識片段,有效縮短了響應(yīng)時間和人工查找成本,保證模型發(fā)現(xiàn)和利用知識串聯(lián)的能力,動態(tài)K值設(shè)定結(jié)合了業(yè)務(wù)實際規(guī)模和歷史案例密度,使模型既不過擬合,又足夠靈活,整體流程大幅提升業(yè)務(wù)事件理解的深度和精準(zhǔn)度,也為流程合規(guī)性、自動歸因及智能決策提供了強(qiáng)大的信息基礎(chǔ)和顯著的全局優(yōu)化效果。[0080]S2,計算相關(guān)度值篩選多模態(tài)融合向量與知識片段的組合,組成門控輸入向量進(jìn)行融合向量計算,并計算知識片段與融合向量的關(guān)系強(qiáng)度值,獲得完整業(yè)務(wù)流程的增強(qiáng)融合向量序列;[0081]優(yōu)選的,計算相關(guān)度值篩選多模態(tài)融合向量與知識片段的組合,組成門控輸入向量進(jìn)行融合向量計算,獲得完整業(yè)務(wù)流程的增強(qiáng)融合向量序列,包括,[0082]根據(jù)多模態(tài)融合向量與知識片段的組合進(jìn)行拼接作為門控輸入向量,基于前饋全連接神經(jīng)網(wǎng)絡(luò)構(gòu)建知識門控融合模型,對門控輸入向量單層神經(jīng)網(wǎng)絡(luò)獲得門控因子,表示[0089]同時針對每個知識片段利用點積形式獲得與初始融合向量的關(guān)系強(qiáng)度值,表示[0093]對業(yè)務(wù)流程中的每個事件t均重復(fù)上述操作,最終獲得完整業(yè)務(wù)流程的增強(qiáng)融合整理模板路徑和實際業(yè)務(wù)的歸因路徑,使用LCS算法確定路徑重合長度,并篩選高度相似對齊的歸因路徑;[0098]優(yōu)選的,確定業(yè)務(wù)事件所屬的類別標(biāo)簽生成事件有向圖,提取類別異常狀態(tài)特征[0099]根據(jù)增強(qiáng)融合向量序列的不同事件確定事件的時間點,并確定業(yè)務(wù)事件所屬的類別標(biāo)簽(如工藝階段編號、設(shè)備類型、報警類型等,取自實際業(yè)務(wù)數(shù)據(jù))以及事件現(xiàn)場元數(shù)據(jù)數(shù)據(jù)),構(gòu)建成時間節(jié)點,并確定所有業(yè)務(wù)事件的節(jié)點集合;[0100]根據(jù)工藝標(biāo)準(zhǔn)表明確獲得行業(yè)業(yè)務(wù)流程主線,根據(jù)業(yè)務(wù)流程中事件i直接流向事件j的標(biāo)準(zhǔn)流轉(zhuǎn)關(guān)系進(jìn)行有向邊構(gòu)建,對于每個相鄰業(yè)務(wù)事件依據(jù)真實業(yè)務(wù)發(fā)生順序以及理論規(guī)定的節(jié)點間銜接順序,分別生成候選有向邊集,對于標(biāo)準(zhǔn)流程,有向邊是依據(jù)行業(yè)規(guī)定直接對接的工序、環(huán)節(jié)或業(yè)務(wù)指令產(chǎn)生,對于實際事件流,則依據(jù)真實業(yè)務(wù)中相鄰事件發(fā)生的順序,自動生成事件之間的直接流轉(zhuǎn)關(guān)系,且每生成一條有向邊附加詳細(xì)屬性包括類別標(biāo)簽和現(xiàn)場元數(shù)據(jù);[0101]將標(biāo)準(zhǔn)流程產(chǎn)生的邊和實際業(yè)務(wù)流程采集的邊合并起來生成事件有向圖,即既包含理論應(yīng)有的流轉(zhuǎn)關(guān)系,也包含了現(xiàn)場真實發(fā)生的實際流轉(zhuǎn),這樣無論是流程監(jiān)督、異常檢[0102]根據(jù)行業(yè)知識庫給出的細(xì)致領(lǐng)域標(biāo)簽,遍歷全部事件節(jié)點,將具有相同領(lǐng)域標(biāo)簽且在有向圖中連通的節(jié)點,確定為業(yè)務(wù)子流程,并將所有業(yè)務(wù)子流程構(gòu)建子流程集合;[0103]對于子流程內(nèi)每條有向邊提取類別異常狀態(tài)特征集合,包括時序特征(連續(xù)事件標(biāo)準(zhǔn)違規(guī)標(biāo)簽(程序自動比對流轉(zhuǎn)節(jié)點對是否跳過必經(jīng)工藝,是否逆流,是否存在非法或不合規(guī)環(huán)節(jié))、實時監(jiān)控報警標(biāo)志(ERP/MES/傳感器系統(tǒng)產(chǎn)生的故障、超限或報警事件),對每條有向邊的每項異常狀態(tài)特征進(jìn)行統(tǒng)計并進(jìn)行歸一化求和,作為每條有向邊的歸因性分值,并統(tǒng)計每個子流程的總歸因性分值;[0104]基于經(jīng)驗法設(shè)置的得分閾值,并將高于得分閾值得分的子流程作為主要歸因路徑,基于行業(yè)知識數(shù)據(jù)庫,收集并整理企業(yè)歷年的歸檔路徑作為模板路徑,包括經(jīng)典缺陷根因路徑、典型問題流、專家審核過的異常傳播鏈、業(yè)務(wù)標(biāo)準(zhǔn)傳播模板,同步采集歸因路徑中節(jié)點步驟邊的異常狀態(tài)特征,生成標(biāo)準(zhǔn)路徑模板庫;[0105]對實際業(yè)務(wù)中獲得的每一條歸因路徑和行業(yè)知識數(shù)據(jù)庫中每一條模板路徑,將節(jié)點順序與每條有向邊的異常狀態(tài)特征,編碼為一組有序特征序列向量,分別為歸因路徑的結(jié)構(gòu)化特征序列和專家知識模板路徑的結(jié)構(gòu)化特征序列,可采用JSON數(shù)組進(jìn)行編碼存儲;[0106]對每一條待歸因路徑,遍歷模板庫,逐一對比特征序列,采用最長公共子序列LCS算法,根據(jù)歸因路徑P的前i步和模板路徑T的前j步之間的最長公共子序列的長度,作為二維數(shù)組L;[0107]若歸因路徑第i步和模板路徑第j步的所有字段完全一致,則確定一致重合長度,否則,選擇排除歸因路徑和模板路徑不匹配的節(jié)點[0110]其中L[i][j]表示歸因路徑的前i步和模板的前j步的一致重合長度,L[i-1][j-1]表示前一對都比對完成的最長公共子序列長度,L'[i][j]表示歸因路徑的前i步和模板的前j步的最大重合長度,L[i-1][j]和L[i][j-1]分別表示只看歸因路徑的前i-1步和模板路徑的前j步以及只看歸因路徑的前i步和模板路徑的前j-1步的最長公共子序列長度;[0111]根據(jù)確定的LCS重合長度與路徑的總長度的比值作為結(jié)構(gòu)相似度分?jǐn)?shù);[0112]基于歷史數(shù)據(jù)的均值與標(biāo)準(zhǔn)差的和作為結(jié)構(gòu)相似度閾值,若結(jié)構(gòu)相似度分?jǐn)?shù)大于等于結(jié)構(gòu)相似度閾值,則判斷歸因路徑與模板路徑高度相似對齊。[0113]通過業(yè)務(wù)事件被分為嚴(yán)格的節(jié)點集合,每個節(jié)點都帶有可追溯的業(yè)務(wù)元數(shù)據(jù)和事件類別,使事件鏈條的描述具備邏輯清晰和數(shù)據(jù)真實保證;從理論流程與實際執(zhí)行中分別抽取有向邊并合并到統(tǒng)一圖結(jié)構(gòu),這讓后續(xù)的流程優(yōu)化、偏差識別和根因追溯都能基于業(yè)務(wù)邏輯全貌開展,既避免了單一視角的盲區(qū),也提供了理想與現(xiàn)實動態(tài)比對的可能。[0114]子流程劃分通過領(lǐng)域標(biāo)簽和節(jié)點連通性聯(lián)動完成,可精確聚合同類業(yè)務(wù)環(huán)節(jié)且自動適配現(xiàn)場工藝變化,降低了人為劃分可能產(chǎn)生的偏差。針對每條有向邊統(tǒng)計時間、狀態(tài)、流程、告警等多維異常特征,歸一求和為客觀可度量的歸因性分值,進(jìn)一步對每個子流程量化異常程度,實現(xiàn)了快速聚焦最有可能影響業(yè)務(wù)結(jié)果的核心異常鏈條。[0115]通過經(jīng)驗法設(shè)置的得分閾值,可以避免高噪聲、低相關(guān)流程占用分析資源,使分析聚焦在真正異常劇烈、可能產(chǎn)生業(yè)務(wù)風(fēng)險的流程段落;采用標(biāo)準(zhǔn)化模板路徑庫、同步特征向量化存儲,讓實際歸因結(jié)果可以與歷史沉淀的典型問題及經(jīng)驗形成高一致性結(jié)構(gòu)化比對。這種比對既不依賴人工經(jīng)驗,也不會遺漏業(yè)務(wù)流程中新的異常模式,從根本上提升了自動化智能分析的適用性和實時性。[0116]LCS算法對比后,通過重合序列長度與總長度比值得到的結(jié)構(gòu)相似度分?jǐn)?shù),為歸因路徑與模板路徑的自動“歸類”及動態(tài)對齊提供了客觀、量化的標(biāo)準(zhǔn),并抑制了表層噪聲或局部波動造成的偽匹配,利用歷史均值與標(biāo)準(zhǔn)差合成的閾值作為最終判據(jù),則讓主要歸因路徑的甄別和高可信的自動歸檔都具備了數(shù)據(jù)驅(qū)動的自適應(yīng)機(jī)制,真正賦能大規(guī)模工業(yè)場景下的流程異常定位和知識閉環(huán)完善。[0117]S4,根據(jù)異常狀態(tài)特征生成歸因路徑與模板的直接索引表,統(tǒng)計周期未能對齊的歸因路徑計算對齊偏差率,生成異常歸因路徑列表;[0119]對篩選的高度相似對齊歸因路徑,將歸因路徑的異常狀態(tài)特征與模板路徑的異常狀態(tài)特征項進(jìn)行映射并以結(jié)構(gòu)化格式存儲,形成歸因路徑和模板路徑的直接索引表。[0120]通過將高度相似對齊的歸因路徑與模板路徑的異常狀態(tài)特征進(jìn)行一一映射,并以結(jié)構(gòu)化方式進(jìn)行存儲,實現(xiàn)了歸因結(jié)果與標(biāo)準(zhǔn)模板之間的精確信息關(guān)聯(lián),保證歸因結(jié)果的所有異常細(xì)節(jié)都能夠被后續(xù)自動化系統(tǒng)、運維人員或決策系統(tǒng)精確調(diào)取和檢索,提高了數(shù)據(jù)復(fù)用和查詢效率,歸因路徑和模板路徑間的直接索引關(guān)系,帶來了業(yè)務(wù)歸因與歷史知識的無縫銜接,便于統(tǒng)計歸因次數(shù)、監(jiān)控特定異常類型的出現(xiàn)趨勢以及發(fā)現(xiàn)流程優(yōu)化的高發(fā)環(huán)節(jié),為企業(yè)后續(xù)的異常跟蹤、歸因解釋、合規(guī)審計及知識庫持續(xù)擴(kuò)展提供了堅實的結(jié)構(gòu)性基礎(chǔ),極大提升了管理與分析的自動化和可控性。[0121]進(jìn)一步的,統(tǒng)計周期未能對齊的歸因路徑計算對齊偏差率,生成異常歸因路徑列[0122]保存歸因路徑的全部節(jié)點序列、邊的異常狀態(tài)特征,以及其匹配的結(jié)構(gòu)相似度分[0123]統(tǒng)計周期內(nèi)歸因路徑中未能與任何模板路徑對齊的歸因路徑數(shù)量,以及本周期歸因路徑總數(shù),計算當(dāng)前周期的對齊偏差率,若偏差率高于偏差閾值(根據(jù)歷史經(jīng)驗設(shè)置),輸[0124]通過將每條歸因路徑的節(jié)點序列、全部邊的異常狀態(tài)特征和具體的結(jié)構(gòu)相似度分?jǐn)?shù)進(jìn)行詳細(xì)記錄并生成日志,使得后續(xù)的追溯、回放和問題復(fù)核都有原始數(shù)據(jù)來源支撐,保證每一次歸因分析既可驗證也方便被重復(fù)利用,周期性統(tǒng)計未對齊歸因路徑與總歸因路徑數(shù),并據(jù)此計算對齊偏差率,通過量化指標(biāo)能夠動態(tài)反映當(dāng)前知識模板對實際業(yè)務(wù)復(fù)雜性[0125]當(dāng)偏差率超過預(yù)定閾值,系統(tǒng)能夠自動篩出全部異常歸因路徑,組成反饋報告,精準(zhǔn)提示管理與分析團(tuán)隊關(guān)注可能的產(chǎn)線變革、設(shè)備老化或新發(fā)難題,支持快速響應(yīng)和知識模板擴(kuò)展優(yōu)化。該過程實現(xiàn)了異常信息的自動歸檔、統(tǒng)計與上報,確保企業(yè)能夠持續(xù)閉環(huán)優(yōu)化業(yè)務(wù)流程和知識資產(chǎn),有效提升問題預(yù)警和自適應(yīng)調(diào)整能力。[0126]本實施例還提供基于行業(yè)大模型的智能數(shù)據(jù)分析方法的系統(tǒng),包括,[0127]多源數(shù)據(jù)采集模塊,負(fù)責(zé)從結(jié)構(gòu)化數(shù)據(jù)源、文本數(shù)據(jù)源、圖形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論