CN119226226B 智能微型檔案室的檔案管理系統(tǒng)、方法及設備 (寧波八益集團有限公司)_第1頁
CN119226226B 智能微型檔案室的檔案管理系統(tǒng)、方法及設備 (寧波八益集團有限公司)_第2頁
CN119226226B 智能微型檔案室的檔案管理系統(tǒng)、方法及設備 (寧波八益集團有限公司)_第3頁
CN119226226B 智能微型檔案室的檔案管理系統(tǒng)、方法及設備 (寧波八益集團有限公司)_第4頁
CN119226226B 智能微型檔案室的檔案管理系統(tǒng)、方法及設備 (寧波八益集團有限公司)_第5頁
已閱讀5頁,還剩29頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利(65)同一申請的已公布的文獻號申請公布號CN119226226A(73)專利權(quán)人寧波八益集團有限公司地址315000浙江省寧波市高新區(qū)劍蘭路401號(74)專利代理機構(gòu)寧波協(xié)眾智庫專利代理事務所(普通合伙)33425GO6N3/0464(2023.01)田偉等.檔案數(shù)據(jù)個性化推薦引擎模型構(gòu)建.檔案.2015,(第12期),第二節(jié).智能微型檔案室的檔案管理系統(tǒng)、方法及設備本申請公開了一種智能微型檔案室的檔案單元用于通過0CR識別待存儲檔案的內(nèi)容,并計算待存儲檔案與多個目標聚類中心的相似度,以確定檔案的存儲位置;檔案編碼單元用于根據(jù)包括檔案類型、存儲位置、安全等級和日期編號的檔案屬性信息構(gòu)建目標檔案的多維編碼;檔案檢索單元用于計算檢索關(guān)鍵詞與所有檔案的內(nèi)容相似度,并基于用戶權(quán)限和檔案的多維編碼輸出一個或多個待選檔案的信息;檔案推薦單元用于采用改進的協(xié)同過濾算法對已選檔案的關(guān)聯(lián)檔案進行推薦。通過本申請的方案,能夠有效解決待存檔待存檔案存儲定位單元101加密單元105檔案編碼單元102檔案檢索單元103檔案推薦單元104智能微型檔案室下一級智能微型檔案遠程監(jiān)管單元106檢索關(guān)21.一種智能微型檔案室的檔案管理系統(tǒng),其特征在于,包括:存儲定位單元、檔案編碼所述存儲定位單元用于通過OCR識別待存儲檔案的內(nèi)容,并計算待存儲檔案與多個目對包含待存儲檔案內(nèi)容的圖像進行預處理,并分別檢測文本區(qū)域和圖像區(qū)域,以得到檔案的結(jié)構(gòu)文本內(nèi)容;基于自適應閾值和動態(tài)合并策略對所有檔案的結(jié)構(gòu)文本內(nèi)容的向量進行一次聚類,以確定最優(yōu)聚類數(shù)量;基于一次聚類構(gòu)建檔案關(guān)系圖,并使用圖神經(jīng)網(wǎng)絡對節(jié)點進行優(yōu)化;通過基于密度的初始中心選擇策略和自適應的聚類數(shù)量調(diào)整機制對優(yōu)化后的節(jié)點表s.t.A;={Zi:ⅡZi-c;Il2<llZi-ci?I2,Vl≠j}其中,C*表示最終的最優(yōu)聚類中心集合,C表示當前的聚類中心集合,z表示優(yōu)化后的節(jié)計算待存儲檔案與多個目標聚類中心的相似度,以選擇最高相似度的聚類確定存儲位所述檔案編碼單元用于根據(jù)包括檔案類型、存儲位置、安全等級和日期編號的檔案屬性信息構(gòu)建目標檔案的多維編碼;所述檔案檢索單元用于計算檢索關(guān)鍵詞與所有檔案的內(nèi)容相似度,并基于用戶權(quán)限和檔案的多維編碼輸出一個或多個待選檔案的信息;所述檔案推薦單元用于采用改進的協(xié)同過濾算法對已選檔案的關(guān)聯(lián)檔案進行推薦;所述加密單元用于對包括OCR識別的檔案內(nèi)容和檔案多維編碼的數(shù)據(jù)進行加密,以存儲至離線數(shù)據(jù)庫中。2.根據(jù)權(quán)利要求1所述的檔案管理系統(tǒng),其特征在于,其中,計算檢索關(guān)鍵詞與所有檔案的內(nèi)容相似度,并基于用戶權(quán)限和檔案的多維編碼輸出一個或多個待選檔案的信息,包采用自然語言處理模型對檢索關(guān)鍵詞進行意圖識別和實體抽??;基于識別的意圖和實體,通過知識圖譜和詞嵌入對檢索的查詢進行擴展;構(gòu)建包括倒排索引、B+樹索引和/或局部敏感哈希索引的多級索引結(jié)構(gòu);3基于文本內(nèi)容相似度、屬性相似度和時間相關(guān)性計算與所有檔案的綜合相似度;基于用戶權(quán)限和檔案的安全等級定義訪問控制策略,并對檢索結(jié)果進行篩選,以輸出一個或多個待選檔案的信息。3.根據(jù)權(quán)利要求1所述的檔案管理系統(tǒng),其特征在于,其中,采用改進的協(xié)同過濾算法對已選檔案的關(guān)聯(lián)檔案進行推薦,包括:構(gòu)建交互矩陣,并進行矩陣分解,以引入多項目標參數(shù)對所述交互矩陣進行優(yōu)化;基于優(yōu)化后的交互矩陣生成個性化的檔案推薦列表。4.根據(jù)權(quán)利要求1所述的檔案管理系統(tǒng),其特征在于,其中,對包括OCR識別的檔案內(nèi)容和檔案多維編碼的數(shù)據(jù)進行加密,以存儲至離線數(shù)據(jù)庫中,包括:將檔案內(nèi)容分成多個固定大小的塊,以使用改進的AES-256算法對每個塊進行獨立加密,且在每個塊之間插入隨機長度的填充數(shù)據(jù);采用動態(tài)密鑰生成機制生成密鑰,并通過基于身份的加密方案進行密鑰分發(fā);基于預設方案對數(shù)據(jù)讀取進行訪問控制加密和同態(tài)加密。5.根據(jù)權(quán)利要求2所述的檔案管理系統(tǒng),其特征在于,其中,基于文本內(nèi)容相似度、屬性相似度和時間相關(guān)性計算與所有檔案的綜合相似度,包括:數(shù),用于平衡三個組成部分的重要性,IDF(q)表示查詢詞q的逆文檔頻率,tf(q;,d)表示查文檔長度,δ表示BM25+算法中的額外參數(shù),HammingDistance()表示計算兩個編碼之間的漢明距離,Encoding()表示將文檔或查詢轉(zhuǎn)換為多維編碼,MaxDistance表示兩個編碼之示文檔的創(chuàng)建或最后修改時間。6.根據(jù)權(quán)利要求3所述的檔案管理系統(tǒng),其特征在于,其中,構(gòu)建交互矩陣,并進行矩陣分解,以引入多項目標參數(shù)對所述交互矩陣進行Rij≈(μ+bi+bj+pT·qj)·Tij戶i的偏置項,b;表示檔案j的偏置項,p?表示用戶i的隱向量,q;表示檔案j的隱向量,T表示時間衰減因子,γ表示內(nèi)容相似度的權(quán)重系數(shù),S;表示檔案i和檔案j之間的內(nèi)容相似度,δ表示上下文特征的權(quán)重系數(shù),c表示上下文特征向量,w;表示檔案j的上下文權(quán)重向量。7.根據(jù)權(quán)利要求1所述的檔案管理系統(tǒng),其特征在于,還包括遠程監(jiān)管單元;其中所述遠程監(jiān)管單元用于為上級檔案室提供下級檔案室的實時運行狀態(tài)、環(huán)境參數(shù)和/或人員操作的信息,并對下級檔案室的對應操作進行遠程審批。4通過0CR識別待存儲檔案的內(nèi)容,并計算待存儲檔案與多個目標聚類中心的相似度,以對包含待存儲檔案內(nèi)容的圖像進行預處理,并分別檢測文本區(qū)域和圖像區(qū)域,以得到檔案的結(jié)構(gòu)文本內(nèi)容;基于自適應閾值和動態(tài)合并策略對所有檔案的結(jié)構(gòu)文本內(nèi)容的向量進行一次聚類,以確定最優(yōu)聚類數(shù)量;基于一次聚類構(gòu)建檔案關(guān)系圖,并使用圖神經(jīng)網(wǎng)絡對節(jié)點進行優(yōu)化;通過基于密度的初始中心選擇策略和自適應的聚類數(shù)量調(diào)整機制對優(yōu)化后的節(jié)點表s.t.A;={Zi:ⅡZi-c;Il2<ll其中,C*表示最終的最優(yōu)聚類中心集合,C表示當前的聚類中心集合,z表示優(yōu)化后的節(jié)計算待存儲檔案與多個目標聚類中心的相似度,以選擇最高相似度的聚類確定存儲位根據(jù)包括檔案類型、存儲位置、安全等級和日期編號的檔案屬性信息構(gòu)建目標檔案的計算檢索關(guān)鍵詞與所有檔案的內(nèi)容相似度,并基于用戶權(quán)限和檔案的多維編碼輸出一個或多個待選檔案的信息;采用改進的協(xié)同過濾算法對已選檔案的關(guān)聯(lián)檔案進行推薦;對包括OCR識別的檔案內(nèi)容和檔案多維編碼的數(shù)據(jù)進行加密,以存儲至離線數(shù)據(jù)庫中。9.一種智能微型檔案室的檔案管理設備,其特征在于,包括:處理器、存儲器、系統(tǒng)總線;其中,所述處理器以及所述存儲器通過所述系統(tǒng)總線相連;所述存儲器用于存儲一個或多個程序,所述一個或多個程序包括指令,所述指令當被所述處理器執(zhí)行時使所述處理器執(zhí)行權(quán)利要求8所述的方法。5技術(shù)領(lǐng)域[0001]本申請涉及檔案管理領(lǐng)域,尤其涉及一種智能微型檔案室的檔案管理系統(tǒng)、方法及設備。背景技術(shù)[0002]檔案管理系統(tǒng)已成為現(xiàn)代組織機構(gòu)中不可或缺的重要工具,其在信息管理、歷史記錄保存和決策支持等方面發(fā)揮著關(guān)鍵作用。檔案管理系統(tǒng)的主要功能是對各類文件、記隨著信息技術(shù)的快速發(fā)展,傳統(tǒng)的紙質(zhì)檔案管理逐漸向數(shù)字化、智能化方向轉(zhuǎn)變,這不僅提高了工作效率,還大大增強了信息的共享和利用能力。檔案管理系統(tǒng)的重要性體現(xiàn)在多個方面:它能夠有效保護重要歷史文獻和數(shù)據(jù),為組織決策提供可靠依據(jù),同時也是確保組織合規(guī)性和透明度的重要工具。現(xiàn)有的檔案管理系統(tǒng)技術(shù)主要包括數(shù)字化存儲、元數(shù)據(jù)管理、全文檢索、權(quán)限控制等。這些技術(shù)的工作原理是通過將文件數(shù)字化,添加描述性信息(元數(shù)據(jù)),建立索引系統(tǒng),并設置訪問權(quán)限,從而實現(xiàn)對檔案的高效管理和快速檢索。然而,現(xiàn)有技術(shù)仍然面臨著一些問題,如海量數(shù)據(jù)處理效率不高、智能化程度不足、系統(tǒng)整合困難、安全性和隱私保護不夠等。[0003]目前,為解決上述問題,業(yè)界已經(jīng)開發(fā)了一些改進方法。例如,采用分布式存儲和云計算技術(shù)來提高數(shù)據(jù)處理能力,引入人工智能算法來增強檢索和分類的智能化程度,使用區(qū)塊鏈技術(shù)來加強數(shù)據(jù)安全性和可追溯性。然而,這些方法仍存在一些明顯的缺陷。首先,大多數(shù)現(xiàn)有解決方案仍然需要大量的人工干預,無法實現(xiàn)真正的智能化和自動化管理。其次,這些系統(tǒng)往往規(guī)模龐大,需要復雜的硬件設施和專業(yè)的技術(shù)支持,不適合小型組織或空間受限的場景。再者,現(xiàn)有系統(tǒng)在數(shù)據(jù)整合和跨平臺兼容性方面仍有不足,難以滿足日益增長的信息共享和協(xié)作需求。最后,雖然有些系統(tǒng)引入了先進的安全技術(shù),但在面對日益復雜的網(wǎng)絡威脅時,仍然存在潛在的安全隱患。[0004]因此,亟需一種技術(shù)方案,從而能夠有效解決現(xiàn)有系統(tǒng)在智能化、空間利用、易用性和安全性等方面的問題。發(fā)明內(nèi)容[0005]為了解決現(xiàn)有技術(shù)的不足,本申請實施例提供了一種智能微型檔案室的檔案管理系統(tǒng)、方法及設備。本申請解決了現(xiàn)有技術(shù)無法有效解決在智能化、空間利用、易用性和安全性等方面的技術(shù)問題。[0006]本申請實施例提供了一種智能微型檔案室的檔案管理系檔案編碼單元、檔案檢索單元、檔案推薦單元和加密單元;其中,所述存儲定位單元用于通過OCR識別待存儲檔案的內(nèi)容,并計算待存儲檔案與多個目標聚類中心的相似度,以確定檔案的存儲位置;所述檔案編碼單元用于根據(jù)包括檔案類型、存儲位置、安全等級和日期編號的檔案屬性信息構(gòu)建目標檔案的多維編碼;所述檔案檢索單元用于計算檢索關(guān)鍵詞與所有6檔案的內(nèi)容相似度,并基于用戶權(quán)限和檔案的多維編碼輸出一個或多個待選檔案的信息;密單元用于對包括OCR識別的檔案內(nèi)容和檔案多維編碼的數(shù)據(jù)進行加密,以存儲至離線數(shù)s.t.A;={Zi:ⅡZi7據(jù)讀取進行訪問控制加密和同態(tài)加密。β,γ表示可調(diào)節(jié)的權(quán)重參數(shù),用于平衡三個組成部分的重要性,IDF(q)表示查詢詞q的逆表示計算兩個編碼之間的漢明距離,Encoding()表示將文檔或查詢轉(zhuǎn)換為多維編碼,當前時間,document\_time表示文檔的創(chuàng)建或最后修改時間。[0015]一種可以的實現(xiàn)方式中,其中,構(gòu)建交互矩陣,并進行矩陣分解,以引入多項目標Tij+γ·Sij+δ·cT·w;,其中,R,表示用戶i對檔案j的預測交互矩陣強度,μ表示全局平均交互強度,b表示用戶i的偏置項,b;表示檔案j的偏置項,p表示用戶i的隱向量,q;表示檔案j的隱向量,Ti;表示時間衰減因子,γ表示內(nèi)容相似度的權(quán)重系數(shù),S;表示檔案i和檔案j之間的內(nèi)容相似度,δ表示上下文特征的權(quán)重系數(shù),c表示上下文特征向量,w;表示檔案j的上下文權(quán)重向量。[0016]一種可以的實現(xiàn)方式中,還包括遠程監(jiān)管單元;其中所述遠程監(jiān)管單元用于為上級檔案室提供下級檔案室的實時運行狀態(tài)、環(huán)境參數(shù)和/或人員操作的信息,并對下級檔案室的對應操作進行遠程審批。[0017]本申請實施例還提供了一種智能微型檔案室的檔案管理方法,包括:通過OCR識別待存儲檔案的內(nèi)容,并計算待存儲檔案與多個目標聚類中心的相似度,以確定檔案的存儲位置;根據(jù)包括檔案類型、存儲位置、安全等級和日期編號的檔案屬性信息構(gòu)建目標檔案的多維編碼;計算檢索關(guān)鍵詞與所有檔案的內(nèi)容相似度,并基于用戶權(quán)限和檔案的多維編碼輸出一個或多個待選檔案的信息;采用改進的協(xié)同過濾算法對已選檔案的關(guān)聯(lián)檔案進行推薦;對包括OCR識別的檔案內(nèi)容和檔案多維編碼的數(shù)據(jù)進行加密,以存儲至離線數(shù)據(jù)庫中。器、系統(tǒng)總線;其中,所述處理器以及所述存儲器通過所述系統(tǒng)總線相連;所述存儲器用于存儲一個或多個程序,所述一個或多個程序包括指令,所述指令當被所述處理器執(zhí)行時使所述處理器執(zhí)行上述實施例所述的方法。[0019]在如上所提供的一種智能微型檔案室的檔案管理系統(tǒng)、方法及設備中,本申請實施例通過深度整合人工智能和機器學習技術(shù),能夠?qū)崿F(xiàn)檔案的自動分類、標記和智能檢索,大幅提高系統(tǒng)的自動化程度和效率;通過引入先進的數(shù)據(jù)壓縮和存儲技術(shù),在有限的物理8空間內(nèi)實現(xiàn)海量數(shù)據(jù)的高效存儲和快速訪問;通過采用多層次的加密和訪問控制機制,能夠確保檔案的絕對安全。附圖說明[0020]為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本申請的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。[0021]圖1為本申請實施例提供的一種智能微型檔案室的檔案管理系統(tǒng)的示意框圖;[0022]圖2為本申請實施例提供的一種檔案檢索方法的流程示意圖。具體實施方式[0023]現(xiàn)在將參照附圖來詳細描述本申請的各種示例性實施例。應注意到:除非另外具體說明,否則在這些實施例中闡述的部件和步驟的相對布置、數(shù)字表達式和數(shù)值不限制本申請的范圍。不同步驟、設備或模塊等,既不代表任何特定技術(shù)含義,也不表示它們之間的必然邏輯順兩個或兩個以上。還應理解,對于本申請實施例中提及的任一部件、數(shù)據(jù)或結(jié)構(gòu),在沒有明確限定或者在前后文給出相反啟示的情況下,一般可以理解為一個或多個。另外,本申請中般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系還應理解,本申請對各個實施例的描述著重強調(diào)各個實施例之間的不同之處,其相同或相似之處可以相互參考,為了簡潔,不再一—贅述。[0025]同時,應當明白,為了便于描述,附圖中所示出的各個部分的尺寸并不是按照實際的比例關(guān)系繪制的。以下對至少一個示例性實施例的描述實際上僅僅是說明性的,決不作為對本申請及其應用或使用的任何限制。對于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設備可以不作詳細討論,但在適當情況下,所述技術(shù)、方法和設備應當被視為說明書的一部分。應注意到:相似的標號和字母在下面的附圖中表示類似項,因此,一旦某一項在一個附圖中被定義,則在隨后的附圖中不需要對其進行進一步討論。[0026]為使本申請實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。[0027]圖1為本申請實施例提供的一種智能微型檔案室的檔案管理系統(tǒng)的示意框圖。需要理解的是,圖中所示系統(tǒng)是示例性而非限制性的。這意味著所涉及的系統(tǒng)架構(gòu)并不受限于特定的形式或設計,而是作為示例來呈現(xiàn)。換言之,圖中展示的架構(gòu)可以被視為一種表達方式,用以清晰地描述相關(guān)概念和關(guān)系,并不排斥其他形式的架構(gòu)。因此,在解釋所述圖片中架構(gòu)時,應當理解該模型具有靈活性和多樣性,其目的在于提供一種示例性描述,而非對9的backbone網(wǎng)絡采用CSPDarknet53,并引入了空間金字塔池化(SPP)模塊增強特征提取能力。檢測出的文本區(qū)域隨后被裁剪并輸入到識別模型中。識別模型可以采用雙向LSTM-LSTM的輸出再經(jīng)過多頭注意力機制的Transformer編碼器,最后通過CTC解碼得到識別結(jié)k=k*determinedbyelbowmethod的基礎(chǔ)上,構(gòu)建檔案關(guān)系圖,每個檔案作為圖中的一個節(jié)點,節(jié)點之間的邊權(quán)重由檔案內(nèi)容相似度決定。然后應用圖神經(jīng)網(wǎng)絡(GNN)進行進一步的特征學習和聚類優(yōu)化。GNN模型采用GraphSAGE架構(gòu),其中包含了注意力機制和跳躍連接。[0035]其次,基于GNN學習到的節(jié)點表示,使用改進的K-Means++算法得到最終的聚類結(jié)果。改進點包括通過基于密度的初始中心選擇策略和自適應的聚類數(shù)量調(diào)整機制對優(yōu)化后的節(jié)點表示進行二次聚類,以得到多個目標聚類中心;其中包括:A;={Zi:ⅡZi-cjIl2<llZi-c?ll[0037]其中,C表示最終的最優(yōu)聚類中心集的節(jié)點表示,c;表示第j個聚類中心,A;表示屬于第j個聚類的節(jié)點集合,k表示聚類數(shù)量,p[0038]得到聚類結(jié)果后,計算待存儲檔案與多個目標聚類中心的相似度,以選擇最高相似度的聚類確定存儲位置。相似度計算可以采用余弦相似度與編輯距離的加權(quán)組合:Similarity(doc,cluster)=α·cos(doc,cluster\_center)+[0039]檔案編碼單元102用于根據(jù)包括檔案類型、存儲位置、安全等級和日期編號的檔案屬性信息構(gòu)建目標檔案的多維編碼。具體而言,使用改進的Huffman編碼對檔案類型進行編碼,以得到類型編碼;基于存儲定位單元得到的聚類結(jié)果進行位置分層,以得到位置編碼;計算檔案內(nèi)容的信息熵,并映射到對應的安全等級,以得到安全等級編碼;使用改進的格雷碼對日期進行編碼,以得到日期編碼;將類型編碼、位置編碼、安全等級編碼和日期編碼進行組合,并基于上下文對組合編碼進行壓縮,以得到多維編碼。[0040]在一個實施場景中,基于存儲定位單元得到的存儲位置信息,結(jié)合檔案的其他屬[0041]類型編碼:使用改進的Huffman編碼對檔案類型進行編碼。首先統(tǒng)計各類型的出現(xiàn)據(jù)新增檔案類型自動更新編碼。[0042]存儲位置編碼:基于存儲定位單元得到的聚類結(jié)果,設計了一種分層的位置編碼方案。首先對聚類進行編號,然后在每個聚類內(nèi)部再進行細分。編碼結(jié)區(qū)域編號][具體位置]。[0043]安全等級編碼:采用基于信息熵的編碼方案。首先計算檔案內(nèi)容的信息熵,然后將熵值映射到不同的安全等級。編碼長度與安全等級成正比,高安全等級的檔案有更長的編11[0044]日期編號編碼:使用改進的格雷碼對日期進行編碼。相比傳統(tǒng)的二進制編碼,格雷碼在相鄰日期之間只有一位不同,便于日期范圍查詢。[0045]最后,將上述各層編碼組合成最終的多維編碼。為了提高編碼的壓縮率,可以采用一種基于上下文的壓縮算法。該算法利用檔案屬性之間的相關(guān)性,通過預測模型減少冗余信息:[0047]檔案檢索單元103用于計算檢索關(guān)鍵詞與所有檔案的內(nèi)容相似度,并基于用戶權(quán)限和檔案的多維編碼輸出一個或多個待選檔案的信息。其中包括:采用自然語言處理模型對檢索關(guān)鍵詞進行意圖識別和實體抽?。换谧R別的意圖和實體,通過知識圖譜和詞嵌入對檢索的查詢進行擴展;構(gòu)建包括倒排索引、B+樹索引和/或局部敏感哈希索引的多級索引結(jié)構(gòu);基于文本內(nèi)容相似度、屬性相似度和時間相關(guān)性計算與所有檔案的綜合相似度;基于用戶權(quán)限和檔案的安全等級定義訪問控制策略,并對檢索結(jié)果進行篩選,以輸出一個或多個待選檔案的信息(如圖2所示,具體方法將在圖2處展開說明)。[0048]檔案推薦單元104用于采用改進的協(xié)同過濾算法對已選檔案的關(guān)聯(lián)檔案進行推衰減因子,γ表示內(nèi)容相似度的權(quán)重系數(shù),S;表示檔案i和檔案j之間的內(nèi)容相似度,8表示上下文特征的權(quán)重系數(shù),c表示上下文特征向量,w;表示檔案j的上下文權(quán)重向量。然后基于優(yōu)化后的交互矩陣生成個性化的檔案推薦列表。[0049]具體而言,本單元提出了一種多因素動態(tài)協(xié)同過濾算法,結(jié)合內(nèi)容分析、用戶行為和時間因素,實現(xiàn)個性化的檔案推薦。首先構(gòu)建用戶-檔案交互矩陣R,其中R;表示用戶i對w?·Edit\_time+w?·Cite\_count,其中w1,w2,w3,w4為權(quán)重參數(shù),通過機器學習算法動態(tài)調(diào)整。采用改進的矩陣分解算法,引入用戶和檔案的偏置項:Rij≈μ+bi+bj+p·Qj,其中μ為全局平均值,b和b;分別為用戶和檔案的偏置項,p?和q;為用戶和檔案的隱向qj))2+λ(Ilpill2+llq;I2+b2+b})。使用隨機梯度下降(SGD)優(yōu)化上述目標函數(shù)。(current\_time-interaction\_time)),將時間因子整合到矩陣分解模型中:Rij≈(μ+bi+bj+P·qj)·Tijo基于檔案的內(nèi)容特征,計算檔案間的相似度矩陣S。采用TF-IDF和Word2Vec的混合表示:[0051]Doc\_vector=a·TF-IDF(doc)+(1-α)·Word2Vec(doc);特征向量c,并擴展模型:Rij≈(μ+bi+b;+PT·qj)·Tij+γ·Sij+8·cT·w;,整。[0059]explanation=Attention(user\_embeddin并通過基于身份的加密方案進行密鑰分發(fā)。密鑰由以下公式生成:K=H(user\_id//index·17+timestamp)modmax\_padding\_length。ifuserattributes[0069]此外,本申請實施例還可以包括配置遠程監(jiān)管單元106;其中所述遠程監(jiān)管單元106用于為上級檔案室提供下級檔案室的實時運行狀態(tài)、環(huán)境參數(shù)和/或人員操作的信息,并對下級檔案室的對應操作進行遠程審批。本單元可以根據(jù)相關(guān)層級進行配置。[0070]具體而言,遠程監(jiān)管功能旨在實現(xiàn)上級單位(如區(qū)級檔案局)對下級單位(如鄉(xiāng)鎮(zhèn)檔案室)的有效監(jiān)督和管理。該功能通過網(wǎng)絡連接,使上級單位能夠?qū)崟r掌握下級檔案室的運行狀況、檔案管理情況,并進行必要的干預和指導。[0071]對于實時監(jiān)控下級檔案室的運行狀態(tài)、環(huán)境參數(shù)和人員操作。可以通過安裝在檔案室的攝像頭進行實時視頻監(jiān)控,部署環(huán)境傳感器,監(jiān)測溫度、濕度、光照等參數(shù),并記錄檔案管理系統(tǒng)的操作日志。還可以使用時間序列分析模型來檢測異常情況。例如使用自回歸移動平均模型(ARMA)來預測相關(guān)參數(shù)的正常值,如果實際觀測值與預測值的差異超過預設閾值,則觸發(fā)報警。在一個實施例中,區(qū)檔案局通過監(jiān)控系統(tǒng)發(fā)現(xiàn)A鄉(xiāng)鎮(zhèn)檔案室的溫度異常升高。系統(tǒng)自動觸發(fā)報警,區(qū)檔案局立即通知A鄉(xiāng)鎮(zhèn)進行檢查,及時發(fā)現(xiàn)并修復空調(diào)故障,避免可能造成的檔案損壞。[0072]進一步地,對下級檔案室的重要操作進行遠程審批??梢栽O置需要遠程審批的操作類型,如機密檔案調(diào)閱、大批量檔案銷毀等。上級管理員通過系統(tǒng)接收審批請求,并進行遠程審核,審批結(jié)果實時反饋給下級檔案室。[0073]審批流程模型可以包括但不限于使用有限狀態(tài)機(FSM)來控制審批流程:[0074]狀態(tài)集合S={待提交,待審批,初審中,復審中,終審中,已通過,已拒絕,已撤回,已過期};[0075]輸入集合I={提交申請,撤回申請,初審通過,初審拒絕,復審通過,復審拒絕,終審通過,終審拒絕,超時};[0076]轉(zhuǎn)換函數(shù)δ(s,i)可以定義如下:[0077]δ(待提交,提交申請)=待審批;[0078]δ(待審批,撤回申請)=已撤回;[0079]δ(待審批,初審通過)=復審中;[0080]δ(待審批,初審拒絕)=已拒絕;[0081]δ(復審中,復審通過)=終審中;[0082]δ(復審中,復審拒絕)=已拒絕;[0083]δ(終審中,終審通過)=已通過;[0084]δ(終審中,終審拒絕)=已拒絕;[0085]δ(任意狀態(tài),超時)=已過期。[0086]結(jié)合上述模型,審批流程可以配置為允許多個審批人同時審核,只有全部通過才進入下一階段。根據(jù)申請內(nèi)容,選擇不同的審批路徑。定義不同角色(如申請人、審批人、管理員)及其操作權(quán)限。每個審批步驟可以添加文字意見和上傳附件。設置自動提醒和催辦,對即將超時的申請自動發(fā)送提醒。引入委托審批機制,審批人可以臨時將權(quán)限委托給他人。添加審批歷史記錄,記錄每個步驟的操作人、時間、意見等信息。還可以設置審批回退功能,允許將申請退回到之前的某個步驟重新審批。同時,引入審批模板,預設常用的審批流程模板,以方便快速創(chuàng)建。例如C鄉(xiāng)鎮(zhèn)申請銷毀一批過期檔案。區(qū)檔案局可以通過遠程審批審核銷毀清單,并通過視頻監(jiān)控全程監(jiān)督銷毀過程,以確保合規(guī)操作。[0087]通過遠程監(jiān)管功能,可以提高監(jiān)管效率,實現(xiàn)了24/7全天候監(jiān)管,大大提高了監(jiān)管[0088]圖2為本申請實施例提供的一種檔案檢索方法的流程示意圖。本單元采用多階段平均文檔長度,δ表示BM25+算法中的額外參數(shù),Hammin間的漢明距離,Encoding()表示將文檔或查詢轉(zhuǎn)換為多維編碼,MaxDistance表示兩個編time表示文檔的創(chuàng)建或最后修改時間。[0102]具體而言,本申請實施例融合多特征的相似度計算方法考慮了文本內(nèi)容相似度、屬性相似度和時間相關(guān)性。[0103]文本相似度采用改進的BM25算法:[0105]屬性相似度基于檔案的多維編碼計算:[0107]時間相關(guān)性考慮檔案的時效性:[0108]Time\_relevance(d)=exp(-λ·(current\_time-document\_time)),[0109]最終相似度為三者的加權(quán)和:[0111]a·BM25(d,q)+β·Simttr(d,q)+γ·Time\_relevance(d),[0112]其中a,β,γ為可調(diào)節(jié)的權(quán)[0113]在步驟S205處,基于用戶權(quán)限和檔案的安全等級定義訪問控制策略,并對檢索結(jié)果進行篩選,以輸出一個或多個待選檔案的信息。具體而言,使用基于屬性的訪問控制[0115]f(user\_attribut

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論