醫(yī)院數(shù)據(jù)湖應用需求_第1頁
醫(yī)院數(shù)據(jù)湖應用需求_第2頁
醫(yī)院數(shù)據(jù)湖應用需求_第3頁
醫(yī)院數(shù)據(jù)湖應用需求_第4頁
醫(yī)院數(shù)據(jù)湖應用需求_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

醫(yī)院數(shù)據(jù)湖應用需求一、需求清單科研智能搜索平臺傳統(tǒng)高級搜索智能科研檢索科研學術服務平臺統(tǒng)一文獻服務科研輔助服務科研大數(shù)據(jù)分析平臺數(shù)據(jù)集管理數(shù)據(jù)初步探查數(shù)據(jù)預處理數(shù)據(jù)分析結果展示科研信息門戶網(wǎng)站科研動態(tài)科研項目空間科研結果溯源數(shù)據(jù)應用安全管控平臺科研材料簽名管理模塊數(shù)據(jù)調(diào)用行為監(jiān)控及存證模塊二、項目內(nèi)容模塊子模塊功能項技術需求數(shù)據(jù)應用1科研智能搜索平臺1.1總體要求1.1.1基于數(shù)據(jù)湖內(nèi)治理后的數(shù)據(jù)資產(chǎn),提供傳統(tǒng)及智能兩種方式進行檢索篩選,以定位其中符合特定臨床研究所需的患者、疾病等各種數(shù)據(jù);節(jié)省科研人員閱讀病歷及篩選的時間,并防止收集數(shù)據(jù)出現(xiàn)遺漏;(1)支持展示當前用戶擁有權限的科室數(shù)據(jù);(2)支持醫(yī)院可設置角色,將角色匹配上不同的查看權限;(3)支持展示治理數(shù)據(jù)的最小時間和最大時間;(4)支持展示患者、病例的統(tǒng)計數(shù)量;(5)支持提供便捷的快速關鍵詞搜索入口,通過醫(yī)療專業(yè)字典分析、切詞等技術處理,檢索出符合請求條件的病歷結果;(6)支持展示住院、急診、門診類型患者人數(shù)統(tǒng)計;(7)支持展示住院、急診、門診類型病歷統(tǒng)計數(shù)量;(8)支持數(shù)據(jù)存儲資源在各個應用統(tǒng)計維度的展示,如:從科室、臨床類、就診類型、科室/醫(yī)院運營等方面統(tǒng)計數(shù)據(jù);(9)支持查看某一專病整體患者概要信息,包括全庫患者數(shù)量,數(shù)據(jù)的時間跨度,住院總?cè)藬?shù),門診總?cè)藬?shù),性別分布,年齡分布,患者來源,就診趨勢;(10)支持查看用藥排名,手術排名,診斷排名,檢查檢驗排名,合并癥統(tǒng)計,治療方式統(tǒng)計等;(11)支持統(tǒng)計以多種形式展現(xiàn),如:連續(xù)型指標采用條形圖、柱狀圖、折線圖等圖表類型,分類型指標采用柱狀圖、餅圖等圖表類型;(12)支持特有統(tǒng)計的定制化開發(fā),如:巴塞羅那分期、TNM分期;(13)支持用戶根據(jù)自己喜好,自定義首頁內(nèi)容,各個數(shù)據(jù)項的位置;1.2傳統(tǒng)高級搜索1.2.1全文檢索:基于標準化、結構化、時序化處理后的醫(yī)療數(shù)據(jù),建立倒排索引文件,提供符合科研用戶使用習慣的快速、高相關性的全文搜索服務;(1)支持通過用藥名稱、檢驗名稱、手術名稱進行快速搜索找到目標患者;(2)支持搜索結果數(shù)據(jù)概覽,支持手術人次、住院人次、檢驗總?cè)舜?、死亡人?shù)、年齡/性別分布、就診排名;(3)支持查看患者360全景視圖;支持在人體圖中展示患者診斷、手術的部位;患者診療事件按照時間可視化展示;支持查看每個診療事件的詳情;支持查看每個診療事件的溯源文本;(4)支持搜索出來的患者加入隊列;(5)支持搜索出來的患者加入科研項目;1.2.2精確/模糊檢索:支持精確和模糊兩種檢索匹配方式,滿足用戶使用ID、描述等不同字段去檢索的各種場景;(1)支持為具體指標設置搜索條件,精確搜索患者(例如:“TNM綜合分期”包含“III期”);(2)支持納入、排除搜索,且支持兩種搜索同時作用;(3)支持搜索歷史自動留存,并且可復用;(4)支持搜索條件收藏,并且可復用;(5)支持多個搜索條件之間的“并且”、“或者”關系靈活切換;(6)支持同患者、同就診兩種維度查詢;(7)支持為搜索條件添加組,并且每個組之間的“并且”、“或者”關系靈活切換;(8)支持不同類型數(shù)據(jù)不同搜索規(guī)則,數(shù)值型指標采用“大于”、“小于”、“等于”等規(guī)則,文本型指標采用“等于”、“包含”、“不包含”等規(guī)則;(9)支持在搜索條件上添加“首次”、“末次”的限定條件(例如:首次診斷名稱包含“肝惡性腫瘤”);(10)支持計算全部條件節(jié)點綜合搜索出的總患者數(shù)量;(11)支持計算每個組搜索出的患者數(shù)量;(12)支持計算每個條件節(jié)點上搜索出的患者數(shù)量;1.2.3組合嵌套搜索:以條件樹形式可視化直觀展示搜索內(nèi)容,支持拖拽方式快速配置醫(yī)學復雜邏輯關系的多層級嵌套查詢條件,匹配查詢結果集,輔助開展回顧性研究;(1)支持多條件組合,精確定義T0事件;(2)支持基于T0事件,在其前后添加多個限定條件;(3)靈活配置事件前后多個條件之間的關系(例如:滿足任意條件,滿足全部條件);(4)支持多條件搜索,添加新事件搜索時可選擇空白搜索或復制上一個事件搜索;(5)支持在添加其他事件時,有示意圖展示與T0事件的關系;1.2.4排序/篩選輔助功能:支持用戶對搜索結果按照時間、科室、主管醫(yī)生、患者信息等多種維度進行排序或二次過濾篩選;1.3智能科研檢索1.3.1問答模式智能搜索:基于科研用戶實際科研或管理需求,提供自然語音問答模式的智能搜索功能,實現(xiàn)如“二次化療后,心肌酶顯著升高的患者”,“本科室去年口服抗生素劑量在2片以上的患者”,“產(chǎn)檢連續(xù)2次血壓在140/90mmHg以上的患者”等復雜化搜索意圖,能快速智能化返回用戶搜索結果;1.3.2搜索結果分析:提供結果數(shù)據(jù)特征分布分析展示,滿足科研用戶對數(shù)據(jù)集質(zhì)量的預分析需求;1.4智能問答1.4.1智能問答:可以針對患者常見的關于不同??频目破招约敖】倒芾韱栴}提供醫(yī)生級專業(yè)回答;1.4.2科普問答:針對患者的科普性問題,提供疾病分類、診斷依據(jù)、檢驗檢查及用藥推薦等問題進行智能回答;2科研學術服務平臺2.1總體要求提供一站式的醫(yī)學文獻數(shù)據(jù)庫查詢?nèi)肟?,并提供各個領域的科研熱點、文獻分布、研究趨勢等科研輔助服務;2.2統(tǒng)一文獻服務支持Pubmed、CNKI、萬方等常用醫(yī)學數(shù)據(jù)庫的統(tǒng)一賬號管理及登錄服務,解決科研用戶需要多平臺切換、文獻分散等問題,實現(xiàn)中外醫(yī)學文獻、指南應搜盡搜;2.3科研輔助服務2.3.1科研熱點分析:對權威醫(yī)學文獻數(shù)據(jù)庫、課題庫信息進行專項抽取分析,提煉出各個領域的科研熱點,讓科研用戶快速、實時了解業(yè)內(nèi)狀態(tài);2.3.2研究趨勢分析:結合歷年的文獻分布、科研熱點以及行業(yè)資訊,對研究趨勢進行預測,為科研學術方向提供指導;2.3.3文獻解讀:支持根據(jù)文獻的原文,提取文獻中的核心思想并總結生成摘要及關鍵字;2.3.4大模型能力:基于大模型技術支持對文獻內(nèi)容的核心思想進行總結并提煉出關鍵信息;2.3.5自動提取文獻摘要:系統(tǒng)能夠根據(jù)論文原文理解并總結提取文章的核心思想,形成一段摘要;摘要結果必須包含文獻中的疾病、數(shù)據(jù)模態(tài)、方法、結論等關鍵信息;2.3.6自動提取文獻關鍵字:支持多個維度提取文章中的關鍵字,包括疾病種類、文獻類型、證據(jù)等級、中心設置、研究人群、樣本量、對照設置、模態(tài)類型、算法模型、數(shù)據(jù)集、是否開源等十幾種維度;3科研大數(shù)據(jù)分析平臺3.1總體要求基于數(shù)據(jù)湖內(nèi)豐富、規(guī)整的各領域數(shù)據(jù)資產(chǎn),搭建數(shù)據(jù)分析平臺滿足科研用戶在診斷、治療、預后等不同階段的科研數(shù)據(jù)分析需要;3.2數(shù)據(jù)集管理3.2.1湖內(nèi)數(shù)據(jù)集:科研賬號下已授權的數(shù)據(jù)湖內(nèi)數(shù)據(jù)集,可通過配置相關庫表信息,直接獲取對應數(shù)據(jù)進行操作;3.2.2離線數(shù)據(jù)集:用戶也可以上傳自有的文件數(shù)據(jù),支持Excel等多種格式導入,數(shù)據(jù)上傳后,將保存在數(shù)據(jù)湖私有化目錄中僅供當前賬號使用;(1)支持數(shù)據(jù)導出:導出格式支持SPSS、Excel、CSV;支持為待導出的指標限定時間階段,導出特定一次的值(例如:首次診斷名稱包含“單純性皰疹”的當次就診內(nèi)“末次”C反應蛋白的值);支持階段內(nèi)多種指標導出規(guī)則:首次、末次、最大值、最小值、平均值、求和、所有值等;(2)支持在檢驗、用藥的變量后面增加天數(shù)(例如:入院后持續(xù)服用“拜新同”多少天);(3)導出數(shù)據(jù)時支持使用概念集合進行設置,導出的數(shù)據(jù)中可查看相應概念集合的結果N/Y;保留所有用戶的數(shù)據(jù)導出記錄,便于管理;3.3數(shù)據(jù)初步探查3.3.1基礎統(tǒng)計指標:均值、方差、極值等;(1)支持數(shù)據(jù)檢索出來的患者直接添加到項目中作為研究對象,支持已有隊列的患者添加到項目中作為研究對象;研究對象支持剔除和增量加入;(2)支持根據(jù)科研需要,提取不同觀測指標,且可以設置觀測指標的基線時間,支持首次末次(例如:首次TACE術結束時間之后30天內(nèi));(3)支持觀測指標的數(shù)據(jù)預覽;(4)支持觀測指標的數(shù)據(jù)質(zhì)量檢查,可選擇全部指標進行檢查;(5)觀測指標支持實時自動保存;(6)支持對研究對象某些觀測指標的缺失值進行均數(shù)/中位數(shù)/隨機數(shù)/刪除替換;3.3.2分布分析:展示變量各種取值的分布情況,判斷是否存在異常值與分布合理性;3.3.3關聯(lián)分析:對不同變量的之間的相關性進行探索,輔助確立研究方向;(1)支持用韋恩圖分析患者人群;(2)支持隊列中的患者加入到科研項目;(3)符合篩選條件的患者自動更新到隊列;(4)支持在隊列中進行二次篩選,可對篩選出的患者另存為隊列;(5)支持患者列表字段自定義顯示配置;(6)隊列內(nèi)患者的可視化管理,如疾病、檢驗、檢查、手術、用藥信息等;(7)支持數(shù)據(jù)導出;3.4數(shù)據(jù)預處理3.4.1數(shù)據(jù)清洗:包括正常的增、刪、改、查以及字段合并、數(shù)據(jù)篩選、數(shù)據(jù)類型轉(zhuǎn)換、異常值刪除等常用的清洗功能;(1)支持數(shù)據(jù)清洗,包括數(shù)據(jù)缺失、數(shù)據(jù)重復、數(shù)據(jù)不準確等常見問題解決;(2)支持患者主索引管理;3.4.2特征工程:主要包括缺失值的處理、歸一化、特征編碼等步驟;(1)支持數(shù)據(jù)結構化和標準化處理;(2)支持SNOMEDCT術語體系;(3)支持OMOP通用數(shù)據(jù)模型;(4)支持數(shù)據(jù)完整性、一致性、準確性、一致性校驗;3.5數(shù)據(jù)分析3.5.1預制模板分析:內(nèi)置多種統(tǒng)計分析及機器學習模型模板,通過拖拉拽等可視化交互方式對模型進行配置,快速驗證實驗推論;3.5.2支持多模態(tài)AI科研,提供自定義的AI智能訓練工具,用戶可以自行選取多模態(tài)并上傳,系統(tǒng)底層由內(nèi)嵌的自動化深度學習訓練模型支撐,科研所需要的項目訓練及模型數(shù)據(jù)生成工作;支持開源的機器學習、深度學習框架搭建,支持多種不同的訓練算法;(1)支持訓練數(shù)據(jù)集管理平臺可建立標準的訓練數(shù)據(jù)集,或?qū)胪獠炕蛐袠I(yè)標準訓練數(shù)據(jù)集,訓練時數(shù)據(jù)集分成兩個部分:一部分用來做訓練,即訓練集;另一部分用來做驗證,即測試集;為研究人員提供訓練數(shù)據(jù)和驗證數(shù)據(jù);(2)支持模型訓練支持選擇模型,選擇對應的數(shù)據(jù)集和對應的訓練參數(shù)(如AI算法以及超參數(shù)、評價指標、訓練數(shù)據(jù)配置等)即可開始進行模型訓練;(3)支持訓練可視化①支持單模態(tài)模型可視化的展示,幫助研究人員了解當前訓練任務的進度,以便對損失度停止下降或者其他異常等不符合預期的模型訓練任務進行暫停、取消等操作;②支持多模態(tài)訓練可視化(全流程展示、節(jié)點進度展示)、幫助研究人員了解當前訓練任務的進度以及預計時間,對訓練過程進行把控,可對訓練任務進行暫停、取消等操作;(4)支持模型驗證模型訓練完成后,支持對訓練集的數(shù)據(jù)進行驗證,得出模型、精確率、召回率等指標,評估模型效果和質(zhì)量;支持可以選取未標注的驗證數(shù)據(jù)集用模型進行識別,對模型的質(zhì)量進行驗證;(5)支持模型管理①初始的模型資源可通過外部文件導入或者直接新增訓練任務生成;管理主要針對模型的版本、模型的各種狀態(tài)(服務狀態(tài)、訓練狀態(tài))、模型的操作記錄、模型的詳細參數(shù)等四個方面進行;②支持通過模型管理工具對模型進行操作,如暫停服務,復制模型、發(fā)布模型、刪除模型等操作;(6)模型發(fā)布支持模型發(fā)布功能,模型發(fā)布后經(jīng)審核即可支持對接CDSS系統(tǒng),對前瞻性數(shù)據(jù)進行驗證;(7)支持訓練提醒支持配置化模型訓練或者特征提取的提醒模式,包括但不局限于站內(nèi)提醒和短信提醒;3.5.3分析腳本分析:支持python、R等多種語言的分析腳本的部署與運行,方便高級科研用戶進行特定場景的分析需要;3.6結果展示3.6.1數(shù)據(jù)可視化:提供直方圖、散點圖、箱型圖等多種圖表供數(shù)據(jù)結果展示使用,系統(tǒng)會根據(jù)分析模型自動選擇適合的圖表類型,用戶也可根據(jù)需要選擇其他個性化的圖表;3.6.2分析報告:系統(tǒng)根據(jù)分析結果自動生成相應的分析報告;該報告符合常規(guī)統(tǒng)計分析軟件(spss、sas)的分析結果,可直接應用于論文寫作及科研項目中;(1)支持用戶在創(chuàng)建項目,數(shù)據(jù)收集后,直接在平臺上進行數(shù)據(jù)統(tǒng)計;支持相關分析、單因素分析、描述性分析、多因素分析、生存分析統(tǒng)計;統(tǒng)計分析結果可保存、方便管理科研成果;(2)支持描述性統(tǒng)計,為科研項目中的變量進行基本統(tǒng)計量的計算,如構成比、均數(shù)、標準差、中心位、方差、極值、正態(tài)性檢驗等;(3)支持單因素分析,支持單變量的單因素組間比較,目前支持t檢驗、卡方檢驗、秩和檢驗、單因素方差分析;(4)支持相關性分析,支持兩變量間的相關性分析,目前支持線性相關、秩相關;(5)支持多因素分析支持邏輯回歸、線性回歸;(6)支持生存分析支持Cox回歸;(7)支持分析結果在線展示;支持分析結果采用三線表進行基線信息展示;支持傾向評分匹配;3.7病案撰寫3.7.1總體要求:支持根據(jù)患者的入院記錄進行特征摘要自動生成首次病程記錄,同時支持根據(jù)患者從入院到出院的電子病歷記錄自動生成出院小結;3.7.2自動生成首次病程:系統(tǒng)支持院內(nèi)業(yè)務系統(tǒng)內(nèi)收錄的患者入院記錄進行病例特征摘要,摘要包含對患者存在的重要診斷依據(jù)(包括影像、病理、檢驗檢查中的異?;蚪Y論信息),并且給出診療建議;3.7.3自動生成病案小結:系統(tǒng)支持對院內(nèi)業(yè)務系統(tǒng)收錄的患者從入院到出院前的電子病歷記錄(包括入院記錄、病程記錄、手術記錄)進行總結;4科研信息門戶網(wǎng)站4.1總體要求建立一個全方位的科研信息門戶網(wǎng)站,使每個科研用戶快速查看、管理自己的科研分析項目,也為采購人科研管理層提供一個全局的管理工具;4.2科研交流門戶提供科研平臺的介紹、操作手冊、注意事項等信息的發(fā)布;也提供一個討論平臺供院內(nèi)外的科研用戶發(fā)布資料及提問,進行學術討論交流;4.3科研項目治理4.3.1可以按時間、科室、角色、項目活躍度等不同維度,對科研項目的病歷、隊列等主體進行監(jiān)控,進而優(yōu)化科研資源投入;(1)支持查看項目內(nèi)整體患者概要信息,包括全庫患者數(shù)量,數(shù)據(jù)的時間跨度,住院總?cè)藬?shù),門診總?cè)藬?shù),性別分布,年齡分布,患者來源,就診趨勢;(2)支持查看用藥排名,手術排名,巴塞羅那分期,綜合分期,TNM分期,組織學類型,是否遠處轉(zhuǎn)移,是否靶向治療等;(3)支持統(tǒng)計以多種形式展現(xiàn),如:連續(xù)型指標采用條形圖、柱狀圖、折線圖等圖表類型,分類型指標采用柱狀圖、餅圖等圖表類型;(4)支持特有統(tǒng)計的定制化開發(fā);4.4科研可信認證確??蒲许椖康恼鎸嵭?、可靠性和可追溯性至關重要;為此,構建一套完善且嚴謹?shù)目蒲许椖靠尚耪J證體系,該體系能夠為科研項目提供從數(shù)據(jù)采集、分析處理到最終結果呈現(xiàn)的全流程可信認證服務;在數(shù)據(jù)階段,系統(tǒng)會對科研項目所涉及的各類原始數(shù)據(jù)進行嚴格審核與認證;無論是通過實驗儀器直接獲取的觀測數(shù)據(jù),還是從各類數(shù)據(jù)庫中收集整理的二手數(shù)據(jù),都會被逐一標記其來源、采集時間、采集方法以及數(shù)據(jù)質(zhì)量等關鍵信息;這些信息將被加密存儲在安全可靠的數(shù)據(jù)庫中,形成數(shù)據(jù)的“數(shù)字指紋”,確保數(shù)據(jù)的真實性和完整性;同時,系統(tǒng)會運用先進的區(qū)塊鏈技術,將數(shù)據(jù)的每一次修改、訪問和傳輸都記錄在不可篡改的分布式賬本上,為后續(xù)的溯源提供堅實基礎;當進入數(shù)據(jù)分析階段,可信認證體系會對所使用的分析方法、算法模型以及相關參數(shù)進行詳細記錄和認證;科研人員所采用的每一種分析工具和技術手段都必須經(jīng)過嚴格的驗證和備案,確保其科學性和合理性;在分析過程中,系統(tǒng)會實時監(jiān)控數(shù)據(jù)處理流程,對每一個中間結果進行校驗和存檔,防止數(shù)據(jù)在分析環(huán)節(jié)出現(xiàn)錯誤或被惡意篡改;一旦發(fā)現(xiàn)異常情況,系統(tǒng)將立即發(fā)出警報,并追溯問題源頭,確保數(shù)據(jù)分析的準確性和可靠性;在得出最終結果后,系統(tǒng)會對科研成果進行全面、細致的審核和認證;這不僅包括對研究結論的科學性、創(chuàng)新性進行評估,還會對成果的呈現(xiàn)形式、引用文獻等方面進行嚴格把關;只有通過層層審核的科研成果,才會被賦予全網(wǎng)唯一的認證密鑰;這個全網(wǎng)唯一的認證密鑰是科研項目可信認證的核心標識,它就像一把“數(shù)字鑰匙”,貫穿于科研項目的整個生命周期;在后期科研溯源過程中,該密鑰發(fā)揮著至關重要的作用;科研人員、評審專家以及相關監(jiān)管部門可以通過這個密鑰,輕松追溯科研項目從數(shù)據(jù)采集到結果產(chǎn)出的每一個環(huán)節(jié);無論是查看原始數(shù)據(jù)的詳細信息,還是了解數(shù)據(jù)分析的具體過程,都能做到一目了然;這種透明化的溯源機制,使得科研過程完全暴露在陽光下,有效防止學術造假行為的發(fā)生;同時,全網(wǎng)唯一的認證密鑰還具有強大的防偽和防盜用功能;一旦密鑰被非法使用或篡改,系統(tǒng)將立即識別并觸發(fā)安全警報,及時阻止任何未經(jīng)授權的操作;這不僅保障了科研成果的真實性和權威性,也為科研工作者的知識產(chǎn)權提供了有力保護,營造了一個公平、公正、誠信的科研環(huán)境;5數(shù)據(jù)應用安全管控平臺5.1科研材料簽名管理模塊認證材料扮演著至關重要的角色,其真實性、可靠性以及可追溯性直接關系到整個認證過程的可信度和有效性;為滿足嚴格且復雜的認證需求,創(chuàng)新性地引入了可信簽名技術,并圍繞參與人、貢獻人等關鍵主體,形成了一套完善且高效的溯源與認證管理機制;在認證材料處理流程中,每一位參與人都被賦予了獨一無二的身份標識,憑借先進的數(shù)字加密技術,這些參與人能夠憑借自身私鑰對認證材料進行可信簽名;這一簽名過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論