標(biāo)準(zhǔn)解讀

《GB/T 42777-2023 基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控 知識圖譜構(gòu)建技術(shù)框架指南》為金融機(jī)構(gòu)在利用文本數(shù)據(jù)進(jìn)行金融風(fēng)險(xiǎn)防控時(shí)提供了知識圖譜構(gòu)建的技術(shù)指導(dǎo)。該標(biāo)準(zhǔn)詳細(xì)闡述了如何通過自然語言處理、信息抽取等技術(shù)手段從非結(jié)構(gòu)化或半結(jié)構(gòu)化的文本數(shù)據(jù)中提取有用的信息,并將其轉(zhuǎn)化為結(jié)構(gòu)化的知識圖譜,以支持更高效的風(fēng)險(xiǎn)識別與管理。

首先,標(biāo)準(zhǔn)定義了幾個(gè)關(guān)鍵概念,包括但不限于“文本數(shù)據(jù)”、“知識圖譜”以及“金融風(fēng)險(xiǎn)”。文本數(shù)據(jù)指任何形式的文字記錄;而知識圖譜是一種用圖模型表示的知識庫,它將實(shí)體(如公司、個(gè)人)及其關(guān)系以圖形方式展示出來;金融風(fēng)險(xiǎn)則涵蓋了信貸風(fēng)險(xiǎn)、市場風(fēng)險(xiǎn)等多種類型。

接著,《GB/T 42777-2023》介紹了基于文本數(shù)據(jù)構(gòu)建知識圖譜的基本流程,主要包括數(shù)據(jù)預(yù)處理、實(shí)體識別與鏈接、關(guān)系抽取、屬性填充及質(zhì)量評估等步驟。其中,數(shù)據(jù)預(yù)處理階段涉及清洗原始文本、去除噪聲等內(nèi)容;實(shí)體識別與鏈接旨在從文本中發(fā)現(xiàn)并關(guān)聯(lián)至已知實(shí)體;關(guān)系抽取用于捕捉實(shí)體間存在的聯(lián)系;屬性填充則是給定實(shí)體補(bǔ)充更多細(xì)節(jié)信息;最后的質(zhì)量評估確保所建圖譜符合預(yù)期要求。

此外,該文件還討論了不同應(yīng)用場景下可能遇到的具體挑戰(zhàn)及應(yīng)對策略,比如面對多源異構(gòu)數(shù)據(jù)時(shí)如何保證一致性、如何處理大規(guī)模文本數(shù)據(jù)集帶來的效率問題等。同時(shí),也強(qiáng)調(diào)了在整個(gè)過程中需遵循的數(shù)據(jù)安全和個(gè)人隱私保護(hù)原則。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2023-08-06 頒布
  • 2023-08-06 實(shí)施
?正版授權(quán)
GB/T 42777-2023基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控知識圖譜構(gòu)建技術(shù)框架指南_第1頁
GB/T 42777-2023基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控知識圖譜構(gòu)建技術(shù)框架指南_第2頁
GB/T 42777-2023基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控知識圖譜構(gòu)建技術(shù)框架指南_第3頁
GB/T 42777-2023基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控知識圖譜構(gòu)建技術(shù)框架指南_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余16頁可下載查看

下載本文檔

GB/T 42777-2023基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控知識圖譜構(gòu)建技術(shù)框架指南-免費(fèi)下載試讀頁

文檔簡介

ICS3524040

CCSA.11.

中華人民共和國國家標(biāo)準(zhǔn)

GB/T42777—2023

基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控

知識圖譜構(gòu)建技術(shù)框架指南

Financialriskpreventionandcontrolbasedontextdata—

Technicalframeworkguidelinesforknowledgegraphconstruction

2023-08-06發(fā)布2023-08-06實(shí)施

國家市場監(jiān)督管理總局發(fā)布

國家標(biāo)準(zhǔn)化管理委員會(huì)

GB/T42777—2023

目次

前言

…………………………Ⅲ

范圍

1………………………1

規(guī)范性引用文件

2…………………………1

術(shù)語和定義

3………………1

知識圖譜與風(fēng)險(xiǎn)防控概述

4………………2

整體架構(gòu)

4.1……………2

基礎(chǔ)支撐層

4.2…………………………3

數(shù)據(jù)源層

4.3……………3

知識抽取與加工層

4.4…………………3

知識管理層

4.5…………………………3

知識挖掘與分析層

4.6…………………3

風(fēng)險(xiǎn)防控應(yīng)用層

4.7……………………3

知識服務(wù)交互層

4.8……………………3

知識圖譜構(gòu)建

5……………3

構(gòu)建步驟

5.1……………3

知識抽取加工

5.2………………………4

知識存儲(chǔ)

5.3……………5

圖分析與圖挖掘

5.4……………………6

基于知識圖譜的風(fēng)險(xiǎn)防控應(yīng)用

6…………8

風(fēng)險(xiǎn)防控關(guān)鍵信息及模型

6.1…………8

典型風(fēng)險(xiǎn)防控應(yīng)用場景

6.2……………8

附錄資料性實(shí)體標(biāo)準(zhǔn)接口及參數(shù)說明示例

A()………10

附錄資料性關(guān)系標(biāo)準(zhǔn)接口及參數(shù)說明示例

B()………11

參考文獻(xiàn)

……………………13

GB/T42777—2023

前言

本文件按照標(biāo)準(zhǔn)化工作導(dǎo)則第部分標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則的規(guī)定

GB/T1.1—2020《1:》

起草

。

請注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別專利的責(zé)任

。。

本文件由全國金融標(biāo)準(zhǔn)化技術(shù)委員會(huì)歸口

(SAC/TC180)。

本文件起草單位中國銀行業(yè)協(xié)會(huì)中國標(biāo)準(zhǔn)化研究院中國工商銀行股份有限公司青島銀行股份

:、、、

有限公司蘭州銀行股份有限公司江蘇江南農(nóng)村商業(yè)銀行股份有限公司北京海致星圖科技有限公司

、、、。

本文件主要起草人高峰趙成剛仲峻鋒曹馨宇劉涌楊斌苗小軍胡正洪楊娟翟士丹劉慶

:、、、、、、、、、、。

GB/T42777—2023

基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控

知識圖譜構(gòu)建技術(shù)框架指南

1范圍

本文件給出了基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控知識圖譜與風(fēng)險(xiǎn)防控概述提供了知識圖譜構(gòu)建基于

,、

知識圖譜的風(fēng)險(xiǎn)防控應(yīng)用的指南

本文件適用于金融機(jī)構(gòu)開展基于文本數(shù)據(jù)的金融風(fēng)險(xiǎn)防控知識圖譜構(gòu)建工作

。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款其中注日期的引用文

。,

件僅該日期對應(yīng)的版本適用于本文件不注日期的引用文件其最新版本包括所有的修改單適用于

,;,()

本文件

。

信息安全技術(shù)金融信息服務(wù)安全規(guī)范

GB/T36618—2018

3術(shù)語和定義

下列術(shù)語和定義適用于本文件

。

31

.

實(shí)體entity

具有獨(dú)立邏輯含義的一類概念人事物

、、。

注例如企業(yè)自然人裁判文書標(biāo)書賬戶等

:、、、、。

32

.

關(guān)系relationship

實(shí)體與實(shí)體之間在特定時(shí)間特定行為下產(chǎn)生的聯(lián)系

、。

注例如企業(yè)實(shí)體之間的股權(quán)關(guān)系轉(zhuǎn)賬關(guān)系擔(dān)保關(guān)系等

:、、。

33

.

屬性attribute

實(shí)體或關(guān)系所具有的特性

注例如自然人的屬性包括姓名

溫馨提示

  • 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個(gè)人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打?。驍?shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
  • 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

最新文檔

評論

0/150

提交評論