DB34∕T 4555-2023 兒童智能指讀技術(shù)規(guī)范_第1頁
DB34∕T 4555-2023 兒童智能指讀技術(shù)規(guī)范_第2頁
DB34∕T 4555-2023 兒童智能指讀技術(shù)規(guī)范_第3頁
免費預(yù)覽已結(jié)束,剩余3頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

ICS35.240.01

CCSL77

34

安徽省地方標(biāo)準(zhǔn)

DB34/T4555—2023

兒童智能指讀技術(shù)規(guī)范

Specificationforintelligentfinger-pointingtechnicalofchildren

2023-10-07發(fā)布2023-11-07實施

安徽省市場監(jiān)督管理局發(fā)布

DB34/T4555—2023

前言

本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定

起草。

請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別專利的責(zé)任。

本文件由安徽淘云科技股份有限公司提出。

本文件由安徽省經(jīng)濟(jì)和信息化廳歸口。

本文件起草單位:安徽淘云科技股份有限公司、科大訊飛股份有限公司、安徽工程大學(xué)計算機(jī)與信

息學(xué)院、合肥巴靈瑞教育科技有限公司、合肥赑歌數(shù)據(jù)科技有限公司、安徽長三角數(shù)據(jù)感知與治理研究

院、江蘇理工學(xué)院、合肥師范學(xué)院、合肥智能語音創(chuàng)新發(fā)展有限公司。

本文件主要起草人:朱翠玲、劉慶升、王曉斐、葉娟、方明、葉劍鳴、陶皖、陳慧珺、毛四方、呂

雪、胡連峰、宋若淼、王忍寶、姜志文、孫艷、張澤之、武方芳。

I

DB34/T4555—2023

兒童智能指讀技術(shù)規(guī)范

1范圍

本文件規(guī)定了兒童智能指讀技術(shù)的術(shù)語和定義、技術(shù)路線和要求。

本文件適用于兒童智能指讀技術(shù)的應(yīng)用。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,

僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本

文件。

GB/T34053.3紙質(zhì)印刷產(chǎn)品印制質(zhì)量檢驗規(guī)范第3部分:圖書期刊

GB/T34053.4紙質(zhì)印刷產(chǎn)品印制質(zhì)量檢驗規(guī)范第4部分:中小學(xué)教科書

GB/T34053.5紙質(zhì)印刷產(chǎn)品印制質(zhì)量檢驗規(guī)范第5部分:報紙

GB/T36480-2018信息技術(shù)緊縮嵌入式攝像頭通用規(guī)范

3術(shù)語和定義

下列術(shù)語和定義適用于本文件。

智能指讀技術(shù)Intelligentfinger-pointing

基于手指檢測、圖像檢索、圖文識別、熱區(qū)匹配等技術(shù),通過TTS或其他信息映射技術(shù),將讀物內(nèi)

容輸出為語音或文本的一種人機(jī)交互技術(shù)。

指向詞技術(shù)Directionalwordtechnology

基于指尖檢測模型對攝像頭獲取的圖像進(jìn)行處理,提取指尖位置信息,獲取指尖處文字區(qū)域,經(jīng)圖

文識別輸出數(shù)據(jù)的一種人機(jī)交互技術(shù)。

點讀技術(shù)Clickreadingtechnology

基于指尖檢測模型對攝像頭獲取的圖像進(jìn)行處理,提取指尖位置信息,利用檢索模型檢索當(dāng)前讀物

信息,結(jié)合指尖位置信息做熱區(qū)匹配相關(guān)交互處理,輸出數(shù)據(jù)的一種人機(jī)交互技術(shù)。

4技術(shù)路線

兒童智能指讀技術(shù)路線見圖1。

1

DB34/T4555—2023

圖1兒童智能指讀技術(shù)路線

5要求

圖像采集

5.1.1概述

采集設(shè)備上的攝像頭對放置在設(shè)備拍攝工作范圍內(nèi)放置的讀物進(jìn)行拍攝采像。

5.1.2采集讀物要求

讀物具體要求見表1。

表1讀物要求

序號項目指向詞技術(shù)點讀技術(shù)

適用于滿足GB/T34053.3、GB/T34053.4和適用于GB/T34053.4中規(guī)定的教材、教

1讀物范圍

GB/T34053.5中規(guī)定的質(zhì)量要求的印刷材料輔、繪本等印刷材料

最大可以支持2號字體

2字號要求—

最小可以支持6號字體

適用字體中文包括但不限于宋體、楷體及隸書

3字體要求等,英文應(yīng)包括但不限于TimesNewRoman、—

Arial及Calibri等。

4讀物位置讀物應(yīng)置于設(shè)備的拍攝工作范圍內(nèi)

5.1.3采集設(shè)備要求

5.1.3.1攝像頭幾何失真要求

攝像頭的幾何失真應(yīng)滿足GB/T36480-2018中6.4.7幾何失真的要求。

2

DB34/T4555—2023

5.1.3.2裝配尺寸要求

攝像頭與產(chǎn)品手板裝配時,確保攝像頭安裝配合尺寸的一致性。

5.1.3.3圖像質(zhì)量要求

圖像應(yīng)滿足色彩質(zhì)量、清晰度和分辨率的要求,詳細(xì)內(nèi)容見表2。

表2色彩質(zhì)量、清晰度和分辨率的要求

序號項目具體要求

1色彩質(zhì)量RGB三通道數(shù)據(jù)能還原出所拍攝的拍攝對象真實色彩信息。

2清晰度在6號字,A3紙中字體輪廓清晰可見。

3分辨率在6號字,中文字符所占像素不少于50×50。

5.1.4手指要求

5.1.4.1手勢要求

單手指指向讀物內(nèi)容。

5.1.4.2手指位置

在指向詞應(yīng)用場景中,手指指著讀物上的內(nèi)容下方;在點讀應(yīng)用場景中,手指指著讀物上的內(nèi)容。

5.1.4.3指讀精度

手指檢測定位精度不超過5號字一個字符的寬度。

5.1.5環(huán)境光要求

環(huán)境光亮度應(yīng)滿足以下要求:

——不應(yīng)在拍攝對象的表面形成反光;

——環(huán)境光亮度不能太暗,導(dǎo)致拍攝圖像不清晰。

區(qū)域判定

5.2.1概述

把攝像頭拍攝的圖像送入指尖檢測模型進(jìn)行圖像處理,并在處理后的圖像中提取用戶手指指尖在

讀物上的位置信息,并根據(jù)位置信息判定是指向詞還是點讀。

5.2.2圖像處理

5.2.2.1對采集圖像的外圍區(qū)域進(jìn)行切除處理,去除無效邊界區(qū)域,但不能去除含有讀物的圖像。

5.2.2.2對采集圖像進(jìn)行縮放處理,以提升檢測效率和指尖定位精度。

5.2.2.3對采集圖像進(jìn)行轉(zhuǎn)碼處理,以滿足手指檢測模型的檢測需要。

5.2.3提取位置信息

5.2.3.1應(yīng)包含對手指圖像的穩(wěn)定性檢測判斷,以保證手指指尖位置信息提取的準(zhǔn)確性。

5.2.3.2通過指尖位置信息判斷用戶意圖是使用指向詞功能還是使用點讀功能。

3

DB34/T4555—2023

5.2.3.3指尖檢測模型的訓(xùn)練數(shù)據(jù)應(yīng)包含兒童應(yīng)用的各種場景,場景包括但不限于不同年級學(xué)生、不

同膚色手指及不同指甲顏色等。

5.2.3.4指尖檢測模型的總訓(xùn)練數(shù)據(jù)不少于100萬條,并按照均等化的比例分配在各種場景中。

識別和搜索

5.3.1概述

5.3.1.1根據(jù)位置信息判定是指向詞功能,則執(zhí)行識別應(yīng)用功能。

5.3.1.2根據(jù)位置信息判定是點讀功能,則實行搜索應(yīng)用功能。

5.3.2識別

5.3.2.1識別過程

根據(jù)指尖位置信息,裁剪指尖處文字區(qū)域圖片,文字區(qū)域圖片要覆蓋指尖處的字或詞;然后使用預(yù)

訓(xùn)練好的識別模型對指尖處文字區(qū)域圖片進(jìn)行文字信息識別,獲得可讀文字信息。

5.3.2.2識別模型

識別模型的訓(xùn)練數(shù)據(jù)應(yīng)含有不同背景信息、不同文字大小及不同字體類型等;且總數(shù)據(jù)不少于100

萬條,并且按照均等化的比例進(jìn)行分配。

5.3.2.3文字背景

文字所在讀物的背景信息應(yīng)多樣化,包括彩色和非彩色背景等。

5.3.3搜索

5.3.3.1搜索過程

利用檢索模型通過采集圖像檢索當(dāng)前的讀物信息,然后結(jié)合指尖信息和讀物信息做熱區(qū)匹配,確定

用戶指讀的區(qū)域在讀物中的位置信息。

5.3.3.2搜索模型

模型訓(xùn)練應(yīng)支持各種場景的書籍,包括純文字書

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論