CN113822143B 文本圖像的處理方法、裝置、設(shè)備以及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第1頁
CN113822143B 文本圖像的處理方法、裝置、設(shè)備以及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第2頁
CN113822143B 文本圖像的處理方法、裝置、設(shè)備以及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第3頁
CN113822143B 文本圖像的處理方法、裝置、設(shè)備以及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第4頁
CN113822143B 文本圖像的處理方法、裝置、設(shè)備以及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利(22)申請日2021.07.30(43)申請公布日2021.12.21科技中一路騰訊大廈35層專利代理師張筱寧GO6V30/40(2022.01)GO6V30/14(2022.01)GO6V30/19(2022.01)(56)對比文件審查員徐夢引權(quán)利要求書6頁說明書18頁附圖5頁介質(zhì)本申請實施例提供了一種文本圖像的處理方法、裝置、設(shè)備以及存儲介質(zhì),可適用于圖像處理、云計算以及人工智能等領(lǐng)域。該方法包括:提區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位文本區(qū)域的排序結(jié)果獲取各文本區(qū)域的文本識2提取待處理文本圖像的初始特征圖;根據(jù)所述初始特征圖,確定所述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征;對于每個所述文本區(qū)域,將所述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到所述文本區(qū)域的區(qū)域特征;基于包含各所述文本區(qū)域的區(qū)域特征的特征序列,預(yù)測所述特征序列中各所述區(qū)域特征在每個時間步所對應(yīng)的概率,基于各所述區(qū)域特征在每個時間步所對應(yīng)的概率,確定各所述文本區(qū)域的排序結(jié)果;其中,一個所述區(qū)域特征在一個時間步所對應(yīng)的概率表征了對應(yīng)于該時間步,該區(qū)域特征對應(yīng)的文本區(qū)域在各所述文本區(qū)域中的排序的概率,所述排序結(jié)果表征了各所述文本區(qū)域的文本識別結(jié)果的輸出順序;獲取各所述文本區(qū)域的文本識別結(jié)果,基于所述排序結(jié)果將各所述文本區(qū)域的文本識別結(jié)果進(jìn)行排序,得到所述待處理文本圖像的文本識別結(jié)果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述初始特征圖,確定所述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征,基于所述初始特征圖中各特征點的位置,確定所述初始特征圖中各特征點之間的位置基于所述初始特征圖中各特征點的特征值、以及所述初始特征圖中各特征點之間的位置關(guān)系,對所述初始特征圖進(jìn)行特征提取,得到根據(jù)所述目標(biāo)特征圖,確定所述目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,所述分類結(jié)果表征了所述目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域;根據(jù)所述目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,確定所述目標(biāo)特征圖中的至少一個文本區(qū)域;對于每個所述文本區(qū)域,根據(jù)所述文本區(qū)域在所述目標(biāo)特征圖中所對應(yīng)的各特征點的特征值,確定所述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征,根據(jù)所述文本區(qū)域在所述目標(biāo)特征圖中所對應(yīng)的各特征點的位置,確定所述文本區(qū)域?qū)?yīng)的空間位置特征。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述初始特征圖中各特征點的位基于所述初始特征圖中各特征點的位置,確定所述初始特征圖中各特征點之間的距所述基于所述初始特征圖中各特征點的特征值、以及所述初始特征圖中各特征點之間基于所述初始特征圖中各特征點的特征值、以及所述初始特征圖中各特征點之間的距個特征點對應(yīng)于所述圖結(jié)構(gòu)中的一個節(jié)點,所述距離小于或等于設(shè)定值的特征點所對應(yīng)的節(jié)點之間具有連邊。4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述目標(biāo)特征圖包括多個通道的特征圖,對于每個所述文本區(qū)域,所述根據(jù)所述文本區(qū)域在所述目標(biāo)特征圖中所對應(yīng)的各特征點的3將所述文本區(qū)域在所述目標(biāo)特征圖中所對應(yīng)的各特征點中同一通道的特征值進(jìn)行融基于所述文本區(qū)域?qū)?yīng)的融合特征值,確定所述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于包含各所述文本區(qū)域的區(qū)域特征的特征序列,預(yù)測所述特征序列中各所述區(qū)域特征在每個時間步所對應(yīng)的概率,包括:對所述特征序列中各所述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到所述特征序列的編碼結(jié)果;對于每個時間步,基于所述編碼結(jié)果和該時間步所對應(yīng)的歷史輸出結(jié)果,預(yù)測各所述區(qū)域特征在該時間步所對應(yīng)的概率;其中,第一個時間步所對應(yīng)的歷史輸出結(jié)果為預(yù)設(shè)特征,除第一個時間步之外的每個時間步,該時間步對應(yīng)的歷史輸出結(jié)果包括該時間步的上一時間步所對應(yīng)的預(yù)測結(jié)果,所述預(yù)測結(jié)果是基于所述上一時間步所對應(yīng)的各概率中最大概率對應(yīng)的文本區(qū)域的區(qū)域特征確定的。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對所述特征序列中各所述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到所述特征序列的編碼結(jié)果,包括:對所述特征序列中各所述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到各所述區(qū)域特征的對應(yīng)的隱狀態(tài)特征和所述特征序列的編碼結(jié)果;所述對于每個時間步,基于所述編碼結(jié)果和該時間步所對應(yīng)的歷史輸出結(jié)果,預(yù)測各所述區(qū)域特征在該時間步所對應(yīng)的概率,包括:對于每個時間步,基于所述編碼結(jié)果和該時間步對應(yīng)的歷史輸出結(jié)果,確定該時間步對應(yīng)的第一特征;對各所述隱狀態(tài)特征進(jìn)行特征提取,得到各所述區(qū)域特征對應(yīng)的第二特征,根據(jù)各所述區(qū)域特征對應(yīng)的第二特征和所述第一特征的相關(guān)性,得到各所述區(qū)域特征在該時間步所對應(yīng)的概率。7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取各所述文本區(qū)域的文本識別結(jié)對于每個所述文本區(qū)域,基于所述文本區(qū)域的文本內(nèi)容特征,得到所述文本區(qū)域的文本識別結(jié)果。8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述初始特征圖,確定所述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征、以及所述對于每個所述文本區(qū)域,將所述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到所述文本區(qū)域的區(qū)域特征是通過圖處理模型實現(xiàn)的;其中,所述圖處理模型是通過以下方式確定的:獲取訓(xùn)練樣本集,所述訓(xùn)練樣本集包括至少一個樣本文本圖像,所述樣本文本圖像的文本區(qū)域和背景區(qū)域標(biāo)注有第一樣本標(biāo)簽,所述第一樣本標(biāo)簽表征了相對應(yīng)的區(qū)域?qū)儆谖谋緟^(qū)域或者背景區(qū)域的真實結(jié)果;提取各所述樣本文本圖像的樣本初始特征;對于每一所述樣本文本圖像,將所述樣本文本圖像的樣本初始特征輸入初始圖處理模型,得到所述樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點的預(yù)測分類結(jié)果,所述預(yù)測4分類結(jié)果表征了所述樣本目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域的預(yù)測結(jié)果;基于各所述樣本文本圖像的第一樣本標(biāo)簽,確定各所述樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點屬于文本區(qū)域或者背景區(qū)域的真實結(jié)果;基于所述真實結(jié)果和所述預(yù)測結(jié)果確定第一訓(xùn)練損失值,并基于所述第一訓(xùn)練損失值和所述訓(xùn)練樣本集對所述初始圖處理模型進(jìn)行訓(xùn)練,直至所述第一訓(xùn)練損失值滿足第一訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為所述圖處理模型。9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于包含各所述文本區(qū)域的區(qū)域特征的特征序列,預(yù)測所述特征序列中各所述區(qū)域特征在每個時間步所對應(yīng)的概率、以及所述基于各所述區(qū)域特征在每個時間步所對應(yīng)的概率,確定各所述文本區(qū)域的排序結(jié)果是通過文本排序模型實現(xiàn)的;其中,所述樣本文本圖像的各文本區(qū)域標(biāo)注有第二樣本標(biāo)簽,所述第二樣本標(biāo)簽表征了所述樣本文本圖像的各文本區(qū)域的真實排序結(jié)果,所述文本排序模型是通過以下方式確定的:基于所述圖處理模型確定各樣本特征序列,每一所述樣本特征序列包括一個樣本文本圖像的各文本區(qū)域的區(qū)域特征;對于每個所述樣本文本圖像,將所述樣本文本圖像對應(yīng)的樣本特征序列輸入初始文本排序模型,得到所述樣本文本圖像的文本區(qū)域的預(yù)測排序結(jié)果;基于所述真實排序結(jié)果和所述預(yù)測排序結(jié)果確定第二訓(xùn)練損失值,并基于所述第二訓(xùn)練損失值和各所述樣本特征序列對所述初始文本排序模型進(jìn)行訓(xùn)練,直至所述第二訓(xùn)練損失值滿足第二訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為所述文本排序模型。初始特征圖提取模塊,用于提取待處理文本圖像的初始特征圖;初始特征圖處理模塊,用于根據(jù)所述初始特征圖,確定所述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征;區(qū)域特征確定模塊,用于對于每個所述文本區(qū)域,將所述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到所述文本區(qū)域的區(qū)域特征;排序結(jié)果確定模塊,用于基于包含各所述文本區(qū)域的區(qū)域特征的特征序列,預(yù)測所述特征序列中各所述區(qū)域特征在每個時間步所對應(yīng)的概率,基于各所述區(qū)域特征在每個時間步所對應(yīng)的概率,確定各所述文本區(qū)域的排序結(jié)果;其中,一個所述區(qū)域特征在一個時間步所對應(yīng)的概率表征了對應(yīng)于該時間步,該區(qū)域特征對應(yīng)的文本區(qū)域在各所述文本區(qū)域中的排序的概率,所述排序結(jié)果表征了各所述文本區(qū)域的文本識別結(jié)果的輸出順序;文本排序模塊,用于獲取各所述文本區(qū)域的文本識別結(jié)果,基于所述區(qū)域排序結(jié)果將各所述文本區(qū)域的文本識別結(jié)果進(jìn)行排序,得到所述待處理文本圖像的文本識別結(jié)果。11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述初始特征圖處理模塊根據(jù)所述初始特征圖,確定所述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容基于所述初始特征圖中各特征點的位置,確定所述初始特征圖中各特征點之間的位置關(guān)系;基于所述初始特征圖中各特征點的特征值、以及所述初始特征圖中各特征點之間的位5置關(guān)系,對所述初始特征圖進(jìn)行特征提取,得到根據(jù)所述目標(biāo)特征圖,確定所述目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,所述分類結(jié)果表征了所述目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域;根據(jù)所述目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,確定所述目標(biāo)特征圖中的至少一個文本區(qū)域;對于每個所述文本區(qū)域,根據(jù)所述文本區(qū)域在所述目標(biāo)特征圖中所對應(yīng)的各特征點的特征值,確定所述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征,根據(jù)所述文本區(qū)域在所述目標(biāo)特征圖中所對應(yīng)的各特征點的位置,確定所述文本區(qū)域?qū)?yīng)的空間位置特征。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述初始特征圖處理模塊基于所述初始特征圖中各特征點的位置,確定所述初始特征圖中各特征點之間的位置關(guān)系時,用于:基于所述初始特征圖中各特征點的位置,確定所述初始特征圖中各特征點之間的距所述基于所述初始特征圖中各特征點的特征值、以及所述初始特征圖中各特征點之間基于所述初始特征圖中各特征點的特征值、以及所述初始特征圖中各特征點之間的距個特征點對應(yīng)于所述圖結(jié)構(gòu)中的一個節(jié)點,所述距離小于或等于設(shè)定值的特征點所對應(yīng)的節(jié)點之間具有連邊。13.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述目標(biāo)特征圖包括多個通道的特征圖,對于每個所述文本區(qū)域,所述區(qū)域特征確定模塊根據(jù)所述文本區(qū)域在所述目標(biāo)特征圖中所對應(yīng)的各特征點的特征值,確定所述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征時,用于:將所述文本區(qū)域在所述目標(biāo)特征圖中所對應(yīng)的各特征點中同一通道的特征值進(jìn)行融基于所述文本區(qū)域?qū)?yīng)的融合特征值,確定所述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征。14.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述排序結(jié)果確定模塊基于包含各所述文本區(qū)域的區(qū)域特征的特征序列,預(yù)測所述特征序列中各所述區(qū)域特征在每個時間步所對對所述特征序列中各所述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到所述特征序列的編碼結(jié)果;對于每個時間步,基于所述編碼結(jié)果和該時間步所對應(yīng)的歷史輸出結(jié)果,預(yù)測各所述區(qū)域特征在該時間步所對應(yīng)的概率;其中,第一個時間步所對應(yīng)的歷史輸出結(jié)果為預(yù)設(shè)特征,除第一個時間步之外的每個時間步,該時間步對應(yīng)的歷史輸出結(jié)果包括該時間步的上一時間步所對應(yīng)的預(yù)測結(jié)果,所述預(yù)測結(jié)果是基于所述上一時間步所對應(yīng)的各概率中最大概率對應(yīng)的文本區(qū)域的區(qū)域特征確定的。15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述排序結(jié)果確定模塊對所述特征序列中各所述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到所述特征序列的編碼結(jié)果時,用于:對所述特征序列中各所述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到各所述區(qū)域特征的對應(yīng)的隱狀態(tài)特征和所述特征序列的編碼結(jié)果;6所述對于每個時間步,基于所述編碼結(jié)果和該時間步所對應(yīng)的歷史輸出結(jié)果,預(yù)測各所述區(qū)域特征在該時間步所對應(yīng)的概率,包括:對于每個時間步,基于所述編碼結(jié)果和該時間步對應(yīng)的歷史輸出結(jié)果,確定該時間步對應(yīng)的第一特征;對各所述隱狀態(tài)特征進(jìn)行特征提取,得到各所述區(qū)域特征對應(yīng)的第二特征,根據(jù)各所述區(qū)域特征對應(yīng)的第二特征和所述第一特征的相關(guān)性,得到各所述區(qū)域特征在該時間步所對應(yīng)的概率。16.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述文本排序模塊獲取各所述文本區(qū)域?qū)τ诿總€所述文本區(qū)域,基于所述文本區(qū)域的文本內(nèi)容特征,得到所述文本區(qū)域的文本識別結(jié)果。17.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述根據(jù)所述初始特征圖,確定所述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征、以及所述對于每個所述文本區(qū)域,將所述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到所述文本區(qū)域的區(qū)域特征是通過圖處理模型實現(xiàn)的;其中,所述圖處理模型是模型訓(xùn)練模塊通過以下方式訓(xùn)練得到的:獲取訓(xùn)練樣本集,所述訓(xùn)練樣本集包括至少一個樣本文本圖像,所述樣本文本圖像的文本區(qū)域和背景區(qū)域標(biāo)注有第一樣本標(biāo)簽,所述第一樣本標(biāo)簽表征了相對應(yīng)的區(qū)域?qū)儆谖谋緟^(qū)域或者背景區(qū)域的真實結(jié)果;提取各所述樣本文本圖像的樣本初始特征;對于每一所述樣本文本圖像,將所述樣本文本圖像的樣本初始特征輸入初始圖處理模型,得到所述樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點的預(yù)測分類結(jié)果,所述預(yù)測分類結(jié)果表征了所述樣本目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域的預(yù)測結(jié)果;基于各所述樣本文本圖像的第一樣本標(biāo)簽,確定各所述樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點屬于文本區(qū)域或者背景區(qū)域的真實結(jié)果;基于所述真實結(jié)果和所述預(yù)測結(jié)果確定第一訓(xùn)練損失值,并基于所述第一訓(xùn)練損失值和所述訓(xùn)練樣本集對所述初始圖處理模型進(jìn)行訓(xùn)練,直至所述第一訓(xùn)練損失值滿足第一訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為所述圖處理模型。18.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述基于包含各所述文本區(qū)域的區(qū)域特征的特征序列,預(yù)測所述特征序列中各所述區(qū)域特征在每個時間步所對應(yīng)的概率、以及所述基于各所述區(qū)域特征在每個時間步所對應(yīng)的概率,確定各所述文本區(qū)域的排序結(jié)果是通過文本排序模型實現(xiàn)的;其中,所述樣本文本圖像的各文本區(qū)域標(biāo)注有第二樣本標(biāo)簽,所述第二樣本標(biāo)簽表征了所述樣本文本圖像的各文本區(qū)域的真實排序結(jié)果,所述文本排序模型是所述模型訓(xùn)練模塊通過以下方式訓(xùn)練得到的:基于所述圖處理模型確定各樣本特征序列,每一所述樣本特征序列包括一個樣本文本圖像的各文本區(qū)域的區(qū)域特征;對于每個所述樣本文本圖像,將所述樣本文本圖像對應(yīng)的樣本特征序列輸入初始文本排序模型,得到所述樣本文本圖像的文本區(qū)域的預(yù)測排序結(jié)果;基于所述真實排序結(jié)果和所述預(yù)測排序結(jié)果確定第二訓(xùn)練損失值,并基于所述第二訓(xùn)7練損失值和各所述樣本特征序列對所述初始文本排序模型進(jìn)行訓(xùn)練,直至所述第二訓(xùn)練損失值滿足第二訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為所述文本排序模型。19.一種電子設(shè)備,其特征在于,包括處理器和存儲器,所述處理器和存儲器相互連所述存儲器用于存儲計算機程序;所述處理器被配置用于在調(diào)用所述計算機程序時,執(zhí)行如權(quán)利要求1至9任一項所述的方法。20.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行以實現(xiàn)權(quán)利要求1至9任一項所述的方法。21.一種計算機程序產(chǎn)品,其特征在于,所述計算機程序產(chǎn)品包括計算機指令,所述計算機指令存儲在計算機可讀存儲介質(zhì)中,電子設(shè)備的處理器從計算機可讀存儲介質(zhì)讀取所述計算機指令,所述處理器執(zhí)行所述計算機指令,使得所述電子設(shè)備執(zhí)行權(quán)利要求1至9任一項所述的方法。8文本圖像的處理方法、裝置、設(shè)備以及存儲介質(zhì)技術(shù)領(lǐng)域[0001]本申請涉及人工智能領(lǐng)域,具體而言,本申請涉及一種文本圖像的處理方法、裝背景技術(shù)[0002]OCR(OpticalCharacterRecognition,光學(xué)字符識別)版面分析一直是一個十分用人力獲取其中的內(nèi)容信息作用十分的有限,而且成本較高,因此越來越多的OCR版面分析方法應(yīng)運而生?,F(xiàn)有的OCR版面分析方案包括基于CNN(或GCN(GraphConvolutionalNetwork,圖卷積神經(jīng)網(wǎng)絡(luò)))的文本分類器對文本中的文本、表格和圖片(或標(biāo)題,作者,摘要等)進(jìn)行分類。[0003]但是經(jīng)發(fā)現(xiàn),現(xiàn)有的OCR版面分析解決方案大都是對OCR的文本內(nèi)容進(jìn)行分類,而對離散的文本信息的整合排序在版面分析中也十分的重要,然而現(xiàn)在并沒有對離散文本的排序問題的解決方法。發(fā)明內(nèi)容[0004]本申請實施例提供一種文本圖像的處理方法、裝置、設(shè)備以及存儲介質(zhì),可對文本圖像中的文本內(nèi)容進(jìn)行有效排序,適用性高[0006]提取待處理文本圖像的初始特征圖;[0007]根據(jù)上述初始特征圖,確定上述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征;[0008]對于每個上述文本區(qū)域,將上述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到上述文本區(qū)域的區(qū)域特征;[0009]基于各上述文本區(qū)域的區(qū)域特征,確定各上述文本區(qū)域的排序結(jié)果,上述排序結(jié)果表征了各上述文本區(qū)域的文本識別結(jié)果的輸出順序;[0010]獲取各上述文本區(qū)域的文本識別結(jié)果,基于上述排序結(jié)果將各上述文本區(qū)域的文本識別結(jié)果進(jìn)行排序,得到上述待處理文本圖像的文本識別結(jié)果。[0012]初始特征圖提取模塊,用于提取待處理文本圖像的初始特征圖;[0013]初始特征圖處理模塊,用于根據(jù)上述初始特征圖,確定上述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征;[0014]區(qū)域特征確定模塊,用于對于每個上述文本區(qū)域,將上述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到上述文本區(qū)域的區(qū)域特征;[0015]排序結(jié)果確定模塊,用于基于各上述文本區(qū)域的區(qū)域特征,確定各上述文本區(qū)域的排序結(jié)果,上述排序結(jié)果表征了各上述文本區(qū)域的文本識別結(jié)果的輸出順序;9[0016]文本排序模塊,用于獲取各上述文本區(qū)域的文本識別結(jié)果,基于上述區(qū)域排序結(jié)果將各上述文本區(qū)域的文本識別結(jié)果進(jìn)行排序,得到上述待處理文本圖像的文本識別結(jié)[0018]基于上述初始特征圖中各特征點的位置,確定上述初始特征圖中各特征點之間的位置關(guān)系;[0019]基于上述初始特征圖中各特征點的特征值、以及上述初始特征圖中各特征點之間的位置關(guān)系,對上述初始特征圖進(jìn)行特征提取,得到目標(biāo)特征圖;[0020]根據(jù)上述目標(biāo)特征圖,確定上述目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,上述分類結(jié)果表征了上述目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域;[0021]根據(jù)上述目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,確定上述目標(biāo)特征圖中的至少一個文本區(qū)域;[0022]對于每個上述文本區(qū)域,根據(jù)上述文本區(qū)域在上述目標(biāo)特征圖中所對應(yīng)的各特征點的特征值,確定上述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征,根據(jù)上述文本區(qū)域在上述目標(biāo)特征圖中所對應(yīng)的各特征點的位置,確定上述文本區(qū)域?qū)?yīng)的空間位置特征。[0024]基于上述初始特征圖中各特征點的位置,確定上述初始特征圖中各特征點之間的[0025]基于上述初始特征圖中各特征點的特征值、以及上述初始特征圖中各特征點之間中每個特征點對應(yīng)于上述圖結(jié)構(gòu)中的一個節(jié)點,上述距離小于或等于設(shè)定值的特征點所對應(yīng)的節(jié)點之間具有連邊。[0027]將上述文本區(qū)域在上述目標(biāo)特征圖中所對應(yīng)的各特征點中同一通道的特征值進(jìn)行融合,得到對應(yīng)于各通道的融合特征值;[0028]基于上述文本區(qū)域?qū)?yīng)的融合特征值,確定上述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征。[0030]基于包含各上述文本區(qū)域的區(qū)域特征的特征序列,預(yù)測上述特征序列中各上述區(qū)域特征在每個時間步所對應(yīng)的概率,基于各上述區(qū)域特征在每個時間步所對應(yīng)的概率,確定各上述文本區(qū)域的排序結(jié)果;[0031]其中,一個上述區(qū)域特征在一個時間步所對應(yīng)的概率,表征了上述區(qū)域特征對應(yīng)的文本區(qū)域在各上述文本區(qū)域中的排序?qū)?yīng)于上述時間步的概率。[0033]對上述特征序列中各上述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到上述特征序列的編碼結(jié)果;[0034]對于每個時間步,基于上述編碼結(jié)果和該時間步所對應(yīng)的歷史輸出結(jié)果,預(yù)測各上述區(qū)域特征在該時間步所對應(yīng)的概率;[0035]其中,第一個時間步所對應(yīng)的歷史輸出結(jié)果為預(yù)設(shè)特征,除第一個時間步之外的每個時間步,該時間步對應(yīng)的歷史輸出結(jié)果包括該時間步的上一時間步所對應(yīng)的預(yù)測結(jié)果,上述預(yù)測結(jié)果是基于上述上一個時間步所對應(yīng)的各概率中最大概率對應(yīng)的文本區(qū)域的區(qū)域特征確定的。[0037]對上述特征序列中各上述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到各上述區(qū)域特征的對應(yīng)的隱狀態(tài)特征和上述特征序列的編碼結(jié)果;[0038]對于每個時間步,基于上述編碼結(jié)果和該時間步對應(yīng)的歷史輸出結(jié)果,確定該時間步對應(yīng)的第一特征;對各上述隱狀態(tài)特征進(jìn)行特征提取,得到各上述區(qū)域特征對應(yīng)的第二特征,根據(jù)各上述區(qū)域特征對應(yīng)的第二特征和上述第一特征的相關(guān)性,得到各上述區(qū)域特征在該時間步所對應(yīng)的概率。[0040]對于每個上述文本區(qū)域,基于上述文本區(qū)域的文本內(nèi)容特征,得到上述文本區(qū)域的文本識別結(jié)果。[0041]可選地,上述文本圖像的處理裝置根據(jù)上述初始特征圖,確定上述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征、以及上述對于每個上述文本區(qū)域,將上述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到上述文本區(qū)域的區(qū)域特征是通過圖處理模型實現(xiàn)的,上述圖處理模型是由模型訓(xùn)練模塊訓(xùn)練得[0042]獲取訓(xùn)練樣本集,上述訓(xùn)練樣本集包括至少一個樣本文本圖像,上述樣本文本圖像的文本區(qū)域和背景區(qū)域標(biāo)注有第一樣本標(biāo)簽,上述第一樣本標(biāo)簽表征了上述相對應(yīng)的區(qū)域?qū)儆谖谋緟^(qū)域或者背景區(qū)域的真實結(jié)果;[0043]提取各上述樣本文本圖像的樣本初始特征;[0044]對于每一上述樣本文本圖像,將上述樣本文本圖像的樣本初始特征輸入初始圖處理模型,得到上述樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點的預(yù)測分類結(jié)果,上述預(yù)測分類結(jié)果表征了上述樣本目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域的預(yù)測結(jié)[0045]基于各上述樣本文本圖像的第一樣本標(biāo)簽,確定各上述樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點屬于文本區(qū)域或者背景區(qū)域的真實結(jié)果;[0046]基于上述真實結(jié)果和上述預(yù)測結(jié)果確定第一訓(xùn)練損失值,并基于上述第一訓(xùn)練損失值和上述訓(xùn)練樣本集對上述初始圖處理模型進(jìn)行訓(xùn)練,直至上述第一訓(xùn)練損失值滿足第一訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為上述圖處理模型。[0047]可選地,上述文本圖像的處理裝置基于各上述文本區(qū)域的區(qū)域特征,確定各上述文本區(qū)域的排序結(jié)果是通過文本排序模型實現(xiàn)的;其中,上述樣本文本圖像的各文本區(qū)域標(biāo)注有第二樣本標(biāo)簽,上述第二樣本標(biāo)簽表征了上述樣本文本圖像的各文本區(qū)域的真實排序結(jié)果,上述文本排序模型是由上述模型訓(xùn)練模塊訓(xùn)練得到的,上述模型訓(xùn)練模塊用于:[0048]基于上述圖處理模型確定各樣本特征序列,每一上述樣本特征序列包括一個樣本文本圖像的各文本區(qū)域的區(qū)域特征;[0049]對于每個上述樣本文本圖像,將上述樣本文本圖像對應(yīng)的樣本特征序列輸入初始文本排序模型,得到上述樣本文本圖像的文本區(qū)域的預(yù)測排序結(jié)果;[0050]基于上述真實排序結(jié)果和上述預(yù)測排序結(jié)果確定第二訓(xùn)練損失值,并基于上述第11二訓(xùn)練損失值和各上述樣本特征序列對上述初始文本排序模型進(jìn)行訓(xùn)練,直至上述第二訓(xùn)練損失值滿足第二訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為上述文本排序模型。[0051]另一方面,本申請實施例提供了一種電子設(shè)備,包括處理器和存儲器,該處理器和存儲器相互連接;[0052]上述存儲器用于存儲計算機程序;[0053]上述處理器被配置用于在調(diào)用上述計算機程序時,執(zhí)行本申請實施例提供的文本圖像的處理方法。[0054]另一方面,本申請實施例提供了一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)存儲有計算機程序,該計算機程序被處理器執(zhí)行以實現(xiàn)本申請實施例提供的文本圖像的處理方法。[0055]另一方面,本申請實施例提供了一種計算機程序產(chǎn)品或計算機程序,該計算機程序產(chǎn)品或計算機程序包括計算機指令,該計算機指令存儲在計算機可讀存儲介質(zhì)中。電子設(shè)備的處理器從計算機可讀存儲介質(zhì)讀取該計算機指令,處理器執(zhí)行該計算機指令,使得該計算機設(shè)備執(zhí)行本申請實施例提供的文本圖像的處理方法。[0056]本申請實施例提供的技術(shù)方案帶來的有益效果是:[0057]通過確定待處理文本圖像中各文本區(qū)域的文本內(nèi)容特征和空間位置特征,可有效基于對待處理文本圖像中離散文本信息所對應(yīng)的各文本區(qū)域的位置以及空間特征,確定各文本區(qū)域的文本識別結(jié)果的輸出順序,提升文本識別結(jié)果的輸出順序的準(zhǔn)確性,提升了所得到的文本圖像的文本識別結(jié)果的可讀性,適用性高。附圖說明[0058]為了更清楚地說明本申請實施例中的技術(shù)方案,下面將對本申請實施例描述中所需要使用的附圖作簡單地介紹。[0059]圖1是本申請實施例提供的一種文本圖像的處理方法的流程示意圖;[0060]圖2是本申請實施例提供的特征提取模型的一網(wǎng)絡(luò)架構(gòu)圖;[0061]圖3是本申請實施例提供的確定文本內(nèi)容特征和空間位置特征的方法流程圖;[0062]圖4是本申請實施例提供的圖處理模型的一網(wǎng)絡(luò)架構(gòu)示意圖;[0063]圖5是本申請實施例提供的確定文本區(qū)域的場景示意圖;[0064]圖6是本申請實施例提供的文本圖像處理方法的網(wǎng)絡(luò)架構(gòu)示意圖;[0065]圖7是本申請實施例提供的文本圖像的處理裝置的結(jié)構(gòu)示意圖;[0066]圖8是本申請實施例提供的電子設(shè)備的結(jié)構(gòu)示意圖。具體實施方式[0067]下面詳細(xì)描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本申請,而不能解釋為對本申請的限制。[0068]本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一辭“和/或”包括一個或更多個相關(guān)聯(lián)的列出項的全部或任一單元和全部組合。[0069]人工智能(ArtificialIntelligence,AI)是利用數(shù)字計算機或者數(shù)字計算機控制的機器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器。人工智能也就是研究各種智能機器的設(shè)計原理與實現(xiàn)方法,使機器具有感知、推理與決策的功能。[0070]人工智能技術(shù)是一門綜合學(xué)科,涉及領(lǐng)域廣泛,既有硬件層面的技術(shù)也有軟件層大數(shù)據(jù)處理技術(shù)、操作/交互系統(tǒng)、機電一體化等技術(shù)。人工智能軟件技術(shù)主要包括計算機視覺技術(shù)、語音處理技術(shù)、自然語言處理技術(shù)以及機器學(xué)習(xí)/深度學(xué)習(xí)等幾大方向。[0071]可選的,本申請實施例中在對待處理文本圖像中各文本區(qū)域的文本識別結(jié)果進(jìn)行排序時,具體涉及到了人工智能技術(shù)中的自然語言處理(NatureLanguageprocessing,NLP)技術(shù)。其中,自然語言處理是計算機科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向。它研究能實現(xiàn)人與計算機之間用自然語言進(jìn)行有效通信的各種理論和方法。自然語言處理是一們?nèi)粘J褂玫恼Z言,所以它與語言學(xué)的研究有著密切的聯(lián)系。自然語言處理技術(shù)通常包括[0072]下面以具體地實施例對本申請的技術(shù)方案以及本申請的技術(shù)方案如何解決上述技術(shù)問題進(jìn)行詳細(xì)說明。下面這幾個具體的實施例可以相互結(jié)合,對于相同或相似的概念或過程可能在某些實施例中不再贅述。下面將結(jié)合附圖,對本申請的實施例進(jìn)行描述。[0073]參見圖1,圖1是本申請實施例提供的一種文本圖像的處理方法的流程示意圖。如圖1所示,本申請實施例提供的文本圖像的處理方法可包括如下步驟:[0074]步驟S11、提取待處理文本圖像的初始特征圖。[0075]在本申請實施例中,待處理文本圖像可以為包括文本信息的任意圖像,如可以包括文本信息的網(wǎng)站截圖、網(wǎng)頁快照以及文獻(xiàn)圖片等、以及包括離散文本信息的網(wǎng)頁圖像等,在此不做限制。[0076]具體地,在獲取到待處理文本圖像之后,在降低待處理文本圖像的分辨率、減少數(shù)據(jù)處理量的同時,可基于特征提取工具、基于神經(jīng)網(wǎng)絡(luò)構(gòu)建的特征提取架構(gòu)等,對待處理文本圖像進(jìn)行預(yù)處理,以得到待處理文本圖像的初始特征圖。[0077]其中,基于神經(jīng)網(wǎng)絡(luò)構(gòu)建的特征提取結(jié)構(gòu)可以包括基于卷積神經(jīng)網(wǎng)絡(luò)CNN(ConvolutionalNeuralNetworks,CNN)、循環(huán)RNN)以及長短期記憶神經(jīng)網(wǎng)絡(luò)(Longshort-termmemory,LSTM)等構(gòu)建的特征提取結(jié)構(gòu),[0078]作為一示例,在獲取到待處理文本圖像之后,可基于VGG-16架構(gòu)的特征提取模型對待處理文本圖像進(jìn)行處理,以提取待處理文本圖像的初始特征圖。其中,VGG-16架構(gòu)采用3*3的卷積核和2*2的最大池化層,并具體由16個隱藏層構(gòu)成,其中包括13個卷積層和3個全連接層,從而在上述多個隱藏層的作用下,在有效提取待處理文本圖像的初始特征圖的同時,使得待處理文本圖像的初始特征圖具有良好的泛化性能。[0079]為確保對待處理文本圖像的初始特征圖為點集形式,因此本申請實施例中的基于圖2所示,圖2是本申請實施例提供的特征提取模型的一網(wǎng)絡(luò)架構(gòu)圖。本申請實施例提供特征提取模型可由多個CBR網(wǎng)絡(luò)層和池化層(MaxPool)構(gòu)成,其中,CBR網(wǎng)絡(luò)層為由卷積網(wǎng)絡(luò)(Conv)、批量歸一化網(wǎng)絡(luò)(BatchNorm)以及激活函數(shù)(ReLu)構(gòu)成的綜合網(wǎng)絡(luò)層,不同的CBR具有不同的數(shù)據(jù)處理能力,池化層可以為最大池化層。[0080]作為一示例,對于高分辨率的待處理文本圖像I_s,可將其分辨率大小調(diào)整為1024×1024,則將3通道的待處理文本圖像輸入基于卷積神經(jīng)網(wǎng)絡(luò)的特征提取模型的數(shù)據(jù)大小為(1024,1024,3),再經(jīng)過基于卷積神經(jīng)網(wǎng)絡(luò)的特征提取模型處理后得到的初始特征圖I_cnn數(shù)據(jù)大小為(32,32,512)。再通過多層一維卷積將數(shù)據(jù)通道數(shù)降低為8,即待處理文本圖像的初始圖像特征I_cnn的最終數(shù)據(jù)大小為(h,w,c)_(h=32,w=32,c=8)。[0081]其中,h表示初始圖像特征的高,w表示初始圖像特征的寬,c表示初始圖像特征的通道數(shù)。需要特別說明的是,本申請實施例提供的特征提取模型僅為示例,具體可基于實際[0082]步驟S12、根據(jù)初始特征圖,確定待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征。[0083]在本申請實施例中,由于待處理文本圖像的初始特征圖可表征待處理文本圖像中的各項信息的特征,如文本信息以及背景信息的特征。其中,待處理文本圖像的背景信息包括但不限于顏色背景信息、圖片信息等非文本信息,具體可基于實際應(yīng)用場景需求確定,在此不做限制。[0084]基于此,在確定出待處理文本圖像的初始特征圖后,可基于待處理文本圖像的初始特征圖,確定待處理文本圖像中各文本區(qū)域的文本內(nèi)容特征和空間位置特征。[0085]例如,待處理文本圖像中包括文本段落1、文本段落2以及背景信息,在確定出待處理文本圖像的初始特征圖之后,可基于初始特征圖確定待處理文本圖像中文本段落1和文本段落2的文本內(nèi)容特征和空間位置特征。[0086]其中,根據(jù)初始圖特征,確定待處理文本圖像所包含的至少一個文本區(qū)域中各文本區(qū)域的文本內(nèi)容特征和空間位置特征的具體實現(xiàn)方式可參見圖3.參見圖3,圖3是本申請實施例提供的確定文本內(nèi)容特征和空間位置特征的方法流程圖,具體包括如下步驟:[0087]步驟S121、基于初始特征圖中各特征點的位置,確定初始特征圖中各特征點之間的位置關(guān)系。[0088]具體地,初始特征圖中各特征點之間的位置關(guān)系可由初始特征圖中各特征點之間的距離表示。其中,初始特征圖中各特征點之間的距離為初始特征圖中各特征點在初始特征圖中的相對位置之間的距離。[0089]步驟S122、基于初始特征圖中各特征點的特征值、以及初始特征圖中各特征點之間的位置關(guān)系,對初始特征圖進(jìn)行特征提取,得到目標(biāo)特征圖。[0090]在本申請實施例中,在初始特征圖中各特征點之間的位置關(guān)系可由初始特征圖中各特征點之間的距離表示的情況下,在對初始特征進(jìn)行特征提取之前,可基于初始特征圖中各特征點的特征值、以及初始特征圖中各特征點之間的位置關(guān)系,構(gòu)建圖結(jié)構(gòu)。[0091]其中,初始特征圖中的每一個特征點對應(yīng)于圖結(jié)構(gòu)中的一個節(jié)點,初始特征圖中每一個特征點的特征值基于圖結(jié)構(gòu)中對應(yīng)節(jié)點的節(jié)點特征值,初始特征圖中特征點間的距離小于或者等于設(shè)定值的特征點所對應(yīng)的節(jié)點之間具有連邊。[0092]換句話說,對于圖結(jié)構(gòu)中的節(jié)點之間的連邊,可確定初始特征圖中任一特征點與其他特征點之間的距離,并在距離小于或者等于設(shè)定值的特征點與該特征點之間建立連邊,從而可構(gòu)建由節(jié)點和邊所組成的圖結(jié)構(gòu)。[0093]可選地,在確定圖結(jié)構(gòu)中的節(jié)點之間的連邊時,還可基于初始特征圖中各特征點的特征值確定。如對于初始特征圖中具有相同特征值、和/或特征值的差值小于或者等于設(shè)定值的兩個特征點,可確定該兩個特征點對應(yīng)于圖結(jié)構(gòu)中的兩個節(jié)點之間具有連邊。[0094]可選地,在確定圖結(jié)構(gòu)中的節(jié)點之間的連邊時,還可基于初始圖特征中各特征點的特征值、以及初始圖特征中各特征點之間的距離確定。若初始圖特征中存在特征值的差值小于或者等于設(shè)定值,且特征點之間的距離小于或者等于設(shè)定值的兩個特征點,則可確定該兩個特征點對應(yīng)于圖結(jié)構(gòu)中的兩個節(jié)點之間具有連邊。[0095]在本申請實施例中,在基于初始圖特征構(gòu)建圖結(jié)構(gòu)之后,可基于圖處理模型對圖結(jié)構(gòu)進(jìn)行特征提取,得到目標(biāo)特征圖。[0096]其中,上述圖處理模型包括但不限于基于圖卷積神經(jīng)網(wǎng)絡(luò)(GraphConvolutionalNetwork,GCN)構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型以及相關(guān)圖處理工具,如基于深度圖卷積神經(jīng)網(wǎng)絡(luò)的模型架構(gòu)、稠密卷積神經(jīng)網(wǎng)絡(luò)等,具體可基于實際應(yīng)用場景需求確定,在此不做限制。參見圖4,圖4是本申請實施例提供的圖處理模型的一網(wǎng)絡(luò)架構(gòu)示意圖。圖4所示的網(wǎng)絡(luò)架構(gòu)中包括依次連接的多個稠密連接模塊、卷積層、池化層等,為減少網(wǎng)絡(luò)深度加深所帶來的梯度消失問題,基于圖4所示的網(wǎng)絡(luò)結(jié)構(gòu)可在包括圖處理模型的層與層之間最大程度的信息傳輸?shù)那疤嵯?,直接將所有層連接起來,每一層將之前所有層的輸入進(jìn)行拼接,之后將輸出的特征傳遞給之后的所有層。[0097]需要特別說明的是,圖4所示的網(wǎng)絡(luò)結(jié)構(gòu)僅為本申請實施例中圖處理模型的一示例,圖處理模型的網(wǎng)絡(luò)架構(gòu)具體可基于實際應(yīng)用場景需求確定在,在此不做限制。[0098]進(jìn)一步地,在基于初始特征圖中各特征點的特征值、以及初始特征圖中各特征點之間的位置關(guān)系構(gòu)建圖結(jié)構(gòu)之后,可基于上述圖處理模型對上述圖結(jié)構(gòu)進(jìn)行處理,以對圖結(jié)構(gòu)進(jìn)行特征提取,得到目標(biāo)特征圖。[0099]作為一示例,基于特征提取模型對待處理文本圖像進(jìn)行處理后,得到的初始特征圖的數(shù)據(jù)I_cnn的大小為(h,w,c)_(h=32,w=32,c=8),通過圖處理模型,基于初始特征圖中各特征點的特征值、以及初始特征圖中各特征點之間的位置關(guān)系,可構(gòu)建圖結(jié)構(gòu),并對圖結(jié)構(gòu)進(jìn)行特征提取,得到目標(biāo)特征圖。[0100]步驟S123、根據(jù)目標(biāo)特征圖,確定目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果。[0101]在本申請實施例中,基于圖處理模型可對目標(biāo)特征圖中各特征點進(jìn)行分類,基于分類結(jié)果確定各特征點屬于本區(qū)區(qū)域或背景區(qū)域,即基于分類結(jié)果確定各特征點對應(yīng)的信息在待處理文本圖中屬于文本區(qū)域還是背景區(qū)域。目標(biāo)特征圖中的特征點的分類結(jié)果表征了目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域[0102]其中,對于目標(biāo)特征圖中的每一特征點,可對該特征點進(jìn)行二分類,得到分類結(jié)果。若目標(biāo)特征圖的每一特征點的分類結(jié)果為第一值(如為1),或者大于設(shè)定概率值,則可確定該特征點表征其屬于文本區(qū)域。若目標(biāo)特征圖中的每一特征點的分類結(jié)果為第二值(如為0),或者不大于設(shè)定概率值,則可確定該特征點表征其屬于背景區(qū)域。[0103]如通過圖處理模型最終可將數(shù)據(jù)大小為(h,w,c)_(h=32,w=32,c=8)的初始特征圖I_cnn轉(zhuǎn)化為1024個特征點,進(jìn)而基于1024個特征點的位置關(guān)系、特征值構(gòu)建圖結(jié)構(gòu),從而得到1024個特征點的分類結(jié)果。[0104]步驟S124、根據(jù)目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,確定目標(biāo)特征圖中的至少一個文本區(qū)域。[0105]在本申請實施例中,基于目標(biāo)特征圖中各特征點的分類結(jié)果,可將分類結(jié)果相同且相鄰的特征點確定為一個連通域,從而從各連通域中確定分類結(jié)果表征文本區(qū)域的目標(biāo)連通域,并將目標(biāo)連通域確定為目標(biāo)特征圖中的文本區(qū)域。[0106]如圖5所示,圖5是本申請實施例提供的確定文本區(qū)域的場景示意圖。通過特征提取模型對待處理文本圖像的初始特征圖進(jìn)行ResNet、DenseNet等處理,使得網(wǎng)絡(luò)層數(shù)增加,其中,每一層對應(yīng)于一個中間特征圖,最后一層對應(yīng)目標(biāo)特征圖。進(jìn)一步對目標(biāo)特征圖進(jìn)行處理得到目標(biāo)特征圖中各特征點的分類結(jié)果。對于目標(biāo)特征圖中各特征點,若特征點的分類結(jié)果表征其屬于文本區(qū)域,則可采用第一標(biāo)識(如采用第一預(yù)設(shè)值)對其進(jìn)行標(biāo)記,若特征點的分類結(jié)果表征其屬于背景區(qū)域,則可采用第二標(biāo)識(如采用第二預(yù)設(shè)值)對齊進(jìn)行標(biāo)記。進(jìn)而基于目標(biāo)特征圖中各特征點的標(biāo)記結(jié)果,將分類結(jié)果相同且相鄰的特征點確定為一個連通域。若采用第一預(yù)設(shè)值1對表征文本區(qū)域的特征點進(jìn)行標(biāo)記,則目標(biāo)特征圖中的文本區(qū)域?qū)?yīng)的連通域如圖5中所示。[0107]步驟S125、對于每個文本區(qū)域,根據(jù)文本區(qū)域在目標(biāo)特征圖中所對應(yīng)的各特征點的特征值,確定文本區(qū)域?qū)?yīng)的文本內(nèi)容特征,根據(jù)文本區(qū)域在目標(biāo)特征圖中所對應(yīng)的各特征點的位置,確定文本區(qū)域?qū)?yīng)的空間位置特征。[0108]在本申請實施例中,由于初始特征圖包括多個通道,因此上述目標(biāo)特征圖包括多個通道的特征圖,且目標(biāo)特征圖包括對應(yīng)于每一通道的特征圖。在此情況下,對于目標(biāo)特征圖中的每個文本區(qū)域,可確定該文本區(qū)域在目標(biāo)特征圖中所對應(yīng)的各特征點的特征值。[0109]進(jìn)一步地,對于該文本區(qū)域在目標(biāo)特征圖中的各特征點,可將各特征點對應(yīng)于同一通道的特征值進(jìn)行融合,得到各特征點對應(yīng)于同一通道的融合特征值。如對于該文本區(qū)域在目標(biāo)特征圖中的各特征點,可將各特征點對應(yīng)于同一通道的不同特征值的平均值,確定為各特征點對應(yīng)于該通道的融合特征值,進(jìn)而可得到各特征點對應(yīng)于不同通道的融合特[0110]可選地,對文本區(qū)域在目標(biāo)特征圖中的各特征點,在將各特征點對應(yīng)于同一通道的特征值進(jìn)行融合還可通過取最大值、取最小值等方式進(jìn)行,具體可基于實際應(yīng)用場景需[0111]進(jìn)一步地,對于目標(biāo)特征圖的每一文本區(qū)域,可進(jìn)一步基于該文本區(qū)域?qū)?yīng)于目標(biāo)特征圖中各特征點對應(yīng)于不同通道的融合特征值,得到融合特征值序列。其中,該融合特征值序列的長度與目標(biāo)特征圖對應(yīng)的通道數(shù)一致?;诖?,對于每一文本區(qū)域,可將該文本區(qū)域?qū)?yīng)的融合特征值序列,確定為該文本區(qū)域?qū)?yīng)的文本內(nèi)容特征。[0112]在本申請實施例中,在確定目標(biāo)特征圖中的各文本區(qū)域后,可基于各文本區(qū)域在目標(biāo)特征圖中所對應(yīng)的各特征點的位置,來確定文本區(qū)域?qū)?yīng)的空間位置特征。[0113]具體地,可基于文本區(qū)域在目標(biāo)特征圖中所對應(yīng)的各特征點的位置,如坐標(biāo)來確定文本區(qū)域在目標(biāo)特征圖中的位置。并且根據(jù)文本區(qū)域在目標(biāo)特征圖中所對應(yīng)的各特征點的位置,確定文本區(qū)域在目標(biāo)特征圖中所對應(yīng)的高和寬,從而基于文本區(qū)域在目標(biāo)特征圖中的位置、所對應(yīng)的高和寬來確定文本區(qū)域的空間位置特征(x,y,w,h)。其中,x,y用于確定文本區(qū)域在目標(biāo)特征圖中的位置,w表示文本區(qū)域在目標(biāo)特征圖中的高,h表示文本區(qū)域在目標(biāo)特征圖中的高。[0114]步驟S13、對于每個文本區(qū)域,將文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到文本區(qū)域的區(qū)域特征。[0115]在本申請實施例中,對于目標(biāo)特征圖所包含的每一文本區(qū)域,可將該文本區(qū)域?qū)?yīng)的文本內(nèi)容特征和空間位置特征進(jìn)行融合,得到該文本區(qū)域的區(qū)域特征。[0116]其中,對每一文本區(qū)域?qū)?yīng)的文本內(nèi)容特征和空間位置特征進(jìn)行融合時,可將每一文本區(qū)域?qū)?yīng)的文本內(nèi)容特征和空間位置特征進(jìn)行拼接,得到該文本區(qū)域?qū)?yīng)的區(qū)域特[0117]作為一示例,目標(biāo)特征圖中各文本區(qū)域?qū)?yīng)的區(qū)域特征可表示為S=CONCAT(s,(x,y,w,h))i∈1,2…,n。其中,i表示文本區(qū)域的索引,CONCAT(s,(x,y,w,h))表示文本區(qū)域i的文本內(nèi)容特征s;和空間位置特征(x,y,w,h)進(jìn)行拼接,n表示目標(biāo)特征圖中文本區(qū)域的數(shù)量。[0118]步驟S14、基于各文本區(qū)域的區(qū)域特征,確定各文本區(qū)域的排序結(jié)果。[0119]在本申請實施例中,在基于上述實現(xiàn)方式確定出待處理文本圖像中各文本區(qū)域的區(qū)域特征之后,可確定包含各文本區(qū)域的區(qū)域特征的特征序列,并基于包含各文本區(qū)域的區(qū)域特征的特征序列,確定各文本區(qū)域的排序結(jié)果。[0120]具體地,可將上述特征序列輸入文本排序模型,以基于文本排序模型確定待處理文本圖像中各文本區(qū)域的排序結(jié)果。其中,上述文本排序模型可以為基于指針網(wǎng)絡(luò)(PointerNetwork,PN)構(gòu)建的文本排序模型,也可以為基于其他神經(jīng)網(wǎng)絡(luò)架構(gòu),如Sequence2Sequence架構(gòu)所構(gòu)建的文本排序模型,具體可基于實際應(yīng)用場景需求確定,在此不做限制。[0121]具體地,可將上述特征序列輸入文本排序模型,以預(yù)測特征序列中各區(qū)域特征在每個時間步所對應(yīng)的概率,進(jìn)而基于各區(qū)域特征在每個時間步所對應(yīng)的概率,確定文本區(qū)域的排序結(jié)果。其中,上述特征序列中一個區(qū)域特征在一個時間步所對應(yīng)的概率,表征了該區(qū)域特征對應(yīng)的文本區(qū)域在各文本區(qū)域中的排序?qū)?yīng)于時間步的概率。[0122]作為一示例,若上述特征序列中包括文本區(qū)域1對應(yīng)的區(qū)域特征1、文本區(qū)域2對應(yīng)的區(qū)域特征2以及文本區(qū)域3對應(yīng)的區(qū)域特征3。此時將包括區(qū)域特征1、區(qū)域特征2以及區(qū)域特征3的特征序列輸入文本排序模型。在第一時間步,確定區(qū)域特征1、區(qū)域特征2以及區(qū)域特征3對應(yīng)于第一時間步的概率。若區(qū)域特征2的對應(yīng)于第一時間步的概率最大,則將區(qū)域特征2對應(yīng)的文本區(qū)域的排序確定為第一排序。[0123]進(jìn)一步地,在第二時間步,確定區(qū)域特征1、區(qū)域特征2以及區(qū)域特征3對應(yīng)于第二時間步的概率,進(jìn)而基于各區(qū)域特征對應(yīng)于第二時間步的概率,并將最大概率對應(yīng)的區(qū)域特征(除區(qū)域特征2)對應(yīng)的文本區(qū)域的排序確定為第二排序,將剩余的區(qū)域特征對應(yīng)的文每個時間步,該時間步對應(yīng)的歷史輸出結(jié)果包括該時間步的上一時間步對應(yīng)的預(yù)測結(jié)果,且該預(yù)測結(jié)果是基于上一個時間步對應(yīng)的各概率中最大概率對應(yīng)的文本區(qū)域的區(qū)域特征間步的概率。若區(qū)域特征2的對應(yīng)于第一時間步的概率最大,則可將為預(yù)設(shè)特征vinput;在第一個時間步之后的其他每個時間步(t大于1時),該時間步對應(yīng)的歷[0133]具體對于每個時間步,可基于各區(qū)域特征對應(yīng)于該時間步的第一特征和第二特第一特征和第二特征的相關(guān)系數(shù)可以表示為之間的任一時間步對應(yīng)的歷史輸出結(jié)果的最大概率包括區(qū)域特征i對應(yīng)的概率,則區(qū)域特征i對應(yīng)于該時間步的相關(guān)系數(shù)a;為預(yù)設(shè)值A(chǔ)。[0136]進(jìn)一步地,對于每一時間步,在確定各區(qū)域特征i對應(yīng)于該時間步的相關(guān)系數(shù)之進(jìn)而從所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征、以及步驟[0144]對于每一樣本文本圖像,將樣本文本圖像的樣本初始特征輸入初始圖處理模[0146]基于真實結(jié)果和預(yù)測結(jié)果確定第一訓(xùn)練損失值,并基于第一訓(xùn)練損失值和訓(xùn)練樣本集對初始圖處理模型進(jìn)行訓(xùn)練,直至第一訓(xùn)練損失值滿足第一訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為圖處理模型。[0147]其中,確定各樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點的預(yù)測分類結(jié)果的具體方式,可參見圖1至圖2所示的確定待處理文本圖像對應(yīng)的目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果的實施方式,在此不再贅述。[0148]其中,上述第一訓(xùn)練損失值具體可基于交叉熵?fù)p失函數(shù)或者其他損失函數(shù)確定,具體可基于實際應(yīng)用場景需求確定,在此不做限制。來確定。其中,r表示樣本目標(biāo)特征圖中的各特征點,yp表示預(yù)測結(jié)果,ygt表示真實結(jié)果,n表示樣本特征圖中特征點的數(shù)量。[0150]根據(jù)第一訓(xùn)練損失值和訓(xùn)練樣本集中的各樣本文本圖像,可基于上述實現(xiàn)方式對初始圖處理模型進(jìn)行迭代訓(xùn)練,并在每次訓(xùn)練過程中對初始圖處理模型中的相關(guān)參數(shù)進(jìn)行調(diào)整。當(dāng)?shù)谝挥?xùn)練損失值符合訓(xùn)練結(jié)束條件時,可將訓(xùn)練結(jié)束時的模型確定為最終的圖處理模型。其中,上述訓(xùn)練結(jié)束條件可以為上述第一訓(xùn)練損失值達(dá)到收斂狀態(tài),或者為上述第一訓(xùn)練損失值低于預(yù)設(shè)閾值等,具體可基于實際應(yīng)用場景需求確定,在此不做限制。[0151]在本申請實施例中,圖1中步驟S14基于各文本區(qū)域的區(qū)域特征,確定各文本區(qū)域的排序結(jié)果可通過文本排序模型實現(xiàn)。[0152]其中,在訓(xùn)練樣本集中各樣本文本圖像的各文本區(qū)域標(biāo)注有第二樣本標(biāo)簽,第二樣本標(biāo)簽表征了樣本文本圖像的各文本區(qū)域的真實排序結(jié)果的情況下,文本排序模型是通過以下方式確定的:[0153]基于圖處理模型確定各樣本特征序列,每一樣本特征序列包括一個樣本文本圖像的各文本區(qū)域的區(qū)域特征;[0154]對于每個樣本文本圖像,將樣本文本圖像對應(yīng)的樣本特征序列輸入初始文本排序模型,得到樣本文本圖像的文本區(qū)域的預(yù)測排序結(jié)果;[0155]基于真實排序結(jié)果和預(yù)測排序結(jié)果確定第二訓(xùn)練損失值,并基于第二訓(xùn)練損失值和各樣本特征序列對初始文本排序模型進(jìn)行訓(xùn)練,直至第二訓(xùn)練損失值滿足第二訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為文本排序模型。[0156]其中,各樣本文本圖像的文本區(qū)域的預(yù)測排序結(jié)果的具體方式,可參見圖1至圖2所示的確定待處理文本圖像中各文本區(qū)域的排序結(jié)果的實施方式,在此不再贅述。[0157]其中,上述第二訓(xùn)練損失值具體可基于交叉熵?fù)p失函數(shù)或者其他損失函數(shù)確定,具體可基于實際應(yīng)用場景需求確定,在此不做限制。[0158]根據(jù)第二訓(xùn)練損失值和圖處理模型確定各樣本特征序列,可基于上述實現(xiàn)方式對初始文本排序模型進(jìn)行迭代訓(xùn)練,并在每次訓(xùn)練過程中對初始文本排序模型的相關(guān)參數(shù)進(jìn)行調(diào)整。當(dāng)?shù)诙?xùn)練損失值符合訓(xùn)練結(jié)束條件時,可將訓(xùn)練結(jié)束時的模型確定為最終的文本排序模型。其中,上述訓(xùn)練結(jié)束條件可以為上述第二訓(xùn)練損失值達(dá)到收斂狀態(tài),或者為上述第二訓(xùn)練損失值低于預(yù)設(shè)閾值等,具體可基于實際應(yīng)用場景需求確定,在此不做限制。[0159]可選地,在提取各樣本文本圖圖像的樣本初始特征時,還可通過特征提取模型訓(xùn)練得到。且在對初始圖處理模型之前可將訓(xùn)練樣本集中的樣本文本圖像輸入至初始特征提取模型,以得到各訓(xùn)練文本圖像的樣本初始特征。并將每一樣本初始特征輸入初始圖處理模型,得到各樣本文本圖像的樣本特征序列,基于初始圖處理模型得到的樣本特征序列對初始文本排序模型進(jìn)行訓(xùn)練。并上述實現(xiàn)方式分別確定第一訓(xùn)練損失值和第二訓(xùn)練損失值之后,基于第一訓(xùn)練損失值和第二訓(xùn)練損失值確定總訓(xùn)練損失值。[0160]進(jìn)一步根據(jù)總訓(xùn)練損失值和訓(xùn)練樣本集,對初始特征提取模型、初始圖處理模型和初始文本排序模型進(jìn)行迭代訓(xùn)練,并在每次訓(xùn)練過程中對初始特征提取模型、初始文本排序模型和初始圖處理模型的相關(guān)參數(shù)進(jìn)行調(diào)整。當(dāng)總訓(xùn)練損失值符合訓(xùn)練結(jié)束條件時,可將訓(xùn)練結(jié)束時的模型確定為最終的特征提取模型、圖處理模型和文本排序模型。其中,上述訓(xùn)練結(jié)束條件可以為上述總訓(xùn)練損失值達(dá)到收斂狀態(tài),或者為上述總訓(xùn)練損失值低于預(yù)設(shè)閾值等,具體可基于實際應(yīng)用場景需求確定,在此不做限制。[0161]基于上述實現(xiàn)方式可確定出圖處理模型和文本排序模型,進(jìn)而基于特征提取模型、圖處理模型以及文本排序模型確定待處理文本圖像匯總各文本區(qū)域的文本識別結(jié)果的輸出順序。參見圖6,圖6是本申請實施例提供的文本圖像處理方法的網(wǎng)絡(luò)架構(gòu)示意圖。如圖6所示,基于特征提取模型可確定待處理文本圖像的初始特征圖?;趫D處理模型,可根據(jù)初始特征圖,確定待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征;對于每個文本區(qū)域,將文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到文本區(qū)域的區(qū)域特征。通過文本排序模型,可基于圖處理模型得到的特征序列,確定各文本區(qū)域的排序結(jié)果從而確定待處理文本圖像中各文本區(qū)域的文本識別結(jié)果的輸出順序。[0162]其中,上述訓(xùn)練樣本集中的樣本文本圖像可通過獲取用戶歷史訪問記錄、文本圖像采樣以及大數(shù)據(jù)(Bigdata)等方式獲取,也可從用于存儲文本圖像的數(shù)據(jù)庫(Database)、云存儲(cloudstorage)或者區(qū)塊鏈(Blockchain)中獲取,具體可基于實際應(yīng)用場景需求確定,在此不做限制。其中,數(shù)據(jù)庫簡而言之可視為電子化的文件柜——存儲電子文件的處所,在本申請中可用于存儲樣本訓(xùn)練集。[0163]其中,基于大數(shù)據(jù)中的數(shù)據(jù)挖掘等技術(shù),可對文本圖像進(jìn)行挖掘以形成本申請中的訓(xùn)練樣本集。[0164]其中,區(qū)塊鏈?zhǔn)欠植际綌?shù)據(jù)存儲、點對點傳輸、共識機制、加密算法等計算機技術(shù)的新型應(yīng)用模式。區(qū)塊鏈本質(zhì)上是一個去中心化的數(shù)據(jù)庫,是一串使用密碼學(xué)方法相關(guān)聯(lián)產(chǎn)生的數(shù)據(jù)塊。在本申請中,區(qū)塊鏈中的每一個數(shù)據(jù)塊均可存儲上述訓(xùn)練樣本集中。[0165]其中,云存儲是在云計算概念上延伸和發(fā)展出來的一個新的概念,是指通過集群應(yīng)用、網(wǎng)格技術(shù)以及分布存儲文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備(存儲設(shè)備也稱之為存儲節(jié)點)通過應(yīng)用軟件或應(yīng)用接口集合起來協(xié)同工作,共同存儲大量的文本圖像。[0166]在本申請實施例中,通過確定待處理文本圖像中各文本區(qū)域的文本內(nèi)容特征和空間位置特征,可有效基于對待處理文本圖像中離散文本信息所對應(yīng)的各文本區(qū)域的位置以及空間特征,確定各文本區(qū)域的文本識別結(jié)果的輸出順序,提升文本識別結(jié)果的輸出順序的準(zhǔn)確性,提升了所得到的文本圖像的文本識別結(jié)果的可讀性,適用性高。[0167]參見圖7,圖7是本申請實施例提供的文本圖像的處理裝置的結(jié)構(gòu)示意圖。本申請實施例提供的文本圖像的處理裝置包括:[0168]初始特征圖提取模塊71,用于提取待處理文本圖像的初始特征圖;[0169]初始特征圖處理模塊72,用于根據(jù)上述初始特征圖,確定上述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征;[0170]區(qū)域特征確定模塊73,用于對于每個上述文本區(qū)域,將上述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到上述文本區(qū)域的區(qū)域特征;[0171]排序結(jié)果確定模塊74,用于基于各上述文本區(qū)域的區(qū)域特征,確定各上述文本區(qū)域的排序結(jié)果,上述排序結(jié)果表征了各上述文本區(qū)域的文本識別結(jié)果的輸出順序;[0172]文本排序模塊75,用于獲取各上述文本區(qū)域的文本識別結(jié)果,基于上述區(qū)域排序結(jié)果將各上述文本區(qū)域的文本識別結(jié)果進(jìn)行排序,得到上述待處理文本圖像的文本識別結(jié)[0173]在一些實施例中,上述初始特征圖處理模塊72,用于:[0174]基于上述初始特征圖中各特征點的位置,確定上述初始特征圖中各特征點之間的位置關(guān)系;[0175]基于上述初始特征圖中各特征點的特征值、以及上述初始特征圖中各特征點之間的位置關(guān)系,對上述初始特征圖進(jìn)行特征提取,得到目標(biāo)特征圖;[0176]根據(jù)上述目標(biāo)特征圖,確定上述目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,上述分類結(jié)果表征了上述目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域;[0177]根據(jù)上述目標(biāo)特征圖中各特征點對應(yīng)的分類結(jié)果,確定上述目標(biāo)特征圖中的至少一個文本區(qū)域;[0178]對于每個上述文本區(qū)域,根據(jù)上述文本區(qū)域在上述目標(biāo)特征圖中所對應(yīng)的各特征點的特征值,確定上述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征,根據(jù)上述文本區(qū)域在上述目標(biāo)特征圖中所對應(yīng)的各特征點的位置,確定上述文本區(qū)域?qū)?yīng)的空間位置特征。[0179]在一些實施例中,上述初始特征圖處理[0180]基于上述初始特征圖中各特征點的位置,確定上述初始特征圖中各特征點之間的[0181]基于上述初始特征圖中各特征點的特征值、以及上述初始特征圖中各特征點之間中每個特征點對應(yīng)于上述圖結(jié)構(gòu)中的一個節(jié)點,上述距離小于或等于設(shè)定值的特征點所對應(yīng)的節(jié)點之間具有連邊。[0183]將上述文本區(qū)域在上述目標(biāo)特征圖中所對應(yīng)的各特征點中同一通道的特征值進(jìn)行融合,得到對應(yīng)于各通道的融合特征值;[0184]基于上述文本區(qū)域?qū)?yīng)的融合特征值,確定上述文本區(qū)域?qū)?yīng)的文本內(nèi)容特征。[0185]在一些實施例中,上述排序結(jié)果確定模塊74,用于:[0186]基于包含各上述文本區(qū)域的區(qū)域特征的特征序列,預(yù)測上述特征序列中各上述區(qū)域特征在每個時間步所對應(yīng)的概率,基于各上述區(qū)域特征在每個時間步所對應(yīng)的概率,確定各上述文本區(qū)域的排序結(jié)果;[0187]其中,一個上述區(qū)域特征在一個時間步所對應(yīng)的概率,表征了上述區(qū)域特征對應(yīng)的文本區(qū)域在各上述文本區(qū)域中的排序?qū)?yīng)于上述時間步的概率。[0188]在一些實施例中,上述排序結(jié)果確定模塊74,用于:[0189]對上述特征序列中各上述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到上述特征序列的編碼結(jié)果;[0190]對于每個時間步,基于上述編碼結(jié)果和該時間步所對應(yīng)的歷史輸出結(jié)果,預(yù)測各上述區(qū)域特征在該時間步所對應(yīng)的概率;[0191]其中,第一個時間步所對應(yīng)的歷史輸出結(jié)果為預(yù)設(shè)特征,除第一個時間步之外的每個時間步,該時間步對應(yīng)的歷史輸出結(jié)果包括該時間步的上一時間步所對應(yīng)的預(yù)測結(jié)果,上述預(yù)測結(jié)果是基于上述上一個時間步所對應(yīng)的各概率中最大概率對應(yīng)的文本區(qū)域的區(qū)域特征確定的。[0192]在一些實施例中,上述排序結(jié)果確定模塊74,用于:[0193]對上述特征序列中各上述文本區(qū)域的區(qū)域特征進(jìn)行編碼處理,得到各上述區(qū)域特征的對應(yīng)的隱狀態(tài)特征和上述特征序列的編碼結(jié)果;[0194]對于每個時間步,基于上述編碼結(jié)果和該時間步對應(yīng)的歷史輸出結(jié)果,確定該時間步對應(yīng)的第一特征;對各上述隱狀態(tài)特征進(jìn)行特征提取,得到各上述區(qū)域特征對應(yīng)的第二特征,根據(jù)各上述區(qū)域特征對應(yīng)的第二特征和上述第一特征的相關(guān)性,得到各上述區(qū)域特征在該時間步所對應(yīng)的概率。[0196]對于每個上述文本區(qū)域,基于上述文本區(qū)域的文本內(nèi)容特征,得到上述文本區(qū)域的文本識別結(jié)果。[0197]在一些實施例中,上述文本圖像的處理裝置根據(jù)上述初始特征圖,確定上述待處理文本圖像所包含的至少一個文本區(qū)域中各個文本區(qū)域的文本內(nèi)容特征和空間位置特征、以及上述對于每個上述文本區(qū)域,將上述文本區(qū)域的文本內(nèi)容特征和空間位置特征拼接,得到上述文本區(qū)域的區(qū)域特征是通過圖處理模型實現(xiàn)的,上述圖處理模型是由模型訓(xùn)練模塊訓(xùn)練得到的,上述模型訓(xùn)練模塊用于:[0198]獲取訓(xùn)練樣本集,上述訓(xùn)練樣本集包括至少一個樣本文本圖像,上述樣本文本圖像的文本區(qū)域和背景區(qū)域標(biāo)注有第一樣本標(biāo)簽,上述第一樣本標(biāo)簽表征了上述相對應(yīng)的區(qū)域?qū)儆谖谋緟^(qū)域或者背景區(qū)域的真實結(jié)果;[0199]提取各上述樣本文本圖像的樣本初始特征;[0200]對于每一上述樣本文本圖像,將上述樣本文本圖像的樣本初始特征輸入初始圖處理模型,得到上述樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點的預(yù)測分類結(jié)果,上述預(yù)測分類結(jié)果表征了上述樣本目標(biāo)特征圖中各特征點屬于文本區(qū)域或背景區(qū)域的預(yù)測結(jié)[0201]基于各上述樣本文本圖像的第一樣本標(biāo)簽,確定各上述樣本文本圖像對應(yīng)的樣本目標(biāo)特征圖中各特征點屬于文本區(qū)域或者背景區(qū)域的真實結(jié)果;[0202]基于上述真實結(jié)果和上述預(yù)測結(jié)果確定第一訓(xùn)練損失值,并基于上述第一訓(xùn)練損失值和上述訓(xùn)練樣本集對上述初始圖處理模型進(jìn)行訓(xùn)練,直至上述第一訓(xùn)練損失值滿足第一訓(xùn)練結(jié)束條件時,將訓(xùn)練結(jié)束時的模型確定為上述圖處理模型。[0203]在一些實施例中,上述文本圖像的處理裝置基于各上述文本區(qū)域的區(qū)域特征,確定各上述文本區(qū)域的排序結(jié)果是通過文本排序模型實現(xiàn)的;其中,上述樣本文本圖像的各[0208]本申請實施例提供的文本圖像的處理裝置可以是運行于計算機設(shè)備中的一個計算機程序(包括程序代碼),例如該裝置為一個應(yīng)用軟件;該裝置可以用于執(zhí)行本申請實施譯碼處理器形式的處理器可以采用一個或多個應(yīng)用專用集成電路(ASIC,Application門陣列(FPGA,Field-Programmable實現(xiàn)這些組件之間的連接通信。其中,用戶接口1003可以包

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論