CN111797885B 用于分類的系統(tǒng)和方法 (三星顯示有限公司)_第1頁
CN111797885B 用于分類的系統(tǒng)和方法 (三星顯示有限公司)_第2頁
CN111797885B 用于分類的系統(tǒng)和方法 (三星顯示有限公司)_第3頁
CN111797885B 用于分類的系統(tǒng)和方法 (三星顯示有限公司)_第4頁
CN111797885B 用于分類的系統(tǒng)和方法 (三星顯示有限公司)_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(10)授權(quán)公告號CN111797885B(65)同一申請的已公布的文獻號(30)優(yōu)先權(quán)數(shù)據(jù)(73)專利權(quán)人三星顯示有限公司地址韓國京畿道(72)發(fā)明人李章煥審查員高東奇(74)專利代理機構(gòu)北京德琦知識產(chǎn)權(quán)代理有限公司11018專利代理師史迎雪康泉用于分類的系統(tǒng)和方法模型一種用于分類的系統(tǒng)和方法。在一些實施例中,該方法包括:從被標(biāo)記的輸入數(shù)據(jù)集形成第一訓(xùn)練數(shù)據(jù)集和第二訓(xùn)練數(shù)據(jù)集;利用第一訓(xùn)練數(shù)據(jù)集訓(xùn)練第一分類器;利用第二訓(xùn)練數(shù)據(jù)集訓(xùn)練變分自編碼器,變分自編碼器包括編碼器和解碼器;通過將偽隨機向量饋入解碼器來生成第三數(shù)據(jù)集;使用第一分類器標(biāo)記第三數(shù)據(jù)集以形成第三訓(xùn)練數(shù)據(jù)集;基于第三數(shù)據(jù)集形成第四訓(xùn)練數(shù)據(jù)集;以及利用第四訓(xùn)練數(shù)據(jù)集訓(xùn)練第二分類21.一種用于將被制造的部件分類為良品或次品的方法,所述方法包括:從被標(biāo)記的輸入數(shù)據(jù)集形成第一訓(xùn)練數(shù)據(jù)集和第二訓(xùn)練數(shù)據(jù)集;利用所述第一訓(xùn)練數(shù)據(jù)集訓(xùn)練第一分類器;利用所述第二訓(xùn)練數(shù)據(jù)集訓(xùn)練變分自編碼器,所述變分自編碼器包括編碼器和解碼通過將偽隨機向量饋入所述解碼器,來生成第三數(shù)據(jù)集;使用所述第一分類器標(biāo)記所述第三數(shù)據(jù)集,以形成第三訓(xùn)練數(shù)據(jù)集;基于所述第三數(shù)據(jù)集形成第四訓(xùn)練數(shù)據(jù)集;并且利用所述第四訓(xùn)練數(shù)據(jù)集訓(xùn)練第二分類器,其中,所述第一訓(xùn)練數(shù)據(jù)集是所述被標(biāo)記的輸入數(shù)據(jù)集,或者所述形成第一訓(xùn)練數(shù)據(jù)集包括:對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合所述被標(biāo)記的輸入數(shù)據(jù)集和所述第一補充數(shù)據(jù)集,以形成所述第一訓(xùn)練數(shù)據(jù)集;其中,所述第二訓(xùn)練數(shù)據(jù)集是所述被標(biāo)記的輸入數(shù)據(jù)集,或者所述形成第二訓(xùn)練數(shù)據(jù)集包括:對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合所述被標(biāo)記的輸入數(shù)據(jù)集和所述第一補充數(shù)據(jù)集,以形成所述第二訓(xùn)練數(shù)據(jù)集。2.根據(jù)權(quán)利要求1所述的方法,其中,所述對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣包括使用合成少數(shù)類過采樣技術(shù)。3.根據(jù)權(quán)利要求1所述的方法,其中,所述對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣包括使用自適應(yīng)合成過采樣技術(shù)。4.根據(jù)權(quán)利要求1所述的方法,其中,所述第四訓(xùn)練數(shù)據(jù)集與所述第三訓(xùn)練數(shù)據(jù)集相5.根據(jù)權(quán)利要求1所述的方法,其中,所述形成第四訓(xùn)練數(shù)據(jù)集包括:組合所述被標(biāo)記的輸入數(shù)據(jù)集的第一部分和所述第三訓(xùn)練數(shù)據(jù)集,以形成所述第四訓(xùn)練數(shù)據(jù)集。6.根據(jù)權(quán)利要求1所述的方法,其中,所述形成第四訓(xùn)練數(shù)據(jù)集包括:組合所述被標(biāo)記的輸入數(shù)據(jù)集的第一部分、所述第一補充數(shù)據(jù)集和所述第三訓(xùn)練數(shù)據(jù)集,以形成所述第四訓(xùn)練數(shù)據(jù)集。7.根據(jù)權(quán)利要求6所述的方法,進一步包括:利用與所述被標(biāo)記的輸入數(shù)據(jù)集的所述第一部分不同的所述被標(biāo)記的輸入數(shù)據(jù)集的第二部分,來驗證所述第二分類器。8.根據(jù)權(quán)利要求1所述的方法,其中,所述被標(biāo)記的輸入數(shù)據(jù)集包括:包括第一數(shù)量的數(shù)據(jù)元的多數(shù)類數(shù)據(jù)和包括第二數(shù)量的數(shù)據(jù)元的少數(shù)類數(shù)據(jù),所述第一數(shù)量超過所述第二數(shù)量至少五倍。9.根據(jù)權(quán)利要求8所述的方法,其中,所述第一數(shù)量超過所述第二數(shù)量至少十五倍。10.一種用于將被制造的部件分類為良品或次品的系統(tǒng),包括:從被標(biāo)記的輸入數(shù)據(jù)集形成第一訓(xùn)練數(shù)據(jù)集和第二訓(xùn)練數(shù)據(jù)集;利用所述第一訓(xùn)練數(shù)據(jù)集訓(xùn)練第一分類器;利用所述第二訓(xùn)練數(shù)據(jù)集訓(xùn)練變分自編碼器,所述變分自編碼器包括編碼器和解碼通過將偽隨機向量饋入所述解碼器來生成第三數(shù)據(jù)集;3使用所述第一分類器標(biāo)記所述第三數(shù)據(jù)集,以形成第三訓(xùn)練數(shù)據(jù)集;基于所述第三數(shù)據(jù)集形成第四訓(xùn)練數(shù)據(jù)集;并且利用所述第四訓(xùn)練數(shù)據(jù)集訓(xùn)練第二分類器,其中,所述第一訓(xùn)練數(shù)據(jù)集是所述被標(biāo)記的輸入數(shù)據(jù)集,或者所述處理電路被配置為:對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合所述被標(biāo)記的輸入數(shù)據(jù)集和所述第一補充數(shù)據(jù)集,以形成所述第一訓(xùn)練數(shù)據(jù)集;其中,所述第二訓(xùn)練數(shù)據(jù)集是所述被標(biāo)記的輸入數(shù)據(jù)集,或者所述處理電路被配置為:對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合所述被標(biāo)記的輸入數(shù)據(jù)集和所述第一補充數(shù)據(jù)集,以形成所述第二訓(xùn)練數(shù)據(jù)集。11.根據(jù)權(quán)利要求10所述的系統(tǒng),其中,所述處理電路被配置為使用合成少數(shù)類過采樣技術(shù)對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣。12.根據(jù)權(quán)利要求10所述的系統(tǒng),其中,所述處理電路被配置為使用自適應(yīng)合成過采樣技術(shù)對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣。13.一種用于將被制造的部件分類為良品或次品的系統(tǒng),所述系統(tǒng)包括:處理電路,所述處理電路被配置為:從被標(biāo)記的輸入數(shù)據(jù)集形成第一訓(xùn)練數(shù)據(jù)集和第二訓(xùn)練數(shù)據(jù)集;利用所述第一訓(xùn)練數(shù)據(jù)集訓(xùn)練第一分類器;利用所述第二訓(xùn)練數(shù)據(jù)集訓(xùn)練變分自編碼器,所述變分自編碼器包括編碼器和解碼通過將偽隨機向量饋入所述解碼器來生成第三數(shù)據(jù)集;使用所述第一分類器標(biāo)記所述第三數(shù)據(jù)集,以形成第三訓(xùn)練數(shù)據(jù)集;基于所述第三數(shù)據(jù)集形成第四訓(xùn)練數(shù)據(jù)集;并且利用所述第四訓(xùn)練數(shù)據(jù)集訓(xùn)練第二分類器,其中,所述第一訓(xùn)練數(shù)據(jù)集是所述被標(biāo)記的輸入數(shù)據(jù)集,或者所述處理電路被配置為:對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合所述被標(biāo)記的輸入數(shù)據(jù)集和所述第一補充數(shù)據(jù)集,以形成所述第一訓(xùn)練數(shù)據(jù)集;其中,所述第二訓(xùn)練數(shù)據(jù)集是所述被標(biāo)記的輸入數(shù)據(jù)集,或者所述處理電路被配置為:對所述被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合所述被標(biāo)記的輸入數(shù)據(jù)集和所述第一補充數(shù)據(jù)集,以形成所述第二訓(xùn)練數(shù)據(jù)集。4用于分類的系統(tǒng)和方法[0001]相關(guān)申請的交叉引用[0002]本申請要求2019年4月5日提交的題為“用于跟蹤數(shù)據(jù)集的數(shù)據(jù)擴充的系統(tǒng)和方法”的第62/830,131號美國臨時申請的優(yōu)先權(quán)和權(quán)益,該申請的全部內(nèi)容通過引用合并于技術(shù)領(lǐng)域[0003]根據(jù)本公開的實施例的一個或多個方面涉及分類器,并且更具體地涉及在訓(xùn)練分類器時使用的用于數(shù)據(jù)擴充的系統(tǒng)和方法。背景技術(shù)[0004]當(dāng)使用對二元類具有數(shù)據(jù)不平衡的數(shù)據(jù)進行訓(xùn)練時,或者當(dāng)在給定輸入數(shù)據(jù)維度的情況下訓(xùn)練數(shù)據(jù)的量相對小時,自動分類器可能表現(xiàn)出相對差的性能。發(fā)明內(nèi)容[0006]根據(jù)本發(fā)明的實施例,提供了一種用于分類的方法,該方法包括:從被標(biāo)記的輸入數(shù)據(jù)集形成第一訓(xùn)練數(shù)據(jù)集和第二訓(xùn)練數(shù)據(jù)集;利用第一訓(xùn)練數(shù)據(jù)集訓(xùn)練第一分類器;利用第二訓(xùn)練數(shù)據(jù)集訓(xùn)練變分自編碼器,變分自編碼器包括編碼器和解碼器;通過將偽隨機向量饋入解碼器來生成第三數(shù)據(jù)集;使用第一分類器標(biāo)記第三數(shù)據(jù)集以形成第三訓(xùn)練數(shù)據(jù)集;基于第三數(shù)據(jù)集形成第四訓(xùn)練數(shù)據(jù)集;并且利用第四訓(xùn)練數(shù)據(jù)集訓(xùn)練第二分類器。[0007]在一些實施例中,第一訓(xùn)練數(shù)據(jù)集是被標(biāo)記的輸入數(shù)據(jù)集。[0008]在一些實施例中,第二訓(xùn)練數(shù)據(jù)集是被標(biāo)記的輸入數(shù)據(jù)集。[0009]在一些實施例中,形成第一訓(xùn)練數(shù)據(jù)集包括:對被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合被標(biāo)記的輸入數(shù)據(jù)集和第一補充數(shù)據(jù)集,以形成第一訓(xùn)練數(shù)據(jù)集。[0010]在一些實施例中,對被標(biāo)記的輸入數(shù)據(jù)集進行過采樣包括使用合成少數(shù)類過采樣[0011]在一些實施例中,對被標(biāo)記的輸入數(shù)據(jù)集進行過采樣包括使用自適應(yīng)合成過采樣[0012]在一些實施例中,第四訓(xùn)練數(shù)據(jù)集與第三訓(xùn)練數(shù)據(jù)集相同。[0013]在一些實施例中,形成第四訓(xùn)練數(shù)據(jù)集包括:組合被標(biāo)記的輸入數(shù)據(jù)集的第一部分和第三訓(xùn)練數(shù)據(jù)集,以形成第四訓(xùn)練數(shù)據(jù)集。[0014]在一些實施例中,形成第四訓(xùn)練數(shù)據(jù)集包括:組合被標(biāo)記的輸入數(shù)據(jù)集的第一部分、第一補充數(shù)據(jù)集和第三訓(xùn)練數(shù)據(jù)集,以形成第四訓(xùn)練數(shù)據(jù)集。[0015]在一些實施例中,該方法進一步包括:利用與被標(biāo)記的輸入數(shù)據(jù)集的第一部分不同的被標(biāo)記的輸入數(shù)據(jù)集的第二部分,來驗證第二分類器。5[0016]在一些實施例中,形成第二訓(xùn)練數(shù)據(jù)集包括:對被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合被標(biāo)記的輸入數(shù)據(jù)集和第一補充數(shù)據(jù)集,以形成第二訓(xùn)練數(shù)據(jù)集。[0017]在一些實施例中,被標(biāo)記的輸入數(shù)據(jù)集包括:包括第一數(shù)量的數(shù)據(jù)元的多數(shù)類數(shù)據(jù)和包括第二數(shù)量的數(shù)據(jù)元的少數(shù)類數(shù)據(jù),第一數(shù)量超過第二數(shù)量至少五倍。[0018]在一些實施例中,第一數(shù)量超過第二數(shù)量至少十五倍。被標(biāo)記的輸入數(shù)據(jù)集形成第一訓(xùn)練數(shù)據(jù)集和第二訓(xùn)練數(shù)據(jù)集;利用第一訓(xùn)練數(shù)據(jù)集訓(xùn)練第一分類器;利用第二訓(xùn)練數(shù)據(jù)集訓(xùn)練變分自編碼器,變分自編碼器包括編碼器和解碼器;通過將偽隨機向量饋入解碼器來生成第三數(shù)據(jù)集;使用第一分類器標(biāo)記第三數(shù)據(jù)集,以形成第三訓(xùn)練數(shù)據(jù)集;基于第三數(shù)據(jù)集形成第四訓(xùn)練數(shù)據(jù)集;并且利用第四訓(xùn)練數(shù)據(jù)集訓(xùn)練第二分類器。[0020]在一些實施例中,第一訓(xùn)練數(shù)據(jù)集是被標(biāo)記的輸入數(shù)據(jù)集。[0021]在一些實施例中,第二訓(xùn)練數(shù)據(jù)集是被標(biāo)記[0022]在一些實施例中,處理電路被配置為:對被標(biāo)記的輸入數(shù)據(jù)集進行過采樣,以產(chǎn)生第一補充數(shù)據(jù)集;并且組合被標(biāo)記的輸入數(shù)據(jù)集和第一補充數(shù)據(jù)集,以形成第一訓(xùn)練數(shù)據(jù)集。[0023]在一些實施例中,處理電路被配置為使用合成少數(shù)類過采樣技術(shù)對被標(biāo)記的輸入數(shù)據(jù)集進行過采樣。[0024]在一些實施例中,處理電路被配置為使用自適應(yīng)合成過采樣技術(shù)對被標(biāo)記的輸入數(shù)據(jù)集進行過采樣。[0025]根據(jù)本發(fā)明的實施例,提供了一種用于將被制造的部件分類為良品或次品的系形成第一訓(xùn)練數(shù)據(jù)集和第二訓(xùn)練數(shù)據(jù)集;利用第一訓(xùn)練數(shù)據(jù)集訓(xùn)練第一分類器;利用第二訓(xùn)練數(shù)據(jù)集訓(xùn)練變分自編碼器,變分自編碼器包括編碼器和解碼器;通過將偽隨機向量饋入解碼器來生成第三數(shù)據(jù)集;使用第一分類器標(biāo)記第三數(shù)據(jù)集,以形成第三訓(xùn)練數(shù)據(jù)集;基于第三數(shù)據(jù)集形成第四訓(xùn)練數(shù)據(jù)集;并且利用第四訓(xùn)練數(shù)據(jù)集訓(xùn)練第二分類器。附圖說明[0026]將參考說明書、權(quán)利要求和附圖來領(lǐng)會和理解本公開的這些和其他特征以及優(yōu)[0027]圖1是根據(jù)本公開的實施例的用于分類的系統(tǒng)的框圖;[0028]圖2是根據(jù)本公開的實施例的用于訓(xùn)練和驗證分類器的方法的流程圖;[0029]圖3A是根據(jù)本公開的實施例的用于訓(xùn)練和驗證分類器的方法的一部分的流程圖;[0030]圖3B是根據(jù)本公開的實施例的用于訓(xùn)練和驗證分類器的方法的一部分的流程圖;[0031]圖3C是根據(jù)本公開的實施例的用于訓(xùn)練和驗證分類器的方法的一部分的流程圖;[0032]圖3D是根據(jù)本公開的實施例的用于訓(xùn)練和驗證分類器的方法的一部分的流程圖;[0033]圖3E是根據(jù)本公開的實施例的用于訓(xùn)練和驗證分類器的方法的一部分的流程圖;[0034]圖3F是根據(jù)本公開的實施例的用于訓(xùn)練和驗證分類器的方法的一部分的流程圖;6[0035]圖4是根據(jù)本公開的實施例的測試結(jié)果的表格;以及[0036]圖5是根據(jù)本公開的實施例的測試結(jié)果的表格。具體實施方式[0037]以下結(jié)合附圖闡述的詳細描述旨在描述根據(jù)本公開提供的用于數(shù)據(jù)擴充的系統(tǒng)和方法的示例性實施例,并且不旨在表示本公開可被構(gòu)造或利用的唯一形式。描述結(jié)合所例示的實施例闡述了本公開的特征。然而,應(yīng)理解,相同或等效的功能和結(jié)構(gòu)可以通過旨在也被涵蓋在本公開的范圍內(nèi)的不同實施例來完成。如本文中其他地方所指代的,相同的附圖標(biāo)記旨在指示相同的元素或特征。[0038]二元類的分類器可以具有將數(shù)據(jù)樣本分配給兩個類中的一個的任務(wù),并且用于訓(xùn)練這種分類器的訓(xùn)練數(shù)據(jù)可能存在顯著失衡。例如,在用于制造電子部件的制造過程中,可能的情況是多數(shù)的部件是可接受的或“良好的”,而少數(shù)的部件在某些方面有缺陷或“不良好的”。為此,當(dāng)在制造和測試過程期間獲得數(shù)據(jù)時,大多數(shù)的數(shù)據(jù)可能來自良好的設(shè)備,不平衡可能成為障礙。要被分類的項目(諸如被制造的部件)的測量值的集合)的維度可能很大。當(dāng)訓(xùn)練自動分類器時,尤其是鑒于每個數(shù)據(jù)元的維度當(dāng)任一類的訓(xùn)練數(shù)據(jù)元的數(shù)量少時,這可能是進一步的障礙。[0040]例如,當(dāng)制造移動顯示器時,可以在顯示面板的制造過程期間獲取跟蹤數(shù)據(jù)。跟蹤數(shù)據(jù)可以包括例如作為時間的函數(shù)的、在制造過程中的溫度和壓力的測量值??梢允褂枚鄠€溫度傳感器和壓力傳感器,并且每個傳感器可以被采樣多次(例如,在幾天的時間內(nèi),每天三次或四次)。由這些測量值產(chǎn)生的跟蹤數(shù)據(jù)可以例如包括大約64次跟蹤,每次跟蹤具有大約304個測量值,例如,總計超過19000個測量值,使得每個數(shù)據(jù)元具有超過19000個維度。[0041]如以下進一步詳細描述的,各種方法可以被使用以解決以上提到的障礙中的一些。參考圖1,在一些實例中,用于檢測故障部件的系統(tǒng)包括一個或多個數(shù)據(jù)收集電路105(數(shù)據(jù)收集電路105可以包括例如溫度傳感器和壓力傳感器、放大器以及模數(shù)轉(zhuǎn)換器)、數(shù)據(jù)預(yù)處理電路110(數(shù)據(jù)預(yù)處理電路110可以對數(shù)據(jù)進行重新格式化,如以下進一步詳細討論的)以及可以是深度學(xué)習(xí)(DL)神經(jīng)網(wǎng)絡(luò)的分類器115。[0042]數(shù)據(jù)預(yù)處理電路110可以從數(shù)據(jù)收集電路105接收原始跟蹤數(shù)據(jù)(例如,如以上提到的多次跟蹤),并且可以將原始跟蹤數(shù)據(jù)重新格式化為例如二維陣列(例如,224×224陣列)。二維陣列的大小可以被選擇為與通常由神經(jīng)網(wǎng)絡(luò)分類的圖像的大小相當(dāng)。然后,重新格式化可以使得有可能重新使用實現(xiàn)圖像的神經(jīng)網(wǎng)絡(luò)分類器的代碼的特定部分,以在一些實施例中使用。[0043]圖2示出了在一些實施例中用于訓(xùn)練和驗證分類器的流程圖。從數(shù)據(jù)預(yù)處理電路110接收被標(biāo)記的輸入數(shù)據(jù)集(或“輸入數(shù)據(jù)集”)205,被標(biāo)記的輸入數(shù)據(jù)集205包括每個被標(biāo)記為“良好”(或“G”)的第一數(shù)量的數(shù)據(jù)樣本(例如,幾千個數(shù)據(jù)元)以及每個被標(biāo)記為“不采用過采樣(如以下進一步詳細討論的)以生成包括一個或兩個類的附加數(shù)據(jù)樣本的第一7補充數(shù)據(jù)集。然后,被標(biāo)記的輸入數(shù)據(jù)集205和第一補充數(shù)據(jù)集可以用于在215處使用利用第一訓(xùn)練數(shù)據(jù)集(第一訓(xùn)練數(shù)據(jù)集可以是,可以包括被標(biāo)記的輸入數(shù)據(jù)集205和第一補充數(shù)據(jù)集兩者的組合(或“聯(lián)合”))的監(jiān)督式學(xué)習(xí)來訓(xùn)練第一分類器(或“基一些實施例中,可以省略在210處的過采樣的步驟或過采樣的結(jié)果,并且可以僅使用被標(biāo)記的輸入數(shù)據(jù)集205來訓(xùn)練第一分類器。[0044]然后,在220處,可以使用由第一分類器(例如,利用由第一分類器的訓(xùn)練產(chǎn)生的權(quán)重進行編程的、訓(xùn)練后的第一分類器或其神經(jīng)網(wǎng)絡(luò)的副本)的訓(xùn)練產(chǎn)生的模型來標(biāo)記第三數(shù)據(jù)集,以形成第三訓(xùn)練數(shù)據(jù)集。機器學(xué)習(xí)模型可以是包括分類器、回歸器、自動編碼器等的多種形式中的任一種。在225處,第三數(shù)據(jù)集可以通過使用變分自編碼器的數(shù)據(jù)擴充方法來生成,如以下進一步詳細討論的。在225處,數(shù)據(jù)擴充方法可以使用第二訓(xùn)練數(shù)據(jù)集作為輸入,該第二訓(xùn)練數(shù)據(jù)集可以是例如被標(biāo)記的輸入數(shù)據(jù)集205,或者被標(biāo)記的輸入數(shù)據(jù)集205和第一補充數(shù)據(jù)集的組合。[0045]然后,在230處,可以使用(i)被標(biāo)記的輸入數(shù)據(jù)集205的第一部分235(由數(shù)據(jù)集分離器240從被標(biāo)記的輸入數(shù)據(jù)集205產(chǎn)生)、(ii)第一補充數(shù)據(jù)集以及(iii)第三訓(xùn)練數(shù)據(jù)集據(jù)集205的第二部分250(也由數(shù)據(jù)集分離器240從被標(biāo)記的輸入數(shù)據(jù)集205產(chǎn)生)驗證由第二分類器(例如,利用由第二分類器的訓(xùn)練產(chǎn)生的權(quán)重進行編程的、訓(xùn)練后的第二分類器或其神經(jīng)網(wǎng)絡(luò)的副本)的訓(xùn)練產(chǎn)生的模型。第二部分250(用于驗證)可以與第一部分235(用于訓(xùn)練)不同,例如,第二部分250可以是被標(biāo)記的輸入數(shù)據(jù)集205的其余部分。[0046]在245處的驗證步驟中,訓(xùn)練后的第二分類器的性能(即,由第二分類器的訓(xùn)練產(chǎn)生的模型的性能)可以用于評估第二分類器是否適合用于生產(chǎn),例如,用于針對每個被制造的部件確定該被制造的部件是要使用還是丟棄(或返工)。[0047]圖3A是過采樣步驟(在圖2中的210處)的流程圖。在210處,對被標(biāo)記的輸入數(shù)據(jù)集205進行過采樣,以形成第一補充數(shù)據(jù)集(或“過采樣的數(shù)據(jù)集”)305。可以使用SMOTE(合成向每個數(shù)據(jù)元添加一個小的隨機向量(或“偏移”)來偏移所產(chǎn)生的數(shù)據(jù)元中的每個數(shù)據(jù)元,以減少第一補充數(shù)據(jù)集305的數(shù)據(jù)元可能干擾其他類(例如,可以是“良好”類的多數(shù)類)的可能性。[0048]圖3B是第一分類器的在215處(圖2)的訓(xùn)練的流程圖。在215處,使用(i)被標(biāo)記的輸入數(shù)據(jù)集205和(ii)第一補充數(shù)據(jù)集305中的一個或兩者來訓(xùn)練第一分類器,從而得到第[0049]圖3C是數(shù)據(jù)擴充(在圖2的225處)的流程圖。變分自編碼器可以包括編碼器和解碼器。編碼器可以將每個接收到的數(shù)據(jù)元映射或“編碼”為滿足以下約束條件的向量或“本征向量”:本征向量具有近似于單位高斯分布(即,近似于向量的元素是獨立的高斯分布的向量分布,例如,每個元素具有均值和方差)的分布。解碼器可以執(zhí)行編碼器的操作的近似逆;解碼器可以將編碼器產(chǎn)生的每個本征向量映射到一(合成)數(shù)據(jù)元,該數(shù)據(jù)元近似于編碼器會映射為該本征向量的數(shù)據(jù)元。編碼器和解碼器可以利用高斯分布的正則化與代表數(shù)據(jù)元的訓(xùn)練集(例如,以上提到的第二訓(xùn)練集)和代價函數(shù)一起訓(xùn)練,該代價函數(shù)是對編碼器的8輸入和解碼器的輸出之間的差的度量。一旦訓(xùn)練了編碼器和解碼器,就可以將偽隨機本征向量(被生成以具有單位高斯分布)饋入解碼器中,以生成合成數(shù)據(jù)元(例如,以生成第三數(shù)據(jù)集315(或“VAE數(shù)據(jù)集”))。如果利用來自兩個類的數(shù)據(jù)元(即,同時具有“不良好”數(shù)據(jù)元)訓(xùn)練變分自編碼器,則合成數(shù)據(jù)元可以是未標(biāo)記的。[0050]圖3D是標(biāo)記(在圖2中的220處)第三數(shù)據(jù)集以形成第三訓(xùn)練數(shù)據(jù)集的流程圖。第三數(shù)據(jù)集315通過第一分類器模型310被分類,并且第三數(shù)據(jù)集315的每個數(shù)據(jù)元被標(biāo)記,以形成第三訓(xùn)練數(shù)據(jù)集(或“被標(biāo)記的VAE數(shù)據(jù)集”)320。圖3E是訓(xùn)練第二分類器(在圖2中的230處)的流程圖。在230處,使用(i)被標(biāo)記的輸入數(shù)據(jù)集205的第一部分235(由數(shù)據(jù)集分離器240從被標(biāo)記的輸入數(shù)據(jù)集205產(chǎn)生)、(ii)第一補充數(shù)據(jù)集305以及(iii)第三訓(xùn)練數(shù)據(jù)集320中的一個或多個(或一個或多個的相應(yīng)部分)來訓(xùn)練第二分類器,從而得到第二分類器模型(或“二元分類器模型”)325。圖3F是分類器驗證(在圖2中的245處)輸入數(shù)據(jù)集205的第二部分250的每個數(shù)據(jù)元被饋入訓(xùn)練后的第二分類器(或“第二分類器模型”)325,并且在330處將產(chǎn)生的每個分類與數(shù)據(jù)元的標(biāo)記進行比較。然后基于分類與標(biāo)記相符的程度評估第二分類器的性能。[0051]圖4的表格示出了使用過采樣和原始G數(shù)據(jù)集的80%、利用基線二元分類器模型310的一個實施例執(zhí)行的測試的結(jié)果。根據(jù)圖2中圖示的方法處理包括“良好”類中的3936個數(shù)據(jù)元和“不良好”類中的22個數(shù)據(jù)元的被標(biāo)記的輸入數(shù)據(jù)集205。使用過采樣(在圖2中的210處)來將(i)“不良好”數(shù)據(jù)元與(ii)“良好”數(shù)據(jù)元的比率增加到0.1:1或1:1。圖4的表格(在第一列中)示出了所使用的訓(xùn)練數(shù)據(jù)集的“良好”數(shù)據(jù)元和“不良好”數(shù)據(jù)元的分類準確度,并且(在第二列中)示出了驗證數(shù)據(jù)集的“良好”數(shù)據(jù)元和“不良好”數(shù)據(jù)元的分類準確度。[0052]圖5的表格示出了在一個實施例中第二分類器模型325的性能測試的結(jié)果。利用(i)來自VAE的合成樣本(第三訓(xùn)練數(shù)據(jù)集320),包括3238個G樣本和6762個NG樣過過采樣產(chǎn)生的2000個NG樣本,以及(iii)從輸入數(shù)據(jù)集205中的G樣本中隨機選擇的2000[0053]可以看出,圖5中示出的性能明顯比圖4中示出的性能好,即,在分別與圖4和圖5對應(yīng)的測試中第二分類器明顯勝過第一(基線)分類器。此外,使用輸入數(shù)據(jù)集205的G樣本中較小的一部分達到了圖5的結(jié)果;輸入數(shù)據(jù)集205的G樣本的80%在產(chǎn)生圖4的結(jié)果的測試中用于訓(xùn)練分類器,然而輸入數(shù)據(jù)集205的G樣本(2000個G樣本)中只有50.8%在產(chǎn)生圖5的結(jié)果的測試中用于訓(xùn)練分類器。[0054]在一些實施例中,k折驗證用于獲得對根據(jù)本文描述的方法構(gòu)造的分類器115的準確度的更可靠的評估。[0055]在一些實施例中,第一分類器(或“第一分類器模型”310)和第二分類器(或“第二分類器模型”)325中的每一個可以是如本文所描述的適當(dāng)訓(xùn)練后的SqueezeNet、ResNet或VggNet神經(jīng)網(wǎng)絡(luò)??梢匀缭?abs/1312.6114可獲得的、D.Kingma和M.Welling的“自動編碼變化貝葉斯(Auto-EncodingVariationalBayes)”中所描述的來構(gòu)造變分自編碼器,其全部內(nèi)容通過引用合并于此。[0056]在一些實施例中,數(shù)據(jù)預(yù)處理電路110、分類器115和執(zhí)行圖2中圖示的方法的系統(tǒng)中的一個或多個以一個或多個處理電路實現(xiàn)。術(shù)語“處理電路”在本文中用于指被采用以處9理數(shù)據(jù)或數(shù)字信號的硬件、固件和軟件的任何組合。處理電路硬件可以包括例如專用集成電路(ASIC)、通用或?qū)S弥醒胩幚韱卧?CPU)、數(shù)字信號處理器(DSP)、圖形處理單元(GPU)和諸如現(xiàn)場可編程門陣列(FPGA)的可編程邏輯器件。在處理電路中,如本文中使用的,每個功能由被配置(即,被硬連線)為執(zhí)行該功能的硬件執(zhí)行,或由被配置為執(zhí)行存儲在非暫時性存儲介質(zhì)中的指令的更通用的硬件(諸如CPU)執(zhí)行。處理電路可以在單個印刷電路板(PCB)上被制作或分布在幾個互連的PCB上。處理電路可以包含其他處理電路;例如,處理電是指數(shù)據(jù)集的適當(dāng)?shù)淖蛹蛘哒麄€數(shù)據(jù)集。[0059]本文中使用的術(shù)語僅用于描述具體的實施例的目的,并且不旨在限制本發(fā)明構(gòu)度的術(shù)語,并且旨在考慮會被本領(lǐng)域普通技術(shù)人員所認識到的測量或計算的值中的固有偏合物或產(chǎn)品中任何其他單一成分的量大的成分。比較而言,術(shù)語“基本成分”是指構(gòu)成組合物、聚合物或產(chǎn)品的至少50%重量或更多的成分。如本文中使用的,術(shù)用于多個項目時是指項目的至少一半。[0060]如本文中使用的,單數(shù)形式的“一”旨在也包括復(fù)數(shù)形式,除非上下文另有明確指組件和/或其組合的存在或附加。如本文中使用的,術(shù)語“和/或”包括所關(guān)聯(lián)列出的項目中的一個或多個的任意和全部組合。諸如“…中的至少一個”的表達,在位于元件列表之后時,修飾整個元件列表并且不修飾列表的個別元件。此外,在描述本發(fā)明構(gòu)思的實施例時,使用或鄰近于另一元件或?qū)樱蛘呖梢?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論