版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利(10)授權(quán)公告號CN112669908B(21)申請?zhí)?02011104920.X(22)申請日2020.10.15(65)同一申請的已公布的文獻號申請公布號CN112669908A(43)申請公布日2021.04.16(30)優(yōu)先權(quán)數(shù)據(jù)地址中國香港新界(74)專利代理機構(gòu)北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司11204專利代理師王達佐洪欣G16H50/30(2018.0(56)對比文件方法高維數(shù)據(jù)的隨機森林.《2016Networks》.2016,第4383-4389頁.(PCA-CQR)框架在湘西流域的應(yīng)用.《AppliedSoftComputing》.2017,第51卷(第2期),第280-293頁.量敏感性分析通過主成分分析.《Reliability卷(第9期),第1-10頁.權(quán)利要求書3頁說明書9頁附圖6頁(54)發(fā)明名稱并入數(shù)據(jù)分組的預(yù)測模型(57)摘要集的預(yù)測模型。具體來講,PrismVote利用主成分分析將訓(xùn)練樣本劃分為不同的分組,并基于不同的分組構(gòu)建預(yù)測模型。對于測試樣本,根據(jù)其分組的概率,使用這個概率作為權(quán)重,將多個預(yù)2鑒定數(shù)據(jù)樣本的訓(xùn)練集,其中所述訓(xùn)練集中的每個數(shù)據(jù)樣本包括多個變量和已知結(jié)果,所述多個變量指示受試者的基因組中多個單核苷酸多態(tài)性(SNP)中的每一個是否存在,并且所述已知結(jié)果指示所述受試者的表型特征;基于所述數(shù)據(jù)樣本的相似性的測量將所述訓(xùn)練集的數(shù)據(jù)樣本分割為多個分組;訓(xùn)練每個分組的預(yù)測模型,其中所述預(yù)測模型基于所述變量預(yù)測結(jié)果的可能性,并且其中針對每個分組獨立地實施所述預(yù)測模型的訓(xùn)練;基于所述測試樣本預(yù)測所述患者的表型特征,其中預(yù)測所述患者的表型特征包括:對于每個分組,使用所述分組的預(yù)測模型來確定所述結(jié)果的概率;對于每個分組,確定所述測試樣本屬于所述分組的概率;以及基于通過所述測試樣本屬于所述分組的概率加權(quán)的每個分組的概率來計算所述測試樣本的預(yù)測結(jié)果,其中所述預(yù)測結(jié)果代表所預(yù)測的所述患者的表型特征。2.如權(quán)利要求1所述的方法,其中分割所述訓(xùn)練集的數(shù)據(jù)樣本包括:建立數(shù)據(jù)樣本的訓(xùn)練集的矩陣;從所述矩陣計算一組特征值和一組特征向量;基于所述特征值的各自大小對所述特征向量進行排序;以及使用排序的特征向量來分割所述訓(xùn)練集的數(shù)據(jù)樣本。3.如權(quán)利要求2所述的方法,其中使用排序的特征向量來分割所述訓(xùn)練集的數(shù)據(jù)樣本選擇所述排序的特征向量的子集作為顯著的特征向量;計算所述顯著的特征向量的加權(quán)平均向量,其中所述加權(quán)平均向量使用根據(jù)所述特征值確定的權(quán)重;對所述加權(quán)平均向量的分量進行排序;以及使用所述加權(quán)平均向量的分位數(shù)將來自所述訓(xùn)練集的每個數(shù)據(jù)樣本分配給所述分組中的一個。計算所述多個分組中的每一個的中心。5.如權(quán)利要求4所述的方法,其中對于每個分組,確定所述測試樣本屬于所述分組的概率包括計算所述測試樣本與所述分組的中心之間的距離度量。6.如權(quán)利要求1所述的方法,其中基于貝葉斯模型計算所述測試樣本的預(yù)測結(jié)果。7.如權(quán)利要求1所述的方法,其中所述每個分組的預(yù)測模型是廣義線性模型。8.如權(quán)利要求1所述的方法,其中所述表型特征對應(yīng)于生理特征。處理器,其連接到所述存儲器并且被配置成:鑒定數(shù)據(jù)樣本的訓(xùn)練集,其中所述訓(xùn)練集中的每個數(shù)據(jù)樣本包括多個變量和已知結(jié)果,所述多個變量指示受試者的基因組中多個單核苷酸多態(tài)性(SNP)中的每一個是否存在,3并且所述已知結(jié)果指示所述受試者的表型特征;基于所述數(shù)據(jù)樣本的相似性的測量將所述訓(xùn)練集的數(shù)據(jù)樣本分割為多個分組;訓(xùn)練每個分組的預(yù)測模型,其中所述預(yù)測模型基于變量預(yù)測結(jié)果的可能性,并且其中針對每個分組獨立地實施所述預(yù)測模型的訓(xùn)練;基于所述測試樣本預(yù)測所述患者的表型特征,其中預(yù)測所述患者的表型特征包括:對于每個分組,使用所述分組的預(yù)測模型來確定所述結(jié)果的概率;對于每個分組,確定所述測試樣本屬于所述分組的概率;以及基于通過所述測試樣本屬于所述分組的概率加權(quán)的每個分組的概率來計算所述測試樣本的預(yù)測結(jié)果,其中所述預(yù)測結(jié)果代表所預(yù)測的所述患者的表型特征。10.如權(quán)利要求9所述的計算機系統(tǒng),其中所述處理器還被配置成使得分割所述訓(xùn)練集建立數(shù)據(jù)樣本的訓(xùn)練集的矩陣;從所述矩陣計算一組特征值和一組特征向量;基于所述特征值的各自大小對所述特征向量進行排序;以及使用排序的特征向量來分割所述訓(xùn)練集的數(shù)據(jù)樣本。11.如權(quán)利要求10所述的計算機系統(tǒng),其中所述處理器還被配置成使得使用排序的特征向量來分割所述訓(xùn)練集的數(shù)據(jù)樣本,其包括:選擇所述排序的特征向量的子集作為顯著的特征向量;計算所述顯著的特征向量的加權(quán)平均向量,其中所述加權(quán)平均向量使用根據(jù)所述特征值確定的權(quán)重;對所述加權(quán)平均向量的分量進行排序;以及使用所述加權(quán)平均向量的分位數(shù)將來自所述訓(xùn)練集的每個數(shù)據(jù)樣本分配給所述分組中的一個。12.如權(quán)利要求9所述的計算機系統(tǒng),其中所述處理器還被配置成:計算所述多個分組中的每一個的中心,其中對于每個分組,確定所述測試樣本屬于所述分組的概率包括計算所述測試樣本與所述分組的中心之間的距離度量。13.如權(quán)利要求9所述的計算機系統(tǒng),其中基于貝葉斯模型計算所述測試樣本的預(yù)測結(jié)14.如權(quán)利要求9所述的計算機系統(tǒng),其中所述每個分組的預(yù)測模型是廣義線性模型。15.如權(quán)利要求9所述的計算機系統(tǒng),其中所述表型特征對應(yīng)于生理特征、疾病的存在或不存在、或?qū)χ委煹姆磻?yīng)中的一種或多種。16.計算機可讀存儲介質(zhì),其具有存儲于其中的程序代碼指令,所述程序代碼指令在由計算機系統(tǒng)的處理器執(zhí)行時使所述計算機系統(tǒng)實施以下方法,所述方法包括:鑒定數(shù)據(jù)樣本的訓(xùn)練集,其中所述訓(xùn)練集中的每個數(shù)據(jù)樣本包括多個變量和已知結(jié)果,所述多個變量指示受試者的基因組中多個單核苷酸多態(tài)性(SNP)中的每一個是否存在,并且所述已知結(jié)果指示疾病是否存在;基于所述數(shù)據(jù)樣本的相似性的測量將所述訓(xùn)練集的數(shù)據(jù)樣本分割為多個分組;4訓(xùn)練每個分組的預(yù)測模型,其中所述預(yù)測模型基于變量預(yù)測結(jié)果的可能性,并且其中針對每個分組獨立地實施所述預(yù)測模型的訓(xùn)練;基于所述測試樣本預(yù)測所述患者是否患有疾病,其中預(yù)測預(yù)測所述患者是否患有疾病對于每個分組,使用所述分組的預(yù)測模型來確定所述結(jié)果的可能性;對于每個分組,確定所述測試樣本屬于所述分組的概率;以及基于通過所述測試樣本屬于所述分組的概率加權(quán)的每個分組的概率來計算所述測試樣本的預(yù)測結(jié)果,其中所述預(yù)測結(jié)果預(yù)測所述患者是否具有所述疾病。17.如權(quán)利要求16所述的計算機可讀存儲介質(zhì),其中分割所述訓(xùn)練集的數(shù)據(jù)樣本包括:建立數(shù)據(jù)樣本的訓(xùn)練集的矩陣;從所述矩陣計算一組特征值和一組特征向量;基于所述特征值的各自大小對所述特征向量進行排序;以及使用排序的特征向量來分割所述訓(xùn)練集的數(shù)據(jù)樣本。18.如權(quán)利要求17所述的計算機可讀存儲介質(zhì),其中使用排序的特征向量來分割所述訓(xùn)練集的數(shù)據(jù)樣本包括:選擇所述排序的特征向量的子集作為顯著的特征向量;計算所述顯著的特征向量的加權(quán)平均向量,其中所述加權(quán)平均向量使用根據(jù)所述特征值確定的權(quán)重;對所述加權(quán)平均向量的分量進行排序;以及使用所述加權(quán)平均向量的分位數(shù)將來自所述訓(xùn)練集的每個數(shù)據(jù)樣本分配給所述分組中的一個。19.如權(quán)利要求16所述的計算機可讀存儲介質(zhì),其還包括:計算所述多個分組中的每一個的中心;其中對于每個分組,確定所述測試樣本屬于所述分組的概率包括計算所述測試樣本與所述分組的中心之間的距離度量。20.如權(quán)利要求16所述的計算機可讀存儲介質(zhì),其中基于貝葉斯模型計算所述測試樣本的預(yù)測結(jié)果。21.如權(quán)利要求16所述的計算機可讀存儲介質(zhì),其中所述每個分組的預(yù)測模型是廣義線性模型。5并入數(shù)據(jù)分組的預(yù)測模型[0001]相關(guān)申請的交叉引用[0002]本申請要求2019年10月15日提交的第62/915,459號美國臨時申請的優(yōu)先權(quán)。背景技術(shù)[0003]本公開內(nèi)容總體上涉及結(jié)果的預(yù)測,并且特別涉及并入數(shù)據(jù)分組的預(yù)測模型。[0004]準確的預(yù)測模型在多個領(lǐng)域都有重要的指導(dǎo)意義。例如,在醫(yī)學(xué)領(lǐng)域中,可根據(jù)特定患者的癌癥風(fēng)險提出與癌癥篩查有關(guān)的最佳建議(例如,實施篩查的頻率和/或?qū)嵤┠姆N篩查測試)。再者,如果患者患有特定疾病,則可以根據(jù)預(yù)測[0005]傳統(tǒng)上,使用諸如線性或邏輯回歸的技術(shù),可以基于一個或多個自變量生成預(yù)測。在傳統(tǒng)方法中,研究團隊設(shè)計一項研究來測試特定變量(或變量集)與特定結(jié)果相關(guān)的特定假設(shè),然后收集足以檢驗該假設(shè)的樣本數(shù)量,其中該數(shù)量是基于預(yù)期的效應(yīng)大小、要控制的潛在混淆變量等預(yù)先確定的。[0006]最近,機器學(xué)習(xí)使得個性化預(yù)測成為可能,特別是在面臨大量的潛在相關(guān)變量時。機器學(xué)習(xí)分類器通常被給予大量“訓(xùn)練”樣本,該數(shù)據(jù)集中變量和結(jié)果均已知。使用已知的訓(xùn)練程序來訓(xùn)練分類器,以優(yōu)化目標函數(shù)。通常,機器學(xué)習(xí)分類器的訓(xùn)練是動態(tài)過程,隨著新樣本被添加到訓(xùn)練數(shù)據(jù)集中,此分類器會重新訓(xùn)練以利用新的信息。發(fā)明內(nèi)容[0007]隨著數(shù)據(jù)集樣本增多,數(shù)據(jù)結(jié)構(gòu)在樣本中的差異性愈來愈明顯。這種漸增的異構(gòu)性會導(dǎo)致假設(shè)“整個訓(xùn)練數(shù)據(jù)集為同質(zhì)性群體”的預(yù)測算法的準確性降低。例如,可能對部分群體的強預(yù)測變量對于另一部分樣本幾乎沒有貢獻。[0008]所要求保護的發(fā)明的某些實施方案涉及適用于群體分層的預(yù)測的技術(shù)。利用主成分分析的方法將樣本根據(jù)數(shù)據(jù)結(jié)構(gòu)分組,并基于不同的分組構(gòu)建預(yù)測模型。對于測試樣本,根據(jù)其群體分層結(jié)構(gòu)基于貝葉斯方法計算屬于不同分組的概率,使用這個概率作為權(quán)重,將多個預(yù)測模型的預(yù)測結(jié)果進行加權(quán)求和,作為最終決策。[0009]本文所述的技術(shù)可應(yīng)用于存在樣本組間差異的任何數(shù)據(jù)集。雖然本文所述的實例涉及使用基因組數(shù)據(jù)的疾病預(yù)測,但相似的技術(shù)也可應(yīng)用于其它背景中。例如,在衛(wèi)生保健領(lǐng)域,數(shù)據(jù)可以包括除基因組數(shù)據(jù)以外的生物標志物(例如血液化學(xué)數(shù)據(jù);醫(yī)學(xué)成像數(shù)據(jù);生物計量參數(shù),如心率或血壓;家族病史;行為參數(shù)(如飲食或運動),以及預(yù)測可涉及診斷(例如,特定疾病的存在或不存在)、發(fā)展疾病的可能性、對特定療程的預(yù)期反應(yīng)等。本文所述的技術(shù)也可應(yīng)用于其它領(lǐng)域,如金融(例如,預(yù)測未來投資回報或貸款違約的可能性)、保險(例如,預(yù)測被保險人未來索賠的可能價值)等。[0010]以下詳細描述以及附圖將提供對所要求保護的發(fā)明的性質(zhì)和優(yōu)點的更好的理解。附圖說明[0011]圖1顯示了根據(jù)本發(fā)明的實施方案的用于預(yù)測結(jié)果可能性的過程的流程圖。6[0012]圖2顯示了在本發(fā)明的一些實施方案中可以與圖1的過程一起使用的用于訓(xùn)練集分組的過程的流程圖。[0013]圖3顯示了在本發(fā)明的一些實施方案中可以與圖1的過程一起使用的用于計算預(yù)測結(jié)果的過程的流程圖。[0014]圖4A-4D顯示了例示出將根據(jù)本發(fā)明的實施方案的過程應(yīng)用于模擬數(shù)據(jù)集的結(jié)果的四幅圖。[0015]圖5是例示出將根據(jù)本發(fā)明的實施方案的過程應(yīng)用于模擬數(shù)據(jù)集的結(jié)果的條形[0016]圖6是顯示使用根據(jù)本發(fā)明的實施方案的過程和全局邏輯回歸分析的阿爾茨海默病數(shù)據(jù)的接收者操作特性(ROC)曲線的圖。[0017]圖7是顯示使用根據(jù)本發(fā)明的實施方案的過程和全局邏輯回歸分析的精神分裂癥具體實施方式[0018]為了提供對所要求保護的發(fā)明的各種特征的理解,描述了其中使用基因組數(shù)據(jù)來預(yù)測個體發(fā)展特定疾病的可能性的實施方案。然而,應(yīng)理解,相同的技術(shù)可以應(yīng)用于其它類型的數(shù)據(jù),并且本發(fā)明不限于基因組數(shù)據(jù)、疾病預(yù)測或健康護理領(lǐng)域。[0020]圖1顯示了根據(jù)本發(fā)明的實施方案的用于預(yù)測結(jié)果的可能性的過程100的流程圖。過程100可以使用適當(dāng)設(shè)計的計算機系統(tǒng)來實現(xiàn)。[0021]在框102,鑒定數(shù)據(jù)樣本的訓(xùn)練集。訓(xùn)練集包含N個個體數(shù)據(jù)樣本。對于每個數(shù)據(jù)樣本x,,其包含p個自變量{x;}(對于j=1,…,p)并且已知其因變量(樣本患病情況)y,。例如,該變量集{x;;}可以代表表明p個不同的單核苷酸多態(tài)性(SNP)。對于每個SNP,變量x:;取值0、1或2,對應(yīng)于基因型中的次要等位基因的個數(shù)。例如,如果G是次要等位基因,并且觀察到的基因型是GG,則SNP值被編碼為2。如果觀察到的基因型是CC,則SNP值被編碼為0。在疾病預(yù)測中,因變量y可以指示疾病的存在(y=1)或不存在(y=0)。在諸如預(yù)測可變物理特征(例如,血糖水平或膽固醇水平)的情況下,結(jié)果y,可以是連續(xù)值的變量。根據(jù)在數(shù)據(jù)樣本x;中代表的特定信息,可以使用其它編碼方案。[0022]在框104,訓(xùn)練集數(shù)據(jù)樣本被劃分為多個分組??梢曰跇颖玖看笮?即,樣本數(shù)N)和每組最小樣本數(shù)(C)來選擇分組數(shù)。在一些實施方案中,可以在范圍2≤K≤N/C內(nèi)選擇分組數(shù)(K),具體根據(jù)自變量的多少等因素綜合而定。機器學(xué)習(xí)分類器可能需要甚至更大的訓(xùn)練集來產(chǎn)生可靠的預(yù)測模型,特別是如果變量的數(shù)量很大的情況。下面描述了在一些實施方案中可以用于優(yōu)化給定訓(xùn)練數(shù)據(jù)集的分組數(shù)的技術(shù)的實例。[0023]圖2顯示了用于分割或分組訓(xùn)練集(其可以在過程100的框104處實現(xiàn))的過程200的流程圖。過程200涉及使用訓(xùn)練數(shù)據(jù)的矩陣表示和主成分分析的元素來定義相似性。[0024]在框202,由訓(xùn)練樣本矩陣X。在一些實施方案中,矩陣X的每一行可以對應(yīng)于數(shù)據(jù)樣本x;并且每一列對應(yīng)一個自變量。因此,對于N個樣本(每個樣本具有p個變量)的訓(xùn)練數(shù)所有變量處于相似的數(shù)值范圍內(nèi)。7意味著部分特征向量分配給一個分組)解釋為祖先方向。具有前q個特征向量中的高度變異的對象在遺傳上更接近并且被分組在[0037]在框212,每個組的中心可以被計算為該組內(nèi)的最前q個特征8[0043]其中是因變量觀測,是自變量觀測矩陣,以及訓(xùn)練數(shù)據(jù)計算比如線性回歸模型的參數(shù)的技術(shù)在本領(lǐng)域中是已知的,并且可以在過程100(s)。如本文使用的,測試樣本s可以是在訓(xùn)練預(yù)測模型中未使用并且已知相關(guān)變量xs=[0050]在框110,可以基于每個分組的預(yù)測模型和測試樣本屬于該分組的概率來計算測用基于測試樣本屬于每個分組的概率的權(quán)重來組合每個分組預(yù)[0051]圖3顯示了用于計算可在框110使用的預(yù)測結(jié)果的過程300的流程圖。在框302,對于每個分組k,基于測試樣本屬于分組k的假設(shè)來計算每個分組預(yù)測(y)。例如,可以將與測9[0052]在框304,對于每個分組k,可以確定測試樣本s屬于該分組的每個分組概率。在一[0060]在框306,基于在框302確定的每組預(yù)測結(jié)果y和樣本s屬于第k組的概率來計算樣過以下給出:[0064]其中Pr(s∈k)=n/N是第k組訓(xùn)練樣本量占總訓(xùn)練樣本量的比例,其式(9)中所定義的。并且其中用于測試樣本的預(yù)測是通過根據(jù)測試樣本在特定分組中的概率組合來自不同分[0066]考慮了諸如過程100的Pris數(shù)量的變量的任意大小的數(shù)據(jù)集進行操作??梢岳缤ㄟ^實施框102-106來生成一組預(yù)測改變)。[0069]諸如過程100的PrismVote方法開發(fā)了適用于群體分層數(shù)據(jù)不同組別的預(yù)測模用所有訓(xùn)練數(shù)據(jù)訓(xùn)練的單個預(yù)測模型)更可靠的預(yù)測,可以考慮不同方法的預(yù)期預(yù)測誤差其它預(yù)測模型。=Var(Y|X=xs)+Var(fR[0072]對于具有針對每個分組的線性回歸模型的K-分組Pris[0074]其中f(X)是來自針對樣本X的第k個分組的回歸模型的預(yù)測,并且w(X)是針對樣本X第k個分組的預(yù)測的權(quán)重。樣本x來說,比全局模型預(yù)測更準確。不等式的推導(dǎo)歸納為PVI(x)>0,其中PVI(x)通過以下給出:[0077]其中是根據(jù)過程100來自第k組的最小二乘估計,是使用全局線性回歸模型(對所有樣本進行訓(xùn)練)的最小二乘估計.取測試數(shù)據(jù)集中最小的PVI值,來衡量對于整個測試數(shù)據(jù)而言,是否要實施PrismVote。[0079]當(dāng)?shù)仁?15)產(chǎn)生PVI>0時,對于所有測試樣本,預(yù)期使用利用線性回歸模型獨立地訓(xùn)練每個分組的PrismVote過程可以提供比在所有訓(xùn)練樣本上訓(xùn)練的單個線性回歸模型更好的預(yù)測性能。[0082]應(yīng)理解,也可以選擇除了由等式(16)指示的以外的K值,即使性能是次優(yōu)的。此外,若預(yù)測模型不是線性回歸模型,相似的邏輯也可用于定義預(yù)期PrismVote過程勝過單個模型和/或確定最佳分組數(shù)的條件。數(shù)從(1、2、3或4)中取值,并且假定每個分組遵循不同的線性回歸預(yù)測模型來生成數(shù)據(jù)。用對于每個數(shù)據(jù)集,由以上等式(14)定義的PVI(線411、421、431、441)和均方差(MSE)測量-1*下,當(dāng)K被選擇為真實分組數(shù)時,PVI被最大化,并且產(chǎn)生最大PVI的K值也提供最小MSE,如由以上等式(16)所指示的。[0087]為了例示出PrismVote的性能,已經(jīng)使用具有不同表型的兩個群體實施了模擬研究。生成了五種不同情境的數(shù)據(jù)。每種情境使用相同的預(yù)測器集(變量)和線性回歸模型,但針對兩個群體之間的各種自變量的效應(yīng)差(表示為平均差)不同。在情境1中,兩個群體的效應(yīng)大小之間沒有差異(平均β差為0);在情境2-4中,效應(yīng)量存在漸增的差異(平均β差為0.18、0.4、0.67);在情境5中,效應(yīng)完全不同(平均β差為1)。情境1-5的所得PVI為0.27、0.10、0.76、1.46和3.23.對于每個情境,計算全局線性回歸模型(對所有數(shù)據(jù)樣本訓(xùn)練的)和K=2的PrismVote過程的均方誤差(MSE)。[0088]圖5是比較每個情境中預(yù)測的MSE的條形圖。對于每個情境,全局(傳統(tǒng))線性回歸模型的結(jié)果在左邊,PrismVote過程的結(jié)果在右邊。從圖5中可以看出,當(dāng)存在效應(yīng)大小差[0090]使用針對每一分組的邏輯回歸預(yù)測模型的PrismVote過程已經(jīng)應(yīng)用于分別與阿爾茨海默病和精神分裂癥相關(guān)的兩個全基因組數(shù)據(jù)集。還將全局邏輯回歸預(yù)測模型應(yīng)用于相同的數(shù)據(jù)集進行比較。將每個訓(xùn)練的模型應(yīng)用于已知結(jié)果的測試數(shù)據(jù),以便評估靈敏度和特異性。[0091]圖6是顯示PrismVote過程(線602)和全局邏輯回歸(線604)的阿爾茨海默病數(shù)據(jù)的接受者操作特性(ROC)曲線的圖。在PrismVote過程的情況下,在5組交叉驗證(5GCV)中平均曲線下面積(AUC)達到74.36%,相對于常規(guī)邏輯回歸提高了3.5%。[0092]圖7是顯示PrismVote過程(線702)和全局邏輯回歸(線704)的精神分裂癥數(shù)據(jù)的高了3.1%。[0093]這些實例顯示,可以使用本文所述類型的PrismVote過程來提高預(yù)測的準確性。應(yīng)理解,這些實施例是例示性的而不是限制性的。性能可以取決于被建模的變量和結(jié)果的特定集合,以及取決于所使用的預(yù)測模型、分組數(shù)和數(shù)據(jù)集的大小。[0094]計算機系統(tǒng)實現(xiàn)[0095]本文所述類型的數(shù)據(jù)分析和計算操作可以在通常為常規(guī)設(shè)計的計算機系統(tǒng)中實現(xiàn),如臺式計算機、平板計算機、移動裝置(例如智能電話)等。這樣的系統(tǒng)可以包括執(zhí)行程序代碼的一個或多個處理器(例如,可用作中央處理單元(CPU)的通用微處理器和/或諸如圖形處理器(GPU)的專用處理器,其可以提供增強的并行處理能力);存儲程序代碼和數(shù)據(jù)風(fēng));用戶輸出裝置(例如,顯示裝置、揚聲器、打印機);組合的輸入/顯示器);信號輸入/輸出端口;網(wǎng)絡(luò)通信接口(例如,有線網(wǎng)絡(luò)接口,如以太網(wǎng)接口和/或無線網(wǎng)絡(luò)通信接口,如Wi-Fi);等。摻入所要求保護的發(fā)明的各種特征的計算機程序可以被編碼和存儲在各種計算機可讀存儲介質(zhì)上;合適的介質(zhì)包括磁盤或磁帶、諸如光盤(CD)或DVD(數(shù)字通用光盤)的光存儲介質(zhì)、閃速存儲器和其它非暫時性介質(zhì)。(應(yīng)理解,數(shù)據(jù)的“存儲”與使用諸如載波的瞬時性介質(zhì)的數(shù)據(jù)傳播不同)。用程序代碼編碼的計算機可讀介質(zhì)可以與兼容的計算機系統(tǒng)或其它電子裝置包裝在一起,或者程序代碼可以與電子裝置分開提供(例如,經(jīng)由因特網(wǎng)下載或作為單獨包裝的計算機可讀存儲介質(zhì))。[0096]如上所述,預(yù)測模型的訓(xùn)練和訓(xùn)練的預(yù)測模型至訓(xùn)練數(shù)據(jù)的應(yīng)用可以在不同的時間和/或由不同的計算機系統(tǒng)或相同的計算機系統(tǒng)實施。此外,當(dāng)有新的訓(xùn)練數(shù)據(jù)時,PrismVote過程的訓(xùn)練部分可以不時地重復(fù)。[0097]另外的實施方案[0098]雖然已經(jīng)參考特定實施方案描述了本發(fā)明,但本領(lǐng)域技術(shù)人員將理解,可以進行變化和修改。以上所述的所有過程均是例示性的并且可以被修改??梢詫⒚枋鰹閱为毧虻奶幚聿僮鹘M合,可以將操作的順序修改到邏輯允許的程度,可以改變或省略以上所述的處
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護理感染控制與公共衛(wèi)生競賽
- 2.6.6.3精神科危重患者護理常規(guī)學(xué)習(xí)培訓(xùn)課件
- 大豐市小海中學(xué)高二生物三同步課程講義第講免疫調(diào)節(jié)(四)
- 2025年辦公設(shè)備維修服務(wù)協(xié)議
- 《液體劑型保健用品生產(chǎn)技術(shù)規(guī)范》標準 征求意見稿
- 基于大數(shù)據(jù)的電子支付異常監(jiān)測系統(tǒng)
- 2025年養(yǎng)寵訓(xùn)練新工具 正向激勵A(yù)I助手評測
- 城市交通智能調(diào)控-第2篇
- 基于AI的注入攻擊檢測
- 2026 年中職掘進技術(shù)(隧道施工基礎(chǔ))試題及答案
- 后備干部考試題庫及答案2025
- 施工現(xiàn)場的安全溝通與應(yīng)急響應(yīng)方案
- 述職報告?zhèn)€人優(yōu)勢劣勢
- 燃氣管網(wǎng)輸配工程可行性研究報告
- 肉毒素除皺注射課件
- DB61-T5129-2025 陜西省房屋建筑與裝飾工程工程量計算標準
- 神奇的加密術(shù)教學(xué)設(shè)計-2025-2026學(xué)年初中數(shù)學(xué)北師大版2024八年級上冊-北師大版2024
- 光伏電站生產(chǎn)指標課件
- 轉(zhuǎn)讓專利權(quán)合同協(xié)議模板
- 2025年輔警招聘考試試題題庫含答案詳解(完整版)
- 工業(yè)廠房建設(shè)公司簡介范文
評論
0/150
提交評論