CN112272849B 用于分析染色質(zhì)相互作用數(shù)據(jù)的方法和設(shè)備(密歇根大學(xué)董事會)_第1頁
CN112272849B 用于分析染色質(zhì)相互作用數(shù)據(jù)的方法和設(shè)備(密歇根大學(xué)董事會)_第2頁
CN112272849B 用于分析染色質(zhì)相互作用數(shù)據(jù)的方法和設(shè)備(密歇根大學(xué)董事會)_第3頁
CN112272849B 用于分析染色質(zhì)相互作用數(shù)據(jù)的方法和設(shè)備(密歇根大學(xué)董事會)_第4頁
CN112272849B 用于分析染色質(zhì)相互作用數(shù)據(jù)的方法和設(shè)備(密歇根大學(xué)董事會)_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局62/6464332018.03.22USPCT/US2019/0233562019WO2019/183346EN2地址美國密歇根州司72001GenomeRewiringduringMouseNeuralDevelopment.《cell》.2017,(第171期),第560頁al..ComprehensiveMappingofLong-RangeInteractionsRevealsFoldinoftheHuman用于分析染色質(zhì)相互作用數(shù)據(jù)的方法和設(shè)備使用二叉搜索樹將基因組元件觸點(diǎn)或讀段編譯歸一化方法應(yīng)用于具有可變大小和/或形狀的所述箱對的相互作用頻率以生成每個(gè)箱對的經(jīng)歸相互作用頻率來識別具有富集的觸點(diǎn)和貧化的作9來自己發(fā)表文獻(xiàn)臨床的序列數(shù)據(jù)Z2CalebWeinrebetal..Identiofhierarchicalchromatindomains.GalipGürkanYard?mc?etal..Software31.一種用于分析染色質(zhì)的空間和時(shí)間組織的計(jì)算機(jī)實(shí)施的方法,所述方法由被編程為執(zhí)行所述方法的一個(gè)或多個(gè)處理器執(zhí)行,所述方法包括:在一個(gè)或多個(gè)處理器處獲得基因組元件的一組成對觸點(diǎn);由所述一個(gè)或多個(gè)處理器將基因組元件分割成多個(gè)箱,其中所述多個(gè)箱的箱大小不一由所述一個(gè)或多個(gè)處理器識別第一組所述多個(gè)箱和第二組所述多個(gè)箱;由所述一個(gè)或多個(gè)處理器生成n×m個(gè)箱對的矩陣,其中n對應(yīng)于所述第一組所述多個(gè)由所述一個(gè)或多個(gè)處理器識別所述箱對中的每個(gè)箱對內(nèi)的成對觸點(diǎn)的子集;由所述一個(gè)或多個(gè)處理器確定所述箱對中的每個(gè)箱對的相互作用頻率;由所述一個(gè)或多個(gè)處理器對所述相互作用頻率中的每個(gè)相互作用頻率進(jìn)行歸一化以生成每個(gè)箱對的經(jīng)歸一化的相互作用頻率;以及由所述一個(gè)或多個(gè)處理器提供染色質(zhì)相互作用的映射以在用戶界面上顯示,包含對所述箱對的指示和對經(jīng)歸一化的相互作用頻率的相應(yīng)指示,其中對所述相互作用頻率中的每個(gè)相互作用頻率進(jìn)行歸一化包含:由所述一個(gè)或多個(gè)處理器確定所述一組成對觸點(diǎn)的密度隨基因組距離的變化以生成對于所述多個(gè)箱對中的每個(gè)箱對:由所述一個(gè)或多個(gè)處理器對所述箱對的區(qū)域上的密度函數(shù)進(jìn)行積分以確定所述箱對的預(yù)期密度;由所述一個(gè)或多個(gè)處理器通過使用泊松統(tǒng)計(jì)分布執(zhí)行統(tǒng)計(jì)分析來將所述箱對內(nèi)的成對觸點(diǎn)的所述子集與所述箱對的所述預(yù)期密度進(jìn)行比較,以確定所述箱對的實(shí)際密度大于所述箱對的所述預(yù)期密度的量明顯顯著的似然度;由所述一個(gè)或多個(gè)處理器將用于多重比較控制的錯(cuò)誤發(fā)現(xiàn)率應(yīng)用于所確定的似然度以確定經(jīng)過調(diào)整的似然度;以及當(dāng)經(jīng)過調(diào)整的似然度小于閾值似然度時(shí),由所述一個(gè)或多個(gè)處理器確定所述箱對具有富集的觸點(diǎn)。2.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括:由所述一個(gè)或多個(gè)處理器使用泊松分布執(zhí)行統(tǒng)計(jì)分析以確定所述箱對的所述實(shí)際密度小于所述箱對的所述預(yù)期密度的量明顯顯著的第二似然度;由所述一個(gè)或多個(gè)處理器將用于多重比較控制的錯(cuò)誤發(fā)現(xiàn)率應(yīng)用于所確定的第二似然度以確定經(jīng)過調(diào)整的第二似然度;以及當(dāng)所述經(jīng)過調(diào)整的第二似然度小于閾值似然度時(shí),由所述一個(gè)或多個(gè)處理器確定所述箱對具有貧化的觸點(diǎn)。3.根據(jù)權(quán)利要求2所述的方法,其中所述統(tǒng)計(jì)分析包含用于確定所述箱對的所述實(shí)際密度與所述預(yù)期密度不同的量在統(tǒng)計(jì)上顯著的第三似然度的雙尾測試;由所述一個(gè)或多個(gè)處理器將用于多重比較控制的錯(cuò)誤發(fā)現(xiàn)率應(yīng)用于所確定的第三似然度以確定經(jīng)過調(diào)整的第三似然度;以及當(dāng)經(jīng)過調(diào)整的第三似然度小于閾值似然度時(shí),由所述一個(gè)或多個(gè)處理器確定所述箱對4具有富集的或貧化的觸點(diǎn)。4.根據(jù)權(quán)利要求1所述的方法,其中所述成對觸點(diǎn)中的至少一些成對觸點(diǎn)是順式觸點(diǎn),使得所述至少一些成對觸點(diǎn)中的每個(gè)成對觸點(diǎn)中的兩個(gè)基因組元件對應(yīng)于同一染色體;并且其中所述成對觸點(diǎn)中的至少一些成對觸點(diǎn)是反式觸點(diǎn),使得所述至少一些成對觸點(diǎn)中的每個(gè)成對觸點(diǎn)中的兩個(gè)基因組元件對應(yīng)于不同的染色體。5.根據(jù)權(quán)利要求1所述的方法,其中所述密度函數(shù)由經(jīng)驗(yàn)數(shù)據(jù)生成,并且所述密度函數(shù)的至少一部分隨著基因組距離的增加而減小。6.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括:由所述一個(gè)或多個(gè)處理器識別DNA序列中與一種或多種分子表型相關(guān)或以因果關(guān)系相關(guān)的單個(gè)基因座;由所述一個(gè)或多個(gè)處理器識別含有所述單個(gè)基因座的一組箱;由所述一個(gè)或多個(gè)處理器獲得受試者的染色質(zhì)相互作用數(shù)據(jù);由所述一個(gè)或多個(gè)處理器將含有所述單個(gè)基因座的所述箱的所述染色質(zhì)相互作用數(shù)據(jù)與另一個(gè)生物細(xì)胞系統(tǒng)中此類箱的觸點(diǎn)數(shù)據(jù)進(jìn)行比較;以及由所述一個(gè)或多個(gè)處理器基于所述比較預(yù)測所述受試者的分子表型。7.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括:由所述一個(gè)或多個(gè)處理器基于染色質(zhì)相互作用的所述映射生成染色體結(jié)構(gòu)的3D或4D模型。8.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括:由所述一個(gè)或多個(gè)處理器生成一組特定的基因座的空間相互作用網(wǎng)絡(luò)。9.根據(jù)權(quán)利要求1所述的方法,其中識別每個(gè)箱對內(nèi)的成對觸點(diǎn)的所述子集包含使用二叉搜索樹識別每個(gè)箱對內(nèi)的成對觸點(diǎn)的所述子集。10.根據(jù)權(quán)利要求1所述的方法,其中所述第一組所述多個(gè)箱和所述第二組所述多個(gè)箱是對應(yīng)于同一染色體的相同的箱。11.根據(jù)權(quán)利要求1所述的方法,其中每個(gè)基因組元件對應(yīng)于基因組內(nèi)的基因座;并且其中每個(gè)箱對應(yīng)于包含以下至少一種的脫氧核糖核酸(DNA)序列的連續(xù)片段:拓?fù)潢P(guān)12.根據(jù)權(quán)利要求11所述的方法,其中識別第一組所述多個(gè)箱和第二組所述多個(gè)箱包含接收對所述第一組箱和所述第二組箱的選擇,以對長程相互作用進(jìn)行全基因組搜索、對調(diào)節(jié)回路進(jìn)行全基因組映射、對長程相互作用中的細(xì)胞間類型可變性進(jìn)行綜合評估,或者識別一組基于Hi-C的診斷和預(yù)后生物標(biāo)記。13.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括:對于所述箱對中的一個(gè)或多個(gè)箱對,由所述一個(gè)或多個(gè)處理器將來自第一生物細(xì)胞系統(tǒng)或生理?xiàng)l件的所述箱對的實(shí)際密度與來自第二生物細(xì)胞系統(tǒng)或生理?xiàng)l件的所述箱對的實(shí)際密度進(jìn)行比較以識別差異性觸點(diǎn)。14.一種用于分析染色質(zhì)的空間和時(shí)間組織的計(jì)算裝置,所述計(jì)算裝置包括:通信網(wǎng)絡(luò);5非暫時(shí)性計(jì)算機(jī)可讀存儲器,所述非暫時(shí)性計(jì)算機(jī)可讀存儲器耦接到所述一個(gè)或多個(gè)處理器并且在其上存儲指令,所述指令當(dāng)由所述一個(gè)或多個(gè)處理器執(zhí)行時(shí)使所述計(jì)算裝獲得基因組元件的一組成對觸點(diǎn);將基因組元件分割成多個(gè)箱,其中所述多個(gè)箱的箱大小不一致;識別第一組所述多個(gè)箱和第二組所述多個(gè)箱;生成n×m個(gè)箱對的矩陣,其中n對應(yīng)于所述第一組所述多個(gè)箱,并且m對應(yīng)于所述第二組所述多個(gè)箱;識別所述箱對中的每個(gè)箱對內(nèi)的成對觸點(diǎn)的子集;確定所述箱對中的每個(gè)箱對的相互作用頻率;對所述相互作用頻率中的每個(gè)相互作用頻率進(jìn)行歸一化以生成每個(gè)箱對的經(jīng)歸一化經(jīng)由所述通信網(wǎng)絡(luò)提供染色質(zhì)相互作用的映射以在用戶界面上顯示,包含對所述箱對的指示和對經(jīng)歸一化的相互作用頻率的相應(yīng)指示,其中為了對所述相互作用頻率中的每個(gè)相互作用頻率進(jìn)行歸一化,所述指令使得所述計(jì)算裝置:確定所述一組成對觸點(diǎn)的密度隨基因組距離的變化以生成密度函數(shù);對于所述多個(gè)箱對中的每個(gè)箱對:對所述箱對的區(qū)域上的密度函數(shù)進(jìn)行積分以確定所述箱對的預(yù)期密度;通過使用泊松統(tǒng)計(jì)分布執(zhí)行統(tǒng)計(jì)分析來將所述箱對內(nèi)的成對觸點(diǎn)的所述子集與所述箱對的所述預(yù)期密度進(jìn)行比較,以確定所述箱對的實(shí)際密度大于所述箱對的所述預(yù)期密度的量明顯顯著的似然度;將用于多重比較控制的錯(cuò)誤發(fā)現(xiàn)率應(yīng)用于所確定的似然度以確定經(jīng)過調(diào)整的似然度;并且當(dāng)經(jīng)過調(diào)整的似然度小于閾值似然度時(shí),確定所述箱對具有富集的觸點(diǎn),其中所述密度函數(shù)由經(jīng)驗(yàn)數(shù)據(jù)產(chǎn)生,并且所述密度函數(shù)的至少一部分隨著基因組距離的增加而減小。15.根據(jù)權(quán)利要求14所述的計(jì)算裝置,其中所述指令進(jìn)一步使所述計(jì)算裝置:識別DNA序列中與一種或多種分子表型相關(guān)或以因果關(guān)系相關(guān)的單個(gè)基因座;識別含有所述單個(gè)基因座的一組箱;獲得受試者的染色質(zhì)相互作用數(shù)據(jù);將含有所述單個(gè)基因座的所述箱的所述染色質(zhì)相互作用數(shù)據(jù)與另一個(gè)生物細(xì)胞系統(tǒng)中此類箱的觸點(diǎn)數(shù)據(jù)進(jìn)行比較;并且基于所述比較預(yù)測所述受試者的分子表型。16.根據(jù)權(quán)利要求14所述的計(jì)算裝置,其中所述指令進(jìn)一步使所述計(jì)算裝置:基于染色質(zhì)相互作用的所述映射生成染色體結(jié)構(gòu)的3D或4D模型;或生成一組特定的基因座的空間相互作用網(wǎng)絡(luò)。17.根據(jù)權(quán)利要求14所述的計(jì)算裝置,其中使用二叉搜索樹來識別每個(gè)箱對內(nèi)的成對觸點(diǎn)的所述子集,其中所述第一組所述多個(gè)箱和所述第二組所述多個(gè)箱是對應(yīng)于同一染色體的相同的箱,其中每個(gè)基因組元件對應(yīng)于基因組內(nèi)的基因座,并且其中每個(gè)箱對應(yīng)于包6質(zhì)狀態(tài)片段、環(huán)狀結(jié)構(gòu)域或染色質(zhì)結(jié)構(gòu)域。18.根據(jù)權(quán)利要求17所述的計(jì)算裝置,其中為了識別第一組所述多個(gè)箱和第二組所述多個(gè)箱,所述指令使得所述計(jì)算裝置接收對所述第一組箱和所述第二組箱的選擇,以對長程相互作用進(jìn)行全基因組搜索、對調(diào)節(jié)回路進(jìn)行全基因組映射、對長程相互作用中的細(xì)胞間類型可變性進(jìn)行綜合評估,或者識別一組基于Hi-C的診斷和預(yù)后生物標(biāo)記。7[0001]相關(guān)申請的交叉引用[0002]本申請要求于2018年3月22日提交的標(biāo)題為“染色質(zhì)相互作用數(shù)據(jù)分析的方法和設(shè)備(MethodandApparatusforAnalysisofChromatinInteractionData)”的美國臨時(shí)申請序列號62/646,433的優(yōu)先權(quán)和申請日的權(quán)益,所述文獻(xiàn)的全部公開內(nèi)容均在此通過引用明確并入本文。技術(shù)領(lǐng)域[0003]本申請涉及染色質(zhì)相互作用分析,并且,更具體地說,涉及一種利用統(tǒng)計(jì)技術(shù)使用可變大小的箱有效識別基因組元件的觸點(diǎn)的方法和系統(tǒng)。背景技術(shù)[0004]今天,基因組元件觸點(diǎn)使用Hi-C測序或其它類似方法進(jìn)行映射,如基因組結(jié)構(gòu)映用于產(chǎn)生Hi-C測序庫的生物細(xì)胞樣品中具有空間觸點(diǎn)的基因組位置對。將多個(gè)這樣的成對末端讀段編譯成表示基因組位置對在空間上相互作用的頻率的圖或頻率矩陣。[0005]為了執(zhí)行映射,將數(shù)據(jù)集編譯到固定大小的箱中,這些箱是彼此相鄰的基因組的大小均勻的部分。然而,這種方法需要選擇固定的分辨率,這使其帶有固有的局限性。在低分辨率下,關(guān)注的基因座與不相關(guān)的基因座結(jié)合,而其它基因座被分成兩半?;蛲ǔS稍鰪?qiáng)子元件調(diào)節(jié),所述增強(qiáng)子元件在序列空間中距所述基因很遠(yuǎn),稱為遠(yuǎn)側(cè)順式,或者位于不同的染色體上,稱為反式。然而,由于數(shù)據(jù)稀疏,這些方法在檢測遠(yuǎn)側(cè)增強(qiáng)子相互作用方面表現(xiàn)不佳。反式和遠(yuǎn)側(cè)順式相互作用出現(xiàn)嚴(yán)重的數(shù)據(jù)稀疏,因?yàn)榫€性基因組中的讀段對被映射到面積超過九百萬平方兆堿基(Mb)的正方形基因組中。在高分辨率下,這一方法非常[0006]此外,讀段密度隨基因組距離變化五個(gè)數(shù)量級,大多數(shù)測得的相互作用集中在軸上。因此,對于固定的箱,精細(xì)的分辨率將導(dǎo)致99.9%以上的全基略的分辨率將完全不能受益于功能元件的長程觸點(diǎn)的調(diào)解,從而將它們切成碎片并將其與相鄰序列區(qū)域結(jié)合,從而耗散研究人員希望檢測的信號。[0007]拓?fù)潢P(guān)聯(lián)結(jié)構(gòu)域(TAD)已被確定為有效的空間和功能基因組。人類基因組約80%的序列長度被分成約2500個(gè)TAD,這是非常穩(wěn)健的,在人體細(xì)胞類型之間、不同人體之間以及疾病狀態(tài)下都非常保守。TAD也起復(fù)制結(jié)構(gòu)域的作用。此外,TAD介導(dǎo)長程空間相互作用:在正方形基因組的任何給定部分中的接觸頻率將與同一TAD對中的更遠(yuǎn)序列部分比跨越TAD邊界的近側(cè)序列部分更密切相關(guān)。[0008]最近的工作已經(jīng)開始解決固定箱的缺點(diǎn)。SHAMAN包省去了固定的箱和矩陣編譯,并采用了不同的方法來檢測觸點(diǎn)。其使用一個(gè)基對分辨率的稀疏矩陣,然后生成一個(gè)滿足從真實(shí)矩陣中采樣的距離頻率和邊緣覆蓋標(biāo)準(zhǔn)的隨機(jī)矩陣。其使用這種隨機(jī)矩陣與真實(shí)矩陣進(jìn)行比較,生成p值,然后將p值與FDR統(tǒng)計(jì)進(jìn)行比較,以解決Hi-C矩陣中的隨機(jī)誤差。但8是,p值是根據(jù)數(shù)據(jù)庫中每個(gè)單獨(dú)讀段對周圍的K最近近鄰聚類密度的Kolmogorov-SmirnovD統(tǒng)計(jì)數(shù)據(jù)生成的。具有顯著密集的K個(gè)最近近鄰的對可以被認(rèn)為是富集的。因此,為特定實(shí)驗(yàn)選擇K值表示分辨率和統(tǒng)計(jì)能力之間的重要權(quán)衡,很像傳統(tǒng)Hi-C編譯中的箱大小選擇。一個(gè)特定讀段對的K個(gè)最近近鄰可能不會被顯著地富集,而讀段對所在的整個(gè)TAD對可能被將在任何情況下改變?nèi)蚪M。此外,與具有強(qiáng)聚類的TAD對相鄰的讀段對可以“收起(stowaway)”在序列接近的密集讀段上,從而以固定箱的方式產(chǎn)生近鄰溢出觸點(diǎn)檢測。[0010]因此,與現(xiàn)有系統(tǒng)相比,需要一種精確映射基因組元件觸點(diǎn)的系統(tǒng),以保持高精度并減少存儲器需求和計(jì)算資源。還需要一種在同一個(gè)箱中分割相關(guān)的基因座并且不將基因座分成兩半以檢測由功能元件介導(dǎo)的長程順式和反式相互作用的系統(tǒng)。發(fā)明內(nèi)容[0011]為了對基因組元件觸點(diǎn)進(jìn)行映射,染色質(zhì)相互作用系統(tǒng)獲得一組基因組元件(例如,基因座),并將所述一組元件分割成不同大小的箱??梢詫⑾溥x擇為在同一個(gè)箱中包含相關(guān)的基因組元件并防止將基因組元件分成兩半。例如,每個(gè)箱可以對應(yīng)于脫氧核糖核酸(DNA)序列的連續(xù)片段,并且可以表示如基因、染色質(zhì)狀態(tài)片段、環(huán)狀結(jié)構(gòu)域、染色質(zhì)結(jié)構(gòu)域、拓?fù)潢P(guān)聯(lián)結(jié)構(gòu)域(TAD)等切割位點(diǎn)增量或功能元件。然后選擇兩組箱(例如,對應(yīng)于染色體1的第一組箱和對應(yīng)于染色體8的第二組箱),并將其放置在n×m矩陣(正方形基因組區(qū)域)中,以生成一組箱對。因此,正方形基因組區(qū)域可以具有可變的例中,兩組箱是相同的(例如,每個(gè)對應(yīng)于染色體1)。在任何情況下,用例如二叉搜索樹識別與成對末端讀段對應(yīng)的位置對或具有可能含有所述位置對的箱對的其它在空間上相互作用的位置(即其中所述箱中的一個(gè)箱含有所述基因座中的一個(gè)基因座,并且另一個(gè)箱含有另一個(gè)基因座)(例如Chr1:950000和Chr8:15000)。[0012]然后,基于對應(yīng)的箱對內(nèi)的基因組元件觸點(diǎn),產(chǎn)生每個(gè)箱對的相互作用頻率。此外,根據(jù)每個(gè)箱對內(nèi)的成對觸點(diǎn)的密度隨基因組距離的變化來對相互作用頻率進(jìn)行歸一化。更具體地說,可以確定成對觸點(diǎn)的密度隨基因組距離的變化以生成密度函數(shù)。這種函數(shù)可以針對特定箱序列中的GC序列百分比、Hi-C測序數(shù)據(jù)集中特定箱序列的序列覆蓋率或用于Hi-C歸一化的其它適當(dāng)因素進(jìn)行校正。然后,對于特定的箱對,在箱對的正方形基因組區(qū)域上對密度函數(shù)進(jìn)行積分,以確定箱對的預(yù)期密度。然后,可以使用例如統(tǒng)計(jì)測試(如泊松分布p值(例如可以向其應(yīng)用Benjamini錯(cuò)誤發(fā)現(xiàn)率))將箱對的預(yù)期密度與實(shí)際密度(即箱對的正方形基因組區(qū)域內(nèi)的成對觸點(diǎn)的數(shù)量)進(jìn)行比較,以在局部或全基因組的基礎(chǔ)上以針對距離(和其它適當(dāng)?shù)奶卣?進(jìn)行調(diào)整的方式生成富集和貧化染色質(zhì)觸點(diǎn)的集合。染色質(zhì)相互作用系統(tǒng)然后可以提供用于在用戶界面上顯示對具有例如富集或貧化的觸點(diǎn)的箱對的指示。[0013]以這種方式,富集或貧化的觸點(diǎn)可以用于基于相應(yīng)基因組內(nèi)基因座的空間相互作用預(yù)測受試者的分子表型。富集或貧化的觸點(diǎn)也可以用于對染色體的3D和4D結(jié)構(gòu)進(jìn)行建或貧化的觸點(diǎn)可以用于確定特定組織或細(xì)胞系中的一對基因座是否相互作用。此外,富集9或貧化的觸點(diǎn)可以用于定位功能性TAD的反式和遠(yuǎn)側(cè)順式結(jié)合配偶體,并構(gòu)建空間觸點(diǎn)網(wǎng)絡(luò)。本實(shí)施例有利地在具有固定大小和間距的可比箱的相同數(shù)據(jù)集中檢測使用傳統(tǒng)方法的現(xiàn)有系統(tǒng)中沒有發(fā)現(xiàn)的長程觸點(diǎn)。在實(shí)驗(yàn)中,與傳統(tǒng)方法相比,本發(fā)明的實(shí)施例檢測到TAD之間2.5倍的顯著長程順式相互作用。[0014]此外,與傳統(tǒng)方法相比,通過使用可變箱大小,本實(shí)施例有利地減少了映射空間相互作用的存儲器需求和計(jì)算資源。與傳統(tǒng)方法一樣,使用固定大小的箱來映射空間相互作用時(shí),必須選擇高到足以確保每個(gè)箱的邊界都在選定的范圍內(nèi)的分辨率。例如,當(dāng)使用固定大小的箱來映射TAD之間的空間相互作用時(shí),必須將分辨率選擇成使得對應(yīng)于每個(gè)箱的DNA序列片段比最短的TAD短。換句話說,如果最小的TAD是100千堿基(kB),那么固定大小的箱10kB),并且聚集了幾個(gè)箱。另一方面,使用可變的箱大小,本實(shí)施例將箱選擇成使得每個(gè)箱表示不同的TAD(或其它功能元件,如基因、染色質(zhì)狀態(tài)片段、環(huán)狀結(jié)構(gòu)域、染色質(zhì)結(jié)構(gòu)域等),而不管其長度如何。例如,如果平均TAD是1兆堿基(MB)長,則本實(shí)施例可以有效地使用1MB分辨率來映射相同功能元件(TAD)的空間相互作用,相比之下,使用傳統(tǒng)方法來映射TAD之間的空間相互作用的分辨率為1kB或10kB。因此,與傳統(tǒng)方法相比,本實(shí)施例的存儲器密集度和計(jì)算復(fù)雜度較低。其中n是讀段對的數(shù)量,k是正方形矩陣中的箱的數(shù)量,每個(gè)步驟的復(fù)雜度對于對準(zhǔn)和質(zhì)量控制為大約0(n),對于編譯為大約0(n*log(k)),對于積分大約為0(k),對于統(tǒng)計(jì)控制和數(shù)據(jù)輸出為大約0(k^2)。下面參考圖8對這些步驟中的每一個(gè)進(jìn)行進(jìn)一步的詳細(xì)描述。[0015]在一個(gè)實(shí)施例中,提供了一種用于分析染色質(zhì)的空間和時(shí)間組織的計(jì)算機(jī)實(shí)施的方法。所述方法包含獲得基因組元件的一組成對觸點(diǎn),將基因組元件分割成多個(gè)箱,其中所述多個(gè)箱的箱大小不一致,識別第一組多個(gè)箱和第二組多個(gè)箱,并生成n×m個(gè)箱對的矩陣,其中n對應(yīng)于第一組多個(gè)箱,并且m對應(yīng)于第二組多個(gè)箱。所述方法進(jìn)一步包含:識別所述箱對中的每個(gè)箱對內(nèi)的成對觸點(diǎn)的子集,確定所述箱對中的每個(gè)箱對的相互作用頻率,對所述相互作用頻率中的每個(gè)相互作用頻率進(jìn)行歸一化以生成每個(gè)箱對的經(jīng)歸一化的相互作用頻率,以及提供用于在用戶界面上顯示的染色質(zhì)相互作用的映射,包含對所述箱對的指示和對經(jīng)歸一化的相互作用頻率的相應(yīng)指示。[0016]在另一個(gè)實(shí)施例中,提供了一種用于分析染色質(zhì)的空間和時(shí)間組織的計(jì)算裝置。所述計(jì)算裝置包含通信網(wǎng)絡(luò)、一個(gè)或多個(gè)處理器以及耦接到所述一個(gè)或多個(gè)處理器并在其上存儲指令的非暫時(shí)性計(jì)算機(jī)可讀存儲器。當(dāng)由所述一個(gè)或多個(gè)處理器執(zhí)行時(shí),所述指令使所述系統(tǒng)獲得基因組元件的一組成對觸點(diǎn),將基因組元件分割成多個(gè)箱,其中所述多個(gè)箱的箱大小不一致,識別第一組所述多個(gè)箱和第二組所述多個(gè)箱,并生成n×m個(gè)箱對的矩陣,其中n對應(yīng)于所述第一組所述多個(gè)箱,并且m對應(yīng)于所述第二組所述多個(gè)箱。所述指令進(jìn)一步使得所述系統(tǒng)識別所述箱對中的每個(gè)箱對內(nèi)的成對觸點(diǎn)的子集,確定所述箱對中的每個(gè)箱對的相互作用頻率,對所述相互作用頻率中的每個(gè)相互作用頻率進(jìn)行歸一化以生成每個(gè)箱對的經(jīng)歸一化的相互作用頻率,并且通過所述通信網(wǎng)絡(luò)提供用于在用戶界面上顯示的染色質(zhì)相互作用的映射,包含對所述箱對的指示和對經(jīng)歸一化的相互作用頻率的相應(yīng)指附圖說明[0017]圖1A展示了根據(jù)當(dāng)前描述的實(shí)施例的示例性染色質(zhì)相互作用系統(tǒng)可以在其上操作的計(jì)算機(jī)網(wǎng)絡(luò)和系統(tǒng)的框圖;[0018]圖1B是根據(jù)當(dāng)前描述的實(shí)施例的可以在圖1A的系統(tǒng)中操作的示例性染色質(zhì)相互作用服務(wù)器的框圖;[0019]圖1C是根據(jù)當(dāng)前描述的實(shí)施例的可以在圖1A的系統(tǒng)中操作的示例性客戶端裝置[0020]圖2描繪了根據(jù)當(dāng)前描述的實(shí)施例的一組示例箱,每個(gè)箱對應(yīng)于染色體中基因座的連續(xù)片段;[0021]圖3描繪了根據(jù)當(dāng)前描述的實(shí)施例的箱對的示例正方形基因組矩陣;[0022]圖4描繪了根據(jù)當(dāng)前描述的實(shí)施例的箱對和相應(yīng)的經(jīng)歸一化的相互作用頻率的示例空間相互作用圖;[0023]圖5描繪了根據(jù)當(dāng)前描述的實(shí)施例的示例密度函數(shù),每個(gè)密度函數(shù)表示成對觸點(diǎn)的密度隨基因組距離的變化;[0024]圖6是表示用于從受試者的生物樣品中生成染色質(zhì)相互作用數(shù)據(jù)的示例性過程的[0025]圖7A描述了根據(jù)當(dāng)前描述的實(shí)施例的富集的觸點(diǎn)和對應(yīng)的基因座和/或與分子表型相關(guān)的單核苷酸多態(tài)性(SNP)的示例顯示;[0026]圖7B描繪了根據(jù)當(dāng)前描述的實(shí)施例的從空間相互作用數(shù)據(jù)生成的示例染色質(zhì)相互作用網(wǎng)絡(luò);[0027]圖8展示了根據(jù)當(dāng)前描述的實(shí)施例的表示用于分析染色質(zhì)空間組織的示例性方法[0028]圖9展示了對描述由染色質(zhì)相互作用系統(tǒng)識別的觸點(diǎn)數(shù)量和由替代系統(tǒng)識別的觸點(diǎn)數(shù)量進(jìn)行比較的維恩圖。具體實(shí)施方式[0029]盡管以下文本闡述了許多不同實(shí)施例的詳細(xì)描述,但是應(yīng)當(dāng)理解的是,這一描述的法律范圍由在本公開結(jié)尾處闡述的權(quán)利要求書的文字來定義。詳細(xì)描述應(yīng)被解釋為僅是示例性的,并且未描述每個(gè)可能的實(shí)施例,因?yàn)槊枋雒總€(gè)可能的實(shí)施例將是不切實(shí)際的,即使不是不可能的??梢允褂卯?dāng)前技術(shù)或在本專利申請日之后開發(fā)的技術(shù)來實(shí)施許多替代性實(shí)施例,所述實(shí)施例將仍落入權(quán)利要求書的范圍內(nèi)。定為意味著……”或類似的句子中明確定義術(shù)語,否則無意限制所述術(shù)語的含義,無論是明示的還是通過暗示,超出其平常或普通含義,并且此術(shù)語不應(yīng)被解釋為在基于本專利的任何章節(jié)中作出的任何陳述(權(quán)利要求書的語言除外)的范圍上受到限制。就以與單個(gè)含義一致的方式在本專利中參考在本專利的結(jié)尾處的權(quán)利要求書中敘述的任何術(shù)語來說,這樣做僅為了清晰起見,以便不使讀者混淆,并且并不旨在將此權(quán)利要求術(shù)語通過暗示或以其它方式限制于所述單個(gè)含義。最后,除非通過引用單詞“構(gòu)件”和沒有任何結(jié)構(gòu)的敘述的功能來限定權(quán)利要求要素,否則不旨在根據(jù)35U.S.C.§112的申請(第六段)來解釋任何權(quán)利11要求要素的范圍。[0032]另外,如本文所用,術(shù)語“基因組元件”可以指脫氧核糖核酸(DNA)序列的特定單[0033]如本文所用,術(shù)語“箱”可以指人類或其它生物體的被認(rèn)為是染色質(zhì)觸點(diǎn)分析的一個(gè)單元的基因組內(nèi)的DNA序列的連續(xù)片段。這種箱可以根據(jù)特定分析針對各種目的進(jìn)行選或這些元件的組合的序列區(qū)域。[0034]此外,如本文所用,術(shù)語“箱對”可以指與線性基因組空間中表示的兩個(gè)箱的笛卡爾乘積(Cartesianproduct)對應(yīng)于的正方形基因組空間中的矩形區(qū)域。這個(gè)術(shù)語也可以指被視為是一對的兩個(gè)箱,而不是由所述對表示的正方形基因組空間的區(qū)域?;蚱渌飳W(xué)結(jié)果是臨床或研究興趣、研究或努力的目標(biāo)。[0036]如本文所用,術(shù)語“藥理學(xué)表型”可以指在臨床護(hù)理、臨床護(hù)理的管理和財(cái)務(wù)以及對人類和其它生物體的制藥以及其它醫(yī)學(xué)和生物醫(yī)學(xué)研究方面可能影響藥物治療、受試者壽命和結(jié)果、生活質(zhì)量等的任何可辨別的表型。此類表型可以包含藥代動(dòng)力學(xué)(PK)和藥效動(dòng)力學(xué)(PD)表型,包含藥物的吸收、分布、代謝和排泄(事件、不良藥物反應(yīng)和不良藥物事件或不良藥物反應(yīng)的對應(yīng)嚴(yán)重程度、器官損傷、藥物濫用和依賴性及其可能性,以及體重及其變化、情緒和行為變化及干擾。此類表型還可包含對藥物組合、藥物與基因的相互作用、社會和環(huán)境因素、飲食因素等的有利和不利的反應(yīng)。所述表型也可以包含遵守藥理學(xué)或非藥理學(xué)治療方案。所述表型還可能包含醫(yī)學(xué)表型,如受試者感染某種疾病或并發(fā)癥的傾向、疾病的結(jié)果和預(yù)后、受試者是否會出現(xiàn)特定的疾病癥狀以及受試者的結(jié)果(如壽命、臨床評分和參數(shù)、測試結(jié)果、醫(yī)療保[0037]如本文所用,術(shù)語“分子表型”可以指能夠在特定的時(shí)間點(diǎn)或回顧點(diǎn)中單獨(dú)地或總體地測量或辨別并且可以出于任何有用的目的而被檢測、評估、估計(jì)或修飾、影響或改變的人類或其它生物體的藥理學(xué)表型或任何其它表型。[0038]總體而言,可以在一個(gè)或多個(gè)客戶端裝置、一個(gè)或多個(gè)網(wǎng)絡(luò)服務(wù)器或者包含這些裝置的組合的系統(tǒng)中實(shí)施用于映射空間相互作用的技術(shù)。然而,為了清楚起見,下面的實(shí)例主要集中于一個(gè)實(shí)施例,其中染色質(zhì)相互作用服務(wù)器獲得一組讀段對或成對基因組元件觸點(diǎn),如一對基因座(例如Chr1:950000,Chr8:15000)。染色質(zhì)相互作用服務(wù)器還獲得一組從研究人員或醫(yī)療保健專業(yè)人員的客戶端裝置獲得。例如,研究人員或醫(yī)療保健專業(yè)人員可以選擇一組特定的讀段對進(jìn)行分析。此外,研究人員或醫(yī)療保健專業(yè)人員可以以特定的分辨率選擇一組特定的箱。例如,研究人員或醫(yī)療保健專業(yè)人員可以選擇其中每個(gè)箱表示不同的TAD的一組箱。在另一個(gè)實(shí)例中,研究人員或醫(yī)療保健專業(yè)人員可以選擇其中每個(gè)箱表示不同的基因的一組箱。服務(wù)器選擇兩組箱(例如,第一組箱對應(yīng)于染色體2,第二組箱對應(yīng)于染色體5,兩組相同的1010,Chr8:15000分配給箱對Chr1:1000-2000*Chr8:10000-20000,因?yàn)檫@一讀段對位于函數(shù)可以針對特定箱序列中的GC序列百分比、Hi-C測序數(shù)據(jù)集中特定箱序列的序列覆蓋可以使用統(tǒng)計(jì)方法(例如泊松分布p值)(例如可以向其應(yīng)用Benjamini錯(cuò)誤發(fā)現(xiàn)率)將箱對相互作用服務(wù)器可以向客戶端裝置提供對箱對的指示和對其相應(yīng)的經(jīng)歸一化相互作用頻通過例如單獨(dú)比較來自每個(gè)數(shù)據(jù)集的富集和貧化觸點(diǎn)來確定例如一對觸點(diǎn)組之間的一組[0042]參考圖1A,示例染色質(zhì)相互作用系統(tǒng)100識別選定的一組讀段對和箱的箱對內(nèi)的互作用以及其它形式的臨床和/或全景信息使用別處描述的其它方法來進(jìn)行。富集或貧化的觸點(diǎn)也可以用于對細(xì)胞核內(nèi)染色體或基因組的3D和4D結(jié)構(gòu)進(jìn)行建模,并識別組織樣品中改變的TAD邊界和空間相互作用,以確定遺傳病或腫瘤學(xué)。此外,富集或貧化的觸點(diǎn)可以用于確定特定組織或細(xì)胞系中的一對基因座是否相互作用。[0043]染色質(zhì)相互作用系統(tǒng)100包含染色質(zhì)相互作用服務(wù)器102和可以通過網(wǎng)絡(luò)130通信連接的多個(gè)客戶端裝置106-116,如下所述。在一個(gè)實(shí)施例中,染色質(zhì)相互作用服務(wù)器102和客戶端裝置106-116可以在通信網(wǎng)絡(luò)130上通過無線信號120進(jìn)行通信,所述通信網(wǎng)絡(luò)可以是任何合適的局域網(wǎng)或廣域網(wǎng),包含WiFi網(wǎng)絡(luò)、藍(lán)牙網(wǎng)絡(luò)、蜂窩網(wǎng)絡(luò)(如3G、4G、長期演進(jìn) 裝置118與通信網(wǎng)絡(luò)130進(jìn)行通信,所述無線或有線裝置可以是無線路由器、無線中繼器、移動(dòng)電話提供商的基站收發(fā)器等。舉例來說,客戶端裝置106-116可以包含平板計(jì)算機(jī)106、測序儀107、支持網(wǎng)絡(luò)的蜂窩電話108、包含來自已發(fā)表文獻(xiàn)、臨床列數(shù)據(jù)的序列數(shù)據(jù)庫109、個(gè)人數(shù)字助理(PDA)110、移動(dòng)裝置智能電話112(本文中也稱為“移動(dòng)裝置”)、膝上型計(jì)算機(jī)114、臺式計(jì)算機(jī)116、可佩戴生物傳感器、便攜式媒體播放器 (未示出)、平板電腦、任何配置用于有線或無線RF(射頻)通信的裝置等。此外,記錄受試者的基因組數(shù)據(jù)、接收多組讀段對/箱、或顯示對富集觸點(diǎn)的指示的任何其它合適的客戶端裝置也可以與染色質(zhì)相互作用服務(wù)器102進(jìn)行通信。[0044]客戶端裝置106-116中的每一個(gè)可以與染色質(zhì)相互作用服務(wù)器102交互,以提供選定的一組讀段對和/或選定的多組箱。例如,測序儀107可以產(chǎn)生提供給染色質(zhì)相互作用服務(wù)器102的序列數(shù)據(jù)。在又一個(gè)實(shí)例中,序列數(shù)據(jù)庫109可以向染色質(zhì)相互作用服務(wù)器102提供從例如已發(fā)表的文獻(xiàn)、臨床試驗(yàn)、聯(lián)合會、學(xué)術(shù)界等產(chǎn)生的預(yù)先存在的序列數(shù)據(jù)。染色質(zhì)相互作用服務(wù)器102然后可以從序列數(shù)據(jù)中識別一組讀段對和/或多組箱。每個(gè)客戶端裝置106-116還可以與染色質(zhì)相互作用服務(wù)器102交互,以接收對箱對的一個(gè)或多個(gè)指示和對箱對的經(jīng)歸一化相互作用頻率的指示。指示可以是數(shù)字指示,并且客戶端裝置可以通過用于向醫(yī)療保健專業(yè)人員或研究人員顯示的用戶界面呈現(xiàn)數(shù)字指示??蛻舳搜b置還可以呈現(xiàn)箱對和經(jīng)歸一化相互作用頻率的圖形表示,如熱圖,其中對應(yīng)于具有較高經(jīng)歸一化相互作用頻率的箱對(例如,富集的觸點(diǎn))的正方形基因組區(qū)域以較暗的顏色突出顯示。[0045]在示例實(shí)施方案中,染色質(zhì)相互作用服務(wù)器102可以是基于云的服務(wù)器、應(yīng)用服務(wù)器、網(wǎng)絡(luò)服務(wù)器等,并且包含存儲器150、一個(gè)或多個(gè)處理器(CPU)142(如耦接到存儲器150的微處理器)、網(wǎng)絡(luò)接口單元144和I/0模塊148,所述I/0模塊例如可以是鍵盤或觸摸屏。[0046]染色質(zhì)相互作用服務(wù)器102也可以通信地連接到讀段對和箱的數(shù)據(jù)庫154。例如,數(shù)據(jù)庫154可以存儲跨基因組或基因組的一部分的箱的集合,其中每個(gè)箱表示對應(yīng)于TAD的一組基因座(例如,Chr1:1280000-1840000)。在一些實(shí)施例中,染色質(zhì)相互作用服務(wù)器102可以從數(shù)據(jù)庫154中檢索一組讀段對和/或多組箱。在其它實(shí)施例中,所述一組讀段對和/或多組箱由客戶端裝置106-116提供。在又其它實(shí)施例中,染色質(zhì)相互作用服務(wù)器102可以從數(shù)據(jù)庫中檢索箱,并且醫(yī)療保健專業(yè)人員或研究人員可以為正方形基因組矩陣的每個(gè)軸選擇多組箱(例如,對應(yīng)于染色體1的第一組箱和對應(yīng)于染色體4的第二組箱)。[0047]存儲器150可以是有形的非暫時(shí)性存儲器,并且可以包含任何類型的合適的存儲器模塊,包含隨機(jī)存取存儲器(RAM)、存儲器150可以存儲例如能夠在處理器142上執(zhí)行的用于操作系統(tǒng)(OS)152的指令,所述操作系統(tǒng)可以是任何類型的合適的操作系統(tǒng),如現(xiàn)代智能手機(jī)操作系統(tǒng)。存儲器150還可以存儲例如可在處理器142上執(zhí)行的用于空間組織模塊160的指令。將在下文參照圖1B對染色質(zhì)相互作用服務(wù)器102進(jìn)行更詳細(xì)的描述。在一些實(shí)施例中,空間組織模塊160可以是客戶端裝置106-116、染色質(zhì)相互作用服務(wù)器102或染色質(zhì)相互作用服務(wù)器102與客戶端裝置106-116的組合中的一個(gè)或多個(gè)的一部分。[0048]在任何情況下,空間組織模塊160可以從數(shù)據(jù)庫154和/或客戶端裝置106-116獲得一組讀段對和多組箱??臻g組織模塊160然后可以使用每組箱作為軸來生成n×m正方形所述箱對的讀段對的子集。然后,空間組織模塊160可以通過基于所有讀段對隨基因組距離而變化的密度函數(shù)將箱對中讀段對的實(shí)際密度與預(yù)期密度進(jìn)行比較來識別每個(gè)箱對的經(jīng)歸一化的相互作用頻率。這種函數(shù)可以針對特定箱序列中的GC序列百分比、Hi-C測序數(shù)據(jù)集中特定箱序列的序列覆蓋率或用于Hi-C歸一化的其它適當(dāng)因素進(jìn)行校正??梢允褂酶鞣N統(tǒng)計(jì)方法來執(zhí)行比較,以生成例如p值,可以將p值與置信閾值進(jìn)行比較,以確定特定的箱對是否具有富集的觸點(diǎn)。空間組織模塊160可以對提供箱對的指示和對相應(yīng)的經(jīng)歸一化的相互作用頻率的指示,用于在客戶端裝置106-116上顯示。這些指示可以以數(shù)字形式或圖形形式(如空間相互作用圖的形式)顯示,如下面參考圖7更詳細(xì)描述的。[0049]染色質(zhì)相互作用服務(wù)器102可以通過網(wǎng)絡(luò)130與客戶端裝置106-116進(jìn)行通信。數(shù)字網(wǎng)絡(luò)130可以是專用網(wǎng)絡(luò)、安全公共互聯(lián)網(wǎng)、虛擬專用網(wǎng)絡(luò)和/或一些其它類型的網(wǎng)絡(luò),如下,數(shù)據(jù)通信可以通過因特網(wǎng)通信協(xié)議在數(shù)字網(wǎng)絡(luò)130上進(jìn)行。[0050]現(xiàn)在轉(zhuǎn)到圖1B,染色質(zhì)相互作用服務(wù)器102可以包含控制器224.控制器224可以包含程序存儲器226、微控制器或微處理器(MP)228、隨機(jī)存取存儲器(RAM)230和/或輸入/輸出(I/0)電路234,所有這些都可以通過地址/數(shù)據(jù)總線232進(jìn)行互連。在一些實(shí)施例中,控制器224還可以包含數(shù)據(jù)庫239,或以其它方式通信連接到所述數(shù)據(jù)庫或其它數(shù)據(jù)存儲機(jī)制試者信息、讀段對數(shù)據(jù)、箱數(shù)據(jù)、空間相互作用映射模板、網(wǎng)頁模板和通過網(wǎng)絡(luò)130與用戶交互所需的其它數(shù)據(jù)。數(shù)據(jù)庫239可以包含與上面參考圖1A描述的數(shù)據(jù)庫154相似的數(shù)據(jù)。[0051]應(yīng)當(dāng)理解的是,盡管圖1B僅描繪了一個(gè)微處理器228,但是控制器224可以包含多個(gè)微處理器228.類似地,控制器224的存儲器可以包含多個(gè)RAM230和/或多個(gè)程序存儲器226。盡管圖1B將I/0電路234描述為單個(gè)塊,但是I/0電路234可以包含許多不同類型的I/0電路??刂破?24可以將一個(gè)或多個(gè)RAM230和/或程序存儲器226實(shí)施為例如半導(dǎo)體存儲器、磁性可讀存儲器和/或光學(xué)可讀存儲器。[0052]如圖1B所示,程序存儲器226和/或RAM230可以存儲各種應(yīng)用,以供微處理器228執(zhí)行。例如,用戶界面應(yīng)用236可以向染色質(zhì)相互作用服務(wù)器102提供用戶界面,所述用戶界面可以例如允許系統(tǒng)管理員對服務(wù)器操作的各個(gè)方面進(jìn)行配置、故障排除或測試。服務(wù)器應(yīng)用238可以操作用于接收一組讀段對和多組箱,生成箱對的正方形基因組矩陣,識別每個(gè)箱對的經(jīng)歸一化相互作用頻率,并向醫(yī)療保健專業(yè)人員或研究人員的客戶端裝置106-116提供對箱對的指示和對歸一化相互作用頻率的指示。服務(wù)器應(yīng)用238可以是單個(gè)模塊238,如空間組織模塊160或多個(gè)模塊238A[0053]盡管在圖1B中將服務(wù)器應(yīng)用238描繪為包含兩個(gè)模塊238A和238B,但是服務(wù)器應(yīng)用238可以包含完成與染色質(zhì)相互作用服務(wù)器102的實(shí)施有關(guān)的任務(wù)的任何數(shù)量的模塊。應(yīng)當(dāng)理解的是,盡管在圖1B中僅描繪了一個(gè)染色質(zhì)相互作用服務(wù)器102,但是可以提供多個(gè)染色質(zhì)相互作用服務(wù)器102以用于分配服務(wù)器負(fù)載、服務(wù)于不同的網(wǎng)頁等。這些多個(gè)染色質(zhì)相互作用服務(wù)器102可以包含網(wǎng)頁服務(wù)器、特定于實(shí)體的服務(wù)器(例如Apple?服務(wù)器等)、位于零售或?qū)S镁W(wǎng)絡(luò)中的服務(wù)器等。[0054]現(xiàn)在參照圖1C,膝上型計(jì)算機(jī)114(或客戶端裝置106-116中的任何一個(gè))可以包含顯示器240、通信單元258、用戶輸入裝置(未示出)以及像染色質(zhì)相互作用服務(wù)器102一樣包含控制器242。類似于控制器224,控制器242可以包含程序存儲器246、微控制器或微處理器(MP)248、隨機(jī)存取存儲器(RAM)250和/或輸入/輸出(I/0)電路254,所有這些都可以通過地址/數(shù)據(jù)總線252進(jìn)行互連。程序存儲器246可以包含操作系統(tǒng)260、數(shù)據(jù)存儲裝置262、多個(gè)軟件應(yīng)用264和/或多個(gè)軟件例程268。例如,操作系統(tǒng)260可以包含MicrosoftWindows⑧、數(shù)據(jù)、多個(gè)例程268的例程數(shù)據(jù)等數(shù)據(jù)和/或通過數(shù)字網(wǎng)絡(luò)130與染色質(zhì)相互作用服務(wù)器102交互所必需的其它數(shù)據(jù)。在一些實(shí)施例中,控制器242還可以包含駐留在膝上型計(jì)算機(jī)114內(nèi)的其它數(shù)據(jù)存儲機(jī)制(例如,一個(gè)或多個(gè)硬盤驅(qū)動(dòng)器、光存儲驅(qū)動(dòng)器、固態(tài)存儲裝置等),或以其它方式通信連接到所述其它數(shù)據(jù)存儲機(jī)制。 務(wù)器102通信。用戶輸入裝置(未示出)可以包含顯示在膝上型計(jì)算機(jī)114的顯示器240上的“軟”鍵盤、通過有線或無線連接進(jìn)行通信的外部硬于接收語音輸入的麥克風(fēng)或任何其它合適的用戶輸入裝置。如參考控制器224所討論的,應(yīng)當(dāng)理解的是,盡管圖1C僅描繪了一個(gè)微處理器248,但是控制器242可以包含多個(gè)微處理器 248。類似地,控制器242的存儲器可以包含多個(gè)RAM250和/或多個(gè)程序存儲器246。盡管圖 1C將I/0電路254描述為單個(gè)塊,但是I/0電路254可以包含許多不同類型的I/O電路??刂破?242可以將一個(gè)或多個(gè)RAM250和/或程序存儲器246實(shí)施為例如半導(dǎo)體存儲器、磁性可讀存儲器和/或光學(xué)可讀存儲器。[0056]除其它軟件應(yīng)用之外,一個(gè)或多個(gè)處理器248可以適于并被配置成執(zhí)行駐留在程序存儲器246中的多個(gè)軟件應(yīng)用264中的任何一個(gè)或多個(gè)和/或多個(gè)軟件例程268中的任何一個(gè)或多個(gè)。多個(gè)應(yīng)用264中的一個(gè)應(yīng)用可以是客戶端應(yīng)用266,所述客戶端應(yīng)用可以被實(shí)施為一系列機(jī)器可讀指令,用于執(zhí)行與在膝上型計(jì)算機(jī)114處接收信息、在膝上型計(jì)算機(jī)上顯示信息和/或從膝上型計(jì)算機(jī)發(fā)送信息相關(guān)聯(lián)的各種任務(wù)。[0057]多個(gè)應(yīng)用264中的一個(gè)應(yīng)用可以是本地應(yīng)用和/或網(wǎng)絡(luò)瀏覽器270(如Apple's述本地應(yīng)用和/或網(wǎng)絡(luò)瀏覽器可以被實(shí)施為一系列機(jī)器可讀指令,用于接收、解釋和/或顯示來自染色質(zhì)相互作用服務(wù)器102的網(wǎng)頁信息,同時(shí)還從如醫(yī)療保健專業(yè)人員或研究人員等的用戶處接收輸入。多個(gè)應(yīng)用中的另一個(gè)應(yīng)用可以包含嵌入式網(wǎng)絡(luò)瀏覽器276,所述嵌入式網(wǎng)絡(luò)瀏覽器可以被實(shí)施為一系列機(jī)器可讀指令,用于接收、解釋和/或顯示來自染色質(zhì)相互作用服務(wù)器102的網(wǎng)頁信息。[0058]多個(gè)例程中的一個(gè)可以包含空間組織顯示例程272,其獲得對箱對的指示和對經(jīng)歸一化相互作用頻率的指示,并在顯示器240上呈現(xiàn)空間相互作用圖。多個(gè)例程中的另一個(gè)例程可以包含數(shù)據(jù)輸入例程274,所述例程獲得一組讀段對、對一組箱或兩組箱的選擇,以包含在正方形基因組矩陣中作為軸,并將所述一組讀段對、對所述一組箱或兩組箱的選擇發(fā)送到染色質(zhì)相互作用服務(wù)器102。[0059]優(yōu)選地,用戶可以從客戶端裝置(如客戶端裝置106-116中的一個(gè)裝置)處啟動(dòng)客戶端應(yīng)用266以與染色質(zhì)相互作用服務(wù)器102進(jìn)行通信,從而實(shí)施染色質(zhì)相互作用系統(tǒng)100。另外,用戶還可以啟動(dòng)或?qū)嵗魏纹渌线m的用戶界面應(yīng)用(例如,本機(jī)應(yīng)用或網(wǎng)頁瀏覽器270,或多個(gè)軟件應(yīng)用264中的任何其它應(yīng)用)以訪問染色質(zhì)相互作用服務(wù)器102,從而實(shí)現(xiàn)染色質(zhì)相互作用系統(tǒng)100。[0060]如上所述,圖1A所示的染色質(zhì)相互作用估服務(wù)器102可以包含存儲器150,所述存儲器可以存儲能夠在處理器142上執(zhí)行的用于空間組織模塊160的指令。[0061]圖2展示了一組示例箱200,每個(gè)箱表示說明性地標(biāo)記為染色體A的染色體的連續(xù)片段。在此實(shí)例中,每個(gè)箱包含染色體A內(nèi)的幾個(gè)基因座。第一箱為從基因座1到基因座100,第二箱為從基因座100到基因座186,第三箱為從基因座192到基因座304,第四箱為從基因座308到基因座396,第五箱為從基因座396到基因座472,第六箱為從基因座478到基因座672,第七箱為從基因座672到基因座716,并且第八箱為從基因座716到基因座904。每個(gè)箱可以表示染色體A內(nèi)不同的切割位點(diǎn)增量或功能元件,例如基因、TAD、染色質(zhì)狀態(tài)片段、環(huán)狀結(jié)構(gòu)域、染色質(zhì)結(jié)構(gòu)域等。在示例組中,箱是不重疊的,并且每個(gè)箱色體片段的長度)各不相同。如上所述,箱可以由醫(yī)療保健專業(yè)人員或研究人員選擇,可以從以前的研究中確定,可以是數(shù)據(jù)庫154中預(yù)先存儲的箱,或者可以以任何合適的方式選擇。雖然所述一組示例箱200在染色體A內(nèi),但是箱可以跨整個(gè)基因組或其任何合適的部分生成,并且可以是任何合適的大小。[0062]如上所述,染色質(zhì)相互作用服務(wù)器102,更具體地說,空間組織模塊160可以獲得與箱組200類似的兩組箱,并且可以生成正方形基因組矩陣,其中每組箱是矩陣的軸。在一些實(shí)施例中,兩組箱是相同的,并且對應(yīng)于相同的染色體或其它基因組區(qū)域。在其它實(shí)施例中,兩組箱對應(yīng)于相同的染色體或基因組區(qū)域,但是箱是不同的,即每個(gè)軸的染色體或基因組區(qū)域被不同地分割。在又其它實(shí)施例中,兩組箱對應(yīng)于不同的染色體或其它基因組區(qū)域。在任何情況下,醫(yī)療保健專業(yè)人員或研究人員可以通過客戶端裝置106-116選擇要用作矩陣中的軸的箱組,或者可以以任何合適的方式選擇箱組。[0063]雖然上文已經(jīng)參照染色體(例如,對應(yīng)于染色體A的一組箱)描述了箱組,但這僅僅是為了便于說明的一個(gè)實(shí)例。箱組可以對應(yīng)于人類或其它生物體基因組中任何合適的DNA序列片段組,如TAD的全基因組集合、基因的全基因組集合、染色質(zhì)狀態(tài)片段的全基因組集合、特定生物醫(yī)學(xué)環(huán)境中關(guān)注的基因座的集合等。除了全基因組集合之外,箱組可以是等位基因特異性的,并且可以對應(yīng)于特定的單倍型和/或雙倍型。此外,根據(jù)倍性水平和/或拷貝數(shù),可以產(chǎn)生多個(gè)箱組。更一般地,一個(gè)箱組可以包含任何箱的集合,其中所述箱中的每一域、染色質(zhì)結(jié)構(gòu)域等)。例如,可以選擇箱組用于長程相互作用的全或基因座組的相互作用配偶體的集中搜索、調(diào)節(jié)回路的全基因組映射、長程相互作用中細(xì)胞間類型可變性的綜合評估、基于Hi-C的診斷和預(yù)后生物標(biāo)記等。然而,箱組不一定必須對應(yīng)于相同類型的功能元件,并且可以包含任何合適的箱組。[0064]圖3展示了可以由染色質(zhì)相互作用服務(wù)器102,更具體地說,空間組織模塊160生成的示例正方形基因組矩陣的箱對300。在此實(shí)例中,來自染色體A的一組箱可以對應(yīng)于矩陣的一個(gè)軸,并且來自染色體B的一組箱可以對應(yīng)于另一個(gè)軸。與來自一個(gè)軸的箱和來自另一個(gè)軸的箱對應(yīng)的矩陣的矩形區(qū)域可以被稱為箱對。例如,箱對302對應(yīng)于ChrA:478-672*ChrB:320-488。如示例正方形基因組矩陣所示,箱對具有不同的形狀和大小。一些箱對是[0065]除了生成矩陣之外,染色質(zhì)相互作用服務(wù)器102還識別每個(gè)箱對內(nèi)的讀段對。一組讀段對可以從數(shù)據(jù)庫154獲得,可以由研究人員或醫(yī)療保健專業(yè)人員通過客戶端裝置106-116提供,或者可以以任何合適的方式獲得。在任何情況下,當(dāng)兩個(gè)讀段都在由箱對占據(jù)的矩形區(qū)域內(nèi)時(shí),可以將讀段對識別為處于箱對內(nèi)。例如,含有讀段對304的箱對所占據(jù)的矩形區(qū)域跨度為從ChrA:478-672*ChrB:1-320。這意味著任何在478與672之間具有染色體A基因座和在1與320之間具有染色體B基因座的讀段對都在箱對內(nèi)。讀段對304可以包含基因座ChrA:570,ChrB:160,其位于ChrA:478-672*ChrB:1-320的矩形區(qū)域內(nèi)。在一些實(shí)施例中,可以使用二叉搜索樹、另一種類型的搜索樹(如四叉樹、k-d樹或B-樹)或用于有效搜索的任何其它合適的數(shù)據(jù)結(jié)構(gòu)(如哈希表)將讀段對與箱對進(jìn)行匹配。[0066]染色質(zhì)相互作用服務(wù)器102然后可以識別與每個(gè)箱對對應(yīng)的讀段對的子集。對于每個(gè)箱對,讀段對的對應(yīng)子集可以用于確定箱對的讀段對的實(shí)際密度或相互作用頻率。在一些實(shí)施例中,箱對的讀段對的實(shí)際密度可以是箱對內(nèi)的讀段對的數(shù)量或者讀段對的數(shù)量除以箱對占據(jù)的矩形區(qū)域。在任何情況下,每個(gè)箱對的相互作用頻率可以根據(jù)密度函數(shù)進(jìn)行歸一化。[0067]在一些實(shí)施例中,染色質(zhì)相互作用服務(wù)器102,更具體地說,空間組織模塊160可以向研究人員或醫(yī)療保健專業(yè)人員的客戶端裝置106提供對箱對的指示和對經(jīng)歸一化相互作用頻率的指示??蛻舳搜b置106可以顯示箱對和經(jīng)歸一化相互作用頻率的圖形表示。圖4展示了可以在客戶端裝置106上呈現(xiàn)的示例空間相互作用圖400或箱對的熱圖和相應(yīng)的經(jīng)歸一化的相互作用頻率。圖4所示的箱組表示人類基因組(染色體1-22,X)。在示例空間相互作用圖400中,箱對的經(jīng)歸一化相互作用頻率用顏色等級表示,以產(chǎn)生染色質(zhì)組織的二維映射。更具體地說,具有較大經(jīng)歸一化相互作用頻率的箱對以較暗的顏色突出顯示。空間相互作用圖400可以與上面參考圖3以圖形形式描述的正方形基因組矩陣類似。如圖4所示,在空間相互作用圖400上沿著從左上方到右下方的對角線的箱對被以空間相互作用圖400中的其它箱對更暗的顏色呈現(xiàn)。因此,這些箱對可以具有富集的觸點(diǎn)。此外,沿著表示染色體內(nèi)觸點(diǎn)的軸的正方形中的觸點(diǎn)比正方形基因組空間的離軸染色體間區(qū)域中的觸點(diǎn)更暗??傮w施例中,可以出于許多有用的目的來評估具有富集和貧化觸點(diǎn)的區(qū)域的集合和接觸程度。[0068]空間相互作用圖400和/或此類觸點(diǎn)的其它表示可以用于生成3D和4D染色質(zhì)結(jié)構(gòu),如3D染色質(zhì)結(jié)構(gòu)410.3D染色質(zhì)結(jié)構(gòu)410描繪了染色體位于細(xì)胞核中染色質(zhì)結(jié)合區(qū)域中的4D核小體。常染色質(zhì)的特征是DNase1超敏反應(yīng),以及定義活性基因組調(diào)節(jié)元件的組蛋白標(biāo)記的特定組合。例如,啟動(dòng)子通常帶有標(biāo)記H3K4me3和H3K27ac,并且增強(qiáng)子通常帶有標(biāo)記H3K4me1和H3K27ac。增強(qiáng)子可以增加或減少其靶基因中的轉(zhuǎn)錄,所述靶基因可以是序列近側(cè)的,和/或在空間上局部化的(例如,通過上述方法)和/或單獨(dú)或以組合形式功能性地連接(例如,通過分子QTL連接)到增強(qiáng)子。異染色質(zhì)定位在染色體區(qū)域的內(nèi)部和核的外圍,靠近核層蛋白和核仁,異染色質(zhì)的特征在于其自身的抑制性染色質(zhì)標(biāo)記和DNA結(jié)合蛋白,以及與CpG最常被甲基化的其它組織相反。另外,在大腦中,一種帶有表觀基因信息的獨(dú)特元件的反應(yīng)性物種—5-羥甲基胞嘧啶(5hmC)相對較常見。相反,在外圍,甲基胞嘧啶(hmC)很常[0069]如上所述,為了確定經(jīng)歸一化的相互作用頻率,空間組織模塊160可以將密度函數(shù)應(yīng)用于箱對,以計(jì)算每個(gè)箱對的預(yù)期密度。圖5展示了示例曲線圖500,其描繪了三個(gè)示例密度函數(shù)510、520、530,每個(gè)密度函數(shù)表示跨這一組中所有讀段對的讀段對真實(shí)密度或理想密度隨基因組距離的變化。如示例曲線圖500中所示,密度函數(shù)510-530中的每一個(gè)隨基因組距離以總體向下傾斜的方式而變化,因?yàn)榇罅康淖x段對包含彼此非常接近的讀段。密度函數(shù)510單調(diào)地減小,而密度函數(shù)520和530首先隨距離而增加,然后減小,并且在每個(gè)距離位置具有可變的斜率和水平。密度函數(shù)510是基于公布的冪律樣條模型的合成函數(shù),所述冪律樣條模型是有時(shí)用于歸一化Hi-C數(shù)據(jù)集的類型的合成距離密度曲線,而其它兩個(gè)密度函數(shù)520、530是經(jīng)驗(yàn)密度函數(shù)。密度函數(shù)520基于來自SK-N-SH細(xì)胞(神經(jīng)元細(xì)胞)的數(shù)且密度函數(shù)530基于來自成纖維細(xì)胞(皮膚細(xì)胞)的數(shù)據(jù)集。然而,這些僅僅是幾組讀段對的密度函數(shù)的幾個(gè)實(shí)例。密度隨基因組距離的變化可以表現(xiàn)出其它組讀段對的其它模式(例如,這一函數(shù)可以隨基因組距離的增加以更快或更慢的速率衰減)。可以根據(jù)經(jīng)驗(yàn)生成序列觸點(diǎn)的特定數(shù)據(jù)庫的這種函數(shù),并對其進(jìn)行適當(dāng)調(diào)整。[0070]在任何情況下,染色質(zhì)相互作用服務(wù)器,更具體地說,空間組織模塊160可以應(yīng)用示例曲線圖500中所示的密度函數(shù)510-530之一來計(jì)算每個(gè)箱對的預(yù)期密度。在一些實(shí)施例中,空間組織模塊160可以選擇適用于所選箱對的經(jīng)驗(yàn)密度函數(shù)。例如,當(dāng)箱組包含表示在皮膚細(xì)胞中表達(dá)的DNA序列片段的箱時(shí),空間組織模塊160可以基于來自成纖維細(xì)胞的數(shù)據(jù)集選擇密度函數(shù)530。當(dāng)箱組包含表示在神經(jīng)元中表達(dá)的DNA序列片段的箱時(shí),空間組織模塊160可以基于來自SK-N-SH細(xì)胞的數(shù)據(jù)集選擇密度函數(shù)520。在其它實(shí)施例中,空間組織模塊160可以選擇合成密度函數(shù)510。[0071]對于特定的箱對,空間組織模塊160可以對跨由箱對占據(jù)的矩形區(qū)域的選定密度織模塊160可以使用各種統(tǒng)計(jì)方法將箱對的預(yù)期密度與實(shí)際密度進(jìn)行比較,以確定預(yù)期密度是否與實(shí)際密度相差統(tǒng)計(jì)上顯著的量。例如,零假設(shè)可以是箱對的實(shí)際密度不大于預(yù)期密度??臻g組織模塊160可以根據(jù)泊松分布或使用單尾測試的任何其它合適的分布將預(yù)期密度與實(shí)際密度進(jìn)行比較,以生成p值。當(dāng)p值小于閾值置信水平(例如,p值.05對應(yīng)于95%的置信度,p值.01對應(yīng)于99%的置信度,等確定箱對包含富集的觸點(diǎn)。在一些實(shí)施例中,空間組織模塊160可以將錯(cuò)誤發(fā)現(xiàn)率應(yīng)用于p值,如Benjamini錯(cuò)誤發(fā)現(xiàn)率,或者用于多重比較控制的其它統(tǒng)計(jì)方法。[0072]在另一個(gè)實(shí)例中,零假設(shè)可以是箱對的實(shí)際密度不小于預(yù)期密度。空間組織模塊160可以根據(jù)泊松分布或使用單尾測試的任何其它合適的分布將預(yù)期密度與實(shí)際密度進(jìn)行比較,以生成p值。當(dāng)p值小于閾值置信水平(例如,p值.05對應(yīng)于95%的置信度,p值.01對應(yīng)于99%的置信度,等等)時(shí),可以拒絕零假設(shè),并且空間組織模塊160可以確定箱對包含貧化的觸點(diǎn)。在一些實(shí)施例中,空間組織模塊160可以將錯(cuò)誤發(fā)現(xiàn)率應(yīng)用于p值,如Benjamini錯(cuò)誤發(fā)現(xiàn)率,或者用于多重比較控制的其它統(tǒng)計(jì)方法。[0073]在又另一個(gè)實(shí)例中,零假設(shè)可以是箱對的實(shí)際密度與預(yù)期密度相同??臻g組織模塊160可以根據(jù)泊松分布或使用雙尾測試的任何其它合適的分布將預(yù)期密度與實(shí)際密度進(jìn)行比較,以生成p值。當(dāng)p值小于閾值置信水平(例如,p值.05對應(yīng)于95%的置信度,p值.01對應(yīng)于99%的置信度,等等)時(shí),可以拒絕零假設(shè),并且空間組織模塊160可以確定箱對包含差異性或異常觸點(diǎn)(即,富集或貧化觸點(diǎn))。在一些實(shí)施例中,空間組織模塊160可以將錯(cuò)誤發(fā)現(xiàn)率應(yīng)用于p值,如Benjamini錯(cuò)誤發(fā)現(xiàn)率,或者用于多重比較控制的其它統(tǒng)計(jì)方法。[0074]雖然本文參考泊松分布描述了統(tǒng)計(jì)分析,但是這僅僅是一種可以用于確定箱對的實(shí)際密度和預(yù)期密度之間是否存在統(tǒng)計(jì)上顯著的差異的類型的統(tǒng)計(jì)測試。其它統(tǒng)計(jì)測試可多元自適應(yīng)回歸樣條、局部估計(jì)的散點(diǎn)圖平滑等)、基于實(shí)例的算法(例如,排序點(diǎn)等)、關(guān)聯(lián)規(guī)則學(xué)習(xí)算法(如先驗(yàn)算法、Eclat算法等)、貝葉斯算斯樸素貝葉斯、多項(xiàng)式樸素貝葉斯、平均單相關(guān)估計(jì)、貝葉斯信念網(wǎng)知器、深度玻爾茲曼機(jī)、深層置信網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、堆疊式自動(dòng)編碼器、生成對抗網(wǎng)絡(luò)等)、降維算法(例如,主成分分析、主成分回歸、偏最小二乘回歸、薩蒙映射(Sammon化學(xué)習(xí)(例如,時(shí)間差異學(xué)習(xí)、Q學(xué)習(xí)、學(xué)習(xí)自動(dòng)機(jī)、狀態(tài)-動(dòng)作-獎(jiǎng)勵(lì)-狀態(tài)-動(dòng)作等)、支[0075]此外,雖然本文描述的方法利用錯(cuò)誤發(fā)現(xiàn)率進(jìn)行多重比較控制,但是可以將任何合適的多重比較控制方法(如錯(cuò)誤覆蓋率、貝葉斯方法等)應(yīng)用于p值。[0076]然后,具有富集或貧化觸點(diǎn)的箱對可以用于基于相應(yīng)基因組內(nèi)基因座的空間相互作用預(yù)測受試者的分子表型。富集或貧化的觸點(diǎn)也可以用于對染色體的3D和4D結(jié)構(gòu)進(jìn)行建或貧化的觸點(diǎn)可以用于確定一對基因座在特定組織或細(xì)胞系中是否和/或在多大程度上相互作用。更進(jìn)一步,富集或貧化的觸點(diǎn)可以用于基于異常觸點(diǎn)和/或正方形基因組空間中的總接觸密度來識別倍性和易位。[0077]例如,醫(yī)療保健專業(yè)人員可以獲得用于測量受試者染色質(zhì)相互作用數(shù)據(jù)的生物樣生物等),并向染色質(zhì)相互作用服務(wù)器提供通過分析生物樣品獲得的實(shí)驗(yàn)室結(jié)果。[0078]在圖6中示出了用于從受試者的生物樣品中生成染色質(zhì)相互作用數(shù)據(jù)的示例過程600。所述過程可以由分析實(shí)驗(yàn)室或其它合適的機(jī)構(gòu)執(zhí)行。在框602處,醫(yī)療保健專業(yè)人員獲得受試者的生物樣品,并將其發(fā)送至化驗(yàn)實(shí)驗(yàn)室進(jìn)行分析。生物樣品可以包含受試者的皮在框606將其重新編程為干細(xì)胞(如誘導(dǎo)性多能干細(xì)胞(iPSC))。然后在框608處,將iPSC分化為多種組織(如神經(jīng)元、心肌細(xì)胞等),并在框610進(jìn)行分析以獲得染色質(zhì)相互作用數(shù)據(jù)。[0079]此外,DNA序列的單個(gè)基因座可以被識別為與特定的分子表型相關(guān)聯(lián)或以因果關(guān)系相關(guān)聯(lián)。一組箱還可以被識別為含有單個(gè)基因座。然后,當(dāng)相對于特定的分子表型或一組分子表型(例如,指示對丙戊酸的反應(yīng)的分子表型)對受試者的染色質(zhì)相互作用數(shù)據(jù)進(jìn)行分析時(shí),可以對與特定的一組分子表型相關(guān)聯(lián)或以因果關(guān)系相關(guān)聯(lián)的基因座的iPSC進(jìn)行分析??梢詫?yīng)于從測定中識別的基因座的箱組與來自其它生物細(xì)胞系統(tǒng)中的這種箱組的觸點(diǎn)數(shù)據(jù)進(jìn)行比較,例如,這樣的系統(tǒng)可以構(gòu)成人體內(nèi)的兩種不同組織、來自兩個(gè)不同個(gè)體的組織樣品、與對照樣品相比經(jīng)受醫(yī)學(xué)處理的細(xì)胞系、或者相同組織、細(xì)胞系或生物體的多細(xì)胞周期條件或細(xì)胞分化狀態(tài)。然后,染色質(zhì)相互作用服務(wù)器102可以基于這一比較來預(yù)測受試者的分子表型。例如,如果受試者的iPSC在具有與對丙戊酸的特定反應(yīng)相關(guān)聯(lián)或以因果方式相關(guān)聯(lián)的基因座的箱組中包含讀段對,染色質(zhì)相互作用服務(wù)器102可以預(yù)測受試者將對丙戊酸具有特定反應(yīng)。[0080]更通常地,選擇哪種染色質(zhì)相互作用數(shù)據(jù)進(jìn)行測定可以基于被識別為與受試者的受檢分子表型組相關(guān)或以因果關(guān)系相關(guān)的染色質(zhì)相互作用數(shù)據(jù)。[0081]更具體地,通過將轉(zhuǎn)錄因子或“重編程因子”或其它試劑引入給定的細(xì)胞類型,將細(xì)胞重編程為iPSC。例如,可以使用山中(Yamanaka)因子(包含轉(zhuǎn)錄因子0ct4(POU5F1)、Sox2(SOX2)、cMyc(MYC)和Klf4(KLF4))將細(xì)胞重編程為iPSC。然后可以將iPSC分化為多種(如DNA甲基化分析、DNase足跡測定、過濾器結(jié)合測定等)來檢測分化的iPSC,以鑒定表觀基因組信息。實(shí)際上,所述系統(tǒng)執(zhí)行虛擬活檢,并且分化的iPSC至少在一定程度上具有其對應(yīng)組織的表型和表觀基因組特性。[0082]在上述實(shí)施例中,從受試者的生物樣品中提取細(xì)胞,將其重新編程為干細(xì)胞,分化為各種組織,并進(jìn)行分析以獲得染色質(zhì)相互作用數(shù)據(jù)(分化的、重編程的細(xì)胞測定法)。可替代地,在某些實(shí)施例中,在不提取細(xì)胞的情況下測定患者的生物樣品(無細(xì)胞測定法)。在其它實(shí)施例中,從患者的生物樣品中提取細(xì)胞,并在不對細(xì)胞進(jìn)行重新編程或分化的情況下進(jìn)行測定(原代細(xì)胞測定法)。在其它實(shí)施例中,將細(xì)胞重編程為iPSC,并在不對細(xì)胞進(jìn)行分化的情況下進(jìn)行分析(重編程的干細(xì)胞分析法)。例如,可以在不進(jìn)行分化的情況下對iPSC進(jìn)行分析以獲得干細(xì)胞組學(xué)。盡管這些只是用于從受試者的生物樣品中生成染色質(zhì)相互作用數(shù)據(jù)的一些示例過程,但是可以在過程中的任何合適階段執(zhí)行測定,并且可以按照任何合適的方式生成染色質(zhì)相互作用數(shù)據(jù)。[0083]在一些實(shí)施例中,空間組織模塊160然后可以向研究人員或醫(yī)療保健專業(yè)人員的客戶端裝置106提供對箱對的指示和對經(jīng)歸一化相互作用頻率的指示。圖7A展示了可以在客戶端裝置106上呈現(xiàn)的富集的觸點(diǎn)和對應(yīng)的基因座以及與分子表型相關(guān)聯(lián)的SNP的示例對在成人中誘導(dǎo)神經(jīng)發(fā)生的兩種藥物(特別是丙戊酸和氯胺酮)的反應(yīng)表型顯著的調(diào)節(jié)SNP的集合。作為本發(fā)明實(shí)施例的示例性實(shí)例,研究這些藥物的科學(xué)家可能希望辨別它們起作用的機(jī)制。這些科學(xué)家可能希望識別這些調(diào)節(jié)性SNP的靶基因,并因此在關(guān)注的系統(tǒng)中找到含有它們的TAD的空間觸點(diǎn)配偶體。這些科學(xué)家也可能希望找出在關(guān)注的系統(tǒng)中這些TAD中的哪一個(gè)相互接觸。在其它實(shí)施例中,關(guān)注基因座的集合可以被識別為與藥物、疾病或其它分子表型的變體的集合或者特定受試者的關(guān)注基因座的集合等對應(yīng)。[0084]示例顯示700包含染色體(例如,17號染色體)、基因座(例如,33720000-35360000)、TAD(例如,1977)、候選觸點(diǎn)(例如,1)和與具有富集觸點(diǎn)的箱對相關(guān)的靶基因三個(gè)(例如TAD1977)到數(shù)百個(gè)(例如TAD2112)。含有藥動(dòng)學(xué)基因座的TAD,例如代謝這些藥物的CYP基因,似乎具有最多的觸點(diǎn)。顯示700還包含與富集的觸點(diǎn)相關(guān)聯(lián)的SNP(例如,rs2857654)和其中其反應(yīng)與SNP相關(guān)聯(lián)的藥物(例如,丙戊酸鈉)。以這種方式,醫(yī)療保健專業(yè)人員或研究人員可以查看與富集的觸點(diǎn)及其對應(yīng)的分子表型相關(guān)的SNP。然而,這僅僅是箱對的數(shù)字指示的一個(gè)示例顯示,僅為了便于說明。在其它實(shí)施例中,客戶端裝置106可以顯示每個(gè)箱對的數(shù)字指示(例如,Chr11:8560000-10720000*Chr11:4580000-4780000)、箱對的相互作用頻率的數(shù)字指示(如p值)、箱對是否具有富集的觸點(diǎn)的指示等。[0085]在又其它實(shí)施例中,客戶端裝置106可以顯示從空間觸點(diǎn)數(shù)據(jù)生成的染色質(zhì)相互作用網(wǎng)絡(luò)。圖7B展示了根據(jù)參考圖7A描述的空間觸點(diǎn)數(shù)據(jù)生成的染色質(zhì)相互作用網(wǎng)絡(luò)750的示例顯示。在一些實(shí)施例中,染色質(zhì)相互作用網(wǎng)絡(luò)750可以呈現(xiàn)在客戶端裝置106上。在任何情況下,如顯示器700所示,具有至少一個(gè)候選觸點(diǎn)的TAD包含在染色質(zhì)相互作用網(wǎng)絡(luò)750中。例如,TAD1977是一個(gè)候選觸點(diǎn),因此包含在染色質(zhì)相互作用網(wǎng)絡(luò)750中。此外,TAD1862和693具有零個(gè)候選觸點(diǎn),因此不包含在染色質(zhì)相互作用網(wǎng)絡(luò)750中。因此,在圖7A的顯示中顯示的13個(gè)所識別的TAD中,有10個(gè)包含與形成功能相關(guān)的TAD的密集相互作用的空間連接,TAD1472與TAD2258和2112連接。染色質(zhì)相互作替代性系統(tǒng)(如下面更詳細(xì)描述的HOMER)識別。TAD1064、2258、2112和1418是藥代動(dòng)力學(xué)[0086]以這種方式,在客戶端裝置106上查看染色質(zhì)相互作用網(wǎng)絡(luò)750的醫(yī)療保健專業(yè)人員或研究人員可以看到染色質(zhì)相互作用網(wǎng)絡(luò)750內(nèi)的關(guān)系的強(qiáng)度。例如,醫(yī)療保健專業(yè)人員或研究人員可能會看到TAD2112與染色質(zhì)相互作用網(wǎng)絡(luò)750中的所有其它TAD都有關(guān)系,而在的不同的基因和變體組,以及它們在各種生物醫(yī)學(xué)觸點(diǎn)和研究觸點(diǎn)中不同的生物學(xué)功能和意義,染色質(zhì)觸點(diǎn)的準(zhǔn)確檢測和顯示在各個(gè)實(shí)施例中可以服務(wù)于許多有用的目的。[0087]圖9展示了染色質(zhì)相互作用系統(tǒng)和HOMER(一種廣泛使用的Hi-C編譯程序)之間的相互作用系統(tǒng)在兩個(gè)軸上產(chǎn)生了TAD箱的矩陣。對于HOMER,使用具有1Mb分辨率的固定箱。兩個(gè)系統(tǒng)檢測到相同的5,648個(gè)觸點(diǎn)。染色質(zhì)相互作用系統(tǒng)檢測到10,193個(gè)HOMER沒有檢測到的觸點(diǎn)。因此,由于染色質(zhì)相互作用系統(tǒng)辨別能力的提高,染色質(zhì)相互作用系統(tǒng)識別了以前的系統(tǒng)沒有檢測到的觸點(diǎn)。因此,染色質(zhì)相互作用系統(tǒng)能夠比以前的系統(tǒng)識別出更多的長程觸點(diǎn)(例如,在大于10Mb的范圍內(nèi)的順式相互作用,其富集了兩倍或更多,并通過了比[0088]HOMER檢測到了12,572個(gè)染色質(zhì)相互作用系統(tǒng)未檢測到中,82%沒有通過染色質(zhì)相互作用系統(tǒng)中的倍數(shù)變化臨界值,90%沒有通過FDR臨界值,7有通過兩個(gè)臨界值。在這些對中,有92%的近鄰TAD對在染色質(zhì)相互作用系統(tǒng)中確實(shí)檢測到觸點(diǎn)。非近鄰不和諧HOMER觸點(diǎn)包含1,054個(gè)觸點(diǎn)。[0089]圖8描繪了表示用于分析染色質(zhì)的空間組織的示例性方法800的流程圖。方法800可以在染色質(zhì)相互作用服務(wù)器102上執(zhí)行。在一些實(shí)施例中,方法800可以在存儲在非暫時(shí)性計(jì)算機(jī)可讀存儲器上并可在染色質(zhì)相互作用服務(wù)器102上的一個(gè)或多個(gè)處理器上執(zhí)行的一組指令中實(shí)現(xiàn)。例如,方法800可以由圖1A的空間組織模體地說,在框802,空間組織模塊160可以獲得一組成對的基因組元件觸點(diǎn)或讀段對。所述一組讀段對可以從如圖1A所示的數(shù)據(jù)庫154、從研究人員或?qū)I(yè)人員的客戶端裝置106或以任何其它合適的方式獲得。在一些實(shí)施例中,研究人員或?qū)I(yè)人員可以為特定的分析或研究選擇特定的一組讀段對,并通過客戶端裝置106將所選擇的組提供給染色質(zhì)相互作用服務(wù)器102。在另一個(gè)實(shí)例中,測序儀107可以產(chǎn)生提供給染色質(zhì)相互作用服務(wù)器102的序列數(shù)據(jù)??臻g組織模塊160然后可以從序列數(shù)據(jù)中識別一組讀段對。在又另一個(gè)實(shí)例中,序列數(shù)據(jù)庫109可以向染色質(zhì)相互作用服務(wù)器102提供從例如已發(fā)表的文獻(xiàn)、臨床試驗(yàn)、聯(lián)合會、學(xué)術(shù)界等產(chǎn)生的預(yù)先存在的序列數(shù)據(jù)。然后,空間組織模塊160可以從序列數(shù)據(jù)中識別一組讀段對。在一些實(shí)施例中,空間組織模塊160將讀段對分成其單端組件后選擇多個(gè)對,其中所述對中的兩個(gè)讀段在任一個(gè)讀段中都存在小于閾值概率(例如,0.05)的未對準(zhǔn)。[0091]空間組織模塊160還可以將基因組元件觸點(diǎn)或讀段分割成箱(框804)。每個(gè)箱可以表示基因組或基因組部分中不同的切割位點(diǎn)增量或功能元件,如基因、TAD、染色質(zhì)狀態(tài)片小(或每個(gè)箱的基因組片段的長度)是變化的。在一些實(shí)施例中,箱可以由醫(yī)療保健專業(yè)人員或研究人員通過客戶端裝置106來選擇,可以從先前研究如序列數(shù)據(jù)庫109中確定,可以是數(shù)據(jù)庫154中預(yù)先存儲的箱,或者可以以任何合適的方式進(jìn)行選擇。例如,研究人員或醫(yī)療保健專業(yè)人員可以選擇其中每個(gè)箱表示不同的TAD的一組箱。在另一個(gè)實(shí)例中,研究人員或醫(yī)療保健專業(yè)人員可以選擇其中每個(gè)箱表示不同的基因的一組箱。[0092]然后在框806,選擇第一組n個(gè)箱和第二組m個(gè)箱,其中每組對應(yīng)于n×m正方形基因組矩陣的軸。軸可以由醫(yī)療保健專業(yè)人員或研究人員通過客戶端裝置106-116選擇,或者可以以任何合適的方式進(jìn)行選擇。在一些實(shí)施例中,兩組箱是相同的,并且對應(yīng)于同一染色體。在其它實(shí)施例中,兩組箱對應(yīng)于同一染色體,但是箱是不同的,即每個(gè)軸的染色體被不同地分割。在又其它實(shí)施例中,兩組箱對應(yīng)于不同的染色體。在任何情況下,空間組織模塊160可以生成包含n×m個(gè)箱對的正方形基因組矩陣(框810),其中箱對是正方形基因組矩陣中的一個(gè)條目或矩形(例如Chr1:1000-2000*Chr8:10000-20000)。[0093]然后,空間組織模塊160將讀段對編譯成箱對。更具體地說,空間組織模塊160可以使用例如二叉搜索樹來識別對應(yīng)于每個(gè)箱對的讀段對的子集(框810)。當(dāng)兩個(gè)讀段都在由箱對占據(jù)的矩形區(qū)域內(nèi)時(shí),可以將讀段對識別為處于箱對內(nèi)。例如304的箱對所占據(jù)的矩形區(qū)域跨度為從ChrA:478-672*ChrB:1-320。這意味著任何在478與672之間具有染色體A基因座和在1與320之間具有染色體B基因座的讀段對都在箱對內(nèi)。讀段對304可以包含基因座ChrA:570,ChrB:160,其位于ChrA:478-672*ChrB:1-320的矩形區(qū)域內(nèi)。在一些實(shí)施例中,可以使用另一種類型的搜索樹(如四叉樹、k-d樹或B-樹)或用于有效搜索的任何其它合適的數(shù)據(jù)結(jié)構(gòu)(如哈希表)將讀段對與箱對進(jìn)行匹配。[0094]在框812,空間組織模塊160基于跨整組讀段對的讀段對密度隨基因組距離的變化來生成密度函數(shù)。在一些實(shí)施例中,密度函數(shù)可以是單調(diào)地遞減的函數(shù)。對于特定的箱對,對密度函數(shù)在箱對(例如,ChrA:478-672*ChrB:1-320)的矩形區(qū)域上進(jìn)行積分,以確定這一箱對的預(yù)期密度(框814)??梢源_定箱對中每個(gè)箱對的預(yù)期密度。[0095]然后,空間組織模塊160可以將特定箱對的預(yù)期密度與特定箱對的實(shí)際密度進(jìn)行比較。例如,實(shí)際密度可以是包含在特定箱對中的讀段對的數(shù)量??梢允褂媒y(tǒng)計(jì)分析對實(shí)際密度和預(yù)期密度進(jìn)行比較,以確定預(yù)期密度之間的差異是否與實(shí)際密度相差統(tǒng)計(jì)上顯著的量(經(jīng)歸一化的相互作用頻率)(框816)。例如,零假設(shè)可以是箱對的實(shí)際密度不大于預(yù)期密度。空間組織模塊160可以根據(jù)泊松分布或任何其它合適的分布將預(yù)期密度與實(shí)際密度進(jìn)行比較,以生成p值。當(dāng)p值小于閾值置信水平(例如,p值.05對應(yīng)于95%的置信度,p值.01對應(yīng)于99%的置信度,等等)時(shí),可以拒絕零假設(shè),并且空間組織模塊160可以確定箱對包含富集的觸點(diǎn)。在一些實(shí)施例中,空間組織模塊160可以將錯(cuò)誤發(fā)現(xiàn)率應(yīng)用于p值,如Benjamini錯(cuò)誤發(fā)現(xiàn)率,或者用于多重比較控制的其它統(tǒng)計(jì)方法。在另一個(gè)實(shí)例中,零假設(shè)可以是箱對的實(shí)際密度不小于預(yù)期密度。當(dāng)p值小于閾值置信水平時(shí),可以拒絕零假設(shè),并且空間組織模塊160可以確定箱對包含貧化的觸點(diǎn)。[0096]在一些實(shí)施例中,可以將例如與不同的生物細(xì)胞系統(tǒng)或不同的生理?xiàng)l件對應(yīng)的多組觸點(diǎn)的實(shí)際讀段計(jì)數(shù)一起分析。例如,這樣的系統(tǒng)可以構(gòu)成人體內(nèi)的兩種不同組織、來自兩個(gè)不同個(gè)體的組織樣品、與對照樣品相比經(jīng)受醫(yī)學(xué)處理的細(xì)胞系、或者相同組織、細(xì)胞系或生物體的多細(xì)胞周期條件或細(xì)胞分化狀態(tài)。這種分析可以通過例如單獨(dú)比較來自每個(gè)數(shù)據(jù)集的富集和貧化觸點(diǎn)來確定例如一對觸點(diǎn)組之間的一組差異性觸點(diǎn)。差異性觸點(diǎn)還可以通過例如使用泊松分布或其它統(tǒng)計(jì)分布的多重采樣分布來確定,以生

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論