生物數(shù)字融合 脫氧核糖核酸(DNA)存儲(chǔ)系統(tǒng)參考架構(gòu)_第1頁
生物數(shù)字融合 脫氧核糖核酸(DNA)存儲(chǔ)系統(tǒng)參考架構(gòu)_第2頁
生物數(shù)字融合 脫氧核糖核酸(DNA)存儲(chǔ)系統(tǒng)參考架構(gòu)_第3頁
生物數(shù)字融合 脫氧核糖核酸(DNA)存儲(chǔ)系統(tǒng)參考架構(gòu)_第4頁
生物數(shù)字融合 脫氧核糖核酸(DNA)存儲(chǔ)系統(tǒng)參考架構(gòu)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ICSFORMTEXT35.240.15CCSFORMTEXTL71?????生物數(shù)字融合DNA存儲(chǔ)系統(tǒng)參考架構(gòu)范圍本文件規(guī)定了DNA存儲(chǔ)系統(tǒng)的參考架構(gòu)、主要功能和工作流程。本文件適用于DNA存儲(chǔ)系統(tǒng)的設(shè)計(jì)和研發(fā)。規(guī)范性引用文件本文件沒有規(guī)范性引用文件。術(shù)語和定義DNA存儲(chǔ)技術(shù)DNAstoragetechnology用人工合成的脫氧核糖核酸(DNA)作為存儲(chǔ)介質(zhì)的數(shù)據(jù)存儲(chǔ)技術(shù)。DNA存儲(chǔ)系統(tǒng)DNAstoragesystem以DNA存儲(chǔ)技術(shù)為核心,人工合成可以編碼數(shù)字信息的DNA序列,并能進(jìn)行穩(wěn)定存儲(chǔ)、讀取和恢復(fù)原始信息的系統(tǒng)。參考架構(gòu)DNA存儲(chǔ)系統(tǒng)主要包括寫入、存儲(chǔ)和讀取三大組成部分,系統(tǒng)參考架構(gòu)見圖1。圖1DNA存儲(chǔ)系統(tǒng)參考架構(gòu)主要功能信息寫入將二進(jìn)制數(shù)據(jù)寫入DNA存儲(chǔ)媒體的過程被稱為信息寫入,信息寫入主要包括編碼和合成兩大模塊。編碼是將數(shù)字文件中的二進(jìn)制數(shù)據(jù)提取出來,并按一定規(guī)則轉(zhuǎn)換成為DNA堿基序列。合成是通過化學(xué)原理或生物酶法原理,利用柱式合成、點(diǎn)陣芯片、半導(dǎo)體芯片等方式根據(jù)編碼步驟獲得的DNA序列進(jìn)行從頭人工合成。轉(zhuǎn)碼映射轉(zhuǎn)碼算法主要分為兩類:考慮DNA分子序列的受限限制進(jìn)行映射的算法,包括Church編碼算法、Goldman編碼算法、Grass編碼算法、Blawat編碼算法等;將兩比特轉(zhuǎn)化為一個(gè)堿基,然后增加篩選過濾步驟的編碼算法,包括DNAFountain噴泉碼和Yin-Yang雙編碼算法等。不同類型算法性能不同、生成序列特性不同、隱私性及穩(wěn)健性不同。待存儲(chǔ)數(shù)據(jù)的編碼算法選擇可根據(jù)以下特征進(jìn)行選擇:數(shù)據(jù)特征,包括文件大小、字節(jié)頻率等;算法性能特征,包括信息密度、轉(zhuǎn)碼速度等;序列特征,包括GC含量、單堿基重復(fù)長(zhǎng)度等;隱私性特征,包括穩(wěn)健性、破譯難度等。糾錯(cuò)編碼采用合適的技術(shù)或算法添加額外的校驗(yàn)數(shù)據(jù),對(duì)原始數(shù)據(jù)進(jìn)行數(shù)學(xué)變換使之能夠應(yīng)對(duì)DNA存儲(chǔ)過程中出現(xiàn)的錯(cuò)誤。生化適配進(jìn)行序列篩選以適應(yīng)DNA分子的生化特性,如:無均聚物、平衡的GC含量、無復(fù)雜二級(jí)結(jié)構(gòu)、無生物活性序列等。數(shù)據(jù)加密為保障DNA存儲(chǔ)中的加密與數(shù)據(jù)安全,可根據(jù)存儲(chǔ)數(shù)據(jù)的隱私性要求,對(duì)于編碼環(huán)節(jié)進(jìn)行加密,實(shí)現(xiàn)DNA編碼高效、隱私。合成DNA序列合成DNA合成環(huán)節(jié)的主要功能是完成DNA序列合成。DNA的合成按原理一般分為化學(xué)法合成和生物法合成?;瘜W(xué)法合成是主流成熟方法,包括一代合成(柱式)和二代合成(芯片)。生物法合成即三代合成(生物酶)。序列拼接受限于高通量合成DNA序列的長(zhǎng)度限制,為適應(yīng)高通量長(zhǎng)片段測(cè)序技術(shù)的要求,將合成的短DNA片段拼接為長(zhǎng)序列的過程。信息貯存封裝封裝分為物理封裝和生物封裝。物理封裝即通過低溫密封、礦化、無機(jī)物密封、固體膠囊等形式進(jìn)行封裝,生物封裝即將DNA分子通過不同形式存儲(chǔ)在活細(xì)胞內(nèi)。保存保存分為體外保存和體內(nèi)保存。當(dāng)體外保存DNA分子時(shí),可采用干粉、溶液、納米顆粒等形式保存。當(dāng)體內(nèi)保存DNA分子時(shí),可采用活細(xì)胞內(nèi)的存儲(chǔ)介質(zhì),如染色體、質(zhì)粒等。信息讀取概述將保存在不同存儲(chǔ)媒體中的DNA序列進(jìn)行測(cè)序獲得DNA片段的堿基排列順序,并將堿基序列轉(zhuǎn)換為二進(jìn)制數(shù)據(jù)從而得到存儲(chǔ)的文本文檔、圖片和聲音文件等數(shù)據(jù)的過程稱為信息讀取。信息讀取過程主要包括檢索、測(cè)序和解碼。檢索通過探針、PCR等方式抽取目標(biāo)DNA以實(shí)現(xiàn)隨機(jī)索引、重復(fù)獲取以及快速預(yù)覽功能。測(cè)序測(cè)序是獲得利用多重PCR分子等方式獲取的編碼DNA分子片段的堿基序列,即該片段中腺嘌呤A、胸腺嘧啶T、胞嘧啶C、鳥嘌呤G的排列順序。DNA測(cè)序技術(shù)主要包括Sanger測(cè)序法、高通量測(cè)序技術(shù)和單分子測(cè)序技術(shù)。高通量測(cè)序技術(shù)主要基于可逆末端終止法、連接測(cè)序法、焦磷酸測(cè)序法和聯(lián)合探針錨定聚合測(cè)序法。單分子測(cè)序技術(shù)主要基于單分子熒光測(cè)序法、單分子納米孔測(cè)序法和單分子晶體管測(cè)序法。目前技術(shù)最為成熟的是高通量測(cè)序技術(shù),已經(jīng)能夠?qū)崿F(xiàn)高通量、高準(zhǔn)確性和低重復(fù)序列率的性能。解碼解碼算法的類型與選擇與編碼算法相同,見5.1.1。解碼環(huán)節(jié)的錯(cuò)誤糾正是確保信息讀取正確率的最后一環(huán),為了糾正DNA存儲(chǔ)過程中出現(xiàn)的插入、刪除、替換等多種類型的錯(cuò)誤,開發(fā)與編碼算法適配的糾錯(cuò)方法。DNA存儲(chǔ)系統(tǒng)工作流程DNA存儲(chǔ)系統(tǒng)工作流程一般可分為4個(gè)主要步驟,包括編碼、合成、貯存、測(cè)序和解碼:編碼:將數(shù)字文件中的數(shù)據(jù)提取出來,并按一定規(guī)則轉(zhuǎn)換成為DNA堿基序列(包括但不限于自然堿基);合成:通過化學(xué)原理或生物酶法原理,利用柱式合成、點(diǎn)陣芯片、半導(dǎo)體芯片等方式根據(jù)編碼步驟獲得的DNA序列進(jìn)行人工合成;貯存:通過物理封裝或生物封裝方式,將攜帶信息的DNA分子保存于體外或體內(nèi);測(cè)序:通過利用如多重PCR、生物素-親和素序列特異性磁珠捕獲等方式,完成全部或部分編碼DNA分子的獲取,將獲取的DNA分子通過Sanger測(cè)序、高通量測(cè)序、單分子測(cè)序等方式進(jìn)行DNA分子序列的測(cè)定;解碼:對(duì)測(cè)序獲得的DNA序列進(jìn)行信息分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論