下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICSFORMTEXT35.240.15CCSFORMTEXTL71?????生物數(shù)字融合DNA存儲(chǔ)系統(tǒng)參考架構(gòu)范圍本文件規(guī)定了DNA存儲(chǔ)系統(tǒng)的參考架構(gòu)、主要功能和工作流程。本文件適用于DNA存儲(chǔ)系統(tǒng)的設(shè)計(jì)和研發(fā)。規(guī)范性引用文件本文件沒有規(guī)范性引用文件。術(shù)語和定義DNA存儲(chǔ)技術(shù)DNAstoragetechnology用人工合成的脫氧核糖核酸(DNA)作為存儲(chǔ)介質(zhì)的數(shù)據(jù)存儲(chǔ)技術(shù)。DNA存儲(chǔ)系統(tǒng)DNAstoragesystem以DNA存儲(chǔ)技術(shù)為核心,人工合成可以編碼數(shù)字信息的DNA序列,并能進(jìn)行穩(wěn)定存儲(chǔ)、讀取和恢復(fù)原始信息的系統(tǒng)。參考架構(gòu)DNA存儲(chǔ)系統(tǒng)主要包括寫入、存儲(chǔ)和讀取三大組成部分,系統(tǒng)參考架構(gòu)見圖1。圖1DNA存儲(chǔ)系統(tǒng)參考架構(gòu)主要功能信息寫入將二進(jìn)制數(shù)據(jù)寫入DNA存儲(chǔ)媒體的過程被稱為信息寫入,信息寫入主要包括編碼和合成兩大模塊。編碼是將數(shù)字文件中的二進(jìn)制數(shù)據(jù)提取出來,并按一定規(guī)則轉(zhuǎn)換成為DNA堿基序列。合成是通過化學(xué)原理或生物酶法原理,利用柱式合成、點(diǎn)陣芯片、半導(dǎo)體芯片等方式根據(jù)編碼步驟獲得的DNA序列進(jìn)行從頭人工合成。轉(zhuǎn)碼映射轉(zhuǎn)碼算法主要分為兩類:考慮DNA分子序列的受限限制進(jìn)行映射的算法,包括Church編碼算法、Goldman編碼算法、Grass編碼算法、Blawat編碼算法等;將兩比特轉(zhuǎn)化為一個(gè)堿基,然后增加篩選過濾步驟的編碼算法,包括DNAFountain噴泉碼和Yin-Yang雙編碼算法等。不同類型算法性能不同、生成序列特性不同、隱私性及穩(wěn)健性不同。待存儲(chǔ)數(shù)據(jù)的編碼算法選擇可根據(jù)以下特征進(jìn)行選擇:數(shù)據(jù)特征,包括文件大小、字節(jié)頻率等;算法性能特征,包括信息密度、轉(zhuǎn)碼速度等;序列特征,包括GC含量、單堿基重復(fù)長(zhǎng)度等;隱私性特征,包括穩(wěn)健性、破譯難度等。糾錯(cuò)編碼采用合適的技術(shù)或算法添加額外的校驗(yàn)數(shù)據(jù),對(duì)原始數(shù)據(jù)進(jìn)行數(shù)學(xué)變換使之能夠應(yīng)對(duì)DNA存儲(chǔ)過程中出現(xiàn)的錯(cuò)誤。生化適配進(jìn)行序列篩選以適應(yīng)DNA分子的生化特性,如:無均聚物、平衡的GC含量、無復(fù)雜二級(jí)結(jié)構(gòu)、無生物活性序列等。數(shù)據(jù)加密為保障DNA存儲(chǔ)中的加密與數(shù)據(jù)安全,可根據(jù)存儲(chǔ)數(shù)據(jù)的隱私性要求,對(duì)于編碼環(huán)節(jié)進(jìn)行加密,實(shí)現(xiàn)DNA編碼高效、隱私。合成DNA序列合成DNA合成環(huán)節(jié)的主要功能是完成DNA序列合成。DNA的合成按原理一般分為化學(xué)法合成和生物法合成?;瘜W(xué)法合成是主流成熟方法,包括一代合成(柱式)和二代合成(芯片)。生物法合成即三代合成(生物酶)。序列拼接受限于高通量合成DNA序列的長(zhǎng)度限制,為適應(yīng)高通量長(zhǎng)片段測(cè)序技術(shù)的要求,將合成的短DNA片段拼接為長(zhǎng)序列的過程。信息貯存封裝封裝分為物理封裝和生物封裝。物理封裝即通過低溫密封、礦化、無機(jī)物密封、固體膠囊等形式進(jìn)行封裝,生物封裝即將DNA分子通過不同形式存儲(chǔ)在活細(xì)胞內(nèi)。保存保存分為體外保存和體內(nèi)保存。當(dāng)體外保存DNA分子時(shí),可采用干粉、溶液、納米顆粒等形式保存。當(dāng)體內(nèi)保存DNA分子時(shí),可采用活細(xì)胞內(nèi)的存儲(chǔ)介質(zhì),如染色體、質(zhì)粒等。信息讀取概述將保存在不同存儲(chǔ)媒體中的DNA序列進(jìn)行測(cè)序獲得DNA片段的堿基排列順序,并將堿基序列轉(zhuǎn)換為二進(jìn)制數(shù)據(jù)從而得到存儲(chǔ)的文本文檔、圖片和聲音文件等數(shù)據(jù)的過程稱為信息讀取。信息讀取過程主要包括檢索、測(cè)序和解碼。檢索通過探針、PCR等方式抽取目標(biāo)DNA以實(shí)現(xiàn)隨機(jī)索引、重復(fù)獲取以及快速預(yù)覽功能。測(cè)序測(cè)序是獲得利用多重PCR分子等方式獲取的編碼DNA分子片段的堿基序列,即該片段中腺嘌呤A、胸腺嘧啶T、胞嘧啶C、鳥嘌呤G的排列順序。DNA測(cè)序技術(shù)主要包括Sanger測(cè)序法、高通量測(cè)序技術(shù)和單分子測(cè)序技術(shù)。高通量測(cè)序技術(shù)主要基于可逆末端終止法、連接測(cè)序法、焦磷酸測(cè)序法和聯(lián)合探針錨定聚合測(cè)序法。單分子測(cè)序技術(shù)主要基于單分子熒光測(cè)序法、單分子納米孔測(cè)序法和單分子晶體管測(cè)序法。目前技術(shù)最為成熟的是高通量測(cè)序技術(shù),已經(jīng)能夠?qū)崿F(xiàn)高通量、高準(zhǔn)確性和低重復(fù)序列率的性能。解碼解碼算法的類型與選擇與編碼算法相同,見5.1.1。解碼環(huán)節(jié)的錯(cuò)誤糾正是確保信息讀取正確率的最后一環(huán),為了糾正DNA存儲(chǔ)過程中出現(xiàn)的插入、刪除、替換等多種類型的錯(cuò)誤,開發(fā)與編碼算法適配的糾錯(cuò)方法。DNA存儲(chǔ)系統(tǒng)工作流程DNA存儲(chǔ)系統(tǒng)工作流程一般可分為4個(gè)主要步驟,包括編碼、合成、貯存、測(cè)序和解碼:編碼:將數(shù)字文件中的數(shù)據(jù)提取出來,并按一定規(guī)則轉(zhuǎn)換成為DNA堿基序列(包括但不限于自然堿基);合成:通過化學(xué)原理或生物酶法原理,利用柱式合成、點(diǎn)陣芯片、半導(dǎo)體芯片等方式根據(jù)編碼步驟獲得的DNA序列進(jìn)行人工合成;貯存:通過物理封裝或生物封裝方式,將攜帶信息的DNA分子保存于體外或體內(nèi);測(cè)序:通過利用如多重PCR、生物素-親和素序列特異性磁珠捕獲等方式,完成全部或部分編碼DNA分子的獲取,將獲取的DNA分子通過Sanger測(cè)序、高通量測(cè)序、單分子測(cè)序等方式進(jìn)行DNA分子序列的測(cè)定;解碼:對(duì)測(cè)序獲得的DNA序列進(jìn)行信息分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息安全保密教育課件
- 2026年跨境金融科技產(chǎn)品項(xiàng)目投資計(jì)劃書
- 2026年疲勞駕駛監(jiān)測(cè)系統(tǒng)項(xiàng)目投資計(jì)劃書
- 2026年河南新鄉(xiāng)鶴壁安陽焦作高三一模語文答案詳解(課件)
- 大樓監(jiān)控設(shè)計(jì)方案
- 2025年網(wǎng)絡(luò)與信息安全管理員職業(yè)技能等級(jí)考試(三級(jí))模擬試卷附答案
- 2025年駕駛員個(gè)人年度工作總結(jié)
- 2025年慢性病健康管理服務(wù)培訓(xùn)試題含答案
- 2025班組三級(jí)安全培訓(xùn)考試試題帶答案(完整版)
- 企業(yè)人力資源管理師四級(jí)模考試題與參考答案
- 新能源電站單位千瓦造價(jià)標(biāo)準(zhǔn)值(2024版)
- 軍隊(duì)院校招生文化科目統(tǒng)一考試模擬試卷
- 03課題三-建筑運(yùn)行大數(shù)據(jù)安全與數(shù)據(jù)質(zhì)量-20180703
- 工業(yè)區(qū)物業(yè)服務(wù)手冊(cè)
- 2024新能源集控中心儲(chǔ)能電站接入技術(shù)方案
- 河南省信陽市2023-2024學(xué)年高二上學(xué)期期末教學(xué)質(zhì)量檢測(cè)數(shù)學(xué)試題(含答案解析)
- 北師大版七年級(jí)上冊(cè)數(shù)學(xué) 期末復(fù)習(xí)講義
- 零售行業(yè)的店面管理培訓(xùn)資料
- 培訓(xùn)課件電氣接地保護(hù)培訓(xùn)課件
- 污水管網(wǎng)工程監(jiān)理月報(bào)
- 安徽涵豐科技有限公司年產(chǎn)6000噸磷酸酯阻燃劑DOPO、4800噸磷酸酯阻燃劑DOPO衍生品、12000噸副產(chǎn)品鹽酸、38000噸聚合氯化鋁、20000噸固化劑項(xiàng)目環(huán)境影響報(bào)告書
評(píng)論
0/150
提交評(píng)論