Arlequin操作說明解析_第1頁
Arlequin操作說明解析_第2頁
Arlequin操作說明解析_第3頁
Arlequin操作說明解析_第4頁
Arlequin操作說明解析_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

精品文檔ARLEQUIN使明言Arlequin一款優(yōu)秀的人類遺傳學數(shù)據(jù)分析軟件,其名字來源于法語Arlecchino,是一個十七世紀意大利著名喜劇人物的名字。這個喜劇人物具有多個面目,可以根據(jù)需要,多個角色之間輕而易舉的相互轉(zhuǎn)變軟件包如此取名,大概是為了說明此款軟件能夠滿足遺傳分析方面的需求。Arlequin軟件包提供了許多方法和統(tǒng)計學檢驗來從遺傳學和人口統(tǒng)計學數(shù)據(jù)(如大量的分子序列數(shù)據(jù)和傳統(tǒng)的等位基因頻率等)中挖掘信息軟件有著友好的圖形操作界面,便于使用者操作。Arlequin件包由、和LaurentExcoffier三人完成。軟件包下載和升級的網(wǎng)址為后件包基本和jre117-win32.exe組成在運行程序之前需要先安裝jre117-win32.exe是個自解壓的程序,點擊此程序?qū)⑽募尫诺剿x擇的目錄,就可以運行了。在上述網(wǎng)址還提供了一個升級包arlpatch2001.zip,修正了原軟件里邊的一些bug,并提高了某些計算程序的精確性;下載后解壓,直接運行即可。Arlquin功能概述:diversity(分子多態(tài)性)Mismatch(錯配分布)Haplotype(單倍型頻率估計)(連鎖不平衡測不同位點上等位基因的非隨機關(guān)聯(lián)Hardy-Weinbergequilibrium(哈溫—伯格平衡)Tajima`stest(中性檢驗)Fu`sneutralitytest(Fu中檢驗)Ewens-wattersonneutralitytest(性檢驗)以上三個中性檢驗都是基于無限位點模型,適用于sequence和RFLP單倍型。(Chakraborty`s融合檢驗測人群的均一性或同質(zhì)性,和中性選擇等)MinimuNetwork(MSN,最小擴張樹或稱為最小支撐樹,基于分子差異)(分子差異度分析,用以評測人群的遺傳結(jié)構(gòu))Pairwisedistances遺傳距離的估計)ofpopulation(檢測隨機交配群體單倍型的非隨機分布)testof(過估計等位基因頻率將單個基因型分配到特定的人群中)Arlequin軟件包功能強大,以上列出了本軟件包一些基本的功能,下文將對這些功能進行詳細的闡釋和實例講解。Arlequin輸入數(shù)據(jù)的式Arlequin軟件包大致能接受以下五種數(shù)據(jù)格式:sequencesRFLP、Microsatellitedata、dataAllele。這些數(shù)據(jù)可以使單倍型)數(shù)據(jù)格式,也可以是基因型()數(shù)據(jù)格式。對于類型數(shù)據(jù)”表示存在限制性位點”表示不存在限制性位點”表示限制性位點缺失。對于DNA類型數(shù)據(jù),“-代表一個缺失的核苷酸,“?”代表一個未知核苷酸,R表示(purineY表示C/T(pyrimidine表示,表示A/T,S精品文檔精品文檔表示C/GK表示G/TB表示D表示A/G/TH表示A/C/TV示N表示A/C/G/T。Arlequin軟件包輸入文件的擴展名應該為*.arp,配置文件的擴展名。Arlequin軟件包輸入文件中,#可以輸入任何字符,直至此行結(jié)尾。1、輸入文件的格式-profile在一個輸入文件的最開始是Profile部分[profile]“當前分析數(shù)據(jù)的名稱或標雙引號內(nèi)可以為任何字符串如Title=ancientmtdnadataof”NbSamples=指所分析數(shù)據(jù)中人群的個數(shù),可以是1-1000之間的任何整數(shù))如:NbSamples=。DataType=此部分用以說明所分析數(shù)據(jù)的格式??梢暂斎氲淖址校骸@纾篋ataType=DNAGenotypicData=此參數(shù)用來說明所分析的數(shù)據(jù)是單倍型數(shù)據(jù)還是基因型數(shù)據(jù)。可以輸入的字符為:0(haplotypic)和1(genotypicdata)例如:0此用明在用何等位。可用的:或除#、?、,以外的任何字符。例如:。缺省值為:GameticPhase=此參數(shù)用以說明配子片段的基因型是否已知。此處可使用的字符有0gameticnotknown)和1()例如:GameticPhase=1缺省值為:此參數(shù)用以說明所研究基因型數(shù)據(jù)是否為隱性等位基因處可使用的字符有共顯性)和1(data隱性數(shù)據(jù)例如:RecessiveData=1。缺省值為:MissData=用來確定用什么字符來代表缺失的位點數(shù)據(jù)這個字符要輸入“‘之間例如MissData=“§缺省值為:MissData=“?當單倍型或表現(xiàn)型的頻率用絕對或相對的數(shù)值來表示時,用到此項??商畹膮?shù)有ABS(絕對數(shù)值相對數(shù)值數(shù)值可以通過對樣本數(shù)目的相對頻率計算而得到如Frequency=ABS。缺省值:ABSCompDistMatrix=此參數(shù)用來說明距離矩陣數(shù)據(jù)是否來自原始的數(shù)據(jù)還是直接就是數(shù)字的形式可采用的字符有:0(利用亞陣數(shù)據(jù))和(通過單倍型信息計算距離矩陣如:CompDistMatrix=。缺省值:FrequencyThreshold=此參數(shù)用來界定輸出文件中,單倍型頻率數(shù)據(jù)的范圍??刹捎玫臄?shù)值有:從0.01到0.0000001有理數(shù)例如:FrequencyThreshold=0.01。缺省值:0.00001EpsilonValue=此參數(shù)代表利用基因型數(shù)據(jù)用來估計單倍型頻率和連鎖不平衡的運算法則的收斂標準。此處可以精品文檔--精品文檔用的數(shù)值為:ˉ到10ˉ12如:EpsilonValue=10缺省值:10

2、輸入文件的格式-Data分的數(shù)據(jù)格式要求如下。[Data]Haplotypelist(單倍型數(shù)據(jù)如下圖所示:Distancematrix距離矩陣數(shù)據(jù)),如下圖所示:對于距離矩陣數(shù)據(jù),是一個下三角的矩陣,而且對角線上所有的值為0由距離矩陣可以計算遺傳結(jié)構(gòu)。在分析中,矩陣的元素應該是Euclidean正方形的形式。另外,單倍型的名字應該跟距離矩陣行和列的順序保持一致。如果單倍型的名字在輸入文件的其它位置也曾出現(xiàn),則二者應該保持一致。3、輸入文件的格式-[Data]后的[的格式,如下示:此參數(shù)用來說明所分析樣品的名字。例如:“mtdnaXinJiangHan注意問題:不同的樣本,名字應該是不一樣的。說明樣本數(shù)目的大小,可以輸入任何正整數(shù)。例如:注意事項邊所列出的樣本數(shù)目必須與此數(shù)保持一致則程序?qū)⒉荒苷_\行會在logfile中產(chǎn)生一個警告信息。對于頻率數(shù)據(jù),當相對頻率確定時,此項參數(shù)可以用來把相對信息頻率為絕對頻率。SampleData=此參數(shù)后邊可以直接輸入所分析的數(shù)據(jù),須在大括號內(nèi)。例如:精品文檔精品文檔4、輸入文件的格式-Genetic說明結(jié)構(gòu)的名稱,雙引號內(nèi)可以為任何字符。例如:StructureName=“ofsamplesfromMongolia”注意:這個名字與輸出結(jié)果中的名字是相對應的。NbGroups=說明基因結(jié)構(gòu)中群體的數(shù)目,任何正整數(shù)即可。例如:注意:如果這個數(shù)值不正確,則程序不會運行或出現(xiàn)問題。IndividualLevel=說明分析多樣性時,是否在個體水平上??刹捎玫臄?shù)值為:或1。例如:IndividualLevel=注意:缺省值為0。1僅適用于基因型數(shù)據(jù)Group=進行分組。在此項中#”不能出現(xiàn)在括號中,否則會導致錯誤的信息。關(guān)于組的注釋信息,應該在確定分組之前已經(jīng)說明。對于分組,示例如下:5、輸入文件的格式-Mantel這個選項可以用來計算矩陣間的相關(guān)性,如Ymatrix和X1之間,Ymatrix、和X2之間。MatrixSize=用來確定用于test的矩陣的大小。所有的正整數(shù)均可。例如:5精品文檔精品文檔MatrixNumber=用來計算相關(guān)性的矩陣的數(shù)目。例如:作為遺傳距離的矩陣。例如,如果用“fst”來計算矩陣之間的相關(guān)性,么每個矩陣的遺傳配對差異將被用來計算。其對應關(guān)系如下圖所示:用來確定計算所使用的選定的距離矩陣的名字雙引號引起來于一個大括號中。如下圖所示:DistMatMantel=利用算的相關(guān)性矩陣的值。形式如下圖所示:UsedYMatrixLabels=屬于此組的矩陣的名字集合,用大括號括起來。形式如下圖所示:精品文檔精品文檔關(guān)于輸文件的實例,如下圖所示:在安目錄下,會有一個名為datafiles”的文件夾,里邊有各種輸入數(shù)據(jù)的例子,分析數(shù)據(jù)時參照那些例子的格式即可。Arlequin的界面及操精品文檔精品文檔Arlequin件的操作界面比較友好,操作簡便。單的“arlequin.exe”件,會彈出如下操作界面。FileMenuproject:打開所要分析的數(shù)據(jù)project:關(guān)掉正在分析的數(shù)據(jù)

:退出Help幫助文件點擊“Project”按鈕,會彈出如對話框:精品文檔精品文檔選擇要分析的數(shù)據(jù)的路徑和名字,點擊“Ok”即可載入數(shù)據(jù),點擊“Cancel則取消此步操作,點擊“ClearList”按鈕清除空白框中的數(shù)據(jù),點擊“Addto”可瀏覽電腦文件夾,載入要分析的數(shù)據(jù)。點擊“”按鈕,操作界面變?yōu)槿缦聢D所示:Use如果選中此選項,則Alequin對每套數(shù)據(jù)都將自動載入相同的設置。精品文檔精品文檔Append:如果選項則每次的運行結(jié)果都自動添加到前次運行結(jié)果之后。Includedistancematrixresults:如果選中此選項,則利用單倍型估計分子分歧度的距離矩陣將在結(jié)果文件中顯示出來。AMOVAnull選中此選項,結(jié)果文件中空分布的運行結(jié)果與輸入文件相同,但擴展名為*、*.vb等。oftoviewresults:確定結(jié)果文件的存放位置。LocationofEditorviewproject:確定用何種文編輯器去查看或編輯Alequin和log文件。點擊“Project”按鈕,會彈出如下對話框。DataFile:確定目標文件的名字和位置,其擴展名必須為*.arp。Data定所分析數(shù)據(jù)的類RFLP、Gameticphase、RecessiveControlsNumber(樣本數(shù)目(用什么字符來分隔不同的位點(用什么字符代表缺失的位點數(shù)據(jù)Optionaldatalistof(單倍型列表distancematrix(離矩陣)group(分組的結(jié)構(gòu))。點擊“”按鈕,彈出如下對話框。精品文檔精品文檔通過此對話框可以將2.0的數(shù)據(jù)轉(zhuǎn)化為Alequin1.11.01.0Phylip3.5、Mega、WinAmova等軟件包的數(shù)據(jù)格式。載入數(shù)據(jù)之后,程序的操作界面發(fā)生相應的變化。點擊“Project”按鈕,操作界面如下圖所示:精品文檔精品文檔title:所分析數(shù)據(jù)的名稱。Genotypic:確定輸入數(shù)據(jù)是雙倍體基因型數(shù)據(jù)還是單倍型數(shù)據(jù)。Gameticphase:確定輸入數(shù)據(jù)中配子片段是否已知。Recessive:確定輸入數(shù)據(jù)中是否為隱性Datatype:輸入數(shù)據(jù)的類型。:缺失數(shù)據(jù)用什么字符來表示?!啊卑粹o可以用來查看計算分析的結(jié)果,利用“Editproject”按鈕可以編輯數(shù)據(jù)文件。“”欄顯示關(guān)于分析數(shù)據(jù)的基本信息。Arlequin軟件還能同時處理多個文件,這點類似于,系統(tǒng)下的批處理命令。這樣的批處理文件以“”為擴展名。打開一個批處理文件,其操作界面與普通數(shù)據(jù)有所不同,如下如圖所示:精品文檔精品文檔對上述操作界面,闡釋如下:Usesettings:對每套數(shù)據(jù)采用已經(jīng)準備好的相關(guān)設置。Use對每套數(shù)據(jù)采用事先預訂好的同一套計算設置。tosummarize:這個選項允許從批處理列表中選擇出每個文件所要進行的計算分析選項。這些結(jié)果會被寫進不同的文件中,但這些文件都以“為擴展名,而且這些文件與“file”置于同一目錄下。點擊“CalculationSettings進行具體的計算分析設置,其操作界面如下圖所示:精品文檔精品文檔“Calculation”對話框被分為三個部分。在操作界面的左上方是一個樹形的結(jié)構(gòu),使用戶可以快速的選擇進行何種運算。在操作界面的左下方是針對于每項計算任務的具體參數(shù)的設置,各種運算參數(shù)可以顯示在這個區(qū)域。在操作界面的右上方會顯示,被選中的計算任務的一些基本信息。“”欄基本信息的說明:Load:載入事先確定好的運算設置(保存在以*為擴展名的文件中:把當前的運算設置保存到以*.ars擴展名的文件中。Reset:所有的設置恢復到缺省值。選擇主操作界面左上方樹形結(jié)構(gòu)中的“Generalsettings”的“files”選項,操作界面變?yōu)槿缦聢D所示:精品文檔精品文檔“Project進行分析的數(shù)據(jù)文件的路徑及名字(多以*.arp擴張名“ResultfileArlequin件包運行結(jié)果的html文件此文件的名字與數(shù)據(jù)文件的名字一致,只是擴張名為*.html。“含結(jié)果文件主要結(jié)構(gòu)的html文件。選擇主操作界面左上方樹形結(jié)構(gòu)中的settings”的Polymorphism”選項,操作界面變?yōu)槿缦聢D所示:精品文檔精品文檔對上述操作界面的解釋如下:missingsite:此參數(shù)用來確定用來計算分析的任何位點的缺失數(shù)據(jù)的多少。例如的水平意味著,一個基因座如果有超的缺失位點,則在計算過程中將不被認可這個選項在處理不同個體且測序片斷不太相同的據(jù)時,尤其有用。如果把此參數(shù)設為,則意味著在所有個體中不能有缺失位點。相反,如果把此參數(shù)設為1,則意味著在所有個體中的缺失位點是允許的。Transversionweitght:顛換的權(quán)重(處理列時Transition:轉(zhuǎn)換的權(quán)重(處理DNA序列時Deletion:位點缺失的權(quán)重(處理DNA序列或RFLP據(jù)時InferhaplotypesfrommatrixUseoriginaldefinition:確定用何種數(shù)據(jù)來確定相似的單倍型,第一個選項的依據(jù)是計算所得的遺傳距離,第二個選項的依據(jù)是數(shù)據(jù)原始狀態(tài)的不同。選擇主操作界面左上方樹形結(jié)構(gòu)中的“General”的“SettingsforEMalgorithm”選項,操作主界面變?yōu)槿缦聢D所示:精品文檔精品文檔“fortheEMEM運算程序及輸出直接相關(guān)的單倍型頻率估計的一些設置。“Significantforoutput確定在結(jié)果輸出文件中型估計頻率的有效數(shù)字的多少。“value此參數(shù)設定了一個標準,即當估計未知配子片斷基因型數(shù)據(jù)的單倍型頻率或連鎖不平衡時,到何種程度才停止程序的繼續(xù)運算。這個標準在不同的個體單倍型中是不一樣的,程序的默認缺省值為1.0E。選擇主操作界面左上方樹形結(jié)構(gòu)中的“Diversity”的“diversity”選項,操作主界面變?yōu)槿缦聢D所示:精品文檔精品文檔對此操作界面的解釋如下:“Standarddiversityindices算幾種常見的分歧度參數(shù),如等位基因的數(shù)目、分離位點的數(shù)目、雜合的水平等等?!癕oleculardiversity分子水平上計算遺傳分歧度的幾個參數(shù)的選擇框?!癈omputeamonghaplotypes用每個人群的單倍型數(shù)據(jù)計算最小支撐樹和最小支撐擴張網(wǎng)絡圖?!癕olecular比較單倍型差異時,選擇遺傳距離的類型”為配對差異距離ofdifference”為核苷酸差異數(shù)的百分比?!癮當選擇位點之間進化速率不同的位點的遺傳距離時,設gamma功能的形校正的參數(shù)值。這個選項只對于計算某些序列間的遺傳距離有用。如果選擇了“0將會使gamma參數(shù)校正失去意義。如果此數(shù)值設置為無窮大,也將使參數(shù)校正失去意義?!癙rintmatrix果選擇此選項,則樣本之間的分子分歧距離會在結(jié)果文件中顯示。Theata(通過估計觀測到的純質(zhì)性而得到的一個參數(shù):通過估計觀測到的隔離位點個數(shù)而得到的一個參數(shù)。Theta(k):通過觀測到的等位基因k的個數(shù)而得到的一個參數(shù)Theta(π):通過平均配對差異數(shù)而得到的一個參數(shù)。例如段論文采用Arlequin體系統(tǒng)分析軟件對克里雅河流域封閉人群個STR因座的實驗數(shù)據(jù)進行處理計算得到平均基因變化(averagediversity)±平均配對差異ofpairwise為3.5012±。選擇主操作界面左上方樹形結(jié)構(gòu)中的“Diversity”的“Mismatchdistribution”選項,操作精品文檔精品文檔主界面變?yōu)槿缦聢D所示:“Mismatchdistribution配對分布或平均配對差異分析,是將一個或多個群體的任兩個序列進行兩兩比較得出的序列間的配對差異情況。而群體間的配對差異分(intermatchdistribution)是群體間的序列進行兩兩比較得出的配對差異情況?!癕oleculardistance提供了兩種分子距離模型difference“Proportionofdifferencedifference”為配差異距離,僅僅是單倍型之間所觀測到的不同的核苷酸的數(shù)目proportionofdifference”為核苷酸差異數(shù)的百分比。Numberofbootstrap進行自展的次數(shù),重抽樣的序列用重置的樣本位點產(chǎn)生。“Mismatchdistribution”的意義:通過考察群體的核苷酸不配對曲線是否單峰型或多峰型、是否偏離中性檢驗,可以推測過去群體是否發(fā)生過擴張。一般群體在過去經(jīng)受擴張或持續(xù)增長,其核苷酸不配對分布曲線(distribution)會呈現(xiàn)單峰泊松分布Tajima中性檢驗顯著偏離中性突變而群體大小保持穩(wěn)定時核苷酸不配對分布曲線則呈現(xiàn)多峰曲線分布,D值檢驗不顯著。低的TajimaD值和配對差異的鐘型分布,可以作為一個古代群體擴張的證明。根據(jù)核苷酸不配對分析還可估算出τ值依據(jù)T=τ/2uT為群體擴張發(fā)生的時間,多世代表示;M為序列長度;u為進化速率可推算群體發(fā)生擴張的年代。過去對群體時代時間多采用20年或25年的估計值,最近tremblay等分析估算的結(jié)果表明年可能是一個更合適的值。例如:段論文,在研究新疆克里雅河封閉人群時,根據(jù)群體核苷酸不配對分析進一步估算出此封閉人群的τ值為6.277,依公τμT,采33%的進化速率,則克里雅人群體擴張時間約發(fā)生在距今5.3萬年前。與計算得的新疆維吾爾人群的值(新疆哈薩克人群外的維吾爾精品文檔精品文檔人群()和境外的哈薩克人群()非常相似。選擇主操作界面左上方樹形結(jié)構(gòu)中的“Diversity”的“frequencies”選項,操作主界面變?yōu)槿缦聢D所示:“即單倍型頻率。如果輸入數(shù)據(jù)的形式屬于配子片斷已知的單倍型數(shù)據(jù)或基因型數(shù)據(jù),則操作界面如上圖所示?!癎enefrequency觀測到的數(shù)據(jù)中,估算最大似然的單倍型頻率。“allelefrequenciesatallloci別估算所有位點的等位基因頻率。“forsharedbetween利用上“control遺傳距離操作設置計算出配對差異距離之后,估計相似的單倍型。對于每個群體,共享的單倍型將在結(jié)果文件中顯示。在結(jié)果文件中,會出現(xiàn)一個包含每組確定單倍型的表格,并且會給出其在每個群體中相對和絕對的頻率。這個選項僅對單倍型數(shù)據(jù)有效。如果輸入數(shù)據(jù)的形式屬于配子片斷未知的基因型數(shù)據(jù),則操作的界面或選項會出現(xiàn)一些改變。選擇主操作界面左上方樹形結(jié)構(gòu)中的“Linkagedisequilibrium”的“Pairwise”選項,操作主界面變?yōu)槿缦聢D所示:精品文檔精品文檔“disequilibrium選項可以檢測基因位點之間存在的明顯的連鎖現(xiàn)象。這個測定能夠處理除基因頻率以外的所有數(shù)據(jù)類型。基因座的數(shù)目可以是任意的,但是如果少于兩個多態(tài)性位點,則檢測不是那么有效。此項操作對于不同類型的數(shù)據(jù)會有不同的操作界面和選項。對于此操作界面的解釋如下:“Numberofstepsin行搜索的最大次數(shù)100000更大的數(shù)值都可以。這個數(shù)值越大,和估計的分離標準系數(shù)就越精確,不過會增長運算的時間?!癗umberofdememorizationsteps開始比較觀測到的可選擇的數(shù)據(jù)同觀測到的數(shù)據(jù)的可能性之前,進行運算的次數(shù)。幾千次的運算對于達到一個隨機的起始點是必須的?!癉D`coefficientsforallofallelesatloci是從不同基因作等位基因測定隨機相關(guān)性的經(jīng)典的連鎖不平衡系數(shù)計算公式為D=P-PPD`是被給出的等位基因的最大DD)ijijmax標準化之后的連鎖不平衡系數(shù)?!癶istogram產(chǎn)生有關(guān)連鎖不平衡的基因作的數(shù)目的柱狀圖,以及位點之間連鎖相關(guān)的S-S表。S是多態(tài)性位點的數(shù)目。計算分析結(jié)果可以保存在名為“l(fā)k_hist.xl”的文件中。“驗連鎖不平衡時的顯著性水平。該操作還根據(jù)數(shù)據(jù)類型的不同,還可以有如下操作界面:精品文檔精品文檔“Numberofpermutations生的隨機序列突變的樣本的數(shù)目。這個數(shù)目可以大于幾千??梢员WC會有少于的不同。P標準誤的估算可以通過程序批處理的手段實現(xiàn)?!癗umberof置程序開始重復估算樣本似然值的隨機初始狀態(tài)的數(shù)目。此界面其它選項同上述操作。選擇主操作界面左上方樹形結(jié)構(gòu)中的“Linkage”的“”選項,操作主界面變?yōu)槿缦聢D所示:精品文檔精品文檔“equilibrium測一個隨機配子單位產(chǎn)生的倍數(shù)基因型的理論。這個檢測僅適用于基因型數(shù)據(jù)。每個基因座分別檢驗。“Numberofstepsin索的最大次數(shù),100000或更大的數(shù)值是允許的。“Numberofdememorizationsteps開始比較觀測到的可選擇的數(shù)據(jù)同觀測到的數(shù)據(jù)的可能性之前,進行運算的次數(shù)。幾千次的運算對于達到一個隨機的起始點是必須的。選擇主操作界面左上方樹形結(jié)構(gòu)中的“Neutrality”的“Infinite-allelemodels”選項,操作主界面變?yōu)槿缦聢D所示:精品文檔HomHom精品文檔“Ewens-Watterson此理論基于一個處于平衡狀態(tài)的人群的Ewens樣本抽樣理論。此檢測通常限定基因的數(shù)目小于等位基因的數(shù)目小于1000?!癗umberof生的隨機樣本的數(shù)目,一般把數(shù)值取在幾千或更大。“Chakraborty`stestof檢驗人群中性選擇、同質(zhì)性、連鎖平衡的一種方法。當樣本的異質(zhì)性被懷疑時可采用此方法,它利用觀測到的純質(zhì)性(純合基因)來估算人群的突變參數(shù)θ。對于此參數(shù)的估計值可以用來計算觀測到的k位基因的可能性,和從一個穩(wěn)定群體抽出中性樣本的可能性。這種方法對人群的融合和異質(zhì)性不敏感。選擇主操作界面左上方樹形結(jié)構(gòu)中的test”的Infinite-site”選項,操作主界面變?yōu)槿缦聢D所示:精品文檔精品文檔Tajima`stestofselective:通過比較人群參數(shù)兩個估計值的大小而得,一個估計值是基于樣本中分離位點的數(shù)目,另一個估計值是基于不同單倍型之間平均配對差異的平均值。在無限位點模型中,如果是中性突變,則這兩個參數(shù)應該相等。自然選擇、人群的不穩(wěn)定、位點之間突變速率的不同都會導致這兩個值的差異。低的TajimaD值(有時是負值)和配對差異的鐘型分布,可以作為一個古代群體擴張的證明。Fu`sofselectiveneutrality:基于一個給定數(shù)目的樣本中所觀察到的k值或更多等位基因的可能性,它以觀測到的配對差異的平均數(shù)為條件。這個檢驗對有人群擴張所造成的群體不平衡比較敏感。選擇主操作界面左上方樹形結(jié)構(gòu)中的Geneticstucture”的“AMOVA/MSN”選項,操作主界面變?yōu)槿缦聢D所示:精品文檔精品文檔“AMOVA/MSN子差異性分析及最小支撐樹的構(gòu)建。(of)是指對分子差異性的分析。它通過對所研究群體進行不同層次的歸類和劃分,可界定不同的遺傳結(jié)構(gòu)并進行統(tǒng)計學檢驗,從而估計出群體間、群體內(nèi)以及個體間不同層次所表現(xiàn)的差異占總變異的多少。這種方法可以討論不同海拔高度、不同語系、以及地理群體間是否存在相應的遺傳變異?!癓ocus個基因座單獨進行分子差異性的分析?!癷nindividualforgenotypic體之間基因分歧度協(xié)方差組成和相關(guān)的固定指數(shù)。因此,它計算觀測到的基因間的差異。這是檢測衡失調(diào)的另一種途徑。選擇這個選型僅對配子片斷已知的基因型數(shù)據(jù)有效?!癗umberofpermutations來檢測協(xié)方差組成和固定指數(shù)的置換數(shù)的值。如果數(shù)值為,則不會有任何檢測結(jié)果。一個較為正確的結(jié)果至少要進行幾千次檢驗?!癈omputespanningnetworkamong用分子差計算并繪制單倍型之間的系統(tǒng)樹?!啊钡倪x擇:1projectmatrix用數(shù)據(jù)文件中的距離矩陣,如果可能的話2distancematrix據(jù)選定的距離模型計算距離矩陣,在數(shù)據(jù)文件中事先被定義的距離矩陣將會被忽略。單倍型數(shù)據(jù)和基因型數(shù)據(jù)都可以產(chǎn)生這樣的矩陣。3UseF-statistics果激活了這個選項,我們將利用一個下三角矩陣(對角線處是)來作為非下三角矩陣元素。這意味著所有不確定單倍型之間的距離將會被認作是確定的,這意味著此項將會影響等位基因頻率的遺傳結(jié)構(gòu)。4betweenhaplotype擇一種距離模型去計算單倍型之間的遺傳距離。不同類型的數(shù)據(jù)要用不同的距離模型去計算分析。精品文檔精品文檔“α選擇允許不同位點之間有不等進化速率時,設gamma能的圖形參數(shù)α的值。根據(jù)數(shù)據(jù)類型不同,選擇上述選項還可能出現(xiàn)如下圖所示的操作界面。分析應用十分廣泛,尤其在比較不同群體之間遺傳相關(guān)性大小時。例如:崔文:在吐魯番古代群體與現(xiàn)代新疆和中亞人群的分析中,可以發(fā)99.75%的遺傳變異來自于群體內(nèi),只有0.25%來自于群體間(P=0.0025,1023permutations當我們將歐洲(Basque)和東亞(Han)的群體加入,再進行比較,組內(nèi)的差異變92.4%,而組間的差異增加為7.6%(顯著性差異。這一結(jié)果說明吐魯番古代群體的mtDNA序列與中亞及新疆的現(xiàn)代群體無明顯的區(qū)別。論文:按地理位置把境外的維吾爾和哈薩克分為一組,把新疆的維吾爾,哈薩克和克里雅人群分為一組,分成兩個組群時,分析結(jié)果表明組間的差異為%P=0.1188內(nèi)人群之間的差異-0.21%(P=0.7181群內(nèi)部的差異為99.87%(=0.5454最后,按語言劃分,這五個群體的語言都屬于阿爾泰語系中的突厥語族但分別屬于兩個不同的語支,因此我們把境外的維吾爾,新疆維吾爾和克里雅分為一組,把境外的哈薩克和新疆哈薩克分為一組,又分成兩個組群時,組間差異為-0.25P0.6182內(nèi)人群間的差異為0.14%P=0.5818人群內(nèi)部的差異為100.10%(=0.4545),這表明講同種語言的人群之間的差異要比語言不同的組群之間的差異還要大,由此可知mtDNA的差異并不能反映語言劃分的范疇。選擇主操作界面左上方樹形結(jié)構(gòu)中的“Geneticstucture”的comparisons選項,操作主界面變?yōu)槿缦聢D所示:精品文檔精品文檔“計算人群之間不相似指數(shù)(遺傳距離)的大小,像統(tǒng)計值,經(jīng)過轉(zhuǎn)換的F值(能夠用于短片段的基因的遺傳距離人群之間和人群內(nèi)部的平均配對差異等。這些遺傳距離可以利用置換人群之間單倍型或個體來進行檢驗?!癈omputationof算所有配對人群的F值。ST“算等線性化的F,這適用于分歧時間較短的樣本?!癝latkin`s算源于配對間的的遺傳距離?!癙airwise算Nei`s人群內(nèi)部和人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論