目前應(yīng)用的兩種快速序列測(cè)定技術(shù)是Sanger等(1977)提出的酶法及Maxam和Gilbert(1977)提出的化學(xué)降解法。雖然其原理大相徑庭,但這兩種方法都是同樣生成互相獨(dú)立的若干組帶放射性標(biāo)記的寡核苷酸,每組寡核苷酸都有固定的起點(diǎn),但卻隨機(jī)終止于特定的一種或者多種殘基上。由于DNA上的每一個(gè)堿基出現(xiàn)在可變終止端的機(jī)會(huì)均等,因些上述每一組產(chǎn)物都是一些寡核苷酸混合物,這些寡核苷酸的長(zhǎng)度由某一種特定堿基在原DNA全片段上的位置所決定。然后在可以區(qū)分長(zhǎng)度僅差一個(gè)核苷酸的不同DNA分子的條件下,對(duì)各組寡核苷酸進(jìn)行電泳分析,只要把幾組寡核苷酸加樣于測(cè)序凝膠中若干個(gè)相鄰的泳道這上,即可從凝膠的放射自影片上直接讀出DNA上的核苷酸順序。
現(xiàn)行的邏終止法人加減法序列測(cè)定技術(shù)(Sacger和Coulson,1975)發(fā)展而來(lái)的。加減法首次引入了使用特異引物在DNA聚合酶作用下進(jìn)行延伸反應(yīng)、堿基特異性的鏈終止,以及采用聚丙烯酰胺凝膠區(qū)分長(zhǎng)度差一個(gè)核苷酸的單鏈DAN等3種方法。盡管有了這些進(jìn)展,但加減法仍然太不精確,也太不得法,因此難以廣為接受。直至引入雙氧核苷三磷酸(ddTBP)作為鏈終止劑(Sanger等,1977 ),酶法DNA序列測(cè)定技術(shù)才得到廣泛應(yīng)用。2',3'ddNTP與普通dNTP不同之處在同它們?cè)诿撗鹾颂堑?' 位置缺少一個(gè)羥基。它們可以在DNA聚合酶作用下通過(guò)其5' 三磷酸基團(tuán)摻入到正在增長(zhǎng)的DNA鏈中,但由于沒(méi)有3'羥基,它們不能同后續(xù)的dNTP形成磷酸二酯鏈,因此,正在增長(zhǎng)的DNA鏈不可能繼續(xù)延伸。這樣,在DNA合成反應(yīng)混合物的4種普通dNTP中加入少量的一種ddNTP后, 鏈延伸將與偶然發(fā)生但卻十分特異的鏈終止展開(kāi)競(jìng)爭(zhēng),反應(yīng)產(chǎn)物是一系列的核苷酸鏈,其長(zhǎng)度取決于從用以起始DNA合成的引物末端到出現(xiàn)過(guò)早鏈終止的位置之間的距離。在4組獨(dú)立的酶反應(yīng)中分別采用4種不同的ddNTP,結(jié)果將產(chǎn)生4組寡核苷酸,它們將分別終止于模板鏈的每一個(gè)A、每一個(gè)G或每一個(gè)T的位置上。
Sanger法DNA測(cè)序的試劑
1.引物
酶促測(cè)序反應(yīng)中利用一個(gè)與模板鏈特定序列互補(bǔ)的合成寡核苷酸作為DNA合成的引物。在許多情況下,可將靶DNA片段克隆于M13噬菌體或噬菌粒載體,以取得單鏈DNA分子作為模板。但也可以采用Sanger 法商定變性雙鏈DNA模板的序列。在以上兩種情況下, 都可以采用能與位于靶DNA側(cè)翼的載體序列相退火的通用引物,而不必取得與未知DNA序列互補(bǔ)的引物。適于M13噬菌體重組克隆的通用測(cè)序引物一般長(zhǎng)15-29 個(gè)核苷酸,并可與緊靠M13mp18噬菌體多克隆位點(diǎn)區(qū)的HindⅢ位點(diǎn)成M13mp19 噬菌體多克隆位點(diǎn)區(qū)的EcoRI位點(diǎn)的序列互補(bǔ)。這些引物同樣也可用于對(duì)克隆于pUC質(zhì)粒的DNA進(jìn)行“雙鏈”測(cè)序,并可從許多廠商中購(gòu)置得到。此外,還有若干家公司出售一些引物,這些引物下為了對(duì)通過(guò)多種限制酶切位點(diǎn)克隆于不同質(zhì)粒的靶DNA進(jìn)行測(cè)序而設(shè)計(jì)的。
2.模板
如上所述,有兩類DNA可以用作Sanger 法測(cè)序的模板:純單鏈DNA和經(jīng)過(guò)熱變性或堿變性的雙鏈DNA。采用通常從重組M13噬菌體顆粒中分離得到的單鏈DNA應(yīng)中獲得數(shù)百個(gè)核苷酸的序列。如用變性雙鏈DNA用模板,則較難獲得這咱質(zhì)量的結(jié)果。盡管采用雙鏈DNA模板的方法顯然既簡(jiǎn)單又方便(Chen和Seeburg,1985),然而只是在不久前得到改進(jìn)以后, 這一方法才發(fā)展到能夠獲得明確可信結(jié)果的水平。其中有兩個(gè)因素是至關(guān)重要的,這就是模板DNA的質(zhì)量和所用DNA聚合酶的種類。小量制箅的質(zhì)粒DNA常常被寡脫氧核糖核苷酸小分子、核糖苷酸及DNA聚合酶的抑制劑所污染,其中前兩種污染物可被用作隨機(jī)引物。結(jié)果,種種“鬼”帶、強(qiáng)終止現(xiàn)象,以及其他假象往往使測(cè)序凝膠含混不清、黯然失色。因此采用小量制備的質(zhì)粒NDA來(lái)測(cè)定未知DNA克隆片段的序列,并不可取。然而,這類DNA?勺鳛閷(duì)已經(jīng)通過(guò)另一方法測(cè)定的序列進(jìn)行進(jìn)一步的合適模板。采用CsCl-溴化乙錠梯度平衡離心法來(lái)純化質(zhì)粒DNA,測(cè)序的結(jié)果會(huì)好得多,但卻要耗費(fèi)大量的人務(wù)和物力。模板鏈的每一個(gè)A、每一個(gè)G或每一個(gè)T的位置上。
3.DNA聚合酶
通常用于雙脫氧法序列測(cè)定的有幾種不同的酶,其中包括大腸桿菌DNA聚合酶I的Klenow片段(Sanger等,1977),反轉(zhuǎn)錄酶(見(jiàn)文獻(xiàn),如Mieredorf和Prfeffer,1987)經(jīng)過(guò)修飾消除了3'→5'外節(jié)酶活性的T7噬菌體DNA聚合酶(Sequenase)和測(cè)序酶2.0),Tabor和Richardson,1978]惟及從嗜熱水生菌(T'hermus aquaticus)分離的耐熱DNA聚合物(Taq DNA聚合酶)。這些酶的特性差別懸殊,因而可大大影響通過(guò)鏈終止反應(yīng)所獲得的DNA序列的數(shù)量的質(zhì)量。
(1)大腸桿菌DNA聚合酶IKlenow 片段 這種酶是最初用以建立Sanger法的酶,也是至今仍然廣泛用于DNA序列測(cè)定的酶。 通常碰到的兩個(gè)問(wèn)題是:1)Koenow片段的持續(xù)合成能力低,以致一些片段并非由于dd NTP的摻入,而是因?yàn)榫酆纤崛四0迳想S機(jī)解離而終止合成,因而導(dǎo)致背景增高。由于該酶不能沿模板進(jìn)行長(zhǎng)中距離移動(dòng),因此利用該酶進(jìn)行的標(biāo)準(zhǔn)測(cè)序反應(yīng)所得序列的長(zhǎng)度有限。通常,這一反應(yīng)只能得到大約250-350個(gè)核苷酸的序列。 如果分兩步進(jìn)行反應(yīng),所得序列的數(shù)目可以翻一番;其中第一步是初始標(biāo)記步驟,采用低濃度的dNTP,而隨后的第二步是鏈延伸-鏈終止反應(yīng),含有ddNTP和高濃度的dNTP(Johoston-Dow等,1987;Stambaugh和Blakesley,1988)。然而即使有了這些改進(jìn),用Klenow 酶所測(cè)序列的長(zhǎng)度通常還是不如持續(xù)合成能力較強(qiáng)的測(cè)序酶。2)這種酶對(duì)模板中的同聚核苷酸段或其他含牢固二級(jí)結(jié)構(gòu)的區(qū)域進(jìn)行復(fù)制的效能很低。將聚合反應(yīng)的溫度提高到55℃,可以緩解但并不能徹底解決這一問(wèn)題(Gomer和Firtel,1985)。有時(shí)可采用一些dNTP類似物[如dITP或7-脫氮dGTP(7-deaza-dGTP)]來(lái)獲取模板中可形成穩(wěn)定二級(jí)結(jié)構(gòu)的相應(yīng)區(qū)段的序列信息,但Kleow酶對(duì)這些類似物的作用不如測(cè)序酶有效,這也許是因?yàn)樗鼈兪筀lenow酶原已較低的持續(xù)合成能力進(jìn)一步降低?偠赃@,可以選用大腸桿菌DNA聚合酶IKlenow片段測(cè)定從引物5'位置起250個(gè)堿基以內(nèi)的一段DNA序列, 但不宜用它來(lái)測(cè)定更長(zhǎng)一段DNA序列或者具有二重對(duì)稱和(或)同聚核苷酸段的DNA序列。
(2)反轉(zhuǎn)錄酶 盡管日常測(cè)序工作并不廣泛使用反轉(zhuǎn)錄酶,但有時(shí)用這個(gè)酶解決一些由于模板DNA中存在A/T或G/C同聚核苷酸區(qū)而引起的問(wèn)題。來(lái)自禽類和鼠類反轉(zhuǎn)錄病毒的反轉(zhuǎn)錄酶在這一看來(lái)要比Klenow酶略勝一籌(Karanthaansis,1982;Graham等,1986 ),盡管它們也許還是比測(cè)序酶遜色(Cameron-Mills,1988;Revak等1988)。
(3)測(cè)序酶: 測(cè)序酶(SequenaseTM)是一種經(jīng)過(guò)化學(xué)修飾的T7噬菌體DNA聚合酶。這酶原來(lái)具有很強(qiáng)的3'→5'外切核酸活性,經(jīng)過(guò)修飾后, 這一活性大部分均被消除。測(cè)序酶2.0版是測(cè)序酶的基因工程產(chǎn)品,它完全缺失了3' →5'外切核酸酶活性,極其穩(wěn)定而經(jīng)活性要比經(jīng)化學(xué)修飾的測(cè)序酶高2倍。測(cè)序酶持續(xù)合成能力很強(qiáng),聚合速率很高,對(duì)諸如dITP和7-脫氮-dGTP等用于提高分子辨率使測(cè)序凝膠某些區(qū)段上的壓縮條帶得以分開(kāi)的核苷酸類似物具有廣泛的耐受性。它是測(cè)定長(zhǎng)段DNA序列的首選酶。測(cè)序酶可以沿模板移動(dòng)很長(zhǎng)的距離,因而一套反應(yīng)常常就可以測(cè)定數(shù)百個(gè)核苷酸的DNA序列。實(shí)際上,測(cè)得序列的長(zhǎng)度更多是受聚丙烯酰胺凝膠的分辨能力而不是受該聚合酶的特性所制約。為了充分利用測(cè)序酶極高的持續(xù)合成能力,可采用兩步測(cè)序反應(yīng)。第一步首先采用低濃度的dNTP的較低溫度, 以便將合成反應(yīng)限制在適度之下并確保放射性標(biāo)記dNTP和較低溫度,以便將合成反應(yīng)限制在適度之下并確保放射性標(biāo)記dNTP的有效摻入,這步反應(yīng)的產(chǎn)物是僅僅延伸了20-30堿基的引物。 再將第一步反應(yīng)等分于4組1套的標(biāo)準(zhǔn)反應(yīng)系統(tǒng)中,每組反應(yīng)中都含有高濃度的d NTP和一種ddNTP。這樣聚合反應(yīng)就得以繼續(xù),直至造成鏈終止的核革酸摻入正在增長(zhǎng)的鏈中。
(4)Taq DNA聚合酶 Taq DNA聚合酶適用于測(cè)定在37 ℃形成大段穩(wěn)定十級(jí)結(jié)構(gòu)的單鏈DNA模板序列。這是因?yàn)門aq DNA聚合酶在70-75℃活性最高,這一溫度下即使GC豐富的模板也無(wú)法形成二級(jí)結(jié)構(gòu)。按照1nnis 等(1988)介紹的方法使用Taq DNA聚合酶進(jìn)行測(cè)序,在放射自顯影片上得到的測(cè)序梯連續(xù)數(shù)百個(gè)堿基條帶始終清晰如一,表明這種酶的持續(xù)合成能力甚佳。模板鏈的每一個(gè)A、每一個(gè)G或每一個(gè)T的位置上。模板鏈的每一個(gè)A、每一個(gè)G或每一個(gè)T的位置上。
4.放射性標(biāo)記的dNTP
直至幾年以前,實(shí)際上所有DNA測(cè)序反應(yīng)都用[α-32P]dNTP來(lái)進(jìn)行。然而32P發(fā)射的強(qiáng)β粒子造成兩個(gè)問(wèn)題。首先由于發(fā)生散射,放射自顯影片上的條帶遠(yuǎn)比凝膠上的DNA條帶更寬、更為擴(kuò)散,因此將影響到所讀取的序列(尤其是從放射自顯影片的上部所讀取的序列)的正確性并將制約從單一凝膠上能讀出的核苷酸序列的長(zhǎng)度。其次32P的衰變會(huì)引起樣品中DNA的輻射分解,因此用32P進(jìn)行標(biāo)記的測(cè)序反應(yīng)只能保存一兩天,否則DNA將被嚴(yán)重破壞以至測(cè)序凝膠上模糊不清、真假莫辨。[35S]dATP的引入(Biggin等,1983)大大緩解了上述兩方面的矛盾。由于35S衰變產(chǎn)生較弱的β粒子,其散射有所減弱,凝膠和放射自顯影片之間在分辨率上相差無(wú)幾,因此可以從一套反應(yīng)中確切測(cè)定數(shù)百核苷酸的DNA序列。此外,35S的低能輻射所引起的樣品分解比較輕微,因此,測(cè)序反應(yīng)可在-20℃保存至1周,而分辨率不見(jiàn)下降。這樣,職果聚丙烯酰胺凝膠方面了發(fā)生技術(shù)故障,只要對(duì)測(cè)序反應(yīng)進(jìn)行重分析即可。
5.dNTP類似物
二重對(duì)稱的DNA區(qū)段(特別是GC含量高者)可以形成鏈內(nèi)二級(jí)過(guò)程中不能充分變性。因此將引起不規(guī)則遷移,使鄰近的DNA條帶壓縮在一起,以致難以讀出序列。這種壓縮現(xiàn)象歸因于DNA二級(jí)結(jié)構(gòu)的存在,而且不可能通過(guò)改變測(cè)序反應(yīng)中出序列。這種壓縮現(xiàn)象歸因于DNA二級(jí)結(jié)構(gòu)地存在,而且不可能通過(guò)改變測(cè)序反應(yīng)中所用DNA聚合酶的種類而得到減輕。但是凝膠中的壓縮區(qū)段往往可以通過(guò)采用諸如dITP(2'-脫氧次黃苷15' -三磷酸)或7-脫氮-dGTP(7-脫氮-2'-脫氧鳥(niǎo)苷-5' -三磷酸)等核苷酸類似物進(jìn)行分辨。這些類似物與普通堿基的配對(duì)能力較弱,而且是測(cè)序酶和Taq DNA聚合酶等DNA聚合酶的合適底物(Gough和Murray,1983;Mixusawa等,1986;Innis等,1988)。但對(duì)某些壓縮條帶,7-脫氮-dGTP無(wú)濟(jì)于事;同樣,dITP也無(wú)補(bǔ)于另一壓縮條帶(尤其是得于GC豐富區(qū)的縮條帶)的分辨。如果需要采用類似物,首先可試用dOTP,如果壓縮條帶用d ITP或7-脫氮-dGTP都無(wú)法分辨, 則轉(zhuǎn)而測(cè)定另一條鏈的DNA序列幾乎總能如愿以償。如上所述,兩種形式的測(cè)序酶和Taq DNA聚合酶對(duì)核苷酸類似物的耐受性優(yōu)于大腸桿菌DNA聚合酶IKlenow片段。此外,制造廠商聲稱在測(cè)定含穩(wěn)固二結(jié)構(gòu)的模板序列時(shí),測(cè)序酶2.0版要優(yōu)于原來(lái)的測(cè)序酶。測(cè)序酶2.0版持續(xù)合成能力強(qiáng)于測(cè)序酶,其作用總是一氣呵成,很少半途而廢,因而消除了“鬼”帶。 而且,測(cè)序酶2.0版對(duì)諸如dITP類核苷酸類惟物的耐受性看來(lái)也優(yōu)于原來(lái)的測(cè)序酶。
二、Maxam-Gilbert DNA化學(xué)降解法
與包括合成反應(yīng)的鏈終止技術(shù)不同,Maxam-Gilbert法要對(duì)原DNA進(jìn)行化學(xué)降解。這一方法是在體外研究lac阻抑制與lac操縱基因相互作用時(shí)醞釀發(fā)展起來(lái)的。時(shí)至今日,可以探測(cè)DNA構(gòu)象的蛋白質(zhì)-DNA相到作用,仍然是Maxam- Gilbert法獨(dú)具的鮮明特點(diǎn)。在這一方法(Maxam和Gilbert,1980)中,一個(gè)末端標(biāo)記的DNA片段在5組互相獨(dú)立的的化學(xué)反應(yīng)分別得到部分降解,其中每一組反應(yīng)特異地針對(duì)某于種或某一類堿基。因此生成5組放射性標(biāo)記的分子,從共同起點(diǎn)(放射性標(biāo)記末端)延續(xù)到發(fā)生化學(xué)降解的位點(diǎn)。每組混合物中均含有長(zhǎng)短不一的DNA分子,其長(zhǎng)度取決于該組反應(yīng)所針對(duì)的堿基在原DNA全片段上的位置。此后,各組均通過(guò)聚丙烯酰胺凝膠電泳進(jìn)行分離,再通過(guò)放射自顯影來(lái)檢測(cè)末端標(biāo)記的分子。相對(duì)而言,Maxam-Gilbert法自初次提出以來(lái),基本沒(méi)有變化。雖然設(shè)計(jì)了另一些化學(xué)降解反應(yīng)(見(jiàn)綜述:Ambrose和Pless,1987),但這些反應(yīng)一般只作為Maxam和Gilbert(1977,1980)最早提出的反應(yīng)的補(bǔ)充。這一方法的成敗,完全取決于上述這些佞兩步進(jìn)行的降解反應(yīng)的特異性。第一步先對(duì)特定堿基(或特定類型的堿基)進(jìn)行化學(xué)修飾,而第二步修飾堿基從糖環(huán)上脫落,修飾堿基5'和3'的磷酸二酯鏈斷裂。在每種情況下,這些反應(yīng)都要在精心控制的條件下進(jìn)行,以確保每一個(gè)DNA分子平均只有一個(gè)靶堿基被修飾。隨后用哌啶裂解修飾堿基的5'和3'位置,得到一組長(zhǎng)度從一到數(shù)百個(gè)核苷酸不等的末端標(biāo)記分子。比較G、A+G、C+T、C和A>C各個(gè)泳道, 右從測(cè)序凝膠的放射自顯影片上讀出DNA序列。由于種種原因(如采用32P進(jìn)行放射性標(biāo)記、末端標(biāo)記DNA的比活度、裂解位點(diǎn)的統(tǒng)計(jì)學(xué)分布、凝膠技術(shù)方面的局限性等等),Maxam-Gilber法所能測(cè)定的長(zhǎng)充要比Sanger法短一些,它對(duì)放射性標(biāo)記末端250個(gè)核苷酸以內(nèi)的DNA序列效果最佳。在70年代Maxam-Gilbert法和Sanger法剛剛問(wèn)世時(shí),利用化學(xué)降解進(jìn)行測(cè)序不但重現(xiàn)性更高,而且也容易為普通研究人員所掌握。Sanger 法南非要單鏈模板和特異寡核苷酸的,并需獲得大腸桿菌DNA聚合酶IKlenow 片段的高質(zhì)量酶制劑,而Maxam-Gilbert法只需要人所共的簡(jiǎn)單化學(xué)試劑。但隨著M13 噬菌體和噬菌粒載體的發(fā)展,也由于現(xiàn)成的合成引物唾手可得及測(cè)序反應(yīng)日臻完善,雙脫氧鏈終止法如今遠(yuǎn)比Maxam-Gilbert法應(yīng)用得廣泛。然而,化學(xué)降解較之鏈終止法具有一個(gè)明顯的優(yōu)點(diǎn):所測(cè)序列來(lái)自原DNA分子而不是酶促合成所產(chǎn)生的拷貝。因此,利用Maxam-Gilbert法可對(duì)合成的寡核苷酸進(jìn)行測(cè)序,可以分析諸如甲基化等DNA修飾的情況,不可以通過(guò)化學(xué)保護(hù)及修飾干擾實(shí)驗(yàn)來(lái)研究DNA二級(jí)結(jié)構(gòu)及蛋白質(zhì)與DNA的相互作用。然而,由于Sanger法既簡(jiǎn)便又快速,因此是現(xiàn)今的最佳選擇方案。事實(shí)上,目前大多數(shù)測(cè)序策略都是為Sanger法而設(shè)計(jì)的。 類核苷酸類惟物的耐受性看來(lái)也優(yōu)于原來(lái)的測(cè)序酶。
三、測(cè)序策略
確證性測(cè)序
從頭測(cè)序
開(kāi)始測(cè)序之前,必須根據(jù)待測(cè)序列區(qū)的長(zhǎng)度,所要求的測(cè)序精確度以現(xiàn)有有設(shè)施來(lái)制定測(cè)序總策略。只有一小部分的研究劃需需分從頭測(cè)定大段從測(cè)定過(guò)和序列,而列多的情況是通過(guò)測(cè)序?qū)ν蛔儯ㄈ琰c(diǎn)突變和缺失)進(jìn)行定位和鑒定,并證實(shí)構(gòu)建的重組DNA的方向與結(jié)構(gòu)。用于上述兩種目的的方略大不相同。
(一)確證性測(cè)序
確證性測(cè)序(例如對(duì)利用寡核苷酸倡導(dǎo)的誘變而產(chǎn)生的突變體進(jìn)行測(cè)序)往往只需要僅僅一套反應(yīng),以取得雙鏈DNA其中一條鏈上局部區(qū)域的核苷酸序列,通常只須對(duì)亞克隆于M13噬菌體或噬菌粒載體上的一段合適的限制酶切片段進(jìn)行測(cè)序,即可如原以償。在許多情況下,等測(cè)區(qū)落于通用引物的測(cè)序范圍之內(nèi);若不然,最好的方法就是合成一段長(zhǎng)度為17-19核苷酸的寡核苷酸引物,與距離待測(cè)區(qū)約50-100核苷酸的序列互補(bǔ)。只要可能,應(yīng)同時(shí)測(cè)定野生型基因上同源區(qū)的序列和突變的相應(yīng)序列。直接在同一張放射自顯影片上對(duì)照有關(guān)序列,極有助于確證變異區(qū)序列并將使突變體與野生型基因之間任何出乎意料之外的其他差異一目了然。
(二)從頭測(cè)序
從頭測(cè)序的目的是要提供一段DNA的準(zhǔn)確核苷酸序列,這一區(qū)段可長(zhǎng)達(dá)數(shù)千堿基,而其序列從來(lái)未經(jīng)測(cè)定。由于單套測(cè)序反應(yīng)所能準(zhǔn)確測(cè)定的靶DNA序列最長(zhǎng)可達(dá)400堿基左右,因引進(jìn)行從頭側(cè)序必須經(jīng)過(guò)精心策劃。長(zhǎng)約400堿基的枝DNA可以按互為相反的方向分別克隆于2種M13噬菌體載體(如M13mp18 和13mp 119)上。然后每條鏈的全序列可以通過(guò)利用通用測(cè)序引物進(jìn)行的單套反應(yīng)得以測(cè)定。如果要對(duì)更長(zhǎng)的靶DNA(如長(zhǎng)達(dá)數(shù)千堿基)進(jìn)行測(cè)序,則可在兩種通用策略中一而行:
(1)隨機(jī)法(或鳥(niǎo)槍測(cè)序法) 在隨機(jī)法中,序列資料是從含有靶DNA隨機(jī)片段的亞克隆中收集而來(lái)的。既不須努力確定這些亞克隆在靶DNA中的位置,也不必設(shè)法查明究竟測(cè)出的是哪一條鏈的序列,只要把積累資料貯存起來(lái),最后可用計(jì)算機(jī)排列妥當(dāng)(Staden,1986)。這一方法是由劍橋的醫(yī)學(xué)研究委員會(huì)(M.R.C.)實(shí)驗(yàn)室率推行的,曾經(jīng)成功地用于測(cè)定人線粒體DNA(Anderson 等,1981)、人腺病毒DNA(Gingeras等,1982;Roberts等,1986)、λ噬菌體DNA(Sanger等,1982),以及Epstenin-Barr病毒DNA(Baer等, 1984)的序列。
(2)定向法 在定向法中,靶DNA的測(cè)序按計(jì)劃有秩序地進(jìn)行。例如,靶DNA的全序列可以通過(guò)測(cè)定一系列嵌套的缺失突變體的序列而獲得,這些突變體具有相同的起點(diǎn)(通常在靶DNA的一端)并分別穿入靶序列區(qū)縱深不同距離處,因此它們可以使靶DNA中更遙不可及的區(qū)段漸進(jìn)地落入可利用通用引物進(jìn)行測(cè)序的范圍之中。另一種方法是,利用一套反應(yīng)中取得的核苷酸序列設(shè)計(jì)新的寡核苷酸充當(dāng)后續(xù)一套反應(yīng)的引物,從而循序漸進(jìn)地獲得從示測(cè)定過(guò)的靶DNA片段的序列。因此在這一方法中。DNA序列的積累是通過(guò)沿DNA鏈漸進(jìn)移動(dòng)引物結(jié)合位點(diǎn)而實(shí)現(xiàn)的。盡管對(duì)隨機(jī)法與定向法的取舍通常由實(shí)驗(yàn)室的物力與專長(zhǎng)所決定,但仍有一少其他因素也會(huì)影響最終的抉擇,這些將在稍后加以討論。
選擇隨機(jī)定向測(cè)定策略的影響因素
(1)計(jì)算設(shè)備 任何大規(guī)模的測(cè)序計(jì)劃將在很大程度上依賴計(jì)算機(jī)程序?qū)υ夹蛄匈Y料進(jìn)行分類、整理和排列(Staden,1986)。在權(quán)衡隨機(jī)法的利與弊之時(shí),必須將與適當(dāng)?shù)挠?jì)算機(jī)設(shè)備進(jìn)行聯(lián)機(jī)的問(wèn)題放到壓倒一切的位置上來(lái)考慮。如果這些設(shè)備尚無(wú)從適當(dāng)?shù)挠?jì)算機(jī)設(shè)備進(jìn)行聯(lián)機(jī)的問(wèn)題放到壓倒一切的位置上來(lái)考慮。如果這些設(shè)備尚無(wú)從談起,就必須將采用隨機(jī)策略的想法束之高閣,轉(zhuǎn)而從前已述及的兩種定向方法中擇一而行。
(2)靶DNA的性質(zhì):如果靶DNA很可能會(huì)有散在的重復(fù)序列,那么就應(yīng)當(dāng)組建嵌套的缺失體用于測(cè)序。計(jì)算機(jī)在區(qū)分重復(fù)序列方面可能束手無(wú)策,而寡核苷酸引物則會(huì)同多個(gè)位點(diǎn)發(fā)生退火。
(3)完成測(cè)序計(jì)劃所需時(shí)間:完成一個(gè)測(cè)序計(jì)旬所需工作蜈可通過(guò)以下指示進(jìn)行估計(jì):
1)從單套反應(yīng)中平均可是300-400核苷酸的序列。
2)一個(gè)人一天可以輕松自如地操作24-32套反應(yīng)。
3)因此一個(gè)測(cè)序工作周,可以測(cè)出15kb核苷酸序列,這一周包括:
a.用一天時(shí)間制備單鏈DNA模板。
b.用一天時(shí)間測(cè)定DNA序列。
c.用一天讀出原始DNA序列并加以排列。
d.再用兩天生物旱生測(cè)序、重新進(jìn)行電泳,以便澄清模棱兩可這處并取得各個(gè)克隆之間的重疊區(qū)序列。
采用隨機(jī)法,所要測(cè)定的序列通常會(huì)比靶DNA所具有的實(shí)際長(zhǎng)度4-6倍。在大多數(shù)情況下,直至雙鏈90%左右的序列測(cè)出以后,才能得到單一的一段鄰接不斷的序列。由于進(jìn)行測(cè)序的亞克隆是隨機(jī)挑選出來(lái)的,因此靶DNA某些區(qū)段的序列在全段序列未能測(cè)出前會(huì)被重復(fù)測(cè)定,至于需要多長(zhǎng)時(shí)間才能找出最后幾個(gè)亞克隆并進(jìn)行測(cè)序,從而使序列提以測(cè)全,則無(wú)法未卜先知。往往會(huì)發(fā)現(xiàn),以上亞克隆在文庫(kù)中得不到充分反映,因此南非要處用與側(cè)翼序列相應(yīng)的寡核苷酸探針進(jìn)行篩選,以分離這些亞克隆。利用限制酶將大分子靶DNA進(jìn)一步分為大小適中(4-5kb)而易于處理的片段,可以使上述推理上難題得以緩和,每一個(gè)這樣的片段都可以用隨機(jī)法單獨(dú)進(jìn)行測(cè)序。
定向缺失法有時(shí)需要投入大量的時(shí)間生成并鑒定一整套嵌套的缺失體。然而一旦這上步水到渠成,則可以從靶DNA上早以妥善安排的多個(gè)區(qū)段上互為相反的兩端向內(nèi)部延伸,才能測(cè)定DNA雙邏的全序列。另一種辦法是用單套缺失突變體來(lái)取得靶DNA單鏈的序,然后利用其信息合成一套寡核苷酸引物,以便用于確證DNA互補(bǔ)鏈的序列(見(jiàn)后)。
(4)使用寡核苷酸合成儀的方便程度:如果能夠無(wú)拘無(wú)束地使用寡核苷酸合成儀,則可快速、廉價(jià)地合成由用戶設(shè)計(jì)的引物。假定要花1-2天時(shí)間來(lái)合成一個(gè)寡核苷酸,那么在最快速度下每周可以由靶DNA的一個(gè)特定起點(diǎn)開(kāi)始從頭測(cè)定600-800個(gè)核苷酸的序列。如果同時(shí)使用幾個(gè)起點(diǎn)開(kāi)始從頭測(cè)序; 或者也可以將M13mp18和M13mp19噬菌體載體,利用通用引物同時(shí)從兩端開(kāi)始測(cè)序;或者也可以將序列內(nèi)部的限制酶切片段亞克隆循下列原則:設(shè)計(jì)DNA測(cè)序物時(shí),應(yīng)遵循下列原則:
1)應(yīng)寡核苷酸與靶DNA的正確主靶DNA中確鑿疑的序列相互補(bǔ)。尤其是利用循序漸進(jìn)的寡核苷酸法來(lái)測(cè)定從未測(cè)過(guò)的DNA序列時(shí),這一點(diǎn)更加重要。盡量讓新設(shè)計(jì)的寡核苷酸互補(bǔ)于已知序列的最遠(yuǎn)端,這是十分自然的人民代表傾向。然而在大多數(shù)情況下,該序列是從測(cè)序凝膠頂部間隔緊密的條帶中讀取的,而在此處發(fā)生閱讀錯(cuò)誤往往司空見(jiàn)慣。因此緊好保守一些,讓所設(shè)計(jì)的引物與位于樣品泳前沿之后一定距離內(nèi)的序列機(jī)互補(bǔ),在凝膠的這一區(qū)段上讀出的序列可信程度較高。
2)引物的堿基組分比便應(yīng)勻稱[40-55%(G+C)], 而且長(zhǎng)度至少應(yīng)有18個(gè)核苷酸。 如果(G+C)%
在上述閾值之外,應(yīng)將寡核苷酸長(zhǎng)度設(shè)計(jì)為(18+n/2)個(gè)核苷酸,其中對(duì)AT豐富區(qū),則n=50-(G+C)%對(duì)GC豐富區(qū),則n=(G+C)%-50。
3)檢查新設(shè)計(jì)二重對(duì)稱區(qū),因?yàn)榭勺噪s交形在發(fā)夾或莖環(huán)結(jié)構(gòu)的寡核苷酸是低物。效引
a.其中不含二重對(duì)稱區(qū),因?yàn)榭勺噪s交形成發(fā)夾或莖環(huán)結(jié)構(gòu)地寡核苷酸是低效引物。
b.它既不會(huì)同載體DNA也不會(huì)同序列已經(jīng)測(cè)出的靶DNA區(qū)段相互補(bǔ),如能保證這一點(diǎn),將大大減少寡核苷酸從模板DNA的不只一個(gè)位置上引導(dǎo)DNA合成的可能性。已商品化的大部分用于DNA分析的計(jì)算機(jī)程序都能夠從序列中檢索合成寡核苷酸的互補(bǔ)區(qū)。
(5)序列的準(zhǔn)確性:如果認(rèn)真地進(jìn)行DNA序列測(cè)定,錯(cuò)誤率將小于0.1 %。但要達(dá)到這樣高的準(zhǔn)確性,必須完整地測(cè)定靶DNA兩條鏈的序列并澄清棱兩可及相互矛盾之處。在這一點(diǎn)上隨機(jī)測(cè)序有其優(yōu)點(diǎn),因?yàn)樵谠摲椒ㄖ心托枰E步對(duì)豐余的原始序列資料進(jìn)行累積,從而使最終所排出的序列的準(zhǔn)確性大為改觀。然而靶DNA中可能存在一些區(qū)域,無(wú)論采用隨機(jī)法還是定向法都不能準(zhǔn)確測(cè)定其序列。解決這些凝難序列往往需要花費(fèi)意外長(zhǎng)的時(shí)間,有時(shí)還要使用堿基類似物(以消除條帶壓縮現(xiàn)象)或Maxam-Gilbert測(cè)序法。
(6)測(cè)序計(jì)劃的下一步打算:不同的測(cè)序策略將會(huì)得到不同類型的樣品材料,這些材料可用于以后的實(shí)驗(yàn)。例如,為NDA測(cè)序而構(gòu)建的多套缺失體可用于研究啟動(dòng)子區(qū)中的結(jié)構(gòu)域,而與靶片段不同區(qū)段互補(bǔ)的多套寡核苷酸,可用于測(cè)定靶DNA突變體的序列。為鳥(niǎo)槍法測(cè)序而構(gòu)建可以留作隨后進(jìn)行定點(diǎn)誘變或制備放射性標(biāo)記探針的材料。