第三节 常用的分子技术
一、DNA指纹图谱技术
顾名思义,这是一类通过比较不同品种的独有图谱特征的鉴定技术。物种之间的基因突变,如单一核苷酸多型性(single nucleotide polymorphism,SNP),或序列插入(insertion)等,都可能会引起限制性内切酶的识别点改变。经电泳分离并与荧光或放射性特异性探针杂交后,会获得大小不同的DNA片段信息,与另一样本的DNA图谱比较,可了解它们的相似性。
1.限制性内切酶谱技术
20世纪70年代发展起来的限制性片段长度多态性(restriction fragment length polymorphism,RFLP)在生物学、医学、农学的许多领域都有成功的应用。技术的核心是限制性内切酶(restriction endonuclease)或限制酶(restriction enzyme)。限制性内切酶会在认知位点(recognition site)识别特定碱基序列,并在切割位点(cleavage site)上进行水解消化,将DNA分子切断。认知位点和切割位点可以距离数千碱基,亦可以在相近位置。限制性内切酶共有4种类型,其中第2类型最具应用价值,如Bam HI的认知位点和切割位点:
Bam HI会识别这个由6个碱基组成的序列,并在箭号的位置切断。如果DNA分子上出现了1个认知位点,Bam HI就会将其切断分成两段。如果有2个认知位点便会分成3段,如此类推。而各个片段的大小,是基于各切割位点之间的距离。限制性内切酶的认知位点和切割位点,决定了RFLP图谱上谱带的出现位置和数量。如果不同品种的生物基因组上的限制性内切酶识别位点出现差异,只要将物种的基因组DNA进行酶切消化,然后比较各自酶切图谱,便可作出物种鉴别。
图2-1 限制性内切酶Bam HI的认知位点(6个碱基序列)和切割位点(箭号所示)
2.随机引物聚合酶链反应(RP-PCR)
随机引物聚合酶链反应(random-primed PCR,RP-PCR)属于指纹图谱类技术。常规PCR中所采用的,是一对特异性高的合成寡核苷酸作引物,而且退火温度尽量提高,多会得到特异性片段。随机引物聚合酶链式反应的引物是任意选择的,而且只会使用单一条引物,退火温度比常规PCR低,反应环境较缓和,通常会得到多条不同分子量的谱带,并以电泳分离,比较样本间图谱差异而作出鉴定。
随机引物聚合酶链反应可细分为2种:①任意引物聚合链式反应(arbitrarily primed-PCR,AP-PCR)(Welsh和McClelland,1990);②随机扩增的多态性(rapid amplified polymorphic DNA,RAPD)(Williams等,1990)。前者的引物长度介于20~ 30个核苷酸,而后者所用的引物则只有10个核苷酸。
图2-2 RP-PCR的原理和实验流程
由图2-2可知随机引物聚合酶链反应特点为:①PCR扩增条件不严格,引物与基因组DNA的多个位置发生错配,这些错配位置之间的区域便被扩增;②PCR产物以电泳分离及显影,得出各品种的图谱,作为鉴定依据。
3.直接扩增长度多态性(DALP)
直接扩增长度多态性(direct amplification of length polymorphism,DALP)原理与RP-PCR相似,但反应条件比RP-PCR的条件严格。而DALP比RP-PCR优胜的地方,是能够直接对特异性谱带进行测序。
在RP-PCR中,只会使用单一条引物进行PCR,所以每个谱带的两端都由相同引物所构成,换言之,两端序列是互补的。如果将谱带作为模板直接进行测序,谱带两端都可跟测序引物结合,所以得到的序列有两套讯号,导致无法将序列解读。因此,RP-PCR的谱带必须先经过克隆,然后使用载体本身的通用引物,方可检测序列。
为了简化程序,随即发明了DALP技术(Desmarais等,1998)。DALP的特点在于引物的设计。正向引物称为选择性引物,5’末端为M13通用引物序列,3’末端附加2~ 5个碱基。而反向引物是M13通用反向引物。反应后,所扩增的谱带有3种结果:①两端都是由选择性引物所构成;②两端都是由反向引物所构成;③一端由选择性引物构成,另一端则由反向引物构成。结果①和②都不能进行直接测序,只有结果③才容许。所以,当筛选合适的正反引物组合时,每个组合需要进行2个独立PCR反应。第一个是加入已被放射标记的选择性引物(正向引物),和一个没标记的反向引物。第二个刚好相反,反向引物是已放射标记的,而选择性引物则是没标记的。进行PCR后,将该2个独立PCR的产物进行电泳分离及放射显影,对比2个独立反应的泳道。如果谱带只出现在其中一条泳道,表示该谱带两端都由相同的引物构成。而当谱带均出现在2个泳道之上,代表两端由正和反向引物构成,可直接测序。
例如要区分品种A和品种B,当筛选一个引物组合时,便要对这两个品种各自进行2个独立反应,所以总计是4个反应。经电泳及显影后,首先找出各品种的特异性谱带,即该谱带只会在其中之一个品种出现。其次,该谱带必须要在2个独立DALP反应同时出现,方能直接测序。
图2-3 DALP的原理和实验流程
由图2-3可知DALP的原理:①在筛选引物时,需要进行两个独立反应。反应1的组合是加入已被放射标记的选择性引物和未被标记的反向引物。反应2刚好相反,反向引物是已被放射标记的,而选择性引物则未被标记的。PCR后,扩增物分别加到泳道1及泳道2进行分离及显影。举例在显影后,谱带A只在泳道1出现,而谱带B则两条泳道出现。原因是②在PCR过程中,谱带A只有正向引物和DNA模板结合,所以两端均是由正向引物构成。在独立反应1(左图),因为正向引物被放射标记,所以谱带在泳道1上会发出讯号。在独立反应2(右图),只有反向引物才被放射标记,相同的DNA区域虽然被PCR扩增(由没有放射标记的选择性引物构成),但因为反向引物并没有构成谱带A,所以泳道2上谱带A的位置没有讯号。因此,当谱带只在其中一条泳道发出讯号时,代表该谱带两端均由相同引物所构成,因此无法进行直接测序。③谱带B的两端分别由正和反向引物构成,所以谱带B在两个泳道都会发出讯号。因此,谱带B可被直接测序。
4.扩增片段长度多态性(AFLP)
扩增片段长度多态性(amplified fragment length polymorphism,AFLP)是一种结合RFLP及PCR的指纹图谱技术(Vos等,1995)。优点是不需事先合成引物或设计探针,便能对基因进行分析。跟其他指纹技术不同处在于引物退火温度严格,因此具有高重复性和高分辨率。
AFLP技术主要由3大步骤组成,每一步骤均可将基因指纹图谱的复杂程度降低,有利后面的电泳分离和显像观察,如图2-4。第一步是将样本的总DNA以两种限制性内切酶消化,通常是一个少位点酶(如Eco RⅠ)配合一个多位点酶(如MseⅠ)。消化后的片段小于1000个碱基,所得的片段将会出现3种情况:①片段两端都是少位点酶黏性切口;②片段两端都是多位点酶的黏性切口;③片段一端是少位点酶,而另一端是多位点酶的切口。之后加入连接酶(ligase)和接头(adaptor)。接头其实是经处理的核酸,共分成两部分:一端是预扩增反应引物的互补区,另一端是黏性切口,该黏性接口可以和经内切酶消化的DNA片段连接。在连接反应中,加入两种接头,分别是少位点和多位点酶粘性接头。完成后,部分基因组片段一端接上少位点酶接头,另一端接上多位点酶接头,其余的片段两端都会连接上同一种连接头。
图2-4 AFLP的原理和实验流程
第二步是进行预扩增反应(pre-amplification),所用的一对引物包括3部分:①接头上的互补区;②酶切点;③3’-末端上的一个碱基。预扩增所使用的正向和反向引物,分别跟少位点和多位点酶粘性接头互补。在PCR过程中,只有两端接上不同接头的DNA片段才会被扩增,其余DNA片段因为只会和正向或反向引物结合,所以那些DNA片段将无法扩增。
第三步是进行选择性扩增反应(selective amplification),所用引物在3’-末端会再增加2~ 3个碱基,进一步将图谱复杂度降低,得出具重复性的扩增物。完成后,可以使用聚丙烯酰胺变性凝胶电泳进行检测,通常会将其中一个选择性扩增引物作放射性标记。由于DNA测序仪越来越普及,最近的研究大多对引物加入荧光标记,利用DNA测序仪直接读出扩增片段的长度。计算所有谱带的大小后,便得出AFLP图谱。
5.聚合酶链式反应-限制性片段长度多态性(PCR-RFLP)
PCR-RFLP是从RFLP技术演变的指纹图谱。传统RFLP多以基因组,线粒体或叶绿体DNA为测试对象。将DNA提纯后加入限制性内切酶进行消化,基因组DNA会被切成多条不同分子量的片段,通过电泳分离,产生专属RFLP图谱。而物种之间的基因突变,可能会引起酶解位的改变,致使RFLP图谱出现差异,通过比较便能将不同物种区分。然而,提取基因组DNA费时,而且所提取的DNA必须完整,否则会影响图谱的准确性及重复性。可惜大部分中药材均经加工处理,令DNA受到不同程度的破坏,所以RFLP未能广泛用于中药材鉴定。PCR-RFLP跟RFLP原理相近,不同之处是前者通过PCR,去扩增某一特定DNA区域来作为酶切的DNA模板。由于经PCR后可以获得大量DNA,而且只分析一小段DNA片段,所以较不受样本DNA质量的影响。
图2-5 PCR-RFLP的原理和实验流程
此技术由3个步骤组成,如图2-5,第一步是使用PCR将特定DNA部位扩增,然后纯化。第二步是将纯化后的PCR产物进行酶切,得出酶切后的DNA片段。第三步是使用电泳将大小不同的DNA片段分离,然后染色观察,对比物种间图谱的差异。2015年版《中国药典》收载了以PCR-RFLP鉴定川贝母Fritillaria cirrhosa的技术数据和实验流程,详细列出PCR的条件和所用的限制性内切酶。
6.扩增变异分辨系统(ARMS)
扩增变异分辨系统(amplification refractory mutation system,ARMS)是一种指纹图谱技术,主要用作区分不同种类的等位基因(Newton等,1989)。首先比较各品种的DNA序列,找出它们之间不同的区域,然后设计特异性引物。所设计的引物其3’-末端序列必须是等位基因间相异区域。在PCR过程中,只有当引物的3’-末端序列跟模板序列完全相配(match)时,才可在严格条件下成功扩增。相反,如果引物的3’-末端序列跟模板不相配(mismatch)时,PCR则无法进行,所以没有谱带。反应后,将各品种的PCR产物用电泳分离显影,对比图谱作鉴定。
2015年版《中国药典》收载了以基于ARMS技术鉴定乌梢蛇Zaocys dhumnades和蕲蛇Agkistrodon acutus的PCR鉴别方法,详细列出特异性引物的序列和PCR反应的条件等技术数据和实验流程如图2-6。①设计特异性引物前,需要确定不同等位基因间的差异位置,引物的3’端最后一个碱基,只会跟其中一种等位基因互补配对;②图中显示存在两种等位基因,在严格条件下进行PCR时,只有当特异性引物的3’末端碱基跟模板序列互补时,才可成功扩增;③反应后,将各品种的PCR产物用电泳分离显影,对比图谱作鉴定。
图2-6 ARMS的原理和实验流程
7.序列特异扩增区(SCAR)
序列特异扩增区(sequence characterized amplified region,SCAR)是一种快速指纹图谱鉴定方法。此技术是依赖其他技术如RAPD、AFLP或序列分析所得的结果,从而设计一或多对特异性引物(Paran和Michelmon,1993)。目的是将检测步骤简化,并将扩增谱带数目减少,令对比结果更一目了然。
RAPD及AFLP等技术的优点是能获得大量生物基因讯息,但当要将不同物种的图谱作比对时,往往要借助软件的帮助才能完成,当它们用作快速鉴定时,便显得太复杂。SCAR的原理是借着一或数对特异性的引物,并以严格的条件进行扩增,通过电泳及染色观察。对应的物种会出现一些特异性谱带,而其他物种的谱带则有不同的分子量,甚至是没有扩增物。因此,检验程序快捷,而且结果清晰易明,不需进行数据分析。
设计SCAR特异性引物时,可以从RAPD或AFLP等图谱中找出物种的特异性谱带,对谱带进行DNA测序,或直接比较品种间的DNA条形码,在特异性的位置上设计引物。
SCAR的操作步骤如图2-7:①SCAR特异性引物,可以由其他DNA技术的结果转化而成,例如将指纹图谱上的特异性谱带测序,或将DNA序列排序,找出物种的特异性序列;②根据特异性区域设计SCAR引物;③利用SCAR引物进行PCR,扩增条件严格,最后得出专一的谱带。
图2-7 SCAR的原理和实验流程
8.适配器连接介导的等位基因特异性扩增法(ALM-ASA)
适配器连接介导的等位基因特异性扩增法(ALM-ASA),是针对各类SNP技术限制,而作出改良的一种鉴定法(Wang等,2006),优点是可同一时间检测大量SNP点。
该技术分成5个步骤,如图2-8。品种A和品种B内有2个SNP位,图中的圆形代表酶切识别位,首先第一步进行预扩增PCR,将目标DNA的总量倍增,以便有足够DNA模板进行反应。第二步是加入限制性内切酶(例如MboⅠ),将预扩增片段切成多段两端含有黏性末端的短片段。第三步加入适配器及连接酶,连接酶会将短片段的两端都连上适配器。适配器的其中一端含MboⅠ切口黏性末端,另一端是一长一短的碱基链(称长臂和短臂)。长臂比短臂多出的碱基,其序列跟ALM-ASA通用引物是相同的,所以ALM-ASA通用引物在之后的PCR过程中,不能直接跟长臂结合,只有当长臂的互补区域(即短臂比长臂所缺少的碱基)被伸延后,ALM-ASA通用引物才可与之结合,然后被用作扩增。第四步进行PCR选择性扩增,加入ALM-ASA通用引物和各种特异性引物。特异性引物的3′-末端位于SNP位点,在3’-末端倒数第3个位为一不匹配碱基,用作加强引物的特异性。当进行PCR时,特异性引物只会跟相关的SNP位点融合,然后伸延至配适器的长臂序列。当长臂的互补区域出现后,ALM-ASA通用引物便会跟它互补,然后进行反方向的伸延,所以SNP点与配适器这一段区域便会不断扩增。相反,如果特异性引物未能跟SNP融合,即无法进行PCR。最后一步是以电泳将PCR产物分离及显影,对比由不同品种所产生的图谱。
图2-8 ALM-ASA的原理和实验流程
二、PCR鉴定技术
1.DNA测序和条形码技术
DNA测序(DNA sequencing)泛指可以将DNA序列解读的技术。20世纪70年代前,检测DNA序列非常费劲,每次只可解读5~ 15个碱基。1977年Frederick Sanger、Allan Maxam和Walter Gilbert各自发明了新的DNA测序技术后,检测序列变得更快更容易。
为方便研究,一般在序列差异较大区域的两端,寻找存在于生物之间的保守区域,即不同物种都拥有相同序列的地方。依照这个保守区域的序列,设计通用引物(universal primer),利用PCR技术便可将不同品种生物扩增。扩增区域DNA测序被设限于1000个碱基之下,目的一是减低扩增的难度,二是减少模板DNA质量的影响。通过比对这些特异性DNA区域,可以对未知样本进行物种鉴定。近年来DNA测序经过不断改良创新,又开发了自动测序仪,如果配合碱基荧光标记,测序效率会大大提高。为方便检索、比较及发表各项序列数据,国际上建立了多个基因序列数据库,收录大量数据。
2000年以前,DNA测序技术已相当成熟,但对于应该使用哪一个DNA区域作为鉴定标准还未有共识。虽然数据库中已载有多个生物品种的序列,但因为解读的DNA区域不一,所以无法相互比较。
经DNA测序所解读的序列,除可用作鉴定之外,亦可作为其他DNA技术如SCAR、ARMS、PCR-RFLP等的设计蓝本。将不同品种的序列进行排序,搜寻存在于种间的各个基因突变点、插入点、缺失点,帮助设计特异性引物。亦可利用计算机程序,找出各品种的PCR产物上限制性内切酶位点的相异处而选择合适的酶,简化逐一筛选的工序。
在本书第一章已经介绍的DNA条形码技术不但可应用于生物进化的分子系统学(molecular phylogenetics)研究,也可用于物种鉴定(Dawnay等,2007;Yoo等,2006)。
2.核酸杂交技术
核酸分子在特定情况下(例如加热),其双链之间的氢键和疏水键会因断裂而变成单链,而在条件恢复后(例如降温)又可依碱基配对变回双链结构。如果将两条存有序列差异的核酸分子变性,在分解成单链后混和,就算条件恢复,两者亦会因未能完全互补而无法结合成双链,这现象称为核酸杂交。利用这一原理,便可测试两条序列是否吻合。过去由于技术所限,核酸杂交每次只可检测少量样本。
核酸杂交实验由4个步骤组成,如图2-9。第一步是探针的制备,其序列依受测品核酸碱基配对。用PCR或限制性内切酶将核酸制成特定长度,然后变性,按预定位置转印到芯片之上。第二步是待测品的准备,可用PCR或限制性内切酶将核酸制成特定长度,并加上可被探测的化学分子(如荧光物)。第三步是杂交,当探针和受测核酸相遇,它们会依彼此间序列互补程度进行复性,完全互补的会变回双链,而探针和受测品有差异时,两者未能结合,受测样品便会被缓冲液洗走。最后一步是检测,根据芯片上发出讯号位置,便能得知哪些受测样本和探针序列是吻合的。
3.DNA芯片技术
DNA芯片(DNA chip)或DNA微阵列(DNA microarray)是一种高通量的检测平台,基本原理也是核酸杂交。芯片技术主要用于基因表达或靶序列鉴定的快速筛选。核苷酸阵列与一般的圆点印记杂交技术相似。它根据DNA双链碱基互补原理,将待测样本DNA或RNA分子与固定在阵列上的已知高密度的DNA探针进行杂交,通过检测探针分子的杂交信号强度,精确识别样本DNA分子的数量和序列信息、甚至样本DNA分子的突变等。它同时快速、灵敏、选择性地检测数以千计的DNA序列。技术突破之处是DNA芯片的制作上利用激光立体化学刻蚀等微加工技术,配合化学合成技术,在芯片上有序地点上数以万计的DNA分子,而这些DNA分子便是传统核酸杂交的单链核酸。因此,在小小一块DNA芯片上,便能同时进行海量的核酸杂交实验,观察基因数据。由于中药材的生物来源极广,此技术正好为高通量鉴定开辟一条新出路。
图2-9 核酸杂交实验步骤示意图
常规制备一个中密度阵列的方法:第一步,以特异的cDNA或寡核苷酸固化于孔板或膜表面;第二步,将待测的DNA或PCR产物用适当的探针进行标记;第三步,将双链DNA或PCR产物变性成单链;第四步,单链分子与锚定的寡核苷酸进行杂交,结果通过比色法或荧光法检测。如图2-10。
由于常用中药少于1000种,因而开发高密度的中药鉴别基因芯片的必要性不大。不同的物种具有不同的基因组结构,因此,每一物种都会在芯片中产生特异的可供检测的杂交谱带。若要提高基因芯片检测的精确度,则不仅需要开发检测药材的DNA探针,而且还要开发检测其相关品种、代用品及伪品的DNA探针。理论上基因芯片可同时检测复方中所含各种组分的品种基原。
4.等温扩增技术
除了上述由PCR技术作为基础的DNA测序、条形码、芯片鉴定技术外,还有一种新颖的环介导等温扩增技术(loop-mediated isothermal amplification,LAMP)用于物种快速鉴定(Notomi等,2000)。LAMP有别于常规PCR,其聚合反应的酶是具有链置换(Strand displacement)能力的Bst DNA聚合酶。其引物也经特别设计,每一个反应会用到6条引物,包括4条特异性引物和2条环引物(loop)。扩增反应可在恒温环境下进行,因此不需要复杂的热循环仪。根据LMAP原理设计了一种实时检视法,当目标DNA与引物结合并进行扩增后,释放出的焦磷酸离子(pyrophosphate ion)与试剂中的镁离子结合,令试剂变成混浊,凭肉眼便能分辨(Moil等,2001)。
图2-10 核酸杂交技术的原理和实验流程
a.探针的序列和受测品碱基配对,按预定位置转印到芯片之上;b.准备待测品时,使用PCR或限制性内切酶将核酸制成特定长度,并加上可被探测的化学分子;c.当探针和受测核酸相遇,它们会依彼此间序列互补程度而结合,两者存有差异的,受测品便会被缓冲液洗走;d.根据芯片上发出讯号位置,便能得知哪些受测样本和探针序列是吻合的。(作者说明:流程是解释上述4步具体过程,没有重复)