上QQ阅读APP看书,第一时间看更新
第四章 内分泌疾病的基因诊断和检测技术
第一节 医学遗传学发展简史
因遗传因素而罹患的疾病称为遗传性疾病或简称为遗传病。遗传因素可以是生殖细胞或受精卵内遗传物质的结构和功能的改变,也可以是体细胞内遗传物质结构和功能的改变。大多数遗传病为先天性疾病。医学遗传学是临床医学与遗传学相互渗透的一门边缘科学,是人类遗传学的一个组成部分。医学遗传学揭示了人类纷繁的变异库,为人类遗传学研究提供了丰富的素材。20 世纪50 年代以来,由于生物化学、细胞遗传学、免疫学与分子遗传学实验技术的发展,使医学遗传学获得了迅猛的发展。比如生化实验技术和分析方法的发展,提高了对先天性代谢病的研究和临床诊断的水平;再比如运用层析法检出尿液中的异常代谢产物,运用电泳技术检出异常血红蛋白分子,淀粉凝胶电泳可检出包括酶在内的蛋白质的结构异常,这都使医学遗传学在理论研究和实际应用两方面都向前跨进了一大步。1956 年,J.H.Tjio(蒋有兴)和Levan 观察人胎肺组织培养细胞,首先正确地鉴定人体体细胞的染色体数目为46 条。在人体染色体数目得到正确鉴定之后,染色体分析技术即被迅速应用于临床 [1,2]。
20 世纪70 年代初,随着限制性内切酶的发现及脱氧核糖核酸(deoxyribo nucleic acid,DNA)分子杂交技术的建立,分子遗传学进入基因工程阶段,并为解决临床问题提供了新的手段。Y.W.Kan(简悦威)等(1976 年)、Wong 等(1978 年)及Dozy 等(1979 年)应用 DNA 实验技术,用胎儿羊水细胞DNA 作出α-珠蛋白再生障碍性贫血的出生前诊断。纵观20 世纪50 年代以来医学遗传学的发展,人们研究与疾病发生有关的各种生物学变异,从表现型变异,蛋白质变异,进而到DNA 变异。历届国际人类遗传学大会清楚地反映了研究水平的不断深入。20 世纪70 年代中期兴起分子遗传学,极大地促进了医学遗传学的发展,揭示癌基因(onco gene)和(或)肿瘤抑制基因(tumor suppressor gene)的突变是肿瘤发生的分子基础,从而确定肿瘤是一种体细胞遗传病。体细胞突变也可能是自身免疫性疾病和衰老过程的分子基础。随着分子遗传学的发展,20 世纪90 年代初,基因治疗进入了临床试验阶段。所谓基因治疗就是将某个正常基因导入患者体内细胞中使之表达,对患者缺乏的或异常的某种蛋白质提供其正常表达产物,从而起到治疗作用 [1,2]。
分子遗传学的发展导致了反求遗传学(reverse genetics)的新趋势。这就是在不知道某种遗传病蛋白质异常的情况下,直接寻找致病的DNA 变异,进而揭示这种DNA 变异所导致的蛋白质异常。这就使遗传学研究从表现型到基因型这条经典路线转变成为从基因型到表现型的反求路线。近年来,在反求遗传学思路指导下,遗传学家们对一些不明原因的遗传病进行了DNA 标记连锁分析,使DNA 标记逐渐逼近,最终找到致病基因。遗传学家们由此找到了Duchenne 肌营养不良的肌营养不良蛋白(dystrophin)基因和囊性纤维化的跨膜调节蛋白基因等 [1,2]。
遗传病的分子遗传学研究,正在使医学遗传学走向21 世纪的大发展。1986 年,诺贝尔奖获得者Dulbecco 提出,如果我们希望对肿瘤有更多的了解,这就必须集中于细胞的基因组,最有用的是从细胞的基因组测序开始。经过学术界几年的争论,1990 年美国国会批准 15 年(1991—2005)拨款30 亿美元的人类基因组计划(human genome project,HGP)。该计划通过以下三步,即连锁图(遗传图)、物理图和基因组测序,揭示人类基因组DNA 30 亿碱基对的全序列。HGP 是生物医学领域的阿波罗登月计划,它给21 世纪的生物医学科学带来一场遗传学革命。由于HGP 意义重大而影响深远,引起了各国政府的高度重视,投入大量资金推进HGP 的研究,使其进展一再超前。2000 年6 月26 日美国总统克林顿和英国首相布莱尔宣布人类基因组序列工作草图诞生。2001年2 月15 日由美国、英国、日本、法国、德国、中国六个国家组成的国际人类基因组测序联合体发表了根据人类基因组94%序列草图做出的初步分析。2004 年 10 月 21 日, Nature 杂志公布了人类基因组的完整序列,这是人类分子遗传学的登峰之作。尤其是2005 年以来,随着高通量二代测序技术的出现和日臻完善,人类进入了后基因组时代,这必将引导21 世纪的生物医学科学结出丰硕成果,进一步造福于人类 [1,2]。
(龚凤英)
第二节 染色体病诊断的检测技术
从遗传学的角度看,遗传性内分泌代谢病包括染色体病、基因病(单基因病和多基因病)、线粒体病和体细胞遗传病(肿瘤等)。染色体病的诊断技术包括核型分析(karyotype analysis)和分子细胞遗传学技术,而诊断单基因病、多基因病、线粒体基因病和体细胞遗传病的最直接方法是基因诊断(gene diagnosis)。随着分子生物学技术的进展,遗传性内分泌代谢病的基因诊断技术也明显提高。这不仅使诊断的准确率明显提高、费用明显下降,而且所花费的时间也大大缩短。
染色体病包括染色体数目异常和结构畸变。目前已发现的人类染色体病约10 000 多种,已确定的综合征约100 多种。确诊染色体病的主要方法是染色体检查,包括经典的显带核型分析技术,以及分子细胞遗传学的新技术如荧光原位杂交(fluorescence in situ hybridization,FISH)、微阵列芯片比较基因组杂交技术(array-based comparative genomic hybridization,aCGH);单核苷酸多态性芯片(single nucleotide polymorphism array,SNP array)等 [1,2]。
一、显带核型分析技术
在细胞分裂的中期,松散的染色质丝通过多级螺旋化,形成在光镜下可辨认的染色体。因此,特定处理处于旺盛有丝分裂的组织细胞,如外周血淋巴母细胞、骨髓、绒毛、胸水、腹水、肿瘤组织、皮肤、肝脏、肾脏等,可获得染色体标本,从而在光镜下进行核型分析(karyotype),包括G 显带、Q 显带、C 显带、N 显带和迟复制X 染色体检测技术。采用染色体显带核型分析技术,可以对内分泌相关染色体数量和结构异常的疾病,比如先天性睾丸发育不良综合征(klinefelter syndrome)和特纳综合征等疾病进行诊断。
二、分子细胞遗传学分析技术
传统的显带技术能够准确地诊断染色体数目异常,但往往不能检出低于5Mb 的染色体结构畸变。为此,发展出了应用克隆的DNA 探针来检测染色体结构畸变的分子细胞遗传学分析技术,该技术的应用在很大程度上提高了染色体病检测的分辨率和准确性。
(一)荧光原位杂交
把某条染色体或其某个区带的特异DNA 采用带有荧光染料的地高辛配基或者生物素等标记为探针,然后与染色体或间期细胞进行杂交,在荧光显微镜下观察杂交后的颜色信号,采用这种技术来检测染色体的方法,称为荧光原位杂交(FISH)。FISH 可鉴别难以确定的染色体重排(属于染色体结构异常)或者在1~3 天迅速诊断染色体数目的异常。因此,FISH 通常用于辅助染色体显带分析。FISH 技术具有敏感度高、信号强、背景低、快速、多色等优势,已成为临床细胞遗传学检测的常规手段,也是基因定位的有力工具 [3]。
(二)微阵列芯片杂交技术
用传统的染色体核型分析方法,如染色体区带染色分析、FISH 技术等,可探讨许多染色体结构变异,但实验操作繁琐、分辨率低,尤其是不能覆盖全基因组,所以很难给出染色体变异位点的精确定位。aCGH 和SNP array 技术的出现,解决了上述难题。
aCGH 和SNP array 的原理是将待测DNA 和正常对照DNA 分别用红色和绿色荧光染料标记,混合,然后与全基因组DNA 芯片或SNP 芯片进行杂交。杂交后的芯片经激光扫描,所得的数据再用计算机进行分析,根据“log 2 比值”检测出缺失(红色过多)或重复(绿色过多)。
aCGH 和SNP array 技术综合了染色体显带分析和FISH 的优势,既覆盖了全基因组,又具有极高的诊断率和准确性,就好比是一次高通量进行了成千上万次的FISH 检测。另外,aCGH 和SNP array 技术的另外一个优点是,其取材是基因组DNA,因而不需要细胞培养,可用于任何组织和细胞的检测,而且大大加快了出结果的时间 [3]。
第三节 基因突变检测的基本技术
遗传性内分泌基因病,包括单基因病和多基因病,其基因诊断则选择不同基因突变检测技术,直接检测和分析样本中的DNA 或RNA 水平上的致病性突变或者变异,常见的DNA 变异检测技术见表1-4-1。样本只要包含任何有核细胞即可,包括外周血(最常用)、活检组织标本、手术切除标本等等。
一、直接检测DNA 突变的技术
(一)聚合酶链反应技术
聚合酶链反应(polymerase chain reaction,PCR)是最基本、最为广泛应用的DNA 突变检测技术,PCR 可以选择性地将单个DNA 或核糖核酸(ribonucleic acid,RNA)分子在几小时内迅速扩增至几百万倍以上,直接检测和分析患者特定基因的序列。从发根、漱口液及少量血痕中得来的极少数细胞均可以直接用于PCR 分析,因而可以不必从组织中抽提大量的DNA 或RNA 样本。
PCR 的原理是用一对能分别与靶DNA 双链序列配对的人工合成的寡聚核苷酸引物,在耐热DNA 聚合酶(Taq polymerase)的作用下,扩增目的DNA 片段。重复热变性、引物退火及引物延伸的循环,DNA 片段的拷贝数会成指数成倍增长,经过约30 多个循环,可达10 6~10 7。
表1-4-1 DNA 变异检测技术一览 [3]
PCR 技术有快速、经济、灵敏度高以及对患者核酸检测的样本的要求低等很多优点。但由于PCR 的强大扩增能力与检测的敏感性,极微量的污染便可导致假阳性结果。因此,临床实验室要特别重视避免PCR 的产物被污染 [3,4]。
(二)实时定量聚合酶链反应技术
自从Mullis 于1985 年发明PCR 技术以来,已经衍生出几十种相关的PCR 方法,如多重PCR、原位PCR、实时-PCR(real time PCR,RT-PCR)和巢式PCR 等。定量PCR 的目的是以PCR 终产物的量推测样本中待测靶分子的绝对起始量和相对起始量,即检测样本中靶基因的拷贝数,该方法对于研究基因的扩增和表达,诊断和判断疾病的预后等都具有非常重要的意义。其中,实时定量 PCR(real time quantitative PCR,qPCR)的应用最为广泛。根据所用荧光技术的不同,qPCR 可分为两类:①根据寡核苷酸探针与PCR 产物结合后所释放出的荧光进行检测和定量,如TaqMan系统;②通过双链DNA 亲和性荧光素与PCR 产物结合后所释放出的荧光进行检测和定量,如SYBR Green 系统。
在PCR 反应的早期,每经过一轮变性、引物退火和延伸合成的周期,DNA 分子的数量就会增加一倍。如果对这种相关性进行绘图,在半对数坐标纸上可以得到一个直线图形。达到一定的产量阈值所需的PCR 循环数可以用来计算PCR 起始模板的数量,通常称为Ct 值。达到一定产量所需的循环数越少,起始PCR 的模板量就越多 [3,4]。
(三)限制性片段长度多态性技术
限制性核酸内切酶是能识别特定的DNA 双链序列,并能在识别序列或其邻近处进行DNA 双链切割的核酸内切酶,比如EcoRI、BamHI、HaeIII等,都是限制性核酸内切酶。限制性片段长度多态性(restriction fragment length polymorphism,RFLP)是由于DNA 序列的变异所引起的限制性内切酶切位点的改变,从而导致酶切片段大小的不同。这种DNA 序列的变异由人类基因组中存在的大量单个碱基置换的中立变异以及某些重复序列的重复数目在不同个体中的差异所导致的。这些变异在不同的个体中存在差异,并在人群中表现为遗传多态的现象 [3,4]。
(四)脱氧核糖核酸印迹技术
脱氧核糖核酸印迹技术,即DNA印迹(Southern blotting)技术是一种将基因组DNA 用限制酶酶切消化后,进行凝胶电泳,将DNA 片段按大小进行分离后,然后再用探针进行核酸杂交,以确定目标DNA 分子片段位置的一种技术。具体操作如下,首先提取样本基因组DNA,然后限制酶消化,产生约100 万个DNA 片段,采用琼脂糖凝胶电泳分离DNA 片段,小的DNA 片段泳动快,而大的DNA 片段泳动慢。采用强碱变性的方法,将双链DNA 变性而分成两条互补的单链,单链DNA 通过印迹作用(blotting)和毛细管作用从凝胶转移到硝酸纤维膜或尼龙膜上。最后,采用经变性后成单链状态的标记DNA 探针,与上述通过印迹含有单链DNA 分子的膜在液相中进行分子杂交。因为DNA 探针只与它的互补DNA 链进行复性或退火,所以杂交后的膜洗去那些未结合的探针,然后将膜(膜上已有被杂交上的标有放射性的探针)与X 线片压在一起进行曝光,这样X 线片上就出现已被杂交的DNA 片段的位置,这个位置完全对应于一开始做琼脂糖凝胶电泳时不同样本的DNA 片段的位置 [3,4]。
(五)核糖核酸印迹技术
核糖核酸印迹技术,即RNA 印迹(Northern blotting)技术,是用于确定RNA 样本中特定基因转录的mRNA 分子的大小及含量信息的一种技术。因为不同基因的转录物的长度不同,因此,一种细胞的总RNA 或纯化的mRNA 可以用琼脂糖凝胶电泳中因分子大小不同而分开,然后同DNA 印记技术一样,转移至硝酸纤维素膜或尼龙膜上,将膜与已标有放射性、变性的探针温育杂交,洗膜并与X 线片压片曝光,将会出现一个或多个目的转录物的条带 [3,4]。
(六)蛋白质印迹技术
蛋白质印迹(Western blotting)技术是用来对特定蛋白质进行定性和半定量的一种方法。本法可用于检测从遗传病患者的细胞中提取的突变蛋白的分子大小及含量的多少。具体操作如下,首先把从细胞中抽提的蛋白质并进行聚丙烯酰胺凝胶电泳(polyacrylamide gel electrophoresis,PAGE),按相对分子质量大小使不同蛋白质分离,然后将它们经印迹转移到一张硝酸纤维素膜、尼龙膜或化学活化膜上,将膜与目的蛋白的抗体一起温育。这种抗原抗体之间的结合可以被标有组织化学、荧光或放射性物质的针对第一抗体的第二抗体所识别。最后,洗膜并与X 线片压片曝光,将在目的蛋白质处出现条带,条带的位置和深浅可以用来确定该蛋白分子量的大小和含量的多少 [3,4]。
(七)Sanger 测序法
DNA 序列测定是诊断已知和未知基因突变最直接、可靠的方法。经典的DNA 测序技术称为Sanger 测序法(Sanger sequencing),以英国著名科学家、两次诺贝尔奖获得者Fred Sanger 命名,是基因诊断的“金标准”。Sanger 测序法可用于点突变、小缺失和小插入等的检测。无论是克隆片段还是PCR 产物,纯化了的DNA 片段都能够进行Sanger 测序。Sanger 测序法是利用了4 个双脱氧核苷酸(ddA、ddC、ddG 和 ddT),它们的脱氧核糖缺少 3′-羟基(通常 DNA 缺少 2′-羟基)。如果加入到正在延伸的DNA 链中,双脱氧核苷酸将阻止DNA 聚合酶结合到与被测序的模板链互补的下一个碱基,因而阻断DNA 的延伸。在Sanger测序中,以被测序的DNA 片段作为模板,4 种双脱氧核苷酸和正常的4 种脱氧核苷酸一并加入反应体系,一段短寡核苷酸引物按照碱基互补配对的原则,结合到DNA 模板上,DNA 聚合酶会选择任一正常核苷酸或双脱氧核苷酸加入而继续延伸合成链。因为如果加入双脱氧核苷酸将而终止DNA 链的合成。因此,PCR 结束后,理论上反应体系中应该存在不同长度片段(只相差一个碱基)的DNA 产物,用电泳的方法分离DNA 产物,因为每一种双脱氧核苷酸标记有可发出不同荧光的荧光染料,因此,根据不同的荧光标记,就可读出DNA 的碱基序列。将该序列与网上数据库中的正常序列进行比对,可以明确是否存在目的DNA序列的点突变、小缺失和小插入等 [3,4]。
(八)高通量测序技术
高通量测序又称二代测序(next generation sequencing,NGS)或大规模平行测序技术,对应于以Sanger 测序法为代表的第一代测序技术而得名。在二代测序中,三种主流测序技术分别为依次出现的Roche/454 焦磷酸测序(2005 年)、Illumina/Solexa 聚合酶合成测序(2006 年)和ABI/SOLiD 连接酶测序(2007 年)。高通量测序可检测全基因组存在的点突变、小插入或者缺少等。与Sanger 测序相比,二代测序技术最突出的特征是单次运行能够产出巨大的序列数据量。
高通量测序技术一般由模板准备、测序和成像、序列组装和比对等部分组成。三种高通量测序技术的原理各不相同,其数据量出、数据质量和单次运行的成本也有差异。相对于Sanger 测序技术,高通量测序技术的出现,使得获得核酸序列数据的单碱基测序费用急剧下降,同时也给基因组学研究带来了新方法和新方案。目前,高通量测序技术已广泛应用于动植物全基因组测序、基因组重测序、外显子组测序、转录组测序、小RNAs 测序和表观基因组测序等方面,并在孟德尔疾病和复杂疾病的研究以及疾病的基因诊断和靶向药物应用中发挥重要作用 [5~10]。
(九)多重连接依赖式探针扩增技术
多重连接依赖式探针扩增(multiplex ligationdependent probe amplification,MLPA)技术是一种高通量、针对待测DNA 靶序列进行定性和半定量分析的方法。该技术具有高效、特异、在一次反应管中可同时检测多个不同的核苷酸序列拷贝数变化的优点,可用于检测DNA 的大片段缺失或者重复。MLPA 的基本实验流程和原理包括DNA变性、探针与DNA 靶序列杂交、连接、PCR 扩增,产物通过毛细管电泳分离后,最后采用软件分析获得DNA 靶序列重复或者缺少的结论。
每对MLPA 探针包括两段寡核苷酸序列,每条探针包括一段引物序列和一段特异性序列。通过与靶序列的杂交,并使用连接酶把两部分探针连接成一条核苷酸单链,再通过通用引物进行扩增。由于设计的每对探针所扩增的产物长度不一,毛细管电泳可将PCR 产物的不同片段进行分离,最后应用Genemarker 等软件对结果进行分析。如果检测的靶序列发生点突变、甲基化、缺失、重复等变异,则相应探针的扩增峰便会发生缺失、降低或升高。因此,根据扩增产物的改变,可判定靶序列是否存在拷贝数目的异常、点突变和甲基化等现象 [3,4]。
二、DNA 突变的预筛查技术
对于未知基因突变的筛查,有以下几种技术:①基于突变型和野生型片段单链在凝胶电泳上迁移率的不同或指纹图谱差异的检测,最典型的是单链构象多态性(single-strand conformational polymorphism,SSCP)、双脱氧指纹法(dideoxy fingerprinting,ddF)和限制性内切酶指纹法(restriction endonuclease fingerprinting,REF)等;②基于突变型和野生型片段生成的杂合双链体与纯合双链体在PAGE 上迁移率不同的检测,包括变性梯度凝胶电泳(denaturing gradient gel electrophoresis,DGGE)、温度梯度凝胶电泳(temperature gradient gel electrophoresis,TGGE)、构象敏感凝胶电泳(conformation-sensitive gel electrophoresis,CSGE)和异源双链分析(heteroduplexes analysis,HA)等;③基于杂合双链体和纯合双链体在高效液相色谱中滞留时间的差异的筛查方法,即变性高效液相色谱(denaturing high performance liquid chromatographty,DHPLC)分析;④基于杂合双链体中错配碱基的化学断裂法(chemical cleavage of mismatch,CCM),如用核糖核酸酶(ribonuclease,RNase),DNA 修复酶或化学试剂(四氧化锇、羟胺)的检测。上述检测方法对于未知基因突变的筛查在灵敏度、适用范围和检测突变类型上存在差异,各有优势和不足 [1,2]。
三、间接检测DNA 突变的技术
一般将基因诊断的方法分为直接法和间接法两大类。直接法如上所述,主要是直接对致病基因进行诊断和分析,检查其是否存在结构异常。而间接分析法主要是用基因旁边或内部的遗传多态标记在家系中作连锁分析而进行基因诊断,主要是用多态性位点来跟踪致病基因的传递。间接检测DNA 突变的技术一般在下述情况下采用:①致病基因还未得到完全克隆;②患者的家系资料较为完整;③已知与致病基因紧密连锁的DNA多态性位点。
(一)短串联重复序列连锁分析技术
短串联重复序列(short tandem repeat,STR)是遍布于人基因组中的高度重复序列,重复单位一般为2~6bp,又称为微卫星DNA(microsatellite DNA)。在人群中因重复次数不同而存在遗传多态性,它的杂合度和所含信息都比较高,因此,可应用该信息对未知致病基因的遗传病进行诊断,也可以作为直接检测DNA 突变的验证手段之一。在采用STR 作连锁分析进行基因诊断时,发生错误诊断的概率大小与突变基因与多态遗传标记间的重组有关 [3,4]。
(二)DNA 指纹
长度10~100bp 的DNA 高度重复序列(重复次数通常为几百至几千次)称为小卫星DNA(minisatellite DNA)。由于小卫星可变的串联重复次数造成许多等位基因,故又称为可变数目串联重复(variable number of tandem repeat,VNTR)。这种信息量最大的多态性标记可涉及几十个或以上的等位基因。因而,如果两个个体之间无亲缘关系,她们的等位基因就不一样。无论是STR还是VNTR,大部分可能对健康无影响,但有些VNTR 可引发相关疾病的发生 [3,4]。
(龚凤英)
第四节 染色体病与基因组病遗传学检查的策略与适用技术
从非显带染色体到显带染色体的制备,染色体检查技术的进步已使不同的染色体能够得到准确的区分,大大提高了对染色体数目异常与结构畸变(染色体病)的识别率。同时,染色体分子杂交技术的出现,使我们能够发现与诊断染色体微小结构突变及其导致的遗传病(基因组病)。
一、染色体与基因组检查策略
(一)染色体与基因组检查的顺序
常规染色体检查是染色体病诊断的“金标准”,对于怀疑染色体病的患者首先应完成常规染色体检查,以发现显著的染色体数目异常与结构畸变。常规染色体检查无阳性发现时,可考虑选择分辨率更高的基因组检查。目前该类检查以比较基因组杂交芯片为代表,以期发现基因组功能性的微小结构突变,包括微缺失及微重复等 [1,2]。
(二)非靶向与靶向基因组检查
采用比较基因组杂交等高分辨技术进行非靶向基因组检查,适用于患者的临床表现缺乏特异性,难以根据症状体征及一般实验室检查获得病因诊断的情况。非靶向基因组检查的结果可进一步采用靶向基因组检查予以验证。以FISH 技术为代表的靶向基因组检查适用于一些常见染色体病的快速筛查,以及非靶向基因组检查结果的验证 [3,4]。
二、染色体与基因组检查的适用技术
FISH 适用于染色体病与基因组病的靶向检测。在临床工作中,通常首先进行常规染色体检查,以获得染色体组全貌。在发现特定染色体异常,尤其是结构改变时,可利用FISH 核型进一步判断与表型的关系 [3,4]。
定量PCR 技术(qPCR)主要针对常见的染色体病与基因组病的靶向检测。定量PCR 技术的缺点是难以对染色体易位与嵌合体做出有效判断。基于短串联重复序列(STR)的定量PCR 技术理论上适用于大部分常见的染色体非整倍数的检查。多重连接依赖式探针扩增(MLPA)是另一个临床常用的染色体病与基因组病的靶向检测技术。该技术适用于检测已知的染色体微缺失/微重复综合征及染色体亚端粒缺失综合征等,是目前针对已知的染色体微缺失/微重复最可靠的遗传检查方法之一 [3,4]。
微阵列比较基因组杂交(aCGH)与单核苷酸微阵列(SNP array)技术均为高通量、高分辨率的基因组结构检测技术,适用于基因组未知微缺失/微重复的非靶向检测。该技术最突出的不足之处在于难以检出染色体平衡易位与嵌合体,该问题的解决还有待于该技术的进一步改进与发展 [9~11]。
(龚凤英)
第五节 单基因病遗传学检查的策略与适用技术
基因诊断是通过寻找致病基因的功能性突变,对单基因遗传病进行病因诊断的过程。基因诊断可分为实验室基因检查与基因突变性质判断两个内容。根据致病基因的结构特点与突变谱,基因检查的重点集中在确定诊断策略与选择适用分子生物学检测技术两个方面。而对基因突变性质的分析则需要集中实验室与生物信息学两个方面的证据。
一、基因检查策略
随着人类疾病基因组学研究的深入,越来越多的致病基因被发现,也积累了大量的基因型与疾病表型相关性的证据。迄今为止,在实验室中已能对近3 000 种单基因病进行基因突变分析。然而,单基因病致病基因突变大都有其自身的特点。致病基因的突变谱特点存在较大差异。因此,在实验室基因检查中首先需要选择合适的检查策略 [1,2]。
(一)直接与间接诊断
1.直接基因诊断
直接基因诊断是指利用适用的技术与方法对遗传病患者的致病基因进行直接分析,确定致病基因突变位点,达到基因诊断的目的。直接基因诊断的指征包括以下几点,致病基因明确的单基因病;患者群体致病基因突变谱已建立,有突变热点;检测基因较小,检测耗时与成本符合临床的需要。
2.间接基因诊断
间接基因诊断是指通过检测基因内或基因两侧的一些遗传多态性位点的基因型,利用基因连锁分析建立家系中野生型基因与突变型基因多态性位点单倍型的信息,进而了解待检者是否获得突变基因的一种诊断方法。间接基因诊断的指征包括以下几点,致病基因明确的单基因病;未能检出致病基因功能区致病突变,或缺乏明显的突变热点;基因较大的单基因病。
间接基因诊断的关键是遗传多态性位点的选择,一般来说,有两类多态可以选用。①单核苷酸多态性(SNP),该类位点数量大,并且较多可以利用限制性片段长度多态性(RFLP)的分析,确定基因型。缺点是这些位点多呈现二态的变化,大大地限制了其多态的信息量。因此,常常需要结合较多的SNP 位点的检测,才能区分出家系中的野生型与突变型基因;②短串联重复序列(STR),这类位点虽然在数量上远远少于SNP 位点,但由于每个位点往往存在有较多的等位片段,因此多态信息量要比SNP 位点大很多,区分家系野生与突变基因所需的STR 位点数也大大少于SNP 位点。基于STR 的这些特点,目前间接基因诊断比较多地选择 STR 位点 [1,2]。
(二)已知与未知基因突变诊断
1.已知基因突变诊断
已知基因突变诊断是一种靶向的基因诊断方法。在进行直接基因诊断时,通过对致病基因的一个或少数几个频繁出现于患者群体的功能性突变进行检测,低成本在短时间内完成基因诊断。常见基因突变诊断的诊断率取决于被检测基因突变在患者群体中出现的频率。该诊断方法适用于致病基因有突变热点的单基因病。
2.未知基因突变诊断
当致病基因缺乏明显的突变热点,或者患者被证实未发现常见突变时,在直接基因诊断中可以采取未知基因突变诊断策略。目前,随着高通量测序技术的发展以及其在临床的逐渐应用,已经能够一次性地对大基因及遗传异质性单基因病进行罕见突变的检测,大大地缩短了直接基因诊断的时间 [1,2]。
二、致病突变分析
在实验室中检出基因突变只是基因诊断的第一步,更重要的是从找出导致疾病的功能性突变,这就是突变性质的分析过程。实质是通过分析突变基因型与疾病表型的关系,最终确定致病突变。突变性质的分析是一个循证的过程,同时涉及生物信息学循证与实验室循证两个方面的东西。
1.生物信息学循证
(1)突变数据库核实基因型与表型信息:
对基因检测中发现的突变点,首先需要查询各种突变数据库以获得判断其性质的信息,主要的数据库包括:①人类基因突变数据库(the human gene mutation database,HGMD)。该数据库集中了公开报道的可引起人类单基因疾病表型的核基因组突变,突变类型包括了单碱基置换、缺失、插入及复杂的基因重排。目前数据库已收集近5 000 个基因,合计超过12 万个基因功能突变的信息。数据库还提供了相关基因的cDNA 序列,能够便利地进行基因突变点的定位,并能判断蛋白质一级结构的改变。同时,通过对特定基因突变谱的查询,判断检测中发现的突变是否已有相关文献报道,进而通过阅读文献,了解既往研究中所发现的基因突变与疾病表型的关系;②位点特异性突变数据库(locus-specific mutation database)。该数据库包括各种特定遗传病致病基因突变。这类数据库与HGMD 最大的不同在于,其是专门针对某一种特定的遗传病而建立的数据库。常常是由国外特定遗传研究领域较领先的研究机构建立,其更新速度更快,还包含了许多未经公开报道的突变与遗传多态性。另外,在基因突变检测中,还一个很重要的步骤就是排除其为单核苷酸多态性的可能性。因此,需要查询遗传变异数据库。美国国立卫生研究院SNP 数据库(database of single nucleic polymorphisms,dbSNP)与欧盟基因组关联研究数据库(genome wide association study central,GWAS Central)是最重要的两个基因多态数据库。其中,dbSNP(http://www.ncbi.nlm.nih.gov/sites/entrez?db = snp)数据库已收集了包括人类在内的超过50 个物种近7 000 万个基因组的变异,是基因突变循证中最常被使用的多态数据库。GWAS Central(https://gwascentral.org/)数据库偏重于表型研究结果。另外,Hapmap数据库(http://hapmap.ncbi.nlm.nih.gov/cgi-perl/gobrowse/hapmap24_B36/)与千人计划数据库(http://1000genomes,org/home)也是判断基因突变性质时信息来源的重要数据库 [12~15]。
(2)跨物种蛋白同源序列的保守性分析:
当基因检测中所发现的突变点,经查询上述各种数据库确定为新突变时,尤其是错义突变时,可以对改突变进行多物种氨基酸序列的比对,用来判断该突变的保守性。保守性分析的基本原理是在功能上越重要的蛋白质,或者越重要的蛋白结构域,在进化过程中越保守。通过比对不同物种特定基因突变氨基酸及两侧的序列(http://genome.uesc.edu,http://blast.ncbi.nlm.nih.gov/Blast.cgi,http://www.megasoftware.net/)的保守性,可以为新突变性质的判断提供重要的线索和依据 [12~15]。
(3)蛋白质高级结构比对:
有些基因突变是通过改变蛋白质的空间结构来影响蛋白的功能的。通过一些公共软件,可以对蛋白质的空间结构进行初步的推测和分析。比如分析基因突变后是否有 α 螺旋、β 折叠、β 转角、扩展链或无规卷曲结构等的改变,这些都有助于对新突变性质进行进一步的判断 [12~15]。
(4)软件预测:
当基因检测中所发现的突变点,经查询上述各种数据库确定为新突变时,还可以采用软件对突变的性质进行进一步的功能预测。这些软件包括PolyPhen2(http://genetics,bwh.harvard.edu/pph2/)、SIFT(http://sift jcvi.org/)、MutPred(http://mutpred.mutdb.org/)、nsSNPAnalyzer(http://snpanlyzer.uthsc.edu/)、Panther(http://www.pantherdb.org/)、PhD-SNP(http://snps.Biofold.org/phd-snp/phd-snp.html)及 SNPs&GO(http://snpsand-go.biocomp.unibo.it/snps-and-go/)等 [12~15]。
2.实验室循证
(1)家系中突变与疾病表型的共分离:
在家系成员中靶向检测到新基因突变,要分析该突变是否存在与疾病表型共分离的现象。比如完全显性的常染色体遗传病家系,分析家系成员是否符合有突变即为患者,无该突变则无病的特点。在该分析过程中,还应该注意区别不完全显性、外显不全及延迟显性等因素的影响。
(2)突变在群体中的分布:
在群体中,SNP 等位基因频率通常超过1%。因此可对非病群体中超过200 个等位基因进行分析,以了解SNP 位点的群体基因频率。如未发现或低于1%,则该变异是功能突变的可能性大。
(3)突变基因mRNA 与蛋白质水平的鉴定:
基因突变的致病性既可以表现为mRNA 质量的变化,也可以主要表现为蛋白质质量或者功能的变化。前者源于一些剪切位点突变、隐匿剪切位点激活突变或基因表达调控位点突变。这些突变的一个共同特点是突变基因mRNA 序列或数量发生了较大的改变,可以通过反转录实验在mRNA 水平上获得突变性质的证据。而有一些错义突变,其致病性可能通过改变蛋白空间结构,其与上下游蛋白结合异常,导致相应途径和通路的改变。该突变需要进行蛋白功能实验来确定突变的致病性。
三、基因检测的适用技术
选择适用的基因检测技术是快速准确地完成基因诊断的前提,其在较大程度上取决于采何种基因诊断策略。下面简要介绍几种实验室的常用技术及其适用范围。
聚合酶链反应-限制性片段长度多态性检测技术(PCR-RFLP)适用于直接基因诊断中常见点突变的检测,可以迅速地区分出野生型与突变型等位基因,从而实现基因诊断的目的。但是该技术的检测结果需要DNA 测序验证 [3,4]。
等位基因特异性寡核苷酸(allele-specific oligonucleotide,ASO)技术适用于直接基因诊断中常见点突变的检测。理想的反应条件和引物模板错配时尽可能少的错配延伸都将影响ASO 的点突变的检出率。因此,ASO 技术比较容易出现假阳/阴性结果。在临床上的使用受到一定限制。该技术的检测结果也需要DNA 测序验证 [3,4]。
聚合酶链反应-单链构象多态性(PCR-single strand conformation polymorphism,PCR- SSCP)技术检测适用于直接基因诊断中未知罕见突变的筛查。该技术只能提示突变存在的可能性,不能证实突变的位置与性质,必须与其他检测手段结合,比如DNA 测序,才能做出诊断。近年来,随着毛细管技术的普及,该技术的具有更高的电泳分辨率,PCR-SSCP 对突变的检出率有了明显的提高 [3,4]。
变性高效液相色谱(DHPLC)技术适用于直接基因诊断中未知罕见突变的筛查。由于DHPLC 技术的突变检出率与PCR 片段中突变碱基的位置,以及异源杂合双链从色谱柱上被洗脱的时间及温度等诸多因素有关,其通用性受到一定程度的影响。该技术的检测结果也需要DNA 测序验证 [3,4]。
高分辨率熔解曲线分析(high-resolution melting analysis,HRM)适用于直接基因诊断中未知罕见突变的筛查。该技术可以提示突变的存在。与DHPLC 技术相比,HRM 技术在突变筛查中具有便捷性、较高灵敏度与特异性的优点,而且检测成本较低,耗时较少,在临床中已得到广泛的使用。该技术的检测结果也需要DNA 测序验证 [3,4]。
Sanger 测序是目前基因突变检测的“金标准”。近年来,随着DNA 测序技术的发展,常规测序的成本不断降低,为直接基因诊断提供了强有力的费用保障。目前几乎所有的基因突变筛查及高通量基因突变检测的结果均需通过Sanger DNA 测序来进行验证 [3,4]。
第二代测序(NGS)技术主要包括全基因组测序(whole genome sequencing,WGS)技术与全外显子组测序(whole exome sequencing,WES)技术。NGS 技术主要用于高通量检测基因的单碱基置换、小的缺失或/和插入等累及较少碱基的变异。遗传病诊断中NGS 技术的应用指征包括检测与寻找高度遗传异质性单基因病的致病基因;检测与寻找表型重叠遗传病的致病基因;检测与寻找大基因的致病突变。NGS 数据中致病突变的主要特点包括:遗传变异的群体频率< 1%~5%;变异类型包括无义突变终止密码突变缺失或/和插入突变剪切位点突变及错义突变等;变异基因与疾病表型存在明确的相关性。需要特别注意的是,致病突变需要采用如Sanger 测序等方法进行验证。NGS 的优势体现在通过对全基因组或全外显子组或预设的特定疾病相关基因群的高通量检测,可以同时获得大量的基因变异信息,为后续致病突变的判断奠定了基础。NGS 也有其局限性,NGS 的检测时间较长,费用较高,尤其是面对获得的大量基因变异信息,后期变异性质的解读和辨析是非常重要的问题,常常需要有强的医学和遗传性背景的专业人员来分析 [5~10]。
多重连接依赖式探针扩增技术(MLPA)适用于未知基因缺失与重复的较高通量检测。除能够对基因缺失进行定性检测外,该技术还具有检测靶点拷贝数的相对定量能力。因此,能够对基因片段的杂合缺失(缺失携带者)及重复进行检测和判断 [3,4]。
除了上述基因检测的适用技术外,其他基因检测技术还包括适用于已知或突变范围比较确定的基因组缺失与重复检测的DNA 印迹(Southern blotting)以及长片段PCR 技术等。
(龚凤英 朱惠娟)
参 考 文 献
1.陈竺等,医学遗传学.北京:人民卫生出版社,2005
2.邬玲仟,张学.医学遗传学.北京:人民卫生出版社,2016
3.Van Ommen GJB,Bakker E,den Dunnen JT.The human genome project and the future of diagnostics,treatment,and prevention[J].Lancet,1999,354(Suppl 1):5-10
4.Goodwin S,McPherson JD,McCombie WR.Coming of age:ten years of next-generation sequencing technologies[J].Nat Rev Genet,2016,17(6):333-351
5.Shendure J,Balasubramanian S,Church GM,et al.DNA sequencing at 40:past,present and future[J].Nature,2017,550(7676):345-353
6.Biesecker LG,Green RC.Diagnostic clinical genome and exome sequencing[J].N Engl J Med,2014,370(25):2418-2425
7.Collins FS,Varmus H.A new initiative on precision medicine[J].N Engl J Med,2015,372(9):793-795
8.Tucker T,Marra M,Friedman JM.Massively parallel sequencing:the next big thing in genetic medicine[J].Am J Hum Genet,2009,85(2):142-154
9.Heather JM,Chain B.The sequence of sequencers:The history of sequencing DNA[J].Genomics,2016,107(1):1-8
10.Behjati S,Tarpey PS.What is next generation sequencing?[J].Arch Dis Child EducPract Ed,2013,98(6):236-238
11.Le Gallo M,Lozy F,Bell DW.Next-Generation Sequencing[J].Adv Exp Med Biol,2017,943:119-148
12.Ginsburg D.Genetics and genomics to the clinic:a long road ahead[J].Cell,2011,147(1):17-19
13.Lu JT,Campeau PM,Lee BH.Genotype-phenotype correlation-promiscuity in the era of next-generation sequencing[J].N Engl J Med,2014,371(7):593-596
14.Yohe S,Thyagarajan B.Review of Clinical Next-Generation Sequencing[J].Arch Pathol Lab Med,2017,141(11):1544-1557
15.Richards S,Aziz N,Bale S,et.al.Standards and guidelines for the interpretation of sequence variants:a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology[J].Genet Med,2015,17(5):405-424