第二章 心血管疾病的分子生物学基础
第一节 分子生物学在心血管疾病中的应用
分子生物学(molecular biology)是在分子水平上研究生命的重要物质(核酸、蛋白质等生物大分子)的化学与物理结构、生理功能及其结构与功能的相关性,定量地阐明生物学规律(遗传进化规律、分化发育规律、生长衰老规律等),揭示复杂生命现象本质的一门现代生物学。
分子生物学的概念有两个层面的含义:①从狭义的角度来说,分子生物学偏重于研究生物大分子——核酸(基因)。主要研究脱氧核糖核酸(deoxyribonucleic acid,DNA)的复制、转录、翻译和基因表达调控的过程,同时涉及与重要调控过程有关的蛋白质和非编码核糖核酸(non-coding RNA,ncRNA)结构与功能的研究。②从广义的角度来说,生命体中一切相关物质的结构功能变化及其规律都是分子生物学研究的内容,不仅研究基因的结构表达机制和表达产物,还要研究RNA、蛋白质、糖和脂类等生物分子与基因的相互作用、基因表达调控和生物信息传递的机制。如蛋白质的结构、运动和功能及生物催化剂的作用机制和动力学,膜蛋白结构功能和膜运输等。总之,生物化学中所涉及的一切大大小小的生物组成成分及各种物质的分子结构、代谢过程及作用机制等都属于分子水平的生物学研究内容。
一、基因组学
基因是核酸分子中贮存遗传信息的遗传单位,即指贮存有功能的蛋白质多肽链或RNA序列及表达这些信息所必需的全部核苷酸序列。按照这个定义,一个基因序列不仅仅包括编码蛋白质多肽链或RNA的核酸序列,还包括保证转录所必需的调控序列及位于编码区5’端上游的非编码序列、内含子和位于编码区3’端下游的非编码序列。从简单的病毒到复杂的高等动植物细胞,RNA序列和蛋白质的结构信息都是以基因的形式贮存在DNA中的。
细胞或生物体中,一套完整的单倍体遗传物质的总和称为基因组(genome)。如人类基因组包含22条常染色体和X、Y两条性染色体上的全部遗传物质以及胞浆线粒体上的遗传物质。基因组的结构主要指不同的基因功能区域在核酸分子中的分布和排列情况,基因组的功能是贮存和表达遗传信息。
心血管疾病(cardiovascular disease,CVD)是一系列由遗传与环境因素相互作用引起的复杂疾病。基因组在心血管系统的健康和疾病中起多种作用:包括疾病预告,发现对心血管有影响的基因位点等。从功能的角度评估这些基因位点,可以发现心血管疾病的生物标志物,探明心血管疾病的发病机制,确认治疗的靶标。
二、蛋白组学和代谢组学
蛋白组(proteome)的概念1994年由Williams和Willkins提出,表示由基因组表达的蛋白质群,是一种细胞组织或完整生物体在特定时空上所拥有的全套蛋白质。蛋白组学(proteomics)为衍生概念,是应用各种技术手段来研究蛋白组的一门新兴学科,其目的是通过对蛋白质性质(包括表达水平、翻译后修饰及蛋白质群体内的相互作用)的研究来了解疾病发生发展揭示蛋白质功能与细胞生命活动规律。蛋白组学研究能提供更多的生命信息,有助于发现和理解生命活动的规律,以及生理、病理现象的本质,可提高判断疾病、诊断疾病的准确性。
蛋白组学的方法可对心血管疾病早期诊断和积极治疗提供有力的依据,它可以直接从生物功能的执行者——蛋白质入手,对心血管疾病蛋白质水平的表达变化进行动态分析。目前蛋白组学技术包括二维凝胶电泳技术、表面增强激光解析/电离时间质谱技术以及基质辅助激光解析电离飞行时间质谱技术等。
代谢组学(metabolomic)的概念由Nicholson教授及其同事于1999年首次提出。代谢组学是继基因组学、转录组学和蛋白组学之后,系统生物学的重要组成部分,是系统研究代谢产物的变化规律,解释机体生命活动代谢本质的科学。它通过高通量、高灵敏度与高精确度的现代分析技术,分析细胞、组织和体液中内源性代谢物的整体组成,来辨识和解析被研究对象的生理病理状态。标本的易采集性也为代谢组学的发展提供了良好的基础。
基因组学和蛋白组学告诉我们可能发生什么,代谢组学告诉我们已经发生了什么,也被视为组学研究的“终点”。代谢组学中先进的仪器检测、数据分析和化学计量方法,对了解心血管疾病的发病机制、临床风险评估、诊断、预后和疗效评估十分重要。目前代谢组学技术包括:一维核磁共振(lH-NMR)、气相层析质谱(GC-Ms)、液相层析质谱(LC-MS)、傅立叶层析质谱(FT-MS)、高效液相质谱(HPLC)、电化学阵列(EC-array)等。
三、分子生物学技术
研究基因功能的最好方式之一是检测基因在不同组织、不同发育阶段以及不同健康状况机体中表达的变化,而大规模检测基因表达的最好方法之一是基因芯片(genechip)技术,又称为微阵列(microarray)技术,或芯片(chip)技术。利用这种技术可以同时测定成千上万个基因的转录活性。基因芯片技术是通过在固相支持物上原位合成(in-situ synthesis)寡核苷酸或者直接将大量预先制备的探针以显微打印的方式有序地固化于支持物表面,然后与待测的荧光标记样品杂交,通过对杂交信号的监测分析,得出样品的遗传信息(基因序列及表达)。根据芯片上固定的探针不同,基因芯片可在同一时间内分析大量的基因功能,高密度基因芯片可在1cm2面积内排列数万个基因用于分析,实现了基因信息的大规模检测。
伴随着PCR技术和荧光标记技术的出现,新的DNA自动测序技术得到迅速发展和广泛应用,第二代和第三代测序技术相继诞生。
焦磷酸测序(pyrosequencing)技术于1996年由瑞典科学家建立,适用于对短到中等长度(通常<400bp)的DNA样品进行高通量测序技术分析的技术。它也是基于聚合原理,但与Sanger双脱氧链终止法不同,它不是通过双脱氧核苷三磷酸的掺入使合成终止,而是依赖于焦磷酸盐的释放。释放的焦磷酸在ATP硫酸化酶(ATP sulfurylase)的作用下;ATP在荧光素酶(luciferase)的催化下与荧光素结合形成氧化荧光素,每一个dNTP的掺入都与一次荧光信号释放相偶联,通过检测荧光的释放和强度,便可实时测定DNA序列。焦磷酸测序技术具有快速、准确、灵敏度高和自动化的特点,但其还存在测定序列较短的问题。
循环芯片测序(cyclic-array sequencing)被称为第二代测序技术,其基本原理是对DNA芯片样品重复进行DNA模板变形、退火杂交和延伸的聚合反应,通过设备观察并记录测序循环中释放的荧光信号,确定DNA序列。目前常用的第二代测序技术平台有454技术、Solexa技术和SOLiD技术等。
单分子实时测序被称为第三代测序技术,它通过增加荧光的信号强度和提高仪器的灵敏度等方法,可以实现单分子序列分析,无需PCR扩增,并继承了高通量测序的优点,可以有效地将序列读取长度提高到数千个碱基,减少了测序后的拼接工作量。
PCR-单链构象多态性分析(PCR-single strand conformation analysis,PCR-SSCP)是近年来在基因突变检测中运用最广泛的方法之一。PCR-SSCP技术凭借突变可引起单链DNA三级构象改变,通过观察单链DNA在非变性聚丙烯酰胺凝胶中的迁移率漂移来判断突变。样品经PCR扩增后,其产物经变性后可以产生2条单链,如果存在基因突变,哪怕是一个碱基的异常,单链的构象也会发生变化,正常与突变的DNA单链在聚丙烯酰胺凝胶电泳(PAGE)中,可以显现出不同的带型,从而确定野生型和突变型,PCR-SSCP分析的主要优点是简易且敏感性较高。但是该技术不能确定突变的部位和性质。PCR-SSCP突变检测敏感性随PCR产物长度的增加而降低,一般用于检测较小外显子的突变。有时由于单个核苷酸变化所引起的构象改变很小,用PAGE电泳就可能无法检出,在PCR产物或待测DNA小于200bp时,PCR-SSCP分析能够检测出70%~95%的突变。如果以毛细管电泳代替PAGE,则可大为提高突变检测的效率。
变性梯度凝胶电泳(denaturing gradient gel electrophoresis,DGGE)利用由碱基序列所决定的DNA片段溶解度或变性度的差异,达到分离野生型与突变型DNA片段的目的,该手段分辨率达一个碱基。当DNA双链沿变性剂浓度梯度增加的聚丙烯酰胺凝胶迁移时,DNA分子中解链温度(Tm)低的部分逐渐变性解链。一般总是错配碱基部分的异源双链Tm最低,最容易解链,其次是富含AT碱基对的部位,富含GC碱基对的部位Tm值较高所以解链较难。因此,正常DNA双链和异源双链在梯度变性胶中电泳时,异源双链总是先解链。将PCR产生的双链DNA在浓度递增的尿素和甲酰胺变性聚丙烯酰胺凝胶上电泳,当某一DNA片段迁移到变性剂浓度与其最低Tm相当的位置时,该片段低温解链部分的双链打开,部分解链导致DNA迁移速度明显下降,观察样品的迁移率变化即可判断是否存在变异。DGGE敏感性高,即便异源双链中仅含一个错配碱基,在电泳时也可分辨其迁移率的改变。DGGE方法的单碱基突变检出率在DNA片段长度600bp以内可以达到95%。DGGE方法需要设计特定片段最佳的PCR引物以及最佳变性条件,这一过程比较复杂,梯度变性胶的制备需要的设备较昂贵,所以在常规实验室不易实施。
变性-高压液相色谱(denaturing high-performance liquid chromatography,DHPLC)是利用DNA构型改变检测基因突变和遗传多态性的方法之一,其可以检测单核苷酸多态和可遗传的突变。实验主要过程包括PCR扩增待测和正常DNA样品,将扩增产物变性后再复性,若存在突变,在这一复性过程中可形成异源双链。在部分变性条件下,高压液相色谱分析可以有效地区分由变异碱基与正常碱基形成的异源DNA双链和正常DNA双链。由于DHPLC的分辨率可达到1bp/ kb,而且操作过程可以全部程序化、大规模化和自动化,使得实验时间大大缩短,实验准确率提高,可作为大群体任何基因突变初筛的有力手段,比SSCP有更多的优越性,具有广泛的应用前景,许多工作都已经证实了DHPLC的敏感性、有效性和准确性。
等位基因特异性扩增法(allele-specific amplification,ASA)是基于PCR技术的一种单核苷酸突变检测法,是分析已知碱基替代或微小片段缺失和插入型突变的常规技术。在PCR的引物设计中,根据已知突变位点性质在引物3'端或中间设计一错配碱基,使之仅能与突变型或野生型基因互补而只扩增突变型或野生型基因。
ASA技术只需一步PCR反应,甚至无需电泳和标记技术。因其快速,重复性强,耗资少,无同位素污染以及高效性等特点,将成为有前途的适应于人群大规模突变筛查的方法。应用该方法最好避免错配碱基为G∶T,这种错配可能引发扩增反应。
化学裂解错配碱基法(chemical cleavage mismatch,CCM)通过化学修饰并切割异源DNA双链中错配碱基,达到检测点突变的目的。其原理是末端标记的DNA片段暴露于可以识别并修饰异源双链中错配碱基的化学试剂中(如错配的胞嘧啶可被羟胺修饰,错配的胸腺嘧啶可被四氧化锇修饰,被修饰的位点随即可被杂氮环己烷等化学物质裂解。DNA修饰裂解后,电泳观察DNA片段长度即可知道突变是否存在。该技术较其他突变检测系统有更多的优越性,可以扫描1~2kb的大片段DNA并在随后的顺序分析中定位突变位点,其效率可达100%。该手段通常首先对目标DNA和野生型DNA进行PCR扩增,然后对野生型DNA扩增片段进行末端标记,标记片段作为探针与目标序列复性形成异源双链,用四氧化锇(OsO4)或羟胺(hydroxylamine)修饰并用哌啶(piperidine)切割,聚丙烯酰胺电泳分离不同长度的片段。采用碳化二亚胺作为错配修饰剂,进一步提高了该方法的敏感性。CCM方法最初采用同位素DNA片段,用荧光标记代替同位素后,称之为荧光化学裂解错配碱基法(FCCM),该方法依然比较敏感并且安全,可检出95%~100%的错配。化学裂解错配碱基法的不足之处在于工作量大,需要使用有害化学物质作为试验用试剂。