上QQ阅读APP看书,第一时间看更新
第3章 表观遗传变异的遗传咨询
续表
续表
引言
在胚胎发育过程中,一个受精卵细胞通过逐渐分裂、分化,产生各种不同的细胞类型,这些细胞尽管共享相同的基因组,具有相同的DNA序列,却具有不同的基因表达模式,执行不同的生物学功能;不仅如此,分化的细胞在通过有丝分裂进行复制后,新的细胞仍然维持原有细胞的类型和基因表达模式。这一现象表明,除了DNA序列信息,细胞中还存在着其他的可遗传信息,参与建立、维持或改变基因表达模式或细胞表型,其机制正是表观遗传学所研究的内容。
表观遗传学(epigenetics)一词最早由英国生物学家Waddington于1942年提出。此后X染色体失活、基因组印记等表观遗传现象被先后发现,其分子基础被证明是DNA甲基化、组蛋白修饰等表观遗传修饰变异 [1]。到20世纪90年代,表观遗传学被定义为“对于非DNA序列改变(有丝分裂和/或减数分裂的)导致的可遗传的基因功能变化的研究” [2]。近年来,对于一些非遗传的,但能够造成基因表达长期改变的表观遗传变异,如某些组蛋白修饰的研究也被认为是表观遗传学 [3]。
表观遗传修饰的建立与维持,对于人体正常发育具有不可替代的作用,表观遗传异常会导致发育异常和疾病。表观遗传修饰与遗传变异存在复杂的相互作用:一方面,遗传变异可能通过改变表观遗传修饰体现其功能;另一方面,表观遗传变异也会影响遗传变异功能的外显。在遗传咨询中,我们需要关注相关表观遗传变异的影响。
第1节 表观遗传变异的分子基础
1 DNA甲基化
1.1 胞嘧啶的甲基化修饰
在哺乳动物的基因组DNA中,胞嘧啶(C)碱基是主要的甲基化修饰位点:胞嘧啶环第五位碳原子与甲基基团共价结合,形成5-甲基胞嘧啶(5mC)。在绝大多数情况下,这种DNA甲基化仅局限于胞嘧啶-磷酸-鸟嘌呤(CpG)二核苷酸中的胞嘧啶上,非CpG的甲基化主要富集于特定细胞类型,如胚胎干细胞 [4]。
体内的DNA甲基化修饰通过DNA甲基转移酶(DNMT)催化完成,反应过程中,S-腺苷甲硫氨酸是甲基的供体 [5]。DNMT家族成员中,DNMT1、DNMT3A和DNMT3B参与DNA甲基化修饰。其中,DNMT1主要通过对复制后处于半甲基化的DNA链进行甲基化修饰,从而维持新细胞基因组DNA的甲基化状态;DNMT3A和DNMT3B是从头甲基化酶,可以同样的效率催化非甲基化和半甲基化DNA的甲基化修饰;此外DNMT3L与DNMT3A和DNMT3B具有较高的序列同源性,本身不能催化DNA的甲基化,但通过影响DNMT3A的活性,参与配子生成过程中DNA甲基化模式的建立。
DNA甲基化在基因组上并非均匀分布,这首先是因为CpG二核苷酸的非均匀分布。在人类基因组上的约98%区域,CpG二核苷酸的密度较低,这与进化过程中5mC发生脱氨基反应后转变为胸腺嘧啶(T),更容易逃脱DNA损伤修复机制,从而形成新生突变有关。这些零散的CpG二核苷酸通常高度甲基化。其余约2%的富含CpG二核苷酸的区域被称为CpG岛(CpG island),单个CpG岛的长度在几百碱基对至2kb之间。人类基因组内存在有近3万个CpG岛,在基因的启动子区和5′端富集,约有60%以上基因的启动子区含有CpG岛,其他CpG岛也大多位于基因调控区域,CpG岛往往处于非甲基化状态 [6-7]。
1.2 DNA甲基化的功能
对DNA甲基化的早期研究发现,基因启动子区的CpG岛中DNA高度甲基化与基因转录沉默密切相关,并且参与建立和维持诸如X染色体失活和基因组印记等表观遗传现象;此外转座因子的高度甲基化可抑制其转座活性,从而增加基因组的稳定性。因而DNA甲基化的功能长期被认为是抑制转录活性。但近年来越来越多的研究表明,DNA甲基化的功能要复杂得多 [8]。
DNA甲基化对基因的调控作用与其位置相关 [9]。全基因组DNA甲基化组和转录组的研究表明,在基因的5′端,包括启动子区,转录起始位点下游1kb区域,尤其是第一个外显子,这些功能元件的高甲基化与转录沉默存在密切联系。但基因5′端的甲基化并不总与转录沉默相关,某些特定基因转录起始位点区域附近的甲基化表明转录激活状态。顺式作用元件,如增强子、沉默子序列的甲基化会影响这些元件的功能,从而降低或增强基因的表达。整体上基因本体(gene body)区域的DNA甲基化与基因高表达水平相关。外显子区域的DNA甲基化程度高于内含子区域,不仅如此,DNA甲基化还参与了基因可变剪接的调控:大约22%的可变外显子受DNA甲基化的调控,DNA甲基化既可能增加也可能降低可变外显子被剪接至成熟信使RNA(mRNA)的可能性。
DNA甲基化对基因表达的调控可通过不同分子机制实现 [8]。对于某些甲基化敏感的转录因子如NRF、CTCF等,其结合位点或邻近区域的DNA甲基化直接阻止转录因子与DNA的结合,从而影响基因的转录或基因可变剪接的调控。另一种方式是某些DNA结合蛋白可以特异性地结合甲基化或非甲基化的CpG位点,并募集其他分子共同调控基因的表达。甲基化CpG结合结构域(MBD)可与甲基化的CpG位点结合,甲基化CpG结合蛋白2(MECP2)是第一种被发现具有该结构域的甲基化DNA结合蛋白,该蛋白可以通过与组蛋白去乙酰化酶(HDAC)和转录辅阻遏分子Sin3A共同作用抑制基因表达,与转录激活因子CREB1相互作用激活基因表达,以及通过结合甲基化的可变外显子影响RNA聚合酶Ⅱ的延伸速率以影响剪接。与甲基化CpG结合结构域相反,CXXC结构域结合富含未甲基化CpG的DNA序列,CFP1转录因子具有CXXC结构域,有研究表明其结合基因启动子区CpG岛,募集组蛋白精氨酸甲基转移酶以阻遏CpG岛甲基化和转录沉默。此外,环指状结构域识别半甲基化DNA,UHRF1通过环指状结构域识别新复制的DNA,募集DNMT1,从而在有丝分裂后维持DNA的甲基化修饰 [4]。
1.3 5-甲基胞嘧啶的氧化产物与去甲基化
10-11易位(TET)酶家族,包括TET1、TET2和TET3,可以将5-甲基胞嘧啶(5mC)氧化为5-羟甲基胞嘧啶(5hmC)。不仅如此,TET酶还可以进一步氧化5hmC,形成5-甲酰基胞嘧啶(5fC)和 5-羧基胞嘧啶(5caC),但TET酶催化这种氧化反应的活性要低得多 [10]。
在人类基因组中,胞嘧啶的甲基化修饰是较为稳定和普遍的,在不同组织和细胞类型中,有4%~5%的胞嘧啶碱基(涵盖70%~80%的CpG二核苷酸)被稳定地甲基化修饰。而其羟甲基化修饰则要稀少得多,并具有明显的组织特异性。在羟甲基化修饰最为普遍的中枢神经系统,有0.3%~0.7%胞嘧啶碱基处于羟甲基化修饰状态,而在脾脏和睾丸组织中,这一比例仅为0.03%~0.06%。5hmC主要富集于低密度CpG区域,包括低表达基因启动子、基因本体以及远端调控区域。至于5fC和5caC,其丰度更低,仅有5hmC的1/100~1/10,主要富集于基因转录起始位点附近以及远端调控区域。
5mC的氧化与其去甲基化修饰相关 [11]:当5mC被深度氧化为5fC和5caC后,其可被胸腺嘧啶DNA糖基化酶(TDG)识别为碱基错配而切除,随后通过碱基切除修复(BER)机制替换为未甲基化的胞嘧啶。TET/TDG/BER通路被认为是主要的DNA主动去甲基化过程,这种主动去甲基化过程协助维持基因启动子区和远端调控区的低甲基化状态。5hmC无法直接被TDG识别,在这一过程中主要起到缓冲池的作用。除了作为去甲基化过程的中间产物,5-甲基胞嘧啶的氧化产物是否具有独立的表观遗传调控作用仍然有待进一步研究。
1.4 DNA甲基化及其氧化产物的检测方法
在聚合酶链反应(PCR)或其他分子克隆系统中并不包含DNMT,因而DNA甲基化修饰在扩增过程中会消失。对DNA甲基化的检测主要在DNA样品进行甲基化依赖的扩增前通过预处理完成,预处理后的DNA可以与多种分子遗传学检测平台结合,对DNA甲基化进行位点特异或者全基因组范围的检测 [12]。目前常用的预处理方法有三类:内切酶消化法、亲和富集法和亚硫酸氢盐转化法。
内切酶消化法利用对CpG位点甲基化敏感和不敏感的同裂酶来区分位点的甲基化状态。最常用于DNA甲基化检测的同裂酶是HpaⅡ和MspⅠ,它们均识别CCGG位点,其中HpaⅡ对识别位点中CpG的甲基化敏感,只能切割CpG未甲基化的DNA,而无法切割甲基化的DNA;而MspⅠ对识别位点的CpG甲基化不敏感,无论是否存在甲基化均能切割,单独或同时使用两种酶,可以对DNA甲基化进行定量和定性分析。这一预处理方法的优点在于操作简便,成本低廉。缺点在于针对不同序列需选择不同组合的同裂酶,且并非所有的CpG位点都能被识别,同时存在酶不完全消化引起的假阳性问题。
亲和富集法主要有两种:一种是使用5mC特异的抗体,与变性后的单链DNA片段进行免疫共沉淀,以富集高度甲基化的DNA;另一种是使用重组的甲基化CpG结合结构域,用层析的方法以分离富集高度甲基化的DNA。后续通常进行核酸微阵列杂交或新一代测序分析,以获取基因组中高度甲基化的区域信息。亲和富集法提供了一种相对快速而高效的全基因组DNA甲基化检测策略。然而这一方法分辨率较低,无法确定单个CpG位点的甲基化情况;同时,该方法不能给出甲基化水平的绝对值,并受CpG位点的密度及甲基化水平影响而存在偏移。
亚硫酸氢盐转化法是使用亚硫酸氢钠对胞嘧啶(C)进行脱氨基反应,使之转化为尿嘧啶(U),而5mC抵抗这一反应。尿嘧啶在后续PCR扩增反应中被转化为胸腺嘧啶(T),这样DNA甲基化修饰的不同就被转化成了碱基序列的差异。这一方法能与大多数分子遗传检测平台兼容,结合测序可以检测每个CpG位点的甲基化状态,因而具有最高的分辨率,近年来成为主要的DNA甲基化检测方法。这一方法的缺点在于转化过程造成严重的DNA降解和损失,同时基因组中绝大多数的胞嘧啶转化为尿嘧啶/肠腺嘧啶,对于引物设计和序列比对等生物信息学过程带来了更高的要求。
DNA甲基化的氧化衍生产物,包括5hmC、5fC和5caC,其检测目前仍然不成熟。一方面,在很多组织中,这些氧化衍生产物的丰度很低,特别是5fC和5caC;另一方面,检测DNA甲基化的方法并不能很好地区分几种不同的胞嘧啶衍生物。如5hmC可以抵抗亚硫酸氢盐的脱氨基反应,因而无法与5mC区分;而5fC和5caC则可以发生脱氨基反应,与胞嘧啶无法区分。近年来出现了几种不同的化学和酶修饰方法,可以对5hmC、5fC和5caC进行单碱基分辨率的检测 [13]。
2 组蛋白修饰
2.1 组蛋白与核小体结构
组蛋白是人类及其他真核生物细胞核内的一类富含精氨酸和赖氨酸等碱性氨基酸残基的蛋白质。包括人类,大部分真核生物有5种组蛋白,即H1、H2A、H2B、H3和H4,其中H3和H4较为保守。除了最为保守的组蛋白H4以外,其他组蛋白均有不同数量的变异体。组蛋白的主要作用是与DNA结合,与其他核蛋白(被统称为非组蛋白)和少量RNA共同形成染色质结构。人类基因组具有30亿对碱基,对于一个2倍体细胞来说约有总长达2m的DNA,因而在通常情况下,基因组DNA需要维持高度折叠压缩状态,在细胞间期以染色质形式存在,而在有丝分裂或减数分裂过程中的特定阶段进一步聚缩形成染色体。染色质按其形态特征、活性状态和染色性能分为两种类型:常染色质和异染色质。前者结构较松散,折叠压缩程度低,与转录激活相关;后者结构紧密,折叠压缩程度高,与转录失活相关。
核小体是染色质的最基本单位,由DNA和组蛋白组成:H2A、H2B、H3和H4四种组蛋白各两个分子形成二聚体,再聚合形成组蛋白八聚体,约146个碱基对(bp)的DNA分子盘绕在八聚体外面近1.7圈,构成核小体的核心结构;未盘绕于八聚体的DNA与组蛋白H1结合,形成完整的核小体结构,每个核小体总计包含约200bp DNA。多个核小体形成一种“绳珠”模型。
组蛋白与DNA的紧密结合,可妨碍其他蛋白与DNA的结合,对于基因表达和DNA复制具有阻碍作用。但组蛋白中包含多个翻译后修饰位点,通过不同类型的共价修饰可以调控DNA的紧缩或松散程度,从而调控基因的表达,这就是组蛋白修饰,一类主要的表观遗传变异。目前研究较多的是核小体核心结构中4种组蛋白N端长尾的修饰。相比于DNA甲基化修饰,组蛋白修饰要复杂得多:常见的组蛋白修饰类型包括乙酰化、甲基化、磷酸化、泛素化、类泛素化、ADP核糖基化和脱氨基化等;而对于某些修饰,如甲基化,还包含单甲基化、二甲基化和三甲基化(me、me2、me3)修饰,分别携带不同的表观遗传信息。组蛋白修饰也可以通过募集其他效应蛋白调控基因的转录活性 [14]。
2.2 组蛋白乙酰化修饰
组蛋白乙酰化修饰是最早发现的组蛋白转录后修饰,指的是组蛋白N端长尾中赖氨酸残基的乙酰化修饰 [15]。这一过程由一类组蛋白乙酰化转移酶(HAT)催化,以乙酰辅酶A为乙酰基供体实现,并可以通过一类组蛋白去乙酰化酶(HDAC)逆转去除乙酰化修饰。
组蛋白乙酰化通常与转录激活和常染色质相关,这是因为乙酰化可以中和高度碱性的组蛋白所携带的正电荷,削弱组蛋白与DNA结合,从而让染色质结构变得松散,并利于转录因子的结合与基因转录。与之相反,组蛋白的去乙酰化促使基因转录沉默。近年来众多研究发现HDAC抑制剂有望应用于癌症、炎症及神经疾病的治疗。
2.3 组蛋白甲基化修饰
组蛋白上不同类型的碱性残基均可发生不同程度的甲基化修饰:赖氨酸可发生单甲基化、二甲基化和三甲基化修饰,精氨酸可发生单甲基化和二甲基化修饰,组氨酸可发生单甲基化修饰 [16]。
组蛋白的甲基化修饰是通过组蛋白甲基化转移酶来实现的。其中一些包含SET结构域的酶或Dot1类似蛋白可对赖氨酸甲基化,而一些PRMT家族蛋白可对精氨酸甲基化。反应过程中S-腺苷甲硫氨酸是甲基的供体。组蛋白甲基化修饰可在有丝分裂后被新形成的核小体结构遗传,但具体机制仍然不明。目前尚未在哺乳动物中发现组蛋白甲基化的跨代传递。组蛋白的甲基化修饰相对稳定,但并非永久的,可以被组蛋白去甲基化酶移除,主要是胺氧化酶和包含JmjC结构域的铁依赖的双加氧酶类。组蛋白甲基化转移酶和去甲基化酶具有较高的特异性,DNA序列、DNA甲基化和非编码RNA均参与甲基化转移酶和去甲基化酶对催化位点的识别。
组蛋白甲基化对于基因表达的调控作用依赖于甲基化位点和甲基化的程度,可以激活或者抑制基因的表达。整体上来说,目前功能较为明确的甲基化修饰包括:H3K4me3与激活的启动子关联,H3K4me1与增强子区域关联,H3K36me3与转录活动的延续关联,H3K27me3与多梳蛋白抑制表达关联,H3K9me3与异染色质区域关联等 [17]。组蛋白不同位点的甲基化和其他种类修饰可以协同发生或相互排斥,以完成精确的表观遗传调控过程。
目前普遍接受的调控模型认为,组蛋白甲基化通过被特异的染色质效应蛋白所识别并募集其他蛋白分子,以实现对染色质结构、基因转录活性以及可变剪接的调控。这些可以特异识别组蛋白甲基化状态的蛋白被称为组蛋白表观遗传信息的“阅读蛋白”(reader)。
2.4 组蛋白的其他修饰及多种修饰间相互作用
组蛋白磷酸化修饰是一种瞬时修饰,是指在组蛋白的丝氨酸、苏氨酸和酪氨酸残基上的磷酸化修饰,这一反应通过蛋白激酶催化并可被磷酸酶所去除。磷酸化修饰可中和组蛋白所携带的正电荷,让染色质结构变得松散。同时,组蛋白特异位点的磷酸化修饰也可以被阅读蛋白所识别,并发挥调控作用。14-3-3家族蛋白是最早发现的可识别组蛋白磷酸化的效应蛋白。组蛋白磷酸化在有丝分裂、DNA损伤修复、细胞凋亡和转录激活过程中起到重要的作用 [18]。
泛素(ubiquitin)是生物体内广泛存在的小分子蛋白。组蛋白的泛素化修饰(ub)指组蛋白的赖氨酸残基与泛素蛋白羧基末端结合的共价修饰,主要为单泛素化修饰。组蛋白H2AK119ub1与转录沉默相关,H2BK123ub1与转录激活相关。类泛素(SUMO)蛋白是一类与泛素有相似性的蛋白。组蛋白类泛素化修饰是指组蛋白的赖氨酸残基被SUMO蛋白所修饰,主要起到抑制基因转录的作用。
不同种类的组蛋白修饰具有直接和间接的相互作用:很多修饰均发生于同一赖氨酸残基上,因而可能产生相互拮抗作用,如H3K9Ac与H3K9me3;另一些修饰发生于邻近残基而干扰阅读蛋白的识别,如H3S10P干扰HP1识别H3K9me3;此外,邻近残基的修饰可能促进或抑制组蛋白修饰酶对催化位点的识别,如H3S10P有助于GCN5酶识别组蛋白H3并增强其乙酰转移酶活性;发生在不同组蛋白上修饰也存在相互作用,如H2B的泛素化对于H3K4的甲基化是必需的 [14]。组蛋白与其他表观遗传修饰也存在相互作用:H3K9me3和H3K36me3促进DNA甲基化,而H3K4的甲基化阻止DNA甲基化 [19]。
2.5 组蛋白修饰的检测方法
组蛋白修饰发生在翻译后,其检测主要基于蛋白质化学方法。组蛋白修饰的检测和分析非常复杂,需关注各种组蛋白类型和变体,不同残基上的多种组蛋白修饰,以及多种修饰水平,修饰间还存在不同的组合类型。目前对组蛋白修饰的检测主要基于质谱的方法,不仅可以对已知修饰进行定性和定量分析,而且还可以发现新的修饰位点和修饰类型。以全部蛋白质酶解产生的肽段混合物为分析对象的自下而上(bottom-up)策略,以及以完整蛋白质分子为分析对象的自上而下(top-down)策略是两种主要的研究策略,应用高效液相色谱分离技术或以纳米材料为基础的高效特异性修饰蛋白质富集法则是主要的前处理方法 [20]。
另一研究重点是组蛋白修饰在基因组上的定位,主要通过染色质免疫沉淀(ChIP)技术进行检测。这一方法是在保持组蛋白与DNA结合的状态下,用特定组蛋白修饰的特异抗体将修饰后的组蛋白-DNA复合物免疫沉淀富集。DNA片段可以通过多种分子遗传学检测方法进行检测,常用方法包括定量聚合酶链反应(qPCR)、寡核苷酸阵列以及染色质免疫沉淀测序(ChIP-Seq)等 [21]。
3 非编码RNA与RNA甲基化
3.1 非编码RNA的表观遗传功能
人类基因组中约有2/3的序列可被转录为RNA,但只有约1.5%的序列编码蛋白。不编码蛋白质序列的RNA被统称为非编码RNA(ncRNA),按长度可分为短链非编码RNA(sncRNA,≤200nt)和长链非编码RNA(lncRNA,>200nt)。非编码RNA执行多种生物学功能,如转录后调控和翻译等,也包括表观遗传变异的直接调控 [22]。
短链非编码RNA中,微RNA(miRNA)和干扰小RNA(siRNA)介导的染色质重塑与DNA甲基化现象主要在酵母与植物中发现。Piwi蛋白互作RNA被发现参与哺乳动物生殖细胞中的表观遗传调控过程:在小鼠中Piwi蛋白互作RNA可以诱导精原细胞基因组中转座因子的从头甲基化。
长链非编码RNA参与的表观遗传调控,一个被深入研究的例子是 XIST介导的雌性哺乳动物体细胞中X染色体随机失活,包括异染色质的形成以及DNA甲基化。此外,哺乳动物基因组中增强子序列被大量转录为长链非编码RNA,被称为增强子RNA(eRNA),这些RNA的表达与增强子介导的转录激活呈正相关,研究表明,eRNA参与形成或维持增强子与启动子间染色质成环结合构象,以及募集转录复合体,包括组蛋白修饰酶的组装。
3.2 RNA甲基化修饰
RNA同样存在广泛的化学修饰,主要是甲基化修饰,最常见的修饰发生在腺嘌呤碱基的第六位氮原子上,被称为m6A。这一过程需要m6A甲基转移酶复合物,包括METTL3、METTL14和WTAP等组分,以S-腺苷甲硫氨酸为甲基供体,催化m6A形成。与绝大多数表观遗传修饰一样,m6A甲基化也是可逆的,已知FTO和ALKBH5双加氧酶可催化m6A甲基化的去除,从而形成RNA m6A的动态平衡。m6A主要富集于mRNA的蛋白质编码序列、3′非翻译区(特别是miRNA靶位点及其邻近区域)、终止密码子附近、剪切位点附近及长的外显子区域。长链非编码RNA上同样存在着m6A修饰。m6A可能也是通过被阅读蛋白识别而协同发挥调控作用。这些阅读蛋白主要通过YTH结构域与甲基化的RNA相结合。m6A的功能还不完全清楚,可能包括RNA的转录、加工、转运、翻译、降解等过程,从而调控基因的正常表达 [23]。
RNA甲基化还可以发生于其他位点,包括腺嘌呤碱基的第一位氮原子甲基化(m1A)、胞嘧啶的第五位碳原子甲基化(m5C)和鸟嘌呤的第七位氮原子甲基化(m7G)等。
3.3 非编码RNA与RNA甲基化的检测
非编码RNA的检测需要将RNA反转录为DNA。近年来分子遗传学检测手段的进步,特别是新一代测序技术的出现,大大加速了非编码RNA的研究。与mRNA相比,非编码RNA特别是长链非编码RNA往往具有较低的表达水平,并可能更不稳定,因而需要特定的富集和前处理方法,在数据分析中也需要额外的关注 [24]。
m6A RNA甲基化的检测目前还是主要依赖于 m6A抗体免疫共沉淀和新一代测序技术完成,尚无可靠的单碱基分辨率的检测方法。
4 小 结
表观遗传变异的分子基础是发生在DNA、RNA和组蛋白水平上的各种表观遗传修饰。已知的表观遗传修饰都是可逆的,可以通过特定的酶建立、维持和去除修饰。表观遗传修饰对基因具有不同的调控作用,包括转录的激活和抑制、可变剪接控制、转录后调控等。尽管各种表观遗传修饰的作用机制各有不同,但往往都有某些识别特定修饰的阅读蛋白参与并募集其他效应蛋白。各种表观遗传修饰并非孤立存在,而是具有相互协同作用,共同调控染色质的结构,从而保证基因表达的精准和稳定。
第2节 正常发育过程中的表观遗传现象
1 X染色体失活
1.1 剂量补偿效应与X染色体失活
“剂量补偿效应”是在两性细胞性染色体数量存在差异的情况下,多数性连锁基因的表达水平仍能保持基本一致的生物学现象。在哺乳动物中,雌性体细胞有2条X染色体,而雄性仅1条,剂量补偿是通过X染色体失活(XCI)完成的。
1949年美国学者巴尔等发现雌猫的神经细胞间期核中有一个被染料深染的小体而雄猫却没有,被命名为“巴氏小体”。此后巴氏小体在人类女性及多种雌性哺乳动物细胞中被发现,并被证明是高度异染色质化的X染色体。1961年,英国学者莱昂提出假设:巴氏小体是失去活性的X染色体。在雌性胚胎发育早期,细胞中1条X染色体随机失活,保持仅有1条X染色体具有转录活性,称为Xa,而失活的X染色体则被称为Xi,Xi在有丝分裂后仍维持失活状态,但在生殖细胞发育过程中恢复活性 [25]。这就是X染色体失活的莱昂假说,这一假说后来进行了修正,失活的X染色体仍能表达部分基因。
1.2 X染色体失活的分子机制
X染色体失活是通过染色体上的单个X染色体失活中心(XIC)诱导发生的,XIC缺失导致X染色体失活不发生,XIC易位至常染色体可导致常染色体失活。人类XIC定位于X染色体长臂接近末端区域(Xq13),长度约为1.3Mb。1991年,研究者在这一区域中发现仅在Xi上表达的基因 XIST,表达一种长链非编码RNA。通过对小鼠中的同源基因 Xist的研究,这一基因被证明在发育早期诱导X染色体失活过程 [26]。
在胚胎干细胞和受精卵中,两条X染色体均有活性, Xist表达水平很低,无法启动X染色体失活过程。随着细胞分化的开始,一条X染色体表达 Xist上调,并顺式覆盖整条X染色体;多梳蛋白复合体(PRC)在 Xist覆盖的X染色体上富集,其中PRC1催化H2AK119ub1泛素化修饰,PRC2催化H3K27me3甲基化修饰,促使基因沉默。这一过程是可逆的和 Xist依赖的,随机发生X染色体失活的稳定过程包括组蛋白H4去乙酰化和DNA的甲基化改变:Xi上多数基因启动子区CpG岛DNA高甲基化,而基因体和基因间的甲基化水平较低。随着分化结束,体细胞中的Xi在有丝分裂中高度稳定并可维持终生,且不依赖于 Xist。发展成Xa的X染色体在分化早期停止表达 Xist,维持染色体转录活性 [27]。XIC上另外几个非编码RNA,即 Tsix、 Jpx和 Ftx,参与调控 Xist单等位基因表达模式的建立,其中 Tsix是 Xist的反义转录本,抑制Xa上 Xist基因表达,促使该基因启动子DNA高度甲基化。
X染色体失活具有严格的计数原则:每个二倍体常染色体组有1条Xa,其余均为Xi;四倍体细胞具有2条Xa;非整倍体中如有n条X染色体,则1条为Xa,n-1条为Xi。
Xi可以在特定条件下重新激活:雌性哺乳动物生殖细胞发育过程中,Xi在减数分裂发生前重新激活,形成2条Xa;其他细胞重编程过程,如诱导多能干细胞过程也可重新激活Xi。
1.3 X染色体失活逃逸与失活偏移
X染色体非整倍体可导致多种临床症状的发生。这一现象表明Xi中并非所有的基因均丧失转录活性,即Xi中的基因存在失活逃逸。人类X染色体中可能多达25%的基因发生失活逃逸,但其中部分基因存在组织差异和个体差异 [28]。有部分发生X染色体失活逃逸的基因存在Y连锁基因的同种异型基因,无论其是否定位于拟常染色体区,这些基因的拷贝数实际上不存在性别差异。其余基因缺乏Y连锁基因的同种异型基因,因而可能与性别特异的表型相关。X染色体失活逃逸基因缺乏 XIST覆盖以及与Xi相关的表观遗传修饰。
X染色体失活是随机发生的,但在人类和动物模型的不同组织中均发现某一条X染色体优先失活的情况,比例超过75%,这一现象被称为X染色体失活偏移(SXCI),可能具有组织特异性 [29]。X染色体失活偏移可分为原发性偏移和继发性偏移。原发性偏移指X染色体失活时期的非随机选择,在人类中原发性偏移发生率可能较低,因为在正常新生儿和年轻女性很少能观察到失活偏移。继发性偏移由X连锁遗传突变影响细胞的增殖或生存所导致,对于杂合子个体来说,突变染色体为Xi的细胞会显著多于Xa的细胞,从而发生失活偏移。继发性偏移与年龄相关。
2 基因组印记
2.1 基因组印记的发现
核移植研究表明单亲胚胎——包含一对卵子或精子基因组的胚胎在发育早期就会死亡,这一现象证明父源和母源基因组在胚胎发育中起到不同的作用。研究表明,某些常染色体基因也存在单个等位基因表达。另一等位基因沉默的情况,表达模式存在亲本特异性,即仅有父源或母源的等位基因能够表达,这一现象被称为基因组印记,这些亲本特异性表达的基因被称为印记基因 [30]。目前人类基因组中大约发现了80个印记基因,多数成簇存在。
2.2 基因组印记的分子机制与作用
印记基因多数成簇存在,同一基因簇上共同的印记控制区(ICR)可以控制多个印记基因的表达模式。印记控制区包含DNA差异甲基化区域(DMR),呈亲本特异性的甲基化,组蛋白H3K9甲基化共同参与ICR的调控。ICR的表观遗传调控在生殖细胞发育期间重建,并维持整个生命周期。ICR的甲基化状态并不表示该印记基因簇遵循同一表达模式,而是具有多种复杂的调控机制。如最早发现 IGF2/ H19印记基因簇中,父源等位基因ICR序列高度甲基化,抑制父本 H19基因表达;母源等位基因ICR序列低甲基化,作为绝缘子与CTCF结合,通过阻遏增强子作用抑制母本 IGF2基因表达。
印记基因的功能包括参与胚胎生长控制,其中控制胎盘的生长方面,总体上父本表达的印记基因增强胚胎生长,而母本表达的印记基因则起抑制作用。印记基因还参与出生后的生长发育、神经精神行为及肿瘤发生等。因而印记基因序列突变或ICR表观遗传异常可导致多种疾病和异常表型的发生。由于印记基因呈亲本特异性表达,其突变导致的表型不符合孟德尔遗传定律。
3 发育过程中的表观遗传重编程
在整个生命周期中,哺乳动物的基因组存在两次全基因组水平的表观遗传信息去除和重新建立的过程,即表观遗传重编程。两次重编程分别发生于植入前发育阶段以及产生新配子的原始生殖细胞阶段 [31]。
植入前发育阶段的表观遗传重编程紧随着受精过程的完成而开始,早于原核融合和细胞分裂。精子的表观基因组具有特殊性,其DNA处于高度甲基化状态,多数组蛋白被精蛋白所取代,形成更为致密的染色质结构。卵子DNA甲基化程度较低,染色质结构也较为松散。随着精子进入卵子细胞,来自精子和卵子的DNA均开始全基因组范围的去甲基化过程。这一过程包括几种不同的机制:①TET3氧化5mC,通过TDG/BER通路主动去甲基化,主要发生于来自精子的基因组;②TET3氧化5mC后通过细胞分裂时DNA复制稀释,被动去甲基化,同样发生于精子基因组;③细胞分裂依赖的DNA复制稀释,导致被动去甲基化,卵子主要通过这种方式完成去甲基化。在这一表观遗传重编程过程中,基因组印记的亲本特异的DNA甲基化修饰仍然被保留下来,除了DNMT1以外,ZFP57和TRIM28也参与对于印记位点DNA甲基化的保护作用。在桑葚胚至囊胚时期,胚胎基因组DNA甲基化达到最低水平,随后开始重新建立甲基化,人类胚胎这一过程持续至植入以后,X染色体随机失活也在这一时期被建立起来 [32]。这一阶段的组蛋白修饰仍不完全清楚,从胚胎二细胞期H3K4me3就逐步建立,较H3K27me3更早 [33]。
当胚胎植入后,随着细胞分化,表观遗传被建立起来。但在生殖细胞的发育过程中,细胞将再次经历表观遗传重编程。人类原始生殖细胞(PGC)大约在胚胎发育第二周由上胚层细胞分化而来,随后细胞在第四周开始向生殖嵴迁移,表观遗传重编程便始于这一时期。这一时期随着PGC的增殖,基因组5mC水平逐渐降低,而5hmC水平较高,DNMT被抑制而TET表达上调,但未发现TDG/BER通路有活性,表明DNA去甲基化过程主要是随着细胞增殖被动去甲基化。组蛋白修饰也在这一期间重编程,包括H3K9me2的去除和H3K27me3的建立等。在胚胎植入后失活的X染色体在这一阶段被重新激活。不同于植入前发育过程中的重编程,PGC重编程过程中,基因组印记相关表观遗传修饰也被去除了。尽管如此,PGC基因组中仍然有部分位点可能抵抗重编程过程。随着PGC迁移完成,在随后的配子发育过程中,新的表观遗传修饰被重新建立起来 [34]。
4 表观遗传的跨代传递
传统上认为只有生殖细胞的DNA序列变异能够被遗传到下一代产生表型,获得性性状无法被遗传至下一代。然而近年来研究表明,环境和生活经历因素可以在不改变生殖细胞DNA序列的情况下导致遗传性性状的改变,表观遗传修饰被认为参与这一过程 [35]。
在细胞分裂过程中,表观遗传修饰的稳定性不如DNA序列。不仅如此,多种表观遗传修饰可在环境因素的作用下发生改变。这些表观遗传修饰的变异可通过不同的机制影响其后代的表型。一种机制是通过生殖细胞的非编码RNA,如精子中较高水平的Piwi蛋白互作RNA,影响发育早期表观遗传重编程过程,从而将获得性性状传递至下一代;第二种机制是通过影响生殖细胞的基因组印记,由于植入前发育阶段的重编程不会去除基因组印记,因而改变的基因组印记可遗传至下一代;第三种机制是基因组中某些表观遗传修饰可以抵抗表观遗传重编程过程,这样获得性性状可能遗传二代及以上,这些机制仍需要更多的研究证实 [36]。
第3节 人类疾病与表观遗传异常
1 X染色体失活对X连锁疾病表型的影响
1.1 X染色体失活与X染色体非整倍体疾病
X染色体非整倍体即X染色体缺失或者增多。由于染色体数目异常,将会导致许多基因拷贝数的改变,从而表现为具有多种畸形的综合征。X染色体非整倍体导致的综合征包括:特纳综合征(X染色体单体)、克氏综合征(XXY综合征)、X染色体三体综合征(XXX综合征)。
由于X染色体失活,X染色体非整倍体的表型往往较为温和。特纳综合征是唯一能够存活至出生的单体综合征 [37]。很多克氏综合征和X染色体三体综合征患者在成年前没有明显临床症状,因生育障碍才被确诊,甚至终生未能发现 [38-39]。X染色体非整倍体的临床症状主要与X染色体上逃逸失活的基因相关。若X染色体失活发生异常,将导致X染色体非整倍体疾病更为严重的临床表型:特纳综合征患者通常智力发育正常,但某些特纳综合征患者体内较高比例细胞中包含环状X染色体[r(X)],这种异常的X染色体可能缺失 XIST基因,导致X染色体不能正常失活,并导致患者精神发育迟滞 [40]。因此,针对X染色体非整倍体的遗传咨询要关注患者的X染色体失活状况。
1.2 X染色体失活偏移与X连锁遗传疾病
X染色体上有1 000多种功能基因,很多都参与了重要生理功能。如果致病基因在X染色体上,就是X连锁遗传疾病。男性仅有1条X染色体,因而若携带致病突变,通常都导致疾病发生;但对于携带杂合突变的女性而言,X染色体失活偏移将直接影响疾病的外显率和临床症状的严重程度。
有突变的X染色体优先失活,将显著减轻X连锁显性遗传病的临床表型。如雷特综合征(Rett syndrome)[OMIM# 312750],临床症状主要表现为进行性神经系统发育障碍,患者基本为女性,多由 MECP2基因的杂合突变导致。对于 MECP2基因突变携带者,突变X染色体完全失活可导致症状不发生,但突变遗传至后代可导致疾病发生 [41]。
与之相反,正常X染色体优先失活可能导致X连锁隐性遗传病在女性杂合突变携带者发病。Duchenne肌营养不良(DMD)[OMIM# 310200]是X连锁隐性遗传病,由 DMD基因突变导致。女性杂合携带者通常没有或仅有轻微的临床表型,但其中约8%具有中度到重度的临床症状,研究表明这一现象与正常X染色体优先失活相关 [42]。
此外,X染色体失活偏移与多种疾病相关,包括肿瘤、X连锁智力障碍、孤独症、自身免疫性疾病、反复流产等 [29]。
X染色体失活偏移可能导致X连锁遗传疾病并无严格的显性/隐性遗传模式,应在遗传咨询中关注,若咨询者为杂合携带者,应综合各项因素,可对咨询者进行X染色体失活偏移检测,看失活的为哪条X染色体,是否存在染色体失活偏移现象,给出合理的遗传咨询意见与建议,指导咨询者优生优育。
2 印记基因疾病
2.1 印记基因突变与单亲二倍体
印记基因的正常表达模式对于正常的生长发育是必需的,其异常往往会影响胚胎发育并导致神经、发育和代谢等多种疾病的发生。遗传因素是印记基因疾病的主要致病原因之一,印记基因突变和单亲二倍体(UPD)是主要的致病因素。
印记基因的点突变和缺失突变均可造成疾病发生,在遗传咨询中需要关注的是印记基因突变所导致的疾病不符合孟德尔遗传定律,这是因为印记基因的单基因表达模式造成分离和自由组合定律失效。印记基因突变的遗传模式如图1-3-1所示。常见印记基因突变导致的疾病包括:①普拉德-威利综合征(PWS)[OMIM#176270],70%~80%的病例由父源15q11-q13缺失导致;②安格尔曼综合征(AS)[OMIM# 105830],约70%患者为母源15q11-q13缺失,25%为母源 UBE3A基因突变;③假性甲状旁腺功能减退症(PHP)[OMIM# 103580],多为母源 GNAS基因突变导致。
UPD是指同源染色体或片段来自父母中的同一个个体 [43]。UPD可分为由单亲纯合染色体组成的同二体型和单亲杂合染色体构成的异二体型。UPD的发生机制包括减数分裂Ⅰ期或Ⅱ期发生错误、合子后重组突变等。其中片段型UPD可由合子后父母源体细胞重组及数目和/或结构型染色体畸变形成;而整体型UPD可由配子互补(GC)、三体补救(TR)、单体救援(MR)、罗伯逊易位或其他易位以及等臂染色体的产生、缺失和重复等机制形成 [44]。由于父母配子的基因组印记在原始生殖细胞发育过程中已建立,UPD将导致印记基因表达模式的异常,包括不表达或双等位基因表达,导致发育异常和疾病发生。UPD可能导致的印记基因疾病如表1-3-1所示。遗传咨询中需考虑这些疾病进行针对性检测以发现UPD。UPD检测方法包括针对染色体结构异常的细胞生物学方法,以及检测序列多态性的杂合缺失。
2.2 印记控制区表观遗传异常与胚胎生长发育异常
印记基因的正常表达模式依赖于印记控制区(ICR)的表观遗传修饰调控,表观遗传异常将导致印记基因亲源等位基因表达不平衡,从而影响胚胎生长发育过程 [30,45]。印记控制区表观遗传异常最为典型的为贝-维综合征和拉塞尔-西尔弗综合征,这两种疾病半数以上的患者不存在DNA序列变异,将在此节重点阐述。辅助生殖会导致此类异常发病率上升。如辅助生殖受孕的胎儿患贝-维综合征的频率比正常受孕的胎儿高出4~9倍,而基因印记异常可能是造成辅助生殖较高流产率的因素 [46]。
图1-3-1 印记基因突变的遗传模式
A.父源表达的印记基因,父亲传至子代的等位基因突变导致疾病发生,母亲传至子代的等位基因突变为携带者;B.母源表达的印记基因,母亲传至子代的等位基因突变导致疾病发生,父亲传至子代的等位基因突变为携带者。
表1-3-1 单亲二倍体相关综合征
注:UPD为单亲二倍体,?为有争议或者不确定,—表示无此项。
2.2.1 贝-维(Beckwith-Wiedemann)综合征
2.2.1.1 疾病概述
贝-维综合征(BWS)[OMIM# 130650]又称脐疝 -巨舌-巨大发育综合征,为最普遍的小儿生长过度综合征 [47]。发病率为 1/13 700~1/10 000,位于新生儿早期死亡病因的第3位,仅次于先天畸形和早产。BWS病因为11p15.5印记基因簇异常,包括:①11p15.5印记控制区(ICR) IC1、 IC2的表观遗传修饰异常,在60%患儿中发现,包括 IC1父源印记区母源等位基因过甲基化而导致 IGF2基因的双拷贝表达和 H19不表达,或 IC2母源印记缺失导致 KCNQ1QT1双拷贝表达;②父源UPD造成的父源表达印记基因过表达,在20%患儿中发现;③染色体缺失和倒位(10%)以及 CDKN1C基因突变(10%)也是BWS的致病机制之一。
2.2.1.2 主要临床症状
BWS的常见临床表现如下:
①生长:宫内生长过度、身体单侧肥大及皮下组织丰满等;②头及面容:巨舌、突眼、面中部发育不良、耳皱褶及切迹等;③腹部和内脏:腹壁缺损、内脏(心、肝、脾、胰、肾、肾上腺等)肥大、肾脏髓质发育不良等;④代谢及其他:新生儿低血糖、鲜红斑痣、胚胎类肿瘤、胎盘增大、脐带过长、羊水过多、骨龄提前等。
BWS患儿基因型与其遗传病因有一定的相关性,如 H19、 IC1高甲基化和父源UPD嵌合体的BWS患儿,其肾母细胞瘤和肝母细胞瘤发生率明显高于其他基因变异; CDKN1C[MIM 600856]和 IC2基因变异则易导致患儿腹壁缺损; IC1/ IC2基因变异和父源UPD嵌合体基因变异与偏身肥大有关等。
2.2.1.3 诊断与鉴别诊断
由于BWS的罕见性及妊娠早期特征不明显,临床诊断现未形成统一的标准。有学者建议具备主要标准中两个(腹壁缺损、巨舌、巨大儿)或一个主要标准加两个次要标准(巨肾或肾脏畸形、肾上腺细胞肥大、基因或染色体异常、羊水过多等)可诊断。但目前还未能达成一致意见。BWS需与其他具有过度生长表现的疾病相鉴别,详见表1-3-2。
表1-3-2 BWS与其他生长过度疾病的鉴别诊断
2.2.1.4 遗传咨询
大多数BWS患儿并无患此病的父母,遗传咨询应根据发病情况的不同区别对待:①阴性家族史(约占85%),染色体核型正常的BWS患儿,如基因检测提示 IC2低甲基化或 IC1高甲基化且无基因序列异常,或染色体11p15区域父源UPD,其同胞和子代患BWS的风险较低。如患儿父母一方为 CDKN1C基因变异,父亲变异则其同胞和子代患BWS的风险<50%,母亲变异则在50%左右。②阳性家族史(10%~15%),染色体核型正常的BWS患儿,父亲基因变异则其同胞及子代患BWS的风险<50%,母亲基因变异则在50%左右。③单卵双生双胞胎(约占1%)如果出现BWS,其同胞和子代患BWS的风险较低。
2.2.2 拉塞尔-西尔弗(Russell-Silver)综合征
2.2.2.1 疾病概述
拉塞尔-西尔弗综合征(RSS)[OMIM# 180860]又称不对称身材-矮小-性发育异常综合征,约50%患儿都有轻微发育延迟。RSS的发病率在西方国家为1/10 000~1/3 000,国内尚无统计。RSS病因 [48]包括:①11p15.5印记控制区(ICR)的表观遗传修饰异常,在50%以上患儿中发现,主要是 IC1父源印记缺失导致 H19双拷贝表达和 IGF2基因不表达;②7号染色体母源UPD(mUPD7),导致母源表达基因过度表达和父源表达基因缺失;③ GRB10基因突变。
2.2.2.2 主要临床症状
RSS患儿以宫内生长受限和出生后生长缺陷为特征,出生体重/身长低于平均值的2个标准差;患儿一般成比例的矮小,头围正常,第5根手指弯曲变形;基本带有巨颅、三角脸、前额突出、口角下斜(鲨鱼嘴)、耳位低下、下颌畸形的特殊面容;由于偏侧生长不足造成四肢长度不对称;部分患儿具有喂养困难、多汗、低血糖、认知迟缓、语言障碍、先天畸形、肌阵挛-肌张力障碍等症状。
2.2.2.3 诊断与鉴别诊断
主要诊断标准为:①宫内发育迟缓,低于胎龄第10个百分位数;②出生后体重/身高比例低于第3个百分位数;③正常头围;④肢体、躯干和/或面部不对称。次要诊断标准为:①上肢短但比例正常;②小指弯曲;③三角脸;④前额突出。辅助标准包括:①咖啡牛奶色素斑或皮肤色素变化;②泌尿生殖道异常(隐睾,尿道下裂);③运动、语言和/或认知迟缓;④喂食异常;⑤低血糖。如果符合主要诊断标准其中3项,或2项主要诊断标准及2项次要诊断标准,结合基因检测,即可作出诊断。
任何病因引起的宫内生长发育迟缓和短身材的现象都应与RSS相鉴别,如3-M综合征、范科尼贫血、Nijmegen综合征和布卢姆综合征等。3-M综合征与RSS均具有生长迟缓和部分相似的特殊面容(巨颅、前额突出)。但3-M综合征终身高低于平均值的5~6个标准差;特殊面容还包括下巴突出、肉质朝天鼻和中脸发育不全等;具有多处影像学检查异常包括骨骼细长、肋骨偏薄、椎体高、隐性脊柱裂、小骨盆、小髂翼和骨龄延迟等。此外3-M综合征为常染色体隐性遗传病,致病基因为 CUL7。范科尼贫血、Nijmegen综合征和布卢姆综合征都具有生长发育缓慢和短小的特征,但这几种疾病所具有的小头、皮肤对阳光敏感及四肢畸形可与RSS相区别。
2.2.2.4 遗传咨询
RSS有多种病因,异常方式主要有三种,即母源UPD(mUPD7)、常染色体显性遗传和常染色体隐性遗传。需对先证者和父母进行遗传学检测,明确病因后根据遗传方式进行相应的遗传咨询。
3 重复序列扩展疾病与表观遗传异常
3.1 基因非编码区的重复序列扩展相关疾病的表观遗传异常
基因非编码区的重复序列扩展可导致表观遗传异常和基因表达沉默。以脆性X综合征(FXS)[OMIM#300624] [49]为例,该疾病是一种X连锁不完全显性遗传的神经发育性疾病。由脆性X智力低下基因1( FMR1)的5′非翻译区的(CGG)n重复序列扩展导致。(CGG)n重复序列长度具有多态性,正常人群(CGG)n重复次数在5~50之间,n在50~200间被称为前突变,大于200称为全突变。(CGG)n全突变个体在发育早期会表达携带(CGG)n全突变的mRNA,这种异常的mRNA可以与基因启动子区DNA相结合,阻止基因转录,随即启动表观遗传沉默机制,组蛋白去乙酰化和H3K9me3修饰,最终全突变(CGG)n自身及上游250bp的CpG岛高度甲基化稳定了基因的沉默状态,是导致FXS的分子机制 [50]。
FXS的临床症状具有多样性,与(CGG)n重复序列及上游CpG岛的甲基化状态具有相关性。对于男性全突变携带者,几乎均发展成FXS,但也有极少数未发生异常甲基化、表型极为轻微的报道。对于女性全突变携带者,由于X染色体失活的存在,仅有约半数发展成FXS,X染色体失活偏移与疾病的发生及临床症状严重程度存在相关性。
男性前突变携带者中未观察到(CGG)n重复序列及上游CpG岛的甲基化异常,但部分老年男性前突变携带者出现震颤/共济失调综合征(tremor/ataxia syndrome),一种神经退行性疾病,研究发现前突变携带者具有较高的 FMR1 mRNA水平和较低的蛋白表达水平,表明转录后调控参与其中。约有1/3的女性前突变携带者发生卵巢功能早衰现象。近年来有研究表明前突变携带者的临床症状与(CGG)n下游两个DNA差异甲基化区域(DMR)的甲基化水平相关。
1型强直性肌营养不良(DM1)[OMIM# 160900]是一组以肌无力、肌强直和肌萎缩为特点的常染色体显性遗传病 [51]。除骨骼肌受累外,还常伴有白内障等多系统受累表现。该病是由 MDRK基因[MIM 605377]的3′UTR区域CTG重复序列扩增引起的。正常人有5~38个CTG重复序列,DM1患者的CTG重复序列常超过100,甚至上千,重复扩增数越多,病情越严重。CTG重复序列是 MDRK基因座中的绝缘子的组成成分之一,该绝缘子与CTCF结合才得以发挥其功能。CTCF与DNA的结合是甲基化敏感的,正常情况下,绝缘子处于去甲基化状态,与CTCF结合形成染色质绝缘子,抑制了 MDRK基因座所转录的反义RNA而保护了常染色质区域。由于DM1患者CTG重复扩增使CTCF相对剂量不足,CpG中CTCF结合位点发生甲基化并进一步拮抗CTCF位点结合,从而失去绝缘子功能,从 MDRK基因座所转录的反义RNA诱发RNA介导的基因沉默,导致该区域的常染色质向异染色质转变 [52]。
3.2 基因编码区的重复序列扩展相关疾病的表观遗传异常
发生在基因编码区的核苷酸重复序列扩展同样导致疾病发生。多聚谷氨酰胺障碍(polyglutamine disorder)就是由基因编码区的三核苷酸的串联重复导致编码蛋白中包含多个连续的谷氨酰胺残基(poly Q),这种蛋白质序列异常可影响蛋白质间相互作用。多个基因中发生的多聚谷氨酰胺障碍与神经退行性疾病相关 [53]。
亨廷顿病(HD)[OMIM# 143100]是一种由于 HTT基因编码区CAG三核苷酸重复序列异常扩增引起的神经退行性疾病,是一种常见的多聚谷氨酰胺障碍 [54]。疾病主要表现为中年发病,运动、认知和精神障碍进行性加重,临床症状为舞蹈样不自主运动及进行性认知障碍,直至痴呆。通常, HTT基因中CAG重复次数为11~34,HD患者重复次数明显增加(一般大于40),CAG重复扩增越多,发病越早。突变 HTT基因编码含poly Q的HTT蛋白,改变其与REST/NRSF复合体及CBP蛋白的结合。
REST/NRSF是一种与NRSEs元件相结合的转录因子,在神经元内发挥重要功能。REST/NRSF与组蛋白去甲基化酶(SMCX)、组蛋白去乙酰化酶(HDAC1和HDAC2)、组蛋白甲基转移酶(G9a)、染色体重塑因子SWI/SNF存在相互作用,故REST/NRSF的功能在突变型HTT作用下发生改变,随即通过上述因子介导表观遗传的相应改变。CBP作为一种组蛋白乙酰转移酶和转录共激活因子,在CREB介导的转录活动中具有重要作用。突变型HTT的多聚谷氨酰胺肽段可直接结合到CBP和p300/CEB相关因子(P/CAF)的组蛋白乙酰转移酶结构域,从而干扰两者对组蛋白的乙酰化修饰。HD患者在发病初期,体内观察到广泛的基因表达下调,可能与组蛋白的乙酰化修饰异常相关,动物模型研究表明,组蛋白去乙酰化酶抑制剂可能是潜在的治疗药物。
第4节 表观遗传信息协助遗传检测和遗传咨询
表观遗传变异检测为遗传检测和遗传咨询提供额外的参考信息,有助于增加检测准确性,提高遗传咨询质量。目前研究最多的是DNA甲基化以及小分子RNA表达在临床诊断中的应用,而组蛋白修饰由于其不稳定及高度动态变化的特点,在临床诊断中的应用面对更多的技术挑战 [55-56]。
1 表观遗传信息辅助遗传检测
1.1 表观遗传信息辅助疾病诊断
在X染色体疾病中往往存在异常的X染色体失活,因而对X染色体失活特异的表观遗传修饰进行检测可用于对X染色体疾病的检测。在失活X染色体(Xi)上,失活目标基因的启动子区处于高甲基化状态,而活化的X染色体(Xa)上相应基因的启动子区则处于低甲基化状态。对相关区域DNA甲基化状态的定量分析,可以获取细胞中X染色体的定量信息。已有几项研究通过检测X染色体失活特异的差异甲基化区域(DMR)检测X染色体非整倍体疾病。
对X染色体失活偏移的检测有助于发现X连锁基因突变在女性携带者中的表型差异性。此外X染色体失活偏移提示多种疾病风险。检测X染色体失活偏移主要是利用女性体细胞的X染色体失活嵌合性和基因多态性进行的,失活染色体可通过甲基化鉴定,父源和母源X染色体(Xp/Xm)通过基因多态性显示。目前应用最广的位点是人雄激素受体基因第一外显子GAG短串联重复序列(STR)。在(CAG)n STR上游约100bp处有一组甲基化敏感的酶切位点,其中包括hpaⅡ酶切位点,当雄激素受体基因有STR长度多态性时,基因组DNA经hpaⅡ消化后PCR扩增失活X染色体的DNA片段,通过变性聚丙烯酰胺凝胶电泳可以显示出长度不同的父本及母本等位基因的两种产物,两者的强度反映了带有失活Xp和失活Xm的体细胞的相对比例 [57]。
检测印记控制区(ICR)的DNA甲基化状态有助于诊断印记基因疾病,正常情况下,ICR在一个等位基因上高度甲基化,而在另一等位基因上低甲基化,甲基化水平接近50%。对染色体微缺失、UPD和单纯ICR表观修饰异常导致的印记基因疾病,相应ICR的DNA甲基化水平将显著上升或下降。
基因非编码区的重复序列扩展导致的疾病,往往在扩增的重复序列区域附近的CpG岛存在异常的甲基化状况。不仅包括前文所述的FXS与DM1,其他如 C9orf72基因重复序列扩展导致的肌萎缩性侧索硬化症患者中也发现上游CpG岛的异常甲基化 [58]。异常的DNA甲基化水平与重复扩展的数量和临床表型均具有正相关性,异常mRNA介导的基因沉默可能是普遍机制。
肿瘤发生发展伴随DNA甲基化的异常,导致基因表达遗传。抑癌基因的高甲基化会导致其表达降低,而癌基因的低甲基化或促进其表达,例如 P16在不同类型肿瘤中以9%~49%的频率被甲基化, BRCA1在散发型乳腺癌和卵巢癌中以10%~20%频率被甲基化 [59]。
1.2 表观遗传信息用于多组织混合样品检测
因为DNA甲基化较为稳定,目前有研究报道显示,可以根据DNA甲基化判断样品中DNA的组织来源,尤其是血液或其他体液中游离DNA的组织来源,例如低甲基化 SERPINB5[serpin peptidase inhibitor,clade B(ovalbumin),member 5]已经作为母血中胎儿游离DNA的标志物 [60]。最近已有研究表明根据DNA甲基化鉴定其组织来源的可行性,并将其命名为血浆DNA组织绘图(plasma DNA tissue mapping),作者筛选了 5 800个甲基化标记,这些甲基化标记可分为两大类:Ⅰ型为一种组织中甲基化修饰完全不同于其他组织的位点;Ⅱ型为在不同组织中甲基化密度不同的位点。根据这些甲基化标志位点可有效区分DNA的组织来源 [61]。另外,还有报道称通过检测4~9个组织特异甲基化位点的DNA甲基化,也可以判断血浆 DNA 的组织来源 [62]。Guo等 [63]报道根据147 888个CpG位点的甲基化可以判断肺癌、结直肠癌的恶性以及组织来源;Shuli Kang等建立了命名为CancerLocator的统计方法,通过分析血液中游离DNA的甲基化可以判断有无患癌,并且可根据DNA甲基化谱判断游离DNA的组织来源。目前,根据表观遗传信息判断DNA组织来源多处于研究阶段,还没有真正应用于临床诊断的报道,但已经显示出了其在肿瘤游离DNA及母血胎儿游离DNA检测中的价值。
2 表观遗传信息对疾病进行分子分型
在疾病的诊断及治疗中,疾病类型的详细信息及种类划分将起到极为重要的作用。传统医学中,一般通过疾病的临床表现及病理学检测对疾病的类型进行划分,近些年来由于靶向治疗及精准医疗的兴起,对临床疾病的分类提出了更为细致和准确的要求。而疾病的分子分型则主要是通过对患者的病灶或体液中的分子变化进行分类,主要包括蛋白表达、DNA序列变化、基因表达变化、表观遗传信息改变等分子水平的检测。目前根据表观遗传信息对疾病进行分子分型的研究同样多集中于肿瘤研究领域,基于DNA甲基化和小分子RNA表达可对乳腺癌 [64]、肺癌 [65]、胃癌 [66]、肝癌 [67]、中枢神经系统肿瘤 [68]等进行精确的分子分类。
骨髓增生异常综合征(MDS)是一大类由于骨髓发育不良而导致的外周血细胞形成受阻的疾病,研究表明5q31-q32的缺失是导致该疾病的主要原因,但该区域基因的异常高甲基化同样也会导致该疾病,所以临床上也建议根据致病原因的不同对该疾病进行分类 [69]。
目前,根据表观遗传学对疾病进行分子分类的研究多处于研究阶段,而在临床中的应用还需要从可操作性、花费、稳定性方面对其进行进一步的优化。
结 语
人类表观基因组计划(HEP)和美国国立卫生研究院(NIH)表观基因组路线图计划通过大规模的检测,为表观遗传学和表观基因组学的进一步发展提供了可能。表观遗传学信息提供了何时、何地、以何种方式去执行DNA遗传信息的指令,对基因表达、调控、遗传有重要作用。表观遗传研究的兴起使得对疾病的研究从对基因的探索演绎为对形成表型的过程和机制的探索。表观遗传变异与DNA变异不同之处在于大部分表观遗传变异是可逆的,这就为疾病的治疗提供了乐观的前景。虽然表观遗传学研究已经取得一定进展,但更多详细内容和机制,尤其是与疾病表型的关系还有待深入研究。相信通过对表观遗传学进行系统而深入的研究,将在疾病的预防、诊断和治疗方面发挥不可估量的作用。任何一种表观遗传病均有相应的靶基因发生变化,或表达过高,或表达过低,甚至沉默。表观遗传病临床表型具有一定的异质性,易于漏诊,如果早期确诊,部分表观遗传病可以通过临床干预而缓解,所以针对表观遗传疾病的遗传咨询就尤为重要,希望通过本章内容的学习使读者对该方面的内容有所了解,对临床工作的开展有所帮助。
(马端 赵欣之 马竞 张进 肖德勇 杜司晨 夏文君 郝丽丽 陈庆 黄建波)
参考文献
[1] BERGER S L,KOUZARIDES T,SHIEKHATTAR R,et al.An operational definition of epigenetics.Genes Dev,2009,23(7):781-783.
[2] RUSSO V E A,MARTIENSSEN R A,RIGGS A D.Epigenetic mechanisms of gene regulation.New York:Cold Spring Harbor Laboratory Press,1996,425-437.
[3] BERNSTEIN B E,STAMATOYANNOPOULOS J A,COSTELLO J F,et al.The NIH roadmap epigenomics mapping consortium.Nat Biotechnol,2010,28(10):1045-1048.
[4] SMITH Z D,MEISSNER A.DNA methylation:roles in mammalian development.Nat Rev Genet,2013,14(3):204-220.
[5] BESTOR T H.The DNA methyltransferases of mammals.Hum Mol Genet,2000,9(16):2395-2402.
[6] LANDER E S,LINTON L M,BIRREN B,et al.Initial sequencing and analysis of the human genome.Nature,2001,409(6822):860-921.
[7] LISTER R,PELIZZOLA M,DOWEN R H,et al.Human DNA methylomes at base resolution show widespread epigenomic differences.Nature,2009,462(7271):315-322.
[8] SCHÜBELER D.Function and information content of DNA methylation.Nature,2015,517(7534):321-326.
[9] TIRADO-MAGALLANES R,REBBANI K,LIM R,et al.Whole genome DNA methylation:beyond genes silencing.Oncotarget,2017,8(3):5629-5637.
[10] RASMUSSEN K D,HELIN K.Role of TET enzymes in DNA methylation,development,and cancer.Genes Dev,2016,30(7):733-750.
[11] WU H,ZHANG Y.Reversing DNA methylation:mechanisms,genomics,and biological functions.Cell,2014,156(1-2):45-68.
[12] LAIRD P W.Principles and challenges of genomewide DNA methylation analysis.Nat Rev Genet,2010,11(3):191-203.
[13] WU H,ZHANG Y.Charting oxidized methylcytosines at base resolution.Nat Struct Mol Biol,2015,22(9):656.
[14] KOUZARIDES T.Chromatin modifications and their function.Cell,2007,128(4):693-705.
[15] GRUNSTEIN M.Histone acetylation in chromatin structure and transcription.Nature,1997,389(6649):349-352.
[16] GREER E L,SHI Y.Histone methylation:a dynamic mark in health,disease and inheritance.Nat Rev Genet,2012,13(5):343-357.
[17] KUNDAJE A,MEULEMAN W,ERNST J,et al.Integrative analysis of 111 reference human epigenomes.Nature,2015,518(7539):317-330.
[18] SAWICKA A,SEISER C.Sensing core histone phosphorylationa matter of perfect timing.Biochim Biophys Acta,2014,1839(8):711-718.
[19] DU J,JOHNSON L M,JACOBSEN S E,et al.DNA methylation pathways and their crosstalk with histone methylation.Nat Rev Mol Cell Bio,2015,16(9):519-532.
[20] NOBERINI R,SIGISMONDO G,BONALDI T.The contribution of mass spectrometry-based proteomics to understanding epigenetics.Epigenomics,2016,8(3):429-445.
[21] COLLAS P.The current state of chromatin immunoprecipitation.Mol Biotechnol,2010,45(1):87-100.
[22] HOLOCH D,MOAZED D.RNA-mediated epigenetic regulation of gene expression.Nat Rev Genet,2015,16(2):71-84.
[23] MEYER K D,JAFFREY S R.The dynamic epitranscriptome:N6-methyladenosine and gene expression control.Nat Rev Mol Cell Biol,2014,15(5):313-326.
[24] KUKURBA K R,MONTGOMERY S B.RNA Sequencing and Analysis.Cold Spring Harbor Protocols,2015,2015(11):951.
[25] LYON M F.Gene action in the X-chromosome of the mouse(Mus musculus L.).Nature,1961,190 :372-373.
[26] PENNY G D,KAY G F,SHEARDOWN S A,et al.Requirement for Xist in X chromosome inactivation.Nature,1996,379(6561):131-137.
[27] WUTZ A.Gene silencing in X-chromosome inactivation:advances in understanding facultative heterochromatin formation.Nat Rev Genet,2011,12(8):542-553.
[28] CARREL L,WILLARD H F.X-inactivation profile reveals extensive variability in X-linked gene expression in females.Nature,2005,434(7031):400-404.
[29] MINKS J,ROBINSON W P,BROWN C J.A skewed view of X chromosome inactivation.J Clin Invest,2008,118(1):20-23.
[30] PETERS J.The role of genomic imprinting in biology and disease:an expanding view.Nat Rev Genet,2014,15(8):517-530.
[31] FENG S,JACOBSEN S E,REIK W.Epigenetic reprogramming in plant and animal development.Science,2010,330(6004):622-627.
[32] SMITH Z D,CHAN M M,HUMM K C,et al.DNA methylation dynamics of the human preimplantation embryo.Nature,2014,511(7511):611-615.
[33] LIU X,WANG C,LIU W,et al.Distinct features of H3K4me3 and H3K27me3 chromatin domains in pre-implantation embryos.Nature,2016,537(7621):558-562.
[34] TANG W W,DIETMANN S,IRIE N,et al.A Unique Gene Regulatory Network Resets the Human Germline Epigenome for Development.Cell,2015,161(6):1453-1467.
[35] HEARD E,MARTIENSSEN R A.Transgenerational epigenetic inheritance:myths and mechanisms.Cell,2014,157(1):95-109.
[36] BOHACEK J,MANSUY I M.Molecular insights into transgenerational non-genetic inheritance of acquired behaviours.Nat Rev Genet,2015,16(11):641-652.
[37] RANKE M B,SAENGER P.Turner’s syndrome.Lancet,2001,358(9278):309-314.
[38] RADICIONI A F,DE MARCO E,GIANFRILLI D,et al.Strategies and advantages of early diagnosis in Klinefelter’s syndrome.Mol Hum Reprod,2010,16(6):434-440.
[39] OTTER M,SCHRANDER-STUMPEL C T,CURFS L M.Triple X syndrome:a review of the literature.Eur J Hum Genet,2010,18(3):265-271.
[40] MATSUO M,MUROYA K,ADACHI M,et al.Clinical and molecular studies in 15 females with ring X chromosomes:implications for r(X)formation and mental development.Hum Genet,2000,107(5):433-439.
[41] VILLARD L,KPEBE A,CARDOSO C,et al.Two affected boys in a Rett syndrome family:clinical and molecular fi ndings.Neurology,2000,55(8):1188-1193.
[42] RICHARDS C S,WATKINS S C,HOFFMAN E P,et al.Skewed X inactivation in a female MZ twin results in Duchenne muscular dystrophy.Am J Hum Genet,1990,46(4):672-681.
[43] Preece M A,Moore G E.Genomic imprinting,uniparental disomy and foetal growth.Trends Endocrinol Metab,2000,11(7):270-275.
[44] DAWSON A J,CHERNOS J,MCGOWAN-JORDAN J,et al.CCMG guidelines:prenatal and postnatal diagnostic testing for uniparental disomy.Clin Genet,2011,79(2):118-124.
[45] ISHIDA M,MOORE G E.The role of imprinted genes in humans.Mol Aspects Med,2013,34(4):826-840.
[46] DEBAUN M R,NIEMITZ E L,FEINBERG A P.Association of in vitro fertilization with Beckwith-Wiedemann syndrome and epigenetic alterations of LIT1 and H19.Am J Hum Genet,2003,72(1):156-160.
[47] MUSSA A,RUSSO S,LARIZZA L,et al.(Epi)genotype-phenotype correlations in Beckwith-Wiedemann syndrome:a paradigm for genomic medicine.Clin Genet,2016,89(4):403-415.
[48] ABU-AMERO S,MONK D,FROST J,et al.The genetic aetiology of Silver-Russell syndrome.J Med Genet,2008,45(4):193-199.
[49] JACQUEMONT S,HAGERMAN R J,HAGERMAN P J,et al.Fragile-X syndrome and fragile X-associated tremor/ataxia syndrome:two faces of FMR1.Lancet Neurol,2007,6(1):45-55.
[50] COLAK D,ZANINOVIC N,COHEN M S,et al.Promoter-bound trinucleotide repeat mRNA drives epigenetic silencing in fragile X syndrome.Science,2014,343(6174):1002-1005.
[51] LONGMAN C.Myotonic Dystrophy.J R Coll Physicians Edinb,2006,36(1):51-55.
[52] CHO D H,THIENES C P,MAHONEY S E,et al.Antisense transcription and heterochromatin at the DM1 CTG repeats are constrained by CTCF.Mol Cell,2005,20(3):483-489.
[53] HE F,TODD P K.Epigenetics in nucleotide repeat expansion disorders.Semin Neurol,2011,31(5):470-483.
[54] WALKER F O.Huntington’s Disease.Lancet,2007,369(9557):218.
[55] BERDASCO M,ESTELLER M.Aberrant epigenetic landscape in cancer:how cellular identity goes awry.Dev Cell,2010,19(5):698.
[56] ZOGHBI H Y,BEAUDET A L.Epigenetics and human disease.Cold Spring Harb Perspect Biol,2016,8(2):a019497.
[57] BOLDUC V,CHAGNON P,PROVOST S,et al.No evidence that skewing of X chromosome inactivation patterns is transmitted to offspring in humans.J Clin Invest,2008,118(1):333-341.
[58] XI Z,ZINMAN L,MORENO D,et al.Hypermethylation of the CpG island near the G4C2 repeat in ALS with a C9orf72 expansion.Am J Hum Genet,2013,92(6):981-989.
[59] ESTELLER M,CORN P G,BAYLIN S B,et al.A gene hypermethylation profile of human cancer.Cancer Res,2001,61(8):3225-3229.
[60] LO Y M,LAM W K.Tracing the tissue of origin of plasma DNAfeasibility and implications.Ann Ny Acad Sci,2016,1376(1):14-17.
[61] SUN K,JIANG P,CHAN K C,et al.Plasma DNA tissue mapping by genome-wide methylation sequencing for noninvasive prenatal,cancer,and transplantation assessments.Proc Natl Acad Sci USA,2015,112(40):E5503-E5512.
[62] LEHMANN-WERMAN R,NEIMAN D,ZEMMOUR H,et al.Identification of tissue-specific cell death using methylation patterns of circulating DNA.Proc Natl Acad Sci USA,2016,113(13):E1826-E1834.
[63] GUO S,DIEP D,PLONGTHONGKUM N,et al.Identification of methylation haplotype blocks aids in deconvolution of heterogeneous tissue samples and tumor tissue-of-origin mapping from plasma DNA.Nat Genet,2017,49(4):635-642.
[64] HENG Y J,LESTER S C,TSE G M,et al.The molecular basis of breast cancer pathological phenotypes.J Pathol,2017,241(3):375-391.
[65] SUZUKI M,YOSHINO I.Aberrant methylation in non-small cell lung cancer.Surg Today,2010,40(7):602-607.
[66] SUI W,SHI Z,XUE W,et al.Circular RNA and gene expression profiles in gastric cancer based on microarray chip technology.Oncol Rep,2017,37(3):1804-1814.
[67] GRAMANTIERI L,FORNARI F,CALLEGARI E,et al.MicroRNA involvement in hepatocellular carcinoma.J Cell Mol Med,2008,12(6A):2189-2204.
[68] CHEN R,SMITH-COHN M,COHEN A L,et al.Glioma subclassifications and their clinical significance.Neurotherapeutics,2017,14(2):284-297.
[69] TORMO M,MARUGAN I,CALABUIG M.Myelodysplastic syndrome:an update on molecular pathology.Clin Transl Oncol,2010,12(10):652-661.