上QQ阅读APP看书,第一时间看更新
第5章 非小细胞肺癌驱动基因的研究进展
第1节 非小细胞肺癌驱动基因概述
一、肿瘤驱动基因的概念
癌症的发生与生物、物理、化学等多重因素相关,但这些因素最终都是与机体的细胞相互作用,引发细胞内遗传物质DNA发生变异或修饰,逐步导致细胞的生长特征发生改变,出现不受组织内调节因素的控制而呈现恶性生长转化。因为肿瘤的发生终究与细胞内部的遗传物质变化相关,现代肿瘤学将癌症称为DNA疾病。随着基因组学技术的发展,在过去十余年中,基因组测序不仅获得了常见形式癌症的基因组概貌,还逐步深入发现了一系列与临床诊治相关的重要基因变异。
癌症驱动基因(cancer driver gene)概念的提出也是近代分子遗传学、基因组学和实验肿瘤学结合而出现的产物。Vogelstein等在研究肿瘤发生的多阶段、多因素的过程中,想知道对于特定的癌症类型,究竟需要多少个基因的变异引发细胞的恶性转化而成为肿瘤细胞。答案是只要少数基因突变后就可以引发肿瘤的发生,以“正常结肠上皮→小的腺瘤样病变( APC基因突变)→大的腺瘤( K- Ras突变)→肠腺癌(TGFβ或PI3K或细胞周期凋亡、通路改变)”的结肠癌发生模型为例,在每一个疾病阶段都会有 APC、 K- Ras、 PI3K等基因的改变,很显然这些少数基因及其突变就是驱动正常细胞恶性转化成为癌细胞的原因。
究竟怎样定义驱动基因呢?人类基因组计划完成后估计我们人类的功能基因数量约在3万左右,其中与癌症相关的基因约有数百个。癌症驱动基因的提出是针对发生突变等变异的基因特征来说的。目前认为,能够赋予细胞选择性生长优势的基因称为“驱动基因(driver gene)”,其携带基因的各类变异(序列突变、拷贝数扩增、缺失、结构重排等)被称为“驱动基因变异(driver mutation/alteration)”。相对而言,发生变异但没有赋予细胞生长优势或增殖能力的基因被称为“乘客基因(passenger gene)”,其携带的变异被称为“乘客变异(passenger mutation/alteration)”或“伴随变异(accompany mutation/alteration)”。这种有趣的分类是将肿瘤比喻为一辆开向万劫不复之灾的车辆,肿瘤中真正与细胞恶性转化生长或进展相关的变异基因好像是车上提供动力的肇事司机(driver),而伴随的基因变异并不提供生长动力,就像是车上的无辜乘客(passenger)。而这些乘客或许个别的也具有驾驶能力(驱动癌细胞生长转移或逃逸免疫能力),或部分乘客经过培训而获得驾驶能力,肿瘤发展的车辆只是在这时并不由他们驾驶,或许在肿瘤发展的某个阶段,这些乘客基因就会发挥作用而成为驱动这个肿瘤车辆的新的肇事司机。
研究发现与癌症相关的基因组变异不仅与基因的序列变异、拷贝数缺失或增加、重排或转座等有关,还与DNA碱基或组蛋白等成分的甲基化、乙酰基化等基团的异常修饰相关。这些在基因组序列之外的异常统称为“表观遗传学变异(epigenetic alteration/deregulation)”。目前对于哪些表观遗传学改变会赋予细胞的恶性转化和选择性生长优势还需要进一步的研究。这些潜在的变异基因又可称为“表观遗传学驱动基因”或“表观驱动基因”。
基因因为变异及其对细胞生长增殖的贡献而被分为驱动基因或乘客基因。但这也并不是绝对的,在肿瘤的发生发展过程中,如上所述,在癌症起始阶段的某些乘客基因或许在转移进展过程中,进一步积累变异而成为驱动基因。
值得一提的是,2015年初,一个国际专家组在德国专门讨论了癌症驱动事件和肿瘤异质性等热点问题时将肿瘤驱动基因定义给予了适当修改。这个定义指出广泛的肿瘤驱动事件(cancer driver)是指在肿瘤进化过程中的任何阶段,包括肿瘤起始、发展、转移及耐药时细胞自主性或非细胞自主性改变的事件,这种事件的发生能够促进细胞增殖、存活、侵润和免疫逃逸等功能的形成。这个关于驱动变异的宽泛定义除了包括上述序列微小突变、DNA拷贝数变异、结构变异、表观遗传学修饰等,还包括了CTLA4、PD1、PDL1等肿瘤内免疫抑制微环境形成的关键分子事件。
二、驱动基因与肿瘤的关系
上面提到的驱动基因是指能够提供肿瘤细胞选择性生长优势的变异基因。但如何定义提供细胞的生长优势呢?其实不同的基因变异对肿瘤的发生发展所起到的作用可能是不同的,且有可能只在特定条件下发挥作用。在所有的癌症驱动基因中,部分基因可能只会提供低程度的生长优势,某些变异基因只会提供中等程度的生长优势,而另一些基因可能会具有很强的驱动能力而直接驱动细胞的恶性转化生长为肉眼可见的肿瘤。
因而根据变异基因对促进细胞恶性转化生长的驱动能力分为低、中、高驱动力的三类。这种基因变异诱导疾病发生的能力又称穿透力(penetrance),即穿透正常生理状态至疾病发生的过程而出现疾病表型的能力。穿透力强的基因变异往往在正常细胞或动物模型中引入该单个变异基因即可诱发肿瘤,所致的癌症往往对该类基因变异具有高度依赖型。肿瘤为了维持其恶性生物学表型而依赖于某个或某些活化癌基因的现象称为癌基因成瘾(oncogene addiction)。癌细胞需要驱动癌基因持续发挥功能,而正常细胞则不需要。因此,以癌基因为治疗靶点,分子靶向药物可特异性地杀伤肿瘤细胞。
目前我们已知的大多数肿瘤相关基因几乎都可以称为驱动基因,这些基因的变异都或多或少参与了肿瘤细胞的恶性转化或生长调节。自Michael Bishop和Harold Varmus在1978年首次发现癌基因 src以后,过去30年是多数癌症基因变异发现的关键时期。1982年RobertWinberg从人类膀胱癌中首次分离出突变的 K- Ras基因,拉开了人类相关癌症癌基因发现的序幕;1984年又与其他研究小组同时发现突变的 p53基因,代表了人类抑癌基因的探索之开始。
驱动基因的阐述为我们理解肿瘤的发病、进展、转移及耐药的整个进化过程的分子机制奠定了分子遗传学概念的基础。充分阐明个体的肿瘤进化过程中的分子规律及主要驱动基因靶点,也有助于我们发现肿瘤的“阿喀琉斯之踵”来研发有效的药物。
三、驱动基因的分类
根据我们对基因的认识程度可分为经典与非经典的驱动基因及其突变;根据基因及其变异在肿瘤中出现频率可分为高频率驱动基因和低频率驱动基因或罕见驱动基因;根据基因发生遗传学变异的分子特征可分为“突变驱动基因”(mutated driver gene,Mut-driver)和“表观驱动基因”(epigenetic-altered driver gene,Epi-driver)。
经典的驱动基因是指那些在临床或研究者中广为熟知的基因,如 K- Ras、 EGFR、 HER2、 BCR/ ABL、 PML/ RARa等。经典的驱动基因也是在特定肿瘤中高频出现或是在多个肿瘤中反复出现的基因。如K-Ras基因在多个肿瘤中都反复出现突变,肺癌突变率高达10%~30%,在胰腺癌高达70%,在结直肠癌高达30%等。抑癌基因 p53在所有癌症中约有一半以上都会发生突变失活,特别是在小细胞肺癌中约90%以上都会出现 p53和 RB基因的突变失活。
有人把高频出现和罕见出现的基因比喻为地理图上的“大山与小山”。对大多数肿瘤来说,在一定高比例患者中出现的相对高频率变异的基因只是少数,而只在少数患者出现的低频率变异的不同基因在数量上占大多数。从变异基因在患者中的分布角度看,高频率变异基因与低频率变异基因就好像是地理上“大山”(mountains)和“小山”(hills)在数量上的对比关系。天下有名的高山屈指可数,但未见名传的小山不计其数。在肿瘤基因变异方面的全面观察似乎正是这种情况,在肿瘤中高频率反复出现的突变如 EGFR、 HER2、 p53、 RB、 SRC、 BCR/ ABL、 KIT、 ALK、 ROS1、 K- Ras/ HRAS/ NRAS、 VHL、 PTEN等基因毕竟是少数。部分这样的驱动基因变异可以作为临床药物靶点,又称可药物作用的遗传变异靶点(actionable or druggable target),携带有这些变异靶点的肿瘤患者通常在临床能够取得显著的药物疗效。
肿瘤驱动基因的另一种分类是根据基因的分子变异特征来进行的。根据1996年S Thiagalingam等提出的只有携带驱动突变的基因才能成为癌症驱动基因。这个概念当时没有考虑到基因组变异的复杂性。后来的研究者发现很多基因并不含驱动序列突变,但其高表达、低表达或表观修饰的改变也与肿瘤发生发展的驱动能力相关,因而也是驱动基因。
从基因变化的分子特征来看,基因的活化或失活不仅仅只依赖于DNA序列发生微细的变化(突变)或片段的结构变异(缺失、倒置、重排、转座)等事件的发生。在DNA序列之外发生的变化,包括DNA碱基或组蛋白的甲基化、乙酰化等修饰,也可以改变基因的表达水平。这些表观遗传学的修饰可以发生在基因的调控区域如启动子,现在发现还可以发生于基因体(gene body)的编码区,从而影响基因的表达。另一些遗传学的改变,如基因的高度扩增或纯合缺失尽管序列上不是通常所说的细微的碱基替换或缺失(插入),但能够显著影响基因的表达水平。高度扩增的基因表达显著增强,纯合缺失的基因则失去表达能力。为此,Vogelstein等将这类非序列改变的遗传学变异也纳入驱动能力范畴,将这类基因称为表观遗传学变化的驱动基因。因此,驱动在概念上得到进一步的完善,总体上提出能够提供生长优势的基因分为突变的驱动基因(mut-driver gene)或表观修饰的驱动基因(epi-driver gene)两大类,前者包括 EGFR、 K- Ras、 p53、 PTEN等,后者包括 CDKN2A、 MLH1等。有的基因的改变可能涉及多个分子机制,比如PTEN的失活,与其序列突变、拷贝数缺失、甲基化等都有关系,因而它既是突变驱动基因,又是表观驱动基因。又如, HER2基因,在部分乳腺癌中 HER2基因会高度扩增导致表达水平异常升高,此时可理解为表观驱动基因,而在小部分肺癌中 HER2可能是由于第20外显子的掺入突变导致激酶活性增加驱动致癌,此时则为突变驱动基因。
四、突变驱动基因的数量
基因组测序结果发现在肺、乳腺、结肠、胰腺、脑等部位的肿瘤中平均约有33至36个基因发生细微的突变导致蛋白产物的改变。95%以上的突变形式是单个碱基的替换,其他形式为一至数个碱基的缺失或(和)插入变异。在碱基替换变异中,90.7%导致错义突变,7.6%是无义突变,1.7%是基因剪切位点或起始、终止密码子附近的变异。
不同类型的肿瘤中基因突变的数量存在很大差异。在黑色素瘤和肺癌中,每个肿瘤约有200个左右的非同义的碱基突变发生。这些突变主要与高诱变特征的紫外线和烟草相关。在肺癌中,吸烟者肺癌的突变数量高达非吸烟者肺癌的10倍。在碱基错配修复功能缺失的结直肠癌中同样具有更多的碱基突变数量。在DNA聚合酶POLE或POLD1的校读功能域发生突变失活的肿瘤中,突变数量也很高。而在儿童肿瘤和白血病中突变数量相对较少,平均约为每个肿瘤中9.6个突变。
在2013年Vogelstein的《癌症基因组概貌》的文章中,作者总结认为迄今为止约有140个左右自身突变的基因能够促进或驱动肿瘤发生。这些变异的基因被称为癌症驱动基因(cancer driver gene)。通常一个肿瘤中约有2至8个这样的驱动基因发生突变,而在基因组上其他位置发生的多数突变并没有给肿瘤细胞带来生长优势,因此而被形象的称为“乘客”突变(passengermutation)。所有的癌症驱动基因主要参与了细胞命运、存活、基因组稳定性这3个细胞内生活学过程相关的12条信号通路的调节。
五、驱动突变发生的时间规律
肿瘤发生过程中各种分子变异的出现看起来杂乱无章,但是通过比较分析会发现一些在时间轴上的发生规律。
结直肠癌中研究相对明确的,在APC这样“gatekeeping”作用的基因发生突变后,细胞由正常状态转向优势的生长称为腺瘤(adenoma)。后续 K- Ras基因的突变使得细胞生长优势进一步明显成为更大的腺瘤。在进一步获得 PIK3CA或 SMAD4或 p53等基因突变活化或失活后,细胞生长更加恶性而成为浸润性癌症病变,直至转移至淋巴结及远处器官。有人估计驱动突变对细胞的生长促进作用在细胞生命周期上约为0.4%,因此需要很多年才会导致一定数量癌细胞组成的肉眼可见的肿瘤。
不同肿瘤的驱动基因突变发生的时间变化差异同样很大。在不断增生修复的肠道肿瘤中,年龄与突变发生的数量相关,一般以上的突变是在“瘤变”前即已经发生,且年长患者的肿瘤中的突变数量明显高于年轻患者的肿瘤。而在通常细胞不会复制修复的胰腺导管、脑等组织中基因突变数量明显较少。在儿童肿瘤中也会发现突变数量较少。基因组测序研究发现在正常前体细胞中突变会随机发生,直至获得一个启动作用的突变。
体细胞突变的发生受到衰老(aging)和诱变剂暴露两个重要因素的影响。突变发生也是以一个可预测可计算的速率进行的,所有突变的数量可以被用作类似物种进化中的生物钟,用于癌症生物学的研究。在结直肠癌和胰腺癌中,分析不同进展时期的肿瘤,采用进化生物钟的分析方法,得到两点发现:需要数十年的时间发展成为完全成熟的转移性的癌症;可能所有转移性病灶中的突变早就存在于原发肿瘤病灶。
但从遗传学角度看,驱动肿瘤发生转移可能与某些分子变异相关,就好比从正常细胞转化成恶性细胞一样需要分子变异。这种假设到现在还没得到驱动基因变异的证据证实,还需要进一步研究。一种解释是发生的基因突变或表观遗传学变异以目前的技术尚无法探测。另一种解释是没有更加详细的分析基因变异,特别是基因变异是异质性的时候。另一种解释是没有转移相关的基因,癌症转移也可能是随机发生事件。晚期肿瘤每天释放数百万以上的细胞进入血液。这些循环肿瘤细胞(circulating tumor cell,CTC)生命周期短,只有一小部分能够存活,在适当器官位置滞留后适应微环境而逐步生长形成转移灶。这种生长优势可能是在原发病灶内已经形成,也可能不需要额外的基因事件,即便正常细胞能够在某些条件下形成淋巴结内器官样结构。因而,在总体上看,对于预后影响最大的肿瘤生物学行为—转移特征的形成从驱动基因角度来看还缺乏证据,需要进一步精细分析转移灶的分子特征,特别是表观遗传学的分子变异。这样的研究可能对于癌症转移发生的分子机制提供新的证据。
六、驱动基因的分析鉴定
如上所述,大部分分子变异在肿瘤细胞的发生发展过程中并不提供动力作用,那么如何鉴定驱动基因的变异呢?多数基因的分子变异对应的功能变异是由单项研究得到证实的,只有少数驱动基因的变异是近年来基因组测序发现而进一步鉴定的。
为鉴定基因变异的驱动性质,首先需要了解各类遗传学变异事件发生的特征。肿瘤细胞在点突变发生率方面与正常细胞相似,但在染色体变异率方面却高于正常细胞。多数实体瘤发生广泛的染色体数量、缺失、插入、转位等遗传变异事件。大片段的变化很难鉴定靶基因,但可以通过纯合缺失、转位、扩增信息推断相关基因。转位重排可导致新的致癌基因发生,如 BCR/ ABL、 EML- ALK等。肿瘤发生的许多转位重排与点突变一样,也可能是乘客(passenger)或伴随变异。检查很多肿瘤的全基因组或外显子组测序结果都会发现众多的染色体内和染色体间的重排,但多数这种重排并不导致有功能的遗传学事件发生。许多转位及纯合缺失却与位于基因组容易断裂的脆性位点,但也并不产生功能性的变异。
纯合缺失常常与肿瘤抑制基因相关。癌细胞能够在这些变异状态下存活可能与 p53等失活而不能激活DNA损伤相关凋亡程序有关。染色体层面改变的驱动基因发现的数量约是点突变驱动基因数量的十分之一。基因组中蛋白编码基因约占1.5%。相应地,更高比例的大量突变发生于非编码区,这些突变绝大部分是乘客(passenger)或伴随变异。
在众多的分子变异事件中,如何区分驱动变异和乘客变异呢?定义生理学术语“驱动基因突变”容易,但真正鉴定哪些体细胞突变是驱动性质的,哪些是乘客性质的比较困难。为便于理解,这里应指出“驱动基因”和“驱动基因突变”的定义是不同的。驱动基因是因为携带“驱动突变”而成为“具有驱动能力的基因”。驱动基因也有可能携带乘客突变。以 APC基因为例, APC基因序列很长,在其氨基端1600个氨基酸内截断蛋白(truncation)的变异才是驱动突变,而在羧基端1200氨基酸内发生的错义点突变或截断突变则均为乘客突变。
除了采用实验来验证基因的突变或表观遗传修饰是否具有促进肿瘤细胞恶性表型的功能之外,是否有其他方法来判断变异的基因是否具有促癌功能呢?特别是在大规模多肿瘤基因组测序的今天,国际上癌症基因组图谱(TCGA)、国际癌症基因组协作组(ICGC)、精准医学计划(PMI)等项目均会产生更多的基因组学数据,但如何从基因组变异信息中快速确定哪些基因具有驱动癌症发生发展的功能是个亟须突破的挑战性工作。
为此,国际上很多研究小组发展出很多统计学方法用于鉴定驱动基因,有些是基于突变的发生频率、有些是基于预测的受影响蛋白的功能改变。当一个基因的突变数量很多次出现,比如 p53和 K- Ras基因,很容易推测是驱动基因,因而这些高突变基因容易被辨认而被形容为“高山”驱动基因。然而在肿瘤中,只有少量突变的“小山”基因在基因数量上占绝大多数,充满而主宰了整个癌症基因组变异的概貌图。这些基因仅从频率很难推断是否为驱动基因,需要进一步分析。
Vogelstein等提出了一种行之有效的比值法鉴定突变驱动基因。当突变频率在校正了突变内容、基因长度等还是无法判断时,应该通过基因突变谱特征来初步判断是否为驱动基因。因为从以前所知的基因变异特征来看,癌基因与抑癌基因具有明显的分子特征性和非随机性。在癌基因中,往往突变会反复累及同一个氨基酸,而抑癌基因则可在整个基因长度上发生截断突变或错义突变。通过这种方法,对癌症体细胞突变目录(COSMIC)数据库中发生404 863个细微突变的18 306个突变基因进行可以很好的分类鉴定出突变驱动基因,并判断是癌基因还是抑癌基因。对于癌基因分类,只需要满足>20%的突变是发生于重复位点且是错义的条件即可;对于抑癌基因分类,则需要满足>20%突变是失活的条件即可。这个方法称为“20/20原则”,适用于所有数据库中已经记录的癌症相关基因的驱动特性判断。
例如:在脑瘤中, IDH1突变刚发现时其作用不清,初始研究认为是个抑癌基因,因为突变使得 IDH1失活了。但是仔细观察却发现几乎所有的突变均存在于第132密码子所编码的同一个氨基酸。根据20/20规则,这应该是个癌基因,最终通过生化研究分析证实 IDH1确实是个癌基因。
另一个例子是 NOTCH1,有些功能研究提示是癌基因,有些则提示为抑癌基因。通过对 NTOCH1在多个器官来源的肿瘤中分析时发现,20/20规则仍然可以准确判断。在淋巴瘤或白血病中, NOTCH1突变是重复出现且没有截断预测的蛋白产物。而在鳞状细胞癌中 NTOCH1的突变则是使得蛋白产物失活的,从而是抑癌基因。通过进一步功能分析验证,揭示 NOTCH1在不同的肿瘤中发挥了不同的生物学功能。
七、突变驱动基因的数量
经过TCGA等项目的3 284个肿瘤的基因组范围内的检测分析约2万个蛋白编码基因的变异,根据20/20规则约只有125个突变驱动基因。71个抑癌基因,54个癌基因。多数基因在以前的研究中已经被发现是癌症相关基因,只有29%的基因突变是通过基因组测序发现的。那么问题是还有可能发现更多的突变驱动基因吗?目前科学家们认为驱动基因数量已经达到平台期。在未来的分析中,更多可能发现的是相同的基因突变被再发现于其他肿瘤。比如 MLL2、 MLL3突变原先发现于髓母细胞瘤,后来被发现在非霍奇金淋巴瘤、前列腺癌、乳腺癌等也存在。同样,ARID1A最早在透明细胞卵巢癌发现,后来发现在胃癌、肝癌等存在。肺癌中发现的几个突变基因,如 K- Ras、 ALK、 EGFR等在其他肿瘤也有发现, K- Ras突变可出现于胰腺癌、结直肠癌、胃癌等, ALK基因融合或突变可发生于髓母细胞瘤、炎症性肌母细胞瘤、间变大B细胞淋巴瘤等。 EGFR突变也可发生于胶质母细胞瘤等。
通过基因组测序发现的突变驱动基因往往在功能上与染色体修饰调节相关,如调节组蛋白或核酸甲基化等。这些基因包括组蛋白 HIST1H3B和 H3F3A,共价修饰DNA的 DNMT1和 TET1,调节组蛋白甲基化状态的 EZH、 SETD2和 KDM6A等基因。这些突变发现有助于进一步理解癌症的表观遗传学改变。如发现了mRNA剪切因子 SF3B1和 U2AF1存在突变,令人震惊地考虑到mRNA剪切异常并不一定是由DNA序列变异所致,也有可能是拼接体(splicesome)功能异常所致。在 ATRX等基因突变的肿瘤中发现其功能于长期以来难以解释的肿瘤细胞内ALT(替代端粒延伸)的机制相关。另一个有趣的例子是 IDH1/ IDH2基因突变与肿瘤代谢和表观遗传学相关。
突变驱动基因多数是否碱基替换、小插入或缺失等细微变异引起,也有可能是有转位、扩增或大片段缺失导致。如反复扩增的 MYC家族基因或纯合缺失的 MAP2K4基因均会出现基因的功能活化或失活。
在DNA片段转位变异过程中,除了基因相互融合活化。另一个难以发现和解释现象就是染色体碎裂后重组(chromothripisis),这会导致大量的染色体重排。有些重排发现是通过核型分析发现的,如费城染色体的发现和分子结果的发现。1960年美国Novell和Hungelford博士发现,在慢性粒细胞白血病(CML)的细胞里,常常发现第22号染色体的长臂缺失了一块。这一缺失的染色体就以二位研究者所在地费城命名为费城染色体。但在其后的12年中,费城染色体的意义一直不明确。直到1973年,Janet Rowley博士应用染色体分带技术检查慢性粒细胞白血病时,发现两个染色体的部分发生了相互交换:第22号染色体那段丢失的片段跳到第9号染色体长臂上,而原来在第9号染色体的那段片段则被接到了第22号染色体的长臂上。这是在人类癌症细胞上第一次发现的染色体易位,这也是通过Rowley孜孜不倦的核型观察发现的。后来通过序列的分析才发现这是导致 BCR/ ABL融合基因形成的遗传学事件。这个著名的遗传学事件也是导致后来第一个小分子靶向药物imatinib的研发成功,临床上CML可达到90%以上的缓解率。
除了仔细观察核型,上述染色体碎裂重组也是导致融合变异基因出现的少见遗传学事件。在肺癌中,2号染色体上的ALK多数情况下是通过与2号染色体上 EML4或10号染色 KIF5B等基因片段倒置或转位导致融合变异,表达异常的EML4-ALK或KIF5B-ALK等融合蛋白,通过细胞内下游通路的激活驱动肿瘤细胞的发生。上述这些遗传学变化可以通过DNA荧光原位杂交技术(FISH)检测分析。但在少数情况下,2号染色体不是发生大片段的倒置,而是发生碎裂重组,在这种情况下,结果同样是会导致EML4和ALK的融合,但由于片段的碎裂重组而难于被FISH技术检测到,而通过二代测序技术才发现EML4-ALK融合事件。
上述发生扩增、缺失或转位重排的变异分析发现增加了13个突变驱动基因,包括10个癌基因和3个抑癌基因,这样与上述125个合并共计有138个驱动基因。
八、驱动基因的“暗物质”部分
分子流行病学研究提示每个肿瘤通常有5至8个打击事件,即驱动基因的变异事件应该达到这个数目左右。但在儿童髓母细胞瘤,目前发现的驱动基因突变只有0至2个。在常见的成人肿瘤,如胰腺、结直肠、乳腺和脑瘤中,突变驱动基因约为3至6个,其他多个肿瘤中只有1至2个基因突变。怎样来解释这些有限数量的突变基因?怎样解释长期以来已经形成的观点,即肿瘤发生发展是多步骤过程、是需要在数十年里积累序贯发生的多个遗传事件?假设将目前还未发现那些变异基因称为驱动基因的“暗物质”部分。关于这方面的解释包括多个方面。首先,测序技术问题可能导致丢失掉一些突变。这些缺陷包括测序技术的局限性、DNA区域的代表性、生物材料中间质成分含量高的原因稀释了存在的突变。最近胰腺癌的研究发现,对已知变异的样本采用NGS测序分析,发现251个驱动基因突变中只有159(63%)被检测到,可见由于技术原因的假阴性率高达39%。技术上的局限还会因测序深度不足而加剧。另外,概念上的问题同样影响驱动基因的检测:即仅测序蛋白编码序列也会导致一些功能性突变的DNA区域检测不到。尽管蛋白编码区域代表大部分的功能区域,但在DNA序列上其他元件或许同样具有重要的基因调节功能。一个明确的例子是TERT基因的启动子内突变会活化该基因的转录增强。
基因组测序虽然会发现更多的突变驱动基因,然而可能仅是在其他肿瘤重复发现已知的“高山”基因突变或在常见肿瘤继续发现一些频率较低的“小山”基因突变。这样,这些基因不会构成假定的暗物质的一大部分。其他类型变异可能为主,比如拷贝数的变异等。另外,最明显的暗物质可能是表观驱动基因。人类肿瘤含有大量的DNA和染色质蛋白的变异。结直肠癌含有超过10%的蛋白编码基因出现差异性甲基化。这些变异可能会提供生长优势。已知 CDK2NA、 MLH1等表观沉默是常见的失活机制。表观修饰是动态变化的,在不同个体,不同细胞类型、不同发育阶段或患者年龄表观修饰状态都会不同。肿瘤微环境的低氧、低营养或细胞异常接触等均可能触发表观修饰的改变。如何界定哪些表观修饰是促进癌症或提供生长优势的标准需要建立,都需要通过未来的表观遗传学检测技术的进步来深入研究。
九、驱动基因的遗传抑制性、信号通路及其对治疗的影响
在肿瘤发生发展、转移、耐药的进化过程中,阐明遗传异质性的存在和变化对肿瘤进化过程的理解非常重要。按照空间的变化有以下4类异质性值得研究:①瘤内异质性:数十年以来已知肿瘤细胞核型的同一型存在。而突变数量的差异反映了两个距最近的共同祖先细胞的距离。肿瘤内空间上相距较远的细胞间比临近细胞呈现更多的变异差异。主要树干突变数量较多,树枝突变数量虽然不一定多于主干突变量,但对于不同转移灶的临床诊治具有重要意义。②转移灶间异质性:多发性转移灶如果异质性较大,每个转移灶来自一群特别的祖先细胞(founder cell),可能携带有不同的驱动基因而对不同的药物敏感或耐药,则对于诊治带来极大挑战。而这种假设被另一种现象即分子异质性主要存在于乘客(passenger)突变所冲淡。或许主要突变驱动基因存在于每一个转移灶,如果情况是这样则对于初始治疗可能较好,一个治疗药物或方案会对全身的多个病灶都会有效。另一个重要问题是在治疗后的耐药机制可能不同,可能不同的病灶产生不同的耐药相关驱动变异。如果不同的瘤灶呈现不同的耐药机制,则导致耐药后治疗策略选择存在极大的困难。③转移灶内异质性:每个转移灶来自于一个或少数均质性细胞,共享一套突变谱系。在后续的分裂生长过程中,也可能会产生新的突变谱系。转移灶对初始治疗可能会产生一定的效果,反应时间与原先存在的耐药突变量相关。一般来说,转移灶10 9个细胞中,可能已有数千个细胞对某种治疗耐药。因此,治疗后复发只是一个时间的问题,理论上可以通过突变频率和细胞生长速率计算来预测。治疗策略理论上是通过多药联合来进行治疗,因为同时对多药耐药的克隆罕见,不同的混合克隆应会被不同药物联用时分别杀死。④患者间异质性:没有两个肿瘤患者之间出现完全一致的疾病过程。这种现象可能与遗传背景、药物代谢酶活性,或与非遗传因子相关。患者间也有可能是瘤内突变差异所致,数十个驱动突变在两个个体间可能仅有数个是共同存在的。突变的差异也可能是同一个蛋白的不同结构域或不同碱基位点发生变异,比如 K- Ras G12D与 G13D突变在结直肠癌和肺癌中的预后或预测意义可能不同。个体间病灶的异质性也有可能是数个驱动基因间的差异所致,比如2014年发表在 Science关于膀胱癌采用mTOR抑制剂治疗的试验结果所示,在少数对mTOR抑制剂有效的患者中,不同患者的有效时间不同,个别患者达到完全缓解,部分患者出现部分缓解。这些患者虽然都是有反应性的(responsive),但出现完全缓解患者的个体则是mTOR上游的抑癌基因 TSC1 E636 fs的框移突变、 ARID1A、 NF2均出现突变;而另有15%左右肿瘤缩减的两位稳定患者则分别是 TSC1 Q694*和R509*+ FGFR3 R248C突变。可见这三个患者虽然都有 TSC1基因突变失活导致下游mTOR通路活化,但是他们 TSC1基因突变失活的位点不同,且有不同的其他驱动突变伴随。可见异质性可能导致同一基因突变型的患者出现不同的药物应答方式和疗效。另一个例子在 EGFR突变的肺癌中,虽然在 EGFR基因第18至第21的4个外显子区域出现的突变多数为对靶向药物敏感的活化突变,但T790M则是对第一代靶向药物耐药性的突变。可见 EGFR众多的突变亚型是异质性的,即便是经典的活化突变 EGFR E19 del与 EGFR L858R之间也是具有不同的疗效和预后的异质性,经LuxLung-3/6及EURTAC临床试验分析初步证实这两个分子亚型之间存在疗效和预后的差异。而 EGFR其他罕见突变与靶向药物的疗效则更是一般。可见“并不是所有的 EGFR突变亚型生来就是平等的!”。不同的 EGFR突变亚型在对第一代至第三代 EGFR靶向药物的反应可能均有细微或中度的差别。除了 EGFR突变本身存在分子异质性, EGFR突变患者的疗效还受到其他基因的修饰性影响,比如 BIM基因多态性或表达水平均能影响临床EGFR突变患者的疗效,及 EGFR突变伴随不同 BIM活化状态的肿瘤对靶向药物的作用不同。多驱动基因的异质性对于详细解释肿瘤间的不同治疗反应和表型具有重要意义。
驱动基因的变异总是通过某些特定信号通路发挥功能作用的。在某些即便是晚期的肿瘤,采用单一靶向治疗尽管疗效有限,但确实能够在一定时间内阻断肿瘤的进展。肿瘤基因组的复杂性此时如何影响肿瘤的呢?有两个概念需要记住,第一个是99.9%的肿瘤变异是乘客(passenger)突变,这些变异标记了连续的克隆性变化的时程。肿瘤基因组的复杂性是由于 p53等基因突变后的结果,而并非是基因突变的原因。另一个概念是如何理解基因组复杂性及其规律性。就像在丛林里的地面看整个地理环境显得杂乱无章,而在空中看则显示一定规律性,动物沿河而居、小溪汇集成河一样有其特定的规律,肿瘤基因组也有其规律性。所有的138驱动基因的突变都为了一件事:直接或间接地导致癌症细胞的选择性生长优势,而且通过一些特定的信号通路发挥作用。
所有驱动基因可划归于一条或多条信号通路。12条信号通路的发现是生物医学领域的伟大成就。而这些信号通路可进一步整合成3个主要的细胞内生物学过程,即细胞进一步生长的命运、细胞存活和基因组的维持。①细胞生长的命运:细胞分化和分裂是相反的关系。许多癌症细胞的突变打破了分化和分裂的平衡,倾向于不停分裂。执行这些过程的功能通路包括APC、HH和Notch等。染色质修饰酶也可归于这类基因,在正常发育过程中,从分裂向分化切换时并非由突变来决定,而是有影响DNA和染色质蛋白的表观修饰改变来决定。②细胞存活:正常细胞总是在毛细血管附近100μm附近,能够获得足够的营养和氧气。但肿瘤血管生成总是扭曲的和通透的,肿瘤细胞获得突变后能够生存于低氧和低营养微环境。这些相关突变包括 EGFR、 HER2、 FGFR2、 PDGFR、 TGFbetaR2、 MET、KIT、 Ras、 RAF、 PIK3CA和 PTEN等。调节细胞周期和凋亡的基因也会发生突变,如 CDKN2A、 MYC和 BCL2等。另一个基因VHL突变后也会促进VEGF产生而促血管形成。③基因组维持:癌细胞会暴露于ROS等图形物质,或出现复制错误而受到检查点控制导致应激。但 p53、 ATM等基因突变使得癌细胞能够耐受这些错误而获得生长优势。控制点突变的 MLH1或 MSH2等基因突变后使得细胞尽快获得更多点突变来调节细胞命运和存活。
调节细胞生长命运、存活和基因组维持的蛋白产物往往相互作用,其中的通路(pathway)也会重叠。癌症是基因病,因而把突变基因按照信号通路(pathway)分类具有重要意义。认识到这些通路(pathway)有助于我们理解患者间的异质性:例如某例肺癌可能是某个受体突变能够存活于低EGF微环境; K- Ras突变肺癌,通常也是将EGFR信号传递到下游的分子;另一例肺癌可能是 NF1突变失活而活化了 K- Ras;还有的肺癌可能是 BRAF突变,传递 K- Ras信号。至此可以认为这些重要的具有异曲同工的分子变异可能不重复出现于同一个肿瘤,这已经得到多数分子流行病学数据的证实。对于这些信号通路的理解和认识也有助于治疗方法的选择:即同一信号通路的不同驱动基因变异的肿瘤可能有各自的靶向药物,同一肿瘤细胞内不同驱动基因突变同时出现可能是一个靶向药物的耐药机制。
近年来采用二代测序技术对肾癌、肺癌等肿瘤的瘤灶内和瘤灶间的分子异质性进行了深入分析,发现了一些肿瘤异质性的规律:①多数肿瘤病灶内异质性分为树状结构的“树干”驱动变异和“树枝”驱动变异。瘤内异质性可能会影响特定靶向治疗的疗效。②药物耐药具有复杂性,有时可能是亚克隆变异所致,有时可能是多克隆变异所致。低频亚克隆也可能会经选择后成为优势克隆而影响治疗效果。这些克隆性特征给克服耐药治疗带来很大的挑战。已经发现亚克隆驱动变异的差异(如mTOR突变)与mTOR抑制剂的对不同病灶的混合疗效相关,亚克隆驱动基因变异的数量与疾病进展时间相关。③肿瘤在进化过程中存在时间和空间的动态异质性变化。产生分枝进化(branched evolution)和遗传多样性的主要原因有基因组倍增、DNA复制应激、APOBEC基因突变和细胞毒治疗,如替莫唑胺等治疗会影响肿瘤的克隆性分化。④导致突变的生物学过程促进异质性发生,这种“阿喀琉斯之踵”特性可能被用于抗肿瘤治疗。如MSH等DNA修复基因的功能缺失突变可能会导致更多的免疫原性的新肿瘤抗原(neoantigen)形成,而这些新抗原的所有亚克隆均可能对免疫调节治疗(如PD1抗体治疗)敏感。
肿瘤异质性虽然是肿瘤普遍存在的现象,看起来复杂多变、分子规律扑朔迷离。但阐述其在癌症发生、发展、转移、抗药进展等进化过程中的作用具有重要意义,会加深对肿瘤的进展机制认识、阐明药物的耐药机制、寻求有效克服耐药对策等提供重要资料。特别是阐明肿瘤的驱动基因变异在时空中的树状结构、所在的信号通路或蛋白复合体,对利用肿瘤异质性来指导临床很重要,也是当前“精准肿瘤学”必经的关键一步。
(张绪超)