第四章 放射损伤易感性预测的分子生物学研究
第一节 概述
放射治疗的目标是尽可能地提高肿瘤控制率,同时减少正常组织的放射损伤,即提高治疗比。近二十年来,放疗新技术的迅猛发展,为精准放疗奠定了物理剂量学基础,显著改善了肿瘤照射的准确性、降低了周围正常组织的受照剂量。但仍有一部分患者无法避免发生严重的正常组织放射损伤,限制了肿瘤照射剂量的提升。
关于放疗所致皮肤毛细血管扩张的研究表明,在考虑了吸收剂量和分次剂量的影响后,高达80%的皮肤毒性风险差异与患者的个体化因素有关。目前认为基因组水平异常在放疗敏感性的异质性中发挥重要作用,例如ATM基因突变患者对放疗超敏且肿瘤发病风险高。识别不同患者对放疗不良反应的易感性差异是个体化肿瘤治疗的重要前提:一方面,对于正常组织毒副作用低危的患者,可以实现安全地增加肿瘤受照剂量来拓宽;另一方面,识别出发生严重正常组织反应的高危患者,可以通过改变放射治疗方案(替代分割方案、治疗计划或方式)、改变手术策略(例如乳腺癌、乳房切除术而不是广泛的局部切除加放射治疗)或药物干预以避免发生严重放疗毒副作用。因此,在过去的二十年里,已探索出一些实验方法来预测正常组织毒性预测实验。尤其是近年来二代测序(next-generation sequencing,NGS)、全基因组关联分析(genome-wide association study,GWAS)和生物信息学系统分析等高通量新技术的兴起,为该领域进一步深入研究提供了良好的基础。
本章将从分子水平主要介绍“组学”相关概念及高通量测序技术平台,回顾新的高通量“组学”技术和更经典的功能实验方法,并讨论这两种方法如何协同作用,以便于识别具有不同放疗诱导毒性风险亚群,探讨其指导个体化放疗的可能与前景。
基因组(genome)是指单倍体细胞核、细胞器或病毒粒子所含的全部DNA分子或RNA分子。基因组学(genomics)的概念由美国科学家Thomas Roderick在1986年首次提出,指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱),核苷酸序列分析,基因定位和基因功能分析的一门科学。基因组学是从系统整体的观念研究生物体全部遗传物质结构与功能的新兴学科,也是当代生命科学“组学”(-omics)理论体系和研究方法中的核心。基因组学研究的主要内容包括以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics)。前者以对基因组的作图和测序技术为核心内容;后者以基因功能的高通量研究方法为核心内容,利用结构基因组学提供的信息,系统地研究基因功能。自从1990年人类基因组计划实施以来,目前基因组学已发展成了生命科学的前沿和热点领域,研究中心逐渐转移至比较基因组学和功能基因组学。
高通量测序技术是基因组学研究的核心和关键技术,迄今为止已历经几代的发展。第一代测序技术,为链终止DNA测序技术,由Sanger在1977年发明,因此也被称为Sanger测序技术。因读长长、稳定性好、可靠性高、高精度(99.99%)而被称为测序技术的“金标准”,目前其测出的碱基数序列已经超过1千亿个参考模板,成为生命科学领域最基本的技术之一。然而,Sanger测序技术成本较高,成为限制其推广应用的主要因素之一。
近年来兴起的第二代测序技术(next-generation sequencing,NGS)已成为当今主流的基因组测序技术,以高通量为主要特征。相对于Sanger测序技术,NGS的优势有:①成本低,把成本从0.01美元/碱基降低至0.0001美元/碱基;②高度并行化,可同时检测几十万个到几千万个DNA分子序列;③通量高且速度快,机器运行一次产生的数据量达几Gb(giga base),运行一次机器仅需3~6天时间。使个体基因组学(personal genomics)成为可能。
目前第三代测序技术已出现,其技术核心为不需要经过PCR扩增,实现了对每一条DNA分子的单独测序,并向测序仪器体积更小的方向发展,如纳米孔单分子测序技术,是未来主要发展方向。有可能在短时间内获得大量与临床表型和基因功能相关的信息。
功能基因组学研究内容主要包括基因功能发现、基因表达分析及其突变检测等,高通量技术平台主要包括微阵列或DNA芯片、表达序列标签(expressed sequence tag,EST)法、基因表达系列分析(serial analysis of gene expression,SAGE)法、蛋白质组学分析法及生物信息学等,有可能在短时间内获得大量与临床表型和基因功能相关的分子生物学信息。
基因芯片(gene chip)的原型是20世纪80年代中期提出的,其原理是杂交检测方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法。分子杂交可在DNA与DNA、RNA与RNA或RNA与DNA的两条单链之间。通常称被检测的核酸为靶序列(target),用于探测靶DNA的互补序列被称为探针(probe)。基因芯片检测通常采用反向杂交方法,即将多个探针分子点在芯片上,样本的核酸靶标进行标记后与芯片进行杂交,可以同时研究成千上万的靶标甚至全基因组作为靶序列。目前基因芯片主要可以实现两大类的检测:RNA水平的大规模基因表达谱的研究和检测DNA的结构及组成。
基因芯片分为三种主要类型:①固定在聚合物基片(尼龙膜,硝酸纤维膜等)表面上的核酸探针或cDNA片段,通常用同位素标记的靶基因与其杂交,通过放射显影技术进行检测。这种方法的优点是所需检测设备与目前分子生物学所用的放射显影技术相一致,相对比较成熟。但芯片上探针密度不高,样品和试剂的需求量大,定量检测存在较多问题。②用点样法固定在玻璃板上的DNA探针阵列,通过与荧光标记的靶基因杂交进行检测。这种方法点阵密度可有较大的提高,各个探针在表面上的结合量也比较一致,但在标准化和批量化生产方面仍有不易克服的困难。③在玻璃等硬质表面上直接合成的寡核苷酸探针阵列,与荧光标记的靶基因杂交进行检测。该方法把微电子光刻技术与DNA化学合成技术相结合,可以使基因芯片的探针密度大大提高,减少试剂的用量,实现标准化和批量化大规模生产。
现代肿瘤学理论认为,肿瘤发生发展除了与DNA核苷酸序列改变,即与经典的遗传机制相关外,表观遗传学(epigenetic)机制同等重要。表观遗传学是研究没有DNA序列改变的,可遗传的基因表达改变的科学,主要通过对核小体DNA和组蛋白的结构修饰及其之后的染色质重塑、非编码RNA调节等,而对局部或整体的基因表达产生重要的调控作用。表观遗传学异常可导致抑癌基因失活或原癌基因激活,可与基因变异共同参与包括肿瘤细胞增殖与分化、细胞周期的调控、肿瘤侵袭和转移以及肿瘤细胞逃避宿主免疫监视等肿瘤发生发展的整个过程。基因的表观遗传修饰主要包括DNA甲基化和组蛋白修饰。DNA甲基化检测技术依据对目标DNA的预处理手段可分为三类,即基于限制性酶切预处理、基于亲和富集预处理以及基于亚硫酸盐修饰预处理的甲基化检测技术。芯片技术可以同时检测多个甲基化位点。而以二代测序技术为基础的表观遗传学测序及研究方法包括:全基因组亚硫酸氢盐测序法(whole genome bisulfite sequencing,WGBS)、简化代表性亚硫酸盐测序法(reduced representation bisulfite sequencing,RRBS)、甲基化DNA免疫共沉淀测序(methylated DNA immunoprecipitation sequencing,MeDIP-seq)、染色质免疫共沉淀测序(chromatin immunoprecipitation sequencing,ChIP-seq)、Tet辅助重亚硫酸盐测序法(Tet-assisted bisulfite sequencing,TAB-seq)、各种染色体构想捕获测序技术(chromosome conformation capture sequencing,3C-seq)、Dnase I-seq/MNase-seq/FAIRE-seq以及RNA测序(RNA sequencing,RNA-seq)等。
蛋白质组学(proteomics)是20世纪90年代中期萌发的新兴学科,即从蛋白质组的水平进一步认识生命活动的机制和疾病发生的分子机制。其研究内容为“一种基因组所表达的全部蛋白质”。蛋白质是执行生命体功能的基本单元,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制;而蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用及蛋白质构象等问题,依赖于直接对蛋白质的研究来解决。而蛋白质组研究本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平、翻译后的修饰、蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生、细胞代谢等过程的整体而全面的认识。
相对于基因组学,蛋白质组学还处于一个初期发展阶段。其研究技术主要包括二维电泳和质谱技术,具体应用包括以下三个方面:①蛋白质鉴定,可以利用一维电泳和二维电泳并结合Western、质谱及免疫共沉淀等技术,对蛋白质进行鉴定研究。②翻译后修饰,很多mRNA表达产生的蛋白质要经历翻译后修饰如磷酸化、糖基化、酶原激活等,翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。③蛋白质功能确定,如分析酶活性和确定酶底物,细胞因子的生物分析/配基-受体结合分析。可以利用基因敲除和反义技术分析基因表达产物——蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。