1.2 核糖核酸与生命调控及健康领域的研究热点与前沿
基于Web of Sciences数据库论文,分别利用VOSviewer软件和Citespace5.0软件分析RNA代谢、调控与生理功能,RNA与疾病,RNA与现代农业,RNA新技术与新方法4个主题的研究热点与前沿。各领域数据检索结果如表1.6所示。
表1.6 各领域数据检索结果
注:检索时间为2021年2月16日至18日,文献类型为Article;RNA与疾病领域论文量太多,软件无法分析,因此将其年份缩短为2019—2020年。
1.2.1 RNA代谢、调控与生理功能
1.2.1.1 研究热点
RNA代谢、调控与生理功能领域研究热点如图1.1所示。
1.非编码RNA多样性鉴定及新型功能分析
microrna、identification、gene、gene-expression、long noncoding rnas、differentiation、biogenesis、transcription、dna methylation、evolution、transcriptome、metabolism、epigenetics、translation等词代表的红色聚类,表示新型miRNA、lncRNA、RNA结合蛋白等的鉴定及其在转录、翻译、表观遗传调控中的作用,如非编码RNA的编码活性[19]、小核RNA的功能多样性[20]、RNA甲基化在人类癌症中的作用等。
图1.1 RNA代谢、调控与生理功能领域研究热点
2.非编码RNA在自噬、炎症方面的调控作用
expression、microrna、apoptosis、cells、activation、mechanisms、inflammation、biomarkers、inhibition、disease、autophagy、angiogenesis、risk、macrophages、stat3等词代表的绿色聚类,表示miRNA、lncRNA等非编码RNA在自噬、炎症方面的调控作用,如miRNA在自噬调控中的作用及其在老年性黄斑变性治疗中的可能用途[21],靶向表观遗传学和非编码RNA治疗动脉粥样硬化[22]等。
3.lncRNA在细胞增殖、转移、凋亡中的作用
proliferation、invasion、cancer、metastasis、migration、progression、cell-proliferation、down-regulation、long noncoding rna、prognosis、epithelial-mesenchymal transition、breast cancer、tumorigenesis等词代表的蓝色聚类,表示长非编码RNA、miRNA、环形RNA等非编码RNA在细胞增殖、迁移、凋亡中的作用及其在肝癌、乳腺癌、胃癌等癌症转移、预后中发挥的重要作用,如lncRNA SNHG1促进癌症发生发展[23],环形RNA circPIP5K1A通过miR-600/HIF-1α调控促进非小细胞肺癌增殖和转移[24]等。
1.2.1.2 研究前沿
1.环形RNA的合成、鉴定及其调节功能研究
lncRNA是一类异质性的ncRNA,其功能为调节蛋白质编码基因的表达、剪接和转录及转录后修饰。lncRNA的转录本可以是线性的,也可以是环形的,环形RNA(circRNA)是5'和3'端共价连接的RNA基团,通过特定的反拼接机制形成。这种共价连接的RNA于1976年首次被发现存在于RNA植物病毒中。研究证明,其他病毒,如肝炎δ病毒,都含有环形结构的RNA基因组。越来越多的证据表明,circRNA是一类新的RNA。circRNA不仅在肿瘤中含量丰富,而且在许多其他组织类型和细胞中也很常见。研究还表明,circRNA不仅比研究人员原先设想的要丰富得多,实际上在某些情况下,它们的表达量要高于其对应的线性RNA,而且它们在进化上高度保守。
circRNA可作为基因表达的主要调节器,并有望作为癌症和其他疾病的新型生物标志物。circRNA比线性RNA有更长的半衰期(>48小时),具有组织、细胞类型或发育阶段特异性[25]。
在生理功能方面,近年来研究得最多的是circRNA在大脑中的作用。在哺乳动物神经元分化和突触发生过程中,许多circRNA被上调。研究表明,大脑特异性circRNA在人类、小鼠和果蝇中高度保守。circRNA还与先天免疫应答相关,在血液、心脏组织中也高度表达。
circRNA的成熟受顺式和反式元素的调控。已有研究证明,circRNA与特定的miRNA能相互作用并发挥仓库的作用。这一特性使circRNA成为活跃的调控转录因子[26]。
2.lncRNA的大规模识别与调控网络研究
研究人员通过分析来自正常组织和肿瘤组织的14166个样本,以高质量的图谱呈现人类长非编码RNA全景图,并建立了lncRNA参考目录(RefLnc)。RefLnc确定了275个与性别、年龄或种族相关的新型基因间lncRNA,以及369个与患者生存、临床阶段、肿瘤转移或复发相关的新型lncRNA[27]。在小鼠和人类中发现了665个保守的lncRNA启动子,这些位置保守的lncRNA基因主要与发育转录因子位点相关,其中一半以上与染色质组织结构有关,并位于染色质环锚点和拓扑关联域(TAD)的边界。研究人员将这些RNA定义为拓扑锚点RNA(tapRNA)。利用位置守恒来识别在基因组、发育和疾病中具有潜在重要性的lncRNA,对tapRNA及其相关编码基因的鉴定表明,它们在功能上是相通的:在体外以类似的方式相互调控对方的表达并影响癌细胞的转移表型。
lncRNA在基因表达的调控中发挥着重要作用,能够转录调控、诱导表观遗传变化,甚至直接调控蛋白质的活性,并作为miRNA海绵与miRNA相互作用、调节内源性mRNA靶点,但其中的生物学和分子机制仍有待确定。特别是lncRNA与其他生物分子相关的调控网络成为转录组研究的新前沿。研究人员研究了lncRNA与其他生物分子之间的关联,展示了应用于lncRNA相互作用预测和分析的多种生物信息学方法[28]。研究表明,lncRNA的表达模式具有细胞类型特异性,这可能是由lncRNA-miRNA的相互作用类似于受体-配体的相互作用导致的。miRNA与lncRNA的特异性结合可能会驱动细胞类型特异性信号级联,并调节生化反馈回路,最终决定细胞的身份和对压力因子的反应[29]。
3.RNA甲基化修饰的鉴定与功能研究
研究人员利用新技术大规模鉴定非编码RNA的N6-甲基腺苷(m6A)修饰,并进一步研究其功能。在非编码RNA的m6A修饰和哺乳动物基因表达的控制方面,研究人员利用先进技术使RNA转录本的修饰实现精确映射,以便剖析转录后的基因调控。在没有翻译的情况下,非编码RNA的修饰可能在其调控、蛋白质相互作用和随后的下游效应器功能中发挥重要作用。目前,已有研究人员研究了m6A对RNA的修饰,并进一步探讨了m6A修饰的lncRNA MALAT1和Xist的不同作用[30]。
在m6A修饰对胚胎发育的影响方面,研究人员使用m6A测序生成了21个跨越主要胚胎组织的全转录组m6A甲基组,揭示了动态的m6A甲基化,确定了大量的组织差异性m6A修饰,并表明m6A与基因表达稳态正相关。研究人员还研究了长基因间非编码RNA(lincRNA)的m6A甲基组,发现增强子lincRNA富集m6A。研究发现,m6A受到人类遗传变异和启动子的广泛调控,表明m6A广泛参与人类发育和疾病[31]。此外,还有研究发现,m6A mRNA标记能促进人类红细胞生成所需调节子的选择性翻译[32]。
1.2.2 RNA与疾病
1.2.2.1 研究热点
RNA与疾病领域研究热点如图1.2所示。
图1.2 RNA与疾病领域研究热点
1.RNA参与炎症、免疫调控、氧化应激,与多种疾病相关
cells、activation、inflammation、gene-expression、inhibition、mechanisms、differentiation、oxidative stress、disease、autophagy、nf-kappa-b、pathogenesis、phosphorylation、exosomes、brain、extracellular vesicles、obesity等词代表的红色聚类,表示外泌体、胞外囊泡等处的非编码RNA参与机体中的炎症、免疫调控,进而参与神经退行性疾病、肿瘤、糖尿病、风湿性关节炎、哮喘、脑损伤、肝纤维化、冠状动脉疾病等多种疾病发生发展的遗传学调控,如参与骨钙化过程中的细胞凋亡,从而与神经退行性疾病等老年疾病相关[33];miRNA参与形成巨噬细胞的功能异质性,从而影响巨噬细胞和间充质干细胞之间的分子串联[34];多个miRNA参与巨噬细胞极化,对巨噬细胞极化进行代谢重编程将有助于治疗多种炎症性疾病[35]等。
2.非编码RNA作为肿瘤的诊断与预后生物标志物
cancer、prognosis、microrna、biomarkers、survival、identification、protein、diagnosis、breast cancer、lncrna、target、dna methylation、circular rna、prostate cancer、serum、management、cerna等词代表的绿色聚类,表示miRNA、lncRNA、环形RNA、ceRNA等非编码RNA可作为乳腺癌、肝癌、前列腺癌等恶性肿瘤的诊断与预后生物标志物。例如,多个miRNA和lncRNA可作为三阴性乳腺癌的潜在生物标志物[36],竞争性内源非编码RNA在肝细胞癌中发挥重要作用[37],非编码RNA网络在白血病进展、转移和耐药中发挥重要作用[38]等。
3.RNA参与肿瘤增殖与转移
expression、proliferation、apoptosis、invasion、metastasis、migration、growth、progression、carcinoma、cell-proliferation、down-regulation、long noncoding rna、epithelial-mesenchymal transition、colorectal cancer、gastric cancer、tumorigenesis等词代表的蓝色聚类,表示lncRNA、miRNA等参与细胞周期调控和细胞迁移、凋亡,进而参与肿瘤增殖、入侵、上皮间质转化(EMT)与转移,与结直肠癌、胃癌、胶质瘤等多种癌症的预后不良相关。例如,组织相容性白细胞抗原复合物P5(HCP5)与许多自身免疫性疾病及恶性肿瘤相关,并参与抗肿瘤药物的耐药性,有望作为癌症生物标志物和治疗靶标[39];miRNA、lncRNA等分子途径能够作为STAT3在癌症中的上游调节物,STAT3通路可作为胃癌等的治疗靶标[40];与EMT相关的lncRNA在三阴性乳腺癌转移中发挥重要作用[41]等。
4.用RNA干扰技术开发癌症新疗法
resistance、therapy、rna、chemotherapy、sirna、delivery、glioblastoma、binding、nanoparticles、tumor、cisplatin、non-small cell lung cancer、chemoresistance、inhibitor、sensitivity、drug-resistance、immunotherapy等词代表的黄色聚类,表示用RNA干扰技术、RNA适配体技术开发癌症治疗新疗法,如新的癌症免疫疗法以克服癌症的耐药性,以及用纳米粒子输送siRNA,如用新型纳米粒子输送miRNA治疗制剂、输送miRNA与小干扰RNA及相关组合疗法,将适配体作为克服癌症耐药性的靶向配体和治疗分子[42],用RNA干扰技术开发靶向脂质体的癌症新疗法以克服癌症干细胞引起的治疗耐药性[43]等。
1.2.2.2 研究前沿
1.环形RNA作为癌症等疾病的生物标志物的研究
环形RNA(circRNA)在生物学尤其是癌症生物学中发挥着重要作用。circRNA被探索最多的功能是作为基因表达的主调节因子,它可以封存或“海绵”其他基因表达调节因子,尤其是miRNA。circRNA作为癌症和其他疾病的新型生物标志物显示出巨大的前景。研究人员分析了circRNA的合成、功能模式及在生理和病理条件下的作用,并讨论了它们作为新型癌症生物标志物的潜力及尚待解决的挑战[44]。
circRNA在癌症中的功能意义已被充分证实,包括逃避生长抑制因子、诱导细胞凋亡、激活入侵和转移、血管生成和持续增殖信号转导。例如,Hsa_circ_0001361通过miR-491-5p/MMP9轴促进膀胱癌的侵袭和转移[45]。circRNA调节癌症中的信号通路,包括在Wnt/β-catenin信号、PIK3/AKT和MAPK/ERK通路中发挥重要作用。研究表明,众多circRNA可作为肠癌、肺癌、胃癌、乳腺癌和肝癌的诊断与预后生物标志物,且已开展了大量的单中心、回顾性研究,但在被验证、转化到临床应用方面还面临挑战,如相关操作有待标准化。
在心血管方面,目前重点对circRNA生物发生、特性、表达谱、检测方法、功能及其在心脏病理中的相关性进行了研究,包括在缺血再灌注损伤、心肌梗死、心脏衰老、心脏纤维化、心肌病、心脏肥大和心力衰竭、动脉粥样硬化、冠状动脉疾病和动脉瘤等疾病中的作用[46]。
2.lncRNA在癌症、心血管等疾病中的作用
lncRNA在基因调控中发挥着重要作用,在医学中具有重要的应用价值。研究表明,任何转录本,无论其是否有编码潜力,都具有RNA固有的功能[47]。HNTRAIR、MALAT1、ANRIL、LNCRA1-P21、ZEB1-AS1、Xist等lncRNA广泛参与肿瘤、心血管等疾病的发生。例如,LCAT1作为ceRNA调节RAC1功能,作为海绵吸附miR-4715-5p在肺癌中发挥作用[48],m6A诱导的lncRNA RP11通过上调Zeb1引发结直肠癌细胞扩散[49],MALAT1的造血功能缺失会促进动脉粥样硬化和斑块炎症的发生[50]等。在心血管疾病方面,lncRNA可能通过调节内皮细胞增殖(如MALAT1、H19)或血管生成(如MEG3、MANTIS)来调节内皮功能障碍。lncRNA参与调控血管平滑肌细胞(VSMC)表型或血管重塑(如ANRIL、SMILR、SENCR、MYOSLID),已有研究探索了lncRNA在白细胞活化(如lincRNA-Cox2、linc00305、THRIL)、巨噬细胞极化(如GAS5)和胆固醇代谢(如LeXis)等方面发挥的作用[51]。
lncRNA领域成果层出不穷,迫切需要辨别其潜在功能作用,以进一步研究人类复杂疾病的病理,开发疾病预防、诊断、治疗、预后的生物标志物方法。目前,已有研究人员基于相关数据库开发计算模型与算法,来预测大部分潜在lncRNA功能和大规模计算lncRNA功能相似性的有效途径,提出未来lncRNA功能预测和功能相似度计算的方向。构建系统的功能标注体系对于加强计算模型的预测准确性至关重要,这将加速未来新型lncRNA功能的鉴定进程[52]。
研究人员将受lncRNA影响的细胞过程与疾病特征联系起来,有利于新的研究方向和治疗方案开发,lncRNA有望成为新的预后生物标志物和治疗靶标。
3.miRNA在癌症等疾病中的作用
miRNA基因表达改变会促进大多数人类恶性肿瘤发生。这些改变是由多种机制导致的,包括miRNA位点缺失、扩增或突变、表观遗传学沉默,或者靶向特定miRNA基因的转录因子失调等。由于恶性细胞依赖miRNA基因的失调表达,而miRNA失调表达反过来被多个蛋白编码的癌基因或肿瘤抑制基因失调所控制,这些miRNA在未来的基于miRNA疗法开发中发挥着重要作用:①人类癌症中涉及的miRNA失调,以及这些失调在癌症启动与进展中的作用。②miRNA表达谱可用作评估那些人类癌症中失调的miRNA。③miRNA作为肿瘤抑制剂靶向重要的癌基因,如B细胞白血病/2型淋巴瘤(BCL2)、MYC和RAS。④miRNA作为癌基因靶向重要的肿瘤抑制因子,如磷酸酶、p27、p57和金属蛋白酶组织抑制剂3(TIMP3)。⑤miRNA基因可被表观遗传学变化沉默,也可导致表观遗传学变化,进而导致肿瘤抑制基因沉默,如miR-29家族成员缺失导致DNA甲基转移酶过表达和肿瘤抑制子沉默。将miR-29重新引入肿瘤细胞中会导致被沉默的肿瘤抑制因子被重新激活,产生肿瘤抑制性。⑥相同的miRNA在多种肿瘤中失调,表明它们可能是人类癌症中常见失调通路的靶点。⑦失调miRNA可以作为抗癌疗法的靶标[53]。
此外,近年来研究人员还通过深度学习和建模分析,大规模研究miRNA参与的疾病机制,以及miRNA与lncRNA、mRNA的相互作用。例如,通过构建一个融合集合学习和降维的计算框架开发了新型算法来全面分析miRNA-疾病的关联性[54];选取了5种重要的miRNA相关人类疾病和5种关键的疾病相关miRNA,开展了miRNA-靶标相互作用研究,分析了20种miRNA-疾病关联的计算模型,总结出构建强大的计算模型预测潜在miRNA-疾病关联的框架,包括5个可行的重要研究模式:①可以利用疾病模块原理(相似疾病往往与功能相似的miRNA相关),根据实验已验证的关联性,预测新的疾病-miRNA关联。②可以通过计算候选miRNA的靶基因与已知疾病基因之间的功能相似度,来识别给定疾病的潜在相关miRNA。③可将社会网络分析的计算模型扩展到miRNA-疾病关联预测,考虑到同一个miRNA家族或簇中的成员往往与相同或相似的疾病相关,miRNA家族和簇的信息可以用于模型的构建。④几乎所有的计算模型都只能预测所研究疾病与miRNA之间是否存在关联,只有RBMMMDA(Restricted Boltzmann Machine for Multiple types of MiRNA-Disease Association)可以预测miRNA与疾病之间的关联类型。因此,对于这些重要的生物学模型,应加大力度解决。⑤未来的算法不仅要预测miRNA与疾病的关联,还应该预测疾病相关的miRNA-靶标相互作用[55]。也有研究人员以乳腺癌为例,研究了mRNA-lncRNA-miRNA相互作用的综合网络[56]。
4.胞外囊泡/外泌体中的ncRNA参与肿瘤等疾病发生发展
从各种肿瘤细胞类型中释放出来的肿瘤细胞外囊泡(TEV)包括内膜来源的外泌体和微泡(MV)。TEV包含了无数的生物分子,如蛋白质、DNA、代谢物和miRNA,它们可以在细胞间转移。此外,TEV还能协调正常和恶性发育的基本过程,如参与乳腺癌的发展。因此,TEV是肿瘤微环境(TME)的重要组成成分,通过将封装的分子载体从母细胞转导到受体细胞,并通过与靶细胞的直接相互作用,充当信使进行信息传递。研究表明,TEV通过促进入侵、血管生成、转移前的微环境准备、逃避免疫监视和诱导耐药性治疗来促进乳腺癌等癌症的发展。TEV有望成为有前景的诊断生物标志物、治疗载体和靶标[57]。此外,还有人员研究了胞外囊泡/外泌体在结直肠癌[58]、糖尿病[59]等疾病的发生、诊断和治疗中的重要作用。
5.RNA甲基化修饰与疾病的关系
N6-甲基腺苷(m6A)是真核生物信使RNA(mRNA)中最丰富的内部化学修饰。近年来,研究人员对动态m6A和其他RNA修饰的调控生物学功能进行了广泛研究。外泌体标记m6A通过复杂的酶和其他蛋白网络的活动进行书写、读取和擦除,m6A结合蛋白读取m6A标记并通过改变RNA代谢过程信号转导其下游调控作用。研究人员目前对m6A修饰的认识,重点是其写入、擦除和读取蛋白在转录后基因调控中的功能,并研究了m6A修饰对人类健康的影响[60]。
m6A修饰与多种癌症进展相关。研究显示,在上皮-间质转化(EMT)期间,癌细胞转移的重要步骤之一是癌细胞中mRNA的m6A修饰增加。删除甲基转移酶样3(METTL3)可下调m6A,损害癌细胞体外和体内的迁移、侵袭和EMT,对m6A的测序和功能研究证实,EMT的关键转录因子Snail参与了m6A调控的EMT,Snail CDS中的m6A触发了癌细胞中Snail mRNA的多体介导翻译。研究证实,YTHDF1介导m6A可以增加Snail mRNA的翻译。此外,METTL3和YTHDF1的上调可作为肝癌患者总生存率的不良预后因素。m6A对癌细胞EMT的调控及在此过程中Snail的翻译起关键作用[61]。m6A修饰通过调控HINT2 mRNA翻译抑制眼部黑色素瘤的发生[62]。
1.2.3 RNA与现代农业
1.2.3.1 研究热点
RNA与现代农业领域研究热点如图1.3所示。
1.植物miRNA、lncRNA的形成、识别与功能鉴定
identification、gene、arabidopsis、microrna、evolution、stress、chloroplast genome、resistance、transcriptome、phylogenetic analysis、biogenesis、wheat、rices、abiotic stress等词代表的红色聚类,表示以拟南芥、小麦、水稻为代表的植物中的miRNA、lncRNA等非编码RNA的形成、演化、识别与功能鉴定,包括在全基因组水平、叶绿体基因组水平识别植物miRNA并加以注释,植物miRNA的功能鉴定包括非生物胁迫耐受和生物胁迫耐受(耐旱、耐寒、抗盐、耐除草剂等)、转录调控、植物发育等方面的作用。例如,小麦SRO基因家族的全基因组鉴定和表征以揭示不同胁迫下的分子进化和表达谱[63],使用全基因组高通量测序鉴定和全面分析水稻中对草甘膦胁迫响应的miRNA、lncRNA和mRNA[64],葡萄中与耐寒相关的lncRNA的鉴定和功能预测[65]等。
图1.3 RNA与现代农业领域研究热点
2.RNA在鱼类养殖中的应用
gene-expression、oxidative stress、fish、growth-performance、nf-kappa-b、rainbow-trout、innate immunity、messenger-rna expression、disease resistance、lipopolysaccharide、trout oncorhynchus-mykiss、atlantic salmon等词代表的绿色聚类,表示mRNA、lncRNA等RNA基因表达在虹鳟鱼、鲈鱼、大西洋鲑鱼等养殖品种中免疫应答、抗病、摄食、生长性能等方面的功能研究,如鉴定分析硬骨鱼类免疫调节性RNA种类,以从抑制剂的角度研究鱼的先天免疫力[66]。
3.天然植物中非编码RNA的药用性
expression、growth、apoptosis、activation、inflammation、proliferation、cancer、disease、antioxidant、autophagy、invasion、migration、signaling pathway、survival等词代表的蓝色聚类,表示天然植物中lncRNA等非编码RNA参与炎症、细胞凋亡中的作用鉴定,以便发挥天然植物抗癌、抗炎的药用性,如黄连中的有效成分的药理作用[67],十字花科蔬菜中天然异硫氰酸盐预防多种慢性疾病的作用机制[68]等。
4.RNA在家畜生长发育与繁殖中的调控作用
pig、chicken、cattle、sheep、association、mrna、pregnancy、receptors、localization、reproduction、bovine、hormone、pituitary、maturation、spermatogenesis、follicles、fertility等词代表的黄色聚类,表示mRNA和非编码RNA在牛、羊、鸡的生长、发育与生殖(如精子形成、卵泡发育、发情周期、妊娠)等过程中的调控作用。例如,牛卵泡发育过程中卵巢颗粒细胞中的miRNA富集与降解研究等。
5.RNA与肉用动物肉质提升
Metabolism、differentiation、liver、skeletal-muscle、obesity、adipose-tissue、meat quality、insulin、lipid metabolism、insulin-resistance、quality、adipogenesis等词代表的紫色聚类,表示研究mRNA和非编码RNA在肉用动物脂肪代谢中的调控作用,以提高肉质品质和适口性,如反刍动物肉中大理石花纹和脂肪酸谱的营养基因组学[69]。
1.2.3.2 研究前沿
1.高通量方法鉴定、注释植物miRNA
利用下一代DNA测序等高通量测序方法已经获得了大量的植物小RNA数据集,从而获得了许多miRNA注释信息。目前,很多内源性siRNA被错误地注释成miRNA。大数据时代,研究人员更新了植物miRNA注释的标准,新标准尽可能将复制和假阳性最小化。对于miRNA和所有其他类别的植物小RNA,需要改进注释系统,并从进化和功能角度与复杂的siRNA注释相区别[70]。研究人员对芸香草[71]、番茄[72]等植物进行了全基因组miRNA鉴定。
2.植物lncRNA分类、鉴定与注释
植物lncRNA的分类与鉴定。lncRNA通过各种机制调节基因表达。已有研究人员探讨了目前主要的植物lncRNA分类方法:①根据功能可分成顺式作用lncRNA、作为靶标模拟物的lncRNA、脚手架和导引物的lncRNA等;②基于基因组位点的分类,可分成顺义和内含型lncRNA(Sense and Intronic lncRNA)、反义lncRNA、基因间lncRNA等。研究人员还鉴定出lncRNA介导的植物基因调控的新作用,形成作为植物基因表达的表观遗传调控器的lncRNA子集[73]。
植物环形RNA的鉴定。研究人员鉴定了拟南芥[74]、花生[75]、玉米[76]、水稻[77]、葡萄[78]等植物的环形RNA,并初步分析了环形RNA在植物应激应答[79]、耐旱、耐冷等方面的功能。
3.动物lncRNA的鉴定与功能分析
研究了哺乳动物各器官和各物种的lncRNA发展动态[80];鉴定了奶牛、鸡、罗非鱼等的lncRNA。例如,开展了长非编码RNA的跨物种推断,极大地拓展了反刍动物转录组的范围[81];亚麻籽油和红花油膳食补充后牛乳腺中长非编码RNA的转录组分析[82];姑苏鸡和乔木园鸡胸肌中lncRNA的测序和特征分析[83];环形RNA参与鸡马雷克氏病肿瘤发生的全基因组分析[84];环形RNA是构成哺乳动物眼和脑的内在基因调控轴的重要组成部分[85];猪流行性腹泻病毒感染引起的猪肠上皮细胞环形RNA分析[86];罗非鱼(Oreochromis Niloticus)环形RNA和环形RNA-miRNA网络在远缘动物脑膜炎发病机制中的全面分析[87];环形RNA介导的猪胚胎肌肉发育中ceRNA调控的全基因组分析[88]等。
4.用RNA干扰技术提高植物抗病能力
基于RNA干扰(RNAi)的抗病毒防御是植物对抗病毒的一种小RNA依赖性抑制机制。虽然抗病毒RNAi的核心成分已为人们所熟知,但目前尚不清楚是否存在额外的调节RNAi的因素。近年来,研究人员通过正向遗传筛选发现了抗病毒RNAi的两个新元件,为抗病毒RNAi机制提供了重要启示。同时,发现miRNA对宿主抗病毒RNAi做出了重要贡献。另外,为了对抗宿主抗病毒RNAi,大多数病毒都会编码RNA沉默的病毒抑制因子(VSR)。已有研究揭示了VSR的多种功能,以及植物宿主和病毒之间错综复杂的相互作用。这些发现使人们对植物中复杂的宿主抗病毒防御机制有了进一步的认识,从而为植物抗病毒策略的发展提供了关键信息[89]。
5.植物叶绿体全基因组全分析
研究人员对14种红树林的完整叶绿体基因组进行系统发育和比较基因组分析,结果表明,大多数叶绿体基因是高度保守的,简单序列重复(SSR)的数量是可变的[90]。枯草叶绿体基因组的特征及与其他单子叶植物物种的比较结果表明,其叶绿体基因组有132个基因,包括86个蛋白编码基因、37个tRNA和8个rRNA;对睡茄与其他4个茄科物种的叶绿体基因组进行比较,发现其基因组特征有相似之处,包括结构、核苷酸含量、密码子使用、RNA编辑位点、SSR、寡核苷酸重复和串联重复[91]。
6.植物选择性剪接及其功能分析
选择性剪接(Alternative Splicing,AS)在植物中普遍存在,并参与植物与环境胁迫之间的许多相互作用。然而,植物中AS进化的模式和基本机制仍不清楚。雌雄同体中选择性剪接的进化分析揭示了AS的分化主要是由于正交基因之间AS事件的得失。此外,研究发现,产生含有过早终止密码子(PTC)的转录本的AS,很可能比产生不含PTC的转录本的AS更加保守,比较分析进一步表明,所确定的AS决定因子的变化显著地导致茄科和十字花科两个分类群中密切相关物种之间的AS差异[92]。研究发现,拟南芥lncRNA asco通过与剪接因子的相互作用调控转录组[93],通过整合多个番茄转录数据源扩大选择性剪接的识别范围[94]。
植物选择性剪接与植物的环境适应能力、抗逆、抗应激等密切相关。在植物中,表观遗传修饰在胁迫下调控转录速率和mRNA丰度的作用开始显现。然而,表观遗传和表观修饰调控AS和翻译效率的机制还需要进一步研究。染色质全景(Chromatin Landscape)在应激下的动态变化可能提供了一个支架,基因表达、AS和翻译是围绕这个支架进行调控的。研究人员探索了基于CRISPR/Cas的策略,用于工程染色质架构,以操纵AS模式(或拼接异构体水平),获得对AS的表观遗传调控的进一步认识[95]。例如,田间生长的甘蔗其昼夜节律钟(Circadian Clock)的基因的选择性剪接与温度适应性相关[96]等。
7.与动物生产能力相关的ncRNA的鉴定
越来越多的研究表明,ncRNA与动物产奶、产肉性能密切相关。在奶牛方面,牛奶外泌体的很大一部分积聚在大脑中,而不同种类的miRNA的组织分布也有所不同。逃逸吸收的牛奶外泌体部分会引起肠道内微生物群落的变化。饮食中外泌体及其载体的消耗会导致循环中miRNA的损失,并引起表型的变化,如认知能力的丧失、嘌呤代谢物的增加、繁殖力的丧失和免疫反应的变化[97]。例如,感染金黄色葡萄球菌的牛乳中不同表达的外泌体微粒体的鉴定和表征[98],口服牛乳、猪乳中的外泌体改变仔猪血清中的miRNA谱[99]等。
1.2.4 RNA新技术与新方法
1.2.4.1 研究热点
RNA新技术与新方法领域研究热点如图1.4所示。
图1.4 RNA新技术与新方法领域研究热点
1.RNA检测、功能鉴定、转录、翻译的调控机制的研究方法开发
Gene expression、identification、protein、rnai、messenger-rna、transcription、resistance、interference、biogenesis等词代表的红色聚类,表示RNA干扰、核糖体表达谱、ChIP-seq、RNA-seq等技术的改进及其应用于ncRNA生物形成、功能鉴定及转录、翻译调控研究等。
2.基于RNA干扰技术的基因治疗新疗法开发
rna interference、sirna、microrna、in-vivo、delivery、in-vitro、nanoparticles、therapy、gene silencing、gene therapy、stability、tumor等词代表的绿色聚类,表示用RNA干扰技术开发成基因疗法,改进纳米颗粒载体来输送基因疗法中的siRNA或微RNA(miRNA)[100],如提高产品的稳定性和靶向性等。
3.用RNA研究方法研究ncRNA在癌症中的作用
Expression、proliferation、cancer、apoptosis、invasion、growth、metastasis、migration、micrornas、progression、long noncoding rna、breast cancer、prognosis、autophagy等词代表的蓝色聚类,表示用RNA新方法研究miRNA、lncRNA、环形RNA等ncRNA在癌细胞增殖、入侵、凋亡及癌细胞耐药性中的作用机制及其作为乳腺癌、肝癌等癌症的诊断、预后的潜在标志物。例如,DLX6-AS1能促进乳腺癌发展[101],环形RNA在肝癌发生发展中发挥作用[102],miRNA-338-3p在癌症生长、入侵、耐药性等方面发挥重要作用[103]。
4.用RNA研究方法研究非编码RNA在炎症、氧化应激中的作用
Cells、activation、mechanisms、inhibition、disease、inflammation、metabolism、oxidative stress、angiogenesis、nf-kappa-b、biomarker、hypoxia等词代表的黄色聚类,表示用相关方法研究非编码RNA、外显组等在机体炎症发生与氧化应激中的作用。
5.RNA标记与成像技术开发
Differentiation、rna-seq、heterogeneity、transcriptome、mouse、dynamics、scrna-seq、single-cell rna sequencing、macrophages、quantification、gene expression等词代表的紫色聚类,表示单细胞RNA测序技术、新型RNA-seq、scRNA-seq等技术的开发,并进行非编码RNA的定量分析、转录组等方面的研究。
1.2.4.2 研究前沿
1.新型研究技术的开发
用核糖体表达谱测定翻译调控水平。核糖体表达谱(Ribosome Profiling)是一种强大的、全面监测RNA翻译的技术,其被应用于从密码子占有率表达谱(Codon Occupancy Profiling)、主动翻译的开放阅读框(ORF)的识别,到各种生理或实验条件下翻译效率的量化等。研究表明,翻译控制在蛋白质丰度测定中发挥重要作用。常用的测量mRNA种类丰度的全基因组分析方法有微阵列和RNA-seq,但是这两种方法都没有提供关于蛋白质合成的信息,蛋白质合成才是基因表达的真正终点。而核糖体表达谱方法通过核酶印记(Nuclease Footprinting)准确绘制出核糖体在转录本上的确切位置,成为一种新兴的技术,它使用深度测序监测活体内翻译。研究人员提出了一个核糖体表达谱中用深度测序定量分析活体内全基因组翻译的协议[104],以改进核糖体表达谱。目前,使用核糖体表达谱的研究已经为识别细胞产生的蛋白质种类和数量提供了新的见解,使人们对蛋白质合成机制本身也有了更详细的了解[105]。
单细胞RNA测序数据相关算法和工具开发。单细胞RNA测序(Single Cell RNA-seq)技术可以在单细胞分辨率下对基因表达进行剖析,研究人员已经开发出许多的生物信息学方法来分析和解释scRNA-seq数据,但需要新颖的算法来确保结果的准确性和可重复性。研究人员已经开发出被广泛使用的19种scRNA-seq技术,并开发出多样化的scRNA-seq数据分析方法,涉及读图和表达定量化、亚种群识别、差异化表达分析等。未来需要从质量控制、读图、基因表达量化、批效应校正、归一化、推算、维度降低、特征选择、细胞聚类、轨迹推理、差异表达调用、替代拼接、等位基因表达和基因调控网络重建等方面进行改进[106]。另有研究人员利用scRNA-seq数据分析了细胞异质性[107],从scRNA-seq数据中鉴定细胞类型,绘制人类细胞图谱[108]或分析发育轨迹[109]等。此外,也有研究人员利用深度机器学习方法来对单细胞RNA-seq数据进行聚类和标注[110]。
2.RNAi等产业应用技术开发
利用RNAi沉默疾病相关基因,有望发展成一类新疗法。2017年,首个RNAi技术药物已被FDA批准上市,还有许多RNAi药物处于临床试验中,如RNAi疗法用于治疗急性间歇性卟啉症[111]等。这类疗法中,将siRNA输送到靶点是RNAi发挥作用的关键,研究人员开发的脂质纳米粒(LNP),能有效地将siRNA输送到肝脏和肿瘤组织中。
此外,RNAi技术也被应用于农业害虫控制。目前,基于RNAi的害虫管理策略的推广受到了阻碍,因为对不同的昆虫种类、品系、发育阶段、组织和基因的控制效率差异很大,这是由内体诱捕、核心机制功能缺陷、免疫刺激不足等因素导致的[112]。研究人员正在从技术角度努力克服这些困难。
3.RNA信息学:相关数据库构建和软件工具开发
相关RNA数据库在不断更新中,曼彻斯特大学Griffiths-Jones S等开发的miRBase数据库,用深度测序技术注释高可信度miRNA,该数据库2019年发布了新的版本,除对miRNA进行编目、命名外,还增加了大量的与miRNA相关的功能数据[113]。中山大学RNA信息中心屈良鹄、杨建华教授等开发的starBase v2.0,用大规模CLIP-seq来解码miRNA-ceRNA、miRNA-ncRNA、蛋白质-RNA相互作用网络[114],目前该数据库已更新到v3.0版本。哈佛大学研究人员开发了核糖体表达谱数据综合分析与注释平台RiboToolkit,用于集中进行Ribo-seq数据分析,包括数据清洗和质量评估、基于RPF的表达分析、密码子占用率、翻译效率分析、差异翻译分析、功能注释、翻译元基因分析及主动翻译ORF的识别。此外,他们还开发了易于使用的网络界面,以方便数据分析和将结果直观地呈现,将极大地促进基于核糖体表达谱的mRNA翻译研究[115]。
研究人员陆续开发出基于高通量数据的分析工具与软件,如DAVID生物信息学资源包括集成的生物知识库和分析工具,旨在从大规模基因/蛋白质列表中系统地提取有生物学意义的信息[116],该工具2020年更新到v6.8版本[117]等。尤其是近年来研究人员开发了许多单细胞RNA测序工具与软件,包括:①数据分析工具,如DendroSplit、SinCHet、Scater、SPRING、ASAP、SIMLR、SCANPY、TSCAN、FastProject、Granatum、FIt-SNE、SC3等;②聚类方法,如基于K-means的RaceID、层次聚类的SINCERA等[118]。
研究人员充分利用深度学习方法来挖掘单细胞RNA测序数据,开发出相关分析软件和工具。例如,利用半监督深度学习对单细胞转录组的基因表达和结构进行高度可扩展和精确推断的方法Disc[119],利用准确、快速、可扩展的深度神经网络方法Deepimpute来推算单细胞RNA-seq数据[120],通过半监督深度学习在单细胞RNA-seq中进行双胞识别的方法Solo[121],用于分析单细胞RNA测序数据的新型深度学习方法Bermuda可揭示隐藏的高分辨率细胞亚型[122],通过深度学习解析基因表达的Digitaldlsorter等[123]。