上QQ阅读APP看书,第一时间看更新
第一节 miRNA:非编码RNA家族新贵
一、非编码RNA家族
生物体中的核糖核酸(ribonucleic acid,RNA)可以分成两大类:编码RNA(protein-coding RNA)和非编码RNA(non-coding RNA,ncRNA)。前者仅有一种,即信使RNA(messenger RNA,mRNA),而后者包括近20种不同的RNA分子 [1-3]。mRNA的序列中含有所谓开放阅读框(open reading frame,ORF),其中包括蛋白质翻译的启动位点(start codon)和终止位点(stop codon)。ncRNA不含有ORF,因此不编码蛋白质。mRNA不具备直接的细胞功能,它们通过翻译程序生成蛋白质或者产生ncRNA来行使细胞功能,而ncRNA本身就能够发挥各种各样的细胞功能,因此也被称为功能性RNA(functional RNA,fRNA)。为了方便叙述,笔者在此将所有ncRNA归入非编码RNA大家族(ncRNA superfamily),这个大家族的成员可以按照“个头”大小(核苷酸序列长度)分为三个家族(family):小ncRNA或短链ncRNA家族(核苷酸序列长度通常﹤50nt)、中长或中链ncRNA家族(序列长度=50~500nt)和长链ncRNA家族(序列长度﹥500nt)。每个家族又是由若干个亚家族组成,而每个亚家族的成员数目不等,少则几个,多则数千。
(一)短链ncRNA家族
高等生物体内存在着大量的短链ncRNA,它们组成了细胞中高度复杂的基因调控网络。短链ncRNA在胚胎发生发育、细胞增殖分化、肿瘤发生发展、干细胞分化等细胞水平的几乎所有生命活动中,以及各类人类疾病的发生发展中,都起着极其重要的调控作用。短链ncRNA家族是由微小RNA、小干扰RNA、piRNA、小核RNA和核仁小RNA这些亚家族所组成的,它们各自在生物体中起着不同但又可能互相重叠的基因调控作用。
1.微小RNA(microRNA,miRNA或miR)
成熟的miRNA的序列长度大约为21~25nt,是由其70~90nt长的带有发夹结构的miRNA前体(miRNA precursor,pre-miRNA)经过Dicer(RNAaseⅢ家族中对双链RNA具有特异性切割功能的酶)加工后生成。它们广泛存在于真核生物中,在物种间具有高度的序列保守性,表达具时序性、组织特异性以及疾病特异性(即特定的miRNA只有在特定的时间、组织或病理状态才会表达) [4,5]。从第一个miRNA被发现以来,迄今人们已经从206个不同的物种中确认了3万多个miRNAs分子(包括人类基因组中的约5600个miRNAs) [6],而且这个数值还在不断地攀升。据推测,miRNAs调节着至少50%的人类基因。可见,miRNA是当之无愧的ncRNA家族的新贵和“掌门人”,也是本书的主角。
miRNA通过其种子序列(seed sequence,5′端2~8位碱基)与靶基因(mRNA)3′末端非翻译区(3′UTR)碱基互补并以氢键结合,继而起到抑制基因表达的作用。这种结合会阻止蛋白翻译过程,也可能导致靶mRNA的降解 [7-10]。按其作用模式的不同,miRNAs可被分为三个类型:①抑制翻译型,以线虫 lin-4为代表。发挥作用时与靶基因不完全互补结合,抑制翻译而不影响mRNA的稳定性(不改变mRNA丰度)。这类miRNAs是目前发现最多的一类。②mRNA降解型,以拟南芥 miR-171为代表。其作用方式和功能与siRNA非常类似,发挥作用时与靶标基因完全互补结合,使靶mRNA降解,从而抑制基因表达。这个类型主要存在于植物细胞中。③全能型,以lethal-7( let-7)为代表。它同时具备以上两种作用模式:当与靶标基因完全互补结合时,直接降解靶mRNA;当与靶基因不完全互补结合时,起着蛋白翻译抑制的作用。研究表明:每个miRNA可以有多个靶基因,而同一个基因亦有可能接受多个miRNAs的调节。这种复杂的调节网络达成了对靶基因的精细调控。
2.小干扰RNA(small/short interference RNA,siRNA)
1999年,Hamilton等在植物基因沉默的研究中首次发现:21~25nt双链RNA(double-stranded RNA,dsRNS)。dsRNA的出现对转基因所导致的基因沉默十分重要,而在转基因正确表达的植株中此dsRNA则不出现。随后,Hammond等在进行细胞提取物核酸酶活性实验时证明了小分子RNA在RNAi(RNA interference)中的作用,这些小分子RNAs就是由dsRNA形成的siRNA。siRNA与靶基因完全互补结合,降解mRNA,从而沉默基因表达,起到诸如抗病毒、基因组染色体结构重塑等作用。
3.piRNA(Piwi-interacting RNA,piRNA)
2006年7月, Nature和 Science等杂志几乎同时报道了同一类新型的小ncRNA。它们是从哺乳动物生殖细胞中分离得到的,长度约为30nt,这种小RNA须与Piwi蛋白家族成员结合才能发挥它们的调控作用。piRNA在配子发生过程中起着十分重要的作用,还可以维持生殖系和干细胞功能,并调节mRNA翻译成蛋白质的过程和mRNA的稳定性。
4.小核RNA(small nuclear RNA,snRNA)
snRNA是真核生物转录后加工过程中RNA剪接体(spliceosome)的主要成分,包括5种:U1,U2,U4,U5和U6。其功能主要是与蛋白因子结合形成小核核糖核蛋白颗粒,行使剪接mRNA的功能,参与mRNA前体的加工过程。snRNA还参与端粒酶RNA的加工过程,与染色体末端的复制有关。另外,snRNA还可能成为反义RNA(antisense RNA),参与基因表达的调控。
5.核仁小RNA(small nucleolar RNAs,snoRNA)
snoRNA是最早在核仁发现的小RNA。绝大多数snoRNA可归为两类:Box C/D和Box H/ACA,它们能够形成保守的“茎-内环-茎”状二级结构。Box C/D snoRNA具有指导rRNA、snRNA或tRNA前体中特定核苷2′-O-核糖甲基化修饰的功能;而Box H/ACA snoRNA则对RNA的碱基进行甲尿嘧啶化修饰。有的snoRNA参与rRNA前体的加工剪切,调节rRNA的正确折叠和组装。
(二)中链ncRNA亚家族
1.转运RNA(transfer RNA;tRNA)
tRNA的主要功能是携带氨基酸进入核糖体,在mRNA指导下合成蛋白质。即以mRNA为模板,将其中具有密码意义的核苷酸顺序翻译成蛋白质中的氨基酸顺序。tRNA还具有其他一些功能,例如,在没有核糖体或其他核酸分子的参与下,携带氨基酸转移至专一的受体分子,以合成细胞膜或细胞壁组分;作为反转录酶引物参与DNA合成;作为某些酶的抑制剂等。此外,有的氨酰-tRNA还能调节氨基酸的生物合成。
2.核糖体RNA(ribosomal RNA,rRNA)
rRNA是细胞中含量最多的RNA种类(约占RNA总量的80%)。rRNA与蛋白质结合成核糖体,其功能是作为mRNA的支架,使mRNA分子在其上展开,实现蛋白质的合成。rRNA单独存在时不执行其功能,它与多种蛋白质结合成核糖体,组装成一个蛋白质生物合成的“装配机”。
3.向导RNA(guide RNA,gRNA)
gRNA存在于真核生物中,由单独的基因转录而成,长度大约是60~80个核苷酸。gRNA的主要功能是参与RNA编辑,这是由其序列的特征所决定的:3′端带有寡聚U尾巴(poly U),中段与被编辑mRNA精确互补,5′端有一锚定序列(anchor)与非编辑的mRNA序列互补。
4.反义RNA(antisense RNA,asRNA)
asRNA是指能够与mRNA及其他RNA互补形成双链RNA分子的一类小ncRNA。由于核糖体不能翻译双链RNA,故asRNA与mRNA特异性的互补结合可抑制该mRNA的翻译。这是原核生物基因表达调控的一种方式,在真核生物中除了能够因互补配对而发生的翻译抑制外,还可以因为互补的双链RNA可被Dicer降解为siRNA,从而进入RNAi途径引起的基因沉默过程。人工合成的asRNA基因被导入细胞后,能够转录成asRNA,抑制特定基因的表达,从而达到阻断该基因功能的目的。
5.转运-信使RNA(transfer-messenger RNA,tmRNA)
tmRNA是具有tRNA样和mRNA样复合功能的RNA分子,广泛存在于细菌中。tmRNA识别翻译或读码有误的核糖体,也识别那些延迟停转的核糖体,介导这些有问题的核糖体的崩解。
6.增强子RNA(enhancer RNA,eRNA)
eRNA是从DNA增强子区域转录的ncRNA分子,序列长度约为50~2000nt。增强子是基因组中对邻近基因表达起着促进或增强作用的DNA序列。eRNA能够提高这些增强子的活性,故而能够促进邻近基因的表达。许多广泛表达的、在细胞基本功能中起着重要作用的基因都处于细胞特异性增强子的调控之下。因此,通过抑制eRNA便可以削弱增强子的活性,其有可能成为人为改变基因表达的一种新策略。
7.信号识别颗粒RNA(signal recognition particle RNA,SRP RNA)
SRP RNA是存在于真核生物细胞质中一种小分子ncRNA和六种蛋白的复合体,此复合体能够识别核糖体上新生肽末端的信号,并与之结合,使肽合成终止,同时,它又能够识别并结合内质网膜上的停泊蛋白,从而将mRNA上的核糖体带到内质网膜上。
(三)长链ncRNA亚家族
1.长链ncRNA(long noncoding RNA,lncRNA)
lncRNA序列长度通常﹥200nt,预计在数量上超过miRNA。在分类上大致包括反义lncRNA、内含子lncRNA、长链基因间非编码RNA(lincRNA)、启动子相关lncRNA、非翻译区lncRNA等。lncRNA在序列上保守性较低,只有约12%的lncRNA可在人类之外的其他物种中找到。lncRNA起初被认为是基因组转录的“噪声”,是RNA聚合酶II转录的副产物,不具有生物学功能。但我们现在知道,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰和核内运输等多种重要的调控过程。并且在剂量补偿效应、表观遗传调控、细胞周期调控和细胞分化调控等众多生命活动中发挥重要作用。lncRNA通过多种方式产生,并以多种途径调节靶基因表达,参与调控生物体生长、发育、衰老、死亡等过程。目前研究发现,lncRNA功能异常往往导致疾病发生。随着研究的不断深入和新的lncRNA不断被发现,lncRNA的研究将是RNA基因组研究令人注目的一个方向。
2.不均一核RNA(heterogeneous nuclear RNA,hnRNA或pre-mRNA)
hnRNA是存在于真核生物细胞核中的不稳定、大小不均的一组高分子RNA。哺乳动物的hnRNA平均分子长度为8~10kb,其范围很广泛,从2~14kb均有。hnRNA之所以也被称为pre-mRNA是因为它们往往是真核生物mRNA的前体,即最初转录生成的RNA。
二、miRNA与siRNA
因为miRNA和siRNA之间有许多共同点,因此很容易被互相混淆。但事实上,它们是完全不同的小RNA分子,并分属于两个独立的短链ncRNA亚家族。为了让读者能够弄清楚两者之间的异同所在,也为了能够更好地认识miRNA,我们有必要对它们作一个详尽的比较(表1-1)。
表1-1 miRNA与siRNA比较一览表
(一)miRNA和siRNA的共同点
1.miRNA和siRNA都是长度为约22nt的寡核苷酸;
2.它们都是Dicer酶切割的产物;
3.它们都在转录后调控基因表达,抑制靶标基因功能;
4.它们都是在与AGO2蛋白结合后才能够处于功能状态。
(二)miRNA和siRNA的不同点
1.miRNA是内源性的生物分子是生物体自身基因正常表达并经过一系列生物合成过程而生成的一类ncRNA,其直接来源是具有“茎-环”结构的miRNA前体(pre-miRNA),也是细胞内天然的基因调控网络系统中的一个重要的、不可或缺的组成部分。而siRNA对于动物界来说有外源性和内源性两种。外源性siRNA至少有两个来源途径:第一个途径是来自病毒感染,病毒感染将病毒基因即外源基因带入人体(或其他生物体)细胞,在宿主细胞产生dsRNA,这些dsRNA可被Dicer剪切生成siRNA;第二个途径是人工设计合成的dsRNA,在被引入细胞后可被Dicer剪切生成siRNA。dsRNA是RNA干扰(RNA interference,RNAi)技术使用的核苷酸片段,这个技术的活体应用涉及小发卡或短发卡RNA(small hairpin RNA or short hairpin RNA,shRNA)。shRNA是一段具有紧密发卡环的RNA序列,被用于RNA干扰来沉默靶基因的表达。利用载体将shRNA导入细胞,载体中的启动子确保shRNA在细胞中的表达,shRNA的发卡结构可被细胞机制切割成siRNA而最终发挥RNA干扰作用。这种装载了shRNA的载体可被传递到子代细胞中去,从而使基因的沉默可被遗传。内源性siRNA来源于asRNA与mRNA形成的dsRNA,不是基因编码的RNA分子。
由于miRNA属于内源性ncRNA,它们不会造成机体干扰素反应,而siRNA之类的dsRNA(包括病毒dsRNA)则会引起脊椎动物中的干扰素反应。
2.miRNA在生物体中的表达具有时序性、保守性、组织特异性和疾病特异性。这些特性使得miRNA能够成为人类疾病诊断和预后的生物标志物和疾病治疗的靶点分子。然而,siRNA不具有这些特性和功用。
3.miRNA在作用机制上是以其种子区域(5′端2~8位7个碱基)与靶mRNA 3′UTR(3′端非编码区)序列互补产生不完全配对结合,主要是阻止mRNA的翻译,通常不会降解靶mRNA [7-10];而siRNA通过以其全序列与靶mRNA编码区(ORF)结合位点完全互补结合,并降解靶mRNA,以达到抑制蛋白质翻译的目的。
4.miRNA对靶基因的调节作用不是基因特异性的,而是种子序列特异性的,每一个miRNA都有一个以上的甚至多达数百个相关的、对应的靶基因。这种“多靶”作用正是miRNAs对基因表达具有精细调控(或微调)功能的机制之一。此外,这种“多靶”作用还会产生“信号放大”和“信号调和”的功效,使得基因调控效应处于更加适中的状态,这也是miRNA基因调控能够对细胞生存和功能达成一个最佳平衡态的原因之一。
相反地,siRNA对靶基因的调节作用却是基因特异性的,也是全序列特异性的。理论上,每一个siRNA只能够沉默一个选定的靶基因,但实际上siRNA可能会产生“脱靶”效应而作用于其他不相干的基因。这种“脱靶”作用很大一部分缘由是siRNA的所谓“miRNA样”作用。也就是说,siRNA序列中相当于miRNA种子序列的区域(5′端2~8位7个碱基)可能采取miRNA的作用机制与多个带有互补区域的非选定的基因相结合,而对这些基因都产生表达抑制作用。这种“脱靶”作用往往对生物体是不利的,也是难以预测的。
5.miRNA的功能是对靶基因的微调,因此基因表达抑制作用相对较弱。而siRNA的功能是基因沉默,故其基因抑制强度效率极高。