第二节 核酸的分子结构
一、DNA的分子结构
(一)DNA的一级结构
DNA是由4种脱氧核苷酸通过3',5'-磷酸二酯键相连接,聚合形成多聚脱氧核苷酸链。DNA的一级结构就是指这些脱氧核苷酸在分子中的排列顺序,也就是碱基排列顺序。
核酸分子的大小常用碱基(base或kilobase)数目或碱基对(base pair,bp)数目来表示。原核生物DNA分子较小,最小的病毒DNA约为5000bp;真核生物的DNA分子很大,一般在106~1010bp。由于各种生物的遗传信息均蕴藏于它们的碱基顺序中,因此,DNA一级结构的分析对阐明DNA的结构和功能具有重要意义。于1990年启动的举世瞩目的
人类基因组计划,目的就是要完成人类单倍体基因组DNA 3×109bp全序列的测定,破译决定人类个体生长发育、生老病死的全部遗传信息。
(二)DNA的二级结构
1952年,E.Chargaff等采用色谱和紫外分析等技术,深入研究了DNA分子的碱基组成成分。他们发现DNA分子组成中具有如下规律:①腺嘌呤和胸腺嘧啶的物质的量总是相等,鸟嘌呤与胞嘧啶的物质的量总是相等;②不同种属生物的DNA碱基组分不同;③同一生物体的不同器官、不同组织中的DNA具有相同的碱基组成。
英国的R.Franklin和M.Wilkins于1952年获得了高质量的DNA分子X射线衍射图。他们分析认为DNA是螺旋性分子,且是以双链形式存在的。综合前人的研究成果,J.Watson和F.Crick于1953年提出了DNA的双螺旋结构模型,阐明了DNA的二级结构。这一模型的提出为生物体内遗传物质的传代和表达等DNA的功能研究奠定了基础,推动了现代分子生物学与生命科学的发展。DNA的双螺旋结构模型要点如下。
① DNA分子由两条反向平行(即一条链由3'→5',另一条链由5'→3')的脱氧核苷酸链构成双螺旋结构。两条链围绕一中心轴形成右手螺旋。螺旋表面形成大沟(major groove)与小沟(minor groove)(图2-11)。这些沟状结构与蛋白质、DNA之间的相互识别有关。
图2-11 DNA分子双螺旋结构模型图解
② 在两条链中,亲水的磷酸与脱氧核糖通过3',5'-磷酸二酯键相连而成的亲水骨架位于螺旋的外侧,疏水的嘌呤和嘧啶碱基平面层叠于螺旋的内侧,碱基平面与戊糖环平面互相垂直。
③ 两条链通过碱基对之间形成的氢键而稳定地维系在一起,并且总是A和T、G和C之间配对,A-T之间形成两个氢键,G-C之间形成三个氢键(图2-12)。这一规律称为“碱基配对规律”或“碱基互补规律”。碱基对之间的氢键维持DNA双螺旋结构横向的稳定性。碱基互补配对原则是双螺旋最重要的特性,其重要的生物学意义在于,它是DNA复制、转录以及逆转录的分子基础。
图2-12 碱基对之间的氢键
④ 双螺旋的直径为2nm,在同一条链上相邻两个碱基平面之间的轴向距离为0.34nm,其旋转的夹角为36°;每隔10个碱基对,脱氧多核苷酸链就绕一圈,螺距为3.4nm。轴向相邻的碱基对之间呈板状堆积,由此产生了具有疏水性的碱基堆积力,是维系DNA双螺旋结构纵向稳定的主要作用力。
(三)DNA双螺旋结构的多样性
除了一些小分子噬菌体如M13噬菌体的DNA,以及一些DNA病毒的DNA是单链结构外,大多数天然DNA分子都是双螺旋结构。前述Watson-Crick提出的双螺旋模型是在低离子强度的溶液(生理盐溶液)和染色体中存在的主要构象,称为B型DNA。这种构型在水性环境和生理条件下最为稳定。自然界中还存在有A型DNA,其含水量少于B型。两者在沟的深浅、螺距、旋转角度、碱基平面距离、每一螺旋的碱基数目等参数上存在一定差异。1979年A.Rich等在研究人工合成的寡核苷酸CGCGCG的晶体结构时竟发现这种DNA为左手螺旋。后来证明这种结构在天然的DNA分子中同样存在,人们称之为Z-DNA(图2-13)。生物体内的这些不同类型的DNA在功能上可能有所差异,是与基因的表达调控相适应的。
图2-13 不同类型的DNA双螺旋结构
(四)DNA的三级结构
DNA双螺旋进一步扭曲或再次螺旋所形成的空间构象,就是DNA的三级结构。双链DNA多为线形分子,但某些病毒、真核生物的线粒体和叶绿体,以及某些细菌的染色体DNA为双链环状DNA(dcDNA)。在生物体内,绝大多数双链环状DNA可进一步扭曲或盘绕成超螺旋(supercoil)(图2-14)。当盘绕方向与DNA双螺旋方向相同时螺旋会变得更紧,这种超螺旋称为正超螺旋;反之则称为负超螺旋。正超螺旋DNA具有更为致密的结构,可以将很长的DNA分子压缩在一个较小的体积内,且由于密度较大,在离心场中和凝胶电泳中的移动速度亦较快。
图2-14 DNA的三级结构
真核细胞核染色质DNA为很长的线形双螺旋,DNA通常是与组蛋白和非组蛋白(呈酸性,故又称酸性蛋白)相结合存在,DNA双螺旋盘绕组蛋白形成核小体(nucleosome),核小体是染色质的基本结构单位。完整的核小体由两部分组成,即核小体核心颗粒和连接区。许多核小体核心颗粒之间由连接区相连,形成念珠状结构。组蛋白是一类富含赖氨酸和精氨酸的碱性蛋白,分为五种,分别用符号H1、H2A、H2B、H3、H4表示。核小体的核心由H2A~H4四种组蛋白组成,形成八聚体结构,DNA缠绕在它的表面,长度为140~145个碱基对。连接核小体核心颗粒的是核小体连接区,其DNA在不同种生物中长度不一,约为25~100个碱基对,H1组蛋白结合于该部位(图2-15)。
图2-15 核小体的结构示意图
由核小体构成的念珠状结构进一步盘绕压缩成更高层次的结构。据估算,人的DNA分子在染色质中反复折叠盘绕共压缩8000~10000倍。
DNA是生物遗传信息的载体,DNA的遗传信息是以基因的形式存在的。基因是DNA分子中的功能片段,其中的核苷酸排列顺序决定了基因的功能。基因的表达产物是蛋白质和与之相关的各种RNA。因此DNA的基本功能是作为生物遗传信息的携带者,作为复制的模板将遗传信息传递给子代;同时作为基因转录的模板,表达生命活动的执行者蛋白质,体现个体的生命现象。
二、RNA的分子结构
(一)RNA的类型
RNA在生命活动中的作用是与蛋白质共同负责基因的表达和表达过程的调控。RNA通常以单链形式存在,但也可以通过链内的碱基配对形成局部的双螺旋二级结构或三级结构。RNA分子量比DNA小得多,由数十个至数千个核苷酸组成。但是它的种类、大小和结构都远比DNA复杂,这是由它功能的多样性决定的。参与蛋白质合成的RNA有三类:信使核糖核酸(messenger RNA,mRNA)、转运核糖核酸(transfer RNA,tRNA)和核蛋白体核糖核酸(ribosomal RNA,rRNA)。此外,细胞内还有许多小分子非编码RNA,它们主要参与基因表达过程中的调控(表2-2)。
表2-2 真核细胞内主要RNA的种类与功能
1. mRNA
mRNA占细胞中RNA总量的2%~5%,是蛋白质合成的模板。mRNA是在细胞核内以DNA为模板合成的。在细胞核内合成的mRNA前体比成熟的mRNA要大得多,而且这种初级的RNA分子大小不一,故称为核不均一RNA(heterogeneous nuclear RNA,hnRNA)。hnRNA在细胞核内存在的时间极短,经过剪接加工成为成熟mRNA,并通过特殊的机制转移至细胞质中作为蛋白质合成的模板。成熟的mRNA由氨基酸编码区和非编码区组成。真核生物成熟mRNA的结构特点是在其5'-端具有一个7-甲基鸟苷三磷酸帽子结构和在其3'-端含有一个多聚腺苷酸尾结构(图2-16)。而原核生物mRNA没有这种结构。5'-端帽子结构是由鸟苷酸转移酶在转录后加工过程中添加上去的,与mRNA中其他核苷酸呈相反方向,形成了5'-5'连接,使得mRNA不再具有5'-末端的磷酸基团,同时与帽子结构相邻的第一个核苷酸中戊糖的C2'通常也被甲基化(图2-17)。成熟mRNA 3'-端多聚腺苷酸尾也是在转录完成后由poly(A)转移酶催化加上去的。5'-端帽子结构和3'-端多聚腺苷酸尾结构对维系mRNA的稳定免受核酸酶的降解、从细胞核向细胞质转运、与核蛋白体结合参与翻译起始调控等均有重要作用。mRNA是三类RNA中最不稳定的,它代谢活跃,更新速度快。原核生物(如大肠杆菌)mRNA的半衰期只有几分钟,真核细胞中的mRNA寿命较长,可达几小时以上。
图2-16 真核生物成熟mRNA结构示意图
图2-17 真核生物mRNA 5'-端帽子结构
mRNA的功能是把储存在DNA中的遗传信息(即碱基序列)抄录下来并转移到细胞质,决定着每一种蛋白质肽链中氨基酸的排列顺序。在mRNA的编码区,从5'-端第一个翻译起始密码AUG开始,每三个核苷酸为一组,决定肽链上某一种氨基酸,这些三个一组的核苷酸顺序称为三联体密码(triplet code)或密码子(codon)。
2. tRNA
tRNA约占细胞RNA总量的15%,通常以游离的状态存在于细胞质中。tRNA是长度为74~95个核苷酸残基的小分子,分子量在25000左右,在三类RNA中它的分子量最小。细胞内tRNA种类很多,目前已完成一级结构测序的tRNA共有100多种。每一种氨基酸都有特异转运它的一种或几种tRNA。
tRNA的功能是在蛋白质生物合成中携带活化了的氨基酸,并将其转运到与核糖体结合的mRNA上用以合成蛋白质。
3. rRNA
rRNA是细胞中含量最多的一类RNA,约占细胞中RNA总量的80%以上,是细胞中核蛋白体(ribosome)的组成成分,rRNA与核蛋白体蛋白共同构成核蛋白体。核蛋白体或核糖体,是一种亚细胞结构,直径为10~20nm的微小颗粒。rRNA约占核糖体的60%,其余40%为蛋白质。原核生物有三种rRNA,按其大小依次为23S rRNA、16S rRNA、5S rRNA(S是大分子物质在超速离心沉降中的沉降系数)。它们分别与不同的核蛋白体蛋白结合形成了核蛋白体的大亚基和小亚基。构成真核生物核蛋白体大小亚基的是28S rRNA、18S rRNA、5S rRNA和5.8S rRNA。
核蛋白体是细胞内蛋白质合成的场所,核蛋白体中的rRNA和核蛋白体蛋白共同为蛋白质生物合成所需要的mRNA、tRNA以及多种蛋白因子提供相互结合和相互作用的空间环境。
除了上述三种RNA外,细胞内还存在着许多其他种类的小分子非编码RNA。有关小分子非编码RNA的研究成为近年来的研究热点,并由此产生了RNA组学的概念。小分子非编码RNA主要包括核内小RNA(small nuclear RNA,snRNA)、核仁小RNA(small nucleolar RNA,snoRNA)、胞质小RNA(small cytoplasmic RNA,scRNA)、催化性小RNA(small catalytic RNA)、小干扰RNA(small interfering RNA,siRNA)、微小RNA(microRNA,miRNA)等。这些小分子非编码RNA在hnRNA和rRNA的转录后加工、转运以及基因表达调控等方面具有重要的生理作用。许多snRNA参与了真核细胞hnRNA的剪接加工过程,它们的作用是识别hnRNA上外显子和内含子的接点,将内含子切除。snoRNA主要参与rRNA中核糖C2'的甲基化修饰。1982年T.Cech和S.Altman等在研究四膜虫rRNA前体的加工中发现rRNA前体本身具有自我催化的作用。他们将这些催化性小RNA称之为核酶(ribozyme)。现已发现多种具有酶催化活性的催化性小RNA。siRNA是生物宿主对于外源入侵的基因所表达的双链RNA进行切割后所产生的具有特定长度(21~23bp)和特定序列的小片段RNA。这些siRNA可以与外源基因表达的mRNA相结合并诱发这些mRNA发生降解,或导致其翻译受到抑制。利用这一机制发展起来的RNA干扰(RNA interference,RNAi)技术正被广泛应用于研究基因功能、基因治疗等领域。miRNA是一大类长度为21~25nt的小分子单链RNA。广泛存在于真核生物中,由内源基因编码,通过转录和加工后合成。这些单链的miRNA通过与siRNA相似的作用机制对靶mRNA实现基因沉默。miRNA在生物体的生长、发育、疾病发生中有着重要的调控作用。目前预测人类10%~30%的基因都有miRNA参与调控。
(二)RNA的一级结构
RNA的一级结构是指多核苷酸链中核苷酸的排列顺序。RNA分子除在某些病毒中为双链结构外,细胞RNA分子通常是单链结构。不同来源、不同种类RNA的核苷酸组成均不相同,碱基组成不像DNA那样有规律。在有些RNA,特别是tRNA中,除四种基本碱基外,还有几十种稀有碱基,如双氢尿嘧啶(DHU)、假尿嘧啶(Ψ)和甲基化的嘌呤(mG、mA)等。这些稀有成分可能与tRNA的生物学功能有一定的关系。
(三)RNA的二级结构
RNA的多核苷酸链虽然为单链结构,但在有着碱基互补配对关系的某些局部区域可以发生弯曲折叠,形成局部的双螺旋区,此即RNA的二级结构(图2-18)。
图2-18 RNA的二级结构
双螺旋区的碱基也按一定规律配对,A-U之间形成氢键,G-C之间形成氢键,每一双螺旋区至少有4~6对碱基对才能稳定。这些局部的螺旋区呈茎状,而不能配对的部分则形成环状结构,称为茎环(stem-loop)结构或发夹(hairpin)结构。不同种类RNA分子中的双螺旋区所占比例不同,rRNA的双螺旋区约占40%,tRNA的双螺旋区约占50%。
RNA二级结构研究得比较清楚的是tRNA。tRNA的线性核糖核酸链有几个片段回折形成局部双螺旋区,而非互补区形成环状结构。绝大多数tRNA都有四个双螺旋区、四个环及一个氨基酸接纳臂,使其二级结构呈三叶草形(图2-19)。
图2-19 tRNA的三叶草形二级结构
tRNA分子左侧的环含有两个二氢尿嘧啶,称为二氢尿嘧啶环(DHU环)。右侧的环含有核糖胸苷(T)—假尿苷(Ψ)—核糖胞苷(C)序列,称为TΨC环,此环可能与结合核蛋白体有关。最令人注意的是位于分子底部的环,称为反密码子环,其顶端的三个核苷酸残基组成三联反密码子,与mRNA分子上的三联密码子通过碱基互补的关系相互识别,不同的tRNA有不同的反密码子。在蛋白质生物合成中,tRNA反密码子依靠碱基互补的方式辨认mRNA的密码子,将其所携带的氨基酸正确地运送到蛋白质合成的场所。此外,tRNA分子中还有一个额外环,此环所含的碱基数目是可变的,导致不同的tRNA分子其分子大小不同。
(四)RNA的三级结构
RNA的三级结构是指多聚核苷酸链中所有原子在三维空间中伸展所形成的相对空间排布位置。RNA三级结构研究得较清楚的也是tRNA。tRNA的二级结构在空间进一步伸展,形成倒“L”形的三维空间结构,即tRNA的三级结构(图2-20)。在倒“L”形的一端为反密码子环,另一端为氨基酸接纳臂,拐角处则为TΨC环和DHU环。从这可看出,虽然TΨC环和DHU环在二级结构上各处一方,但在三级结构上相距很近。
图2-20 tRNA的三级结构