分子流行病学和分子进化流行病学
上QQ阅读APP看书,第一时间看更新

第一节 DNA的进化

一、DNA含量的进化
伴随着生物有序性的进化,DNA从质和量两方面均发生了巨大的变化。由于越复杂的生物越需要更多的基因来表达、传递更多的遗传信息,因此在生物进化过程中DNA含量不断增多。目前最简单的生物是病毒,有些病毒的基因数量还不足10个;而哺乳动物的每个单倍体染色体基因组约含3万个基因。当然,DNA含量与生物进化只是大致相关而非完全相关。但总体来说,从低等生物到高等生物的进化过程中常常伴随着DNA含量的增加。
二、编码区DNA序列的进化
在生物进化过程中,DNA链发生变异并将该变异保存,并遗传给下一代,造成了生物群体中DNA序列的进化。由于基因编码区3个连续核苷酸(密码子)编码1个氨基酸,再由氨基酸进一步组成蛋白质序列。当细胞暴露于射线、化学药品、病毒或在细胞分裂期DNA复制过程中均可能发生点突变。若细胞DNA点突变恰好发生在编码区,则可能会对该编码区翻译的蛋白质造成很大的影响,从而使细胞的表达性状发生改变。如血红蛋白β亚基编码区基因的第17个碱基“A”被“T”代替则引起镰状细胞贫血。此点突变造成血红蛋白β亚基第6位氨基酸由谷氨酸变成了缬氨酸,使红细胞产生镰刀状外形,由于此种红细胞含氧量低从而引起贫血。
三、非编码RNA的进化
随着越来越多生物的全基因组被测序,除tRNA、rRNA以及snRNA外,越来越多的非编码RNA(miRNA、lincRNA以及circRNA)被发现,并且已经实验证明非编码RNA(non-coding RNA)的基因表达调控作用。序列分析表明,非编码RNA比编码序列积累了更多的变异,并且部分非编码RNA(比如lincRNA)的序列保守性不高。
四、重复序列的进化
重复序列在真核生物基因组中大量存在,并且在不同物种间变异很大。重复序列可分为串联重复序列(tandem repeats sequence, TRS)和散布的重复序列(dispersed repeats sequence, DRS)两种。串联重复DNA是重复单元相邻出现的重复序列,根据重复单元的大小,可分为微卫星、小卫星和卫星序列。散布的重复序列多为转座元件,即通过转座过程实现在基因组不同位置复制和转移的重复DNA序列。转座因子的主要进化意义有:①整合到基因中引起基因突变,从而干扰基因的表达;②使重复的基因产生新基因、新miRNA以及调控序列的功能;③打断基因的编码区域,破坏基因功能;④反转录转座子在转座过程中不包含内含子,致使复制产物比原来的序列更短;⑤转座因子转座后遗留下的空隙修复不成功时导致变异;⑥转座可使不同区域间的异位重组,造成基因组结构的复杂化。
五、基因的进化
(一)基因结构的进化
1.基因延长形成新基因
人类触珠蛋白由编码84个氨基酸的α 1链和编码143个氨基酸的α 2链组成,通常α 1链有F和S两种形式,α 2链有部分F型和部分S型。α 2链是通过基因内不等交换(杂合体的F与S等位基因交换)而产生的新基因。
2.基因重复形成新的基因
如两个重复基因来自同一个祖先基因,则其中一个会发生突变形成另一个与祖先基因功能不同的新基因。因此,通过测定基因核苷酸序列或氨基酸序列可以判定他们是否来自同一个祖先。如人类血红蛋白α链和β链共同氨基酸比率达41%,而β链和γ链共同氨基酸高达73%,这种相似性随机出现的概率可以忽略不计,则这三条链是来自同一祖先。
3.断裂基因、基因重组和假基因进化
原核和真核细胞中许多基因是不连续的,有些基因被数目不等的插入序列分隔为若干个基因区,如腺病毒α基因,核糖体RNA基因等。有研究认为出现隔离区是为了避免移码突变。此外,隔离区还有很多其他的功能。如细菌的插入序列作为隔离区可以起到转录调节作用,当插入序列插入到基因内部,可能使该基因失活,当插入序列插入到基因上游启动子位置,可能起到启动子的作用,上调下游基因的表达。
假基因(pseudogene)是基因组中与真基因序列相似但缺乏功能的DNA序列。与正常基因相比,假基因结构上存在不同部位不同程度的插入和缺失。假基因的进化速度快于功能基因,速度大约是功能基因进化速度最快部分的1.7倍。在进化过程中,假基因是新基因产生的来源之一。
(二)基因调控的进化
有学者认为可以通过检查同工酶的多重组合形式来研究基因进化过程。如鱼类进化从低等到高等是无颌纲、软骨鱼纲和硬骨鱼纲,他们以LDH同工酶的基因表达为例来研究基因调控的进化差别。无颌纲鱼以七鳃鳗为代表,一个LDH同工酶就可以满足不同细胞代谢需要;软骨鱼纲以水兔银鲛为代表,有两个基因的LDH同工酶;硬骨鱼类以鳄鱼为代表,LDH是A、B、C三个不同亚基聚合的多聚体。
(三)基因进化过程
基因的进化过程一般先改变基因结构,再改变基因调控。基因进化是先获得新的遗传信息,再产生一个新的有用基因。在基因复制之前是祖先基因,紧接着是分化期,通过结构基因本身的突变和不断积累产生,这样新的基因就会产生。另外,基因表达调控的变化不仅表现在转录水平,而且也改变了蛋白质产物结构,使蛋白质获得新的调控物质,出现基因表达和组织表达上的变化。
(四)基因频率与分子进化
生物大分子进化过程中必然伴随着大量的遗传物质的改变,从而为自然选择提供基础,可使自然选择从这些变异中去除不利的变异,保留有利变异来适应不断改变的环境。在此过程中,生物群体各种基因出现的频率会有所差异,进而来实现种群的微进化。
1.基因库和基因频率
基因库(gene pool)是指一个种群所含的全部基因。种群是生物生存和生物进化的基本单位,每个种群都有它特有的基因库,种群越大,基因库也越大,反之亦然。种群中的个体一代代死亡,但基因库却代代相传,并在传递过程中不断发展。但当种群很小时,可能会失去遗传的多样性,丧失进化上的优势而被淘汰。
基因频率(gene frequency)是指某种基因在某个种群中出现的比例。在足够大的种群中,如果没有基因突变,食物和生存空间充足,种群内个体之间随机交配的条件下,种群中的基因频率不变。但这种情况在自然状态下不存在,实际上由于基因突变、重组和自然选择等因素的存在,种群的基因频率不断变化。基因频率变化的方向由自然选择决定,所以生物进化的实质是种群基因频率变化的过程。
2.基因频率变化的影响因素
引起基因频率变化的影响因素主要有三个:选择、迁移和遗传漂变。
(1)选择:
选择(selection)是保存有利变异和淘汰不利变异从而适应环境的过程。选择的实质是定向改变群体的基因频率。选择是生物进化和新物种形成的主要因素。选择决定已发生的变异能否保留继续进化,甚至进化成新的物种。所以,自然选择决定变异的保留或淘汰。自然选择是定向的,只保留有利变异,即与环境相适应的变异。经过无数次选择,一定区域中某物种的有利变异基因不断加强,不利变异基因逐渐淘汰,从而使物种基因频率发生改变,形成新物种或同一物种的亚种。
(2)迁移:
迁移(migration)是指含有某种基因的个体在从一个地区迁移到另一个地区的机会不均等,而导致基因频率发生改变。如一对等位基因A和a,如果含有A基因的个体比含有a基因的个体更多或更少地迁移到一个新的地区,那么在这个新地区建立的新种群的基因频率就相应发生了改变。
(3)遗传漂变:
遗传漂变(genetic drift)是指如果种群太小,含有某基因的个体在种群中的数量又很少的情况下,可能会由于这个个体的突然死亡或没有交配而使这个基因在这个种群中消失的现象。种群越小,遗传漂变越显著。