第二节 遗 传 方 式
孟德尔(Mendel)是遗传学的奠基人。他通过一系列豌豆杂交及测交实验,于1865年提出了生物性状由遗传因子(hereditary factor)决定。1909年,Johannsen提出用基因(gene)一词代替遗传因子。染色体上成对的基因所占的特定位置称为基因座(locus),位于同源染色体上同一基因座的一对基因称为等位基因(allele),某一特定基因座上的一对等位基因的组合类型称为基因型(genotype),基因型在一定环境作用下形成的生物体可以观察到的性状,称为表型(phenotype)。如果一个体同源染色体上同一基因座的等位基因彼此相同,称为纯合子(homozygote);如果等位基因彼此不同,称为杂合子(heterozygote)。如果同源染色体上同一基因座的两个等位基因分别发生不同的突变,称为复合杂合子(compound heterozygote);而两个不同基因座的等位基因各有一个发生突变,称为双重杂合子(double heterozygote)。在杂合状态下表现出来的性状,称为显性性状(dominant character),决定显性性状的等位基因称为显性基因(dominant gene);反之,在杂合状态下未表现出来的性状称为隐性性状(recessive character),决定隐性性状的等位基因称为隐性基因(recessive gene)。
基因的遗传方式是多种多样的,主要包括单基因遗传、多基因遗传、线粒体基因遗传等。不同的遗传方式具有不同的遗传特征。
一、遗传的基本规律
1865年,Mendel通过豌豆杂交实验提出了遗传因子的分离律和自由组合律;1910年,Morgan利用果蝇进行杂交实验,发现了连锁和交换律;1908年,Hardy和Weinberg分别提出了群体中的遗传平衡定律,即Hardy-Weinberg平衡律。
(一)分离律
分离律(law of segregation)是指生物在生殖细胞形成过程中,同源染色体分离,分别进入不同的生殖细胞,即每个生殖细胞只有亲代成对的同源染色体中的一条;位于同源染色体上的等位基因也随之分离,生殖细胞只含有2个等位基因中的一个;对于亲代,其某一遗传性状在子代中有分离现象。
(二)自由组合律
自由组合律(law of independent assortment)是指生物在生殖细胞形成过程中,非同源染色体之间是完全独立的,可分可合,随机组合;位于染色体上的等位基因也随之自由组合。
(三)连锁与交换律
连锁和交换律(law of linkage and crossing-over)是指同一条染色体上的基因彼此间是连锁在一起的,构成了一个连锁群(linkage group);同源染色体上的基因连锁群并非固定不变,在生殖细胞形成过程中,同源染色体在配对联会时发生交换,使基因连锁群发生重新组合。
一般而言,同源染色体上2对基因之间的重组率与基因间的距离有关,2对基因相距越远,发生交换的机会越大,重组率越高。同一染色体上2个基因的相对距离用厘摩(centiMorgan,cM)为单位表示,1%重组率表示为1cM。
(四)Hardy-Weinberg平衡律
按照分离律和自由组合律,当两个杂合个体婚配后,子代3/4表现为显性性状,1/4表现为隐性性状,因而在群体中随着隐性性状的减少,显性性状将会增加,最终大多数为显性性状;但是,在随机婚配的大群体中,没有受到外在因素影响的情况下,显性性状并没有随着隐性性状的减少而增加,不同基因型相互比例在一代代传递中保持稳定,这就是Hardy-Weinberg平衡律(Hardy-Weinberg law)。如果一个群体满足如下所有条件:①群体容量无限大;②随机婚配;③没有自然选择;④没有突变;⑤没有大规模的迁移和基因流(gene flow);⑥基因型频率没有性别差异,则该群体的等位基因频率和基因型频率在世代传递过程中保持不变,处于遗传平衡状态。
二、单基因遗传(孟德尔遗传)
由一对等位基因单独决定遗传性状或遗传病的遗传方式称为单基因遗传,这种单个致病基因引起的遗传病称为单基因遗传病(single-gene disorder,monogenic disorder)。单基因遗传病的世代传递遵循孟德尔定律,故又称孟德尔遗传病。根据致病基因所位于的染色体,以及基因的“显性”或“隐性”性质,将单基因遗传方式分为5种:①常染色体显性(autosomal dominant,AD);②常染色体隐性(autosomal recessive,AR);③X 连锁显性(X-linked dominant,XD);④X 连锁隐性(X-linked recessive,XR);⑤Y 连锁遗传(Y-linked inheritance)。
临床上研究人类性状或疾病的遗传方式主要通过观察这些性状或疾病在家系内分离或传递来判断的,常用系谱分析法(pedigree analysis)。家系中第一个被医生或研究者发现的罹患某种遗传病的患者或带有某种性状的成员,称为先证者(proband)。系谱是从先证者入手,详细调查其所有家族成员的亲属关系及遗传病或性状的分布情况,并用特定的系谱符号(图1-31)按一定的格式绘制而成的图解。系谱中不仅要包括患病或具有某种性状的个体,还必须包括全部健康的家族成员。借助系谱,可以对家系进行回顾性分析,以确定某一疾病或性状在该家族中是否有遗传因素的作用及其可能的遗传方式;还可以进行前瞻性遗传咨询,评估家庭成员的患病风险或再发风险。对某一种遗传病或性状进行系谱分析时,仅依据一个家系的系谱资料有时无法明确该病或性状的遗传方式,需要将多个具有相同遗传病或性状的家系的系谱作综合分析,才能得到可靠的推断。
图1-31 常用的系谱绘制符号
(一)常染色体显性遗传
如果一种遗传病或性状的控制基因位于第1~22号常染色体上,其突变基因呈显性,这种遗传方式称为常染色体显性遗传。人类有许多性状都是常染色体显性遗传,比如,就耳朵形状而言,长耳壳、宽耳壳和有耳垂均为显性性状。人类的许多疾病也呈常染色体显性遗传,如软骨发育不全、Huntington病、家族性高胆固醇血症、多发性结肠息肉、神经纤维瘤、遗传性脊髓小脑共济失调、并指Ⅰ型等。
1.常染色体显性遗传的特征
典型的常染色体完全显性遗传方式有如下特点(图1-32):①致病基因位于常染色体,因而致病基因的遗传与性别无关,即男、女性患病机会均等;②系谱中连续几代都能看到患者,疾病呈连续传递;③患者的双亲中通常有一个是患者,致病基因由患病的亲代遗传下来;如果双亲都未患病,则可能是由新发突变所致,多见于突变率较高的遗传病;④双亲均无病时,子女一般不会患病,除非发生新的基因突变;⑤患者的同胞和后代有1/2的风险患病。
图1-32 典型的常染色体显性遗传病系谱图
2.婚配类型及子代发病风险的预测
假如用A代表决定某种显性疾病的等位基因,用a代表其相应正常的隐性等位基因,则在完全显性的情况下,患者的基因型为AA或Aa,正常个体的基因型为aa。临床上最常见的是杂合子患者(Aa)与正常个体(aa)之间的婚配,其子女大约有一半是患者,这对夫妇再生育子女的发病风险为1/2。如果夫妇双方都是杂合子患者(Aa),则子女的发病风险为3/4。
(二)常染色体隐性遗传
如果一种遗传病或性状的控制基因位于第1~22号常染色体上,其突变基因呈隐性,这种遗传方式称为常染色体隐性遗传。人类常见的常染色体隐性遗传病包括先天性聋哑、苯丙酮尿症、白化病、囊性纤维化等。
1.常染色体隐性遗传的特征
典型的常染色体隐性遗传方式有如下特点(图1-33):①致病基因位于常染色体,因而致病基因的遗传与性别无关,即男、女性的患病机会均等;②系谱中通常看不到连续传递现象,往往是散发病例,但同胞中可有多人患病;③患者的双亲一般不患病,但都是致病基因的携带者;④患者的同胞有1/4的风险患病,患者表型正常的同胞中有2/3的概率为携带者;⑤患者的后代一般不发病,但一定是携带者;⑥近亲婚配时子女的发病风险显著提高,因为共同的祖先可能传递给他们共同的突变基因。
图1-33 典型的常染色体隐性遗传病系谱图
2.婚配类型及子代发病风险的预测
对于常染色体隐性遗传病,突变基因为等位基因a,呈隐性,只有基因型为aa纯合子时才表现为疾病,纯合子AA或杂合子Aa表型正常。两个致病基因分别来自患者双亲,因而患者双亲都是携带一个致病基因的杂合子Aa;虽然表型正常,但再次生育时仍可能把致病基因传给后代。两个常染色体隐性遗传病的肯定携带者(obligate carrier)婚配后,其子女的发病风险为1/4;表型正常的子女中有2/3的概率是携带者。
一些发病率高的常染色体隐性遗传病人群或近亲婚配时会有携带者与患者婚配(Aa×aa),其子代1/2的风险为患者,1/2的概率为携带者。由于家系中连续两代出现患者,且患者分布类似显性遗传,常容易误认为是常染色体显性遗传方式。因此,近亲婚配家庭出现这种遗传方式时,要考虑到常染色体隐性遗传的可能性。患者与正常个体婚配(AA×aa),其后代全部为肯定携带者。极少数情况下患者相互婚配(aa×aa),子女将全部为患者。值得注意的是,对于具有遗传异质性的单基因遗传病,同病婚配时,双亲有可能为不同基因座的纯合子(aa×a′a′),其子代为双重杂合子而不会患病。
(三)X连锁显性遗传
由性染色体上的基因所决定的遗传性状或疾病,在家系世代传递时与性别明显相关,在群体中的分布存在明显的性别差异,这种遗传方式称为性连锁遗传(sex-linked inheritance)。 人类性染色体包括X和Y染色体,性连锁遗传也就分为X连锁遗传和Y连锁遗传。如果一种遗传病或性状的控制基因位于X染色体上,其突变基因呈显性,这种遗传方式称为X连锁显性遗传。人类常见的X连锁显性遗传病有抗维生素D性佝偻病、Alport综合征、口面指综合征Ⅰ型、色素失调症等。
正常女性有两条X染色体,X连锁显性时纯合子和杂合子都表现为疾病,故女性的发病率一般为男性的2倍;由于群体中致病基因频率很低,女性纯合子的概率很小,临床多见的女性一般都是患病杂合子;女性杂合子患者由于还存在一个正常的等位基因,在不完全显性的情况下病情一般比男性轻,且差异较大;另外,由于X染色体随机失活,当带有致病基因的X染色体失活时病情较轻,反之则较重。
男性只有一条X染色体,Y染色体上缺少相应的等位基因,故男性X染色体上的基因是不成对的,只有成对等位基因中的一个,称为半合子(hemizygote)。其X染色体上的基因有突变即表现出疾病,且病情较重;男性X染色体的致病基因只能从母亲传递而来,又只能传递给女儿,不会传递给儿子,称之为交叉遗传(criss-cross inheritance)。
1.X连锁显性遗传的特征
典型的X连锁显性遗传方式(图1-34)有如下特点:①群体中女性患者数目多于男性患者,一般约为男性患者的2倍,但女性患者病情通常较男性轻。②患者双亲中必有一方患病;如果双亲均不患病,则致病基因为新发突变。③由于存在交叉遗传,男性患者的女儿全部患病,儿子全部正常;女性患者(杂合子)的子女中各有1/2的风险患病。④系谱中常可见疾病呈连续传递,但绝无父子传递(male-male transmission),可以据此与常染色体显性遗传相区别。
图1-34 典型的X连锁显性遗传病系谱图
2.婚配类型及子代发病风险的预测
X连锁显性遗传时,可以用XA代表X染色体上突变的显性致病基因,则女性患者的基因型为XA XA或XA X,多为杂合子患者XA X,男性患者的基因型为XAY。临床上最常见的婚配类型为女性杂合子患者(XAX)与正常男性(XY)之间的婚配,其子女中男女均有1/2的发病风险;男性患者(XA Y)与正常女性(XX)之间婚配,其后代中女性全部为患者,男性则全部正常。
(四)X连锁隐性遗传
如果一种遗传病或性状的致病基因位于X染色体上,其突变基因呈隐性,这种遗传方式称为X连锁隐性遗传。X连锁隐性遗传时半合子男性只有一个等位基因,发生突变即表现出性状或疾病;而女性当致病基因纯合时才表现出性状或疾病,杂合状态下表型正常,但可以作为携带者将突变传递给后代。人类X连锁隐性遗传病较多,如假肥大性肌营养不良、红绿色盲、甲型血友病、乙型血友病、葡萄糖-6-磷酸脱氢酶缺乏症等。
1.X连锁隐性遗传的特征
典型的X连锁隐性遗传方式(图1-35)有如下特点:①群体中男性患者数目远远多于女性患者,某些致病基因频率低的疾病家系中,往往只见到男性患者;②男性患者的致病基因由携带者母亲传递而来,如果母亲不是携带者,则致病基因可能源自新发突变,也可能是由于母亲的生殖腺嵌合;③携带者母亲再生育时,其儿子有1/2的风险患病,女儿有1/2的概率是携带者;④由于交叉遗传,男性患者的兄弟、外祖父、舅父、姨表兄弟、外甥、外孙等也有可能是患者;⑤如果出现女性患者,则有如下几种可能:父亲是患者同时母亲是携带者,X染色体丢失或重排导致女性半合子,遗传异质性。
图1-35 典型的X连锁隐性遗传病系谱图
2.婚配类型及子代发病风险的预测
X连锁隐性遗传时,可以用Xa代表X染色体上突变的隐性致病基因,则男性患者的基因型为Xa Y,女性患者的基因型为Xa Xa,女性杂合子携带者的基因型为XXa。所有携带致病基因突变的男性都发病,因而男性患者的发病率可以体现致病基因在群体中的频率。而女性纯合突变时才发病,因而女性患者的发病率是男性的发病率的平方,女性携带者的频率是男性发病率的2倍。
临床上最常见的婚配类型为表型正常的女性携带者(XXa)与正常男性(XY)之间的婚配,子代中儿子有1/2的发病风险,女儿中有1/2为携带者,但不会发病;正常女性(XX)与半合子男性患者(Xa Y)之间的婚配,其子女表型都正常,但由于交叉遗传,父亲的Xa一定会传给女儿,所有女儿均为携带者;偶尔能见到男性半合子患者(Xa Y)与女性携带者(XXa)之间的婚配,其儿子和女儿均有1/2的发病风险,表型正常的女儿均为携带者。
(五)Y连锁遗传
如果一种遗传病或性状的致病基因位于Y染色体上,则其遗传方式称为Y连锁遗传。人类Y染色体只存在于男性,其传递规律也比较简单(图1-36),致病基因随着Y染色体的传递而传递,由父亲传给儿子、儿子传给孙子,这样的遗传方式又称全男性遗传。Y连锁遗传疾病或性状全部为男性受累,女性不会得病,也不会传递基因。人类Y连锁遗传病和基因较少,已知的有外耳道多毛症、H-Y抗原基因、Y染色体性别决定区SRY基因及无精子因子AZF基因等。
图1-36 典型的Y连锁遗传病系谱图
三、非典型孟德尔遗传
各种单基因遗传的性状或疾病在群体及家系中具有各自的分布规律,通过对多个家系的调查和系谱分析,可以对疾病的遗传方式做出初步判断并预测后代的发病风险。然而某些单基因性状或疾病的遗传还存在着一些例外情况,即非典型孟德尔遗传。
(一)表现度、外显率、拟表型
表现度(expressivity)是指基因在个体中的表现程度,即在不同遗传背景及环境因素影响下,相同的基因改变在不同个体或同一个体的不同部位,其性状或疾病的表现程度可能存在显著差异。例如,常染色体显性遗传的轴后型多指(趾)症AⅠ型(postaxial polydactyly,type AⅠ,PAPA1)[OMIM 174200],患者可以表现出不同的指(趾)数、不同的手多指与脚多趾、不同的多余指(趾)长短程度,或不同的软组织增加和掌骨增加程度等。这些差异可以出现在不同个体,也可出现在相同个体的不同部位。
外显率(penetrance)是指某一杂合显性基因在特定的群体及环境中表现出相应表型的比例,常用百分率(%)来表示。外显率为100%时称为完全外显(complete penetrance);外显率低于100%时称为不完全外显(incomplete penetrance)或外显不全。外显率差异的例子如Huntington病(Huntington disease)[OMIM 143100],致病基因HTT编码Huntingtin蛋白,发病机制为基因第1外显子的三核苷酸重复(CAG)n发生动态突变。(CAG)n的重复次数与疾病发生的早晚、病情的轻重有关:正常个体的(CAG)n重复次数在9~35次;重复次数在36~40次时,呈不完全外显,发病较晚,病情较轻;重复次数大于41次时,呈完全外显,患者发病较早,病情较重。
值得注意的是,外显率与表现度是两个不同的概念:外显率说明的是基因表达与否,属于“质”的范畴;而表现度说明的是基因在表达前提下其表现程度如何,属于“量”的范畴。
拟表型(phenocopy)或称表型模拟,是指因某些营养或环境因素的作用使得个体恰好产生了与某一特定基因的表型相同或相似的表型。拟表型是由环境因素所致,而非生殖细胞的基因突变引起,因而不会遗传给后代。例如,缺乏维生素D会导致佝偻病,与常染色体显性遗传的抗维生素D佝偻病有相似的表型,这种由营养因素维生素D缺乏引起的佝偻病就是一种拟表型。
(二)遗传异质性与多效性
遗传异质性(genetic heterogeneity)是指同一种遗传性状或疾病可以由不同的基因所控制,可分为基因座异质性(locus heterogeneity)和等位基因异质性(allelic heterogeneity)。基因座异质性是指同一种遗传性状或疾病由不同基因座的突变引起。例如,耳聋、白化病等可以由不同染色体上不同的基因突变引起,表现出不同的遗传方式;等位基因异质性是指同一种遗传性状或疾病由同一基因座上的不同突变引起。例如,DMD基因发生不同的突变,既可能引起症状严重的Duchenne肌营养不良,也可能引起症状较轻的Becker肌营养不良。
基因的多效性(p leiotropy)是指一个基因可以控制或影响多个性状。生物体发育过程中的许多生理和生化反应都是互相联系和互相依赖的,基因的作用是通过调控新陈代谢的一系列生化反应,进而影响到个体的发育方式并决定性状的形成,因此,一个基因的变异能够直接或间接地影响多个生化过程,导致多个性状发生相应的改变。基因多效性的例子如全身性结缔组织病马方综合征(Marfan syndrome)[OMIM 154700],患者既有骨骼系统异常,如身材瘦高、四肢细长、手足关节松弛、蜘蛛指(趾)等,又有心血管畸形和晶状体易位的表现。基因多效性产生的原因,并不是基因本身具有多重效应,而是基因的编码产物参与机体复杂代谢的结果。
(三)遗传早现与延迟显性
早现(anticipation)是指一些遗传病(通常为显性遗传病)在连续几代的传递过程中,发病年龄逐代提前并且病情逐代加重的现象。早现遗传的典型病例如强直性肌营养不良1型(myotonic dystrophy 1)[OMIM 160900],主要发生于成年人,男性多于女性。临床症状为肌无力、肌萎缩和肌强直,前两种症状更突出,后期表现为肌肉收缩后松弛延迟,也可累及心肌和平滑肌,可伴有早期白内障、免疫球蛋白异常、轻度智力低下等。致病基因是编码肌强直蛋白激酶(dystrophia myotonia protein kinase)的DMPK基因,其3′-非翻译区存在(CTG)n三核苷酸重复序列,正常个体群(CTG)n三核苷酸重复次数约为5~35次,受累的患者常超过50次,有时甚至高达1000次以上。在患病家系的世代传递过程中,三核苷酸重复的拷贝数常逐代增加,强直性肌营养不良的发病年龄也随之逐渐提早,病情逐渐加重。
延迟显性(delayed dominance)是指某些显性遗传病的杂合子(Aa)在生命的早期,因致病基因不表达或者表达后引起的损伤(退行性或累积性)尚不足以引起明显的临床表现,只在延迟到一定的年龄后才表现出疾病。延迟显性遗传病致病基因的外显率与年龄相关。例如,常染色体显性多囊肾病(autosomal dominant polycystic kidney disease)[OMIM 173900]临床表现为双肾囊肿、血尿、高血压、腹痛及进行性肾衰竭,患者20多岁能通过B超检测到肾囊肿,直到40多岁或更晚才出现临床症状。此外,Huntington病、脊髓小脑共济失调1型等疾病也都是延迟显性遗传病。
(四)从性遗传与限性遗传
从性遗传(sex-influenced inheritance)是指某些常染色体显性遗传病虽然基因位于常染色体,但杂合子(Aa)的表型明显受性别的影响,显示出男女患病比例或病情的差异。例如,雄激素性秃发(androgenetic alopecia)[OMIM 109200]呈常染色体显性遗传,临床表现为从头顶中心向周围扩展的进行性、弥漫性和对称性脱发。秃顶一般于35岁左右开始出现,男性患者数目明显多于女性,这是由于男性杂合子即可表现为秃顶,而女性杂合子仅表现为头发稀疏而不会表现秃顶性状,只有女性纯合子(AA)才会出现秃顶的性状。研究表明,这种性别差异与男女体内雄性激素水平的差异有关。另外,常染色体显性遗传的原发性色素病,是由于体内铁代谢障碍而引起含铁血黄素广泛沉积,导致皮肤色素沉着、肝硬化和糖尿病三联征。本病多于40岁后发病,男性发病率明显高于女性,其原因可能是女性特有的月经、妊娠或流产等生理或病理性失血导致铁的丢失,相对减轻了铁的沉积,减轻了症状。
限性遗传(sex-limited inheritance)是指某些基因虽然位于常染色体上,但基因的表达明显受到性别限制,因而只在一种性别表现出性状,而在另一种性别则完全不能表现。限性遗传主要是由于男女在解剖学结构上的差异造成的,也可能是由于性激素分泌方面的差异限制。例如,男性的家族性睾丸中毒症、女性的子宫阴道积水症等,都是典型的限性遗传。
(五)遗传印记
生物体的一对同源染色体或相应的一对等位基因分别来自父亲和母亲,某些来自双亲的同源染色体或等位基因存在功能上的差异,因而当它们发生相同的改变时,所形成的表型会有所不同,这种现象称为遗传印记(genetic imprinting)或称亲代印记(parental imprinting)、基因组印记(genomic imprinting)。因为存在印记效应,人类一些单基因遗传病的外显率和表现度会因突变基因的亲代来源不同而不同。例如,对于Huntington病和脊髓小脑性共济失调Ⅰ型,如果突变的致病基因由母亲传递而来,则其子女的发病年龄与母亲的发病年龄一样,病情也不会加重;如果突变由父亲传递而来,则其子女的核苷酸重复拷贝数将会进一步扩展,发病年龄比父亲提早,病情加重。反之,强直性肌萎缩和多发性神经纤维瘤等疾病的突变基因如果经母亲传递而来,则子女的发病年龄会提早病情加重。遗传印记持续存在于一个个体的终生,但它并不是一种突变,也不是永久性的改变,在配子形成时,旧的印记会被消除,新生个体会根据性别产生新的印记,即印记被相反性别所逆转。例如,父源突变引起的Huntington病早发型女性患者,其后代的发病年龄不会再提前,早发型父源效应经过一代的传递即可消失。
遗传印记的最典型病例是Prader-Willi综合征(PWS)和Angelman综合征(AS),前者表现为肥胖、肌张力低、身材矮小、轻度智力障碍,后者表现为无诱因发笑、严重语言和智力发育障碍、癫痫发作。两者是临床表型不同的两种遗传病,但均是由15q11-13的印记基因区域发生缺失导致。PWS多是由父源性缺失或母源性单亲二倍体引起,而AS则是母源性缺失或父源性单亲二倍体引起。
遗传印记的存在使得突变基因的表型不符合孟德尔遗传规律。遗传印记的发生机制与DNA水平的甲基化修饰有关,印记相关的甲基化是终生不变的。表观遗传学(epigenetics)的DNA甲基化修饰也会影响基因的表达,但其甲基化不是终生的,而是可以随时间和空间的改变而发生动态变化。
四、多基因遗传
人类的许多遗传性状或疾病并非由一对等位基因决定,而是由多对等位基因共同控制。每一对基因对遗传性状或疾病形成的作用是微效的,称为微效基因(minor gene),而若干对微效基因的效应累加在一起可以形成一个明显的表型效应,称为累加效应(additive effect),相应的基因也称为累加基因(additive gene)。因此,由多个微效基因的累加效应控制遗传性状或疾病的遗传方式称为多基因遗传(polygenic inheritance)或多因子遗传(multifactorial inheritance)。 此外,上述的遗传性状或遗传病的发生不仅受多个微效基因的影响,还受环境因素的影响,这类遗传性状或疾病也称为复杂性状或复杂疾病(complex disorder)。人类的许多常见病和先天畸形都属于复杂疾病范畴,如原发性高血压(essential hypertension)、糖尿病(diabetes)、精神分裂症(schizophrenia)、阿尔茨海默病(Alzheimer disease)、唇裂腭裂以及先天性心脏病等。目前研究认为,多基因遗传的微效基因中可能存在一些起主要作用的基因,称为主基因(major gene),了解主基因将大大有助于理解复杂疾病的发病、诊断、预防和治疗。
(一)多基因遗传的规律
1.多基因遗传的特点
多基因遗传与单基因遗传的不同之处在于:其遗传性状或疾病受许多微效基因的控制,这些微效基因彼此之间没有显性与隐性之分,呈共显性,具有累加效应。
单基因遗传的基因型和表型之间存在直接的因果关系,要么具有性状(受累),要么不具有性状(不受累)。单基因性状的变异在群体中的分布往往是不连续的,可以明显地分为2~3群,因而也把单基因性状称为质量性状(qualitative character)(图1-37)。例如,常染色体隐性遗传的垂体性侏儒Ⅰ型(pituitary dwarfism 1)[OMIM 262400],致病基因是编码生长激素1的基因GH1。突变纯合子(aa)患者的平均身高约120cm,正常个体(AA)或突变携带者(Aa)的平均身高为165cm,由此将人群分成身高变异分布不连续的两个亚群,尽管基因型aa的个体间存在变异,但平均值显著低于基因型AA或Aa的平均值。再如,常染色体隐性遗传病苯丙酮尿症(PKU)的致病基因为编码苯丙氨酸羟化酶(PAH)的PAH,突变时会使PAH活性下降。以正常个体(AA)血浆PAH的活性为100%,杂合携带者(Aa)的PAH活性为45%~50%,苯丙酮尿症患者的PAH活性仅为0%~5%,由此观察到的人群PAH活性变异呈不连续的三峰分布。
图1-37 质量性状变异分布图
A.垂体性侏儒与正常个体的身高;B.PKU患者、携带者和正常个体PAH的活性
多基因性状在群体中的分布呈连续的单峰分布,波峰处为平均值(有时为中位数),不同个体间的差异只是量的变异,且差异较小,因而多基因性状又称为数量性状(quantitative character)。例如,人的身高、体重、血压、智商等遗传性状都属于多基因数量性状。如果对任何一个群体的身高进行随机调查,可以发现极矮和极高的个体只占少数,大部分个体的身高接近平均值,并且由矮向高逐渐过渡,这种身高变异分布绘制的曲线呈正态分布(normal distribution)(图 1-38)。再以血压为例,假设某人群有2个影响收缩压的基因座A和B,每个基因座的2个等位基因分别为A和A′、B和B′,如果A和B等位基因可使收缩压在平均值100mmHg(1mmHg=0.133kPa)基础上升高10mmHg,A′和B′等位基因不改变收缩压,则这2个基因座的基因型分布及相应的收缩压如表1-5所示,收缩压在该人群中的分布情况近似于正态分布。
图1-38 数量性状变异分布图(人的身高变异)
表1-5 决定收缩压的两个基因座的基因型分布
2.多基因遗传的规律
尽管多基因遗传中每对微效基因的作用是微小的,但若干对基因作用积累,可以形成一个明显的累加效应。多基因遗传的若干基因在传递过程中各自遵循分离律和自由组合律,环境因素也起着增强或抑制性状的作用。
以人的身高为例来解释数量性状的遗传规律。假设有3个非连锁的基因座可以影响人的身高,等位基因A、B和C可以分别使身高在平均值(165cm)的基础上增高5cm,则基因型AABBCC个体的身高将是195cm;等位基因A′、B′和C′可以分别使身高在平均值(165cm)的基础上降低 5cm,那么基因型 A′A′B′B′C′C′个体的身高将是 135cm;而等位基因 A、B、C 和 A′、B′、C′之间的其他组合产生了介于这两者之间的其他身高值。假如一个极高身高(195cm)的个体(AABBCC)和一个极矮身高(135cm)的个体(A′A′B′B′C′C′)婚配,其子 1 代的基因型为杂合子(AA′BB′CC′),身高表现为中等(165cm)。 然而,环境因素(如营养好坏、阳光充足与否、是否进行体育锻炼等)对身高也会产生一定的影响,使子1代个体间的身高在165cm左右出现一定的变异。假如相同基因型的子1代个体间进行婚配,这3对非连锁的基因遵循分离律和自由组合律,可以产生8种配子,精卵随机结合形成64种基因型的合子(表1-6),加上环境因素对身高的增强或抑制作用,使子2代个体中大部分身高仍为中等,然而变异范围更为广泛,也会出现少数身高极高和极矮的个体。将子2代身高变异分布绘成柱形图和曲线图,可见类似于正态分布(图1-39)。假如子2代个体间随机婚配,同理,子3代的身高变异分布曲线将更加趋近于正态分布。
表1-6 人体身高三对等位基因的基因型组合
图1-39 子2代身高变异分布图
诸如身高之类的数量性状的决定基因远远不止3对,每个基因的作用也并不是对等的,并且有时基因座上含有2个以上的等位基因类型,对性状的影响更加复杂,加上环境因素的影响,使得数量性状在群体中的分布更为精细和复杂,通常形成连续的正态分布曲线。
综上所述,多基因遗传的规律是:①两个极端变异(纯合子)的个体婚配,其子1代都是中间类型(杂合子),也会产生环境因素影响的一定范围的变异;②两个中间类型的子1代个体婚配,其子2代大部分也是中间类型,但由于微效基因的分离和自由组合,以及环境因素的影响,变异范围比子1代要更加广泛,有时会出现极端变异的个体(纯合子);③在一个随机婚配的群体中,多基因和环境因素都会影响数量性状,变异范围更加广泛,但大多数个体接近于中间类型,很少有个体为极端变异。
(二)多基因遗传病再发风险的预测
多基因遗传病的患病率较高,病因复杂,属于常见病。这些疾病的发生有一定的遗传基础,通常呈现家族倾向,但又不符合典型的孟德尔遗传方式。在研究和分析其病因和发病机制,评估再发风险时,不仅要分析遗传因素,同时还要考虑环境因素的影响(图1-40)。
图1-40 环境因素和遗传因素决定的人类疾病谱
1.易患性与阈值
多基因遗传病的遗传基础是若干微效基因的累加效应,这种由遗传因素决定的一个体的患病风险称为易感性(susceptibility)。环境因素对多基因遗传病同样产生影响,将遗传因素和环境因素共同作用决定的一个体的患病风险称为易患性(liability)。易患性是多基因遗传中的一个特定概念,在一个群体中,易患性极高或极低的个体都占少数,大多数个体都接近平均值,易患性同多基因性状一样,在群体中呈正态分布。在环境因素相同的条件下,个体间的患病风险差异可以认为是由不同的易感性造成的,易感性高低可代表易患性高低。一个体的易患性达到或超过一定限度时就可能发病,这种由易患性决定的多基因遗传病发病的最低限度称为阈值(threshold)。由此,可以根据阈值将人群连续分布的易患性变异分为两部分,即低于阈值的健康群体和达到并高出阈值的患病群体,连续分布的数量性状产生了质的差别(图1-41)。阈值是易患性变异的某一点,超过该点个体将会患病,在一定的环境条件下,阈值代表患病所必需的最低的致病基因的数量。因此,多基因遗传病属于阈值相关疾病。
图1-41 阈值模式:群体易患性变异分布图
一个体的易患性高低无法测量,只能通过生育子女的发病情况做粗略的估计,但一个群体的易患性平均值可以通过该群体的患病率做出估计。以多基因遗传病易患性正态分布曲线下的面积代表总人群,则易患性超过阈值的那部分曲线下面积占总面积的比例为患者所占总人群的百分数,即为患病率。可见,一种多基因病的发病阈值越低,与易患性平均值距离越近,表明易患性高,群体患病率越高;反之,发病阈值越高,与易患性的平均值距离越远,表明易患性低,群体患病率低。
2.遗传率
多基因遗传性状或疾病是遗传因素和环境因素共同作用的结果,其中,遗传因素作用的大小可用遗传率来衡量。遗传率(heritability)是指多基因的累加效应对疾病易患性的作用大小,常用百分率(%)表示。遗传率越大,表明遗传因素对疾病发生的作用越大。当一种疾病的易患性完全由遗传因素决定时,遗传率为100%;反之,完全由环境所决定时,遗传率为0。这两种极端情况在多基因遗传中是极少见的,对于遗传率高的疾病,其遗传率可高达70%~80%,表明遗传因素在决定疾病易患性变异上起重要作用,环境因素的作用较小;遗传率低的疾病,其遗传率仅为30%~40%,表明环境因素在决定疾病易患性变异上起重要作用,遗传因素的作用不显著,可能不会出现明显的家族聚集现象。
表1-7列出了一些常见的多基因遗传病的患病率和遗传率。值得提出的是:①某种疾病的遗传率是根据特定环境中特定人群的患病率估算出来的,不同的环境和人群遗传率会有所不同,因此不能完全适用于其他环境或人群。②遗传率是群体统计量,不能应用到个体,若某种疾病的遗传率为50%,仅说明在该病的总变异中,遗传因素占50%的作用,而不能说明某个患者的发病50%由遗传因素决定。③遗传率的估算仅适合于没有遗传异质性,也没有主基因效应的遗传病,如果某种遗传病的多个致病基因中有一个显性的主基因,则估算的遗传率可以达到100%;如果主基因为隐性,则由先证者的同胞估算的遗传率可以高于由父母或子女估算的遗传率。因此,只有当由同胞、父母和子女分别计算的遗传率相似时,这个遗传率才是合适的,才可以认为该病的发生可能是多基因遗传的结果。
表1-7 常见多基因遗传病的群体患病率、先证者一级亲属患病率、性别比和遗传率
3.多基因遗传病再发风险的预测
多基因遗传病的阈值模式可以对患者亲属的疾病再发风险进行多种预测,这些预测与孟德尔遗传方式不同。
(1)患者亲属的再发风险与遗传率密切相关:
若多基因遗传病的群体患病率为0.1%~1%,遗传率为70%~80%,则患者一级亲属的再发风险可以通过Edward公式来估计:qr=,式中qr表示患者一级亲属患病率,qg表示群体患病率。若某种遗传病的遗传率高于80%或群体患病率高于1%,则患者一级亲属患病率将高于群体患病率的平方根;若遗传率低于70%或群体患病率低于0.1%,则患者一级亲属患病率低于群体患病率的平方根。例如,某地区人群中唇(腭)裂的患病率为0.17%,遗传率为76%,则患者一级亲属再发风险≈4%;如果遗传率为100%,患者一级亲属的再发风险上升到约9%;如果遗传率为50%,患者一级亲属的再发风险下降到约2%。可见多基因遗传病的再发风险与疾病的遗传率高低有关。群体患病率、遗传率和患者一级亲属患病率之间的相互关系如图1-42所示,横坐标为群体患病率,纵坐标为患者一级亲属患病率,斜线为遗传率,可以依据此图估计多基因遗传病的发病风险。例如,无脑畸形伴脊柱裂的群体患病率为0.38%,遗传率为60%,查图中横坐标上0.38处垂直线与遗传率60%的斜线交点,其对应的纵坐标刻度近于4,则该病患者一级亲属患病率接近于4%。
图1-42 群体中患病率、遗传率和患者一级亲属患病率的关系
此外,从图中可见多基因遗传病在遗传率相同的情况下,群体患病率不同,患者亲属的发病风险率也不同。表1-8大致列出了各种遗传率下群体患病率和患者一级亲属患病率的差异。例如,对于遗传率为50%的多基因遗传病,群体患病率为0.1%时,患者一级亲属患病率为1%,高于群体患病率10倍;群体患病率为1%时,患者一级亲属患病率为5%,高于群体患病率5倍;群体患病率为10%时,患者一级亲属的患病率为20%,高于群体患病率2倍。
(2)患者亲属的再发风险与亲属级别有关:
患者亲属再发风险在不同家庭中各不相同,平均再发风险的预测是根据经验数据获得的,并不像孟德尔性状那样遵从特定的遗传模式。多基因遗传病有明显的家族聚集倾向,患者亲属的患病率必定高于群体患病率,然而随着亲属级别的降低,再发风险也相应地迅速降低,向群体患病率靠拢(表1-9)。
表1-8 患者一级亲属患病率与遗传率和群体患病率的关系
表1-9 常见多基因遗传病的亲属级别与发病率的关系
(3)患者亲属的再发风险与亲属中患病人数有关:
多基因遗传时一个家庭中的患病人数越多,则亲属的再发风险越高。例如,唇腭裂的群体患病率为0.17%,遗传率为76%,一对表型正常的夫妇第一胎生育了一个唇腭裂患儿,则再次生育唇腭裂患儿的风险为4%;如果他们第二胎又生了一个唇腭裂患儿,则第三胎生育唇腭裂患儿的风险上升到10%。更多患儿的出生并没有改变患病风险本身,只是提示这对夫妇携带更多唇腭裂的致病基因或暴露在更强的环境因素之中,他们虽未发病,但易患性更接近发病阈值,使得一级亲属的再发风险增高。这一点与单基因遗传病不同,如常染色体隐性遗传病,无论一个家庭已生育一个或更多的患儿,患者同胞的再发风险理论上仍为25%。
(4)患者亲属的再发风险与患者病情严重程度有关:
多基因遗传病发病的遗传基础是微效基因的累加效应。如果患者病情严重,说明其易患性远远高于发病阈值,可能带有更多的易感基因,其父母所带有的易感基因也多,易患性也更接近于阈值,再生育时其后代的患病风险也相应增高。例如,单侧唇裂患者的同胞再发风险为2.46%;单侧唇裂合并腭裂的患者同胞再发风险为4.21%;双侧唇裂加腭裂的患者同胞再发风险为5.74%,这说明缺陷越严重,潜在的易患性越大。这一点也与单基因遗传病不同,在单基因遗传病中,不论病情轻重如何,其再发风险仍为50%或25%。
(5)患者亲属的再发风险与疾病发病率有关:
如果某种多基因遗传病在一般群体中的患病率越低,则其发病阈值越高,患者超过发病阈值而发病,说明带有更多的易感基因,因而患者亲属的再发风险相对增高;反之,在一般群体中的发病率越高,则发病阈值越低,患者带有较少的易感基因,亲属再发风险也相对减小。
(6)多基因遗传病的群体患病率存在性别差异时,亲属的再发风险与性别有关:
某种多基因遗传病的群体患病率存在性别差异,说明不同性别的发病阈值是不同的。对于群体患病率较低而阈值较高的性别患者,其亲属再发风险相对增高;相反,对于群体中患病率较高但阈值较低的性别患者,其亲属的再发风险也相对降低,这种现象称为Carter效应(Carter effect)。 例如,先天幽门狭窄男性的患病率为0.5%,女性的患病率仅为0.1%,男性比女性患病率高5倍。男性患者的后代中儿子的再发风险为5.5%,女儿的再发风险是2.4%;而女性患者的后代中儿子的再发风险高达19.4%,女儿的再发风险高达7.3%。这样的结果说明,女性患者比男性患者带有更多的易感基因。
五、线粒体遗传
线粒体是真核细胞的能量代谢中心,细胞呼吸作用中的氧化还原反应在线粒体中进行。线粒体内膜富含呼吸链-氧化磷酸化系统的酶复合体,通过电子传递和氧化磷酸化产生大量ATP,为细胞的各种生命活动提供能量。线粒体基因组DNA(mitochondrial DNA,mtDNA)的结构已在本章第一节中做了介绍。mtDNA与核DNA的不同之处在于,mtDNA分子上没有核苷酸结合蛋白,缺乏组蛋白对DNA的保护作用;而且线粒体内缺乏DNA损伤修复系统,使得mtDNA易于发生突变而无法修复,突变容易传递。另外,大部分细胞含有数百个线粒体,每个线粒体含有2~10个mtDNA分子,这样每个细胞可含有数千个mtDNA,成为mtDNA杂质性的分子基础。有性生殖的受精方式决定了mtDNA的母系遗传特点。线粒体广泛存在于除红细胞以外所有的组织细胞中。脑和骨骼肌作为高能量代谢器官,其细胞中含有大量线粒体,因而mtDNA缺陷产生极其广泛的疾病谱,最主要的表现为线粒体性脑肌病。目前,已发现人类100多种疾病与线粒体基因突变有关。
(一)线粒体遗传规律
mtDNA与核DNA相比有其独特的传递规律,其遗传特点呈非孟德尔遗传方式,又称核外遗传。了解线粒体遗传规律有助于更好的认识线粒体疾病的病因学与发病机制。
1.mtDNA的复制具有半自主性
与其他特化的膜性细胞器相比,线粒体拥有自己的遗传物质,被称为“第25号染色体”或“M染色体”。线粒体DNA能够独立进行复制、转录和翻译。然而,线粒体呼吸链-氧化磷酸化系统的80多种蛋白质亚基中,mtDNA仅编码13种,绝大部分需要依赖于核DNA编码。此外,维持线粒体结构和功能的大分子复合物也需要核DNA编码。因此,线粒体是一种半自主细胞器,mtDNA的功能受核DNA的影响,mtDNA基因与核DNA突变均可导致线粒体蛋白质合成受阻,引起细胞能量代谢障碍。
2.线粒体基因组所用的遗传密码和通用密码不同
mtDNA的遗传密码中UGA编码色氨酸,而非终止信号,mtDNA的基因无终止子。tRNA兼用性较强,其反密码子主要识别密码子的前两位碱基,第3位碱基的识别有一定的自由度,称为碱基摆动,可识别4种碱基中的任何一种,因此,仅用22个tRNA便可识别线粒体mRNA的多达48个密码子(表1-10)。
表1-10 丙氨酸(Ala)的tRNA反密码子摆动
3.mtDNA为母系遗传
人类受精卵中的线粒体绝大部分来自母亲的卵母细胞,即母亲将mtDNA传递给她的儿子和女儿,但只有女儿能将其mtDNA传递给下一代,这种传递方式称为母系遗传(maternal inheritance)。精子中的线粒体只位于精子的中段,它们在受精过程中几乎不能进入卵细胞,因而受精卵中极少发现父源性线粒体。如果家系中一些成员具有相似的临床症状,并且都是从女性患者传递而来,则应考虑可能为mtDNA基因突变造成的。然而,如果是编码线粒体蛋白的核基因突变,则不会呈现母系遗传。然而,有时某些突变的mtDNA未能通过遗传瓶颈,使得疾病的传递也可能不完全符合母系遗传。
4.mtDNA在有丝分裂和减数分裂期间都要经过复制分离
个体的卵母细胞中约有100 000个线粒体,然而卵母细胞经历减数分裂发育成熟时,绝大多数线粒体会丧失,数目会减少到10~100个。受精卵经过细胞有丝分裂和增殖,线粒体的数目又可能达到10 000个或更多。这种卵细胞形成期mtDNA的数量锐减的过程,称为遗传瓶颈(genetic bottleneck)。通过遗传瓶颈,只有随机的一小部分mtDNA可以进入成熟的卵细胞传给子代,如果保留下来的mtDNA恰巧携带一种突变的基因,则随着胚胎细胞分裂和组织形成,mtDNA复制后随机分离到子细胞中,使得部分子细胞及其分化形成的成体组织细胞含有大量携带突变基因的线粒体。当氧化磷酸化系统缺陷的线粒体数量过多时,会影响组织能量供应,进而影响器官功能,这在高耗能组织格外明显。
5.mtDNA的杂质性与阈值效应
纯质性(homoplasmy)是指一个组织或细胞中含有相同的线粒体基因组,要么都是野生型,要么都是突变型。反之,杂质性(heteroplasmy)是指一个组织或细胞中既含有野生型线粒体基因组,又含有突变型线粒体基因组。杂质性产生的机制在于,mtDNA能够自主进行复制,与细胞周期及细胞核复制时无关;线粒体可随细胞分裂随机分配到子细胞中,造成不同的组织或细胞中携带突变型mtDNA的比例也不同,这也造成了线粒体基因病存在组织特异性表型和表型多样性。
杂质性细胞的表型取决于细胞内野生型和突变型mtDNA的相对比例,当突变型mtDNA达到一定比例,产生的能量不足以维持细胞的正常功能时,就会出现异常表型,即线粒体基因病。因此,mtDNA突变存在阈值效应,能引起特定组织器官功能障碍的最低数量的突变mtDNA称为阈值。阈值是一个相对概念,易受突变类型、组织、老化程度的影响,个体差异很大。突变的mtDNA随着年龄的增加在细胞中逐渐积累,病情也常表现为与年龄相关的渐进性加重。
6.mtDNA的突变率极高
mtDNA存在极高的突变率,原因在于mtDNA缺少组蛋白的保护,而且线粒体中缺乏DNA损伤修复系统。mtDNA的突变率比核DNA高约10~20倍,mtDNA中氧化磷酸化基因的突变率也远远高于核DNA。高突变率使得个体和群体中的序列差异较大,多态性也较高,任意两个人的mtDNA平均每1000bp中有4个不同。人群中含有多种中立到中度有害的mtDNA突变,但有害突变会因为选择而消失。因此,突变的mtDNA较普遍,但线粒体基因病并不常见。
(二)线粒体基因突变
线粒体基因组缺陷所引起的疾病称为线粒体基因遗传病(mitochondrial genetic disorder),属于细胞核外遗传。线粒体基因病常见临床表现包括肌病、心肌病、痴呆、突发性肌阵挛、耳聋、失明、贫血、糖尿病及大脑供血异常(休克)等。临床表现的严重程度依赖于多种因素,如胚胎发育早期突变型mtDNA的复制分离程度、突变型mtDNA在特定组织中的累积程度、杂质性程度、组织对氧化磷酸化的依赖性以及年龄等。常见的与线粒体疾病相关的mtDNA异常见表1-11。
表1-11 与线粒体基因病相关的mtDNA异常
续表
根据 www.gen.emory.edu/mitomap.htm l,D:常染色体显性;2-Hit:与神经母细胞瘤 AD 形式相似;M:母系;(M):有大量mtDNA重复的母亲母系遗传而来的稀有病例;R:常染色体隐性;S:散发
线粒体基因突变的类型主要包括碱基突变、缺失和插入突变,以及mtDNA拷贝数目突变。
1.碱基突变
包括错义突变及蛋白质生物合成基因突变。前者又称为氨基酸置换突变,主要为脑脊髓性及神经性疾病的致病突变类型,如Leber遗传性视神经萎缩和神经疾病。后者为tRNA基因突变,这类突变导致的疾病比错义突变所致的疾病更具有系统性的临床特征,并且与线粒体肌病相关,代表性疾病包括肌阵挛性癫痫伴碎红纤维病(MERRF综合征)、线粒体脑肌病乳酸中毒及卒中样发作(MELAS综合征)、母系遗传的肌病及心肌病等。
2.缺失和插入突变
以缺失突变为多见,主要引起眼肌病。mtDNA发生缺失的原因常常是由于mtDNA的异常重组或复制过程中的异常滑动所致。这类疾病常常散发而无家族史,多见于一些神经性及退行性疾病中,如Kearns-Sayre综合征。
3.mtDNA拷贝数目突变
以拷贝数目减少为主,mtDNA的拷贝数大大低于正常,仅见于一些致死性婴儿呼吸障碍、乳酸中毒或肌、肝、肾衰竭的病例。
另外,可以根据组织分布和表型,将mtDNA点突变分为3类,该分类对基因治疗可能有提示作用。
(1)有限的组织-有限的表型:
该类突变只限于骨骼肌,只在患者肌肉组织中才能检测到突变,主要临床表现为肌萎缩性运动障碍。大部分编码蛋白的mtDNA基因突变和部分线粒体tRNA突变[tRNAu(CUN)基因中的 G12315A和 A12320G突变、tRNATyr基因中的 A5874G突变]属于这一类型。目前尚不清楚为什么这些点突变只存在于骨骼肌细胞中,可能的解释是突变事件发生于胚胎发育后期,即中胚层形成之后。
(2)有限的组织-无限的表型:
在分析的所有组织中,基因突变无差异,但疾病的表型却存在明显的组织特异性。该类突变包括Leber遗传性视神经萎缩的3个最常见的突变G11778A、T14487C、G3460A,以及非综合征型或氨基苷诱发的感觉神经性耳聋突变(A1555G和A7445G)。
(3)无限的组织-有限的表型:
患者的许多组织都可以检测到这些突变,但杂质性比例不同,引起的临床表现多涉及多系统及中枢神经方面的症状。大部分线粒体tRNA的突变及少数编码蛋白质的mtDNA基因突变属于这一类型。
总体说来,大部分编码蛋白质的mtDNA基因突变属于第一或第二类,第三类较少;而大部分tRNA基因突变属于第三类,极少数属于第一或第二类。
(赵彦艳)