医学遗传学(第4版)(全国高等学历继续教育“十三五”(临床专本共用)规划教材)
上QQ阅读APP看书,第一时间看更新

第一节 人类基因组概论

真核细胞最显著的特征是具有细胞核。在细胞分裂间期,细胞核内的DNA分子和蛋白质结合成染色质(chromatin),在细胞有丝分裂阶段,染色质螺旋化,浓缩成为染色体(chromosome)。染色体是遗传信息的载体,也是遗传的物质基础。人体每个体细胞内含有两个染色体组,每个染色体组的DNA构成一个基因组。每个基因组的DNA含有2.85×10 9个碱基对。广义的基因组包括细胞或生物体的全套遗传物质,人类包括通常意义上的细胞核基因组和线粒体基因组。
一、人类基因组序列组成
根据基因组DNA的碱基排列序列重复出现的程度不同,基因组DNA碱基序列分为重复序列和单一序列。目前的人类基因组测序结果提示人类细胞核染色体基因组中90%左右为DNA重复序列,10%左右为单一序列。
1.单一序列
单一序列(unique sequence)在人类基因组中约占DNA的10%,指在一个基因组中只出现一次或者几次的DNA序列。它们主要构成编码蛋白质或酶的基因,称为结构基因(structure gene)。目前估计一个人类基因组中大约含有2万~2.5万个左右的结构基因,在这些基因之中,有一部分是多个拷贝的基因家族。在基因组中,单一序列常被重复序列隔开。
2.重复序列
重复序列(repetitive sequence)是指一个基因组中存在有多个拷贝的DNA序列,约占人类基因组的90%。根据DNA重复顺序的长度和拷贝数,重复序列又可分为高度重复序列和中度重复序列。
在人类基因组当中,高度重复序列(highly repetitive sequence)通常是由很短的碱基序列组成(一般不大于200bp),重复频率很高,可以达10 6以上,散在于基因组中,占基因组的10%~30%。高度重复序列一般不进行转录,不编码任何蛋白质。目前认为它们的主要功能为参与维持染色体的结构,如构成着丝粒、端粒等间隔结构基因并参与减数分裂时染色体的配对。
中度重复序列(intermediate repetitive sequence)是在人类基因组内散在或成簇存在的、长度大于300bp的一些序列,根据其长度和拷贝数分为短分散DNA序列,也称短分散核元件(short interspersing nuclear element,SINE)和长分散DNA序列,也称长分散核元件(long interspersing nuclear element,LINE)。这些元件被认为具有重要的生物学功能和医学价值,已证实SINE和LINE是造成一些遗传病中的突变的原因。至少这些家族中的一些拷贝是高度活动的,它们可以将不同的拷贝插入到基因组的其他位置,从而可能造成一些重要基因的插入失活。
3.多基因家族
多基因家族(multigene family)是真核生物基因组中最重要的特点之一,指由一个祖先基因经过重复和变异所产生的一组来源相同、结构相似、功能相关的基因。多基因家族可分为两种类型:一种类型是基因家族的各个成员具有几乎相同的碱基顺序,串联排列集中在一条染色体上,这种集中成簇的一组基因称为基因簇(gene cluster),同时发挥作用,合成某些蛋白质;另一种类型是一个基因家族可分为若干群,分别成簇地分布在几条不同的染色体上。此外,在多基因家族中,有些成员不具有任何功能,被称为假基因。
4.假基因
假基因(pseudogene)是一种与相应的正常基因序列类似,但却不能编码蛋白质的核苷酸序列。现已在大多数真核生物中发现了假基因,如珠蛋白、干扰素、组蛋白及人的rRNA和tRNA等基因家族中均存在假基因。假基因起初也可能是有功能的基因,以后由于缺失、倒位或点突变等原因使这些基因变成了无功能的基因。
二、人类基因组化学成分和特征
1944年Avery等用实验的方法证明了DNA是生物的遗传物质。1953年Watson和Crick在前人工作的基础上,提出了著名的DNA分子双螺旋结构模型,奠定了DNA复杂功能的结构基础。
1.DNA分子的组成和一级结构
组成DNA分子的基本单位是脱氧核苷酸。每个脱氧核苷酸由磷酸、脱氧核糖和含氮碱基组成。碱基有4种:腺嘌呤(adenine,A)、鸟嘌呤(guanine,G)、胞嘧啶(cytosine,C)和胸腺嘧啶(thymine,T)(图 2-1)。因碱基的不同,可以构成4种不同的脱氧核苷酸:脱氧腺嘌呤核苷酸(dAMP,A)、脱氧鸟嘌呤核苷酸(dGMP,G)、脱氧胞嘧啶核苷酸(dCMP,C)和脱氧胸腺嘧啶核苷酸(dTMP,T)。这4种脱氧核苷酸按一定顺序连接起来构成脱氧多核苷酸长链(DNA单链)。在多核苷酸链上,前一个核苷酸脱氧核糖的3′位羟基与后一个核苷酸脱氧核糖的5′位磷酸结合,脱水后形成3′,5′磷酸二酯键(图2-2)。大多数自然状态下一个多核苷酸长链分子的两端,总有一个脱氧核糖带有自由的5′磷酸,称为5′端。而另一端的脱氧核糖带有自由的3′羟基,称为3′端。DNA分子由两条多核苷酸链组成,两条多核苷酸链之间通过碱基配对的方式彼此互补成双链结构。DNA分子在上述结构形成的基础上,最后形成了一个由两条反向平行的多核苷酸链所组成的稳定的双链DNA结构,也即DNA的一级结构。
图2-1 构成DNA的碱基
图2-2 DNA双螺旋的化学结构与碱基配对
图2-3 DNA分子双螺旋结构模型
2.DNA的双螺旋结构
1953年Watson和Crick提出了DNA双螺旋结构分子模型(图2-3)。这一模型提出DNA分子是由两条反向平行的多核苷酸链围绕一个共同的轴盘绕而成的双螺旋结构,两条链的方向是一条链从 5′→3′,另一条链从 3′→5′,主链位于螺旋的外侧,脱氧核糖平面与螺旋轴平行,碱基对位于螺旋的内部;两条多核苷酸链上互配的碱基借氢键相连,A与T、G与C配对;碱基平面与螺旋轴基本垂直,嘌呤和嘧啶上的氨基和酮基具有亲水性,使互配的碱基之间可以形成碱基对,A和T之间有两个氢键,G和C之间有三个氢键;大部分双螺旋链中每一螺旋内含10个碱基对;沿螺旋轴方向观察,双螺旋的表面存在两条凹槽,一条深而宽,称为大沟;一条浅而窄,称为小沟。
DNA分子的双螺旋结构具有重要的生物学意义:DNA分子的碱基排列顺序储存了大量遗传信息,若一个DNA分子长度为n个碱基,就可能有4 n种排列序列;DNA分子的碱基互补结构是DNA复制和修复的基础,DNA双链中的每条链都可作为模板合成一条新的DNA双链,同时DNA分子受损时,可在修复酶的作用下,以互补链为模板进行修复;DNA分子的双链互补结构是分子杂交技术的基础,利用DNA碱基互补,单链DNA可以从复杂的DNA混合物中找到与其互补的DNA序列;DNA双螺旋结构中的大沟是DNA与蛋白质相互作用的结构基础,基因转录时转录因子与大沟的DNA相结合而发挥作用。