原核生物和真核生物的基因组有哪些基本特征?

原核生物和真核生物的基因组有哪些基本特征?
2023年04月16日 13:34 补点芝士

大家好!今天咱们来说说原核生物和真核生物基因组的基本特征。

原核生物,比如细菌、支原体、衣原体、立克次体、螺旋体、放线菌,都有完整的代谢系统,并且可调节代谢以适应营养状况和环境因素的变化。因此,原核生物基因组中基因的数目多于病毒,但少于真核生物,并有以下基本特征。

1.基因组DNA大多数为单一闭环双链分子原核生物的DNA虽然结合有少量蛋白质,但并未形成典型的染色体结构,只是习惯上也称为染色体。染色体在细胞内形成一个致密区域,称为原核(prokaryon)、类核(nucleoid)。原核无核膜,其核心部分(20%)由RNA和支架蛋白构成,外周(80%)是基因组DNA。

2.基因组DNA只有一个复制起点真核生物基因组DNA有多个复制起点。

3.基因组序列以编码序列为主占85%~90%,非编码序列主要是一些调控元件。

4.基因组所含基因的数目比病毒多细菌有1700~7500个,较小的支原体也有近500个基因。许多基因形成操纵子结构。

真核生物基因组比原核生物基因组还要大,结构更复杂,并有以下基本特征。

1.染色体DNA是线性分子含三种功能元件。

(1)复制起点(origin of replication,ori) 功能是启动DNA复制。每个染色体DNA分子都有多个复制起点,例如酵母每个染色体DNA分子平均有25个复制起点。

(2)着丝粒DNA(centromere,CEN) 为真核生物所特有,功能是将染色体均分给子细胞。酿酒酵母着丝粒DNA是约125bp的单一序列,而大多数真核生物着丝粒DNA是>40kb的高度重复序列,富含A-T。人着丝粒DNA又称α卫星DNA。着丝粒DNA几乎不含蛋白基因。

(3)端粒(telomere,TEL) 为真核生物所特有,功能是维持染色体结构的独立性和稳定性,参与DNA复制完成。端粒位于染色体DNA末端,是一种富含T/G的短串联重复序列,不含蛋白基因。例如,哺乳动物和其他脊椎动物端粒以TTAGGG为重复单位,串联重复500~5000次,长度为3~30kb(人的3~20kb),末端有10~100nt的黏性末端,形成5~10kb的t环。

2.染色体DNA形成染色体结构染色体数目一定,除了配子是单倍体外,体细胞一般是二倍体。

3.基因组序列中仅有不到10%是蛋白质编码序列人类基因组甚至不到2%。编码序列在基因组序列中的比例是真核生物、原核生物和病毒基因组的重要区别,并且在一定程度上是衡量生物进化程度的标尺。

4.基因在基因组中散在分布相邻基因被称为基因间区(intergenic region,又称基因间序列,intergenic sequence,占人类基因组的2/3。不过,目前看来,这部分可能不到10%)的非编码序列隔开。很多基因间区的功能尚未阐明。

5.基因组序列中包含大量重复序列重复序列(repetitive sequence)又称重复DNA(repetitive DNA)。每一种重复序列都是一定拷贝数(copy number,一个细胞内所含某种基因或DNA分子、序列的数目)的某种核苷酸序列(称为重复单位)的集合。重复序列可根据重复单位的连续性分为串联重复序列(tandem repeat)和散在重复序列(interspersed repeat sequence),也可根据重复程度分为高度重复序列、中度重复序列和单一序列。

(1)高度重复序列(highly repetitive sequence) 又称高度重复DNA(highly repetitive DNA),在基因组中呈串联重复或反向重复排列,且大部分位于异染色质区,特别是除酵母外的端粒和着丝粒区,重复单位长度不到100bp(通常不到10bp),拷贝数可达10^6个,占哺乳动物基因组序列的不到10%(人类3%)。高度重复序列不编码蛋白质或RNA,其已阐明的功能是参与DNA复制、DNA转座、基因表达调控和细胞分裂时的染色体配对,例如着丝粒DNA是富含A-T的高度重复序列。

(2)中度重复序列(moderately repetitive sequence) 又称中度重复DNA(moderately repetitive DNA),多数散在分布于基因组中,重复单位长度可达10^2~10^3bp,拷贝数可达10^3个,占哺乳动物基因组序列的25%~50%(人类50%),包括一些基因间区、转座子、串联重复序列(如Alu序列和KpnⅠ序列)、蛋白基因内含子,也包括rRNA基因(100~5000个拷贝,例如人类基因组约有200个,分布在5条染色体上;爪蟾基因组约有600个,集中在1条染色体上)、tRNA基因(如人类基因组有497个)、5S rRNA基因(如人类基因组约有2000个)和某些蛋白基因(如组蛋白、肌动蛋白、角蛋白等)。

中度重复序列可分为长散在元件(long interspersed nuclear element,LINEs)和短散在元件(short interspersed nuclear element,SINEs)。

(3)单一序列(unique sequence) 又称单拷贝序列(single-copy sequence)、单一DNA(unique DNA)、非重复DNA(nonrepetitive DNA),在整个基因组中只有一个或几个拷贝。哺乳动物基因组序列的50%~60%是单一序列。蛋白基因大部分属于单一序列,但只占其一小部分。

不同生物基因组中所含重复序列比例差异极大。原核生物基因组几乎不含重复序列,大多数单细胞真核生物基因组含中度重复序列不到20%,动物基因组所含中度和高度重复序列可达50%,植物和两栖动物基因组所含中度和高度重复序列可达80%。

一个细胞含许多mtDNA拷贝,因此mtDNA属于重复序列。

6.基因组中存在各种基因家族基因家族成员或形成基因簇,或散在分布。

7.基因组中含大量转座子如人类基因组序列中45%为转座子序列,不过其中绝大多数因存在缺陷而不能转座。

以上就是原核和真核生物基因组的基本特征,下次咱们聊聊DNA的多态性和遗传标记。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部