4月1日凌晨,被誉为生命科学“登月计划”的人类基因组测序再次取得重大进展:基因序列国际科学团队端粒到端粒联盟(T2T)发表了第一个完整的、无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。《科学》杂志连发6篇论文报告这一成就。 早在2001年,由6国科学家共同参与的国际人类基因组计划首次公布人类基因组图谱及初步分析结果;2003年公布了人类基因组序列草图。由于技术限制,当初的人类基因组计划留下了大约8%的“空白”间隙。 当时这8%为什么测不出来?如今科学家是如何完成首个完整无间隙人类基因组序列的?人类基因组测序完成有什么意义? 当时这8%为什么测不出来?这些部分是负责干什么的? 在2003年公布的人类基因组序列草图中,人类基因组的绝大部分区域已经能够通过测序进行读码,其中真正属于编码蛋白质基因的部分只占到1%,剩下99%的区域包含着大量突变,是不编码蛋白质序列的片段,因此,也曾被科学家称为“垃圾序列”。 但在后续研究中发现,“垃圾序列”中也包含着很多与基因本身的调控功能有重要联系的序列区域,对编码蛋白质的基因区域有调控作用。然而,想要对它进行测序,困难重重,因为其中存在着大量重复序列,当时的测序方法难以应对。 北京航空航天大学教授、结构生物学家、中国生物物理学会科普工委秘书长叶盛介绍,人类的染色体中有接近31亿对碱基,但当时的测序技术每次只能读取几百位碱基,两者之间存在着巨大的差距。而且当时研究人员所使用的鸟枪法技术,需要把整个DNA全部剪断,再对碎片进行测序,之后根据碎片之间重叠的部分重新拼接。大量重复序列的存在令拼读变得十分困难,导致很多区域被遗漏,也就是这8%的“空白”间隙。
|