首个复杂细胞的基因组来自多种物种的混合基因
摘要
一项新研究揭示,早期复杂细胞(真核细胞)的基因组是通过来自多种细菌和古菌的多波基因转移构建的,这使得简单的融合模型变得更加复杂。
<p>我们倾向于将自身以及构成我们的复杂细胞视为生命之树中的一个独特分支,与细菌和古菌那些紧凑、看似无特征的细胞截然不同。但我们发现,我们的基因组实际上是一个混合体,是来自细菌和古菌的基因大杂烩,其中也有一些在我们自身的谱系中演化而来。</p>
<p>科学家们逐渐接受了一个简单的解释:第一个复杂细胞是古菌细胞与细菌融合的产物,细菌最终演化成了线粒体——一种产生化学能量的结构,至今仍保留着少量自己的基因组。随着时间的推移,许多其他细菌基因被转移到正在演变成我们现在所称的真核细胞的细胞核中,与那里的古菌基因混合在一起。</p>
<p>但一项新研究仔细审视了所有真核生物共有的基因,得出的结论是,实际情况要更复杂一些,并且存在多波来自细菌的基因转移。细菌与古菌融合的大框架仍然正确,但这只是其中一部分,物种间的基因转移在当时是普遍现象。</p><p><a href="https://arstechnica.com/science/2026/06/the-first-complex-cells-had-genes-from-a-complex-mix-of-species/">阅读全文</a></p>
<p><a href="https://arstechnica.com/science/2026/06/the-first-complex-cells-had-genes-from-a-complex-mix-of-species/#comments">评论</a></p>
查看缓存全文
缓存时间: 2026/06/11 13:33
# 第一批复杂细胞的基因来自多种物种的混合
来源:https://arstechnica.com/science/2026/06/the-first-complex-cells-had-genes-from-a-complex-mix-of-species/
我们祖先的基因组是通过一次次基因转移浪潮构建而成的。
我们倾向于将自己和构成我们的复杂细胞视为生命之树中一个独特的枝干,区别于细菌和古菌那些紧凑、看似毫无特征的细胞。但我们发现,我们的基因组实际上是一个混合体——来自细菌和古菌的基因大杂烩,其中还夹杂着一些在我们自身谱系中进化出来的基因。
科学家们逐渐为这一现象找到了一个简单的解释:第一批复杂细胞是古菌细胞与细菌融合的产物,细菌最终进化成了线粒体——一种仍保留着部分自身基因组的化学能量生成结构。随着时间的推移,许多其他细菌基因被转移到了正在成为我们现在所称的真核生物的细胞核中,与那里的古菌基因相互混杂。
但一项新研究仔细审视了所有真核生物共有的部分基因,并得出结论认为实际情况要稍微复杂一些:存在多波来自细菌的基因转移。关于细菌与古菌合并的大图景仍然是正确的,但这只是基因转移在物种间司空见惯的图景中的一部分。
## 模糊的大图景
通向当前图景的道路十分曲折。首先,人们花了很长时间才认识到古菌是一个独立的谱系。而极力主张线粒体是细菌在其他细胞内定居产物的那位科学家,在被嘲笑多年后才使她的观点被广泛接受,之后她又开始主张真核细胞内所有复杂结构都是通过类似过程产生的。(没有证据支持这一点。)
随着时间的推移,尤其是在基因组序列变得广泛可用之后,人们逐渐清楚线粒体的基因——无论是其微小的剩余基因组中的,还是现在存在于我们细胞核中的——都起源于一个名为α变形菌的细菌谱系。但最初是什么吞噬了α变形菌,这个问题又花了更长时间才弄清楚。嫌疑落在了古菌身上,但古菌与我们之间存在一些关键的生化差异,而且已知的古菌甚至缺乏许多真核生物关键系统的原始版本。此外,也没有与真核生物基因组特别接近的古菌基因组。
这一情况直到大约十年前才有所改变。研究人员开发出无需先分离不同细胞类型、即可从环境样本中组装整个基因组的技术后,他们发现了阿斯加德古菌,这个类群与真核生物关系如此密切,以至于让人们开始质疑我们是否应该干脆将真核生物视为古菌的一个复杂分支。
但即使大图景变得越来越完整,复杂因素也在不断累积。例如,很明显,水平基因转移——基因在可能亲缘关系很远的物种之间交换——在微生物群落中极为常见。与此一致的是,研究人员继续在真核生物中发现来自α变形菌以外谱系的基因簇。
此外,还有一个挑战是弄清祖先真核生物基因组的样子。如果我们简单地将真核基因定义为尚未在细菌或古菌基因组中出现的基因,那就有可能在后来的发现中被推翻。我们也可能缺乏足够广泛的真核生物基因组集合来确信我们判断哪些基因属于所有真核生物共同祖先的能力。对此类问题的不同假设可能会产生不同的进化历史。
## 第一批真核生物
这就是巴塞罗那的一组研究人员决定涉足的情况。他们的第一步是限制真核生物家族树中包含的物种数量。我们已测序的物种往往严重偏向于动物和常见环境中的物种,导致家族树的某些分支被过度代表。该团队选择的物种使样本在树上的分布更加均匀。
在他们保留的基因组中,他们剔除了任何会产生所谓“低复杂度”蛋白质的基因——比如那些重复大量相同氨基酸短序列的基因。许多真核生物基因彼此也是近亲,这是由于祖先基因多次重复复制造成的。研究人员只从这些相关蛋白质集合中保留了一个基因。这导致基因数量远少于典型真核生物基因组中的数量。
而且,完成这一切后,他们又将这个过程重复了两次,每次做出不同的选择,使得每组中超过一半的基因与其他任何一组中的基因都不相同。(有趣的是,每组基因被称为“直系同源组”,导致论文中大量讨论“OG”。)
通过审视这些简化基因组中存在的基因功能,研究人员可以对所有真核生物最后共同祖先具有哪些类型的遗传功能做出一些估计。他们的结论是:这种生物生活在含氧环境中,通过捕食其他生物或以其残骸为食来获取能量。
这些细胞内部已经复杂,有内部的蛋白质轨道,由在细胞内运输货物的马达蛋白穿行其中。有用于消化细胞内蛋白质的结构(溶酶体和过氧化物酶体),以及真核生物代谢、DNA复制和RNA生成的所有基本要素。缺失的一大特征是一组用于决定细胞何时分裂以及管理分裂所需事件的基因。这可能表明细胞分裂最初只是受代谢限制。
## 这是如何发生的?
大约三分之一的基因类群似乎是真核生物特有的,在其他界中没有对应物。其中一些可能存在于产生真核生物最后共同祖先的谱系中,另一些可能是在真核生物真正开始多样化和分叉之前产生的。
正如预期的那样,许多其他基因来自阿斯加德古菌或α变形菌,这与我们起源的大图景模型一致。但研究人员还发现,另外两个细菌类群——浮霉状菌和粘细菌——的贡献大致相同。(所有涉及的细菌类群都多样化且相对常见,与阿斯加德古菌形成鲜明对比。)这些结果在他们三次不同的基因选择中均成立,因此不太可能是分析的伪影。
此外,还有来自一系列不同细菌类群的小贡献。但来自包括巨型病毒在内的病毒类群的贡献,比任何一个单一细菌类群的贡献都要大。
研究人员还估计了基因类群被引入的时间。正如预期,阿斯加德古菌是最早的贡献者。但有一个细菌谱系在线粒体存在之前引入了大量基因,另一个组群在线粒体之后做出了重大贡献。如果真核生物是在微生物席中进化出来的——那里许多物种长期紧密靠近,并可能依赖彼此提供某些代谢物——那么这一切就说得通了。
## 一幅复杂的图景
虽然这里显然至少有一个内共生案例——细菌在另一个细胞内生存并最终形成线粒体——但也完全有可能存在其他内共生案例,只是最终只留下了遗传残余。从这些数据中无法判断这一点。
病毒的贡献也可能很复杂。可能有些基因被鉴定为病毒基因,是因为它们在当今的病毒中被发现,但最初起源于其他最终灭绝的谱系。病毒在微生物群落中通常介导水平基因转移,这类似于这种情况。
作者也承认,这篇论文不会是这个话题的终稿。他们写道:“数据库的完整性,而非方法选择,很可能是导致不同研究之间存在差异的原因。”换句话说,随着更多基因组序列不断进入公共数据库,重新审视这一分析可能是值得的。(引用的声明也解释了为什么他们的结果可能与过去尝试类似工作的人不同。)
但无论存在不确定性以及未来修正的前景如何,作者们有一个表述几乎肯定会保持正确,即使他们的一些结果站不住脚:“原核生物到真核生物的过渡可能是一个渐进且复杂的过程。”
《自然》,2026。DOI:10.1038/s41586-026-10639-9(关于DOI)
John Timmer的照片
John是Ars Technica的科学编辑。他拥有哥伦比亚大学的生物化学学士学位,以及加州大学伯克利分校的分子和细胞生物学博士学位。离开键盘时,他往往会找一辆自行车,或者找一个风景优美的地方远足。
2条评论
1. “最热阅读”中第一篇故事的配图:廉价的伊朗无人机击落了价值2500万美元的美国陆军直升机——也许是偶然
相似文章
AlphaGenome:用于更好地理解基因组的人工智能
DeepMind 推出 AlphaGenome,这是一个能够预测 DNA 序列变异如何影响基因调控和生物过程的 AI 模型,可应用于多种细胞类型和组织。该模型可处理多达 100 万个碱基对,通过 API 向非商业研究提供,完整论文已在《自然》杂志上发表。
与冰人奥茨一起冻结的古老微生物仍在生长
一项对冰人奥茨微生物组的研究揭示了仍然存活着的古老酵母和细菌菌株,为了解他这一人生态系统提供了见解。
科学家以惊人精度编辑人类胚胎基因
科学家在人类胚胎基因编辑方面取得了惊人精度,标志着基因工程的重大进展。
@AnthropicAI:新科学博客:为什么AI在编程领域进步快于生物学?对智能体而言,生物数据库就像为汽车时代之前建造的城市……
Anthropic的科学博客认为,AI在生物学领域的进展落后于编程,因为生物数据基础设施并非为智能体设计。一项案例研究表明,添加确定性检索层(gget病毒)可将准确率提升至接近100%。
@arcinstitute: 因为PerturbSpace使用标准的单细胞测序,它与任何单细胞读出都兼容。在一天内,…
Arc Institute的PerturbSpace利用标准单细胞测序,可在一天内从多个样本中实现转录组、位置、CRISPR向导、克隆关系及表面蛋白的高通量单细胞分析。