重新定义遗传力后,人类寿命遗传力约为50%
摘要
一篇文章批评了近期发表在《科学》杂志上的一篇论文,该论文重新定义了遗传力,在一个没有意外死亡或感染性疾病的假设世界中估计人类寿命遗传力约为50%,并认为该论文的结论具有误导性。
暂无内容
查看缓存全文
缓存时间: 2026/05/13 18:15
# 人类寿命的遗传率约为50%——当遗传率被重新定义成不同的东西时
来源:https://dynomight.net/lifespan/
发色的遗传率有多高?嗯,如果你是一个红头发的人,并且你有一个同卵双胞胎,那么他/她肯定也是红头发。但双胞胎长白头发的年龄似乎会因生活方式而略有差异。而且胚胎时期黑色素细胞最终分布在头骨的什么位置也有一定随机性。你的双胞胎还可能染发!所以正确的答案是:一个很大的数字,但不到100%。
好吧,但看看这个:假设我把“发色”重新定义为“忽略表观遗传和胚胎因素,并假装没有人会变白头发、染发等等的发色”。现在,发色的遗传率是100%。太神奇了,对吧?
或者——智商的遗传率有多高?智者会回答:“在0%到100%之间的某个数字,这不重要,请别对我大喊大叫。”但无论这个数字是多少,它都取决于社会。在我们这个多元宇宙的分支里,有些孩子有私人教师、有机食品和两万美元的夏令营,而其他孩子则面对功能失调的学校、含铅油漆,以及喝着百事可乐盯着发光长方形的夏天。这些肯定对智商至少有*一些*影响。
但再看一次:假设我把“智商”重新定义为“在一个假设世界里,每个孩子都得到完全相同的学校、营养和养育,因此这些非遗传因素都不再重要的智商”。突然之间,智商的遗传率更高了。令人振奋,对吧?太科学了。
如果你想这样重新定义东西……那也不是*错*的。我的意思是,遗传率本来就是一个相当武断的概念。所以如果你更喜欢讨论另一个世界里的遗传率而不是我们真实世界里的,我又有什么资格评判呢?
顺便说一句,这里有一篇近期论文(https://doi.org/10.1126/science.adz1187):
**我强调这是一篇完全没问题的论文。**我挑它的毛病主要是因为它在《科学》杂志上发表——这意味着,和所有《科学》论文一样,它宣称了不起的发现,但对这些发现意味着什么或者实际做了什么却含糊其辞。另外,在《科学》上发表论文在道德上是错误的,或者让我嫉妒。所以我想试着解释一下发生了什么。
其实很简单。至少,在我花了几个小时反复阅读论文和附录之后,我现在已经说服自己它很简单了。所以,作为一个小小的教学实验,我打算用三种不同详细程度来解释这篇论文。
## 解释1:非常极其高层的画面
估计寿命遗传率的常规方法是使用双胞胎数据。根据使用的数据集不同,结果会在23-35%之间。这篇论文构建了一个数学模型,试图模拟在一个假设世界中人们*会*活多久——在这个世界里,没有人死于任何与非衰老相关的原因,也就是没有车祸、药物过量、自杀、谋杀,也没有(非衰老相关的)传染病。在那个模拟数据中,对于假设世界中模拟的人,遗传率为46-57%。
每个人似乎都在这样解读这篇论文:
> 啊哈!我们原以为寿命的遗传率是23-35%。但结果发现大约是50%。现在我们知道了!
我理解这一点。显然,当《科学》的编辑们选择这篇论文的标题时,他们的目标就是引导你得出这个结论。但这并不是论文所说的。它说的是:
> 我们构建了一个平行宇宙的数学模型,在这个宇宙中没有人死于事故、谋杀、药物过量或传染病。在那个模型中,遗传率大约是50%。
## 解释2:非常高层画面
让我们重新开始。这是论文中的图2。
通常,遗传率通过双胞胎研究来估计。思路是同卵双胞胎共享100%的DNA,而异卵双胞胎只共享50%。因此,如果某个特征在同卵双胞胎中的相关性高于异卵双胞胎,那就表明DNA影响了该特征。有一些统计方法可以形式化这种直觉。给定一个记录各种同卵和异卵双胞胎寿命的数据集,这些方法会得出一个遗传率数字。
上图中两个这样的传统估计值以黑色圆圈显示。对于丹麦双胞胎队列,寿命的遗传率估计为23%。对于瑞典队列,为35%。
这篇论文创建了一个“双胞胎模拟器”。根据历史数据,他们拟合了一个数学模型来模拟“新”双胞胎的寿命。然后他们在这些模拟数据上计算遗传率。
为什么要在模拟数据而不是真实数据上计算遗传率?嗯,他们的数学模型包含一个“外在死亡率”参数,该参数旨在反映所有非衰老相关因素(如事故、谋杀或传染病)导致的死亡几率。他们假设任何人死于这些原因的概率是恒定的,不随时间变化,并且这解释了几乎所有15到40岁人群的死亡。
建立模拟器的意义在于可以*改变*外在死亡率。这就是上图中紫色曲线所展示的。对于一系列不同的外在死亡率参数,他们模拟双胞胎数据集。对于每个模拟数据集,他们像处理真实数据集一样估计遗传率。
注意上图中的紫色曲线几乎碰到了黑色圆圈。这意味着如果他们用与现实匹配的外在死亡率运行模拟器,得到的遗传率数字会与真实数据得到的数字对齐。这表明他们的数学模型并非完全疯狂。
如果你降低外在死亡率,你就减少了寿命中非遗传的随机性。所以遗传率上升。因此,紫色曲线向左移动时会上升。
## 中场休息:关于《科学》杂志
我对这篇论文的解释依赖于一定程度的猜测。出于某种原因,《科学》杂志决定论文中几乎不应该包含数学,即使这篇论文*是关于*数学的。所以我主要是在根据英文描述工作。但即使那个描述也不系统。没有一处清楚地按照顺序列出了他们做的所有事情。相反,你得到的是零散的提示,随机分布在论文各处。有一个附录,论文自信地反复引用它。但如果你真的读了附录,那只是更多关于随机事物的不连贯解释,只不过现在用华丽的Microsoft Word格式加入了方程。
现在,在大多数期刊中,作者写所有内容。但《科学》有专业编辑。鉴于《科学》上每一篇专注于统计的论文似乎都是这样,我们可能不应该责怪这篇论文的作者。(除了他们最初决定在《科学》上发表这一点。)
不过我想知道那些编辑到底在做什么。让我给你看点东西。这是论文第一页上他们开始实际解释他们真正做了什么的第一段:
看到结尾那个*h(t,θ)*了吗?你可能会问,那到底是什么?这是个好问题,因为它在之前从未被介绍过,之后也再未被提及。我猜它只是想表达*f(t,θ)*,这没问题。(在产生错别字方面我不输任何人。)但如果花钱请期刊带来了这种结果,那些期刊还有什么用?
继续……
## 解释3:也还是高层,但这是我们打算达到的最低层次
可能大多数人不需要这么多细节,应该跳过这一节。对于其他人,让我们最后重新开始一次。
估计遗传率的“常规”方法是查看不同类型双胞胎之间的相关性。直观地说,如果同卵双胞胎的寿命相关性高于异卵双胞胎,那就表明寿命是遗传的。事实证明,遗传率的一个估计量是“同卵双胞胎相关性减去异卵双胞胎相关性的两倍,且都在一起抚养长大。”还有其他类似估计量适用于其他类型的双胞胎。这些通常表明寿命的遗传率大约是20%到35%。
这篇论文创建了一个方程来模拟某人在某个年龄死亡的概率。方程的参数因人而异,反映我们中一些人拥有倾向于更长寿命的DNA。但思路是15到40岁之间的死亡概率相当恒定,之后开始增加。
这个方程包含一个“外在死亡率”参数。它旨在反映所有非衰老相关因素(如事故或谋杀等)导致的死亡几率。他们假设这个参数是恒定的。(相对于人和时间都恒定。)注意他们并没有实际查看任何关于死亡原因的数据。他们只是给方程添加了一个所有人在所有年龄段共享的恒定死亡风险,然后称之为“外在死亡率”。
现在记住,不同的人在他们的死亡概率方程中应该有不同的参数。为了反映这一点,他们拟合了一个高斯分布(钟形曲线)到参数上,目标是使其与历史数据吻合。思路是如果参数分布太宽,可能会有很多人15岁死亡或活到120岁,这就不对了。如果分布太集中,那么可能每个人都在43岁死亡,那也不对。所以他们找到一个好的分布,使得模拟中人们死亡的年龄看起来像历史数据中人们实际死亡的年龄。
好的!现在他们有了:
1. 一个方程,旨在反映某人在某年龄死亡的概率。
2. 该方程参数的一个分布,旨在产生看起来像真实历史数据的人口范围死亡年龄。
在继续之前,我提醒你两件事:
1. 他们假设他们的死亡方程*完全*决定了某人在某年死亡的概率。
2. 他们假设某人死亡方程的形状*完全*由基因决定。
一个人在某个年龄死亡的事件是随机的。但发生这种事*的概率*被假设是固定的,并且仅由基因决定。
现在他们模拟不同类型的双胞胎。为了模拟同卵双胞胎,他们从参数分布中抽取参数,将这些参数分配给两个不同的人,然后让他们根据死亡方程随机死亡。(这变得病态了吗?)为了模拟异卵双胞胎,他们做同样的事情,只不过不是给两个双胞胎相同的参数,而是给他们*相关的*参数,以反映他们共享50%的DNA。
他们到底如何创建这些相关参数?论文中没有解释,补充材料中也很模糊。据我所知,他们从参数分布中抽取两组参数,使得这些*参数*之间的相关性水平为0.5。
现在他们有了模拟的双胞胎。他们可以用不同的外在死亡率值来模拟他们。如果他们降低外在死亡率,寿命的遗传率就会上升。如果将其降到零,遗传率就会上升到大约50%。
几乎所有人类特征都部分由基因决定,部分受环境和/或随机性影响。如果你能改变世界,减少随机性,那么*当然*遗传率会上升。这对预期寿命来说和其他任何事物一样。那么这篇论文的意义何在?
有意义!
1. 当然,很明显,在一个没有事故或谋杀的世界里,遗传率会更高。我们不需要一篇论文来知道这一点。但是*高多少*?如果不建模和模拟那个世界,就无法说明。
2. 我们的双胞胎数据集非常古老。很可能现在非衰老相关的死亡比过去低,因为我们有更好的医疗保健等。这意味着当今活着的人的寿命遗传率可能比我们双胞胎数据集中的人(其中一些出生在1870年)要大。我们只有等自己都死了才能确定,但这篇论文给了我们一种猜测的方法。
3. 我有没有提过遗传率取决于社会?以及当社会变化时遗传率会变化?还提到遗传率*只是一个比率*(https://dynomight.net/heritable/),你应该停止试图让它成为非比率,因为只有比率的东西不能是非比率?这是一个很好的提醒。
老实说,我认为这篇论文建立的模型相当巧妙。没有什么是完美的,但我认为对于“如果外在死亡率更低,寿命的遗传率会有多高?”这个问题,这是一个相当不错的尝试。
我只有两个反对意见。第一个是对《科学》杂志的写作风格。这是一篇描述统计模型的论文。难道论文中不应该有一处地方按顺序从开始到结束解释他们到底做了什么吗?表面上,我认为这是在第二页的左栏完成的,只是细节很少,因为《科学》是为普通读者写的。但个人而言,我认为那种描述是所有世界中最糟糕的。它没有以一种连贯的方式讲述高层故事,而是抛给你一些随机的技术细节,却没有足够的信息让你真正理解它们。难道不能在附录中至少给出完整故事和全部细节吗?我觉得这浪费了我好几个小时的时间,而且如果有人想重复这项工作,根据给出的描述几乎不可能做到。我们作为一个社会,怎么能决定把“最好”的论文拿来这样对待呢?
但我的主要反对意见是:
起初,我觉得这很荒谬。人们因车祸死亡不是一个“混杂因素”。假装没有人死于车祸并不能“解决”某种偏见。那只是在另一个世界中计算遗传率。记住,遗传率不是某种柏拉图式的理型。它是一个*观察性统计量*。不存在独立于我们世界偶然事实的“真实”遗传率。
但经过反思,我认为他们想表达的是这样的:
> 当外在死亡率调整到更接近现代水平时,人类寿命的遗传率约为50%。
问题是:我认为这……不是真的?以下是论文中实际的遗传率估计值,按数据集(不同图)、截止年份(颜色)和外在死亡率(x轴)变化。
当外在死亡率下降时,遗传率上升。那么显而易见的问题是:现代人的外在死亡率是多少?
这个问题很棘手,因为“外在死亡率”不是简单的观察统计量。它是他们模型中的一个参数。(记住,他们从未查看死亡原因。)所以很难说,但他们似乎暗示现代人的外在死亡率是每年0.001,或者可能略低。
上图中的x轴是外在死亡率以10为底的对数。而0.001的以10为底的对数是-3。但如果你在x轴为-3时查看曲线,遗传率估计值*并不是50%*。它们更像是35-45%,具体取决于特定模型和年龄截止点。
所以这是我建议的标题:
> 根据我们的模拟,当外在死亡率调整到现代水平时,人类寿命的遗传率约为40%。
也许这就是我不在《科学》杂志工作的原因。
相似文章
随着研究人员年岁增长,其开创性工作产出减少
发表在《科学》杂志上的一项研究分析了1200万名科学家,发现虽然随着年龄增长,产生连接性创新的能力有所提升,但产生颠覆性创新的能力却在下降。
通过改变理性度来缓解RLHF中的认知偏差
本文提出了一种通过基于大型语言模型(LLM)对标注者可靠性的评估来动态调整理性度参数,从而缓解人类反馈强化学习(RLHF)中认知偏差的方法。
健康素养标注中的结构化分歧:认识论稳定性、概念难度与按一致性分层推断
一项针对6,323条COVID-19开放回答的分级健康素养标注的大规模研究表明,分歧更多源于任务的概念难度而非标注者身份,主张采用视角主义建模以实现有效推断。
无法复现现代论文声明 [D]
一位研究人员报告称无法复现现代论文中的声明,在检查的7项声明中,有4项无法复现,2项在GitHub上存在未解决的问题,引发了对研究质量标准的担忧。
赋予角色的大型语言模型表现出类似人类的动机推理
本文研究了为大语言模型赋予角色是否会引发类似人类的动机推理,发现赋予角色的大语言模型真实性辨别能力最多下降9%,并且以与其诱导的政治身份一致的方式评估科学证据的可能性最多增加90%,而基于提示的去偏见方法基本无效。