AI 如何推进生物声学科学发展,帮助拯救濒危物种
摘要
Google DeepMind 发布了更新版本的 Perch,这是一款用于生物声学分析的 AI 模型,可帮助保护人士通过音频数据监测濒危物种。新模型改进了鸟类物种预测能力,更好地适应水下环境,并扩展到包括哺乳动物、两栖动物和人为噪声的分析,原始版本已被下载超过 25 万次。
我们新推出的 Perch 模型可帮助保护人士更快地分析音频,从而保护濒危物种,范围涵盖夏威夷蜜鸟到珊瑚礁生态系统。
查看缓存全文
缓存时间: 2026/04/20 08:35
# AI如何助力生物声学科学,拯救濒危物种
来源:https://deepmind.google/blog/how-ai-is-helping-advance-the-science-of-bioacoustics-to-save-endangered-species/
我们新推出的 Perch 模型能帮助保护人士更快速地分析音频数据,从而保护从夏威夷蜜鸟到珊瑚礁等濒危物种。
科学家们保护地球野生生态系统健康的方式之一,是使用麦克风(或水下传感器)收集大量音频数据,其中包含来自鸟类、青蛙、昆虫、鲸鱼、鱼类等的鸣叫声。这些录音可以告诉我们某个区域存在的动物,以及该生态系统健康状况的其他线索。然而,处理如此大量的数据仍然是一项巨大的挑战。
今天,我们发布了 Perch 模型的更新版本(http://arxiv.org/abs/2508.04665),这是一款旨在帮助保护人士分析生物声学数据的 AI 模型。新版本在现有鸟类物种预测中达到更好的最先进水平。它能更好地适应新环境,尤其是珊瑚礁等水下环境。它接受了更广泛的动物种类训练,包括哺乳动物、两栖动物和人为噪声——总数据量几乎翻倍,来自 Xeno-Canto (https://xeno-canto.org/) 和 iNaturalist (https://neurips.cc/virtual/2024/poster/97701) 等公开数据源。它可以处理数千甚至数百万小时音频数据中的复杂声学场景。而且功能多样,可以帮助回答许多不同的问题,从"有多少婴幼个体出生"到"某个区域有多少个体动物"。
为了帮助科学家们保护地球生态系统,我们将这个新版本的 Perch 以开源模型的形式发布,并将其在 Kaggle (https://www.kaggle.com/models/google/bird-vocalization-classifier/tensorFlow2/perch_v2) 上提供。
Perch 不仅识别鸟类的声音。我们的新模型接受了更广泛的动物种类训练,包括哺乳动物、两栖动物和人为噪声。
## 成功案例:Perch 在实地应用
自 2023 年首次推出以来,初版 Perch 已被下载超过 25 万次 (https://www.kaggle.com/models/google/bird-vocalization-classifier),其开源解决方案现已融入许多工作生物学家的工具中。例如,Perch 的向量搜索库现已成为康奈尔大学广泛使用的 BirdNET Analyzer (https://github.com/birdnet-team/BirdNET-Analyzer) 的一部分。
此外,Perch 正在帮助澳大利亚鸟类保护组织和澳大利亚声学观测站为多个独特的澳大利亚物种建立分类器。例如,我们的工具使人们 (https://www.theguardian.com/environment/2025/feb/12/plains-wanderers-spotted-in-melbournes-west-for-first-time-in-30-years-with-help-of-ai) 能够发现一个捉摸不定的平原漂泊鸟的新种群。
> 这是一个了不起的发现——像这样的声学监测将帮助塑造许多濒危鸟类物种的未来。
Paul Roe
澳大利亚詹姆斯库克大学研究院院长
近期研究还发现,早期版本的 Perch 可用于 (https://www.sciencedirect.com/science/article/pii/S1574954125003395) 识别单只鸟类,并 (https://www.sciencedirect.com/science/article/pii/S1470160X24013876) 追踪鸟类数量,有可能减少对捕获和放生研究的需求以监测种群。
最后,来自夏威夷大学 LOHE 生物声学实验室 (https://lohelab.org/) 的生物学家已使用该模型来监测和保护蜜鸟种群,这些鸟类在 (https://www.mauiforestbirds.org/cultural-significance) 夏威夷神话中非常重要,但面临由非本地蚊子传播的禽疟疾的威胁。Perch 帮助 LOHE 实验室找到蜜鸟声音的速度比其常规方法快近 50 倍,使他们能够在更广泛的区域内监测更多种类的蜜鸟。我们预期新模型将进一步加快这些工作。
## 解开地球的播放列表
Perch 模型可以预测录音中存在的物种,但这只是故事的一部分:我们还提供了 (https://github.com/google-research/perch-hoplite) 工具,使科学家能够从单个示例快速构建新的分类器,并监测训练数据稀少或声音非常具体(如幼体叫声)的物种。给定一个声音示例,Perch 的向量搜索会在数据集中找到最相似的声音。当地专家随后可以将搜索结果标记为相关或不相关,以训练分类器。
这种向量搜索和具有强大嵌入模型的主动学习的组合称为 (https://openaccess.thecvf.com/content/ICCV2023/papers/Stretcu_Agile_Modeling_From_Concept_to_Classifier_in_Minutes_ICCV_2023_paper.pdf) **敏捷建模**。我们最近发表的论文—— (https://arxiv.org/abs/2505.03071)"寻找鸟鸣:生物声学中的敏捷建模"——证明了这种方法在鸟类和珊瑚礁中都有效,可以在一小时内创建高质量的分类器。
## 展望未来:生物声学的未来
我们的模型和方法共同帮助最大化保护工作的影响,为有意义的实地工作留出更多时间和资源。从夏威夷的森林到海洋的珊瑚礁,Perch 项目展示了当我们将技术专业知识应用于世界上最紧迫的挑战时可以产生的深远影响。构建的每个分类器和分析的每一小时数据都让我们更接近一个由丰富、欣欣向荣的生物多样性组成的星球之音。
**致谢**
本研究由 Perch 团队开发:Bart van Merriënboer、Jenny Hamer、Vincent Dumoulin、Lauren Harrell 和 Tom Denton,以及来自谷歌研究院的 Otilia Stretcu。我们还感谢夏威夷大学的 Amanda Navine 和 Pat Hart,以及康奈尔大学鸟类学实验室的 Holger Klinck、Stefan Kahl 和 BirdNet 团队。还有所有与我们合作的朋友和同事,如果篇幅再长一千字,我们本可以在这篇博文中提及他们。
相似文章
利用AI绘制、建模和理解自然
DeepMind宣布新的AI研究应用,用于保护自然,包括高分辨率森林砍伐风险模型、使用图神经网络进行物种分布映射,以及Perch生物声学模型的更新。
Music AI Sandbox 推出新功能,访问权限扩大
Google DeepMind 扩展了 Music AI Sandbox,新增功能包括 Lyria 2 音乐生成模型,并向美国音乐人开放更广泛的访问权限,通过用于生成、扩展和编辑音乐内容的工具来实现 AI 辅助音乐创作。
DolphinGemma:Google AI 如何帮助破译海豚通信
Google 开发了 DolphinGemma,一个大语言模型,旨在学习和生成海豚的鸣叫声。该项目与乔治亚理工学院和 Wild Dolphin Project 合作,旨在推进对海豚沟通模式的理解,并实现潜在的物种间对话。
Qwen3.7-Max 挑战 Google 争夺第三名,AI 拯救鲸鱼,微调破坏版权对齐
The Batch AI 新闻汇总涵盖 Qwen3.7-Max 挑战 Google 第三名、AI 拯救鲸鱼的应用,以及研究表明微调会破坏版权对齐。
Pawse.ai
Pawse.ai 是一个为狗设计的声学调节系统,可能使用AI来管理或调整声音环境。