audio

#audio

OpenAI WebRTC 音频会话，现支持文档上下文

Simon Willison's Blog ↗ · 16小时前缓存

Simon Willison 更新了他的 OpenAI WebRTC 音频会话工具，以支持新的 GPT-Realtime-2 模型，并增加了文档上下文功能，用于对话式音频讨论。

0 人收藏 0 人点赞

#audio

口语对话中的上下文感知多模态声明验证

arXiv cs.CL ↗ · 2天前缓存

本文介绍了MAD2，一个用于口语对话中多模态声明验证的新基准，并提出了音频和文本模型的校准融合，利用对话上下文来提高验证准确性。

0 人收藏 0 人点赞

#audio

我常用的三款耳机

The Verge ↗ · 3天前缓存

一位资深音频评测员分享了他最常用的三款耳机，其中Soundcore Liberty 5 Pro因出色的通话质量和降噪效果而备受赞誉，尽管默认音效需要调整。

0 人收藏 0 人点赞

#audio

推出 Gemma 4 12B：一个统一的、无编码器的多模态模型

Google DeepMind Blog ↗ · 4天前缓存

Google DeepMind 宣布推出 Gemma 4 12B，一种新颖的无编码器多模态 AI 模型，将视觉和音频直接集成到 LLM 主干中，在配备 16GB RAM 的笔记本电脑上提供高级推理和代理能力，以 Apache 2.0 许可证发布。

0 人收藏 0 人点赞

#audio

Teenage Engineering: 推出 APC-2

Hacker News Top ↗ · 5天前缓存

Teenage Engineering 宣布推出 APC-2，这是一款与 SUPERSENSE 合作打造的专业音频唱片录制系统，用于实时刻录黑胶唱片。

0 人收藏 0 人点赞

#audio

黑胶唱片在响度战争中沦陷：不仅是附带损害（2025）

Hacker News Top ↗ · 6天前缓存

这篇文章解释了响度战争（通常是一种数字现象）如何在使用压缩数字母版进行黑胶刻录时降低黑胶唱片的质量，并以 Prince 的 Purple Rain 为例。

0 人收藏 0 人点赞

#audio

@victormustar: 在本周结束之前，让我们回顾一下开放AI领域最疯狂的一周，发布了超过25个引人注目的开放权重模型…

X AI KOLs Following ↗ · 2026-06-05 缓存

本周开放AI领域异常精彩，发布了超过25个开放权重模型，涵盖大语言模型、图像生成、音频/语音、视觉和视频/3D等领域，NVIDIA、Google等机构贡献突出。

0 人收藏 0 人点赞

#audio

新型德州仪器5532芯片并非我们使用了几十年的5532

Hacker News Top ↗ · 2026-06-03

德州仪器发布了新型5532芯片，与几十年来使用的经典版本不同，可能影响音频应用。

0 人收藏 0 人点赞

#audio

2026年最佳Alexa音箱四款推荐：Echo Dot Max、Echo Dot、Echo Show 11

Wired ↗ · 2026-06-02 缓存

《连线》杂志评测了2026年四款最佳Alexa音箱和智能显示屏，其中Echo Show 11被评为最佳智能显示屏，Echo Show 8（第三代）是最实惠的选择，文中还提及了广告和音质方面的权衡。

0 人收藏 0 人点赞

#audio

@Xiaomi: Xiaomi Sound Play。小巧于掌心，震撼于每刻。18W强劲音效，多彩灯光效果。14小时续…

X AI KOLs Following ↗ · 2026-05-28 缓存

Xiaomi宣布Sound Play，一款紧凑便携音箱，18W输出，多彩灯光，14小时续航，IP68耐用性。

0 人收藏 0 人点赞

#audio

@Xiaomi：这就是 #XiaomiBuds6。舒适的半入耳佩戴、更丰富的声音、更清晰的通话以及更智能的日常便捷体验。

X AI KOLs Following ↗ · 2026-05-28 缓存

小米发布了Buds 6，具备舒适的半入耳佩戴、更丰富的声音、更清晰的通话以及更智能的日常便捷体验。

0 人收藏 0 人点赞

#audio

ChildVox：理解与表征儿童声音的语音、音频及大型音频语言模型基准

Hugging Face Daily Papers ↗ · 2026-05-28 缓存

ChildVox 提出了一个全面的基准，用于分析儿童在不同发育阶段的声学交流，整合了来自17个以儿童为中心的音频和语音数据集的20多个子任务。

0 人收藏 0 人点赞

#audio

Cearvol的Wave设计抗击听力损失与衰老污名

Wired ↗ · 2026-05-26 缓存

Cearvol Wave Lite耳机提供中等程度的听力辅助，但在音质方面表现不足，尤其是在对话和观影时。不过，在助听器市场中，其定价合理。

0 人收藏 0 人点赞

#audio

Show HN: Audiomass – 一款免费开源的多轨音频编辑器，运行于浏览器中

Hacker News Top ↗ · 2026-05-24

Audiomass 是一款完全在网页浏览器中运行的免费开源多轨音频编辑器。

0 人收藏 0 人点赞

#audio

神秘的XF86AudioPlay问题

Lobsters Hottest ↗ · 2026-05-22 缓存

一篇博客文章，详细描述了在Emacs中调试重复出现的XF86AudioPlay按键事件，最终通过libinput和evtest追踪到头戴式耳机设备驱动的问题。

0 人收藏 0 人点赞

#audio

Marshall为其更小巧的贴耳式无线耳机重新引入ANC

The Verge ↗ · 2026-05-19 缓存

Marshall发布了Milton A.N.C.，一款配备主动降噪功能的新型贴耳式无线耳机，售价229.99美元。它提供无ANC状态下长达80小时的播放时间、蓝牙6.0、空间音频以及可更换电池。

0 人收藏 0 人点赞

#audio

loopmaster – 实时编程音乐IDE

Hacker News Top ↗ · 2026-05-18

loopmaster 是一款用于实时编程音乐的IDE，支持实时算法音乐创作。

0 人收藏 0 人点赞

#audio

说正经的，这个看起来和听起来都太棒了

Reddit r/ArtificialInteligence ↗ · 2026-05-18

一条称赞产品或演示外观和声音高质量的评论。

0 人收藏 0 人点赞

#audio

泄露图片揭示索尼十周年纪念版‘ColleXion’耳机

The Verge ↗ · 2026-05-18 缓存

泄露图片和细节揭示了索尼即将推出的十周年纪念版ColleXion耳机，采用高级设计、更新音频驱动，售价649美元，预计5月19日发布。

0 人收藏 0 人点赞

#audio

AudioMosaic：对比掩码音频表示学习

arXiv cs.LG ↗ · 2026-05-15 缓存

AudioMosaic 提出了一种基于对比学习的音频编码器，通过对频谱图块应用结构化时频掩码来构建正样本对，实现高效的大批量训练，在音频基准测试中达到最先进性能，并提升了音频-语言模型的效果。

0 人收藏 0 人点赞

audio

提交意见反馈