audio

#audio

推出 Gemma 4 12B：一个统一的、无编码器的多模态模型

Google DeepMind Blog ↗ · 17小时前缓存

Google DeepMind 宣布推出 Gemma 4 12B，一种新颖的无编码器多模态 AI 模型，将视觉和音频直接集成到 LLM 主干中，在配备 16GB RAM 的笔记本电脑上提供高级推理和代理能力，以 Apache 2.0 许可证发布。

0 人收藏 0 人点赞

#audio

Teenage Engineering: 推出 APC-2

Hacker News Top ↗ · 2天前缓存

Teenage Engineering 宣布推出 APC-2，这是一款与 SUPERSENSE 合作打造的专业音频唱片录制系统，用于实时刻录黑胶唱片。

0 人收藏 0 人点赞

#audio

@victormustar: 在本周结束之前，让我们回顾一下开放AI领域最疯狂的一周，发布了超过25个引人注目的开放权重模型…

X AI KOLs Following ↗ · 4天前缓存

本周开放AI领域异常精彩，发布了超过25个开放权重模型，涵盖大语言模型、图像生成、音频/语音、视觉和视频/3D等领域，NVIDIA、Google等机构贡献突出。

0 人收藏 0 人点赞

#audio

新型德州仪器5532芯片并非我们使用了几十年的5532

Hacker News Top ↗ · 6天前

德州仪器发布了新型5532芯片，与几十年来使用的经典版本不同，可能影响音频应用。

0 人收藏 0 人点赞

#audio

2026年最佳Alexa音箱四款推荐：Echo Dot Max、Echo Dot、Echo Show 11

Wired ↗ · 2026-06-02 缓存

《连线》杂志评测了2026年四款最佳Alexa音箱和智能显示屏，其中Echo Show 11被评为最佳智能显示屏，Echo Show 8（第三代）是最实惠的选择，文中还提及了广告和音质方面的权衡。

0 人收藏 0 人点赞

#audio

@Xiaomi: Xiaomi Sound Play。小巧于掌心，震撼于每刻。18W强劲音效，多彩灯光效果。14小时续…

X AI KOLs Following ↗ · 2026-05-28 缓存

Xiaomi宣布Sound Play，一款紧凑便携音箱，18W输出，多彩灯光，14小时续航，IP68耐用性。

0 人收藏 0 人点赞

#audio

@Xiaomi：这就是 #XiaomiBuds6。舒适的半入耳佩戴、更丰富的声音、更清晰的通话以及更智能的日常便捷体验。

X AI KOLs Following ↗ · 2026-05-28 缓存

小米发布了Buds 6，具备舒适的半入耳佩戴、更丰富的声音、更清晰的通话以及更智能的日常便捷体验。

0 人收藏 0 人点赞

#audio

ChildVox：理解与表征儿童声音的语音、音频及大型音频语言模型基准

Hugging Face Daily Papers ↗ · 2026-05-28 缓存

ChildVox 提出了一个全面的基准，用于分析儿童在不同发育阶段的声学交流，整合了来自17个以儿童为中心的音频和语音数据集的20多个子任务。

0 人收藏 0 人点赞

#audio

Cearvol的Wave设计抗击听力损失与衰老污名

Wired ↗ · 2026-05-26 缓存

Cearvol Wave Lite耳机提供中等程度的听力辅助，但在音质方面表现不足，尤其是在对话和观影时。不过，在助听器市场中，其定价合理。

0 人收藏 0 人点赞

#audio

Show HN: Audiomass – 一款免费开源的多轨音频编辑器，运行于浏览器中

Hacker News Top ↗ · 2026-05-24

Audiomass 是一款完全在网页浏览器中运行的免费开源多轨音频编辑器。

0 人收藏 0 人点赞

#audio

神秘的XF86AudioPlay问题

Lobsters Hottest ↗ · 2026-05-22 缓存

一篇博客文章，详细描述了在Emacs中调试重复出现的XF86AudioPlay按键事件，最终通过libinput和evtest追踪到头戴式耳机设备驱动的问题。

0 人收藏 0 人点赞

#audio

Marshall为其更小巧的贴耳式无线耳机重新引入ANC

The Verge ↗ · 2026-05-19 缓存

Marshall发布了Milton A.N.C.，一款配备主动降噪功能的新型贴耳式无线耳机，售价229.99美元。它提供无ANC状态下长达80小时的播放时间、蓝牙6.0、空间音频以及可更换电池。

0 人收藏 0 人点赞

#audio

loopmaster – 实时编程音乐IDE

Hacker News Top ↗ · 2026-05-18

loopmaster 是一款用于实时编程音乐的IDE，支持实时算法音乐创作。

0 人收藏 0 人点赞

#audio

说正经的，这个看起来和听起来都太棒了

Reddit r/ArtificialInteligence ↗ · 2026-05-18

一条称赞产品或演示外观和声音高质量的评论。

0 人收藏 0 人点赞

#audio

泄露图片揭示索尼十周年纪念版‘ColleXion’耳机

The Verge ↗ · 2026-05-18 缓存

泄露图片和细节揭示了索尼即将推出的十周年纪念版ColleXion耳机，采用高级设计、更新音频驱动，售价649美元，预计5月19日发布。

0 人收藏 0 人点赞

#audio

AudioMosaic：对比掩码音频表示学习

arXiv cs.LG ↗ · 2026-05-15 缓存

AudioMosaic 提出了一种基于对比学习的音频编码器，通过对频谱图块应用结构化时频掩码来构建正样本对，实现高效的大批量训练，在音频基准测试中达到最先进性能，并提升了音频-语言模型的效果。

0 人收藏 0 人点赞

#audio

测试一个智能体技能：将提示转化为音频课程并发布到Spotify

Reddit r/AI_Agents ↗ · 2026-05-13

作者描述了测试一个智能体工作流程，该流程将提示转化为音频课程以发布到Spotify，潜在用途包括会议简报、团队更新和学习笔记。

0 人收藏 0 人点赞

#audio

@OpenAI: 在以下平台收听OpenAI播客—— Spotify https://open.spotify.com/show/0zojMEDizKMh3aTxnGLENP… Apple https://podcasts.a…

X AI KOLs ↗ · 2026-04-17

OpenAI宣布其播客现已上线主流流媒体平台，包括Spotify、Apple Podcasts和YouTube。

0 人收藏 0 人点赞

#audio

Socrati

Product Hunt ↗ · 2026-04-14

Socrati 是一款在 Product Hunt 上发布的新产品，可以从各种来源生成个人知识播客。

0 人收藏 0 人点赞

#audio

OmniGUI：在全方位模态智能手机环境中对GUI智能体进行基准测试

Hugging Face Daily Papers ↗ · 2026-04-03 缓存

OmniGUI引入了一个针对GUI智能体的步骤级基准测试，该测试整合了静态图像、同步音频和视频片段，以模拟真实的智能手机交互。评估显示，当前模型在处理时序和听觉输入方面存在困难，凸显了对全方位模态能力的需求。

0 人收藏 0 人点赞

audio

提交意见反馈