audio

标签

Cards List
#audio

推出 Gemma 4 12B:一个统一的、无编码器的多模态模型

Google DeepMind Blog · 17小时前 缓存

Google DeepMind 宣布推出 Gemma 4 12B,一种新颖的无编码器多模态 AI 模型,将视觉和音频直接集成到 LLM 主干中,在配备 16GB RAM 的笔记本电脑上提供高级推理和代理能力,以 Apache 2.0 许可证发布。

0 人收藏 0 人点赞
#audio

Teenage Engineering: 推出 APC-2

Hacker News Top · 2天前 缓存

Teenage Engineering 宣布推出 APC-2,这是一款与 SUPERSENSE 合作打造的专业音频唱片录制系统,用于实时刻录黑胶唱片。

0 人收藏 0 人点赞
#audio

@victormustar: 在本周结束之前,让我们回顾一下开放AI领域最疯狂的一周,发布了超过25个引人注目的开放权重模型…

X AI KOLs Following · 4天前 缓存

本周开放AI领域异常精彩,发布了超过25个开放权重模型,涵盖大语言模型、图像生成、音频/语音、视觉和视频/3D等领域,NVIDIA、Google等机构贡献突出。

0 人收藏 0 人点赞
#audio

新型德州仪器5532芯片并非我们使用了几十年的5532

Hacker News Top · 6天前

德州仪器发布了新型5532芯片,与几十年来使用的经典版本不同,可能影响音频应用。

0 人收藏 0 人点赞
#audio

2026年最佳Alexa音箱四款推荐:Echo Dot Max、Echo Dot、Echo Show 11

Wired · 2026-06-02 缓存

《连线》杂志评测了2026年四款最佳Alexa音箱和智能显示屏,其中Echo Show 11被评为最佳智能显示屏,Echo Show 8(第三代)是最实惠的选择,文中还提及了广告和音质方面的权衡。

0 人收藏 0 人点赞
#audio

@Xiaomi: Xiaomi Sound Play。小巧于掌心,震撼于每刻。18W强劲音效,多彩灯光效果。14小时续…

X AI KOLs Following · 2026-05-28 缓存

Xiaomi宣布Sound Play,一款紧凑便携音箱,18W输出,多彩灯光,14小时续航,IP68耐用性。

0 人收藏 0 人点赞
#audio

@Xiaomi:这就是 #XiaomiBuds6。舒适的半入耳佩戴、更丰富的声音、更清晰的通话以及更智能的日常便捷体验。

X AI KOLs Following · 2026-05-28 缓存

小米发布了Buds 6,具备舒适的半入耳佩戴、更丰富的声音、更清晰的通话以及更智能的日常便捷体验。

0 人收藏 0 人点赞
#audio

ChildVox:理解与表征儿童声音的语音、音频及大型音频语言模型基准

Hugging Face Daily Papers · 2026-05-28 缓存

ChildVox 提出了一个全面的基准,用于分析儿童在不同发育阶段的声学交流,整合了来自17个以儿童为中心的音频和语音数据集的20多个子任务。

0 人收藏 0 人点赞
#audio

Cearvol的Wave设计抗击听力损失与衰老污名

Wired · 2026-05-26 缓存

Cearvol Wave Lite耳机提供中等程度的听力辅助,但在音质方面表现不足,尤其是在对话和观影时。不过,在助听器市场中,其定价合理。

0 人收藏 0 人点赞
#audio

Show HN: Audiomass – 一款免费开源的多轨音频编辑器,运行于浏览器中

Hacker News Top · 2026-05-24

Audiomass 是一款完全在网页浏览器中运行的免费开源多轨音频编辑器。

0 人收藏 0 人点赞
#audio

神秘的XF86AudioPlay问题

Lobsters Hottest · 2026-05-22 缓存

一篇博客文章,详细描述了在Emacs中调试重复出现的XF86AudioPlay按键事件,最终通过libinput和evtest追踪到头戴式耳机设备驱动的问题。

0 人收藏 0 人点赞
#audio

Marshall为其更小巧的贴耳式无线耳机重新引入ANC

The Verge · 2026-05-19 缓存

Marshall发布了Milton A.N.C.,一款配备主动降噪功能的新型贴耳式无线耳机,售价229.99美元。它提供无ANC状态下长达80小时的播放时间、蓝牙6.0、空间音频以及可更换电池。

0 人收藏 0 人点赞
#audio

loopmaster – 实时编程音乐IDE

Hacker News Top · 2026-05-18

loopmaster 是一款用于实时编程音乐的IDE,支持实时算法音乐创作。

0 人收藏 0 人点赞
#audio

说正经的,这个看起来和听起来都太棒了

Reddit r/ArtificialInteligence · 2026-05-18

一条称赞产品或演示外观和声音高质量的评论。

0 人收藏 0 人点赞
#audio

泄露图片揭示索尼十周年纪念版‘ColleXion’耳机

The Verge · 2026-05-18 缓存

泄露图片和细节揭示了索尼即将推出的十周年纪念版ColleXion耳机,采用高级设计、更新音频驱动,售价649美元,预计5月19日发布。

0 人收藏 0 人点赞
#audio

AudioMosaic:对比掩码音频表示学习

arXiv cs.LG · 2026-05-15 缓存

AudioMosaic 提出了一种基于对比学习的音频编码器,通过对频谱图块应用结构化时频掩码来构建正样本对,实现高效的大批量训练,在音频基准测试中达到最先进性能,并提升了音频-语言模型的效果。

0 人收藏 0 人点赞
#audio

测试一个智能体技能:将提示转化为音频课程并发布到Spotify

Reddit r/AI_Agents · 2026-05-13

作者描述了测试一个智能体工作流程,该流程将提示转化为音频课程以发布到Spotify,潜在用途包括会议简报、团队更新和学习笔记。

0 人收藏 0 人点赞
#audio

@OpenAI: 在以下平台收听OpenAI播客—— Spotify https://open.spotify.com/show/0zojMEDizKMh3aTxnGLENP… Apple https://podcasts.a…

X AI KOLs · 2026-04-17

OpenAI宣布其播客现已上线主流流媒体平台,包括Spotify、Apple Podcasts和YouTube。

0 人收藏 0 人点赞
#audio

Socrati

Product Hunt · 2026-04-14

Socrati 是一款在 Product Hunt 上发布的新产品,可以从各种来源生成个人知识播客。

0 人收藏 0 人点赞
#audio

OmniGUI:在全方位模态智能手机环境中对GUI智能体进行基准测试

Hugging Face Daily Papers · 2026-04-03 缓存

OmniGUI引入了一个针对GUI智能体的步骤级基准测试,该测试整合了静态图像、同步音频和视频片段,以模拟真实的智能手机交互。评估显示,当前模型在处理时序和听觉输入方面存在困难,凸显了对全方位模态能力的需求。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈