native-audio

标签

Cards List
#native-audio

Gemma 4 12B 原生无编码器语音输入利用建议?

Reddit r/LocalLLaMA · 2026-06-14

讨论利用 Gemma 4 12B 的无编码器架构实现原生语音输入,寻找现成的低延迟流式音频摄入解决方案。

0 人收藏 0 人点赞
#native-audio

Gemini 音频模型升级,打造更强大的语音体验

Google DeepMind Blog · 2025-12-12 缓存

Google 更新了 Gemini 2.5 Flash Native Audio,以提升实时语音智能体的能力,包括更精准的函数调用、更好的指令遵循能力,以及更流畅的对话上下文检索。此次更新还在 Google Translate 应用 beta 版中引入了实时语音翻译功能,可在 70 多种语言中保留语音语调。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈