real-time-interaction

标签

Cards List
#real-time-interaction

MiniCPM-o 4.5:迈向实时全双工全模态交互

Hugging Face Daily Papers · 2026-04-30 缓存

MiniCPM-o 4.5 是一个拥有 90 亿参数的多模态模型,具备 Omni-Flow 框架,支持实时全双工交互,使模型能够同时感知并主动响应。其开源性能达到最先进水平,可与 Gemini 2.5 Flash 相媲美,并能在内存低于 12GB 的边缘设备上运行。

0 人收藏 0 人点赞
#real-time-interaction

Hello GPT-4o

OpenAI Blog · 2024-05-13 缓存

OpenAI发布GPT-4o,一个功能全面的多模态模型,可实时处理音频、视觉、文本和视频,平均音频响应延迟为232毫秒。该模型在文本和代码能力上与GPT-4 Turbo相当,同时显著改进了多语言、音频和视觉功能,API成本降低50%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈