标签
这是一个使用AI实时响应用户语音输入的互动故事游戏演示,玩家扮演吟游诗人与名为“死亡女士”的AI角色即兴对话,AI根据玩家每一句话动态推进剧情。
讨论利用 Gemma 4 12B 的无编码器架构实现原生语音输入,寻找现成的低延迟流式音频摄入解决方案。
Cursor 更新了其 Design Mode,新增点击、绘制和语音输入等视觉提示,允许直接编辑 UI 元素,从而改善设计师和开发者的工作流程。
Matt Van Horn 分享了使用 Claude Code 的高级工作流:先通过 plan.md 进行详细规划,再用语音输入和多窗口并行执行任务,展示了如何将 AI 深度融入开发流程,大幅提升效率。
本文分享了来自Codex官方团队的使用技巧,包括持久对话流、语音输入、任务干预与排队、工具集成、自动化和目标设定等,帮助用户最大化利用Codex这一AI编码智能体。
这个推文串讨论了使用Codex编码代理的最佳实践,重点包括持久线程、语音输入、引导、队列,以及其从代码生成扩展到完整计算机工作流程自动化的能力。
Jason Liu 分享了他如何使用 OpenAI 的 Codex 进行编码之外的知识工作,利用持久化线程、语音输入和引导将编码代理整合到他更广泛的工作流程中。
Jason Liu 分享了高效使用 Codex 的工作流基本组件,包括持久线程、语音输入和引导,将 AI 智能体从编码扩展到知识工作。
推出适用于 iPhone 的 Blue 智能听写键盘,它利用 ChatGPT 智能地将口述想法转录为精炼文本,使听写在日常使用中更快、更可靠。
OpenLess 是一款开源语音输入工具,支持 macOS 和 Windows,可语音转文字并自动润色,特别适合编写 AI 提示词。
OpenAI 推出 ChatGPT iOS 应用,提供免费访问、跨设备对话历史同步和 Whisper 语音输入集成。ChatGPT Plus 订阅者可在 iOS 上获得 GPT-4 访问权限、早期功能和更快的响应速度。