@GoogleDeepMind: 我们正在利用 AI 重新构想一个拥有 50 年历史的人机交互界面——鼠标指针。这些实验性演示展示了人们如…

X AI KOLs 新闻

摘要

Google DeepMind 正在尝试利用 Gemini AI 重新构想鼠标指针界面,让用户能够通过手势动作、语音输入以及自然简写来控制屏幕。

我们正在利用 AI 重新构想一个拥有 50 年历史的人机交互界面——鼠标指针。🖱️ 这些实验性演示展示了人们如何直观地通过手势动作、语音输入以及自然简写来指引屏幕上的 Gemini 完成任务 🧵 https://t.co/p6fhgNcopz
查看原文
查看缓存全文

缓存时间: 2026/05/13 00:36

我们正在用人工智能重新构想一个存在了 50 年的界面——鼠标指针。🖱️

这些实验性演示展示了人们如何通过动作、语音和自然简写直观地在屏幕上引导 Gemini,以完成各种任务 🧵 https://t.co/p6fhgNcopz

相似文章

Reimagining the mouse pointer with AI

YouTube AI Channels

Google DeepMind 正在实验一种由 Gemini 驱动的 AI 指针,它能理解用户的指向意图、上下文和语音,并跨应用执行操作,从而重塑人机交互方式。

为 AI 时代重塑鼠标指针

Hacker News Top

DeepMind 推出了一款实验性的 AI 驱动鼠标指针,它能够理解视觉上下文和用户意图,旨在简化用户在不同应用程序中与 AI 的交互体验。

推出 Gemini 2.5 计算机使用模型

Google DeepMind Blog

Google 通过 Gemini API 发布 Gemini 2.5 计算机使用模型,使开发者能够构建可通过点击、输入和滚动与用户界面交互的 AI 代理。该模型在网页和移动控制基准测试中表现优异,延迟更低,现已在 Google AI Studio 和 Vertex AI 中提供预览版。

推出 Gemini 2.0:我们为智能体时代打造的新型 AI 模型

Google DeepMind Blog

Google DeepMind 推出 Gemini 2.0,这是一款新型智能体 AI 模型,具备原生图像和音频输出、增强的工具使用能力和多模态功能,专为下一代 AI 智能体设计。Gemini 2.0 Flash 现已向开发者推出,计划于 2025 年初实现更广泛的可用性。