@GoogleDeepMind: 我们正在利用 AI 重新构想一个拥有 50 年历史的人机交互界面——鼠标指针。这些实验性演示展示了人们如…

X AI KOLs 2026/05/12 17:03 新闻

google-deepmind gemini ai-interface human-computer-interaction mouse-pointer generative-ai

摘要

Google DeepMind 正在尝试利用 Gemini AI 重新构想鼠标指针界面，让用户能够通过手势动作、语音输入以及自然简写来控制屏幕。

我们正在利用 AI 重新构想一个拥有 50 年历史的人机交互界面——鼠标指针。🖱️ 这些实验性演示展示了人们如何直观地通过手势动作、语音输入以及自然简写来指引屏幕上的 Gemini 完成任务 🧵 https://t.co/p6fhgNcopz

查看原文

查看缓存全文

缓存时间: 2026/05/13 00:36

我们正在用人工智能重新构想一个存在了 50 年的界面——鼠标指针。🖱️

这些实验性演示展示了人们如何通过动作、语音和自然简写直观地在屏幕上引导 Gemini，以完成各种任务 🧵 https://t.co/p6fhgNcopz

相似文章

YouTube AI Channels

Google DeepMind 正在实验一种由 Gemini 驱动的 AI 指针，它能理解用户的指向意图、上下文和语音，并跨应用执行操作，从而重塑人机交互方式。

Hacker News Top

DeepMind 推出了一款实验性的 AI 驱动鼠标指针，它能够理解视觉上下文和用户意图，旨在简化用户在不同应用程序中与 AI 的交互体验。

Google DeepMind Blog

Google 通过 Gemini API 发布 Gemini 2.5 计算机使用模型，使开发者能够构建可通过点击、输入和滚动与用户界面交互的 AI 代理。该模型在网页和移动控制基准测试中表现优异，延迟更低，现已在 Google AI Studio 和 Vertex AI 中提供预览版。

X AI KOLs

Google DeepMind已将Gemini与波士顿动力的Spot机器人整合，实现无需复杂编码的自然语言控制。用户现在可以用日常英语指令Spot执行导航、拍照、物体操控等复杂任务。

Google DeepMind Blog

Google DeepMind 推出 Gemini 2.0，这是一款新型智能体 AI 模型，具备原生图像和音频输出、增强的工具使用能力和多模态功能，专为下一代 AI 智能体设计。Gemini 2.0 Flash 现已向开发者推出，计划于 2025 年初实现更广泛的可用性。