@_philschmid: 昨日我们在Gemini 3.5 Flash中发布了计算机使用功能,支持浏览器、移动端和桌面环境。我整理了一个…
摘要
Phil Schmid宣布在Gemini 3.5 Flash中推出计算机使用功能,能够控制浏览器、移动端和桌面环境,并提供了通过adb控制Android手机的快速入门指南。
昨日我们在Gemini 3.5 Flash中发布了计算机使用功能,支持浏览器、移动端和桌面环境。我整理了一份关于如何控制Android手机的快速入门指南。
1. 通过终端运行单个脚本安装模拟器。
2. 使用`adb`通过交互API实现基本代理循环来控制手机。
3. 也支持连接远程设备(`adb connect <ip>:5555`)。
4. 同样的模式也适用于iOS,例如使用simctl。
查看缓存全文
缓存时间: 2026/06/26 02:04
昨天我们在 Gemini 3.5 Flash 中推出了计算机使用功能,支持浏览器、移动设备和桌面环境。我整理了一个快速入门指南,介绍如何控制 Android 手机:
- 使用单个脚本从终端安装模拟器。
- 基本智能体循环,通过
adb使用交互 API 控制手机。 - 也能连接到远程设备(
adb connect :5555)。 - 同样的模式也适用于 iOS,例如使用
simctl。
相似文章
@_philschmid: https://x.com/_philschmid/status/2070176665045434477
一份指南和Python脚本,用于利用Gemini 3.5 Flash的Computer Use能力控制Android模拟器。该功能允许模型查看截图并通过ADB执行返回的操作(点击、轻触、文本输入)。
在 Gemini 3.5 Flash 中引入计算机使用
Gemini 3.5 Flash 现已原生支持将计算机使用作为内置工具,使开发者能够构建智能体,在浏览器、移动端和桌面环境中进行交互,用于软件测试和知识工作等长期自动化任务。
Gemini 3.5 Flash 中的计算机使用
Google 宣布计算机使用现已成为 Gemini 3.5 Flash 的内置工具,使开发者能够构建可在浏览器、移动设备和桌面环境中进行观察、推理和操作的智能体。
@_philschmid: 我很兴奋地介绍 Gemini API 中的托管代理。一次 API 调用即可获得一个完整的代理,具备代码执行、网页浏览…
Phil Schmid 宣布 Gemini API 中的托管代理,支持一次性调用获取包含代码执行、网页浏览和文件管理功能的代理,运行在隔离沙箱中,由 Gemini 3.5 Flash 驱动。
@chetaslua: Gemini 3.5 Flash 一次性构建了一个完整的 Ubuntu/GNOME 网页操作系统。单个 HTML 文件,内置 CSS 和 JS。从一个提示开始:>w…
Gemini 3.5 Flash 从一个单一提示生成了一个功能完整的 Ubuntu/GNOME 风格的网页操作系统,全部在一个 HTML 文件中,包括 dock、终端、文件管理器、窗口管理和设置。