@paul_cal:我想强调一下这事有多离谱。如果你在2020年告诉别人,一个序列到序列(seq2seq)模型会直接使用命令行指令来编写一个Python程序……
摘要
Paul Buchheit指出了现代序列到序列模型令人惊讶的零样本能力,即无需针对特定任务进行训练,也能生成命令行指令和Python程序,利用计算机视觉库直接通过像素画面来玩Doom。
我想强调一下这事有多离谱。如果你在2020年告诉别人,一个序列到序列(seq2seq)模型会直接使用命令行指令来编写一个Python程序,该程序利用现成的计算机视觉库,仅凭像素画面就能玩Doom
哦,顺便提一下,我们并没有针对这类问题进行训练。它只是自然而然地做到了这一点
查看缓存全文
缓存时间: 2026/05/10 20:31
想强调一下这有多离谱。在 2020 年,如果你告诉某人,一个 seq2seq 模型会使用命令行来构建一个 Python 程序,该程序利用预制的计算机视觉库直接从像素玩《毁灭战士》(Doom),对方大概会觉得不可思议。
哦,顺便提一句,我们并没有在特定任务类别上对它进行训练。它只是自己就这么搞定了。
相似文章
「Claude刚刚帮我在家建了一个湿实验室,还完成了我的全基因组测序。我完全没有实验室经验!」--- 现在的人们在家就能测序自己的DNA!
一位没有任何实验室经验的用户借助Claude的指导,在家中搭建了湿实验室并完成了自己的全基因组测序,充分体现了AI辅助推动DIY生物学走向大众化的趋势。
@injaneity:我逆向了 @OpenAI 的 Codex Computer Use,做了 pi-computer-use:一款模型无关的 macOS 电脑自动化工具,送给所有 π 爱好者
一位开发者逆向 OpenAI 的 Codex Computer Use,开源打造 pi-computer-use:支持任意模型的 macOS 自动化工具,优先走 AX 导航,并为兼容模型提供视觉回退。
@karpathy: 有人最近告诉我,OpenClaw时刻如此重大的原因是因为这是大量非技术人员第一次接触到…
Andrej Karpathy讨论了OpenClaw时刻之所以引起广泛共鸣,是因为非技术受众首次接触到了超越ChatGPT消费级产品的先进agentic AI模型。
你最意想不到的本地模型用途是什么?
一个讨论,鼓励用户分享本地AI模型出人意料且富有创意的用途。作者提到他们让一个本地VLM通过看屏幕来玩桌游。
@taiyo_ai_gakuse: 哥们,我真的做了个超棒的东西哈哈,我自己构建了一个CLI,集成了新发布的GPT-Realtime-2,……
一位开发者分享了一个自定义CLI工具,利用新发布的GPT-Realtime-2 API,在视频会议平台中实现日英实时语音翻译。