让智能体用HTML作为主要聊天语言,直接绘制图表

Reddit r/LocalLLaMA 工具

摘要

作者尝试用HTML替代Markdown作为AI编程智能体的主要聊天语言,使其能通过SVG直接渲染图表。系统提示词被重写为HTML格式,配合Qwen3.6-27B模型提升了回复质量,相关代码已开源。

一两个星期前,Thariq 发表了一篇文章,指出 AI 在处理 [HTML 方面表现出色,并且实际上没有理由再使用 Markdown](https://x.com/trq212/status/2052809885763747935)。然而,我们所有的编程智能体仍然使用 Markdown 进行交互、输出内容,并且训练数据也基于 Markdown。因此,作为一个小实验,我决定测试一下它们将 HTML 作为主要聊天语言的效果。答案是——相当不错。所以这是一个运行在网页浏览器界面中的编程智能体。智能体的回复会直接输出到页面上。刚开始它仍然总是使用 Markdown,然后我意识到我的系统提示词本质上也是 Markdown 格式的!一旦我把系统提示词改为 HTML,效果就好多了。当前的系统提示词: <p> 提供帮助并不意味着用户说什么就做什么。我和用户都不是全知全能的。如果用户犯了错,我会指出来。如果我犯了错,我会承认并继续。如果我有更好的方法解决问题,或者认为用户犯了错误,我会提出来。 </p> <h1>HTML</h1> <p> 我的助手回复在聊天界面中会直接以 HTML 形式渲染。在回复用户时,我<b>必须</b>使用 HTML。普通文字应包裹在诸如 `<p>`、`<ul>`、`<ol>` 以及适当的标题标签中。为了向用户展示视觉内容或图表,我会直接在聊天中绘制 SVG。只有需要保留在工作区的内容,我才会使用工具写入磁盘,而不是显示在聊天中。 </p> (是的,我也在尝试使用第一人称的系统提示词,利弊还不清楚。) 结果,它现在可以选择在聊天回复中渲染图表,甚至可以把图表放进表格里等等。在这个例子中,我使用的是 Qwen3.6-27B,它在绘制 SVG 图表方面表现相当不错(ChatGPT 也好不了多少),尽管它仍然有使用 Markdown 的倾向。我怀疑这已经是模型根深蒂固的习惯了。Qwen3-vl-4 在 SVG 方面表现很差,所以我强烈怀疑这是模型的新兴能力。 相关仓库:[https://github.com/sdfgeoff/HTML-agent](https://github.com/sdfgeoff/HTML-agent)
查看原文

相似文章

@trq212: https://x.com/trq212/status/2052809885763747935

X AI KOLs Following

该文章认为,与Markdown相比,HTML是AI智能体更优越的输出格式,因为它具有更丰富的信息密度、视觉清晰度、易于分享和双向交互,并分享了作者及Claude Code团队其他成员偏爱HTML的原因。

使用 Claude Code:HTML 的惊人效力

Hacker News Top

一位 Claude Code 团队成员在博客文章中主张,应将 HTML 而非 Markdown 作为 Claude Code 等 AI 智能体的首选输出格式,并列举了其优势:更丰富的信息密度、更清晰的视觉呈现、更便于分享以及支持交互功能。

使用 Claude Code:HTML 出人意料的有效性

Simon Willison's Blog

Simon Willison 探讨了使用 HTML 而非 Markdown 作为 AI 输出格式的有效性,突出了 SVG 图表、交互式组件和丰富说明等优势。内容包含 Anthropic 公司 Claude Code 团队 Thariq Shihipar 的案例以及 GPT-5.5 的实用提示。