新DSL如何在LLM时代生存
摘要
本文探讨了新的领域特定语言(DSL)如何通过强调强大的文档、交互式着陆页以及稳健的工具(如语言服务器和诊断)在LLM时代保持相关性,并以作者的项目Web Pipe和Datafarm为例。
暂无内容
查看缓存全文
缓存时间: 2026/06/12 02:53
# 新DSL如何在LLM时代生存
来源:https://www.williamcotton.com/articles/how-a-new-dsl-survives-in-the-era-of-llms
2026年6月11日
过去几十年里,用Python、Rust、Ruby以及其他"传统"编程语言编写的项目不计其数。所有这些代码为LLM提供了绝佳的素材。随着这些模型不断进步,幻觉出现的频率也大幅下降。
但关键不仅在于供训练用的源代码数量庞大,更在于围绕这些语言构建的先进工具链:类型检查器、代码检查工具、语言服务器、编译器、解释器、测试框架,应有尽有。所有这些工具都将软件锚定在现实中,并能向LLM智能体提供即时反馈。例如,代码还未运行,类型检查器就能捕捉到幻觉。
正因为如此,这些传统语言被用来创造更多内容,供未来模型训练使用。
我们似乎陷入了一种某种意义上的反馈循环。
那么,在LLM时代,一门新语言要如何做才能变得可行呢?
答案与过去的情形并没有太大不同:优秀的文档、出色的市场推广和强大的工具链。潜在的语言用户如何了解一门新语言?他们如何上手?该语言如何与现有工具和工作流程集成?现代语言需要一个稳健的语言服务器,还需要一套内容详实、上手流程顺畅的文档。
此外,一门新语言还需要额外做些事情,以便更好地与LLM智能体协作。
#### 文档与上下文
一种方法是让新语言从二进制本身生成类似`AGENTS.md`的文件,大致如下:
`webpipe init --codex`
以下是Web Pipe(https://github.com/williamcotton/webpipe)使用的LLM模板(https://github.com/williamcotton/webpipe/blob/main/src/scaffold/templates/LLM.md.template),这是我最近正在实验的一个Web应用DSL。
这么说可能有点不公平,因为Web Pipe拥有其他DSL可能不具备的一些优势。它嵌入了jq、Lua、JavaScript、SQL等其他语言。LLM对这些语言已经比较熟悉,因此这种管道导向方法的语法和语义并没有增加太多学习成本。
我已经成功地在codex中使用一次性提示,仅凭这个单一的`AGENTS.md`模板文件作为指导,就创建了使用Web Pipe的演示应用程序。
#### 落地页
越快地传达一门新语言的目的和用例越好。越快让人开始试用这门语言也越好。既然为新人创建WASM运行时环境从未如此简单,那么在落地页顶部添加一个交互式编辑器会让你受益匪浅,就像我的另一个项目Datafarm(https://williamcotton.github.io/datafarm-studio)所做的那样。
所以,不要只针对CLI工具这样的单一运行时。也要瞄准浏览器运行时!
#### 工具链
你需要出色的诊断能力。从编译时到运行时,再到代码检查,你必须在这个问题上投入大量精力。你需要一个语言服务器,还需要多个与底层诊断工具交互的接口。当然,现在已经有大量智能体编程工具可以帮助解决这个问题!
我遇到过一种模式:创建一个单一的二进制文件,同时充当运行时和语言服务器。这样可以将所有诊断反馈内联在两者之间。此外,将诊断功能与LSP API分离,意味着你可以为浏览器可嵌入的组件(如Monaco)提供WASM诊断工具。无论使用哪种工具或运行时,都能在所有拼写错误和语法错误下显示红色波浪线,简直是王道!
我认为,随着覆盖新语言起步所需基础的难度不断降低,未来几年我们将看到新语言(尤其是DSL类型)的爆发式增长。
相似文章
专家级新手和独狼将主导早期LLM时代
作者反思了本地LLM(GPT-OSS 20B、Qwen3 Coder 30B)如何帮助他将博客从Drupal迁移到静态站点,并将其比作快速交付代码但需要审查的初级开发人员。他认为,'专家级新手'和'独狼'将在早期LLM时代蓬勃发展。
使用枯燥语言配合LLM
一篇观点文章指出,LLM在枯燥且一致的语言与生态系统(如Ruby on Rails)中表现更佳,因为训练语料库的方差较低,从而产生更可靠的智能体输出,而碎片化的生态系统(如JavaScript)则导致效果不佳。
微调大语言模型以生成1995年代风格的文档
作者使用1990年代微软手册语料库,对本地大语言模型进行微调,以生成复古风格的文档,探索本地模型在技术写作中的定制化应用。
为了内容而内容
作者探讨了LLM如何影响编码和日常语言中的用词,发现LLM偏好的词汇在编程会话和Google Trends中出现的频率均有所增加,这引发了人们对人类开始采用LLM写作风格的担忧。
@haider1: Yann LeCun 表示,LLMs 在语言本身就是推理基础的领域(如数学和代码)中最强…
Yann LeCun 指出,LLMs 在语言作为推理基础的领域(如数学和代码)中最强,但它们并非有创造力的数学家、软件架构师或计算机科学家。