依赖中无LLM代码
摘要
git-annex 维护者详细介绍了移除包含LLM生成代码的依赖项的努力,表达了对代码质量和伦理影响的担忧。
暂无内容
查看缓存全文
缓存时间: 2026/07/02 20:08
# 依赖中没有LLM代码
来源:https://joeyh.name/blog/entry/no_LLM_code_in_dependencies/
过去一个月我花了大约100个小时,确保git-annex在构建时可以不依赖任何包含LLM生成代码的依赖项。至少目前是这样。
https://git-annex.branchable.com/no_llm_code/
持续审查一个程序的整个依赖树,这就是当今编程的常态吗?
我发现了一些真正糟糕的东西。大量的LLM生成变更,在下一个版本中被无故回退。一个长达1489行的提交信息,却对应着一个26,000行代码库中10,000行的变更。还有一个LLM提示,要求从另一个项目中复制代码,似乎只是靠运气才避免了版权侵权。
我现在对依赖项的质量有了更多信息,这必将影响未来的决策。就我目前所见,这是这项工作的唯一积极成果。
我意识到,我现在可能是在逆水行舟。似乎这就是为什么Software Freedom Conservancy选择回避(https://sfconservancy.org/llm-gen-ai/llm-backed-generative-ai-recommendations.html),而且我怀疑FSF也未必能做得更好。
随着这些多米诺骨牌倒下,我正在重新考虑自己对这些社区的参与。但我仍会继续我的工作,并支持我的用户。
用LLM提示一句话似乎很容易:
> 添加 fourmolu 配置并用 restyled neat 格式化模块
然后提交结果,称自己为10倍效率开发者。但请考虑你行为的更广泛影响。(在上面的例子中,那个项目失去了我后续的所有合作。)
相似文章
禁止LLM代码
git-annex宣布一项政策,禁止在其项目中包含LLM生成的代码,原因是版权不确定性,并提供了一个构建标志以避免依赖包含此类代码的依赖项。
NLNet Labs LLM 政策
NLNet Labs 宣布了一项限制在代码和文档贡献中使用 LLM 的政策,要求披露 LLM 的使用情况,并禁止 AI 生成的代码。
我们的模型基于哪些模型?审计现代LLM中的隐形依赖关系
介绍ModSleuth,一个智能系统,通过分析公开制品递归重建LLM开发中的大规模依赖图,揭示多跳许可证义务和文档不一致性。
LLM智能体能够查看代码仓库
本文首次系统性地实证研究了使用可视化仓库表示来增强基于LLM的编码智能体,结果表明,将可视化图作为补充模态集成,可以在保持或提高问题解决准确率的同时,将令牌消耗降低高达26%。
本地LLM伙伴
一位拥有45年经验的开发者正在构建一个本地优先的LLM框架,包含多智能体逻辑,即将在GitHub上开源,并向社区询问哪些功能能改善他们的本地LLM体验。