llm 0.32a2
摘要
llm CLI 工具已发布 0.32a2 版本,新增对 OpenAI /v1/responses 端点的支持,以启用 GPT-5 类模型的交错推理功能。
暂无内容
查看缓存全文
缓存时间: 2026/05/13 00:16
# 发布:llm 0.32a2
来源:https://simonwillison.net/2026/May/12/llm/
2026年5月12日
发布 llm 0.32a2 (https://github.com/simonw/llm/releases/tag/0.32a2) — 从命令行访问大型语言模型
这个 LLM (https://llm.datasette.io/) alpha 版本包含大量实用功能,但最重要的细节如下:
> 大多数具备推理能力的 OpenAI 模型现在使用 `/v1/responses` (https://platform.openai.com/docs/api-reference/responses) 端点,而非 `/v1/chat/completions`。这为 GPT-5 级别的模型启用了工具调用之间的交错推理功能。#1435 (https://github.com/simonw/llm/pull/1435)
这意味着当您针对 OpenAI 模型运行提示时,现在可以看到总结后的推理令牌,它们会以不同于标准错误的颜色显示。如果不想看到这些内容,可以使用 `-R` 或 `--hide-reasoning` 标志。
发布于 2026年5月12日 (https://simonwillison.net/2026/May/12/) 下午 5:45
## 近期文章
- 关于 xAI/Anthropic 数据中心交易的笔记 (https://simonwillison.net/2026/May/7/xai-anthropic/) - 2026年5月7日
- 直播博客:Code w/ Claude 2026 (https://simonwillison.net/2026/May/6/code-w-claude-2026/) - 2026年5月6日
- “氛围编程”和“智能体工程”正变得比我愿意接受的还要接近 (https://simonwillison.net/2026/May/6/vibe-coding-and-agentic-engineering/) - 2026年5月6日
这是由 Simon Willison 发布的 **beat**,发布于 2026年5月12日 (https://simonwillison.net/2026/May/12/)。
projects528 (https://simonwillison.net/tags/projects/) ai2018 (https://simonwillison.net/tags/ai/) annotated-release-notes49 (https://simonwillison.net/tags/annotated-release-notes/) openai419 (https://simonwillison.net/tags/openai/) generative-ai1786 (https://simonwillison.net/tags/generative-ai/) llms1752 (https://simonwillison.net/tags/llms/) llm599 (https://simonwillison.net/tags/llm/)
### 月度简报
赞助我 **每月 10 美元**,获取本月最重要 LLM 开发动态的精选邮件摘要。
付钱让我给你发得更少!
赞助并订阅 (https://github.com/sponsors/simonw/)
相似文章
llm 0.32a1
llm 0.32a1 版本发布说明。llm 是由 Simon Willison 开发的一个用于处理大语言模型的 Python 命令行工具和库。
llm 0.32a0
本文宣布 Simon Willison 开发的 'llm' 命令行工具发布 0.32a0 版本,并提供有关大型语言模型发展的月度简报。
LLM 0.32a0 是一次重大且向后兼容的重构
LLM 0.32a0 对 Python 库和 CLI 工具进行了重大且向后兼容的重构,从简单的文本提示转变为支持消息序列和多部分响应,以更好地处理结构化 JSON 和工具调用等现代 LLM 功能。
vllm-project/vllm v0.19.1
vLLM v0.19.1 发布 - 一个快速易用的开源 LLM 推理和服务库,拥有业界领先的吞吐量,支持 200+ 个模型架构以及包括 NVIDIA/AMD GPU 和 CPU 在内的多样化硬件。
vllm-project/vllm v0.20.0
vLLM v0.20.0 已发布,这是一个用于高吞吐量 LLM 推理和服务的开源库,特色功能包括 PagedAttention 以及对多种硬件架构的支持。