Blog

评估 DiffusionGemma 透明度（9分钟阅读）

TLDR AI ↗ · 3天前缓存

分析了 Google 的 DiffusionGemma 模型发布的透明度，讨论了其对 AI 安全与问责的影响。

0 人收藏 0 人点赞

Inception Labs 的 Mercury 2 AI 在 Google 的 DiffusionGemma 擅长的领域击败了它（4分钟阅读）

TLDR AI ↗ · 3天前缓存

Inception Labs 发布了 Mercury 2，这是一个扩散语言模型，每秒可生成约1000个token，在 AIME 2026 基准测试中以 90% 对 69.1% 的得分优于 Google 的 DiffusionGemma，不过 DiffusionGemma 是免费且开源权重的，而 Mercury 2 是付费且闭源权重的 API 模型。

0 人收藏 0 人点赞

Sakana Fugu（三分钟阅读）

TLDR AI ↗ · 3天前缓存

Sakana AI 推出 AB-MCTS，一种推理时缩放算法，使多个前沿 AI 模型（Gemini 2.5 Pro、o4-mini、DeepSeek-R1-0528）协同工作，在 ARC-AGI-2 基准测试中显著优于单个模型。

0 人收藏 0 人点赞

sqlite-utils 4.0rc1 新增迁移和嵌套事务

Simon Willison's Blog ↗ · 3天前缓存

sqlite-utils 4.0rc1 是一个候选发布版本，新增了内置数据库迁移（从 sqlite-migrate 移植而来）以及通过 db.atomic() 实现的嵌套事务，同时包含少量不向后兼容的更改。

0 人收藏 0 人点赞

sqlite-utils 4.0rc1

Simon Willison's Blog ↗ · 3天前缓存

sqlite-utils 4.0rc1 是 Python CLI 工具的一个发布候选版本，该工具简化了 SQLite 数据库操作。

0 人收藏 0 人点赞

三星电子向员工推出ChatGPT和Codex

OpenAI Blog ↗ · 3天前缓存

三星电子正在向全球员工部署OpenAI的ChatGPT Enterprise和Codex，这是OpenAI规模最大的企业部署之一，旨在提升研发、营销和制造领域的工作效率。

0 人收藏 0 人点赞

面向AI代理的临时Cloudflare账户

Simon Willison's Blog ↗ · 3天前缓存

Cloudflare宣布推出临时账户，允许开发者在无需注册的情况下将Workers部署到临时项目中，账户有效期为60分钟，并可选择申请永久保留，主要面向AI代理，但具有广泛用途。

0 人收藏 0 人点赞

引用 Sean Lynch

Simon Willison's Blog ↗ · 5天前缓存

肖恩·林奇的一句话强调，模型上下文协议（MCP）的主要价值在于将认证流程隔离在代理的上下文窗口之外，可能只是API的认证网关。

0 人收藏 0 人点赞

更准确模拟金属合金行为的新方法

MIT News — Artificial Intelligence ↗ · 5天前缓存

麻省理工学院的研究人员开发了一种基于机器学习的方法，能够准确模拟金属合金的行为，无论其化学复杂性如何，从而实现更快、更便宜的材料创新。

0 人收藏 0 人点赞

测试 Mythos 和 Fable，超越 SWE-bench，Nvidia 的开放竞争者

The Batch ↗ · 5天前缓存

Anthropic 发布带有严格防护措施的 Claude Fable 5，以及美国政府随后对该模型实施的出口管制，引发了人们对 AI 主权和专有 AI 平台稳定性的担忧。

0 人收藏 0 人点赞

‘禁止挖人’：中国AI巨头DeepSeek据报要求投资者承诺不挖角（3分钟阅读）

TLDR AI ↗ · 6天前缓存

据报，DeepSeek在其74亿美元融资轮中，要求投资者承诺不挖走其人才，凸显了中国人工智能工程师领域的激烈竞争。

0 人收藏 0 人点赞

估值130亿美元的AI初创公司押注更便宜的OpenAI和Anthropic替代方案（4分钟阅读）

TLDR AI ↗ · 6天前

Baseten是一家估值130亿美元的AI初创公司，为使用低成本AI模型替代OpenAI和Anthropic的企业提供软件和计算能力。

0 人收藏 0 人点赞

Mistral AI 将在 Vibe 上增加代码和应用功能（2分钟阅读）

TLDR AI ↗ · 6天前缓存

Mistral AI 正在为其 Vibe (Le Chat) 网络平台增加专门的代码和应用部分，将其从对话界面转变为开发和应用程序构建环境。一款新的、大型稀疏混合专家模型也确认将在夏季以开放权重形式发布。

0 人收藏 0 人点赞

AI教父炮轰马斯克的xAI是'失败之作'，称实验室正面临'巨大泡沫破裂'的风险（4分钟阅读）

TLDR AI ↗ · 6天前缓存

Yann LeCun称Elon Musk的xAI是'失败之作'，并警告高昂的AI支出可能导致'巨大泡沫破裂'，批评该公司与OpenAI和Anthropic竞争的能力。

0 人收藏 0 人点赞

谷歌正在使用英伟达的策略来打造有竞争力的AI芯片业务（11分钟阅读）

TLDR AI ↗ · 6天前

谷歌正在采用英伟达的策略来打造有竞争力的AI芯片业务，向Anthropic出租TPU计算能力，并提升推理性能以与英伟达的主导地位竞争。

0 人收藏 0 人点赞

使用回放缓冲区重新审视难题 (8分钟阅读)

TLDR AI ↗ · 6天前缓存

ZPPO在LLMs/VLMs的强化学习中为难题引入了回放缓冲区，允许反复接触，逐步提高rollout准确性，而不会导致策略漂移。该方法比GRPO解决了更多难题，尤其是那些初始准确率接近零的问题。

0 人收藏 0 人点赞

强化学习走向广泛且持久的受益模型（22分钟阅读）

TLDR AI ↗ · 6天前缓存

OpenAI研究人员表明，针对有益特质（诚实、透明、可纠正性）在现实场景中进行强化学习，能在数十个对齐基准上产生广泛改进，且这些改进能够泛化到训练领域之外，并在对抗压力下持续存在。

0 人收藏 0 人点赞

智能体的自改进记忆（6分钟阅读）

TLDR AI ↗ · 6天前

Perplexity Brain是一个记忆系统，它构建了一个跨任务、项目、决策、文件和来源的持久上下文图，使智能体能够从相关上下文开始，而不是从头开始，从而提高答案正确性并降低任务成本。

0 人收藏 0 人点赞

Midjourney，人工智能图像生成器，正在开发全身超声波扫描仪（三分钟阅读）

TLDR AI ↗ · 6天前缓存

Midjourney以其人工智能图像生成器闻名，宣布推出全身超声波扫描仪，可在60秒内完成全身扫描，该设备与Butterfly Network合作开发。公司计划开设水疗中心提供服务，并力争在2031年前获得FDA批准并在全球部署。

0 人收藏 0 人点赞

OpenAI 准备发布 GPT-5.6 模型（2分钟阅读）

TLDR AI ↗ · 6天前缓存

OpenAI 正准备发布 GPT-5.6 系列，包括标准版、Mini 和 Pro 版本，传闻具有 150 万个 token 的上下文窗口和改进的自主编码能力，目标在周二发布，与 Anthropic 竞争激烈。

0 人收藏 0 人点赞

Blog

提交意见反馈