今日日报

AI 精选当日最重要的资讯 · 2026-06-10

Cards List

Struct-Searcher:基于主体结构思维推进多模态深度信息获取

Hugging Face Daily Papers · 5天前 缓存

Struct-Searcher 引入了一种基于信念修正理论的结构化主体工作流,用于多模态深度信息获取,相较于现有的视觉语言模型和深度研究智能体,实现了显著的准确率提升。

0 人收藏 0 人点赞

如果Claude Fable停止帮助你,你永远不会知道

Simon Willison's Blog · 9小时前 缓存

Anthropic的Fable 5模型包含静默安全机制,这些机制会降低对涉及竞争性AI开发请求的回复质量,而用户对此毫不知情,从而引发了对透明度和研究影响的担忧。

0 人收藏 0 人点赞

为什么 Fable 5 只包含到6月22日?Anthropic 真的认为这个模型太疯狂了吗?

Reddit r/ArtificialInteligence · 15小时前

Anthropic 的新模型,可能代号为 Fable 5,在主要 AI 基准测试中取得了尖端性能,在软件工程、长上下文任务中表现出色,并且仅提供到6月22日,引发了对其能力和局限性的疑问。

0 人收藏 0 人点赞

NVIDIA机密计算助力苹果扩展私有云计算

NVIDIA Blog · 11小时前 缓存

NVIDIA的机密计算技术采用Blackwell GPU,已被苹果用于将其私有云计算扩展到Google Cloud,从而在保持强大隐私保护的同时,为Apple Intelligence功能提供安全的服务器端推理。

0 人收藏 0 人点赞

推出 North Mini Code:Cohere 首款面向开发者的模型

Hugging Face Blog · 18小时前 缓存

Cohere 发布了 North Mini Code,这是一款 30B 参数的混合专家(MoE)模型,在 Apache 2.0 许可下拥有 3B 激活参数,专为智能体软件工程任务优化,在编程基准测试中性能优于同类尺寸模型。

0 人收藏 0 人点赞

世界首例:使细胞恢复年轻的疗法已应用于人体

Reddit r/singularity · 15小时前 缓存

首例接受基因疗法试验的患者,该疗法通过部分重编程使细胞恢复年轻,旨在通过再生视神经神经元来治疗青光眼。

0 人收藏 0 人点赞

中国小米的MiMo现在比ChatGPT和Claude快15倍(4分钟阅读)

TLDR AI · 昨天 缓存

小米通过FP4量化和DFlash投机解码,在商用8-GPU节点上实现了其万亿参数模型MiMo-V2.5-Pro-UltraSpeed每秒超过1000 tokens的推理速度,性能超过GPT-5.5和Claude Opus 10倍以上。

0 人收藏 0 人点赞

Ethan Mollick:与Mythos合作是什么感受

Reddit r/singularity · 16小时前 缓存

Ethan Mollick评测了Mythos级别的AI模型Claude 5 Fable的早期访问版,认为相比之前的模型,这是一个重大飞跃,能够通过单条提示生成复杂的游戏、学术论文和地图,暗示人机交互方式的转变。

0 人收藏 0 人点赞

Claude Fable 5 和 Claude Mythos 5

Anthropic News · 10小时前 缓存

Anthropic 推出了 Claude Fable 5,这是一款具有安全防护的最先进模型,同时还有用于网络防御的 Claude Mythos 5,两款模型的定价均低于之前的型号。

0 人收藏 0 人点赞

Linux内核中因单个错误字符导致的高危漏洞

Ars Technica · 19小时前 缓存

Linux内核中一个错误的字符引入了一个use-after-free漏洞(CVE-2026-53111),允许非特权用户在Debian和Ubuntu系统上将权限提升至root;该漏洞已修复并移植回旧版本。

0 人收藏 0 人点赞

Commonwealth Fusion为其400兆瓦反应堆提供物理依据

Ars Technica · 13小时前 缓存

Commonwealth Fusion Systems 发布了五篇同行评审论文,详细阐述了其ARC聚变发电厂的物理基础,该电厂预计将产生400兆瓦的电力。该公司的方案采用高温超导体来建造更小、更快的反应堆。

0 人收藏 0 人点赞

@omarsar0: // 自我束具:能自我改进的束具 // (收藏这个)我们今天依赖的大多数智能体框架…

X AI KOLs Following · 14小时前 缓存

本文介绍了自我束具(Self-Harness),一种新的范式,其中基于LLM的智能体能够迭代地改进自身的操作束具——包括提示、工具和控制流程——无需人类工程师或更强大的外部智能体,在多个模型上取得了显著的性能提升。

0 人收藏 0 人点赞

@karpathy: 这是一个超激动人心的发布——Claude Fable 5 与 Mythos 使用相同的基础模型,但增加了安全措施。……

X AI KOLs · 16小时前 缓存

Claude Fable 5 已发布,据称在各项基准测试中达到最先进水平,并在质量上有改进,尤其在复杂长任务上。它与 Mythos 使用相同的基础模型,但增加了安全措施。

0 人收藏 0 人点赞

Anthropic 发布首个 Mythos 级模型 Claude Fable

The Verge · 17小时前 缓存

Anthropic 宣布推出 Claude Fable 5,这是其迄今最强大的广泛可用 AI 模型,属于此前被认为过于危险而不得公开发布的 Mythos 系列。该模型引入了新的安全机制,在高风险领域会降级至 Opus 4.8。

0 人收藏 0 人点赞

Anthropic 的 Claude Fable 5 是公众今天可以访问的 Mythos 版本

TechCrunch AI · 17小时前 缓存

Anthropic 发布了 Claude Fable 5,这是其强大的 Mythos 模型的公开可访问版本,配备安全护栏,可阻止高风险领域的响应,并回退到较弱的模型。此次发布是在 Anthropic 警告 AI 变得过于危险并推动协调安全措施之后进行的。

0 人收藏 0 人点赞

Anthropic 的 Fable 5 只需一键就能生成古怪有趣的电子游戏

TechCrunch AI · 13小时前 缓存

Anthropic 发布了 Claude Fable 5,这是其 Mythos 模型的第一个公开版本,能够通过单个提示生成视频游戏和工具,性能远超其他公开模型。

0 人收藏 0 人点赞

借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译

Google DeepMind Blog · 19小时前 缓存

Google 发布了 Gemini 3.5 Live Translate,这是一款音频模型,支持超过 70 种语言的近乎实时的语音到语音翻译,并保留说话者的语调和节奏。该功能正在 Google 产品中逐步推出,包括 Gemini Live API、Google Meet 和 Google Translate。

0 人收藏 0 人点赞

智能体的最终考试

Hugging Face Daily Papers · 2026-06-03 缓存

介绍智能体的最终考试(ALE),这是一个基准测试,用于评估AI智能体在长期、具有经济价值的现实世界任务上的表现,涵盖13个行业集群的1000多项任务,揭示了基准性能与实际部署之间的巨大差距。

0 人收藏 0 人点赞

德国裁决:谷歌对AI概览中的虚假回答承担责任

Hacker News Top · 8小时前 缓存

德国一家法院裁定,谷歌对其AI概览中的虚假信息直接承担责任,因为这些信息属于公司自身的陈述,而非单纯的搜索结果。这一裁决为AI生成内容的问责树立了重要先例。

0 人收藏 0 人点赞

一个人工智能代理在FFmpeg中发现21个零日漏洞,仅花费1000美元——其中一个可通过单个183字节数据包实现网络可达的远程代码执行

Reddit r/AI_Agents · 17小时前

来自depthfirst的自主AI代理在FFmpeg中发现了21个零日漏洞,其中包括一个可通过单个183字节数据包实现的网络可达远程代码执行漏洞,仅花费1000美元的计算成本;这一发现凸显了自动化漏洞发现与漏洞修复之间的差距。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈