全部文章,按抓取时间从新到旧排列。
Howard Lutnick宣布与Anthropic合作,分析并批准'Fable 5'以符合美国政府的人工智能方向,Susie Wiles赞扬特朗普总统在AI领域的领导力。
Kent C. Dodds 发布了一张照片,显示他在 AI Engineer World's Fair 的工作坊前排起了长队,Joel hooks 表示他也有类似情况。
一篇预印本研究发现,大型语言模型自发地发展出了专门化的模块化大脑区域,用于语言、数学、物理和社会推理,这与人类大脑相似,表明智能系统设计中的趋同现象。
VibeVoice 1.5B,一个长篇幅多说话人TTS模型,现已获得audio.cpp(原生C++/ggml运行时)的支持,在RTX 5090上实现4.08倍实时速度,比无量化的Python基线快2.86倍。
x402协议使自主代理能够通过Base上的USDC支付工具费用,Apify已与Coinbase合作,将其x402支持从2,000个工具扩展到20,000多个工具。
Claude Sonnet 5 现已全面可用,正在 GitHub Copilot 中推出。早期测试显示其编码性能强大,尤其在 CLI 任务上表现突出,具有良好的提示缓存利用率和有竞争力的延迟。
Philipp Schmid 发布了一项针对 Omni Flash 的技能,该技能通过 Gemini Omni Flash API 将视频编辑集成到代理中,支持文本生成视频、图像参考、首帧以及对话式编辑。
复旦大学举办了一场别开生面的期末考试,51名学生每人编写了10道问题,旨在难倒三个AI模型(Claude、DeepSeek、MiniMax),成绩根据这些问题对AI的难度而定。
REAP是一个自动化管道,从真实的开发者-代理会话中策划生产环境衍生的编码代理基准,利用基于LLM的分类和稳定性检查,确保无需手动标注的可靠评估。
Etched 高调亮相,宣布推出专门为 Transformer 推理设计的 AI 芯片和整套推理集群,已获得超过 10 亿美元客户合同和 8 亿美元融资,首台机柜将于今年夏天发货。
这种教育考核方式鼓励学生探索 Claude、DeepSeek 和 MiniMax 三个模型的长处与短板,出题难倒AI,从而培养批判性思维和AI时代所需的竞争力。
Review-it.ai 通过上传稿件帮助博士生找到可能接受其论文的期刊。
谷歌研究院推出了 TabFM,这是一个针对表格数据的基础模型,能够在无需预训练的情况下,通过单次前向传播对未见过的表格进行零样本分类和回归。
最新Claude Code CLI客户端代码中被发现隐藏了一个中转站名单,来自这些站点的用户可能被Claude随机修改prompt以干扰请求,引发关于透明度和隐私的讨论。
一条推文,推广了一份精心整理的数学与深度学习资源合集,旨在帮助理解像Claude这样的模型背后的基础,包括线性代数、实分析、优化和表示论。
John Schulman 强调桥水基金的工作表明,使用专家标注数据进行微调,在金融文档分类上能显著优于仅用提示的方法。
Anthropic 的职业文章为工程师勾勒了一份作品集路线图,涵盖 Python、API、RAG、智能体(agents)和部署,重点介绍了诸如提示链(prompt chaining)、路由(routing)和并行化(parallelization)等智能体系统模式。
atomic.chat进行了一项对比,显示Claude Sonnet 5在三个物理编码演示中与GPT 5.5表现相当,但成本低6倍,且使用的token数少于其他模型。