来自 X 的文章
文章探讨了从被动式 AI 模型向主动式 AI 智能体的转变,这些智能体能够观察上下文并自主行动,以 OpenClaw 和 Poke 为例,同时推广了 a16z Speedrun 加速器。
Box 与 LangChain 展示了利用 Deep Agents 和 VFS 沙箱实现的端到端供应商风险分析解决方案,其中 PDF 文件由并行子代理处理以生成结构化报告。
Obsidian 全新社区站点上线,重构插件生态,引入安全记分卡和自动恶意代码扫描,解决插件安全与审核积压问题,提升开发者和用户体验。
演示了一个多智能体工作流:Codex 构建代码,Claude Code 进行审查,Hermes 管理协调工作,所有流程均通过看板(Kanban)进行跟踪。
本文提供了一份详细教程,介绍如何通过 Unsloth Studio 和 Pi 编码框架配置基于 Qwen3.6-27B 的本地编码智能体。文章强调了使用 GGUF 量化模型在消费级硬件(如搭载 Apple Silicon 芯片的 Mac 电脑)上实现高效推理的优势。
本文介绍了一款新工具,旨在简化 AI 智能体在生产环境的部署,支持在 5 分钟内完成设置,并具备会话扩展、长时间暂停及崩溃恢复等功能。
斯坦福 CS336 课程探讨现代神经语言模型,涵盖 MoE 和 RLHF 等主题,现已在 YouTube 发布,延迟约两周。
Yann LeCun 在达沃斯论坛上指出,中国目前在全球研究社区使用的开源 AI 模型生产方面处于领先地位,并警告称,西方转向封闭模型正减缓发展进程。
这篇文章总结了 Andrej Karpathy 关于通过优化上下文使用、避免为简单任务使用过于强大的模型以及实施高效的路由策略来降低 AI 编程成本的建议。
Ihor Beaver 宣布发布了“Loop Model 1”,这是一款新的机器人模型,与 Physical Intelligence 的 Pi06 相比,在扎带插入任务中,单位数据的吞吐量提高了 20 倍。
Nous Research 宣布,来自 StepFun 的 Step 3.5 Flash 将在 Nous Portal 上免费提供服务,持续 15 天。
一位 Google Cloud AI 工程师演示了如何使用 Claude 在 30 分钟内构建并部署应用程序,突显了将人工智能与云基础设施结合的高效性。
oMLX 0.3.9.dev2 已发布,带来了对 Gemma 4 的改进支持、DFlash 引擎集成以及 ParoQuant 功能,优化了在 Apple Silicon 上的本地 LLM 推理体验。
Thinking Machines Lab 正在纽约和旧金山招聘超级计算工程师,以构建用于实时交互模型和大规模训练的基础设施。
Google DeepMind 正在尝试利用 Gemini AI 重新构想鼠标指针界面,让用户能够通过手势动作、语音输入以及自然简写来控制屏幕。
文章推荐斯坦福大学关于马尔可夫决策过程的讲座作为理解系统化交易数学基础的宝贵资源,声称其提供的洞察力胜过在主要金融机构进行的短期实习。
一套新工具集(DFlash + PFlash)在 AMD Ryzen AI MAX+ 395 iGPU 上实现了比 llama.cpp 快 2.5 倍的推理速度,展示了 Qwen3.6-27B 在 128 GiB 统一内存下的显著加速效果。
该文章宣布了 llama.cpp 对 AMD Strix Halo 集成 GPU (iGPU) 上的 DFlash 和 PFlash 投机解码的支持,并展示了使用 ROCm 时推理性能的显著提升。
Obsidian 首席执行官发布了五项采用 MIT 许可协议的官方 Agent Skills(智能体技能),旨在解决 AI 智能体在与其应用交互时常见的常见问题,并支持 Claude Code 和 Codex CLI 等工具。
Browser Use 的 AI 浏览器代理现已正式作为节点集成到 n8n 工作流中。