标签
关于在本地设备上通过U盘运行大型语言模型(如Gemma 4、Qwen 3.5、Gemma 2)的指南,无依赖,仅需8GB内存。
PostHog的工程师使用了多次长时间运行的Claude Code会话,重写了他们的SQL解析器,相比之前基于ANTLR的解析器实现了70倍的加速,而他们自己几乎没看代码。
Kog 开源了 Laneformer 2B 模型,这是一个 23 亿参数、经过指令调优的编码模型,专为高速解码设计。通过从架构阶段优先考虑延迟,实现了每秒超过 3000 个 token 的生成速度。
有人开源了名为“循环工程”的框架,用于构建一个AI驱动的对冲基金,可利用Claude代码实现24/7全天候交易,声称能够持续创造超额收益(alpha)。
Blåmba 是对早期2000年代手机铃声和多媒体提供商的开源重实现,支持现代网页和WAP访问。它还包含了第38届混沌通信大会上关于技术背景的演讲。
OpenAI 公开了 Codex 项目的 AGENTS.md 开发守则,涵盖 Rust 代码库的内部规范和治理细节。
Sipp 是一个开源库,利用 llama.cpp 实现浏览器内推理,使 AI 模型能够直接在浏览器中运行。
对 Xteink X4 的评测,这是一款售价40英镑的电子墨水屏阅读器,小巧到可以贴在手机上。文章重点介绍了该设备的轻量化设计、不错的原厂固件,以及活跃的自定义固件生态,包括 CrossPoint、Papyrix 和 Inx 等选项。
Papers with Code上的一个精选页面列出了顶级开源OCR模型和基准测试,重点介绍了百度(Unlimited OCR)和Mistral(OCR 4)的新发布,旨在支持RAG等AI智能体应用场景。
使用基于 JAX 的流水线和 Vision Transformer,通过自对弈强化学习训练了一个超人类水平的 Generals.io 智能体。在人类 1v1 排行榜上排名第一;所有代码和一个快速的 JAX 模拟器均已开源。
NVIDIA NeMo AutoModel 利用 HuggingFace Transformers v5,在微调 Mixture-of-Experts 模型时,无需修改代码(只需一个导入),即可实现 3.4 至 3.7 倍的训练吞吐量提升和 29% 至 32% 的 GPU 内存减少。
Sentient Foundation启动了一项4200万美元的开源AGI资助计划,包含两个轨道:不涉及股权的资助以及针对商业开源AI产品的投资,重点考察技术质量和生态价值。
Youssef Hosni宣布,他的《LLM Roadmap》一书(曾在To Data & Beyond商店成为畅销书)现已开源并免费提供,旨在为LLM和生成式AI提供清晰的学习路径。
Mozilla 宣布了 MDN MCP 服务器,该服务器使用模型上下文协议,为 AI 编码工具提供最新的 MDN 文档和浏览器兼容性数据,从而在开发工作流中提供更准确的 Web 平台信息。
RubyLLM是一个统一的Ruby框架,用于与多个AI提供商交互,支持聊天机器人、智能体、RAG等,并提供一致的API。
一条推文推荐使用vLLM代替Ollama进行本地AI,理由是更好的GPU利用率、更高的效率,以及在测试中速度提升高达2倍。vLLM是一个快速、开源的LLM推理和服务库,支持多种模型和硬件后端。
Yann LeCun在联合国开源周上表示,开源AI对于全球AI主权至关重要,因为专有AI对于大多数国家和公司来说过于昂贵且集中化。
推荐了四个适用于机器学习/计算机视觉/NLP等领域的开源论文写作技能包,分别侧重结构规范、润色审查、完整科研流程和中文协作,支持Codex、Claude Code、Gemini等AI助手。
对OpenClaw仓库中拉取请求的统计分析显示,AI生成的PR垃圾邮件激增,合并率从48%下降到9.3%,贡献者每天提交数百个自动PR。文章将这一现象与早期的电子邮件垃圾邮件进行比较,并讨论了基于信誉的过滤器和信任管理系统(如Vouch)等新兴解决方案。
详细记录了将Wine移植到Astral爱好操作系统的过程,通过WoW64实现了32位Windows应用的运行,并解决了OpenGL/EGL依赖问题,从而能够运行Cogmind等游戏。