面向大学使用场景的本地文档处理工具(Docling、Liteparse、Mineru 和 Unstructured)对比,评估它们对本地部署的适用性。
Cross Repo Review 是一个工具,用于映射仓库间的依赖关系,并在 PR 上展示下游影响、破坏性变更和影响范围,同时追踪代码、服务、数据和管道依赖。
IBM 推出 CUGA,这是一个开源智能代理框架,处理状态、工具调用和编排的底层细节,让开发者专注于定义工具和提示词。本文展示了使用 CUGA 构建的二十多个单文件示例应用,展示了它如何消除重复的框架设置工作。
本技术指南介绍了如何使用 Python 和 Apache Spark 实现自定义查询语言(EHQL),重点在于使用 Lark 定义语法和解析。
LispE 是 NAVER 开发的一个紧凑的 Lisp 方言,结合了函数式和数组语言特性,提供了针对 PyTorch、GGUF、MLX 和 tiktoken 的 AI 库,并附带一个基于浏览器的测试环境。
一个AI智能体从一个提示训练编码智能体的实时演示,并回顾了所有产物。
由 Shanshrew 开发的新型解析器架构比当前最快的 JS/TS 解析器快 2-3 倍,并正在集成到 Oxc 中。
Tidebase 是一个开源工具,为AI代理提供身份认证、凭证代理、检查点、队列、调度和网关,全部基于Postgres。
构建可复用的Claude Code Agent循环指南,通过替换检查脚本即可用于不同任务,如修复Bug、优化速度或降低成本。
browser-search 是一个开源、自托管的工具集,包含三款工具(SearXNG、Camofox、CloakBrowser),让AI助手无需API密钥或订阅即可搜索和浏览网页,并具备自动导航升级和深度研究能力。
一名开发者构建了kaeru,这是一个开源的AI代理共享记忆系统,能让代理跨会话持久化上下文、在不同代理和人类之间共享知识,并以3D星系形式可视化记忆。该工具支持多种代理框架,具备时间回溯、重要性级别和推理轨迹等功能。
pi-fusion 是 pi 的一个扩展,通过并行扇出多个模型并将结果融合,以更低成本获得更好性能,支持提示词重写和会话存档。
ymawky 是一个完全用ARM64汇编编写的Web服务器,支持CGI、静态文件和多种HTTP方法,现已可在Linux上运行。
现在有了适用于 llama.cpp 的 MiniMax M3 EAGLE 草稿模型的 GGUF 转换,可在兼容硬件上实现推测解码加速。
Prime Intellect发布了prime-rl v0.6.0,支持在万亿参数规模的大型Mixture-of-Experts模型上进行高效强化学习,实现低于5分钟的步骤时间,并对异步强化学习进行了优化。