标签
Kimi 发布了 K2.7 Code 模型及其高速版,并公布了 API 定价,相比竞品 Mimo 更贵且速度较慢。
三星将从2026年10月起为SmartThings API推出付费层级,包括面向个人开发者的每月4.99美元套餐,此举可能会影响高级用户和Home Assistant集成。
现在提供基于医疗维基百科文章的免费RAG API,可为本地LLM提供准确的医疗事实,通过纠正关于Lhermitte征的幻觉示例进行了展示。
Cloudflare 为所有客户推出了自管理 OAuth,允许开发者创建和管理 OAuth 客户端以实现委托 API 访问,从而提升 Cloudflare 应用生态的安全性和可扩展性。
本文讨论了LLM代码风格选择如何影响Token消耗和成本,并提供了优化建议,如使用Web API标准和更简单的缩进以减少输出Token。
一个生物云实验室允许通过API在几分钟内运行实验,无需昂贵的自动化工程师和漫长的设置时间,使独立创始人能够快速进行数千次药物筛选。
Databricks 为 Genie Agent 推出了 Agent Mode API,为在平台上构建和管理 AI 代理提供了新接口。
mcpgen 是一个 CLI 工具,能将任意 OpenAPI 3.x 规范或 Postman 集合转换为功能完备、自包含的 Python MCP 服务器,自动检测认证方式,无运行时依赖,并可生成可部署的源代码。
本文介绍了MemClaw,一种用于多智能体LLM系统的受控共享内存架构,形式化了诸如未授权泄漏和过时传播等故障模式,并通过ArgusFleet测试框架评估了该系统。
Anthropic 报告并解决了影响多个 Claude 模型和服务的错误率升高问题,该问题发生于 2026 年 6 月 23 日,持续时间为 UTC 时间 14:08 至 15:33。
文章解释了RFC 10008中定义的新HTTP QUERY方法,该方法通过提供一种标准、安全且幂等的带请求体方法,解决了GET和POST在复杂查询方面的限制。
一个简短的预测:2025年工程师会将LLM API集成到他们的测试工具中,而2026年他们会设计测试工具以便在Agent中运行。
本文解释了vLLM用于强化学习的权重同步API,涵盖了它如何促进RL训练中的权重更新和KV缓存重计算,重点关注降低训练框架的复杂性。
Stripe 推出了 Directory,这是一个其网络中可搜索的企业目录,专为 AI 代理和开发者设计,以便以编程方式发现和集成服务。
Sakana Fugu 通过单一 API 动态编排多种顶级模型,以处理复杂的多步骤任务。它利用其在 ICLR 2026 论文中提出的学习型编排方法,实现了前沿水平的性能,同时避免了对单一供应商的依赖。
关于在使用 GLM 5.2 模型时避免速率限制和降低成本的指南,涵盖提示批处理、缓存、免费模型替代方案、努力水平、上下文窗口管理和自托管。
StartupWiki 是一个免费、开放的创业公司数据库,无需账户或订阅即可发现和研究公司。