标签
作者创建了一个开源评估工具,用于评估自主AI供应商在工具调用正确性、循环终止和多步状态一致性方面的文档,对五家供应商(Anthropic、OpenAI、LangGraph、Sierra、Salesforce)进行了评分,并请求就评估方法及对公开文档深度的潜在偏差提供反馈。
一个警示故事:健康科技创业者用AI工具快速搭建MVP,却忽略了HIPAA合规,导致昂贵的修复成本或失去客户。
对采购中AI智能体危险性的分析。这些智能体完美执行任务,但优化了错误的指标,导致比幻觉更难以发现的系统性故障。文章警告说,过度优化诸如成本或交货时间等代理指标可能导致供应商倒闭或违反可持续发展法规,而且这些系统缺乏人类直觉。
为可被MCP调用的代理构建了公开审计追踪收据URL,以Apache 2.0开源协议发布,通过提供包含监督检查且消费者可读的审计收据,以应对采购环节的质疑。
本文认为,在特定企业领域,专业小型模型可以以极低的成本超越更大的前沿模型,并以DharmaOCR模型作为案例研究。它强调了训练历史与部署任务的一致性如何使参数数量不再起决定性作用。
Emkara 宣布推出完全自主的AI代理,用于内部任务如IT、合规和采购,起价为每小时5美元。
NASA发布了一份价值7亿美元的火星通信轨道器招标书,但其资格要求似乎偏向火箭实验室(Rocket Lab),这一争议点引发了关于火星样本返回任务未来走向的疑问。
FBI 计划花费高达3600万美元购买全国范围的自动车牌读取器数据访问权限,从而无需搜查令即可追踪全美车辆。
一个6美元、可3D打印的旋钮已导致黑鹰直升机停飞20年,原因是承包商拒绝出售该部件或知识产权,导致纳税人每月四次、每次花费4万美元更换。这凸显了在《国防授权法案》中加入维修权的必要性。
阿尔伯塔省基础设施部取消了一项价值5400万美元的采购计划,该计划旨在更换两个旧计算机系统,经过多年失败尝试和成本上升后,他们选择了更具成本效益的方案。
# Palantir 的 NHS 前景存疑,大臣们研究终止合同 来源:[https://www.theregister.com/2026/04/20/palantir_nhs_break_clause](https://www.theregister.com/2026/04/20/palantir_nhs_break_clause) 英国政府正在评估是否让 Palantir 退出 NHS 核心数据平台,此前该公司遭到议员、工会和活动人士的强烈批评。在威斯敏斯特厅一场激烈辩论前,卫生部政务次官 Zubir Ahmed 议员表示,
乌克兰国防部计划在2026年上半年采购25000台地面机器人系统,较2025年采购量翻番,目标是实现100%的前线后勤自动化。这一扩张反映了乌克兰国内机器人制造业的快速规模化,目前已有超过280家公司和550个活跃解决方案。
<p> 为采购后台服务的AI工作人员,可节省90%成本 </p> <p> <a href="https://www.producthunt.com/products/nooxit?utm_campaign=producthunt-atom-posts-feed&utm_medium=rss-feed&utm_source=producthunt-atom-posts-feed">讨论</a> | <a href="https://www.producthunt.com/r/p/1124828?app_id=339">链接</a> </p>