标签
在激进采用人工智能导致代价高昂的质量问题后,福特重新雇佣了数百名资深工程师。这家汽车制造商现在将人工智能与人工监督相结合,以提高生产质量。
一篇评论,强调尽管AI取得了进步,但人类的理解力对于安全和人道的部署仍然至关重要,敦促用户验证AI的输出并以尊重对待AI。
本文提出,AI辅助社会科学研究的可靠性取决于决策架构——即认知劳动在人类与机器之间的分工方式。通过一个预先指定的析因实验,作者表明,一个无约束的多智能体基线在72%的运行中失败,而采用三个架构承诺(限制LLM仅进行推理、确定性数据/估计、以及三个人类决策门控)的组织运行失败率仅为16%。
本文分析了35,361条引用AI使用的GitHub代码注释,开发了AI辅助开发活动的分类体系,发现开发者主要使用LLM进行代码实现和增强,随后进行人工重构和错误修复,并且随时间推移,从直接代码生成转向概念支持。
本文调研了AI在整个研究生命周期中的能力与局限,从创意生成到成果发布,识别出可靠辅助与不可靠自主之间的明确界限。它提供了一个分类体系、基准测试套件、工具清单以及人类主导的AI协作研究设计原则。
文章讨论了企业如何从设计阶段就将欧盟AI法案合规要求融入产品开发,强调透明度、防护机制和人类监督是关键架构变化。
本文介绍了功能性意向性测试(FIT)和 FIT-Eval 框架,旨在量化代理型人工智能系统中类意向行为程度,以服务于治理与问责目的。