标签
一位开发者展示了使用CopilotKit将Attio CRM数据实时生成AI驱动的用户界面(UI)的概念验证集成,并在Codex原生应用中运行,以创建自适应工作流。
一位顾问反思了AI如何接管他们工作中基于知识的部分,迫使他们转向执行智能和协调AI代理,并询问其他人的工作如何发生变化。
LlamaIndex 在 LlamaParse 中推出了细粒度边界框,支持对文档中每一个单词进行可视化引用,从而让用户能够人工审核确切的数字和图表。
Anthropic 发布了 Fable 5,声称它在软件工程、科学、知识工作和视觉等关键基准测试中达到了最先进水平,超过了所有先前可用的模型。
本文介绍了 Perplexity 与哈佛商学院合作研究的结果,探讨了像 Perplexity 的 Computer 这样的 AI 代理如何重塑知识工作,显示出在降低成本的同时提高了自主性、效率和范围。
本研究使用Perplexity的生产数据来分析AI代理如何重塑知识工作,发现代理将时间和成本降低超过87%,提高质量,并扩大自动化任务的范围。
Kimi Work 是一个桌面AI代理,可以在本地并行运行300个代理,具备浏览器自动化和定时任务功能,旨在提升独立知识工作者和机构的生产力。
本研究使用Perplexity的生产数据,比较AI代理与对话式助手,发现代理将完成任务时间减少87%,成本降低94%,同时扩展了知识工作的范围和质量。
一篇评论文章认为,AI并没有夺走有意义的工作,而是暴露了许多知识工作者岗位的 pointless,而像护理、管道维修这类动手工作依然对AI免疫。
OpenAI 推出了针对 Codex 的新角色特定插件,以及注释和创建交互式应用的功能,从而将该工具的用途扩展到各个领域的非开发者。
OpenAI 宣布为 Codex 推出新的角色特定插件,将其使用范围从开发者扩展到分析师、营销人员及其他知识工作者,同时新增了注释和应用创建等功能。
OpenAI 的最新报告显示,Codex 正从编码工具扩展为知识工作者的生产力工具,拥有超过 500 万周活跃用户,并在数据分析、工作流自动化等非开发人员任务中快速增长。
一份使用 OpenAI 的 Codex 作为知识工作操作系统的详细指南,包括设置、工作流程和一个七天入门计划,且该指南本身由 Codex 撰写。
本文提出一个三步框架,用于设计和报告知识工作AI的基准,强调基准任务与实际工作活动之间的一致性。它从O*NET数据库中推导出18种工作活动,并分析了三个现有基准(GDPval、OfficeQA Pro、APEX-SWE),以展示基准分数与实际工作能力之间的差距。
Every的CEO Dan Shipper通过真实数据指出,全面拥抱AI agent后公司反而增加了招聘,挑战了AI会大规模取代工作的普遍预期,并撰文解释这一悖论。
本文介绍了QuestBench,这是一个由学生构建的基准,用于评估人文和社会科学领域的深度研究系统。结果显示,即使是像GPT-5.5这样的先进系统也只能通过57.58%的问题,突显了可信度方面的失败。
安德烈·卡帕斯讨论了当前AI模型的局限性,强调人类技能培养比外包思考更重要,以及他受星际迷航学院启发的新教育平台愿景。
Jason Liu 分享了他如何使用 OpenAI 的 Codex 进行编码之外的知识工作,利用持久化线程、语音输入和引导将编码代理整合到他更广泛的工作流程中。
Jason Liu 分享了如何将 Codex 作为核心枢纽,跨工具处理幻灯片、PDF、电子表格等知识工作,最大程度发挥其价值。
Jason Liu 分享了高效使用 Codex 的工作流基本组件,包括持久线程、语音输入和引导,将 AI 智能体从编码扩展到知识工作。