标签
Ryan Zhu 宣布与 NousResearch 合作,实现在任何操作系统上连接 iMessage,让个人助手能够访问 iMessage 并解锁全新体验。
介绍了Claw-Anything,这是一个基准测试,用于评估始终在线的个人AI助手在涵盖长时间跨度、多种服务和多样化设备交互的综合用户活动上下文中的表现。实验表明,即使是GPT-5.5也仅达到34.5%的pass@1,突显了当前智能体能力与始终在线辅助需求之间的显著差距。