cognition

标签

#cognition

用于模拟紧急疏散中类人意识与行为的认知-情感-人格框架

arXiv cs.AI ↗ · 5小时前缓存

本文提出一个扩展的疏散框架，将认知、情感、社交和人格机制整合到基于智能体的不确定性人类行为仿真中。该框架建模动态事件意识、记忆、恐惧以及基于OCEAN的人格，展示了其对疏散效率和真实人群现象的影响。

0 人收藏 0 人点赞

#cognition

用张量网络建模儿童情感记忆

arXiv cs.LG ↗ · 5小时前缓存

本文介绍了一种张量网络模型，用于捕捉情绪效价对儿童识别记忆顺序依赖结构的影响，达到了77.98%的准确率，展示了量子启发方法在建模认知现象中的价值。

0 人收藏 0 人点赞

#cognition

@dabit3：保持模型无关性，使@cognition总能提供“最佳”模型，而不仅仅是“我们的最佳”模型。Devin Fusion是一个…

X AI KOLs Following ↗ · 13小时前缓存

Cognition推出Devin Fusion，这是一款自适应模型路由器，可在保持真正前沿智能用于代理编程任务的同时，将成本降低35%。

0 人收藏 0 人点赞

#cognition

发展性方法揭示神经语言模型的统计学习：Transformer从最抽象的统计模式中泛化

arXiv cs.CL ↗ · 昨天缓存

本文采用发展性方法研究神经语言模型（特别是Transformer）如何从人工语法中学习统计模式，发现它们首先获取全局抽象统计信息，然后学习局部依赖关系，并在早期出现过度泛化。

0 人收藏 0 人点赞

#cognition

@dabit3：我们今天非常高兴地正式启动 @cognition 为 @DevinAI 设立的大使计划。这是我们首次…

X AI KOLs Following ↗ · 5天前缓存

Cognition 为 DevinAI 正式启动大使计划，面向全球招募 50 位新大使，入选者可获得免费的 Devin Max 计划、积分和早期访问权限。

0 人收藏 0 人点赞

#cognition

@josephhhhz: http://cognition.ai 现已变为 http://cognition.com

X AI KOLs Following ↗ · 2026-06-21 缓存

Cognition 将域名从 cognition.ai 迁移至 cognition.com，Devin 仍是首个自主软件工程师。

0 人收藏 0 人点赞

#cognition

@swyx：终于发布了！！！@METR_Evals 发现 SWEBench 超半数的结果是无法合并的劣质代码。FrontierCode 代表…

X AI KOLs Following ↗ · 2026-06-08 缓存

FrontierCode 是 METR 和 Cognition 推出的新编程基准，用于评估 AI 模型在代码可维护性和质量方面的表现，结果显示许多模型会生成无法合并的代码。该基准包含超过 1000 小时的工作量，并表明即使顶尖模型也难以应对，其中 Opus 4.8 在最难的等级上仅获得 13.8%。

0 人收藏 0 人点赞

#cognition

@scaling01: Opus 4.8 是目前最好的编程模型。Cognition 的 FrontierCode 可能是最高质量的编程基准测试……

X AI KOLs Timeline ↗ · 2026-06-08 缓存

Cognition 推出了 FrontierCode，这是一个高质量的编程基准测试，超越了单纯的单元测试，用于衡量代码的可维护性、回归安全性和质量，由 20 多位开源开发者精心设计了 150 个任务。

0 人收藏 0 人点赞

#cognition

@dabit3: Tokenmaxxing 已死。大家都意识到用token使用量来衡量生产力是个糟糕的方法。那么接下来我们该怎么做……

X AI KOLs Following ↗ · 2026-06-07 缓存

讨论AI采用中从基于token的生产力指标转向产出、影响和价值衡量，重点介绍Cognition的解决方案：自适应路由、支出归因、自动化以及生产力保障。

0 人收藏 0 人点赞

#cognition

@swyx: 终于！来自Cog的首个评估产品发布！！！！！！作为背景说明：@METR_Evals 的上限约为16小时。Cog已推出私有企业级评估…

X AI KOLs Following ↗ · 2026-06-04 缓存

Cognition发布了Devin的首个评估套件，提供长达100小时的企业级评估并附有财务保证。数据集包含来自126家企业用户的真实Java/TypeScript/Python/C#任务，旨在比现有基准更准确地衡量工程生产力。

0 人收藏 0 人点赞

#cognition

AI写作最有趣的用例可能不是写作本身

Reddit r/ArtificialInteligence ↗ · 2026-06-04

文章认为，AI在写作中的最大价值可能在于辅助认知与创造力，而非生成最终文本，它充当着创造力的放大器。

0 人收藏 0 人点赞

#cognition

Devin Desktop

Product Hunt ↗ · 2026-06-02

Devin Desktop 允许用户从单一界面管理本地和云端AI代理集群。

0 人收藏 0 人点赞

#cognition

@cognition: 加入我们，与@mercor_ai、@Etched和@AnthropicAI一起在旧金山参加为期一天的Hackathon，头奖5万美元。报名截止…

X AI KOLs Following ↗ · 2026-06-01 缓存

由Cognition、Mercor、Etched和Anthropic AI联合主办的在旧金山举行的为期一天的Hackathon，头奖5万美元，总奖金10万美元。报名截止日期为6月12日。

0 人收藏 0 人点赞

#cognition

@patio11: 那大部分认知对于手头的任务来说是完全足够的。其余部分中的一些将是重要的诊…

X AI KOLs Following ↗ · 2026-05-31

一条推文指出，许多AI认知将足以完成任务，剩余的工作涉及诊断性分类，例如决定是否值得花钱请律师。

0 人收藏 0 人点赞

#cognition

@patio11: 特别地，存在一个道德层面：“我们将能够以前所未有的低价提供初阶认知能力……”

X AI KOLs Following ↗ · 2026-05-31 缓存

讨论了以史无前例的低价提供初阶认知能力所涉及的道德层面，强调AI的替代方案可能根本没有答案。

0 人收藏 0 人点赞

#cognition

他们称之为酷热是有原因的：高温扰乱动物大脑

Ars Technica ↗ · 2026-05-31 缓存

热浪会损害动物的认知能力，导致鸟类学习困难、攻击性增强，随着气候变化加剧，可能带来生态影响。

0 人收藏 0 人点赞

#cognition

Cognition的Scott Wu表示AI编程代理不应取代人类

TechCrunch AI ↗ · 2026-05-29 缓存

Cognition首席执行官Scott Wu表示，像Devin这样的人工智能编码代理旨在辅助而非取代人类程序员，强调人机协作而非失业问题。

0 人收藏 0 人点赞

#cognition

@walden_yan: 如果你正在构建自己的云代理，比如Devin或Ramp Inspect，这里有关于设置虚拟机的许多精彩细节……

X AI KOLs Following ↗ · 2026-05-28 缓存

与Walden Yan (Cognition)和Cole Murray (OpenInspect)深入探讨构建云代理，涵盖虚拟机设置、计算机使用、内存以及异步代理在AI工程领域的兴起。

0 人收藏 0 人点赞

#cognition

@AYi_AInotes: 今天听到的最醍醐灌顶的一句话了，老黄说，真正会用AI的人都是极高认知的提问者，都是带着自己的认知去提问，让它帮你叩开未知的边界，而不是让它替你思考，也就是说，以道御术，前提是你能以术入道，没有自己的道，再好的工具在你手里也只是一个玩…

X AI KOLs Timeline ↗ · 2026-05-25 缓存

引用黄仁勋的观点：真正会用AI的人是能带着自己的认知去提问的高认知提问者，而非让AI代替思考。

0 人收藏 0 人点赞

#cognition

@yibie: 多 Agent 系统炒了一年，生产环境里真正活下来的只有三种模式。剩下的都在坟墓里。这个结论不是我的。它来自三份今天同时浮出水面的证据——一份是 Cognition（Devin 背后的公司）工程负责人的内部复盘，一份是 Manning …

X AI KOLs Timeline ↗ · 2026-05-25 缓存

本文综合三份独立报告（Cognition 工程负责人的复盘、Manning 作者的行业全景报告、metaswarm 项目），指出生产环境中真正存活的多 Agent 系统只有三种模式：流水线、编排和生成-验证，而对等协作模式因隐式决策冲突和级联误差而失败。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈