标签
文章讨论了构建基于LLM的AI工具仍需捕获领域知识,尽管比之前的AI世代更容易,因为知识不必严格结构化。
作者回复了关于其爆款帖子“LLMs are eroding my career”的评论,讨论了AI自动化如何减少金融科技领域对深层领域知识的需求,以及在vibecoding文化中保持勤奋所面临的挑战。
一条推文将AI的应用比作用一群缺乏领域知识的天才替换员工,引发混乱。
BODHI是一种领域知识提示方法,通过用结构化的C到Python翻译指南增强少量示例提示,改进了基于LLM的形式化操作系统内核规范生成,在OSV-Bench基准测试中达到了高达96.73%的Pass@1。
YC 合伙人 @t_blom 发表了一场关于打造自我改进的 AI 原生公司的演讲,强调了递归 AI 循环并通过 AI 自动化减少员工人数。
本文介绍了FINESSE-Bench,一个包含八个专业基准、共3,993个问题的套件,用于对大语言模型进行金融能力的分层评估,涵盖专业认证主题与应用交易任务。