标签
Anjney Midha警告称,大约18个月内,AI驱动的颠覆将从根本上威胁那些其价值依赖于提供信任的网络安全公司,并引用了苦涩的教训。
Richard Sutton总结其苦涩教训:AI应专注于可扩展的方法如搜索和学习,而非融入人类知识。
介绍了教学RL,一种范式,其中训练特权自我教师以生成正确且易于遵循的轨迹,表明这是一个相对简单的RL问题。
作者认为,虽然“苦涩的教训”和“没有免费午餐”的直觉在孤立状态下具有误导性,但当两者结合时,它们提供了正确的视角。
一条关于在机器学习中培养真正研究技能的有深度的帖子,涵盖了如何独立选题、培养品味、提升信息输入以及通过写作来厘清思路。