标签
介绍了EduAgentBench,一个基于源的基准,用于评估辅导智能体在教学专业判断、多轮辅导以及自主教学工作流程执行方面的能力。对前沿模型的评估表明,它们在情境化辅导和工作流任务中仍未能达到专业教学标准。
Arize Phoenix宣布在AI Engineer: Europe会议上举办免费的两小时评估工作坊,由开发者关系主管Laurie Voss主讲,内容包括手动数据检查以及内置与自定义评估。
精心整理的50个实用网站,涵盖绕过付费墙、免费教科书、研究论文、设计工具、生产力应用等,重点介绍谷歌往往忽略的资源。
本文研究了使用生成式AI工具(NotebookLM、Claude、M365 Copilot、Cursor、Claude Code)从教师笔记生成幻灯片,发现编程助手生成的幻灯片质量最佳,且学生无法可靠地区分AI生成的幻灯片与人工制作的幻灯片。
一位用户推荐一门课程,称其为学习大语言模型的最佳课程之一,基于他观看了部分讲座的体验。
斯坦福NLP将CS336课程推广为学习成功训练最先进语言模型技巧的途径。
AnjneyMidha 发推文说,每所美国大学都应订购某种硬件设备,供学生们拆解、逆向工程并拓展其功能。
斯坦福 CS336 课程探讨现代神经语言模型,涵盖 MoE 和 RLHF 等主题,现已在 YouTube 发布,延迟约两周。
推广 mlcourse.ai,这是由 OpenDataScience 提供的一个开源机器学习课程,涵盖理论、实践以及 Kaggle 竞赛。
UCF文理学院毕业生在毕业典礼上对演讲嘉宾Gloria Caulfield喝倒彩,此前她称AI为“下一次工业革命”。此举凸显了技术热情与人文专业学生担忧之间的紧张关系。
本文报道,AI 工具 ChatGPT 目前正被用于编写教育教科书的内容。这标志着大语言模型在出版行业的一个新应用领域。
一位 Anthropic 工程师发布了一个关于构建高效 AI 智能体的 14 分钟教程,因其对开发者极具实用价值而广受赞誉。
作者批评了在使用 PyTorch 等高级库时缺乏对底层机制理解的现象,并推荐 Simon J.D. Prince 的笔记集合,以弥合语法应用与第一性原理工程实践之间的差距。
An interactive visual guide, 'how-llms-work', breaks down the entire lifecycle of Large Language Models based on Andrej Karpathy's lectures, covering data collection to post-training.
该社交媒体帖子介绍了 SK 海力士公司三位继承人的出生年份及教育背景,指出其中两人曾在北京就读。
Stanford has released a free course, CS146S 'The Modern Software Developer', which teaches developers to use AI to boost coding productivity by integrating AI into the development workflow.
作者描述了一个使用 Gemini Nano Pro、Tripo 和 Codex 生成 3D 生物结构的工作流,强调了 AI 在加速教育方面的潜力。
一条社交媒体帖子,通过将 NP 比作总是能找到正确路径的“神奇计算机”来解释 P 与 NP 问题,并引用了 MIT 的《算法导论》课程。