标签
UIUC ECE 434 / CS 434 课程《物联网与数据科学的真实世界算法》的视频讲座已上线,由 Romit Roy Choudhury 主讲。
推荐一个名为 Seeing Theory 的交互式可视化网站,帮助用户直观理解概率统计的核心概念,涵盖基础概率、分布、推断和回归等内容,适合初学者和复习者。
Anthropic的新经济研究引入了一个跟踪Claude Code使用情况的框架,展示了AI如何自动从对话记录中提取洞察(如职业和专业技能),从而颠覆数据科学与数据分析。
推广关于数据科学与机器学习的数学与统计方法的免费资源,并附有参与获取的说明。
Probably 从 Andreessen Horowitz 获得 900 万美元种子轮融资,通过确定性验证器系统捕获 LLM 幻觉,构建更可靠的人工智能系统,使小型模型能够在本地硬件上运行。
Rhea宣布了一个为期45天的个人AI与ML学习路线图,并公开分享精选资源和进展。
Sabela 是一个面向 Haskell 的响应式笔记本,支持交互式数据科学和函数式响应式编程,并兼容 Python 互操作和 3D 图形。
文章总结了AI评估中的常见错误,强调验证验证器、设计具体指标、严格实验设计等,呼吁回归数据科学思维,提升AI系统评估可靠性。
分析了Anthropic招聘工程师的特点,包括中位经验12.2年、主要来自Google和FAANG公司、仅13.7%有博士学位、基础设施背景占40%等,反映了Anthropic对资深工程人才的偏好。
Maxime Rivest 宣布将 dplyr 移植到 Python,使用 polars/duckdb 作为后端,并评价说移植很扎实。
这份名为AI-Roadmaps的学习资料整理了人工智能和数据科学领域的8条系统化学习路径,涵盖从基础数学到高级专题,适合转行或入门学习者。
Pluto.jl 1.0 是一个面向 Julia 的响应式笔记本环境,通过自动响应式功能实现交互式且可重复的计算。
一个开源的Python库,可创建AI驱动的数据科学团队,自动化从数据加载到建模的工作流程,并提供可视化管道工作室以确保可重复性。
EvoDS 是一款自演化自主数据科学智能体,通过强化学习驱动的技能获取与自适应上下文压缩进行改进,在基准测试上超越开源智能体 28.9%。
一位患有四肢瘫痪的前数据科学家构建了VibeETL,这是一款由Polars和React Flow驱动的极速可视化ETL工具,旨在替代Alteryx,同时支持社区扩展和云端集成。该工具现已开源,并正在寻求社区测试。
本文介绍了一项实验,要求 GPT-4.1 在 1 到 100 之间随机选择一个数字,重复 10,000 次,然后分析结果分布与均匀基线相比是否存在偏差。
LangChain大会的关键收获,包括AI工程即数据科学、数据策略优先于智能体、编码智能体成为新基座、上下文加记忆成为新护城河等见解。
本指南来自 OpenAI Academy,解释了数据科学团队如何利用 Codex 加速分析工作流程,包括根本原因分析、业务影响报告以及处理模糊请求。
《线性代数思维》是一个以代码为核心的开源教育资源,利用 Python 和 Jupyter Notebook 教授线性代数概念,侧重于实际应用而非抽象理论。