@MaxForAI: 你很难找到比这个更好的eval资源库了 如果你对eval感兴趣,这些是你应该读的。 感谢 @xdotli 分享

X AI KOLs Timeline 新闻

摘要

分享一个精选的AI评估(evals)资源库,包含高质量博客、播客、论文和项目,由Xiangyi Li整理。

你很难找到比这个更好的eval资源库了 如果你对eval感兴趣,这些是你应该读的。 感谢 @xdotli 分享
查看原文
查看缓存全文

缓存时间: 2026/06/24 20:29

你很难找到比这个更好的eval资源库了

如果你对eval感兴趣,这些是你应该读的。

感谢 @xdotli 分享

Xiangyi Li (@xdotli): sharing my personal library on evals 1/n

i put together the highest quality blogs, podcasts, papers, and projects on evals. additions are welcome!

It’s hard to find a better eval repository than this one.

If you’re interested in eval, these are what you should read.

Thanks to @xdotli for sharing

Unsloth 团队太恐怖了

他们居然用一种叫 1-bit 压缩的极端技术,把来自中国的顶级开源模型GLM 5.2 用一种叫 1-bit 压缩的极端技术进行了优化,并转换成轻量级的 GGUF 格式。

这意味着你可以完全在本地(Locally)运行GLM5.2(256G内存的Mac Studio),不需要任何互联网连接或外部服务器,而且速度超棒,达到了 21 个 token 每秒(人类说话大概十几token每秒)。

他们还不满足于此,他们还搞了个直播,把这个压缩的本地模型放到对决中,直接面对世界上最强大、最昂贵的付费云服务器 Claude 4.8 Opus 和 GPT-5.5。

让评论区的开发者们最震惊的一点是,这个本地模型竟然能与价值数十亿美元的服务器势均力敌,给出了非常智能且精准的回答,完全能媲美这些闭源巨头。

今天真正的赢家不是某个模型,而是本地运行的概念: 从现在起,你的数据在设备上 100% 安全 你的 API 账单成本为零美元,而且智能水平能与美国最强公司一较高下

多么疯狂但革命性的方法

相似文章

@xdotli: 分享我的个人评估库 1/n

X AI KOLs Timeline

一条推特串,分享了一个精心整理的个人库,包含关于AI评估(evals)的高质量博客、播客、论文和项目,并欢迎补充。

@PierceZhang34: 分享一个专注于 AI 辅助科研的开放共建仓库 Awesome Vibe Research 项目核心目标它收集和沉淀科研全流程(从想法生成到论文发表、传播)中可复用、可验证、可演化的 AI 辅助组件,包括: Agents(智能体) Skil…

X AI KOLs Timeline

分享了一个由 ModelScope 维护的开放共建仓库 Awesome Vibe Research,该仓库收集并沉淀了科研全流程中可复用、可验证、可演化的 AI 辅助组件,包括智能体、技能包、工作流、工具和最佳实践,旨在帮助科研人员和开发者利用 AI 提升研究效率。