@MaxForAI: 你很难找到比这个更好的eval资源库了 如果你对eval感兴趣,这些是你应该读的。 感谢 @xdotli 分享
摘要
分享一个精选的AI评估(evals)资源库,包含高质量博客、播客、论文和项目,由Xiangyi Li整理。
查看缓存全文
缓存时间: 2026/06/24 20:29
你很难找到比这个更好的eval资源库了
如果你对eval感兴趣,这些是你应该读的。
感谢 @xdotli 分享
Xiangyi Li (@xdotli): sharing my personal library on evals 1/n
i put together the highest quality blogs, podcasts, papers, and projects on evals. additions are welcome!
It’s hard to find a better eval repository than this one.
If you’re interested in eval, these are what you should read.
Thanks to @xdotli for sharing
Unsloth 团队太恐怖了
他们居然用一种叫 1-bit 压缩的极端技术,把来自中国的顶级开源模型GLM 5.2 用一种叫 1-bit 压缩的极端技术进行了优化,并转换成轻量级的 GGUF 格式。
这意味着你可以完全在本地(Locally)运行GLM5.2(256G内存的Mac Studio),不需要任何互联网连接或外部服务器,而且速度超棒,达到了 21 个 token 每秒(人类说话大概十几token每秒)。
他们还不满足于此,他们还搞了个直播,把这个压缩的本地模型放到对决中,直接面对世界上最强大、最昂贵的付费云服务器 Claude 4.8 Opus 和 GPT-5.5。
让评论区的开发者们最震惊的一点是,这个本地模型竟然能与价值数十亿美元的服务器势均力敌,给出了非常智能且精准的回答,完全能媲美这些闭源巨头。
今天真正的赢家不是某个模型,而是本地运行的概念: 从现在起,你的数据在设备上 100% 安全 你的 API 账单成本为零美元,而且智能水平能与美国最强公司一较高下
多么疯狂但革命性的方法
相似文章
@xdotli: 分享我的个人评估库 1/n
一条推特串,分享了一个精心整理的个人库,包含关于AI评估(evals)的高质量博客、播客、论文和项目,并欢迎补充。
@pauliusztin_:每天都有100+人问我“怎么学AI评估?”我每次都把11个链接直接粘贴:1. AI评估与可观测(系列)
一份每日被反复转发的11个精选链接,帮你掌握AI评估技术,涵盖评估方法、可观测性、LLM-as-judge与智能体评估。
@10xmylife: 分享10个设计参考网站,可以直接让AI参考,拯救你的AI审美
分享10个设计参考网站,旨在帮助AI提升审美能力,适用于AI生成内容时参考。
@jinchenma_ai: 全网最强 AI 优质信源汇总,赶紧收藏! 可以把这篇文章,丢给 Codex + Obsidian 让 AI 编译一个索引目录, 后续想让 ai 搜索优质信息,让他去根据这个目录去对应着搜就可以了。
推荐一篇全网最强AI优质信源汇总文章,并建议使用Codex和Obsidian编译索引目录以便后续AI搜索优质信息。
@PierceZhang34: 分享一个专注于 AI 辅助科研的开放共建仓库 Awesome Vibe Research 项目核心目标它收集和沉淀科研全流程(从想法生成到论文发表、传播)中可复用、可验证、可演化的 AI 辅助组件,包括: Agents(智能体) Skil…
分享了一个由 ModelScope 维护的开放共建仓库 Awesome Vibe Research,该仓库收集并沉淀了科研全流程中可复用、可验证、可演化的 AI 辅助组件,包括智能体、技能包、工作流、工具和最佳实践,旨在帮助科研人员和开发者利用 AI 提升研究效率。