@vikingmute: 这是哪个神仙做的这个网站?https://sophon.at 收集和展示和AI 相关的所有信息和内容, 论文/最新模型/Benchmark/排行榜 论文还能直接在线看,非常非常全 还有 feed ,可以直接订阅了解最新的消息。 还有这个 …

X AI KOLs Timeline 工具

摘要

本文推荐了一个名为 Sophon 的网站,它聚合了 AI 领域的论文、模型、基准测试、排行榜和强化学习环境等信息,提供实时排行榜、对比和订阅功能,被誉为 AI 研究的 Bloomberg 终端。

这是哪个神仙做的这个网站?https://t.co/qM6FJuo28V 收集和展示和AI 相关的所有信息和内容, 论文/最新模型/Benchmark/排行榜 论文还能直接在线看,非常非常全 还有 feed ,可以直接订阅了解最新的消息。 还有这个 Sophon 这个词居然是三体里面智子的意思。 https://t.co/pUP4Ig4s9L
查看原文
查看缓存全文

缓存时间: 2026/06/05 07:08

这是哪个神仙做的这个网站?https://t.co/qM6FJuo28V 收集和展示和AI 相关的所有信息和内容, 论文/最新模型/Benchmark/排行榜 论文还能直接在线看,非常非常全

还有 feed ,可以直接订阅了解最新的消息。

还有这个 Sophon 这个词居然是三体里面智子的意思。 https://t.co/pUP4Ig4s9L


Sophon - AI evals, model leaderboards & RL environments

Source: https://sophon.at/homepage Sophon

The Bloomberg terminal for AI research

Every model, benchmark, leaderboard, RL environment and paper on one screen, with the signals that show what is rising and what moves a score.

Open the terminalBrowse the feed

906models

599benchmarks

1.8kRL envs

27leaderboards

39kpapers

373labs

1Claude Opus 4.8 2GPT-5.2 3Gemini 3 Ultra 4Llama 4 405B ### Live standings Every leaderboard, ranked in real time.Opus GPT-5 Gem 3 MMLU 92 90 88 GSM8K 95 96 94 SWE 71 65 68 ### Head to head Models side by side as a benchmark matrix.reasoningmathcodeagents verifiers-mathlifts7 swe-gymlifts5 ### What lifts a score Envs and datasets ranked by the benchmarks they move.AllRL envsFrontier+ modelGemini 3 Ultra$5/M2h evalAIME 2025top 78%5h toolterminal-bench-rllifts 41d paperScaling RL envs2.3k★1d ### What just shipped One typed stream. Save the filters you live in as views.swe⌘K SWE-bench Verified Claude Opus 4.8 prime-intellect / math Arena Elo ### Find anything ⌘K across models, evals, tools, papers and labs.1M Context $5/M Price T·I·A Modality MMLU GPQA ### Spec sheets Context, price, modality and full benchmark coverage.Scaling RL environments Self-rewarding LMs Process reward models ### Your watchlist Star papers, models and evals to track. Browser-local, no account.trained with averifiable reward signalacross envs ### Highlight the source Mark up a paper’s PDF in four colors. Pin a note to any passage.Notes Reproduces the SWE-bench claim. Compare reward shaping against v2. Only stored in your browser. ### Private notes Jot a thought on any paper. Stored only in your browser.

Plugged into the RL-env ecosystem

Browse all

Links-first, no lock-in.298 env-to-benchmark lift links.

Harbor

Laude

Prime Intellect

1.3k envs

OpenReward

352 envs

Atropos

111 envs

OpenEnv

34 envs

Open the terminal

Enter Sophon

相似文章

@VincentLogic: 发现个 AI 圈高质量信息源神器! follow-builders,这个开源项目能帮你每天蹲守全网一线 AI 大佬的动态,自动整理成摘要推给你。 作者张子雅(哈佛文科背景转型 AI)搞的,理念贼正——"关注建设者,而非网红"。 不追那些只…

X AI KOLs Timeline

介绍了一个名为 follow-builders 的开源项目,用于自动追踪 AI 领域建设者的动态并生成摘要推送,旨在帮助用户获取高质量信息。

@grgerwcwetwet: 推荐一个开源项目 Horizon,一个专门盯海外科技圈的 AI 信息雷达。 它会自动聚合 Hacker News、Twitter、Reddit、GitHub 等平台内容,再用 AI 做筛选、去重和总结,把真正有价值的信息整理成日报。 比较…

X AI KOLs Timeline

推荐开源项目 Horizon,这是一个AI驱动的海外科技新闻雷达,自动聚合Hacker News、Twitter、Reddit、GitHub等平台内容,进行筛选、去重和总结,生成中英双语日报,并支持推送到飞书、邮箱、微信等渠道。

@gkxspace: 发现一个很疯狂的开源工具,你输一句话描述你要什么数据,它派出一群 AI Agent 并行跑到各个网站上调研,几分钟后汇总成一张结构化表格给你 其实数据都摆在网上,但想变成一张能用的表格,历来都是苦力活,过去这是一个工程项目: 拼搜索、写爬…

X AI KOLs Timeline

BigSet 是一个开源工具,输入一句话描述所需数据,它会派出多个 AI Agent 并行在网络上调研,自动推断 schema、去重、验证并生成结构化表格,支持定时刷新。