@vikingmute: 这是哪个神仙做的这个网站?https://sophon.at 收集和展示和AI 相关的所有信息和内容, 论文/最新模型/Benchmark/排行榜 论文还能直接在线看,非常非常全 还有 feed ,可以直接订阅了解最新的消息。 还有这个 …
摘要
本文推荐了一个名为 Sophon 的网站,它聚合了 AI 领域的论文、模型、基准测试、排行榜和强化学习环境等信息,提供实时排行榜、对比和订阅功能,被誉为 AI 研究的 Bloomberg 终端。
查看缓存全文
缓存时间: 2026/06/05 07:08
这是哪个神仙做的这个网站?https://t.co/qM6FJuo28V 收集和展示和AI 相关的所有信息和内容, 论文/最新模型/Benchmark/排行榜 论文还能直接在线看,非常非常全
还有 feed ,可以直接订阅了解最新的消息。
还有这个 Sophon 这个词居然是三体里面智子的意思。 https://t.co/pUP4Ig4s9L
Sophon - AI evals, model leaderboards & RL environments
Source: https://sophon.at/homepage
Sophon
The Bloomberg terminal for AI research
Every model, benchmark, leaderboard, RL environment and paper on one screen, with the signals that show what is rising and what moves a score.
Open the terminalBrowse the feed
906models
599benchmarks
1.8kRL envs
27leaderboards
39kpapers
373labs
1Claude Opus 4.8 2GPT-5.2 3Gemini 3 Ultra 4Llama 4 405B ### Live standings Every leaderboard, ranked in real time.Opus GPT-5 Gem 3 MMLU 92 90 88 GSM8K 95 96 94 SWE 71 65 68 ### Head to head Models side by side as a benchmark matrix.reasoningmathcodeagents verifiers-mathlifts7 swe-gymlifts5 ### What lifts a score Envs and datasets ranked by the benchmarks they move.AllRL envsFrontier+ modelGemini 3 Ultra$5/M2h evalAIME 2025top 78%5h toolterminal-bench-rllifts 41d paperScaling RL envs2.3k★1d ### What just shipped One typed stream. Save the filters you live in as views.swe⌘K SWE-bench Verified Claude Opus 4.8 prime-intellect / math Arena Elo ### Find anything ⌘K across models, evals, tools, papers and labs.1M Context $5/M Price T·I·A Modality MMLU GPQA ### Spec sheets Context, price, modality and full benchmark coverage.Scaling RL environments Self-rewarding LMs Process reward models ### Your watchlist Star papers, models and evals to track. Browser-local, no account.trained with averifiable reward signalacross envs ### Highlight the source Mark up a paper’s PDF in four colors. Pin a note to any passage.Notes Reproduces the SWE-bench claim. Compare reward shaping against v2. Only stored in your browser. ### Private notes Jot a thought on any paper. Stored only in your browser.
Plugged into the RL-env ecosystem
Links-first, no lock-in.298 env-to-benchmark lift links.
Harbor
Laude
Prime Intellect
1.3k envs
OpenReward
352 envs
Atropos
111 envs
OpenEnv
34 envs
Open the terminal
相似文章
@VincentLogic: 发现个 AI 圈高质量信息源神器! follow-builders,这个开源项目能帮你每天蹲守全网一线 AI 大佬的动态,自动整理成摘要推给你。 作者张子雅(哈佛文科背景转型 AI)搞的,理念贼正——"关注建设者,而非网红"。 不追那些只…
介绍了一个名为 follow-builders 的开源项目,用于自动追踪 AI 领域建设者的动态并生成摘要推送,旨在帮助用户获取高质量信息。
@XAMTO_AI: 兄弟姐妹们,别再说信息差难找了! 这个神器,一次扫10个平台,把全网过去30天在聊什么、押注什么,直接浓缩成一份报告! last30days-skill 冲上GitHub Trending第一! 一周狂飙7000+星,总星1.3万! 不是…
一个AI代理驱动的搜索引擎,聚合Reddit、X、YouTube等平台的最新内容,自动生成交叉验证报告,冲上GitHub Trending第一。
@seclink: AI 网站设计 & 创作者 SaaS 平台 — 信息差分析 一、最核心的信息差:中国几乎无人讨论的"新物种" 1. http://Bolt.new — 浏览器内全栈开发,无需本地环境 StackBlitz 做了一件很激进的事:用 WebC…
Bolt.new 是一个浏览器内全栈AI开发工具,允许用户通过聊天创建网站和应用,支持设计系统集成和云端部署。
@grgerwcwetwet: 推荐一个开源项目 Horizon,一个专门盯海外科技圈的 AI 信息雷达。 它会自动聚合 Hacker News、Twitter、Reddit、GitHub 等平台内容,再用 AI 做筛选、去重和总结,把真正有价值的信息整理成日报。 比较…
推荐开源项目 Horizon,这是一个AI驱动的海外科技新闻雷达,自动聚合Hacker News、Twitter、Reddit、GitHub等平台内容,进行筛选、去重和总结,生成中英双语日报,并支持推送到飞书、邮箱、微信等渠道。
@gkxspace: 发现一个很疯狂的开源工具,你输一句话描述你要什么数据,它派出一群 AI Agent 并行跑到各个网站上调研,几分钟后汇总成一张结构化表格给你 其实数据都摆在网上,但想变成一张能用的表格,历来都是苦力活,过去这是一个工程项目: 拼搜索、写爬…
BigSet 是一个开源工具,输入一句话描述所需数据,它会派出多个 AI Agent 并行在网络上调研,自动推断 schema、去重、验证并生成结构化表格,支持定时刷新。