@no_stp_on_snek: http://LocalMaxxing.com 众多提交中的第一个。
摘要
LocalMaxxing 是一个提供本地 LLM 推理社区基准测试的网站,让用户能够追踪速度并比较硬件性能。
查看缓存全文
缓存时间: 2026/07/02 06:19
https://t.co/jaHceErsAQ 众多提交中的第一个。 https://t.co/VnmiKj5XYu
Localmaxxing - 本地大语言模型推理基准测试
来源:https://localmaxxing.com/en 社区驱动的本地大语言模型推理性能基准。追踪速度、对比硬件、找到你的最佳配置。
相似文章
@LottoLabs: https://x.com/LottoLabs/status/2064185127782232135
LocalMaxxing 是一个社区基准测试平台,用于本地 LLM 推理,帮助用户比较硬件、速度和配置。LottoLabs 团队阐述了他们的愿景,即通过更好的基准测试、评估和可访问的部署,使本地推理基础设施变得普遍。
@no_stp_on_snek: 进行中
推广 Atlas Inference,这是一个开源推理服务工具,在 Qwen3.6-35B-A3B 基准测试上实现了 200+ tok/s 的性能。
本地模型优化(3 分钟阅读)
本文分析了在 MacBook Pro 上本地运行 AI 推理的可行性,对比了本地 Qwen 35B 模型与云端 Claude Opus 4.5。结论是,对于常规任务,本地模型速度快 2 倍,尽管在能力上略有差距,但仍是日常工作量中一半任务的实用选择。
@TheAhmadOsman: 实用技巧 本地运行LLM?给它们网络访问权限 我的配置: - SearXNG:候选源发现 - Firecrawl:已知-…
一条推文技巧,介绍如何通过 SearXNG 进行搜索、Firecrawl 进行抓取、Camofox 作为浏览器回退,采用“搜索-提取-交互”工作流,为本地 LLM 赋予网络访问能力,使其变得更加实用。
Show HN: 根据基准测试排名,为你的硬件找到最佳本地LLM
whichllm 是一个开源Python工具,它自动检测你的GPU/CPU/RAM,并从HuggingFace中排名最适合你系统的本地LLM,使用真实基准测试而非大小启发式方法。