performance

#performance

@SpaceTimeViking: 宣布 Orinth 1.0 AEON ULTIMATE UNCENSORED！BF16 和 NVFP4 量化版，适用于 DGX Spark / Blackwell 架构。保留…

X AI KOLs Timeline ↗ · 6小时前缓存

宣布 Orinth 1.0 AEON ULTIMATE UNCENSORED，这是一个采用 BF16 和 NVFP4 量化的模型，适用于 DGX Spark/Blackwell 架构，声称在启用 DFlash 的情况下性能提升 200-300%。

0 人收藏 0 人点赞

#performance

@VraserX: GPT-5.6 Sol 听起来简直疯狂。成本仅为 Fable 的 25%。每秒 750 个 token。甚至比 Mythos 更智能……

X AI KOLs Timeline ↗ · 7小时前缓存

据称 GPT-5.6 Sol 速度极快（750 t/s），成本效益高（仅为 Fable 成本的 25%），同时性能超越 Mythos，可能重置市场格局。

0 人收藏 0 人点赞

#performance

@ItsmeAjayKV：快速更新：我在3090上试用了Ornith-1.0-35B-Q5_K_M，感受复杂。好的方面：速度确实很快。我测…

X AI KOLs Following ↗ · 9小时前缓存

用户在一张RTX 3090上测试了Ornith-1.0-35B，发现其推理速度较快（提示处理1560 tok/s，生成约78 tok/s），但在Three.js任务上的编码表现始终不如Qwen 3.6，即使多次尝试也是如此。

0 人收藏 0 人点赞

#performance

让CPU非常愤怒的数据访问模式

Lobsters Hottest ↗ · 13小时前缓存

文章探讨了如何通过利用CPU缓存行为来构造尽可能慢的数据访问模式以对整数数组求和，并证明精心设计的模式可能比随机访问慢30%以上。

0 人收藏 0 人点赞

#performance

@MiaAI_lab: 在您的@NVIDIAAI DGX Spark上可以运行的最佳模型是什么？1× DGX Spark * ⁠Qwen 3.6 35b NVFP4 - 256k ctx, 110 tok/s…

X AI KOLs Timeline ↗ · 14小时前缓存

一条推文详细介绍了在Nvidia DGX Spark上可以运行的最佳AI模型，包括Qwen 3.6和DeepSeek v4 Flash变体，以及单机和多机设置下的token速度和上下文长度。

0 人收藏 0 人点赞

#performance

分片你的锁：对6种Go缓存设计进行基准测试

Lobsters Hottest ↗ · 15小时前缓存

本文在不同工作负载下对六种Go内存缓存设计进行了基准测试，发现使用256个锁的分片映射在单互斥锁和读写锁方法中表现最佳，尤其是在多核系统上。

0 人收藏 0 人点赞

#performance

又一次大型张量修复 b9820

Reddit r/LocalLLaMA ↗ · 23小时前

通过在 ggml 后端中减少分割计算期间的同步来提升性能，新增异步 CUDA 复制功能，并让同步放宽机制在多个后端中更通用。

0 人收藏 0 人点赞

#performance

@no_stp_on_snek: TurboQuant+ 更新。4.25→4.125 bpw，解码更快，KLD 降低，崩溃修复。需要测试者：最后阶段一直埋头…

X AI KOLs Following ↗ · 昨天缓存

TurboQuant+ 更新带来更低比特率（4.125 bpw）、更快的解码速度以及减少约 34-35% 的 KLD。开发者正在各种硬件后端上寻找测试者。

0 人收藏 0 人点赞

#performance

介绍 Flink 原生 S3 文件系统：专为性能打造，为生产环境设计

Lobsters Hottest ↗ · 昨天缓存

Apache Flink 2.3 引入了 flink-s3-fs-native，这是一个新的无 Hadoop 依赖的 S3 文件系统插件，它提供最高两倍速度的检查点、精确一次写入的 Sink，并消除了 Hadoop 依赖和 CVE 分类处理。它已在多家大公司的生产环境中使用。

0 人收藏 0 人点赞

#performance

让devenv启动变快，以及整个nixpkgs也随之加速 - devenv

Lobsters Hottest ↗ · 昨天缓存

这篇博文解释了Nix中动态链接器搜索共享库导致devenv和其他Nix工具启动性能问题的原因，并探讨了包括静态链接在内的潜在解决方案。

0 人收藏 0 人点赞

#performance

@OpenAI: GPT-5.6 Sol 是目前我们为网络安全打造的最强大模型。它重新定义了长周期安全任务的性能-效率边界……

X AI KOLs ↗ · 昨天缓存

OpenAI 宣布推出 GPT-5.6 Sol，这是一款专注于网络安全的模型，在漏洞研究与利用等长周期安全任务上提升了性能与效率。

0 人收藏 0 人点赞

#performance

@Voxyz_ai: 别再告诉Claude Code/Codex“读取这个文件”。别再告诉Claude Code/Codex“现在再读那个”。别再告诉C…

X AI KOLs Timeline ↗ · 昨天缓存

推荐'codebase-memory'，该工具能在3分钟内将整个代码库（如Linux内核）索引为图结构，供AI代理使用，减少token消耗和工具调用次数，同时提升答案质量。

0 人收藏 0 人点赞

#performance

PgBouncer 工作原理

Lobsters Hottest ↗ · 昨天缓存

一份详细的技术指南，解释 PgBouncer 作为 PostgreSQL 连接池的工作原理，涵盖其连接池模式、生产部署及常见陷阱。

0 人收藏 0 人点赞

#performance

@victormustar: 移动端300 tok/s太疯狂了... 开源必须赢

X AI KOLs Following ↗ · 昨天缓存

开源AI推理在移动端达到300 tok/s，借助WebGPU框架，Liquid AI的LFM2.5 230M模型在浏览器中达到1,400 tok/s。

0 人收藏 0 人点赞

#performance

@BunnyxStudio: 花了 3 周时间告别 SwiftData，现在 Hive 的启动速度有了显著的提升，66000张图片的资料库基本无需等待即刻使用。减少冷启动的时间对于体验来说真的很重要。

X AI KOLs Following ↗ · 2天前缓存

BunnyxStudio 花费3周时间移除了SwiftData，使得Hive应用启动速度显著提升，66000张图片的资料库几乎无需等待即可使用。

0 人收藏 0 人点赞

#performance

对于双GPU，在PCIe 5.0 x8/x4与x8/x8模式下运行时，推理速度会有很大影响吗？

Reddit r/LocalLLaMA ↗ · 2天前

一位用户询问在PCIe 5.0 x8/x4与x8/x8模式下运行双GPU是否会对LLM推理速度产生显著影响。

0 人收藏 0 人点赞

#performance

消费级硬件上的 GLM 5.2

Reddit r/LocalLLaMA ↗ · 2天前

一位用户在配备双 RTX 5090 的高端类消费级系统上测试了 unsloth 量化版 GLM-5.2 模型，达到了每秒 12 个 token。

0 人收藏 0 人点赞

#performance

我们如何通过将稳定上下文移出提示词来使AI代理更快

Reddit r/AI_Agents ↗ · 2天前

描述了一种通过将稳定上下文移出提示词来提高AI代理速度的技术，从而减少令牌使用量和延迟。

0 人收藏 0 人点赞

#performance

自由线程Python：过去、现在与未来

Lobsters Hottest ↗ · 3天前缓存

Thomas Wouters 在 PyCon US 2026 上发表了关于自由线程 Python 的过去、现在与未来的演讲，该 Python 版本移除了全局解释器锁 (GIL)，允许并行线程执行。

0 人收藏 0 人点赞

#performance

@rohanpaul_ai: GLM-5.2在ARC-AGI-2上获得22.8%，每任务$0.25。值得注意的是，2025年5月左右，经过验证的最佳模型在ARC-AGI-2上只有…

X AI KOLs Timeline ↗ · 3天前缓存

GLM-5.2在ARC-AGI-2上取得22.8%的成绩，在ARC-AGI-1上取得77%的成绩，每任务成本仅0.25美元，比2025年5月的最佳前沿得分提高了7.6倍。

0 人收藏 0 人点赞

performance

提交意见反馈