performance-optimization

标签

Cards List
#performance-optimization

在Ryzen AI 7 350 NPU上达到峰值TOPS性能

Lobsters Hottest · 昨天 缓存

关于在AMD Ryzen AI 7 350 NPU上实现峰值TOPS性能的技术深度剖析,与Xilinx AIE-ML v2 AI引擎进行比较,并解释用于矩阵乘法工作负载的硬件架构。

0 人收藏 0 人点赞
#performance-optimization

从本地存储引擎中移除 fsync

Hacker News Top · 3天前 缓存

FractalBits 推出了一种专为单节点设计的 KV 存储引擎,通过在硬件层级直接管理数据持久性来消除 fsync 调用,从而在 NVMe SSD 上实现显著提升的写入吞吐量。

0 人收藏 0 人点赞
#performance-optimization

AI推理遵循着截然不同的规则(9分钟阅读)

TLDR AI · 3天前 缓存

文章指出AI推理对云数据基础设施提出了独特挑战,其需求更接近高并发OLTP系统,而非传统面向人类速度的应用。文章强调需要优化存储和数据访问层,以应对自主智能体驱动的"AI数据海啸"。

0 人收藏 0 人点赞
#performance-optimization

近似双曲正切函数

Hacker News Top · 2026-04-22 缓存

本文梳理了多种快速双曲正切近似方法——泰勒展开、Padé 逼近、样条曲线及位级技巧,面向神经网络与实时音频场景。

0 人收藏 0 人点赞
#performance-optimization

Elixir 应用优化之旅

Lobsters Hottest · 2026-04-20 缓存

一位开发者分享了优化 Elixir 应用的经验与教训,重点介绍了针对 Postgres 连接池工具 Ultravisor 的性能改进。文章涵盖了使用火焰图、调用追踪等性能分析技术,以及 eFlambè 和 tprof 等工具。

0 人收藏 0 人点赞
#performance-optimization

弱链优化:多智能体推理与协作框架

arXiv cs.CL · 2026-04-20 缓存

本论文提出WORC框架,这是一个针对多智能体LLM系统的弱链优化框架,通过基于元学习的权重预测和不确定性驱动的资源分配来识别并强化表现不佳的智能体,在推理基准上达到82.2%的准确率,同时提升了系统稳定性。

0 人收藏 0 人点赞
#performance-optimization

ARM处理器上匹配字符的最快方法?

Lobsters Hottest · 2026-04-19 缓存

本文探讨了在ARM处理器上使用SIMD指令进行字符匹配的最快方法,比较了传统的NEON方法与现代ARM芯片(如AWS Graviton4、Google Axion等)上可用的较新SVE2能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈