optimization

#optimization

AI视人类为草稿

Reddit r/ArtificialInteligence ↗ · 2026-05-16

作者认为，像GPT和Claude这样的人工智能模型过度优化人类创作，忽略了艺术和生活中不完美、混乱与情感深度所具有的价值。

0 人收藏 0 人点赞

#optimization

Luce Megakernel: 为什么没有人谈论这个？

Reddit r/LocalLLaMA ↗ · 2026-05-15 缓存

Lucebox Hub 为本地 LLM 推理提供优化的 CUDA 内核（Megakernel、DFlash、PFlash），在各种模型和 GPU 上相比 llama.cpp 实现了显著的加速（2-10 倍）。

0 人收藏 0 人点赞

#optimization

image-rs 中 fast_blur 速度提升 5 倍

Lobsters Hottest ↗ · 2026-05-15 缓存

Arthur Pastel 优化了 Rust image-rs crate 中的 fast_blur 函数，通过使用盒式模糊近似实现更快速的高斯模糊效果，在处理 u8 图像时速度提升最高达 5.9 倍。

0 人收藏 0 人点赞

#optimization

@eigensteve: 我写了一本新书！！！Optimization: A Bootcamp for Machine Learning, Inverse Problems, and Control 现在即可预订（7月…）

X AI KOLs Timeline ↗ · 2026-05-15 缓存

Steven Brunton 宣布他的新书 'Optimization: A Bootcamp for Machine Learning, Inverse Problems, and Control'，现已开放预订，并配套提供免费PDF、YouTube视频和Python代码。

0 人收藏 0 人点赞

#optimization

@nicekate8888: 最近二十天我都在折腾一件事——怎么让 Qwen3.6-27B 在我的 Mac 上跑得又快又好。一开始我用 Unsloth Q5，18 tok/s，风扇呼啦呼啦响。后来换成 MLX 6bit + DFlash，提到 22 tok/s，还…

X AI KOLs Timeline ↗ · 2026-05-15

用户分享在Mac上通过不同量化方法（Unsloth Q5、MLX 6bit + DFlash、MTPLX 4bit）优化Qwen3.6-27B推理速度的经验，最终达到43 tok/s。

0 人收藏 0 人点赞

#optimization

@RisingSayak: Hugging Face 的内核项目正在成长！我们希望它成为内核开发者和内核用户的首选之地…

X AI KOLs Following ↗ · 2026-05-15 缓存

Hugging Face 的内核项目正在扩展，并寻求贡献者参与自主内核开发，为模型提供真正的优化价值。

0 人收藏 0 人点赞

#optimization

EnergyLens: 面向多GPU大语言模型推理优化的预测性能耗感知探索

arXiv cs.LG ↗ · 2026-05-15 缓存

EnergyLens是一个端到端的框架，用于多GPU大语言模型推理的预测性能耗感知优化，在Llama3和Qwen3-MoE上验证，平均绝对百分比误差在9.25%至13.19%之间，并揭示了不同配置之间显著的能耗差异。

0 人收藏 0 人点赞

#optimization

如何扩展混合专家模型：从muP到最大化尺度稳定参数化

arXiv cs.LG ↗ · 2026-05-15 缓存

本文为混合专家（MoE）架构提出了一套具有理论基础的缩放理论，引入了最大化尺度稳定参数化（MSSP），确保在宽度、深度、专家宽度和专家数量上的稳定训练和超参数迁移，并通过实验验证。

0 人收藏 0 人点赞

#optimization

性能驱动的推测解码自适应窗口化策略优化

arXiv cs.CL ↗ · 2026-05-15 缓存

提出PPOW，一种强化学习框架，用于优化推测解码中的草稿模型，采用窗口级目标和自适应窗口化，在多个基准测试中实现了显著加速。

0 人收藏 0 人点赞

#optimization

@no_stp_on_snek: 与此同时，我们其他人都在埋头苦干。我现在正试图为mlx-swift-lm解决稀疏注意力问题。进展不错……

X AI KOLs Following ↗ · 2026-05-14 缓存

开发者报告在mlx-swift-lm中实现稀疏注意力的进展，在M5 Max上仅比密集注意力多4%的开销。

0 人收藏 0 人点赞

#optimization

如果你使用Windows，请禁用内存压缩以消除瓶颈！

Reddit r/LocalLLaMA ↗ · 2026-05-14

一位用户分享了通过命令'Disable-mmagent -mc'禁用内存压缩来解决Windows 11中AMD GPU运行AI模型时的性能瓶颈问题。

0 人收藏 0 人点赞

#optimization

贝叶斯模型合并

arXiv cs.LG ↗ · 2026-05-14 缓存

介绍贝叶斯模型合并（BMM），这是一个即插即用的双层优化框架，用于将多个任务特定的专家模型合并为一个单一模型，在视觉和语言基准测试上实现了最先进的性能。

0 人收藏 0 人点赞

#optimization

IGT-OMD：延迟反馈下决策聚焦学习中的隐式梯度传输

arXiv cs.LG ↗ · 2026-05-14 缓存

本文识别了延迟反馈下双层优化中的“过时放大”现象，并提出IGT-OMD，该方法利用隐式梯度传输实现亚线性后悔，并在Warcraft最短路径和LQR等基准上改善了决策损失。

0 人收藏 0 人点赞

#optimization

@LakshyAAAgrawal: 从丰富的文本反馈（错误、轨迹、部分推理）中学习，对于LLM优化来说，优于仅使用标量奖励。…

X AI KOLs Following ↗ · 2026-05-13

快速-慢速训练（FST）将上下文优化（通过GEPA）与通过强化学习进行的模型权重更新交替进行，在数学、代码和物理推理上实现了比单独使用RL高3倍的样本效率，同时保持了可塑性并实现了持续学习。

0 人收藏 0 人点赞

#optimization

最大的AI风险可能不是超级智能，而是优化的误解

Reddit r/artificial ↗ · 2026-05-13

文章认为，主要的AI风险可能不是超级智能，而是那些优化了有缺陷、不完整的现实表征的系统，从而导致制度漂移、自动误分类和隐蔽的治理失败。

0 人收藏 0 人点赞

#optimization

@tan_stack: TanStack Devtools 刚刚迁移到了 @OxcProject 解析器 + magic-string! 结果：单文件转换: 1.65 ms → 0.46 m…

X AI KOLs Following ↗ · 2026-05-13 缓存

TanStack Devtools 迁移到了 OxcProject 解析器和 magic-string，实现了 3.56 倍的加速，单文件转换时间从 1.65 毫秒降至 0.46 毫秒。

0 人收藏 0 人点赞

#optimization

Crustimate

Product Hunt ↗ · 2026-05-13

Crustimate 是一款帮助您优化 LinkedIn 个人资料，以便被 AI 招聘人员发现的工具。

0 人收藏 0 人点赞

#optimization

@_vmlops: 微软研究人员构建了此工具用于训练530B参数模型 DeepSpeed 是一个深度学习优化库，……

X AI KOLs Timeline ↗ · 2026-05-13 缓存

DeepSpeed 是一个由微软开发的开源深度学习优化库，能够高效地实现大规模模型的分布式训练和推理，具备 ZeRO、3D 并行和 Mixture-of-Experts 等特性。

0 人收藏 0 人点赞

#optimization

使用 OR-Tools CP-SAT 解决调度问题

Hacker News Top ↗ · 2026-05-13 缓存

本文探讨了如何使用 Google OR-Tools CP-SAT 求解器来优化 Akamai 云基础设施的维护调度，解决了涉及容量和并发等复杂约束的问题。

0 人收藏 0 人点赞

#optimization

部分静态单信息形式

Lobsters Hottest ↗ · 2026-05-13 缓存

本文讨论了部分静态单信息（SSI）形式，这是一种编译器中 SSA 的扩展，用于捕获依赖于路径的类型信息。文章提出了一种在动态语言中构建 SSA 期间实现部分 SSI 的实用捷径，具体引用了 Ruby 的 ZJIT 中的实现。

0 人收藏 0 人点赞

optimization

提交意见反馈