optimization

标签

Cards List
#optimization

AI视人类为草稿

Reddit r/ArtificialInteligence · 2026-05-16

作者认为,像GPT和Claude这样的人工智能模型过度优化人类创作,忽略了艺术和生活中不完美、混乱与情感深度所具有的价值。

0 人收藏 0 人点赞
#optimization

Luce Megakernel: 为什么没有人谈论这个?

Reddit r/LocalLLaMA · 2026-05-15 缓存

Lucebox Hub 为本地 LLM 推理提供优化的 CUDA 内核(Megakernel、DFlash、PFlash),在各种模型和 GPU 上相比 llama.cpp 实现了显著的加速(2-10 倍)。

0 人收藏 0 人点赞
#optimization

image-rs 中 fast_blur 速度提升 5 倍

Lobsters Hottest · 2026-05-15 缓存

Arthur Pastel 优化了 Rust image-rs crate 中的 fast_blur 函数,通过使用盒式模糊近似实现更快速的高斯模糊效果,在处理 u8 图像时速度提升最高达 5.9 倍。

0 人收藏 0 人点赞
#optimization

@eigensteve: 我写了一本新书!!!Optimization: A Bootcamp for Machine Learning, Inverse Problems, and Control 现在即可预订(7月…)

X AI KOLs Timeline · 2026-05-15 缓存

Steven Brunton 宣布他的新书 'Optimization: A Bootcamp for Machine Learning, Inverse Problems, and Control',现已开放预订,并配套提供免费PDF、YouTube视频和Python代码。

0 人收藏 0 人点赞
#optimization

@nicekate8888: 最近二十天我都在折腾一件事——怎么让 Qwen3.6-27B 在我的 Mac 上跑得又快又好。 一开始我用 Unsloth Q5,18 tok/s,风扇呼啦呼啦响。 后来换成 MLX 6bit + DFlash,提到 22 tok/s,还…

X AI KOLs Timeline · 2026-05-15

用户分享在Mac上通过不同量化方法(Unsloth Q5、MLX 6bit + DFlash、MTPLX 4bit)优化Qwen3.6-27B推理速度的经验,最终达到43 tok/s。

0 人收藏 0 人点赞
#optimization

@RisingSayak: Hugging Face 的内核项目正在成长!我们希望它成为内核开发者和内核用户的首选之地…

X AI KOLs Following · 2026-05-15 缓存

Hugging Face 的内核项目正在扩展,并寻求贡献者参与自主内核开发,为模型提供真正的优化价值。

0 人收藏 0 人点赞
#optimization

EnergyLens: 面向多GPU大语言模型推理优化的预测性能耗感知探索

arXiv cs.LG · 2026-05-15 缓存

EnergyLens是一个端到端的框架,用于多GPU大语言模型推理的预测性能耗感知优化,在Llama3和Qwen3-MoE上验证,平均绝对百分比误差在9.25%至13.19%之间,并揭示了不同配置之间显著的能耗差异。

0 人收藏 0 人点赞
#optimization

如何扩展混合专家模型:从muP到最大化尺度稳定参数化

arXiv cs.LG · 2026-05-15 缓存

本文为混合专家(MoE)架构提出了一套具有理论基础的缩放理论,引入了最大化尺度稳定参数化(MSSP),确保在宽度、深度、专家宽度和专家数量上的稳定训练和超参数迁移,并通过实验验证。

0 人收藏 0 人点赞
#optimization

性能驱动的推测解码自适应窗口化策略优化

arXiv cs.CL · 2026-05-15 缓存

提出PPOW,一种强化学习框架,用于优化推测解码中的草稿模型,采用窗口级目标和自适应窗口化,在多个基准测试中实现了显著加速。

0 人收藏 0 人点赞
#optimization

@no_stp_on_snek: 与此同时,我们其他人都在埋头苦干。我现在正试图为mlx-swift-lm解决稀疏注意力问题。进展不错……

X AI KOLs Following · 2026-05-14 缓存

开发者报告在mlx-swift-lm中实现稀疏注意力的进展,在M5 Max上仅比密集注意力多4%的开销。

0 人收藏 0 人点赞
#optimization

如果你使用Windows,请禁用内存压缩以消除瓶颈!

Reddit r/LocalLLaMA · 2026-05-14

一位用户分享了通过命令'Disable-mmagent -mc'禁用内存压缩来解决Windows 11中AMD GPU运行AI模型时的性能瓶颈问题。

0 人收藏 0 人点赞
#optimization

贝叶斯模型合并

arXiv cs.LG · 2026-05-14 缓存

介绍贝叶斯模型合并(BMM),这是一个即插即用的双层优化框架,用于将多个任务特定的专家模型合并为一个单一模型,在视觉和语言基准测试上实现了最先进的性能。

0 人收藏 0 人点赞
#optimization

IGT-OMD:延迟反馈下决策聚焦学习中的隐式梯度传输

arXiv cs.LG · 2026-05-14 缓存

本文识别了延迟反馈下双层优化中的“过时放大”现象,并提出IGT-OMD,该方法利用隐式梯度传输实现亚线性后悔,并在Warcraft最短路径和LQR等基准上改善了决策损失。

0 人收藏 0 人点赞
#optimization

@LakshyAAAgrawal: 从丰富的文本反馈(错误、轨迹、部分推理)中学习,对于LLM优化来说,优于仅使用标量奖励。…

X AI KOLs Following · 2026-05-13

快速-慢速训练(FST)将上下文优化(通过GEPA)与通过强化学习进行的模型权重更新交替进行,在数学、代码和物理推理上实现了比单独使用RL高3倍的样本效率,同时保持了可塑性并实现了持续学习。

0 人收藏 0 人点赞
#optimization

最大的AI风险可能不是超级智能,而是优化的误解

Reddit r/artificial · 2026-05-13

文章认为,主要的AI风险可能不是超级智能,而是那些优化了有缺陷、不完整的现实表征的系统,从而导致制度漂移、自动误分类和隐蔽的治理失败。

0 人收藏 0 人点赞
#optimization

@tan_stack: TanStack Devtools 刚刚迁移到了 @OxcProject 解析器 + magic-string! 结果:单文件转换: 1.65 ms → 0.46 m…

X AI KOLs Following · 2026-05-13 缓存

TanStack Devtools 迁移到了 OxcProject 解析器和 magic-string,实现了 3.56 倍的加速,单文件转换时间从 1.65 毫秒降至 0.46 毫秒。

0 人收藏 0 人点赞
#optimization

Crustimate

Product Hunt · 2026-05-13

Crustimate 是一款帮助您优化 LinkedIn 个人资料,以便被 AI 招聘人员发现的工具。

0 人收藏 0 人点赞
#optimization

@_vmlops: 微软研究人员构建了此工具用于训练530B参数模型 DeepSpeed 是一个深度学习优化库,……

X AI KOLs Timeline · 2026-05-13 缓存

DeepSpeed 是一个由微软开发的开源深度学习优化库,能够高效地实现大规模模型的分布式训练和推理,具备 ZeRO、3D 并行和 Mixture-of-Experts 等特性。

0 人收藏 0 人点赞
#optimization

使用 OR-Tools CP-SAT 解决调度问题

Hacker News Top · 2026-05-13 缓存

本文探讨了如何使用 Google OR-Tools CP-SAT 求解器来优化 Akamai 云基础设施的维护调度,解决了涉及容量和并发等复杂约束的问题。

0 人收藏 0 人点赞
#optimization

部分静态单信息形式

Lobsters Hottest · 2026-05-13 缓存

本文讨论了部分静态单信息(SSI)形式,这是一种编译器中 SSA 的扩展,用于捕获依赖于路径的类型信息。文章提出了一种在动态语言中构建 SSA 期间实现部分 SSI 的实用捷径,具体引用了 Ruby 的 ZJIT 中的实现。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈