precision

#precision

@elonmusk: 飞船着陆非常精准，意味着它本可以被塔臂接住

X AI KOLs Following ↗ · 11小时前

埃隆·马斯克表示，飞船着陆非常精准，本可以被塔臂接住。

0 人收藏 0 人点赞

#precision

你那台80美元的Tesla P100多年来一直在llama.cpp中默默地做有噪声的数学计算。三行代码修复它，免费。

Reddit r/LocalLLaMA ↗ · 2026-07-12

一个三行修复程序修正了llama.cpp中针对Nvidia P100 GPU (sm_60)的CUDA代码的精度错误，显著提高了输出质量且不影响性能。该补丁将现有的豁免扩展到P100，该GPU拥有快速的fp16硬件，却错误地使用了较低的精度。

0 人收藏 0 人点赞

#precision

@ando_w: 今天面试了个候选人，简历写"精通 RAG"。我问召回率多少，他说"挺好的"。我问怎么评估的，他说"问了几句感觉不错"。这就是行业现状：90% 的 RAG 项目没有评估集，全靠手感。能说出 Recall 和 Precision 的，已经…

X AI KOLs Timeline ↗ · 2026-07-08 缓存

一位面试官吐槽自称“精通RAG”的候选人无法说出召回率和精确度，指出行业中90%的RAG项目缺乏规范的评估集，全靠主观判断。

0 人收藏 0 人点赞

#precision

@svpino：AI生成3D场景很酷，但基本上只是个噱头，很难用于任何严肃的事情。如果我们……

X AI KOLs Following ↗ · 2026-07-07 缓存

一条推文批评AI生成的3D场景不过是噱头，并推荐TopviewAI的3D Shot Composer工具，以实现更精确的场景指导和控制。

0 人收藏 0 人点赞

#precision

@ArkadiiBessonov: LLM预训练中使用FP8的三种主要方法——区别主要在于scale的附加方式。per-tens…

X AI KOLs Timeline ↗ · 2026-06-27 缓存

解释了LLM预训练中FP8缩放的三种主要方法——per-tensor、blockwise和MXFP8——重点关注scale的附加方式，并根据scale必须在matmul的收缩维度上保持恒定这一约束，推导出tile几何形状。

0 人收藏 0 人点赞

#precision

本田新型机械手精度极高，能拧动微小螺丝

Reddit r/singularity ↗ · 2026-06-24

本田开发出一款精密机械手，能拧动微小螺丝，展示了适用于制造领域的先进灵巧性。

0 人收藏 0 人点赞

#precision

涨价效应很疯狂..

Reddit r/LocalLLaMA ↗ · 2026-06-18

有帖子暗示一款名为Q.01的模型即将发布，提到了涨价效应，并表示不再需要高精度。

0 人收藏 0 人点赞

#precision

字节级模型

Reddit r/LocalLLaMA ↗ · 2026-06-15

讨论了字节级分词器是否在精确任务（如区分相似名称、计数字符和大小写敏感）上优于子词分词器，并询问当前推荐。

0 人收藏 0 人点赞

#precision

中间浮点精度

Lobsters Hottest ↗ · 2026-06-14 缓存

本文探讨了C++代码中的中间浮点精度如何依赖于编译器设置、CPU标志和架构，尤其是在x87 FPU上，以及这如何影响性能和计算结果。

0 人收藏 0 人点赞

#precision

Google的QATs Q4_0比Unsloth的Q4_K_XL具有更高的精度（至少部分如此）

Reddit r/LocalLLaMA ↗ · 2026-06-08

技术对比显示，Google的Q4_0量化Gemma-4模型比Unsloth的Q4_K_XL版本具有更高的精度和更多的高精度张量，从而导致文件体积更大。

0 人收藏 0 人点赞

#precision

FP8注意力中的P-Cast精度：凹陷引发的崩溃与S=2^8的最优性

arXiv cs.AI ↗ · 2026-06-08 缓存

本文分析了在将softmax输出转换为FP8（E4M3）时，由于注意力凹陷现象导致的FP8注意力精度损失。它表明正向KV迭代会导致非凹陷注意力值下溢，并提出反向迭代和静态缩放因子S=256来消除下溢，实现了3-10倍的MSE改进。

0 人收藏 0 人点赞

#precision

DeepSeek V4 Pro 在精确度上击败 GPT-5.5 Pro

Hacker News Top ↗ · 2026-06-08

据报道，DeepSeek V4 Pro 在精确度上优于 GPT-5.5 Pro，这标志着模型准确性方面的重大进步。

0 人收藏 0 人点赞

#precision

精确性不等于忠实性：使用完整Oracle进行覆盖感知的接地生成评估

Hugging Face Daily Papers ↗ · 2026-06-08 缓存

本文指出了无参考忠实性指标中的一个盲点：它们只衡量精确性（即声明是否得到支持），而不衡量召回率（即相关事实的覆盖程度）。作者引入了一种使用Formula 1遥测数据和天气数据的完整Oracle评估，表明高精确度模型往往覆盖不佳，并提出了一个组合指标。

0 人收藏 0 人点赞

#precision

偏差累积，方差抵消

Hacker News Top ↗ · 2026-05-29 缓存

本文证明，对BF16优化器状态使用随机舍入可以匹配FP32性能，因为无偏误差随时间抵消，而四舍五入则因累积偏差而停滞。一项使用MLP的实验表明，BF16+SR在减少内存使用的同时达到了与FP32相似的损失。

0 人收藏 0 人点赞

#precision

我今天学到了关于GPU的知识

Lobsters Hottest ↗ · 2026-05-08 缓存

一位游戏开发者讲述了他在游戏《Blackshift》中修复GPU渲染bug的经历。问题是将8位邻接整数转换为浮点数时出现的浮点数精度问题，导致在部分NVIDIA GPU上出现视觉瑕疵，且该bug只在主渲染模式中出现，预览模式中并未出现。

0 人收藏 0 人点赞

precision

提交意见反馈