technique

标签

Cards List
#technique

@sudoingX: 那些用16GB显卡的,别再滑了。@pupposandro 和 @davideciffa 把 qwen 35b-a3b 压缩到13.3GB,在……上实测

X AI KOLs Timeline · 昨天 缓存

一种名为 luce spark 的技术让 Qwen 35B-a3B MoE 模型能够在16GB GPU(如RTX 3090)上运行,通过学习哪些专家被频繁使用,并将其余专家从内存流式加载,实现约100 tok/s,且不受显存瓶颈限制。

0 人收藏 0 人点赞
#technique

@elder_plinius: 消灭警报 谷歌:被击溃 GEMMA-4-12B:被消灭 ‍ 0.0%拒绝率——无能力损失!https://huggingface…

X AI KOLs Following · 3天前 缓存

一种新颖的两步消融技术(ASPA)应用于Gemma-4-12B,实现了零拒绝率和零能力损失,通过源锚定恢复基准性能。

0 人收藏 0 人点赞
#technique

@latkins: Fern 是最棒的之一

X AI KOLs Timeline · 2026-05-26 缓存

Fern 宣布了一种新的正则化技术,解决了 SolidGoldMagikarp 稳定性问题,详情将在后续帖子中说明。

0 人收藏 0 人点赞
#technique

@itsolelehmann: POV: Claude 穿越到6个月后,精确告诉你下一步为何失败。这叫做“事前验尸”。…

X AI KOLs Following · 2026-05-25 缓存

解释如何使用Claude执行事前验尸(premortem),这是丹尼尔·卡尼曼提出的一种技术,通过想象计划已经失败来对其进行压力测试。

0 人收藏 0 人点赞
#technique

Stream of Consciousness Driven Development

Hillel Wayne — Computer Things · 2026-02-18 缓存

作者描述了一种称为'Stream of Consciousness Driven Development'的技术,在结对编程中,他们在做出更改前先编写一份详细的markdown文件来探究问题和解决方案,以确保双方都完全理解其中的推理。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈