qwen3

#qwen3

PEARL：从自然语言出发的求解器在环交互式优化建模

arXiv cs.AI ↗ · 昨天缓存

介绍了PEARL，一个用于交互式优化建模的系统，采用求解器在环方法，从自然语言出发迭代改进问题表述，其性能超越了DeepSeek-V3.2-685B等更大规模的模型。

0 人收藏 0 人点赞

#qwen3

先承诺后推理：开放权重LLM中回答预承诺的行为复现与初步激活级证据

arXiv cs.CL ↗ · 2天前缓存

本文使用一个极简的洗车问题，在开放权重大型语言模型（Qwen3-8B）中复现了回答预承诺现象，并提供了初步激活级证据，表明承诺在答案文本生成之前就已编码在隐藏状态中。

0 人收藏 0 人点赞

#qwen3

为Qwen3 30B模型（Q8量化）搭建本地AI服务器：这个硬件合适吗？

Reddit r/AI_Agents ↗ · 3天前

讨论搭建用于Qwen3 30B模型（Q8量化）的本地AI服务器，质疑所选硬件是否合适。

0 人收藏 0 人点赞

#qwen3

@ADarmouni：https://arxiv.org/pdf/2607.13988 微软研究院的一篇优秀的强化学习工作，成功提升了Qwen3小型MoE模型的性能……

X AI KOLs Timeline ↗ · 3天前缓存

本文介绍了TRACE，一种用于长周期智能体强化学习的密集信用分配方法，该方法在不使用额外评论模型的情况下，显著提升了Qwen3小型MoE模型在智能体基准测试上的表现。

0 人收藏 0 人点赞

#qwen3

基于 Qwen3 235B A22B Instruct 2507 构建的内存管道在 LongMemEval-S 上获得第一名（470/500），同时其令牌效率比次优系统高出约 10 倍

Reddit r/LocalLLaMA ↗ · 2026-07-14

基于 Qwen3 235B A22B Instruct 2507 构建的内存管道在 LongMemEval-S 上获得最高分（470/500），同时其令牌效率比次优系统高出约 10 倍。

0 人收藏 0 人点赞

#qwen3

评估J-space熵在Qwen3-4B上的7个数据集中作为错误预测器的效果 [R]

Reddit r/MachineLearning ↗ · 2026-07-13

本研究评估了灵感来自Anthropic的Jacobian Lens的J-space熵能否在Qwen3-4B上的七个数据集中作为错误预测器。结果显示，它可以补充事实检索中的输出置信度，但它并非通用的幻觉检测器，且具有很强的任务依赖性。

0 人收藏 0 人点赞

#qwen3

CPU设置的首次尝试 - MS-02 Intel 285hx，尝试Qwen3、Qwen3.6和Gemma4

Reddit r/LocalLLaMA ↗ · 2026-07-12

在基于Intel 285hx处理器（MS-02）的CPU配置上测试AI模型Qwen3、Qwen3.6和Gemma4。

0 人收藏 0 人点赞

#qwen3

一个本地的、100%私有的语言模型，就在你的手机上！！

Reddit r/ArtificialInteligence ↗ · 2026-07-05

一个本地且私有的语言模型（Qwen 3 的 1.5B 和 4B 量化版本）可以在智能手机上离线运行，附带从 32B 模型蒸馏而来的微调与 LoRA。

0 人收藏 0 人点赞

#qwen3

基于领域特定知识图谱的面向旅游的推理大语言模型

arXiv cs.CL ↗ · 2026-06-30 缓存

本文提出一个模块化流水线，使用领域特定知识图谱生成多跳问答对，并微调一个面向旅游领域的推理大语言模型 (Qwen3-4B)，实现了82.4%的精确匹配准确率，显著优于基线模型。

0 人收藏 0 人点赞

#qwen3

面向农业应用的通用大语言模型微调：基于Qwen3-8B的可复现框架与评估协议

arXiv cs.CL ↗ · 2026-06-30 缓存

本文提出AgriTune-R，一个用于农业任务微调Qwen3-8B的可复现框架，整合了数据治理、LoRA/QLoRA微调、RAG、专家评估和安全控制。

0 人收藏 0 人点赞

#qwen3

Qwen3-tts.cpp + Compose 桌面 GUI

Reddit r/LocalLLaMA ↗ · 2026-06-29

开发者改进了 qwen3-tts.cpp，使其在 RTX 5080 上实现 5 倍实时运行，并使用 Kotlin Compose Multiplatform 创建了跨平台桌面 GUI，具备语音克隆、流式传输和说话人嵌入管理功能。

0 人收藏 0 人点赞

#qwen3

DeepSpec - deepseek-ai 集合

Reddit r/LocalLLaMA ↗ · 2026-06-28 缓存

DeepSeek AI 在 Hugging Face 上发布了 DeepSpec 集合，包含基于 Qwen3 和 Gemma4 的各种尺寸（1B-3B）的推测解码模型（dspark, dflash, eagle3）。

0 人收藏 0 人点赞

#qwen3

使用稀疏自编码器发现数百万个可解释特征

arXiv cs.LG ↗ · 2026-06-26 缓存

本文介绍了Qwen3-Instruct SAE，这是一套基于Qwen3指令微调模型训练的稀疏自编码器，能够发现数百万个可解释特征，并展示了拒绝引导能力。

0 人收藏 0 人点赞

#qwen3

JetSpec：通过并行树草稿打破推测解码的扩展极限

Hugging Face Daily Papers ↗ · 2026-06-25 缓存

JetSpec是一个推测解码框架，结合高效的前向草稿与因果条件化，提升LLM推理速度与接受率，在MATH-500上实现最高9.64倍加速，在对话工作负载上实现4.58倍加速。

0 人收藏 0 人点赞

#qwen3

GPU上的无畏并发：在Rust中进行安全的GPU推理，与vLLM/SGLang竞争 [R]

Reddit r/MachineLearning ↗ · 2026-06-18

cuTile Rust 引入了一种基于块（tile）的编程模型，利用 Rust 的所有权机制来保证 GPU 内核的内存安全和无数据竞争，基于该模型构建的 Grout 推理引擎在 Qwen3 模型上实现了与 vLLM/SGLang 相当的吞吐量。

0 人收藏 0 人点赞

#qwen3

@SpaceTimeViking: Qwen3.6 27B 在新的 AEON ULTIMATE VLLM 镜像上备受青睐 @NVIDIAAI DGX SPARK OPTIMIZED！https://github.com/AEO…

X AI KOLs Timeline ↗ · 2026-06-18 缓存

AEON-7 发布了 Qwen3.6-27B 的完全无审查、能力增强的 ablitation 版本，针对 NVIDIA DGX Spark 进行了优化，采用 NVFP4 量化和 DFlash 推测解码以提升性能。

0 人收藏 0 人点赞

#qwen3

@lmsysorg: SGLang-Omni 现已于第0天提供来自 @Open_MOSS 的 MOSS-TTS-Local Transformer v1.5！这是一个开源的 48 kHz 立体声 TTS 模式…

X AI KOLs Timeline ↗ · 2026-06-18 缓存

MOSS-TTS-Local Transformer v1.5 是一个开源的 48 kHz 立体声 TTS 模型，具有零样本语音克隆、原生流式传输，并支持31种语言，基于 Qwen3-4B 骨干网构建，通过 SGLang-Omni 提供。

0 人收藏 0 人点赞

#qwen3

@KaichaoYou: 并发部署是RL训练基础设施中最困难的部分之一。我们很高兴帮助SemiAnalysis进行压力测试…

X AI KOLs Timeline ↗ · 2026-06-17 缓存

KaichaoYou讨论了RL训练基础设施中扩展并发部署的挑战，重点介绍了与SemiAnalysis一起对Qwen3 235B进行的沙箱扩展压力测试，包括错误和修复的详细说明。

0 人收藏 0 人点赞

#qwen3

@sheriyuo: 本文提出ASAG, Attention-State Adaptive Generation, 一个无需训练、即插即用的推理停止框架，用于推理…

X AI KOLs Timeline ↗ · 2026-06-16 缓存

ASAG利用注意力熵来检测推理何时无效益，提前停止以提高准确率并减少token生成。在Qwen3-8B上的实验显示，准确率提升4.4%，生成的token减少超过40%。

0 人收藏 0 人点赞

#qwen3

vLLM 现在有一个新的流式解析器支持 Qwen3+，可在 nightly 版本中使用

Reddit r/LocalLLaMA ↗ · 2026-06-15 缓存

vLLM 现在为 Qwen3+ 模型提供了流式解析器，可在 nightly 构建中使用。vLLM 是一个快速且易于使用的 LLM 推理和服务库。

0 人收藏 0 人点赞

qwen3

提交意见反馈