llm-analysis

#llm-analysis

整数无故发生神秘变化，而本应无代码生成影响

The Old New Thing (Raymond Chen) ↗ · 2026-07-10 缓存

一位开发者发现，交换两个等效宏竟导致无关函数中出现意外的整数变化，这篇博客文章深入探究了这一谜团，并对某个大语言模型（LLM）关于控制流保护的解释提出了质疑。

0 人收藏 0 人点赞

#llm-analysis

Hacker News Top ↗ · 2026-07-09

Arcaide 是一款可构建多级调用图的工具，它结合结构分析与行为分析，帮助开发者探索和理解代码库，并利用 LLM 增强图形、剔除琐碎工具。

0 人收藏 0 人点赞

#llm-analysis

arXiv cs.CL ↗ · 2026-07-08 缓存

本文提出了针对交易法律文件LLM分析的令牌高效检索方法，证明结构化检索可以在使用更少的令牌和更低成本的同时，在答案质量上与全语料注入相匹配。

0 人收藏 0 人点赞

#llm-analysis

arXiv cs.CL ↗ · 2026-05-26 缓存

本文使用预训练LLM进行零样本分类，分析了约2000万条Twitch聊天信息，涵盖七种游戏类型，发现2.4%的消息具有毒性，其中MOBA游戏的毒性率最高（3.2%），体育游戏最低（2%）。研究还发现，同一类型内不同游戏之间的毒性分布存在显著差异。

0 人收藏 0 人点赞

#llm-analysis

arXiv cs.CL ↗ · 2026-05-13 缓存

本文介绍了 Qwen-Scope，这是一套在 Qwen3 和 Qwen3.5 模型上训练的稀疏自编码器（SAE）工具包，旨在实现机械可解释性分析与干预。该工具包发布了涵盖密集和 MoE 骨干网络的 14 组 SAE 权重，为残差流激活提供了稀疏表示。

0 人收藏 0 人点赞

#llm-analysis

arXiv cs.CL ↗ · 2026-05-08 缓存

这篇学术论文分析了两代大语言模型与人类撰写新闻文本相比的句法和词汇多样性，发现较新的对齐模型表现出多样性降低的现象。

0 人收藏 0 人点赞

#llm-analysis

Google DeepMind Blog ↗ · 2025-12-16 缓存

DeepMind发布Gemma Scope 2，这是一套面向Gemma 3模型家族的开放可解释性工具套件，旨在帮助AI安全社区理解和调试幻觉、越狱等复杂的语言模型行为。

0 人收藏 0 人点赞