标签
一项涉及2.6万名中国初高中生的长期研究发现,学生自主使用AI后,作业表现提升18%但闭卷考试成绩在半年内下降20%,中考和高考成绩分别下降24%和18%,且81%的学生存在用AI代写作业的现象。
Nathan Lambert和Finbarr Timbers讨论了大型语言模型的最新后训练配方,包括DeepSeek V4、GLM 5.1、Kimi K2.6,以及行业向多教师在线策略蒸馏的转变。
Reasonix(原名DeepSeek-Reasonix)是一个基于Go语言开发的AI编码代理CLI工具,支持技能、记忆、Hooks、MCP等功能,可替代OpenCode。
本文提出ASAG,一种无需训练的方法,基于注意力分布自适应地停止大型推理模型的推理,在使用DeepSeek-R1-Distill和Qwen3模型的基准测试中,将token使用量减少约40%,同时准确率提升3.2%。
这条推文比较了Nemotron 3 Ultra和DeepSeek V4的后训练方法,指出两者都使用多个专长教师并通过在线策略蒸馏合并到一个学生模型,但在支持重叠方面存在差异。
本文讨论中国作为后来者如何在AI领域迅速取得进展,质疑数据集、算力和算法的来源,这些使DeepSeek等公司能够赶上OpenAI和Google等美国领先者。
一个即将开源的AI工具,利用DeepSeek自动抓取AppStore用户评价并进行信息挖掘,帮助产品经理了解用户反馈、版本问题和产品机会。
介绍如何在配备 96GB 内存的 Mac M3 Max 上,使用 Antirez 的 ds4 引擎和 SSD 流式传输运行 DeepSeek 4 flash,实现约每秒 12 token 的推理速度。
2026年中本地AI模型的技术概览,重点介绍开放权重模型如何通过混合专家模型和稀疏注意力机制的进步缩小了与前沿模型的差距,从而实现高效的本地推理。
一位前Meta AI研究员分享了一个关于英国主权AI辩论的10点帖文,认为规模较小、范围明确的团队无需数十亿资金即可验证新方向,并强调培养本地人才和管理期望对于英国AI生态系统至关重要。
这条推文推荐将Pi编码代理与DeepSeek配合使用,并链接到详细的设置指南博客。
一项技术调查抓取并比较了ChatGPT、Gemini和DeepSeek的网络流量,以理解每个系统在技术上如何定义和附加来源至回答中,揭示了三种本质不同的机制和迥异的引用偏好。
分析 DeepSeek V4 在编程排行榜上的高分与其声称的落后前沿8个月的差距,突出狭窄基准优化与更广泛推理测试之间的差异,以及运行量化本地版本时实际性能的损失。
参观DeepSeek总部后,可见其低调的出身、年轻的团队和独特的文化。这家公司由一家对冲基金运营,专注于保持小规模,且对AGI风险并不担忧,而是更关注失业等社会问题。
本文介绍了如何使用GRPO微调LLM(Qwen3-8B)以实现可靠的JSON结构化输出,将模式准确率从62%提升至82%,超越了GPT-4.1的58%。
本文研究了使用 LoRA 和 NEFTune 对 DeepSeek-R1-8B 进行指令微调用于金融命名实体识别,取得了 0.912 的微平均 F1 值,并优于多个基线模型。
AI Gateway 的2026年5月数据显示,DeepSeek的代币份额飙升至17%,但支出极少,而 Anthropic 保持了65%的支出,表明路由策略注重成本且整体使用量在增长。
介绍了FlashMemory DeepSeek-V4检索器,这是一个轻量级模型,通过预测接下来将关注哪些块来稀疏化DeepSeek-V4的CSA KV缓存,仅保留约10-15%在设备上,同时匹配全注意力性能。
这篇文章认为,人工智能创业浪潮是不可持续的,因为智能作为一种数字商品,复制边际成本为零,且大多数人工智能公司将在2029年前倒闭,只剩下几大巨头掌控能源和芯片等物理层。
华为已开源其CANN软件工具包,以与Nvidia的CUDA竞争,而DeepSeek V4在华为昇腾芯片上显示出显著的推理性能提升。