deepseek

#deepseek

@Gorden_Sun: https://x.com/Gorden_Sun/status/2066919099016630286

X AI KOLs Following ↗ · 2026-06-16 缓存

一项涉及2.6万名中国初高中生的长期研究发现，学生自主使用AI后，作业表现提升18%但闭卷考试成绩在半年内下降20%，中考和高考成绩分别下降24%和18%，且81%的学生存在用AI代写作业的现象。

0 人收藏 0 人点赞

#deepseek

@natolambert: 新播客与@finbarrtimbers！我们盘点最新的后训练配方，从GLM 5.1、Kimi K2.6、DeepSeek V4、Xia…

X AI KOLs Timeline ↗ · 2026-06-16 缓存

Nathan Lambert和Finbarr Timbers讨论了大型语言模型的最新后训练配方，包括DeepSeek V4、GLM 5.1、Kimi K2.6，以及行业向多教师在线策略蒸馏的转变。

0 人收藏 0 人点赞

#deepseek

@huangjinbo: Reasonix 真的很优秀，不要被它的项目名字（DeepSeek-Reasonix）所误导了，只要中转站支持 OpenAI-compatible 都可以支持...再次推荐。主要是它的技能、记忆、Hooks、MCP等功能都很好用...它被…

X AI KOLs Timeline ↗ · 2026-06-16 缓存

Reasonix（原名DeepSeek-Reasonix）是一个基于Go语言开发的AI编码代理CLI工具，支持技能、记忆、Hooks、MCP等功能，可替代OpenCode。

0 人收藏 0 人点赞

#deepseek

当进一步推理无益时停止：推理模型中的注意力状态自适应生成

arXiv cs.CL ↗ · 2026-06-16 缓存

本文提出ASAG，一种无需训练的方法，基于注意力分布自适应地停止大型推理模型的推理，在使用DeepSeek-R1-Distill和Qwen3模型的基准测试中，将token使用量减少约40%，同时准确率提升3.2%。

0 人收藏 0 人点赞

#deepseek

@ziv_ravid: 1/我阅读了Nemotron 3 Ultra报告，将其后训练与DeepSeek V4的对比很有趣。两者现在都…

X AI KOLs Timeline ↗ · 2026-06-15 缓存

这条推文比较了Nemotron 3 Ultra和DeepSeek V4的后训练方法，指出两者都使用多个专长教师并通过在线策略蒸馏合并到一个学生模型，但在支持重叠方面存在差异。

0 人收藏 0 人点赞

#deepseek

美国主导了大部分AI研发，中国近期如何能如此迅速地发展AI？

Reddit r/ArtificialInteligence ↗ · 2026-06-14

本文讨论中国作为后来者如何在AI领域迅速取得进展，质疑数据集、算力和算法的来源，这些使DeepSeek等公司能够赶上OpenAI和Google等美国领先者。

0 人收藏 0 人点赞

#deepseek

@vista8: 输入任意 App名称，自动抓取AppStore用户评价。用 DeepSeek 做信息挖掘，把评论变成产品经理能用的信息： 1. 用户到底在夸什么、骂什么 2. 哪些问题和版本更新有关 3. 哪些代表有产品机会 4. 可视化图表产品预计…

X AI KOLs Following ↗ · 2026-06-14 缓存

一个即将开源的AI工具，利用DeepSeek自动抓取AppStore用户评价并进行信息挖掘，帮助产品经理了解用户反馈、版本问题和产品机会。

0 人收藏 0 人点赞

#deepseek

你可以在 Mac (M3 Max, 96GB) 上运行 Deepseek 4 flash

Reddit r/LocalLLaMA ↗ · 2026-06-14

介绍如何在配备 96GB 内存的 Mac M3 Max 上，使用 Antirez 的 ds4 引擎和 SSD 流式传输运行 DeepSeek 4 flash，实现约每秒 12 token 的推理速度。

0 人收藏 0 人点赞

#deepseek

2026年中本地模型

Reddit r/LocalLLaMA ↗ · 2026-06-14 缓存

2026年中本地AI模型的技术概览，重点介绍开放权重模型如何通过混合专家模型和稀疏注意力机制的进步缩小了与前沿模型的差距，从而实现高效的本地推理。

0 人收藏 0 人点赞

#deepseek

@rosstaylor90: 关于主权AI辩论的几点看法，曾在英国为Meta构建多个LLM，现为一家英国初创公司工作……

X AI KOLs Following ↗ · 2026-06-14 缓存

一位前Meta AI研究员分享了一个关于英国主权AI辩论的10点帖文，认为规模较小、范围明确的团队无需数十亿资金即可验证新方向，并强调培养本地人才和管理期望对于英国AI生态系统至关重要。

0 人收藏 0 人点赞

#deepseek

@LinearUncle: 如果你要追求终极的coding agent自由，目前只有pi才能给你安心。如果你一直想试试 pi + deepseek，但是不知道怎么配置，强烈推荐新手查看这篇老外小哥的blog: https://deepakness.com/blog…

X AI KOLs Timeline ↗ · 2026-06-12 缓存

这条推文推荐将Pi编码代理与DeepSeek配合使用，并链接到详细的设置指南博客。

0 人收藏 0 人点赞

#deepseek

我们抓取了ChatGPT、Gemini和DeepSeek的网络流量，观察各自如何定义"来源"——三种完全不同的机制

Reddit r/artificial ↗ · 2026-06-11

一项技术调查抓取并比较了ChatGPT、Gemini和DeepSeek的网络流量，以理解每个系统在技术上如何定义和附加来源至回答中，揭示了三种本质不同的机制和迥异的引用偏好。

0 人收藏 0 人点赞

#deepseek

Deepseek V4 如何能在编程排行榜上名列前茅，却依然落后前沿8个月？

Reddit r/LocalLLaMA ↗ · 2026-06-11

分析 DeepSeek V4 在编程排行榜上的高分与其声称的落后前沿8个月的差距，突出狭窄基准优化与更广泛推理测试之间的差异，以及运行量化本地版本时实际性能的损失。

0 人收藏 0 人点赞

#deepseek

关于DeepSeek的笔记

Hacker News Top ↗ · 2026-06-10 缓存

参观DeepSeek总部后，可见其低调的出身、年轻的团队和独特的文化。这家公司由一家对冲基金运营，专注于保持小规模，且对AGI风险并不担忧，而是更关注失业等社会问题。

0 人收藏 0 人点赞

#deepseek

@akshay_pachaar: https://x.com/akshay_pachaar/status/2064700531600458093

X AI KOLs Following ↗ · 2026-06-10 缓存

本文介绍了如何使用GRPO微调LLM（Qwen3-8B）以实现可靠的JSON结构化输出，将模式准确率从62%提升至82%，超越了GPT-4.1的58%。

0 人收藏 0 人点赞

#deepseek

使用 LoRA 和 NEFTune 对 DeepSeek-R1-8B 模型进行指令微调

arXiv cs.AI ↗ · 2026-06-10 缓存

本文研究了使用 LoRA 和 NEFTune 对 DeepSeek-R1-8B 进行指令微调用于金融命名实体识别，取得了 0.912 的微平均 F1 值，并优于多个基线模型。

0 人收藏 0 人点赞

#deepseek

DeepSeek 加入代币量竞争，Anthropic 继续主导支出（12分钟阅读）

TLDR AI ↗ · 2026-06-10 缓存

AI Gateway 的2026年5月数据显示，DeepSeek的代币份额飙升至17%，但支出极少，而 Anthropic 保持了65%的支出，表明路由策略注重成本且整体使用量在增长。

0 人收藏 0 人点赞

#deepseek

FlashMemory DeepSeek-V4 检索器（GitHub仓库）

TLDR AI ↗ · 2026-06-10 缓存

介绍了FlashMemory DeepSeek-V4检索器，这是一个轻量级模型，通过预测接下来将关注哪些块来稀疏化DeepSeek-V4的CSA KV缓存，仅保留约10-15%在设备上，同时匹配全注意力性能。

0 人收藏 0 人点赞

#deepseek

我们正在购买一种能自我复制的东西

Reddit r/ArtificialInteligence ↗ · 2026-06-09

这篇文章认为，人工智能创业浪潮是不可持续的，因为智能作为一种数字商品，复制边际成本为零，且大多数人工智能公司将在2029年前倒闭，只剩下几大巨头掌控能源和芯片等物理层。

0 人收藏 0 人点赞

#deepseek

@bookwormengr: 关于CANN（华为版的CUDA）及DeepSeek V4在华为芯片上推理的精彩报道……“CANN（神经网络计算架构）

X AI KOLs Timeline ↗ · 2026-06-09 缓存

华为已开源其CANN软件工具包，以与Nvidia的CUDA竞争，而DeepSeek V4在华为昇腾芯片上显示出显著的推理性能提升。

0 人收藏 0 人点赞

deepseek

提交意见反馈