deepseek

#deepseek

@bookwormengr: 关于CANN（华为版的CUDA）及DeepSeek V4在华为芯片上推理的精彩报道……“CANN（神经网络计算架构）

X AI KOLs Timeline ↗ · 2026-06-09 缓存

华为已开源其CANN软件工具包，以与Nvidia的CUDA竞争，而DeepSeek V4在华为昇腾芯片上显示出显著的推理性能提升。

0 人收藏 0 人点赞

#deepseek

关于在Hopper上使DeepSeek V4 Flash达到近200 tok/s的一些技巧

Reddit r/LocalLLaMA ↗ · 2026-06-08 缓存

这篇博文提供了在双GH200工作站上使用vLLM对DeepSeek V4 Flash进行推理，达到近200令牌/秒的技巧和基准测试，重点介绍了使用Canada-Quant的量化检查点和张量并行优化。

0 人收藏 0 人点赞

#deepseek

MiniMax正在自掘坟墓

Reddit r/AI_Agents ↗ · 2026-06-08

MiniMax的涨价和模型限制正在将用户推向DeepSeek等竞争对手以及Claude或ChatGPT等高端选项，颠覆了其先前作为廉价、可用日常工具的声誉。

0 人收藏 0 人点赞

#deepseek

DeepSeek V4 Pro 在精确度上击败 GPT-5.5 Pro

Hacker News Top ↗ · 2026-06-08

据报道，DeepSeek V4 Pro 在精确度上优于 GPT-5.5 Pro，这标志着模型准确性方面的重大进步。

0 人收藏 0 人点赞

#deepseek

@GoSailGlobal: 多代理AI协作实战数据来了：用Opus 4.8做规划、Deepseek/Gemma做执行，成本降10倍，速度快2倍。秘诀不是用最贵的模型，是让便宜模型干重活、贵模型只做决策。这跟公司管理一个道理：CEO不该写代码，实习生不该定战略。A…

X AI KOLs Timeline ↗ · 2026-06-08 缓存

一篇关于多代理AI协作的实战分享，提出了使用Opus 4.8做规划、Deepseek/Gemma做执行的分层策略，可降低成本10倍、提升速度2倍，并开源了相关实现。

0 人收藏 0 人点赞

#deepseek

@jakevin7: DeepSeek V4 的"Think Max"模式，本质就是在 prompt 开头加了一句"你必须把每一步都想清楚，不许走捷径" 所以推理能力到底是涌现的，还是……被骂出来的？

X AI KOLs Following ↗ · 2026-06-06 缓存

DeepSeek V4的"Think Max"模式实际上只是在prompt开头添加了要求逐步思考的指令，引发了对推理能力来源的讨论。

0 人收藏 0 人点赞

#deepseek

@cyrilXBT: Nemotron 3 Ultra 对比 DeepSeek V4 对比 MiniMax M3 对比 Qwen 3.7 Max。相同两个提示词。四个前沿模型。一个…

X AI KOLs Following ↗ · 2026-06-06 缓存

四种前沿AI模型（Nemotron 3 Ultra、DeepSeek V4、MiniMax M3、Qwen 3.7 Max）在相同两个提示词上的对比，附完整结果链接。

0 人收藏 0 人点赞

#deepseek

@antirez: DeepSeek v4 PRO 通过SSD流式传输在我的128GB MacBook m5 max上运行。1.6万亿参数。

X AI KOLs Timeline ↗ · 2026-06-04 缓存

DeepSeek v4 PRO，一个拥有1.6万亿参数的模型，通过SSD流式传输在128GB MacBook m5 max上运行，展示了本地运行大规模模型的能力。

0 人收藏 0 人点赞

#deepseek

@queen_nunaa: 有人已经在 GitHub 上弄了个仓库，能让你免费、永久地用上 Claude Code。做法就是把 Claude Code 的请求转发到 10 个免费的服务商，比如 DeepSeek、Kimi 这些。整个配置过程也就五分钟左右，现在已…

X AI KOLs Timeline ↗ · 2026-06-04 缓存

有人在GitHub上创建了一个仓库，通过将Claude Code的请求转发到DeepSeek、Kimi等10个免费服务商，让用户免费且永久地使用Claude Code，配置只需五分钟，已有超过两万开发者使用。

0 人收藏 0 人点赞

#deepseek

大模型价值之争 - DeepSeek V4 Pro vs MiMo-V2.5-Pro vs MiniMax M3

Reddit r/LocalLLaMA ↗ · 2026-06-03

一场讨论，比较DeepSeek V4 Pro、MiMo-V2.5-Pro和MiniMax M3在本地或OpenRouter使用中的最佳性价比，重点关注代理和编码任务，并提及Hermes Agent和Qwen 3.6变体。

0 人收藏 0 人点赞

#deepseek

@TheAhmadOsman：S级中国实验室：Moonshot 和 DeepSeek，这两家遥遥领先于其他所有实验室

X AI KOLs Following ↗ · 2026-06-03 缓存

简短观点：Moonshot 和 DeepSeek 是中国顶尖的AI实验室，远超前于其他实验室。

0 人收藏 0 人点赞

#deepseek

为何中国AI模型正在重塑AI经济学

Reddit r/AI_Agents ↗ · 2026-06-03

像DeepSeek和Qwen这样的中国AI模型，以比西方同类产品低5至20倍的成本提供有竞争力的性能，正在重塑AI经济学并推动多模型部署策略。

0 人收藏 0 人点赞

#deepseek

@NeoResearchAI: 我们是 Neo Research（新衡）。亚洲首个独立的前沿AI安全评估与研究实验室。今天我们正在发布……

X AI KOLs Following ↗ · 2026-06-02 缓存

Neo Research (新衡)，亚洲首个独立前沿AI安全评估实验室，宣布其第一份报告：对 DeepSeek v4 Pro 的安全评估。

0 人收藏 0 人点赞

#deepseek

观察：每个模型的最佳代理框架将由模型开发者自身提供

Reddit r/AI_Agents ↗ · 2026-06-01

讨论人工智能模型如何在使用其自身开发者构建的框架时表现最佳，而第三方框架可能导致表现不佳，尽管基准测试成绩出色。文中引用了Claude Code（针对Claude模型）和Codex（针对GPT模型）等示例。

0 人收藏 0 人点赞

#deepseek

@danveloper: 简直不敢相信，我竟然在树莓派 5（8GB 版）上以超过1 tok/s的速度运行了 DeepSeek-V4-Flash（284B 参数）……

X AI KOLs Timeline ↗ · 2026-06-01 缓存

一位开发者经过大量实验，成功在树莓派 5 上以超过1 tok/s的速度运行了284B参数的DeepSeek-V4-Flash模型，使用的是来自 antirez 的未经修改的 GGUF 文件。

0 人收藏 0 人点赞

#deepseek

Deepseek V4 flash 在 DGX Spark 上的性能

Reddit r/LocalLLaMA ↗ · 2026-06-01

一位 Reddit 用户分享了在双华硕 GX10 DGX Spark 配置上运行 DeepSeek V4 Flash 的经验，详细介绍了性能指标、配置和功耗，并提供了不同上下文长度下的吞吐量基准测试结果。

0 人收藏 0 人点赞

#deepseek

在SAFi中构建和管理AI代理

Reddit r/AI_Agents ↗ · 2026-05-31

作者介绍了SAFi，这是一个用于AI代理的开源运行时治理引擎，详细说明了其内存系统（伦理记忆、对话记忆、个人资料记忆、项目记忆）以及实际用例，例如由DeepSeek V4驱动的工作助手。

0 人收藏 0 人点赞

#deepseek

OpenRouter DeepSeek V4 Pro 模型的“信用额度用尽”错误令人困惑

Reddit r/openclaw ↗ · 2026-05-31

用户报告称，通过 OpenRouter 使用 DeepSeek V4 Pro 模型时，返回了一个误导性的“信用额度用尽”错误，结果发现这是一个特定于模型的问题，导致浪费了数小时的调试时间。

0 人收藏 0 人点赞

#deepseek

@royxy: 你们都传说应该用 Codex 做 plan，而用 Deepseek 做实施。但我最近这两天对于一个相当复杂的，应该从来没有人做过的项目进行推进探讨的感受是，Deepseek 的创造性要比 Codex 高，而 Codex 落地的逻辑能力和工…

X AI KOLs Timeline ↗ · 2026-05-31

用户分享使用Deepseek和Codex进行复杂项目规划与实施的经验，认为Deepseek更具创造性，而Codex在逻辑和工程能力上更强。

0 人收藏 0 人点赞

#deepseek

DeepSWE基准测试显示，DeepSeek v4 Pro仅通过8%的任务

Reddit r/LocalLLaMA ↗ · 2026-05-31

关于DeepSWE基准测试的讨论显示，DeepSeek v4 Pro仅通过了8%的任务，与它在类似任务上的表现相比，这个分数低得令人惊讶。

0 人收藏 0 人点赞

deepseek

提交意见反馈