deepseek

标签

Cards List
#deepseek

@bookwormengr: 关于CANN(华为版的CUDA)及DeepSeek V4在华为芯片上推理的精彩报道……“CANN(神经网络计算架构)

X AI KOLs Timeline · 2026-06-09 缓存

华为已开源其CANN软件工具包,以与Nvidia的CUDA竞争,而DeepSeek V4在华为昇腾芯片上显示出显著的推理性能提升。

0 人收藏 0 人点赞
#deepseek

关于在Hopper上使DeepSeek V4 Flash达到近200 tok/s的一些技巧

Reddit r/LocalLLaMA · 2026-06-08 缓存

这篇博文提供了在双GH200工作站上使用vLLM对DeepSeek V4 Flash进行推理,达到近200令牌/秒的技巧和基准测试,重点介绍了使用Canada-Quant的量化检查点和张量并行优化。

0 人收藏 0 人点赞
#deepseek

MiniMax正在自掘坟墓

Reddit r/AI_Agents · 2026-06-08

MiniMax的涨价和模型限制正在将用户推向DeepSeek等竞争对手以及Claude或ChatGPT等高端选项,颠覆了其先前作为廉价、可用日常工具的声誉。

0 人收藏 0 人点赞
#deepseek

DeepSeek V4 Pro 在精确度上击败 GPT-5.5 Pro

Hacker News Top · 2026-06-08

据报道,DeepSeek V4 Pro 在精确度上优于 GPT-5.5 Pro,这标志着模型准确性方面的重大进步。

0 人收藏 0 人点赞
#deepseek

@GoSailGlobal: 多代理AI协作实战数据来了:用Opus 4.8做规划、Deepseek/Gemma做执行,成本降10倍,速度快2倍。 秘诀不是用最贵的模型,是让便宜模型干重活、贵模型只做决策。 这跟公司管理一个道理:CEO不该写代码,实习生不该定战略。A…

X AI KOLs Timeline · 2026-06-08 缓存

一篇关于多代理AI协作的实战分享,提出了使用Opus 4.8做规划、Deepseek/Gemma做执行的分层策略,可降低成本10倍、提升速度2倍,并开源了相关实现。

0 人收藏 0 人点赞
#deepseek

@jakevin7: DeepSeek V4 的"Think Max"模式,本质就是在 prompt 开头加了一句"你必须把每一步都想清楚,不许走捷径" 所以推理能力到底是涌现的,还是……被骂出来的?

X AI KOLs Following · 2026-06-06 缓存

DeepSeek V4的"Think Max"模式实际上只是在prompt开头添加了要求逐步思考的指令,引发了对推理能力来源的讨论。

0 人收藏 0 人点赞
#deepseek

@cyrilXBT: Nemotron 3 Ultra 对比 DeepSeek V4 对比 MiniMax M3 对比 Qwen 3.7 Max。相同两个提示词。四个前沿模型。一个…

X AI KOLs Following · 2026-06-06 缓存

四种前沿AI模型(Nemotron 3 Ultra、DeepSeek V4、MiniMax M3、Qwen 3.7 Max)在相同两个提示词上的对比,附完整结果链接。

0 人收藏 0 人点赞
#deepseek

@antirez: DeepSeek v4 PRO 通过SSD流式传输在我的128GB MacBook m5 max上运行。1.6万亿参数。

X AI KOLs Timeline · 2026-06-04 缓存

DeepSeek v4 PRO,一个拥有1.6万亿参数的模型,通过SSD流式传输在128GB MacBook m5 max上运行,展示了本地运行大规模模型的能力。

0 人收藏 0 人点赞
#deepseek

@queen_nunaa: 有人已经在 GitHub 上弄了个仓库,能让你免费、永久地用上 Claude Code。 做法就是把 Claude Code 的请求转发到 10 个免费的服务商,比如 DeepSeek、Kimi 这些。 整个配置过程也就五分钟左右,现在已…

X AI KOLs Timeline · 2026-06-04 缓存

有人在GitHub上创建了一个仓库,通过将Claude Code的请求转发到DeepSeek、Kimi等10个免费服务商,让用户免费且永久地使用Claude Code,配置只需五分钟,已有超过两万开发者使用。

0 人收藏 0 人点赞
#deepseek

大模型价值之争 - DeepSeek V4 Pro vs MiMo-V2.5-Pro vs MiniMax M3

Reddit r/LocalLLaMA · 2026-06-03

一场讨论,比较DeepSeek V4 Pro、MiMo-V2.5-Pro和MiniMax M3在本地或OpenRouter使用中的最佳性价比,重点关注代理和编码任务,并提及Hermes Agent和Qwen 3.6变体。

0 人收藏 0 人点赞
#deepseek

@TheAhmadOsman:S级中国实验室:Moonshot 和 DeepSeek,这两家遥遥领先于其他所有实验室

X AI KOLs Following · 2026-06-03 缓存

简短观点:Moonshot 和 DeepSeek 是中国顶尖的AI实验室,远超前于其他实验室。

0 人收藏 0 人点赞
#deepseek

为何中国AI模型正在重塑AI经济学

Reddit r/AI_Agents · 2026-06-03

像DeepSeek和Qwen这样的中国AI模型,以比西方同类产品低5至20倍的成本提供有竞争力的性能,正在重塑AI经济学并推动多模型部署策略。

0 人收藏 0 人点赞
#deepseek

@NeoResearchAI: 我们是 Neo Research(新衡)。亚洲首个独立的前沿AI安全评估与研究实验室。今天我们正在发布……

X AI KOLs Following · 2026-06-02 缓存

Neo Research (新衡),亚洲首个独立前沿AI安全评估实验室,宣布其第一份报告:对 DeepSeek v4 Pro 的安全评估。

0 人收藏 0 人点赞
#deepseek

观察:每个模型的最佳代理框架将由模型开发者自身提供

Reddit r/AI_Agents · 2026-06-01

讨论人工智能模型如何在使用其自身开发者构建的框架时表现最佳,而第三方框架可能导致表现不佳,尽管基准测试成绩出色。文中引用了Claude Code(针对Claude模型)和Codex(针对GPT模型)等示例。

0 人收藏 0 人点赞
#deepseek

@danveloper: 简直不敢相信,我竟然在树莓派 5(8GB 版)上以超过1 tok/s的速度运行了 DeepSeek-V4-Flash(284B 参数)……

X AI KOLs Timeline · 2026-06-01 缓存

一位开发者经过大量实验,成功在树莓派 5 上以超过1 tok/s的速度运行了284B参数的DeepSeek-V4-Flash模型,使用的是来自 antirez 的未经修改的 GGUF 文件。

0 人收藏 0 人点赞
#deepseek

Deepseek V4 flash 在 DGX Spark 上的性能

Reddit r/LocalLLaMA · 2026-06-01

一位 Reddit 用户分享了在双华硕 GX10 DGX Spark 配置上运行 DeepSeek V4 Flash 的经验,详细介绍了性能指标、配置和功耗,并提供了不同上下文长度下的吞吐量基准测试结果。

0 人收藏 0 人点赞
#deepseek

在SAFi中构建和管理AI代理

Reddit r/AI_Agents · 2026-05-31

作者介绍了SAFi,这是一个用于AI代理的开源运行时治理引擎,详细说明了其内存系统(伦理记忆、对话记忆、个人资料记忆、项目记忆)以及实际用例,例如由DeepSeek V4驱动的工作助手。

0 人收藏 0 人点赞
#deepseek

OpenRouter DeepSeek V4 Pro 模型的“信用额度用尽”错误令人困惑

Reddit r/openclaw · 2026-05-31

用户报告称,通过 OpenRouter 使用 DeepSeek V4 Pro 模型时,返回了一个误导性的“信用额度用尽”错误,结果发现这是一个特定于模型的问题,导致浪费了数小时的调试时间。

0 人收藏 0 人点赞
#deepseek

@royxy: 你们都传说应该用 Codex 做 plan,而用 Deepseek 做实施。但我最近这两天对于一个相当复杂的,应该从来没有人做过的项目进行推进探讨的感受是,Deepseek 的创造性要比 Codex 高,而 Codex 落地的逻辑能力和工…

X AI KOLs Timeline · 2026-05-31

用户分享使用Deepseek和Codex进行复杂项目规划与实施的经验,认为Deepseek更具创造性,而Codex在逻辑和工程能力上更强。

0 人收藏 0 人点赞
#deepseek

DeepSWE基准测试显示,DeepSeek v4 Pro仅通过8%的任务

Reddit r/LocalLLaMA · 2026-05-31

关于DeepSWE基准测试的讨论显示,DeepSeek v4 Pro仅通过了8%的任务,与它在类似任务上的表现相比,这个分数低得令人惊讶。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈