标签
华为已开源其CANN软件工具包,以与Nvidia的CUDA竞争,而DeepSeek V4在华为昇腾芯片上显示出显著的推理性能提升。
这篇博文提供了在双GH200工作站上使用vLLM对DeepSeek V4 Flash进行推理,达到近200令牌/秒的技巧和基准测试,重点介绍了使用Canada-Quant的量化检查点和张量并行优化。
MiniMax的涨价和模型限制正在将用户推向DeepSeek等竞争对手以及Claude或ChatGPT等高端选项,颠覆了其先前作为廉价、可用日常工具的声誉。
据报道,DeepSeek V4 Pro 在精确度上优于 GPT-5.5 Pro,这标志着模型准确性方面的重大进步。
一篇关于多代理AI协作的实战分享,提出了使用Opus 4.8做规划、Deepseek/Gemma做执行的分层策略,可降低成本10倍、提升速度2倍,并开源了相关实现。
DeepSeek V4的"Think Max"模式实际上只是在prompt开头添加了要求逐步思考的指令,引发了对推理能力来源的讨论。
四种前沿AI模型(Nemotron 3 Ultra、DeepSeek V4、MiniMax M3、Qwen 3.7 Max)在相同两个提示词上的对比,附完整结果链接。
DeepSeek v4 PRO,一个拥有1.6万亿参数的模型,通过SSD流式传输在128GB MacBook m5 max上运行,展示了本地运行大规模模型的能力。
有人在GitHub上创建了一个仓库,通过将Claude Code的请求转发到DeepSeek、Kimi等10个免费服务商,让用户免费且永久地使用Claude Code,配置只需五分钟,已有超过两万开发者使用。
一场讨论,比较DeepSeek V4 Pro、MiMo-V2.5-Pro和MiniMax M3在本地或OpenRouter使用中的最佳性价比,重点关注代理和编码任务,并提及Hermes Agent和Qwen 3.6变体。
简短观点:Moonshot 和 DeepSeek 是中国顶尖的AI实验室,远超前于其他实验室。
像DeepSeek和Qwen这样的中国AI模型,以比西方同类产品低5至20倍的成本提供有竞争力的性能,正在重塑AI经济学并推动多模型部署策略。
Neo Research (新衡),亚洲首个独立前沿AI安全评估实验室,宣布其第一份报告:对 DeepSeek v4 Pro 的安全评估。
讨论人工智能模型如何在使用其自身开发者构建的框架时表现最佳,而第三方框架可能导致表现不佳,尽管基准测试成绩出色。文中引用了Claude Code(针对Claude模型)和Codex(针对GPT模型)等示例。
一位开发者经过大量实验,成功在树莓派 5 上以超过1 tok/s的速度运行了284B参数的DeepSeek-V4-Flash模型,使用的是来自 antirez 的未经修改的 GGUF 文件。
一位 Reddit 用户分享了在双华硕 GX10 DGX Spark 配置上运行 DeepSeek V4 Flash 的经验,详细介绍了性能指标、配置和功耗,并提供了不同上下文长度下的吞吐量基准测试结果。
作者介绍了SAFi,这是一个用于AI代理的开源运行时治理引擎,详细说明了其内存系统(伦理记忆、对话记忆、个人资料记忆、项目记忆)以及实际用例,例如由DeepSeek V4驱动的工作助手。
用户报告称,通过 OpenRouter 使用 DeepSeek V4 Pro 模型时,返回了一个误导性的“信用额度用尽”错误,结果发现这是一个特定于模型的问题,导致浪费了数小时的调试时间。
用户分享使用Deepseek和Codex进行复杂项目规划与实施的经验,认为Deepseek更具创造性,而Codex在逻辑和工程能力上更强。
关于DeepSWE基准测试的讨论显示,DeepSeek v4 Pro仅通过了8%的任务,与它在类似任务上的表现相比,这个分数低得令人惊讶。