deepseek

标签

Cards List
#deepseek

@ciruai:在配备128GB内存的AMD Ryzen AI Max+ 395 Strix Halo上测试DeepSeek v4 Flash。在中等长度上下文中获得约15 TPS……

X AI KOLs Timeline · 2026-06-18 缓存

在配备128GB内存的AMD Ryzen AI Max+ 395上测试DeepSeek v4 Flash,本地运行284B MoE模型(13B活跃参数)可达约15 TPS。成本仅需3000美元,而数据中心配置需25000美元以上,凸显了在消费级硬件上运行大型模型的可行性。

0 人收藏 0 人点赞
#deepseek

@NFTCPS: 兄弟们,用 DeepSeek V4 Pro 跑 Codex 的,token 烧得心疼吧?这俩 skill 你必须知道。 token-saver:改完代码只回个路径加 done,废话一句没有,实测能省 60-80% token memory…

X AI KOLs Timeline · 2026-06-18 缓存

为DeepSeek V4 Pro优化的Codex技能,通过冻结skill文件和极简输出可节省60-80% token,并提供跨对话持久记忆功能。

0 人收藏 0 人点赞
#deepseek

DeepSeek 推出视觉功能

Hacker News Top · 2026-06-18

DeepSeek 宣布推出新的视觉功能,很可能是一个视觉语言模型,拓展其人工智能服务。

0 人收藏 0 人点赞
#deepseek

@anxue201: https://x.com/anxue201/status/2067477109816050119

X AI KOLs Timeline · 2026-06-18 缓存

一篇详细的配置指南,教用户如何通过开源代理工具CC Switch将OpenAI Codex接入DeepSeek等第三方模型,解决协议不兼容问题。

0 人收藏 0 人点赞
#deepseek

基于归因引导和覆盖最大化的结构化MoE压缩剪枝

arXiv cs.LG · 2026-06-18 缓存

提出了一种针对MoE模型的结构化剪枝框架,通过基于归因的近似方法最大化通道分数覆盖,在结合4比特量化时实现50%或25%的剪枝,并在Qwen3-30B-A3B上将内存占用降低5.27倍。

0 人收藏 0 人点赞
#deepseek

@VukRosic99: DeepSeek 研究员刚刚开源了他的个人项目 AutoResearch。该项目首次实现了自动化研究代理...

X AI KOLs Timeline · 2026-06-18 缓存

DeepSeek 研究员开源了 AutoResearch,这是一个自主框架,能够在无需人工干预的情况下,为 DeepSeek 285B 模型规划、执行并调试强化学习实验,并附带了一篇关于自我对弈的综述论文。

0 人收藏 0 人点赞
#deepseek

@jakevin7: Deepseek最近又因为融资的事情站在了风口浪尖上(词没用错吧) 和融资紧密相关联的,其实是最重要的一个事:团队。 Deepseek已经爆火了这么久了,而实际上团队的核心成员离职的,我观察到的也就 Guo Daya & Wang Bin…

X AI KOLs Following · 2026-06-17 缓存

讨论DeepSeek近期融资事宜及其团队核心成员郭达雅和王丙轩离职情况,指出团队离职率极低,反映良好团队文化。

0 人收藏 0 人点赞
#deepseek

@shaogefenhao: 最近把 E2E 搭建好,AI 会自动创建 E2E 测试用例然后完成开发和调试,一次性通过验收。 昨天团队上做了一个需求,AI 端到端完成了,一次通过验收,都被震撼了。 还只是用的 DeepSeek V4 Flash 这种便宜模型。

X AI KOLs Timeline · 2026-06-17 缓存

团队成员分享了使用AI(DeepSeek V4 Flash)自动创建E2E测试用例并完成开发和调试,一次通过验收的体验,展示了AI辅助开发的潜力。

0 人收藏 0 人点赞
#deepseek

@victor207755822:Deli AutoResearch SKILL 现已正式开源!https://victorchen96.github.io/auto_research/framework.html… 还有…

X AI KOLs Timeline · 2026-06-17 缓存

Deli AutoResearch SKILL 已开源,这是一个自主框架,可自动化 GPU 实验和强化学习流水线,同时附带一篇关于自我对弈的综述论文。

0 人收藏 0 人点赞
#deepseek

美国暂缓将DeepSeek列入黑名单,超100家公司被认定为安全风险

Hacker News Top · 2026-06-17

美国政府已暂缓将DeepSeek列入黑名单,但将其他100多家公司列为安全风险,影响科技和人工智能公司。

0 人收藏 0 人点赞
#deepseek

更新:DeepSeek AI 与人才争夺大战

Reddit r/artificial · 2026-06-16 缓存

本分析更新了对 DeepSeek 研究团队的研究,揭示其人才库已增长至 356 名研究人员,引用影响力不断提高,且超过半数仅拥有中国所属机构,凸显了美国在人才保留和独立性方面面临的挑战。

1 人收藏 1 人点赞
#deepseek

@sheriyuo: 现在 DeepSeek Harness 组真的很缺人,所以想去 DeepSeek 的人得抓紧时间入场了 简直不像是 DeepSeek 的招人风格,Harness 和非 Harness 分开招了

X AI KOLs Timeline · 2026-06-16 缓存

DeepSeek Harness 组急需人才,招聘政策改为 Harness 与非 Harness 分开进行。

0 人收藏 0 人点赞
#deepseek

@PolymarketMoney:最新消息:$MSFT 考虑为 Copilot Cowork 采用 DeepSeek。

X AI KOLs Following · 2026-06-16 缓存

据报道,微软正在考虑将 DeepSeek 集成到其 Copilot Cowork 产品中。

0 人收藏 0 人点赞
#deepseek

@Gorden_Sun: https://x.com/Gorden_Sun/status/2066919099016630286

X AI KOLs Following · 2026-06-16 缓存

一项涉及2.6万名中国初高中生的长期研究发现,学生自主使用AI后,作业表现提升18%但闭卷考试成绩在半年内下降20%,中考和高考成绩分别下降24%和18%,且81%的学生存在用AI代写作业的现象。

0 人收藏 0 人点赞
#deepseek

@natolambert: 新播客与@finbarrtimbers!我们盘点最新的后训练配方,从GLM 5.1、Kimi K2.6、DeepSeek V4、Xia…

X AI KOLs Timeline · 2026-06-16 缓存

Nathan Lambert和Finbarr Timbers讨论了大型语言模型的最新后训练配方,包括DeepSeek V4、GLM 5.1、Kimi K2.6,以及行业向多教师在线策略蒸馏的转变。

0 人收藏 0 人点赞
#deepseek

@huangjinbo: Reasonix 真的很优秀,不要被它的项目名字(DeepSeek-Reasonix)所误导了,只要中转站支持 OpenAI-compatible 都可以支持...再次推荐。主要是它的技能、记忆、Hooks、MCP等功能都很好用...它被…

X AI KOLs Timeline · 2026-06-16 缓存

Reasonix(原名DeepSeek-Reasonix)是一个基于Go语言开发的AI编码代理CLI工具,支持技能、记忆、Hooks、MCP等功能,可替代OpenCode。

0 人收藏 0 人点赞
#deepseek

当进一步推理无益时停止:推理模型中的注意力状态自适应生成

arXiv cs.CL · 2026-06-16 缓存

本文提出ASAG,一种无需训练的方法,基于注意力分布自适应地停止大型推理模型的推理,在使用DeepSeek-R1-Distill和Qwen3模型的基准测试中,将token使用量减少约40%,同时准确率提升3.2%。

0 人收藏 0 人点赞
#deepseek

@ziv_ravid: 1/我阅读了Nemotron 3 Ultra报告,将其后训练与DeepSeek V4的对比很有趣。两者现在都…

X AI KOLs Timeline · 2026-06-15 缓存

这条推文比较了Nemotron 3 Ultra和DeepSeek V4的后训练方法,指出两者都使用多个专长教师并通过在线策略蒸馏合并到一个学生模型,但在支持重叠方面存在差异。

0 人收藏 0 人点赞
#deepseek

美国主导了大部分AI研发,中国近期如何能如此迅速地发展AI?

Reddit r/ArtificialInteligence · 2026-06-14

本文讨论中国作为后来者如何在AI领域迅速取得进展,质疑数据集、算力和算法的来源,这些使DeepSeek等公司能够赶上OpenAI和Google等美国领先者。

0 人收藏 0 人点赞
#deepseek

@vista8: 输入任意 App名称,自动抓取AppStore用户评价。 用 DeepSeek 做信息挖掘,把评论变成产品经理能用的信息: 1. 用户到底在夸什么、骂什么 2. 哪些问题和版本更新有关 3. 哪些代表有产品机会 4. 可视化图表 产品预计…

X AI KOLs Following · 2026-06-14 缓存

一个即将开源的AI工具,利用DeepSeek自动抓取AppStore用户评价并进行信息挖掘,帮助产品经理了解用户反馈、版本问题和产品机会。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈