training

标签

Cards List
#training

@eglyman:我们训练了一个0.35B参数的模型,在电子表格导航方面比opus 4.6更优秀。普通企业信用卡公司的常规操作。

X AI KOLs Following · 2026-05-07 缓存

一位开发者训练了一个350M参数的模型,其处理电子表格的能力优于Anthropic的Opus 4.6。

0 人收藏 0 人点赞
#training

2026年中ROCm状态 [D]

Reddit r/MachineLearning · 2026-05-07

作者询问2026年中AMD的ROCm生态系统在AI训练领域的当前可行性,将其与NVIDIA的CUDA进行比较,并询问它是否已达到PyTorch的“开箱即用”阶段。

0 人收藏 0 人点赞
#training

ChatGPT如何在保护隐私的同时了解世界

OpenAI Blog · 2026-05-06 缓存

OpenAI解释了ChatGPT如何从公共数据和用户互动中学习,同时通过过滤和用户控制来保护隐私。

0 人收藏 0 人点赞
#training

Transition

Product Hunt · 2026-05-05

Transition 是一个由人工智能驱动的教练平台,旨在优化跑步者的运动训练计划并提升比赛表现。

0 人收藏 0 人点赞
#training

第八代TPU:面向智能体时代的双芯片设计

Hacker News Top · 2026-04-22 缓存

Google发布第八代TPU:TPU 8t用于训练,TPU 8i用于推理,专为大规模、高能效AI智能体工作负载打造,将于今年晚些时候推出。

0 人收藏 0 人点赞
#training

如何获得一个好的目标检测模型?[P]

Reddit r/MachineLearning · 2026-04-20

一位用户希望获得关于改进其YOLO11n目标检测模型的建议,计划将其部署在Raspberry Pi 5上,但困扰于理论mAP50指标与实际检测性能之间的差距。

0 人收藏 0 人点赞
#training

kaizen

Product Hunt · 2026-04-16

Kaizen 是一款训练平台,能够根据用户的运动表现与活动数据动态调整跑步训练计划。

0 人收藏 0 人点赞
#training

Ulysses 序列并行:百万Token上下文训练

Hugging Face Blog · 2026-03-09 缓存

Ulysses 序列并行是一种用于训练具有百万Token上下文的大语言模型的技术,通过将序列块分布在多个GPU上来降低内存需求,实现高效的长上下文训练。它与HuggingFace Accelerate、Transformers Trainer和TRL集成,支持Flash Attention和DeepSpeed ZeRO。

0 人收藏 0 人点赞
#training

OpenAI 为新闻机构推出学院

OpenAI Blog · 2025-12-17 缓存

# 为新闻机构推出 OpenAI 学院 来源:[https://openai.com/index/openai-academy-for-news-organizations/](https://openai.com/index/openai-academy-for-news-organizations/) OpenAI 与美国新闻项目(American Journalism Project)和伦费斯特研究所(The Lenfest Institute)合作,为使用 AI 的记者和出版商推出一个新的学习中心。在 OpenAI,我们认为新闻业对于健康的民主至关重要。人们依靠可靠的地方和国家报道来了解他们的社区和

0 人收藏 0 人点赞
#training

Training Agents: Live tutorial on how to fine-tune a coding agent for continual learning

YouTube AI Channels · 昨天 缓存

本直播教程展示了如何使用监督微调(SFT)在代理跟踪记录数据集上训练一个小型代码代理(Gemma 4 2B),并利用HF Jobs和Track IO自动化参数扫描与评估,体现“用代理训练代理”的理念。

0 人收藏 0 人点赞
#training

Training to cycle across Antarctica | with ChatGPT

YouTube AI Channels · 2026-06-12 缓存

一位探险者借助ChatGPT作为虚拟助理,计划独自无补给骑行到南极点,并通过减重、故障排查和配重训练来完善准备。

0 人收藏 0 人点赞
#training

FareedKhan-dev/train-llm-from-scratch

GitHub Trending (daily) · 2026-05-30 缓存

一个GitHub仓库,提供使用PyTorch从头训练大型语言模型的代码,基于Attention Is All You You论文,支持在单个GPU上训练十亿参数模型。

0 人收藏 0 人点赞
#training

2026年5月8日 对齐教学:教导Claude为什么

Anthropic Research · 2026-05-08 缓存

Anthropic分享了改进Claude对齐训练的经验,通过教授底层原则而非仅仅展示示例,在代理错位评估中获得了满分。

0 人收藏 0 人点赞
← Previous
← 返回首页

提交意见反馈