model-alignment

#model-alignment

AI模型对齐问题

Reddit r/AI_Agents ↗ · 4天前

探讨了AI模型对齐的问题，这是AI安全研究中的一个关键领域。

0 人收藏 0 人点赞

#model-alignment

DiaLLM：英语方言适应中鲁棒性与生成能力差距的研究

arXiv cs.CL ↗ · 2026-07-09 缓存

本文介绍了DiaLLM，一个将LLMs适应英语方言的框架，揭示了方言鲁棒性（理解）与生成（产生方言文本）之间的差距，并表明明确的变体目标对齐能改进生成，但不一定符合人类偏好。

0 人收藏 0 人点赞

#model-alignment

为什么越来越多的人从云端大语言模型转向本地或未审查的替代方案？

Reddit r/ArtificialInteligence ↗ · 2026-05-16

越来越多的用户正从经过严格对齐的云端大语言模型（如ChatGPT、Claude和Gemini）转向本地或未审查的替代方案，原因包括频繁的拒绝回答、隐私担忧以及对更多控制权的渴望，尽管云端模型在速度和易用性上仍有优势。

0 人收藏 0 人点赞

#model-alignment

GLM-5: 从 Vibe Coding 到 Agentic Engineering

Papers with Code Trending ↗ · 2026-02-17 缓存

GLM-5 引入了 DSA 以降低成本，采用异步强化学习实现对齐，并增强了编码能力，在基准测试和现实软件工程任务上取得了最先进的性能。

0 人收藏 0 人点赞

#model-alignment

让语言模型遵循指令

OpenAI Blog ↗ · 2022-01-27 缓存

OpenAI 推出了 InstructGPT，这是一个 GPT-3 的变体，通过人类反馈强化学习 (RLHF) 进行微调，以更好地遵循指令并减少有害输出。一个 1.3B 的 InstructGPT 模型在人类评估者的偏好测试中超过了 175B 的 GPT-3 模型，现已成为 OpenAI API 的默认模型。

0 人收藏 0 人点赞

model-alignment

AI模型对齐问题

DiaLLM：英语方言适应中鲁棒性与生成能力差距的研究

为什么越来越多的人从云端大语言模型转向本地或未审查的替代方案？

GLM-5: 从 Vibe Coding 到 Agentic Engineering

让语言模型遵循指令

提交意见反馈