标签
香港中文大学(深圳)的研究人员提出了一种越狱方法,利用Archive of Our Own平台上的同人小说子类型作为攻击载体,将有害内容嵌入创意写作场景中。该方法在八个对齐大语言模型上的平均攻击成功率(ASR)达到0.731,多轮扩展版本(Saga-A4)的ASR进一步提升至0.924,超越了现有方法。
POLARIS 是一套训练方案,结合 GRPO 与 LLM-as-judge 奖励机制及人类参考注入技术,旨在提升小模型的长篇故事生成能力。将其应用于 Qwen3.5-9B 后,所得到的 POLARIS-9B 模型在创意写作基准测试中达到了 Qwen3.5-27B 的水平,同时在遵循长度指令方面表现更佳。
在短篇创意写作基准测试中,Gemini 3.5 Flash 表现优于 Gemini 3.1 Pro,在直接对比中从 -2.3 提升到 -1.8。
本文介绍了一个数据集和训练框架,将人类创作的小说转换为多分辨率规划支架,使长上下文语言模型能够生成具有更类似人类散文和叙事动力的书籍规模小说。
一个以写作为导向的微调,基于Google的Gemma 4 31B模型,旨在实现更自然的英语和更优美的文笔,减少拒绝回答,适合创意写作、翻译和角色扮演。
# 使用 GPT-5 进行创意写作 来源: [https://openai.com/index/gpt-5-creative-writing/](https://openai.com/index/gpt-5-creative-writing/) [\(在新窗口中打开\)](https://x.com/OpenAI)[\(在新窗口中打开\)](https://www.youtube.com/OpenAI)[\(在新窗口中打开\)](https://www.linkedin.com/company/openai)[\(在新窗口中打开\)](https://github.com/openai)[\(在新窗口中打开\)](https://www.instagram.com/openai/)[\(在新窗口中打开\)](https://www.tiktok.com/@openai)[\(在新窗口中打开