llm-prompting

#llm-prompting

比较BERT句子对分类与少样本大语言模型提示在德语气候新闻中检测威胁与解决方案框架

arXiv cs.CL ↗ · 2026-06-26 缓存

本文比较了微调BERT（gbert-large）与少样本大语言模型提示（Llama 4 Maverick）在德语气候新闻句子中检测威胁与解决方案框架的效果。BERT获得了更高的F1分数（0.83 vs 0.78），消融研究表明提供前一句上下文可提升性能。

0 人收藏 0 人点赞

#llm-prompting

Reddit r/ArtificialInteligence ↗ · 2026-05-23

一种提示工程技巧，要求ChatGPT在回答前先识别假设、缺失信息和常见错误，以获得更深入、更个性化的回答。

0 人收藏 0 人点赞

#llm-prompting

arXiv cs.LG ↗ · 2026-05-22 缓存

本文研究使用贝叶斯抛硬币模型对符号程序（如Python）和提示程序进行性能预测，发现符号程序的性能是全有或全无的，而提示程序具有分散的先验分布，并介绍了RAP（检索近似先验）用于性能预测。

0 人收藏 0 人点赞

#llm-prompting

Reddit r/artificial ↗ · 2026-05-14

文章认为，在处理复杂任务时，将AI视为平等伙伴能获得更好的结果，而精确提示仍适用于技术性任务。

0 人收藏 0 人点赞

#llm-prompting

Reddit r/artificial ↗ · 2026-05-11

作者详细阐述了不让LLM生成最终事实核查判定的决定，转而采用混合架构：LLM负责数据提取，确定性Python层负责评分，并指出了随机不稳定性和可审计性的问题。

0 人收藏 0 人点赞

#llm-prompting

X AI KOLs Following ↗ · 2026-05-11

Andrej Karpathy 建议通过提示词引导大语言模型将回复组织为 HTML，以实现更好的可视化效果，并预测 AI 的输出将从文本演变为交互式神经视频。

0 人收藏 0 人点赞

#llm-prompting

arXiv cs.CL ↗ · 2026-04-20 缓存

DiZiNER 是一个利用多个大语言模型之间的分歧来优化零样本命名实体识别任务指令的框架，在18个基准测试中的14个上取得了最先进的结果，并显著缩小了零样本与监督系统之间的性能差距。

0 人收藏 0 人点赞