标签
GrandGuard 针对老年人在大语言模型聊天机器人交互中的特定风险,提出了一套全面的分类体系、基准测试与防护措施。研究发现,主流大语言模型对超过50%的此类风险处理不当,并提出了两种防护措施,检测准确率最高可达96.2%。