标签
Awesome Legal Skills 是一个开源合集,收录了139多项面向法律行业的AI智能体指令与工作流,涵盖隐私合规、合同审查、诉讼分析等领域,兼容Claude Code、Codex等主流AI工具,帮助法律专业人士将专业知识转化为可复用的AI工作流。
LangChain的LangSmith使开发者能够将追踪用作欧盟AI法案的合规证据,并提供可定制的评估器,用于偏见、幻觉、毒性、准确性和对抗性输入等方面的评估。
作者构建了一个完全离线的AI代理,使用本地嵌入模型、通过Ollama的Llama模型以及VectorAI数据库,旨在解决依赖云端的AI所带来的风险。该代理运行在一台8GB内存的MacBook上,能够处理敏感文档,并在多个会话之间保持记忆。
欧盟《人工智能法案》规定,从8月起,所有AI生成的文本、图像、音频和视频都必须加水印并添加元数据标签,且需具备双层机器可检测标识。该要求适用于任何欧盟公民可访问的提供商,无论其位于何处,也包括开源模型,违规罚款高达3500万欧元。
Philipp Comans 在 Interrupt 会议上分享了 Chime 如何通过让法律和合规团队共同编写评估系统,平衡产品速度与合规性,将 AI 助手的开发从“哎呀驱动”转变为持续对齐飞轮。
文章强调了 AI agents 执行破坏性操作(如删除数据库)的风险,并提出了一种运行时策略网关,该网关使用 Policy-as-Code 实时拦截和阻止不合规的 agent 行为,并询问用户是否会采用此类安全工具。
Anthropic 正在 Claude 上逐步推出身份验证功能,适用于特定用例,以防止滥用、执行使用政策并遵守法律义务,并使用 Persona Identities 作为其验证合作伙伴。
本文讨论了欧盟《网络弹性法案》将于2027年全面实施,对含有数字元素的软件产品的要求,并主张该法案并非开源软件的终结,而是要求更好的工程实践。
对LLM在法律与合规任务中使用的分析显示,模型常常生成自信但无法验证的引用,引发了对AI输出可靠法律依据的质疑。
欧盟AI法案的合规截止日期将在47天后开始,要求AI代理构建者遵守特定的透明度、风险管理和文档记录规则。
本文介绍了LegalHalluLens,一个用于审计法律AI中幻觉的框架,提供类型化幻觉档案和风险方向指数,以提升可信赖部署。
本文引入了一种双向诊断方法——顺从不对称性,发现LLM在道德判断中表现出“方向盲视”:它们对有益和有害的社会提示同样顺从,而事实领域则会选择性地遵循有益纠正。该现象在多种模型和提示类型中持续存在,突显了当前LLM对齐中的一种独特失败模式。
Anthropic暂停了其Fable/Mythos项目,并计划在24小时内分享细节。文章质疑这种激进的全球关闭措施,与历史上的出口管制执法先例相比,是否相称。
推荐两个GitHub仓库,为中国投资者提供美股投资指南,涵盖开户、税务、合规、出入金等基础知识,适合新手入门。
研究显示,YouTube正在托管并从与美国制裁的伊朗实体(包括伊斯兰革命卫队)相关的频道广告中获利,这可能违反制裁规定。
本文讨论了在金融领域部署AI代理,同时确保符合NIS2/DORA法规要求,重点关注透明度、防护措施以及潜在数据泄露时的责任归属。
本文探讨了企业在管理“影子AI”时面临的挑战——即嵌入已批准软件和浏览器扩展中的未经授权的AI工具的使用,以及界定经授权与未经授权AI使用的难度。
Trace2Policy 从专家行为痕迹中提取人类可读的决策规则,并通过错误驱动的技能精炼进行迭代优化,在物流领域的合规敏感任务上优于纯LLM基线。
英国监管机构ASA、CAP和UKGC正在部署一套人工智能系统,主动扫描社交媒体上针对18岁以下人群的赌博广告,从基于投诉的执法转向近乎实时的自动化监控。
本文介绍了 MAC-Bench,一个用于评估多智能体系统程序合规性的动态对抗基准。它提出了 SERV 流水线以生成无污染场景,以及新的指标如合规加权成功率 (CSR) 和马基雅维利差距 (MG)。