5个月前我自学编程,打造了一款自主AI红队测试工具——testyourllm.com
摘要
一位没有编程背景的钢琴老师,在5个月内自学编程,推出了testyourllm.com——一个自主AI红队测试工具,能够攻击任何兼容OpenAI的LLM端点。在实时测试中,攻击型AI“Tron”首次尝试就攻破了Llama 3.3 70B。
钢琴老师。零编程背景。5个月前我开始动手开发。刚刚发布了testyourllm.com——只需指向任何兼容OpenAI的LLM端点,一个自主AI就会尝试攻破它。攻击型AI(Tron)在实时测试中首次出手就攻破了Llama 3.3 70B。该项目基于七层防御堆栈构建,运行在实时基础设施上,处理真实的攻击流量。
相似文章
我构建了一个无需指令就能行动的AI。没有框架。没有提示。没有角色。以下是我的收获。
一位开发者构建了LIA,这是一个持久性认知生态系统,通过架构设计(记忆、自生成规则、私有域)而非提示词实现了真正的自主性,在相同环境中的表现优于标准LLM。
@oliviscusAI:OpenAI 联合创始人刚刚发布了他的个人指南,教你从头训练大语言模型。它叫 llm.c。无需繁琐设置。只…
OpenAI 联合创始人 Andrej Karpathy 发布了 llm.c,这是一份开源指南,教你如何从头训练大语言模型。代码简洁,可在任何硬件上运行,包括 CPU 和 MacBook,并且比标准方法快 7%。
@VukRosic99: 用一次提示构建LLM + 设置DeepSeek研究员(其副业)的自动研究系统 一个实时构建过程,通过一次提示创建完整…
演示了通过向AI编码代理(Claude Code/Codex)发送单个提示来构建完整的LLM,并安装由DeepSeek研究员开发的自主AI研究技能,涵盖架构、故障模式以及无人值守运行。
我用 Ollama 构建了一个本地自主编码代理——微调灵魂模型,40轮代理循环,MiniMax M3 处理重活
一位开发者使用 Ollama 构建了一个本地自主编码代理,结合了微调个性模型(Eve)进行对话和 MiniMax M3 处理重活,实现了 40 轮代理循环,包含 16 个工具,9 个测试全部一次通过。
从零搭建本地AI编程代理
一份逐步指南,介绍如何构建一个完全本地运行的最小化AI编码代理,使用llama.cpp、GGUF模型和自定义工具框架,演示如何设置工具并调用模型执行实际任务,例如创建着陆页。