构建了一个轻量级Python框架,用于本地LLM角色扮演(Ollama/Phi-3),以防止上下文漂移。寻求反馈。
摘要
一个轻量级Python框架,使用Ollama和Phi-3进行本地LLM角色扮演,具有上下文保留和原生流式传输功能,防止角色漂移。
大家好,我想分享一个我正在构建的开源项目。我想要一种干净、轻量的方式来处理使用Ollama和Phi-3的本地AI角色扮演,但我一直遇到角色漂移、流式传输延迟和上下文管理的问题。我没有使用庞大、臃肿的AI代理框架,而是为此用例构建了一个专用的轻量级Python框架。它原生地处理上下文锁定和LLM流式传输,使角色保持锁定状态,同时不会消耗不必要的token内存。**内置功能:**
* **Ollama集成:** 专为本地模型如Phi-3定制(也支持其他模型,但我使用Phi-3)。
* **原生LLM流式传输:** 无需长时间等待生成。
* **上下文保留:** 即使在多轮长对话中也能保持角色完整性。
* **MIT许可证:** 完全开源。由于我的Reddit账户是全新的,如果包含直接的GitHub超链接,自动审核会删除我的帖子。如果你想查看代码、浏览文件或帮助测试,**直接链接已钉在我的Reddit个人资料简介中**,或者你可以在GitHub上搜索:**tegetgoofficial-bot/ai-roleplay-framework**
我想看看这里的其他开发者是否觉得这种结构合理。你们认为以这种方式处理本地角色扮演状态怎么样?
相似文章
我搭建了一个竞技场,让LLM们在真实物理规则下进行剑斗。你来决定刀刃哪部分锋利,盲评胜负,免费OpenRouter模型争夺Elo排名。目前Llama 3.3正在刺向GPT-OSS的脸。
新竞技场让LLM控制物理布娃娃进行武器对决,用户定义武器伤害区域、盲评投票,模型争夺Elo排名。免费模型如Llama 3.3和GPT-OSS参与竞争,基础设施可自托管。
Built a Tauri v2 desktop chat shell for local LLMs — point it at Ollama / llama.cpp / any OpenAI-compatible endpoint, MIT, ~12 MB binary
Built a Tauri v2 desktop chat shell for local LLMs that can connect to Ollama, llama.cpp, or any OpenAI-compatible endpoint. The project is MIT licensed and produces a ~12 MB binary.
我为TradingAgents框架构建了一个本地GUI——兼容Ollama
一位开发者给TradingAgents多智能体LLM股票分析框架构建了本地Web GUI,支持多种LLM提供商,并添加了实时管线可视化、报告阅读器和多会话聊天等功能。
我构建的一个工具,用于生成带有功能性铰接部件的3D对象。它托管在GitHub上,且大部分与LLM无关。
一位开发者构建了一个流程,将LLM用作结构化代码编译器来生成Blender Python代码,从而生成带有功能性铰接部件的3D对象,而非单一网格。该工具开源且与LLM无关。
@badlogicgames:pibot 现在完全本地运行,使用 parakeet 进行语音转文字(STT),qwen3-tts 进行文字转语音(TTS),以及 Qwen 3.6 作为本地的多模态大语言模型……
pibot 现已完全本地化,采用 Parakeet 进行语音转文字(STT),Qwen3-tts 进行文字转语音(TTS),并通过 llama.cpp 使用 Qwen 3.6 作为本地多模态大语言模型,推理引擎基于 Rust/mlx-c,实现了零 Python 依赖。