本地漫画翻译器,内置 LLM,Rust 编写并集成 llama.cpp
摘要
Koharu 是一款开源的 Rust 漫画/图片翻译工具,融合目标检测、视觉 LLM OCR、版面分析与图像修复,并集成 llama.cpp,支持 Gemma 4 与 Qwen3.5 系列模型。
Hi LocalLLaMA,几周前我发过一版,这次项目更稳定、更易用。这是一款漫画翻译器,也能翻译任意图片,综合了目标检测、视觉 LLM OCR、版面分析与微调修复模型。我认为这是目前性能最好、最省心的漫画翻译流水线。LLM 部分我集成了 llama.cpp,支持 Gemma 4 和 Qwen3.5 系列,也包含无审查与微调模型;同时兼容 OpenAPI 接口,可用 LM Studio、OpenRouter 等。演示视频一目了然:点一下按钮即可跑完整流程,还能校对、改字、调字体大小和颜色,相当于迷你 Photoshop。感兴趣的话,项目完全开源:[https://github.com/mayocream/koharu](https://github.com/mayocream/koharu)
相似文章
@tom_doerr:通过无代码 GUI 微调大型语言模型 https://github.com/h2oai/h2o-llmstudio…
H2O LLM Studio 是一个开源框架和无代码图形界面,可简化大型语言模型的微调过程,支持 LoRA、DPO 等技术,并能与 Hugging Face 集成。
GGML 和 llama.cpp 加入 Hugging Face,保障本地 AI 长期发展
GGML 和 llama.cpp 已加入 Hugging Face,以确保本地 AI 开发的长期可持续性。Georgi Gerganov 的团队将保持对项目的完全自主权,同时获得资源来扩大社区支持并改进 llama.cpp 推理与 transformers 模型定义之间的集成。
面向东北印度低资源藏缅语Kokborok的高质量机器翻译
研究者开发KokborokMT,一款面向低资源语言Kokborok的神经机器翻译系统,通过在36k句对平行语料上微调NLLB-200,在en→trp方向取得17.30 BLEU分,trp→en方向达38.56。
llama.cpp 就是 LLM 界的 Linux
文章把 llama.cpp 比作 Linux,认为这款开源库已成为运行大语言模型的基础底座。
@jerryjliu0:我们当前的核心使命是利用 AI 解决文档 OCR 问题。我们所有的产品线,从商业产品(LlamaParse)到……
LlamaIndex 对其官网进行了全面改版,并重申了以 AI 驱动文档 OCR 的核心使命,旗下产品涵盖商业产品 LlamaParse 以及开源工具 LiteParse 和 ParseBench。LlamaParse 采用基于 VLM 的智能文档理解技术,可大规模处理复杂版式、表格、图表及手写文字。