@CoinSh0t:一个中国GitHub账号刚刚发布了2026年十大免费开源项目。如果你来自欧洲或美国……

X AI KOLs Timeline 新闻

摘要

一个中国GitHub账号精选了2026年十大免费开源AI项目,包括浏览器自动化工具(Midscene.js)、语音克隆(GPT-SoVITS)、文档AI代理(MaxKB)、数据库查询(DB-GPT)、知识助手(FastGPT)、PDF解析(MinerU)、多步骤代理(OpenManus)、视频生成(Wan 2.2)、文档接地(RAGFlow)和AI应用平台(Dify)。

一个中国GitHub账号刚刚发布了2026年十大免费开源项目。 如果你来自欧洲或美国,有99%的可能性你从未见过其中任何一个。 我把这10个项目全部翻译成了英文,省得你自己动手: MidScene.js MidScene.js允许你用自然语言描述操作,即可自动化浏览器或手机,无需CSS选择器或XPath。 它由字节跳动团队构建,由于它像人类一样读取屏幕,你的脚本能经受住任何UI重新设计。 → http://github.com/web-infra-dev/midscene… GPT-SoVITS GPT-SoVITS能从五秒样本中克隆声音,然后支持英语、中文、日语、韩语和粤语。 它是全球使用最广泛的开源语音克隆工具之一,并且可以在你自己的机器上免费运行。 → http://github.com/RVC-Boss/GPT-SoVITS… MaxKB MaxKB能将你的文档转化为一个AI代理,只需一行脚本即可嵌入任何网站。 它一键部署,内置本地模型,因此你的数据永远不会离开你的服务器。 → http://github.com/1Panel-dev/MaxKB… DB-GPT DB-GPT允许公司内任何人用自然语言向数据库提问,并返回SQL语句及完整的图表。 它完全私有化运行,支持MySQL、Postgres、ClickHouse等。 → http://github.com/eosphoros-ai/DB-GPT… FastGPT FastGPT能将你的文档堆转化为一个可工作的AI知识助手,无需编码。 它可在2GB服务器上运行,已拥有数十万用户。 → http://github.com/labring/FastGPT MinerU MinerU能将杂乱的PDF、扫描件和Office文件清理成整洁的、LLM就绪的文本,且不破坏表格。 它是严肃团队喂给AI的文档层,由一家顶级中国研究实验室构建。 → http://github.com/opendatalab/MinerU… OpenManus OpenManus是MetaGPT团队大约三小时内构建的Manus代理的免费开源克隆。 你只需指向自己的API密钥,它就能自主规划并执行多步骤任务,无需邀请码。 → http://github.com/FoundationAgents/OpenManus… Wan 2.2 Wan 2.2是阿里巴巴的开源视频模型,能在单张消费级GPU上实现文生视频和图生视频。 商业视频API每秒收费高达一美元,而它仅需电费就能完成同样的工作。 → http://github.com/Wan-Video/Wan2.2… RAGFlow RAGFlow是当AI在真实文档上持续出现幻觉时,人们转而使用的引擎。 它的解析器能处理表格、扫描件以及二十多种格式,正因如此它已获得超过75,000颗星。 → http://github.com/infiniflow/ragflow… Dify Dify是构建AI应用的完整平台,集可视化工作流画布、RAG和代理于一体。 它已悄然跨越130,000颗星,并在你耳熟能详的公司中投入生产环境。 → http://github.com/langgenius/dify
查看原文
查看缓存全文

缓存时间: 2026/06/18 04:07

Midscene.js

开源、视觉驱动的UI测试——用自然语言编写测试,自动化任何平台。

相似文章

本周GitHub上增长最快的十大AI仓库

Reddit r/LocalLLaMA

精选本周GitHub上增长最快的十大AI仓库,涵盖AI编程助手、个人AI、记忆系统、浏览器自动化以及本地优先开发工具。