@jerryjliu0:我们当前的核心使命是利用 AI 解决文档 OCR 问题。我们所有的产品线,从商业产品(LlamaParse)到……
摘要
LlamaIndex 对其官网进行了全面改版,并重申了以 AI 驱动文档 OCR 的核心使命,旗下产品涵盖商业产品 LlamaParse 以及开源工具 LiteParse 和 ParseBench。LlamaParse 采用基于 VLM 的智能文档理解技术,可大规模处理复杂版式、表格、图表及手写文字。
我们当前的核心使命是利用 AI 解决文档 OCR 问题。我们所有的产品线,从商业产品(LlamaParse)到开源工具(LiteParse、ParseBench),都完全聚焦于解决这一问题。现正式推出我们全新改版的官网 https://llamaindex.ai/?utm_medium=socials&utm_source=xjl&utm_campaign=2026-apr-…
查看缓存全文
缓存时间:
2026/05/09 04:54
我们今天的核心使命是利用 AI 解决文档 OCR 问题。我们所有的产品线——从商业产品(LlamaParse)到开源项目(LiteParse、ParseBench)——都完全聚焦于解决这一问题。全新改版的官网正式上线:https://llamaindex.ai/?utm_medium=socials&utm_source=xjl&utm_campaign=2026-apr-...
---
# LlamaIndex | 面向文档 OCR 与工作流的 AI 智能体
来源:https://www.llamaindex.ai/?utm_medium=socials&utm_source=xjl&utm_campaign=2026-apr-
LlamaParse 借助 VLM 驱动的文档理解智能体,将原本耗时数小时的人工文档处理压缩至数秒内完成。
- 立即开始使用 (https://cloud.llamaindex.ai/)
- 预约演示 (https://www.llamaindex.ai/contact)
## 免费开始使用 LlamaParse
**免费套餐包含:**
- 每月 10,000 免费积分(约 1000 页)
- 支持布局感知文档解析的智能体 OCR
- 基于自定义 Schema 的结构化数据提取
- 构建并部署端到端文档智能体
- 试用 LlamaParse (https://cloud.llamaindex.ai/)
//
智能体理解
通过语义理解,将复杂布局转换为整洁、可直接供 LLM 使用的输出内容。
专项专家模型
面向特定任务的智能体将文本、图表、表格等内容分解,并路由至对应的专家模块处理。
自动纠错循环
递归检查机制自动检测并修复错误,即使面对模糊扫描件和多模态文档,也能保持高通过率。
手写文字
解析凌乱的手写内容,提取结构化数据,使其可用于 AI 工作流。
表格
提取行、列及关联关系——即使面对密集或不规则布局也游刃有余。
图表
将图表和统计图转换为可供数据管道使用的结构化数据。
- 已处理文档超 **10 亿份**
- 每月软件包下载量超 **2500 万次**
- LlamaParse 用户超 **30 万**
01
LlamaParse
LlamaParse 为企业级文档自动化提供强大支撑,在解析、提取、索引和检索方面达到业界领先水平——兼顾准确性、可配置性与可扩展性。
- 了解更多 (https://www.llamaindex.ai/llamacloud)
- 预约演示 (https://www.llamaindex.ai/contact)
### 解析
业界领先的文档解析能力,支持 50 余种非结构化文件格式——包括内嵌图片、复杂布局、跨页表格,甚至手写笔记。
### 提取
使用基于 Schema 的 LLM 驱动提取智能体,将非结构化内容转化为结构化洞察——无需模型训练。
### 分割
根据自然语言描述,将文档拆分为逻辑段落。
### 分类
使用自然语言规则自动对文档进行分类。
### 索引
企业级分块与向量化嵌入管道,为每次检索调用提供精准、相关的结果,实现最优 RAG 效果。
npm install @llamaindex/liteparse
02
LiteParse
**解析任意文档。本地运行。极速高效。**
由 LlamaParse 团队打造的开源文档解析工具。支持 PDF、Office 文档及图片的文本解析——无需云服务,无需消耗 LLM Token,无任何限制。
- 在 GitHub 上查看 (https://github.com/run-llama/liteparse)
- 了解更多 (https://www.llamaindex.ai/liteparse)
### 完全开源
### 本地极速处理
### 支持所有主流格式
### 输出边界框坐标
为 AI 智能体提供上下文
让 LLM 以接近人类的精度读取复杂文档。
预约演示 (https://www.llamaindex.ai/contact)
替代传统 IDP 系统
无需定制模板,即可实现文档处理现代化升级。
预约演示 (https://www.llamaindex.ai/contact)
多步骤文档智能体
构建可持续运行的智能体,自动化知识型工作。
预约演示 (https://www.llamaindex.ai/contact)
金融
从金融研究和尽职调查到自动化发票处理,各大银行、对冲基金和金融科技企业正借助 AI 重塑工作流。
探索金融行业 (https://www.llamaindex.ai/industry/finance)
保险
风险与保障领域的企业正将非结构化数据转化为可执行洞察——优化承保、审计和理赔处理流程。
探索保险行业 (https://www.llamaindex.ai/industry/insurance)
制造业
领先制造商正利用 AI 从规格说明、操作手册和检测报告中快速准确地提取关键信息。
探索制造业 (https://www.llamaindex.ai/industry/manufacturing)
医疗健康
从病历和医生手写笔记到保险理赔,医疗机构正借助 AI 优化临床与行政工作流程。
探索医疗健康行业 (https://www.llamaindex.ai/industry/healthcare-pharma)
99.9% 正常运行时间
基础设施专为持续运行的文档处理场景设计——在真实生产负载下保持稳定。
企业级安全保障
精细化访问控制、增强数据加密,开箱即符合 HIPAA、GDPR 和 SOC2 合规要求。
专属支持与 SLA
专属技术支持、快速响应时间,以及面向关键 AI 业务定制的 SLA 协议。
灵活部署方式
可在我们的安全云环境中运行,也可完全部署于您的 VPC,满足数据驻留要求。
专为在生产环境中运行 AI 的团队而构建,兼顾可靠性、安全性与大规模管控能力。
- 预约演示 (https://www.llamaindex.ai/contact)
99.9% 正常运行时间
基础设施专为持续运行的文档处理场景设计——在真实生产负载下保持稳定。
企业级安全保障
精细化访问控制、增强数据加密,开箱即符合 HIPAA、GDPR 和 SOC2 合规要求。
专属支持与 SLA
专属技术支持、快速响应时间,以及面向关键 AI 业务定制的 SLA 协议。
灵活部署方式
可在我们的安全云环境中运行,也可完全部署于您的 VPC,满足数据驻留要求。
"LlamaParse 大幅简化了复杂文档的解析过程,这对端到端 AI 开发至关重要。"
"我们对 LlamaParse 与市面上所有同类工具进行了基准测试。它的输出结果最为可靠,格式最为整洁——尤其在处理我们最棘手的内容时表现突出。"
"LlamaParse 是企业智能体管道中解析复杂文档的首选方案。"
相似文章
X AI KOLs Following
LlamaIndex 推出了 liteparse-server,这是一个开源、可自托管的 HTTP 后端,用于解析 PDF、图像和 Office 文档,支持空间布局提取、OCR 和截图生成,专为 AI 和数据工作流设计。
X AI KOLs Following
LlamaIndex 发布了 liteparse-server,这是一个可自托管、无模型的 HTTP API,能够以高空间保真度和隐私保护能力解析多种多样的文档类型。
X AI KOLs Following
LlamaIndex 宣布推出 ParseBench,这是一个用于评估 AI 代理文档解析的新基准,并邀请 AI 工程师参加 5 月 27 日的线上研讨会,讨论其方法论以及如何弥补像 OlmOCR 这样的现有基准中的空白。
X AI KOLs Timeline
Parse-Flow 是 LlamaIndex 构建的一个开源可视化工作流设计器,它将四个文档处理原语——Parse(解析)、Classify(分类)、Split(分割)和 Extract(提取)——串联到一个由 LlamaAgents 工作流驱动的拖拽画布中,能够从非结构化企业文档(如PDF、合同和发票)中可靠地提取结构化数据。
X AI KOLs Following
LlamaParse 现在为 Parse、Extract 和 Classify 任务提供延迟指标,包括排队时间、处理时间和总延迟的详细分解。这有助于用户监控和扩展其文档处理。