标签
Databricks 推出 LTAP(湖事务/分析处理),这是一种新的架构,在数据湖中基于单一数据副本统一 OLAP 和 OLTP,消除 ETL 管道,并由 Lakebase 提供支持。这为 AI 应用时代的操作数据、分析数据和流数据提供了单一受管的基础。
本文提出了SANA,一个用于数据湖上探索式问答(EQA)的诊断消融框架,它将端到端代理失败分解为搜索、规划、数据分析和策略组件。在LakeQA和KramaBench上的评估显示,数据分析是一个持续的瓶颈,而搜索在大型场景中是一个主要限制。
LakeQA是一个新的基准,用于在百万级数据湖上进行探索性问答,评估跨文本、表格和知识图谱的多跳推理和组合能力。