data-lake

标签

Cards List
#data-lake

Databricks 推出 LTAP:统一的 OLAP/OLTP 数据架构

Hacker News Top · 2026-06-16 缓存

Databricks 推出 LTAP(湖事务/分析处理),这是一种新的架构,在数据湖中基于单一数据副本统一 OLAP 和 OLTP,消除 ETL 管道,并由 Lakebase 提供支持。这为 AI 应用时代的操作数据、分析数据和流数据提供了单一受管的基础。

0 人收藏 0 人点赞
#data-lake

SANA:大数据湖问答代理的关键因素是什么?

arXiv cs.CL · 2026-06-15 缓存

本文提出了SANA,一个用于数据湖上探索式问答(EQA)的诊断消融框架,它将端到端代理失败分解为搜索、规划、数据分析和策略组件。在LakeQA和KramaBench上的评估显示,数据分析是一个持续的瓶颈,而搜索在大型场景中是一个主要限制。

0 人收藏 0 人点赞
#data-lake

LakeQA:百万级数据湖上的探索性问答基准

arXiv cs.CL · 2026-06-10 缓存

LakeQA是一个新的基准,用于在百万级数据湖上进行探索性问答,评估跨文本、表格和知识图谱的多跳推理和组合能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈