@Greptime:Erxi(@WangErxi)现在成为 GreptimeDB 的提交者。Erxi 这个名字暗藏一点文字游戏。它来自中文词“无名”……

X AI KOLs Following 新闻

摘要

Erxi 在贡献了包括 meta KV 写入保护、flush 原因传播以及 CSV COPY 修复等多项改进后,被欢迎成为 GreptimeDB 的新提交者。

Erxi(@WangErxi)现在成为 GreptimeDB 的提交者。Erxi 这个名字暗藏一点文字游戏:它来自中文词“无名”——只保留两个字符的上半部分,就变成了“二夕”(Erxi)。他之所以被 GreptimeDB 吸引,是因为稳定性。多年的值班经验让他深知稳定的重要性,而 Rust 代码库意味着很少有系统级的生产事故。两个月后,他已经提交了 meta KV 写入保护、flush 原因传播、可取消的INSERT...SELECT,以及一系列 CSV COPY 修复。他还参与 Apache Paimon 的开发,并维护自己的 GreptimeDB Flink 连接器。欢迎加入。
查看原文
查看缓存全文

缓存时间: 2026/06/08 19:29

Erxi (@WangErxi) 现已成为 GreptimeDB 提交者。Erxi——这个名字暗藏巧思:它取自中文“无名“二字,仅保留两个字符的上半部分,便成了“二夕“(Erxi)。吸引他加入 GreptimeDB 的是稳定性。多年值班经验让他深知稳定的价值,而 Rust 代码库意味着几乎不会出现系统级生产故障。两个月后,他已交付了 meta KV 写保护、刷新原因传播、可取消的 INSERT…SELECT 以及一系列 CSV COPY 修复。他同时还在参与 Apache Paimon 项目,并维护着自己的 GreptimeDB Flink 连接器。欢迎加入。


欢迎新提交者 Erxi | Greptime 双周报 - 第 84 期

来源:https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report 欢迎 Erxi 成为 GreptimeDB 提交者

我们很高兴地欢迎 Erxi (https://github.com/QuakeWang) 成为新的 GreptimeDB 提交者!

他在社区中被称为 Erxi——这个名字暗藏巧思:它取自中文“无名“二字:仅保留两个字符的上半部分,便成了“二夕“(Erxi)。

Erxi 有着大数据和 OLAP DBA 背景。最初吸引他的是 GreptimeDB 的稳定性——多年运行生产系统的经验让他深知其重要性。在与 Wayne 的交流中,他了解到 GreptimeDB 很少出现系统性的严重生产问题,大多数问题都是逻辑相关而非系统性的——他认为部分原因在于该产品是用 Rust 编写的。他参与得越多,就越欣赏该项目即使在有公司支持的情况下,仍能保持开源、对贡献者友好的社区氛围。

在 GreptimeDB 中,他的兴趣涵盖存储与刷新行为、大数据生态集成以及可观测性。过去两个月,他完成了一系列有意义的工作,包括:

  • 加固 metasrv 控制平面——撤销 metasrv 领导者之外的 meta KV 写入(#8060 (https://github.com/GreptimeTeam/greptimedb/pull/8060))
  • 刷新可观测性——通过 FlushRegions 路径传播刷新原因(#8051 (https://github.com/GreptimeTeam/greptimedb/pull/8051))
  • 查询生命周期——在进程管理器中跟踪 INSERT ... SELECT 以便取消,并涵盖 KILL 支持(#8138 (https://github.com/GreptimeTeam/greptimedb/pull/8138), #8151 (https://github.com/GreptimeTeam/greptimedb/pull/8151))
  • 管道易用性——允许在管道中进行详细的索引配置(#8036 (https://github.com/GreptimeTeam/greptimedb/pull/8036))
  • Mito 选项校验 (#8094 (https://github.com/GreptimeTeam/greptimedb/pull/8094)) 和 gRPC CLI 选项命名对齐 (#8021 (https://github.com/GreptimeTeam/greptimedb/pull/8021))
  • COPY FROM CSV 可用性——跳过错误记录 (#8198 (https://github.com/GreptimeTeam/greptimedb/pull/8198)) 以及支持无表头 CSV (#8233 (https://github.com/GreptimeTeam/greptimedb/pull/8233))

除了 GreptimeDB,Erxi 还活跃于 Apache Paimon 社区——尤其是 paimon-rust 项目以及与 Ray Data 和 Daft 的集成——他维护着个人项目 GreptimeDB Flink 连接器 (https://github.com/QuakeWang/greptimedb-flink-connector),最近还在探索 AI 可观测性和多模态数据处理。

用他自己的话来说,他不想给自己贴太多标签——只是一个“喜欢探索和构建有趣事物的开发者“。你可以在 X (https://x.com/WangErxi) 和 GitHub (https://github.com/QuakeWang) 上找到他。

欢迎加入,Erxi!🚀

总结 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#summary)

开发周期:2026-05-18 至 2026-05-31

以下是近期提交的亮点:

  • 现在可以通过 meta-srv 对表进行重新分区,无需删除再重建
  • Flow 查询通过检查点支持跟踪增量读取位置
  • 查询预过滤器缓存结果以跳过重复的 Parquet 行组扫描

我们建议旧版本用户升级以获取这些修复和改进。

贡献者 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#contributors)

过去两周,共有 15 位贡献者 合并了 50 个 PR。其中 4 位个人贡献者 贡献了 5 个 PR。欢迎我们的新贡献者:@rogierlommers (https://github.com/rogierlommers)

感谢以下个人贡献者:

  • @QuakeWang (https://github.com/QuakeWang): db#8151 (https://github.com/GreptimeTeam/greptimedb/pull/8151), db#8138 (https://github.com/GreptimeTeam/greptimedb/pull/8138)
  • @yihong0618 (https://github.com/yihong0618): db#8158 (https://github.com/GreptimeTeam/greptimedb/pull/8158)
  • @Copilot (https://github.com/Copilot): db#8185 (https://github.com/GreptimeTeam/greptimedb/pull/8185)

近期 PR 亮点 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#highlights-of-recent-prs)

db#8179 (https://github.com/GreptimeTeam/greptimedb/pull/8179) feat(flow): 支持增量读取检查点 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#db-8179-feat-flow-support-incremental-read-checkpoints)

Flow 查询现在在处理支持的聚合 SQL 模式时,可以使用增量检查点而非全表扫描。系统跟踪区域水位线以安全推进检查点,并将增量结果与现有 sink 状态合并,从而减少连续数据处理工作负载的计算开销。

db#8108 (https://github.com/GreptimeTeam/greptimedb/pull/8108) feat: 增量查询连接重写辅助器 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#db-8108-feat-inc-query-join-rewrite-helper)

现在可以通过新的查询重写辅助器将增量查询重写为与 sink 表的连接。此内部优化为更高效的增量查询执行模式奠定了基础。

db#8154 (https://github.com/GreptimeTeam/greptimedb/pull/8154) feat: 为终端水位线添加 flow 查询上下文管道 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#db-8154-feat-add-flow-query-context-plumbing-for-terminal-watermarks)

Flow 任务现在可以通过前端客户端中的新管道传播查询上下文并收集终端水位线指标。此基础设施为增量 Flow 读取做准备,同时不改变当前的批处理执行行为。

db#8186 (https://github.com/GreptimeTeam/greptimedb/pull/8186) feat(meta-srv): 支持对未分区表进行重新分区 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#db-8186-feat-meta-srv-support-repartition-for-unpartitioned-tables)

此前,重新分区仅适用于已定义了分区键的表。现在 repartition 过程可以通过添加分区键索引并将单个区域拆分为多个区域,将未分区表转换为分区表。

db#8102 (https://github.com/GreptimeTeam/greptimedb/pull/8102) feat: 为预过滤器实现缓存 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#db-8102-feat-implement-a-cache-for-the-prefilter)

现在对同一 Parquet 行组进行重复扫描时,将重用来自新的 PrefilterResultCache 的先前计算过滤结果,而不是重新读取和重新评估过滤列。缓存以行组和过滤表达式为键,可通过新的 prefilter_result_cache_size 选项设置大小限制(默认 128MB)。

好的入门问题 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#good-first-issue)

Issue#8227 (https://github.com/GreptimeTeam/greptimedb/issues/8227) 时间戳显示精度应遵循列模式 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#issue-8227-timestamp-display-precision-should-respect-column-schema)

通过 MySQL/PostgreSQL CLI 查询时,时间戳渲染并不总是遵循列模式定义的精度——例如,TIMESTAMP(9) 列会被截断为微秒。请修复格式化以遵循每列声明的精度。

  • 关键词:MySQL 协议、时间戳格式化
  • 难度:简单

Issue#7987 (https://github.com/GreptimeTeam/greptimedb/issues/7987) feat: 添加 flow_statistics 系统表和 SHOW FLOW STATUS 命令,用于 flow 运行时可观测性 (https://greptime.com/blogs/2026-05-31-greptimedb-biweekly-report#issue-7987-feat-add-flow-statistics-system-table-and-show-flow-status-for-flow-runtime-observability)

添加一个名为 flow_statistics 的系统表以及一个 SHOW FLOW STATUS SQL 命令,用于显示 flow 运行时信息,如启动时间、运行时间、已处理数据量和最近的错误。

  • 关键词:SQL 解析器、可观测性
  • 难度:中等

相似文章