2.5k 2 分钟

CatalogObjectCache 是个缓存对象,为了缓存 CatalogdObjects,它是线程安全的。仅在新建或更新较新版本时执行真正的更新,add 和 remove 方法也需要更新全局实例 CatalogObjectVersionSet,它保持 catalog 版本的跟踪。

5.9k 5 分钟

Impala 的词法解析使用语法分析生成器 JFlex 和 Java 语法解析器自动生成工具 CUP,具体原理和使用见官方文档,本文只分析一个简单的 SELECT 语句。

4.2k 4 分钟

# 简介

Impala 是一个分布式,大规模并行处理数据库引擎。

  • 支持 SQL 实时查询
  • 由 Java 和 C++ 实现
  • 共享 Hive Metastore
  • 支持多种数据存储格式,如 Text、Parquet、Avro 等
  • 支持多种数据存储引擎,如 HDFS、KUDU、S3 等
  • 能够与 Hadoop 集成
  • ...

18k 16 分钟

MetaStore 是 Hive 的元数据服务,本文会从使用和部署上分析,着重说明它的元数据格式。然后从 Impala 的角度,分析使用方式和元数据存储。