一、数据字典介绍
数据字典是ClickHouse提供一种非常简单且实用的存储媒介,他以键值和属性映射的形式定义数据。字典中的数据会主动或被动加载到内存并支持动态更新。由于字典数据常驻内存的特性,所以非常适合保存常量或经常使用的维度表数据,从而避免不必要的JOIN查询。
数据字典分为内置与扩展两种形式,内置字典顾名思义就是ClickHouse 默认自带的字典,而外部字典是用户通过自定义配置实现的字典,也叫扩展字典。
正常情况下,字典中的数据只能通过字典函数访问(ClickHouse设置了一类字典函数,专门用于字典数据的取用)。但是也有一种例外,那就是使用特殊的字典表引擎,在字典表引擎的帮助下,可以将数据字典挂载到一张代理的数据表下,从而实现数据表与字典数据的JOIN查询。
1.1 内置字典
ClickHouse目前只有一种内置字典:Yandex.Metrica字典,从名称上来看,这个字典是ClickHouse自家产品上的字典,而他设计目的是快速存取地理数据。较为遗憾的是,由于版权原因,Yandex并没有将geo地理数据开放出来。这意味着,ClickHouse目前的内置字典只是提供了定义机制和取数的函数,所以内置字典的现状较为尴尬,需要遵循它的规范自行导入数据,由于现实工作中使用场景很少,只做了解即可。
1.2 外部扩展字典
外部扩展字典是以插件的形式注册到ClickHouse中,由用户自定义数据模式以及数据来源,目前扩展字典支持7种类型的内存布局和4类数据来源,性比内置字典,扩展字典才是更适合更多的业务场景。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/143216.html