打开导航
全部产品
MPP云数仓
前言
概述
阅读对象
词汇表
产品简介
产品概述
产品优势
使用模式及场景
管理员快速入门
账户系统
数据中心
数据中心配置
对象存储区域
对象存储区域配置
配额管理
初始化租户
终端用户快速入门
选择集群类型
创建数据仓库集群
开始使用数据仓库集群
最佳实践
数据模型
堆存储和追加优化存储
行式存储和列式存储
压缩
分布
内存管理
分区
索引
资源队列
ANALYZE
VACCUM
加载
安全
加密
运维操作
基础环境巡检
网络检查
服务状态检查
常用运维操作
常见问题
创建集群失败的处理
集群操作失败的处理
租户端
大数据
MPP云数仓
最佳实践
分布
最近更新时间: 2019-10-25 08:04:45
为所有表定义分布策略:要么定义分布键,要么使用随机分布,不要使用缺省分布方式。
优先选择可均匀分布数据的单个字段做分布键。
不要选择经常用于 WHERE 子句的字段做分布键。
不要使用日期或时间字段做分布键。
分布键和分区键不要使用同一字段。
对经常执行 JOIN 操作的大表,优先考虑使用关联字段做分布键,尽量做到本地关联,以提高性能。
数据初始加载后或者每次增量加载后,检查数据分布是否均匀。
尽可能避免数据倾斜