Cube的使用包含创建和构建两个过程。
创建可以理解为“定义数据结构的过程”
构建可以理解为“往定义好的数据结构中添加计算数据的过程”
全量构建和增量构建
新创建的 Cube 只有定义,而没有计算的数据,它的状态是 “DISABLED” 的
要想让 Cube 有数据,还需要对它进行构建,Cube 的构建方式通常有两种:
- 全量构建:构建时读取的数据源是全集
- 增量构建:构建时读取的数据源是子集
增量构建 VS 全量构建
全量构建和增量构建对比如下
-
对于小数据量的 Cube,或者经常需要全表更新的 Cube,使用全量构建需要更少的运维精力,以少量的重复计算降低生产环境中的维护复杂度
-
对于大数据量的 Cube,例如,对于一个包含两年历史数据的 Cube,如果需要每天更新,那么每天为了新数据而去重复计算过去两年的数据就会变得非常浪费,在这种情况下需要考虑使用增量构建
网友评论