南大通用GBase 8a做distinct、group和join时避免严重数据倾斜导致的性能问题

在执行distinct、group、join是由多个列参数时,如果投影列里没有Hash分布列,则会选择一个列做hash动态重分布。GBase 8a数据库集群通过_t_gcluster_distinct_multi_redist和_t_gcluster_hash_redistribute_groupby_on_multiple_expression参数,可以指定多个列参与hash计算,避免GBase 8a做distinct、group、join时通过指定多列动态Hash重分布避免严重数据倾斜导致的性能问题。