南大通用GBase 8a在做非Hash列的group时,默认策略是将各个节点的数据先在本地group后,再将结果发到临时表做二次聚合。此方案在聚合列唯一值少,聚合结果行数相比原始数据行数有明显降低时是非常适合的,但如果聚合结果没有降低,比如1000万行聚合后999万行,汇总到临时表后二次聚合,结果还是在999万行,则第一次的本地聚合就出现了资源浪费。GBase 8a提供了一个可选参数,通过延迟聚合来提升性能。
国产南大通用GBase数据库使用体验
南大通用GBase 8a在做非Hash列的group时,默认策略是将各个节点的数据先在本地group后,再将结果发到临时表做二次聚合。此方案在聚合列唯一值少,聚合结果行数相比原始数据行数有明显降低时是非常适合的,但如果聚合结果没有降低,比如1000万行聚合后999万行,汇总到临时表后二次聚合,结果还是在999万行,则第一次的本地聚合就出现了资源浪费。GBase 8a提供了一个可选参数,通过延迟聚合来提升性能。