W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗(yàn)值獎勵
GROUP BY 算子主要用于在 SQL 中進(jìn)行分組聚合計(jì)算操作。
用于對數(shù)據(jù)進(jìn)行分組的算法有 HASH 算法和 MERGE 算法,因此根據(jù)算法可以將 GROUP BY 算子分為兩種:HASH GROUP BY 和 MERGE GROUP BY。執(zhí)行計(jì)劃生成時根據(jù) SQL 優(yōu)化器對于兩種算子的代價評估,來選擇使用哪種 GROUP BY 算子。
對于普通的聚合函數(shù)(SUM/MAX/MIN/AVG/COUNT/STDDEV)也是通過分配 GROUP BY 算子來完成,而對于只有聚合函數(shù)而不含有 GROUP BY 的 SQL,分配的是 SCALAR GROUP BY 算子,因此 GROUP BY 算子又可以分為三種:SCALAR GROUP BY、HASH GROUP BY 和 MERGE GROUP BY。
示例 1:含 SCALAR GROUP BY 算子的執(zhí)行計(jì)劃
obclient>CREATE TABLE t1(c1 INT, c2 INT);
Query OK, 0 rows affected (0.12 sec)
obclient>INSERT INTO t1 VALUES(1, 1);
Query OK, 1 rows affected (0.12 sec)
obclient>INSERT INTO t1 VALUES(2, 2);
Query OK, 1 rows affected (0.12 sec)
obclient>INSERT INTO t1 VALUES(3, 3);
Query OK, 1 rows affected (0.12 sec)
Q1:
obclient> EXPLAIN SELECT SUM(c1) FROM t1\G;
*************************** 1. row ***************************
Query Plan:
| ========================================
|ID|OPERATOR |NAME|EST. ROWS|COST|
----------------------------------------
|0 |SCALAR GROUP BY| |1 |37 |
|1 | TABLE SCAN |T1 |3 |37 |
========================================
Outputs & filters:
-------------------------------------
0 - output([T_FUN_SUM(T1.C1)]), filter(nil),
group(nil), agg_func([T_FUN_SUM(T1.C1)])
1 - output([T1.C1]), filter(nil),
access([T1.C1]), partitions(p0)
上述示例中,Q1 查詢的執(zhí)行計(jì)劃展示中的 outputs & filters 中詳細(xì)列出了 SCALAR GROUP BY 算子的輸出信息如下:
信息名稱 |
含義 |
---|---|
output |
該算子輸出的表達(dá)式。 |
filter |
該算子上的過濾條件。 由于示例中 SCALAR GROUP BY 算子未設(shè)置 filter,所以為 nil。 |
group |
需要進(jìn)行分組的列。 例如,Q1 查詢中是 SCALAR GROUP BY 算子,所以為 nil。 |
agg_func |
所涉及的聚合函數(shù)。 例如,Q1 查詢是計(jì)算表 t1 的 c1 列數(shù)據(jù)之和,因此為 |
示例 2:含 HASH GROUP BY 算子的執(zhí)行計(jì)劃
Q2:
obclient>EXPLAIN SELECT SUM(c2) FROM t1 GROUP BY c1 HAVING SUM(c2) > 2\G;
*************************** 1. row ***************************
Query Plan:
| ======================================
|ID|OPERATOR |NAME|EST. ROWS|COST|
--------------------------------------
|0 |HASH GROUP BY| |1 |40 |
|1 | TABLE SCAN |T1 |3 |37 |
======================================
Outputs & filters:
-------------------------------------
0 - output([T_FUN_SUM(T1.C2)]), filter([T_FUN_SUM(T1.C2) > 2]),
group([T1.C1]), agg_func([T_FUN_SUM(T1.C2)])
1 - output([T1.C1], [T1.C2]), filter(nil),
access([T1.C1], [T1.C2]), partitions(p0)
上述示例中,Q2 查詢的執(zhí)行計(jì)劃展示中的 outputs & filters 詳細(xì)列出了 HASH GROUP BY 算子的輸出信息如下:
信息名稱 |
含義 |
---|---|
output |
該算子輸出的表達(dá)式。 |
filter |
該算子上的過濾條件。 由于設(shè)置要求分組后的 c2 列求和大于 2,因此為 |
group |
需要進(jìn)行分組的列。 例如,Q2 查詢是 HASH GROUP BY 算子,所以為 nil。 |
agg_func |
所涉及的聚合函數(shù)。 例如,Q2 查詢中計(jì)算表 t1 的 c1 列之和,因此為 |
說明
HASH GROUP BY 算子將會保證在執(zhí)行時采用 HASH 算法進(jìn)行分組。
示例 3:含 MERGE GROUP BY 算子的執(zhí)行計(jì)劃
Q3:
obclient>EXPLAIN SELECT /*+NO_USE_HASH_AGGREGATION*/SUM(c2) FROM
t1 GROUP BY c1 HAVING SUM(c2) > 2\G;
*************************** 1. row ***************************
Query Plan:
| =======================================
|ID|OPERATOR |NAME|EST. ROWS|COST|
---------------------------------------
|0 |MERGE GROUP BY| |1 |45 |
|1 | SORT | |3 |44 |
|2 | TABLE SCAN |T1 |3 |37 |
=======================================
Outputs & filters:
-------------------------------------
0 - output([T_FUN_SUM(T1.C2)]), filter([T_FUN_SUM(T1.C2) > 2]),
group([T1.C1]), agg_func([T_FUN_SUM(T1.C2)])
1 - output([T1.C1], [T1.C2]), filter(nil), sort_keys([T1.C1, ASC])
2 - output([T1.C1], [T1.C2]), filter(nil),
access([T1.C1], [T1.C2]), partitions(p0)
上述示例中,Q3 查詢的執(zhí)行計(jì)劃展示中的 outputs & filters 中詳細(xì)列出了 MERGE GROUP BY 算子的信息,可以看出相同的 SQL 生成執(zhí)行計(jì)劃時選擇了 MERGE GROUP BY 算子,其算子基本信息都是相同的,最大的區(qū)別是在執(zhí)行的時候選擇的分組算法不一樣。同時,這里的 2 號算子 TABLE SCAN 返回的結(jié)果是一個無序結(jié)果,而 GROUP BY 算法采用的是 MERGE GROUP BY,因此必須分配一個 SORT 算子。
注意
NO_USE_HASH_AGGREGATION 和 USE_HASH_AGGREGATION 的 HINT 可以用于控制 GROUP BY 算子選擇何種算法進(jìn)行分組。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: