定制網站費用南寧seo專員
在Hive中,有四個BY比較:Order By、Sort By、Distribute By和Cluster By。
-
Order By是全局排序,只有一個Reducer。它可以按照升序(ASC)或降序(DESC)對結果進行排序。Order By子句通常用在SELECT語句的結尾。
-
Sort By是對每個Reducer內部的數據進行排序。它不保證全局排序,但可以在每個Reducer內部對結果進行排序。
-
Distribute By是用于對Reducer的數據進行分發(fā)。它指定了數據的分發(fā)方式,但不保證排序。
-
Cluster By是對數據進行排序和分發(fā),相當于同時使用了Sort By和Distribute By。
因此,Order By是全局排序,Sort By是Reducer內部排序,Distribute By是數據分發(fā),而Cluster By是排序和分發(fā)的組合操作。