Skip to content

Commit 1a9d2d4

Browse files
committed
usecase
1 parent 0ea1343 commit 1a9d2d4

File tree

1 file changed

+8
-0
lines changed

1 file changed

+8
-0
lines changed

_posts/2024-11-27-join_algorithms.md

Lines changed: 8 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -101,9 +101,17 @@ end
101101
- 어떤 조인 알고리즘이든 사용 가능하다.
102102
- 큰 테이블은 다른 노드로 전달되지 않아도 되기 때문에 네트워크 비용이 절감된다.
103103

104+
# 분산 쿼리엔진 사용사례
105+
- spark 2.3 버전부터는 sort-merge join을 선호한다.
106+
- 메모리 안정성을 높게 평가한 것으로 보인다.
104107

105108
![](https://miro.medium.com/v2/resize:fit:1400/format:webp/1*EQOwbBV0AmDIvWfBtP4RCw.png)
106109

110+
- trino / presto에서는 hash join을 선호한다. sort-merge 조인이 미구현되어 있다.
111+
- datafusion은 hash join을 선호한다.
112+
113+
전반적으로 노드 메모리에 가까운 데이터를 조인하는 경우 sort-merge join이 빠르고, 그렇지 않은 경우 hash join이 빠르다고 한다.
114+
107115
# 참고
108116
- Database System Concepts, 7th Edition. *Abraham Silberschatz, Henry F. Korth, S. Sudarshan. McGraw-Hill Education. 2019.*
109117
- [CS186 berkely lecture](https://www.youtube.com/@CS186Berkeley/videos)

0 commit comments

Comments
 (0)