[SQL#6] 서브쿼리(Subquery) (2) - join, natural join, outer join

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

공대생의 공부흔적

[SQL#6] 서브쿼리(Subquery) (2) - join, natural join, outer join 본문

Database & Big Data/SQL

[SQL#6] 서브쿼리(Subquery) (2) - join, natural join, outer join

생대공 2024. 3. 16. 00:17

참고: Database Systems: The Complete Book (2nd edition) - 6.3 Subqueries

이번 글에서는 서브쿼리 중 SQL의 join에 대해 알아볼 것이다.

두 개의 relation은 product, theta join, natural join, outerjoin으로 join될 수 있다. 예시를 바탕으로 하나씩 알아보자.

Movies(title, year, length)
StarsIn(movieTitle, movieYear, starName)

Movies	title	year	length	StarsIn	movieTitle	movieYear	starName
	t1	y1	l1		t1	y1	s1
	t1	y2	l2		t2	y2	s2

Cross Join (product)

가장 간단한 join의 형태는 cross join이다. 다른 말로 cartesian product나 product라 부른다.

Movies CROSS JOIN StarsIn;

CROSS JOIN은 문법상 여러 relation을 comma로 연결하는 것과 동일하다.

Movies, StarsIn;

위와 같은 CROSS JOIN의 결과는 다음과 같다. Movies의 모든 튜플과 StarsIn의 모든 튜플의 가능한 모든 조합이 결과값이 된다.

title	year	length	movieTitle	movieYear	starName
t1	y1	l1	t1	y1	s1
t1	y1	l1	t2	y2	s2
t2	y2	l2	t1	y1	s1
t2	y2	l2	t2	y2	s2

Theta join

ON 키워드와 함께 쓰는 theta join은 ON 뒤에 오는 조건을 만족하는 R×S의 product를 의미한다.

Movies JOIN StarsIn ON
	title = MovieTitle AND year = movieYear;

이러한 쿼리의 경우 리턴 결과는 다음과 같다.

title	year	length	movieTitle	movieYear	starName
t1	y1	l1	t1	y1	s1
t2	y2	l2	t2	y2	s2

Natural join

Natural join은 단순히 공통된 attribute를 찾는 연산으로, 두 개의 relation이 동일한 이름의 attribute를 갖는 경우라는 점에서 theta-join과는 차이점이 있다. attribute의 교집합 연산이라고 이해해도 될 것 같다.

예시로 사용하는 Movies와 StarsIn relation을 서로 같은 이름의 attribute를 갖도록 다음과 같이 바꿔보자.

Movies	title	year	length	StarsIn	title	year	starName
	t1	y1	l1		t1	y1	s1
	t1	y2	l2		t2	y2	s2

이 경우, natural join 쿼리는 다음과 같이 표현되며,

Movies NATURAL JOIN StarsIn;

이때의 결과는 아래와 같다.

title	year	length	starName
t1	y1	l1	s1
t2	y2	l2	s2

Outer join

outer join은 join의 결과를 null 값으로 패딩된 dangling tuple을 이용해 확장시키는 방식이다. 다음과 같이 StarsIn relation의 두 번째 튜플을 (t3, y3, s3)으로 변화시켜 생각해 보자.

Movies	title	year	length	StarsIn	title	year	starName
	t1	y1	l1		t1	y1	s1
	t1	y2	l2		t3	y3	s3

NATURL LEFT OUTER JOIN

Movies NATURL LEFT OUTER JOIN StarsIn;

이 쿼리는 Movies relation의 모든 tuple을, StarsIn 및 Movies relation의 모든 attribute과 연결시킨다. StarsIn의 attribute가 없는 Movies의 tuple (t1, y2, l2)에는 해당 attribute에 NULL 값을 넣어 리턴한다.

title	year	length	starName
t1	y1	l1	s1
t2	y2	l2	NULL

NATURL RIGHT OUTER JOIN

Movies NATURL RIGHT OUTER JOIN StarsIn;

left와 동일한 방식으로, 오른쪽에 있는 StarsIn relation의 모든 tuple을 확장하는 연산이다.

title	year	length	starName
t1	y1	l1	s1
t3	y3	NULL	s3

NATURAL FULL OUTER JOIN

Movies NATURAL FULL OUTER JOIN StarsIn;

양쪽 모두, 즉 Movies와 StarsIn relation의 모든 tuple을 각 attribute에 대응하여 확장한다.

title	year	length	starName
t1	y1	l1	s1
t2	y2	l2	NULL
t3	y3	NULL	s3

FULL OUTER JOIN ... ON

natural join이 아닌 theta join으로도 (full) outer join을 구현할 수 있다. 즉, attribute의 이름이 relation 간 동일하지 않은 경우에도 조건을 통해서 만족하는 product의 값을 추출해낼 수 있다. 다시 attribute의 이름을 처음처럼 되돌려 생각해보자.

Movies	title	year	length	StarsIn	moiveTitle	movieYear	starName
	t1	y1	l1		t1	y1	s1
	t2	y2	l2		t3	y3	s3

Movies FULL OUTER JOIN StarsIn ON
	title = movieTitle AND year = movieYear;

이러한 쿼리의 경우, Movies와 StarsIn의 모든 튜플이 ON 이후의 조건(title = movieTitle과 year = movieYear) 만족하는 경우 그대로, 아닌 경우 패딩된 NULL과 함께 결과로 리턴된다.

title	year	length	movieTitle	movieYear	starName
t1	y1	l1	t1	y1	s1
t2	y2	l2	NULL	NULL	NULL
NULL	NULL	NULL	t3	y3	l3

Redundancy

어떤 join 연산들은 select-from-where로 대체될 수 있다.

R CROSS JOIN S는 SELECT * FROM R, S 와 동일하다.
R NATURAL JOIN S는 SELECT A, B, C FROM R, S WHERE R.A = S.A 와 동일하다. (R은 A,B, S는 A,C의 attribute을 가진다고 가정)
R FULL OUTER JOIN S는 select-from-where로 대체될 수 없다.

저작자표시

'Database & Big Data > SQL' 카테고리의 다른 글

[SQL#5] 서브쿼리(Subquery) (1) - 스칼라 값을 생산하는 서브쿼리, Relation/Tuple과 관련된 조건들, correlated 서브쿼리, FROM/SELECT에서의 서브쿼리 (1)	2024.03.15
[SQL#4] 여러 relation을 포함하는 쿼리: UNION, INTERSECT, EXCEPT (0)	2024.03.15
[SQL#3] 문자열 패턴 매칭, NULL을 포함하는 연산/비교, 쿼리 결과 정렬 (0)	2024.03.09
[SQL#2] 쿼리(Simple Query), Projection, Selection (0)	2024.03.09
[SQL#1] Relational Model 구현하기 (2)	2024.03.07

'Database & Big Data/SQL' Related Articles

공대생의 공부흔적

[SQL#6] 서브쿼리(Subquery) (2) - join, natural join, outer join 본문

[SQL#6] 서브쿼리(Subquery) (2) - join, natural join, outer join

Cross Join (product)

Theta join

Natural join

Outer join

NATURL LEFT OUTER JOIN

NATURL RIGHT OUTER JOIN

NATURAL FULL OUTER JOIN

FULL OUTER JOIN ... ON

Redundancy

'Database & Big Data > SQL' 카테고리의 다른 글

티스토리툴바