태지쌤

로봇 & 코딩교육 No.1 크리에이터

Data Science

상관관계 분석을 위한 3가지 방법: 스피어만, 피어슨, 켄달

태지쌤 2025. 4. 2. 12:58
반응형

맥북

상관관계 분석을 위한 3가지 방법: 스피어만, 피어슨, 켄달

안녕하세요!

데이터 분석과 IT에 관심 있는 여러분을 위해

오늘은 상관관계 분석에 대해 쉽고 재미있게 알아보는 시간을 가져보겠습니다.

데이터를 분석하다 보면 "두 변수 간에 어떤 관계가 있을까?"를 알고 싶을 때가 많죠.

이럴 때 사용하는 것이 바로 상관관계 분석입니다.

상관관계 분석에는 여러 방법이 있지만,

오늘은 가장 널리 쓰이는 스피어만(Spearman),

피어슨(Pearson), 그리고 켄달(Kendall) 방법을 소개하겠습니다.

각각의 방법이 언제, 어떻게 쓰이는지 일반적인 사례를 통해 쉽게 설명할게요!

1. 피어슨 상관계수 (Pearson Correlation Coefficient)

피어슨은 뭐죠?

피어슨 상관계수는 가장 기본적이고 널리 사용되는 상관관계 분석 방법입니다.

두 변수 간의 선형적 관계를 측정합니다.

즉, 한 변수가 증가하면 다른 변수가 일정하게 증가하거나 감소하는지를 확인할 때 사용합니다.

특징

- 값의 범위: -1에서 +1 사이

- +1: 완벽한 양의 상관관계 (한 변수가 증가할 때 다른 변수도 비례적으로 증가)

- 0: 상관관계 없음

- -1: 완벽한 음의 상관관계 (한 변수가 증가할 때 다른 변수는 비례적으로 감소)

- 두 변수 모두 연속형 데이터(숫자 데이터)여야 하며, 데이터가 정규분포를 따를 때 가장 효과적입니다.

예시

- 키와 몸무게의 관계: 키가 클수록 몸무게가 증가한다면 양의 상관관계를 가질 수 있습니다.

- 공부 시간과 시험 점수: 공부 시간이 늘어나면 시험 점수가 높아질 가능성이 크죠.

한계점

피어슨은 데이터가 선형 관계를 가지지 않거나 이상치(outlier)가 많으면 정확도가 떨어질 수 있습니다.

2. 스피어만 상관계수 (Spearman Rank Correlation)

스피어만은 뭐죠?

스피어만 상관계수는 두 변수 간의 순위(서열) 관계를 측정합니다.

즉, 데이터의 값 자체보다는 값들의 순서에 집중합니다.

피어슨과 달리 데이터가 반드시 선형적일 필요는 없으며, 이상치에도 비교적 강합니다.

특징

- 값의 범위: -1에서 +1 사이 (해석은 피어슨과 동일)

- 데이터를 순위로 변환한 후 계산하므로, 숫자뿐만 아니라 서열 데이터를 다룰 수 있습니다.

- 비선형 관계도 측정 가능!

예시

- 학생들의 시험 성적 순위와 운동 능력 순위 간의 관계: 높은 성적을 가진 학생들이 운동 능력도 뛰어난지 확인할 때.

- 영화 평점 순위와 흥행 순위 간의 관계: 평점이 높은 영화가 흥행도 잘 되는지 알아볼 때.

한계점

데이터의 순서만 고려하기 때문에 값 자체의 차이는 반영되지 않습니다.

3. 켄달 타우 (Kendall Tau)

켄달은 뭐죠?

켄달 타우는 두 변수 간의 일치성(consistency)을 측정하는 방법입니다.

스피어만과 유사하지만, 순위 간의 일치 정도를 더 세밀하게 계산합니다.

특히 작은 데이터셋이나 순위 데이터에서 유용합니다.

특징

- 값의 범위: -1에서 +1 사이 (해석은 피어슨과 스피어만과 동일)

- 두 변수 간에 순서가 얼마나 일치하는지를 계산하며, 불일치 정도도 함께 고려합니다.

- 스피어만보다 계산 방식이 조금 더 복잡하지만, 작은 데이터셋에서는 더 정확한 결과를 제공합니다.

예시

- 직원들의 업무 평가 순위와 승진 순위 간의 관계: 업무 평가가 높은 직원이 승진도 잘 되는지 확인할 때.

- 스포츠 경기 결과와 전문가 예상 순위 간의 관계: 전문가 예상이 실제 결과와 얼마나 일치하는지 알아볼 때.

한계점

큰 데이터셋에서는 계산 속도가 느릴 수 있습니다.

언제 어떤 방법을 써야 할까?

마무리

상관관계 분석은 데이터를 이해하고 인사이트를 얻는 데 매우 중요한 도구입니다.

피어슨, 스피어만, 켄달 각각 장단점이 있으니 여러분이 가진 데이터와 분석 목적에 맞게 선택해 보세요!

혹시 더 궁금한 점이나 실습해보고 싶은 사례가 있다면 댓글로 남겨주세요.

감사합니다!

반응형