태지쌤

로봇 & 코딩교육 No.1 크리에이터

Data Science

[정오분류표] 정확도, 민감도, 특이도 헷갈리지 않는 완벽 가이드

태지쌤 2024. 7. 4. 12:30
반응형

정오분류표, 정확도, 민감도, 특이도: 헷갈리지 않는 완벽 가이드

 

데이터 분석과 머신러닝 분야에서 정오분류표(Confusion Matrix), 정확도(Accuracy), 민감도(Sensitivity), 특이도(Specificity)는 핵심적인 개념입니다. 하지만 이 개념들은 서로 밀접하게 관련되어 있으면서도 미묘한 차이를 가지고 있어 일반인들에게는 헷갈릴 수 있습니다.

이 글에서는 정오분류표를 기반으로 정확도, 민감도, 특이도정의, 계산 방법, 상호 연관 관계쉽고 명확하게 설명하여 헷갈림 없이 이해할 수 있도록 도와드리겠습니다.

1. 정오분류표: 예측 결과의 진실을 표로 보여주다

정오분류표는 실제 결과와 예측 결과를 비교하여 모델의 성능을 평가하는 데 사용되는 표입니다.

분류
실제 양성
실제 음성
예측 양성
TP (True Positive)
FP (False Positive)
예측 음성
FN (False Negative)
TN (True Negative)
  • TP: 실제로 양성인 경우 모델이 양성으로 예측한 경우
  • FP: 실제로 음성인 경우 모델이 양성으로 예측한 경우 (오류)
  • FN: 실제로 양성인 경우 모델이 음성으로 예측한 경우 (오류)
  • TN: 실제로 음성인 경우 모델이 음성으로 예측한 경우

 

2. 정확도: 얼마나 정확하게 맞추었는지

정확도는 모델이 전체 예측 중 얼마나 많은 예측을 정확하게 했는지를 나타내는 지표입니다.

정확도 = (TP + TN) / (TP + FP + FN + TN)

3. 민감도: 실제 양성을 얼마나 잘 찾아냈는지

민감도는 실제로 양성인 경우 모델이 양성으로 예측한 비율을 나타내는 지표입니다.

민감도 = TP / (TP + FN)

4. 특이도: 실제 음성을 얼마나 잘 구분했는지

특이도는 실제로 음성인 경우 모델이 음성으로 예측한 비율을 나타내는 지표입니다.

특이도 = TN / (TN + FP)

5. 정확도 vs 민감도 vs 특이도: 상황에 맞는 지표 선택

  • 정확도: 전반적인 모델 성능을 평가하는 데 유용하지만, 데이터 불균형 (예: 양성 데이터보다 음성 데이터가 훨씬 많은 경우)에서는 오해의 소지가 있을 수 있습니다.
  • 민감도: 실제로 양성인 경우를 얼마나 놓치지 않고 찾아내는지가 중요한 경우 (예: 질병 진단)에 유용합니다.
  • 특이도: 실제로 음성인 경우를 얼마나 잘 구분하는지가 중요한 경우 (예: 스팸 필터)에 유용합니다.

6. 예시: 의료 진단 모델 평가

의료 진단 모델을 평가하는 경우, 민감도더 중요할 수 있습니다. 왜냐하면 질병을 가진 환자를 놓치는 것은 심각한 결과를 초래할 수 있기 때문입니다. 반면, 특이도건강한 환자를 오진하는 것을 방지하는 데 중요합니다.

7. 결론: 상황에 맞는 지표 활용

정오분류표, 정확도, 민감도, 특이도는 모델 성능을 다각적으로 평가하는 데 중요한 지표입니다. 데이터의 특성과 분석 목적에 따라 적절한 지표를 선택하고 해석하는 것이 중요합니다.

https://link.coupang.com/a/bIeyaJ

 

LG전자 2024 그램 프로 360 16 코어Ultra7

COUPANG

www.coupang.com

반응형