태지쌤

로봇 & 코딩교육 No.1 크리에이터

2024/07/05 2

차원 축소: 변수 선택과 변수 추출의 비밀 무기

​차원 축소: 변수 선택과 변수 추출의 비밀 무기 (PCA 포함)​머신러닝과 데이터 분석에서 차원 축소는 고차원 데이터를 저차원 공간으로 변환하는 중요한 기술입니다. 데이터의 차원을 줄이는 것은 데이터 처리 속도 향상, 모델 성능 개선, 과적합 방지 등의 효과를 가져옵니다.이 글에서는 변수 선택과 변수 추출이라는 두 가지 주요 차원 축소 기법을 쉽고 명확하게 설명하고, 각 기법의 장단점, 활용 사례, 실제 적용 방법까지 단계별로 안내합니다. 또한, 변수 추출의 대표적인 방법인 PCA(주성분 분석)에 대해 심층적으로 다루어 이해를 높일 수 있도록 돕겠습니다.​1. 차원의 저주: 고차원 데이터의 문제점데이터의 차원이 높아질수록 데이터 처리에 필요한 계산량과 시간이 기하급수적으로 증가합니다. 이는 데이터 분석..

Data Science 2024.07.05

비지도 학습 결과 평가: 산점도 활용 가이드

비지도 학습 결과 평가: 산점도 활용 가이드​​비지도 학습은 라벨이 없는 데이터를 기반으로 학습하는 머신 러닝 알고리즘입니다.비지도 학습 모델의 성능을 평가하는 것은 도전적인 작업입니다.따라서 다양한 평가 방법들이 제안되었으며, 그 중 산점도(scatter plot)는 비지도 학습 결과를 시각적으로 확인하는 데 유용한 도구입니다.이 글에서는 산점도를 활용한 비지도 학습 결과 평가 방법을 단계별로 설명하고, 각 단계에서 고려해야 할 사항과 주의점을 알아보겠습니다.​1. 데이터 준비 및 전처리데이터 불균형 문제 해결: 데이터 세트에 불균형이 존재하는 경우, 표본 추출(sampling) 또는 데이터 변환(data transformation)을 통해 불균형을 해소해야 합니다.데이터 정규화: 데이터의 척도가 서로..

Data Science 2024.07.05
반응형