태지쌤

로봇 & 코딩교육 No.1 크리에이터

Data Science 88

상관관계 분석을 위한 3가지 방법: 스피어만, 피어슨, 켄달

맥북 Apple 2024 맥북 프로 14 M4 - 노트북 | 쿠팡 현재 별점 4.9점, 리뷰 337개를 가진 Apple 2024 맥북 프로 14 M4! 지금 쿠팡에서 더 저렴하고 다양한 노트북 제품들을 확인해보세요. www.coupang.com Apple 2024 맥북 프로 14 M4 - 노트북 | 쿠팡 현재 별점 4.9점, 리뷰 337개를 가진 Apple 2024 맥북 프로 14 M4! 지금 쿠팡에서 더 저렴하고 다양한 노트북 제품들을 확인해보세요. www.coupang.com ​ 상관관계 분석을 위한 3..

Data Science 2025.04.02

선형 회귀분석에서 수정된 결정계수(Adjusted R²)가 생겨난 이유는?

https://link.coupang.com/a/cmraJ0 Apple 2024 맥북 프로 14 M4 - 노트북 | 쿠팡현재 별점 4.9점, 리뷰 337개를 가진 Apple 2024 맥북 프로 14 M4! 지금 쿠팡에서 더 저렴하고 다양한 노트북 제품들을 확인해보세요.www.coupang.com   ​선형 회귀분석에서 수정된 결정계수가 생겨난 이유는?​안녕하세요! 데이터 분석과 IT에 관심이 많은 여러분을 위해오늘은 선형 회귀분석에서 자주 등장하는 개념인수정된 결정계수(Adjusted R²)에 대해 알아보겠습니다."수정된 결정계수가 왜 필요할까?"라는 질문에 대한 답을 일반인이 이해하기 쉽게 풀어볼게요!​1. 결정계수(R²)란 무엇인가요?​먼저, 결정계수(R²)부터 간단히 짚고 넘어가겠습니다. 결정계수는..

Data Science 2025.04.02

Pictoblox 통해 초등학생 대상 chatGPT 사용하기

https://link.coupang.com/a/cc8WSn LG전자 2023 그램 15 코어i5 인텔 13세대 - 노트북 | 쿠팡현재 별점 4.9점, 리뷰 400개를 가진 LG전자 2023 그램 15 코어i5 인텔 13세대! 지금 쿠팡에서 더 저렴하고 다양한 노트북 제품들을 확인해보세요.www.coupang.com안녕하세요? 로봇 & 코딩교육No.1 크리에이터 태지쌤이에요.AI교육이 대세인 요즘생성형 AI를 활용하는 경우몇가지 제한되는 사항들이 있어요.예를 들어 각종 생성형 AI를 활용하기 위해1) 회원가입이 필요(혹은 특정 계정. 구글 등)2) 사용 연령의 제한3) 학부모 동의 필요이런 제약 사항들이 있어요.그래서 보다 손쉽게생성형 AI를 활용한 교육을할 수 있는 방법을 소개할게요.PictoBlox라..

Data Science 2025.02.05

슬라이딩 윈도우 데이터 가공: 시계열 데이터 분석의 핵심 기법

​시계열 데이터를 다룰 때 자주 사용되는 '슬라이딩 윈도우' 기법에 대해 알아보겠습니다. 이 방법은 데이터 과학자들이 연속적인 데이터 포인트를 효과적으로 분석하고 가공하는 데 사용하는 강력한 도구입니다.​슬라이딩 윈도우란?​슬라이딩 윈도우는 고정된 크기의 '윈도우'를 데이터를 따라 이동시키면서 각 윈도우 내의 데이터를 분석하는 기법입니다. 이 방법을 통해 시간에 따른 데이터의 변화를 연속적으로 관찰할 수 있습니다.​슬라이딩 윈도우의 주요 특징​1. 윈도우 크기 : 분석하고자 하는 데이터 포인트의 수를 결정합니다.2. 스텝 크기 : 윈도우가 이동하는 간격을 정합니다.3. 연산 : 각 윈도우 내에서 수행할 계산을 정의합니다 (예: 평균, 중앙값, 최대값 등).​슬라이딩 윈도우의 응용 분야​- 주식 시장 분석..

Data Science 2024.12.23

머신러닝에서의 데이터 전처리: 표준화, 정규화, RobustScaler

​https://link.coupang.com/a/b4dnd2 Apple 2024 맥북 프로 14 M4 - 노트북 | 쿠팡쿠팡에서 0.0 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 0 제품도 바로 쿠팡에서 확인할 수 있습니다.www.coupang.com머신러닝에서의 데이터 전처리: 표준화, 정규화, RobustScaler ​데이터 전처리는 머신러닝 모델의 성능을 크게 향상시킬 수 있는 중요한 단계입니다. 오늘은 데이터 스케일링의 세 가지 주요 방법인 표준화, 정규화, 그리고 RobustScaler에 대해 알아보겠습니다.​1. 표준화 (Standardization)​표준화는 데이터의 평균을 0, 표준편차를 1로 변환하는 과정입니다.​- 수식: (x - μ) / σ- 특징: 이상치에 민감할 수 ..

Data Science 2024.12.10

PCA에서 변수 선택과 변수 추출 차이점

https://link.coupang.com/a/b3a8pW Apple 2024 맥북 프로 14 M4 - 노트북 | 쿠팡쿠팡에서 0.0 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 0 제품도 바로 쿠팡에서 확인할 수 있습니다.www.coupang.com ​안녕하세요! 오늘은 PCA(주성분 분석)에서 변수 선택과 변수 추출의 차이점에 대해 알아보겠습니다. 데이터 분석을 하다 보면 변수 선택과 변수 추출이라는 용어를 자주 접하게 되는데요, 이 두 개념은 비슷해 보이지만 실제로는 매우 다른 의미를 가지고 있습니다. 그럼 하나씩 살펴보도록 하겠습니다.​PCA의 기본 개념PCA는 고차원 데이터를 저차원으로 변환하는 기법으로, 데이터의 분산을 최대한 보존하면서 차원을 축소하는 방법입니다. 이 과정에서 변..

Data Science 2024.12.03

K-means 최적의 k값 찾는 엘보우, 실루엣 기법

https://link.coupang.com/a/b3a8pW Apple 2024 맥북 프로 14 M4 - 노트북 | 쿠팡쿠팡에서 0.0 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 0 제품도 바로 쿠팡에서 확인할 수 있습니다.www.coupang.com안녕하세요! 오늘은 K-means 클러스터링에서 최적의 k값을 찾는 방법에 대해 알아보겠습니다. 데이터 분석에서 클러스터링은 매우 중요한 기법이며, 그 중에서도 K-means는 가장 널리 사용되는 방법 중 하나입니다. 그럼 시작해볼까요? 😊​​K-means 클러스터링 소개K-means 클러스터링은 주어진 데이터 포인트를 k개의 클러스터로 나누는 비지도 학습 기법입니다. 이 방법은 각 클러스터의 중심(centroid)을 계산하고, 데이터 포인트를..

Data Science 2024.12.03

상관계수와 독립성

​상관계수와 독립성에 대해 알아보겠습니다. 상관계수는 두 변수 간의 관계의 세기와 방향을 측정하는 개념입니다. 반면, 독립성은 두 변수 간의 상호 의존성이 없음을 나타내는 개념입니다. 이 두 개념은 통계학에서 매우 중요한 역할을 하며, 데이터 분석 및 해석에 필수적입니다.​1. 상관계수란 무엇인가?상관계수는 두 변수 간의 관계를 수치적으로 표현하는 지표입니다. 일반적으로 -1에서 1 사이의 값을 가지며, 1에 가까울수록 두 변수 간의 양의 상관관계가 강하다는 것을 의미하고, -1에 가까울수록 음의 상관관계가 강하다는 것을 의미합니다. 0에 가까운 값은 두 변수 간의 관계가 없음을 나타냅니다.​2. 상관계수의 종류상관계수에는 여러 종류가 있습니다. 가장 일반적으로 사용되는 것은 피어슨 상관계수입니다. 이는..

Data Science 2024.11.29

SVM 모델과 과적합

​안녕하세요! 오늘은 SVM(Support Vector Machine) 모델이 과적합되지 않는 이유에 대해 알아보겠습니다. 머신러닝에서 과적합은 모델이 훈련 데이터에 너무 잘 맞춰져서 새로운 데이터에 대한 일반화 능력이 떨어지는 현상을 말합니다. SVM은 이러한 과적합을 방지하는 데 매우 효과적인 모델입니다. 그럼 하나씩 살펴보도록 하겠습니다.​SVM 모델의 기본 개념SVM은 주어진 데이터 포인트를 분류하기 위해 최적의 결정 경계를 찾는 알고리즘입니다. 이 결정 경계는 두 클래스 간의 마진을 최대화하는 방식으로 설정됩니다. SVM은 선형 분류기와 비선형 분류기를 모두 지원하며, 커널 트릭을 사용하여 고차원 공간으로 데이터를 변환할 수 있습니다. 이를 통해 복잡한 데이터 구조를 효과적으로 처리할 수 있습니..

Data Science 2024.11.29

가우시안 RBF 커널의 정의

​가우시안 RBF 커널에 대해 알아보겠습니다. 오늘은 기계학습에서 중요한 역할을 하는 가우시안 RBF 커널에 대해 자세히 설명드리겠습니다. 이 커널은 데이터의 비선형성을 처리하는 데 매우 유용하며, 다양한 머신러닝 알고리즘에서 널리 사용됩니다.가우시안 RBF 커널은 Radial Basis Function의 일종으로, 주로 서포트 벡터 머신(SVM)에서 사용됩니다. 이 커널은 두 점 사이의 거리를 기반으로 하여, 데이터 포인트 간의 유사성을 측정합니다. 즉, 두 점이 가까울수록 커널 값이 높아지고, 멀어질수록 커널 값이 낮아지는 특징을 가지고 있습니다.​가우시안 RBF 커널의 수학적 표현가우시안 RBF 커널의 수학적 표현은 다음과 같습니다:[ K(x_i, x_j) = \exp\left(-\gamma |x_..

Data Science 2024.11.29
반응형