태지쌤

로봇 & 코딩교육 No.1 크리에이터

데이터분석 18

시계열 데이터분석과 데이터 누수 data leakage

시계열 데이터, 흐르는 데이터에서 숨겨진 누수를 찾아라! 1. 서론시계열 데이터는 시간에 따라 변화하는 데이터를 말하며, 주식 시세, 날씨 변화, 센서 데이터 등 다양한 분야에서 활용됩니다. 하지만, 시계열 데이터를 분석하고 모델링할 때 데이터 누수가 발생하면 모델 성능 저하와 잘못된 예측으로 이어질 수 있습니다. 마치 흐르는 강에서 누수가 발생하면 정확한 수량 측정이 불가능하듯, 데이터 누수는 시계열 데이터의 본질적인 특징을 왜곡하여 오류를 야기할 수 있습니다.  2. 시계열 데이터 누수의 종류: 다양한 형태의 숨은 누수데이터 누수는 크게 두 가지 유형으로 나눌 수 있습니다.미래 정보 누수: 모델 학습에 사용되는 데이터에 미래 시점의 정보가 포함되는 경우입니다. 마치 미래를 미리 알고 시험에 대비하는 ..

Data Science 2024.07.02

다항 회귀 vs 다중 회귀 개념 차이점 비교

다항 회귀와 다중 회귀는 모두 회귀 분석의 일종이지만, 다루는 변수와 형태가 다릅니다. 쉽게 이해할 수 있도록 비교해 설명해드릴게요.​ ​다항 회귀 (Polynomial Regression)- **정의**: 다항 회귀는 독립 변수가 하나이지만, 그 독립 변수의 n차 항들을 포함하는 회귀 분석입니다.- **목적**: 데이터와 더 잘 맞는 곡선(비선형 관계)을 찾기 위해 사용됩니다.- **수식 예시**: \( y = \beta_0 + \beta_1 x + \beta_2 x^2 + \beta_3 x^3 + ... + \beta_n x^n \)- **사용 예시**: 독립 변수 \( x \)가 한 개인 경우, 예를 들어 시간에 따른 온도 변화 추세를 분석할 때 사용됩니다.​다중 회귀 (Multiple Regres..

Data Science 2024.06.20

[패스트캠퍼스] 한번에 끝내는 데이터사이언스 환불 후기

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. ​ 오늘 소개해 드릴 강의후기는 패스트캠퍼스의 한번에 끝내는 데이터사이언스에요. ​ 얼마전에 패스트캠퍼스에서 이벤트를 진행했었거든요. 안심환불보장~! ​ ​ 일주일동안 마음껏 강의를 들어보고 마음에 안들면 묻지도 따지지도 않고 전액을 환불해주는 이벤트였어요. 그래서 저도 하나 신청해봤어요. 한번에 끝내는 데이터사이언스 ​ ​ 수강료는 368000원 적지 않은 금액이에요. ​ ​ 크게 4개의 주제를 다루고 있어요. 1.데이터 사이언스란(개괄) 2.데이터엔지니어링 with SQL 3.데이터분석 with python 4.머신러닝 with python ​ ​ SQL 파트를 제외하고는 패스트캠퍼스 소속 강사인 김용담 강사가 진행해요. 기본적으로 말발..

Data Science 2024.02.02

ITUP(잇업)에서 K-디지털 기초역량훈련으로 엑셀 R SQL을 한번에!

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. ​ 2024년 새해가 되었어요. 새해가 되면 목표 하나씩은 세우게 되죠. 특히 자기개발에 대한 목표가 있을거에요. 저는 데이터분석에 관심이 많아졌어요. 이 글을 읽고 계신분들도 취업준비나 이직을 위해서 혹은 본인 업무의 역량향상을 위해서 데이터활용 및 데이터분석에 관심이 많을거에요. ​ 이때 학원을 다니려고하면 왔다 갔다 시간과 비싼 학원비에 망설이게 되고 디지털교육은 편하긴 하지만... 진짜 내 실력을 제대로 키워줄 수 있을지 염려가 되기도 하죠. ​ 저는 'K-디지털 기초역량훈련'을 통해 이런 고민을 해결했어요. ​ 'K-디지털 기초역량훈련'을 처음 들어보신 분도 있을 테니 간단히 말씀드리면 고용노동부에서 대학생부터 구직자, 재직자 등 ..

Data Science 2024.01.17

데이터 분석가가 반드시 알아야 할 모든 것(황세웅, 위키북스)

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. 오늘 소개할 책은 위키북스에서 출판한 데이터 분석가가 반드시 알아야 할 모든것 책 제목이 길죠~?^^ 책 제목 뿐만 아니라 두께도 어마어마 합니다. '모든 것'이라는 단어를 통해서 충분히 예상할 수 있죠 ㅎㅎㅎ ​ ​ 저자는 선문대학교 황세웅 교수이구요. 교수하기 전에 산업체에서 실제로 데이터 분석가 및 데이터사이언티스르로 활동했던 경험이 있는만큼 기존의 대학교재처럼 딱딱하지 않고 실무 중심으로 씌여진 책이에요. ​ ​ 책 내용이 방대해서 가격도 비쌉니다. 이북이 없어서 아쉬워요. ​ ​ 이 책은 정말 데이터 분석가로 직무 전환을 하고 싶은 사람이라면 구입해서 책꽂이에 꽂아두고 모르는게 생기면 꺼내서 읽을만한 소장 가치가 있는 책이에요. 저..

Data Science 2023.11.27

[데이터분석] 과외받는 느낌의 마소캠퍼스 파이썬 강의추천

파이썬기초부터 데이터분석, 머신러닝까지 한번에 쭉 배우고 싶다면~! 여러 명의 강사가 나와서 서로 연결도 안되는 따로따로인 그런 강의말고 큰 흐름으로 연결되는 강의를 선택해보세요. 이번에 마소캠퍼스에서 파이썬 입문부터 데이터분석, 머신러닝까지 모두 배울 수 있는 > 강의가 있어서 들어봤어요. ​ ​ 강의의 특징은 비전공자라도 쉽게 이해할 수 있도록 쉬운 설명과 실습용 코드를 제공해요. ​ ​ 아래와 같이 1) 파이썬 입문 2) 파이썬 데이터 분석 실무 3) 파이썬 머신러닝 총 3개의 주제로 되어있구요. 파이썬이 처음이신분은 파이썬 입문강의부터 들으시면 되고 기초 문법은 알고 있다 하시는 분은 파이썬 데이터분석 실무 강의부터 들으셔도되요. ​ ​ 각 파트마다 파이썬 기초문법은 공통적으로 들어가 있기 때문에..

파이썬 2023.02.15
반응형