태지쌤

로봇 & 코딩교육 No.1 크리에이터

데이터 3

시계열 데이터분석과 데이터 누수 data leakage

시계열 데이터, 흐르는 데이터에서 숨겨진 누수를 찾아라! 1. 서론시계열 데이터는 시간에 따라 변화하는 데이터를 말하며, 주식 시세, 날씨 변화, 센서 데이터 등 다양한 분야에서 활용됩니다. 하지만, 시계열 데이터를 분석하고 모델링할 때 데이터 누수가 발생하면 모델 성능 저하와 잘못된 예측으로 이어질 수 있습니다. 마치 흐르는 강에서 누수가 발생하면 정확한 수량 측정이 불가능하듯, 데이터 누수는 시계열 데이터의 본질적인 특징을 왜곡하여 오류를 야기할 수 있습니다.  2. 시계열 데이터 누수의 종류: 다양한 형태의 숨은 누수데이터 누수는 크게 두 가지 유형으로 나눌 수 있습니다.미래 정보 누수: 모델 학습에 사용되는 데이터에 미래 시점의 정보가 포함되는 경우입니다. 마치 미래를 미리 알고 시험에 대비하는 ..

Data Science 2024.07.02

코딩 때문에 포기한 사람 여기 모여라! 코딩없이 배우는 데이터과학

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. ​ 오늘 소개해드릴 책은 성안북스에서 나온 "코딩 없이 배우는 데이터 과학"이에요. ​ 굉장히 책 제목부터 자극적이죠? 사실 대부분의 사람들에게 데이터과학, 데이터분석, 데이터시각화하면 당연히 코딩은 기본 베이스라는게 상식처럼 되어있기 때문인데요. 정말 데이터 과학이 코딩없이 가능한지? 태지쌤이 꼼꼼하게 읽어보았습니다. ​ ​ 코딩 없이 배우는 데이터 과학 이 책은 황보현우, 한노아 공동저자구요. 두 분 모두 학계와 기업체 경력이 있는 빅데이터 인공지능 관련 권위자라고 할 수 있어요. ​ ​ 코딩없이 배우는 데이터 과학 사실 이 책의 핵심은 챕터1에 나와있습니다. 기존에는 데이터과학을 위해선 R이나 파이썬과 같은 프로그래밍 언어가 필수였다면..

Data Science 2023.03.25
반응형