태지쌤

로봇 & 코딩교육 No.1 크리에이터

통계학 4

시계열 데이터와 패널 데이터 비교 및 차이점

​안녕하세요, 여러분! 오늘은 시계열 데이터와 패널 데이터에 대해 알아보겠습니다. 이 두 가지 데이터 유형은 통계학과 경제학에서 매우 중요한 역할을 하며, 각각의 특성과 차이점을 이해하는 것이 중요합니다. 그럼 시작해볼까요?​1. 시계열 데이터란?시계열 데이터는 특정 변수의 값을 시간에 따라 기록한 데이터입니다. 예를 들어, 한 기업의 월별 매출액이나 기온 변화 등을 시계열 데이터로 표현할 수 있습니다. 이 데이터는 시간의 흐름에 따른 변화를 분석하는 데 유용하며, 주로 경제학, 기상학, 금융 분야에서 많이 사용됩니다.​2. 패널 데이터란?패널 데이터는 여러 개체에 대한 시계열 데이터를 결합한 형태입니다. 즉, 동일한 개체에 대해 여러 시점에서 수집된 데이터로, 예를 들어 여러 기업의 연도별 매출액을 기..

Data Science 2024.10.30

[책리뷰] 전공책 이해안될 때 '이렇게 쉬운 통계학'

오늘 소개해 드릴 책은 한빛미디어에서 나온 이렇게 쉬운 통계학입니다. 2019년에 발행된 책이구요. 저는 전자책으로 읽어보았어요.​​ ​ ​ 저자는 일본인이고 이 책은 번역본입니다.​​ ​ ​ '이렇게 쉬운'이라는 수식어가 붙어있는것처럼 이 책은 최대한 통계학을 쉽게 접근하려고 했어요. 인공지능 붐이 일면서 통계학에 대한 관심도 높아지고 있어요. 그런데 그만큼 내용이 어려운 게 사실이에요. 이 책은 최대한 개념을 쉽게 그리고 독자의 개념 이해를 돕기 위해 적절한 일러스트를 제시하고 있어요. ​ 예를 들어 평균, 중앙값, 최빈값이 일반인들은 헷갈릴 수 있어서 아래와 같은 일러스트로 개념을 소개하는거죠. 그림을 보면 차이점을 쉽게 알 수 있어요.​​ ​ ​ 평균은 특이값에 약한 대푯값임을 설명하고 이를 그림..

Data Science 2023.05.20

[통계학] 조건부 확률이란? Conditional probability

​ 조건부 확률(Conditional probability)은 어떤 사건이 발생하였을 때, 다른 사건이 발생할 확률을 의미합니다. 조건부 확률은 P(B|A)와 같이 표기합니다. 여기서 B는 조건이 되는 사건이며, A가 일어난 상황에서 B가 일어날 확률을 나타냅니다. ​ 수식으로 표현하면 다음과 같습니다. P(B|A) = P(A∩B) / P(A) ​ 여기서 P(A∩B)는 사건 A와 B가 모두 일어날 확률이며, P(A)는 사건 A가 일어날 확률입니다. 이 때, 사건 A와 B가 서로 독립일 경우 P(B|A) = P(B)가 성립합니다. ​ 예를 들어, 주사위를 던져서 3이 나오는 확률을 P(A)라고 하고, 그 결과가 홀수인 경우의 확률을 P(B)라고 합시다. 이 때, 주사위의 결과가 3인 상황에서 홀수가 나올 ..

Data Science 2023.05.04

통계학에서 말하는 확률변수

확률 변수는 어떤 사건의 결과로 나올 수 있는 값들을 대상으로 확률을 부여하는 변수입니다. 간단한 예를 들어보면, 동전 던지기를 할 때 앞면이 나오면 1, 뒷면이 나오면 0으로 값을 지정한다고 하면, 이 값은 0 또는 1의 두 가지 값 중 하나를 가지게 됩니다. 이렇게 동전 던지기에서 나올 수 있는 결과들이 가능한 값들이 됩니다. 이렇게 가능한 값들을 변수로 나타낸 것이 확률 변수입니다. 확률 변수는 이 가능한 값들을 대상으로 어떤 값이 나올 확률을 부여하는 것입니다. 예를 들어, 동전 던지기에서 앞면이 나올 확률은 0.5이고 뒷면이 나올 확률도 0.5입니다. 이렇게 확률 변수는 가능한 값들과 그 값이 나올 확률을 모두 고려합니다. 또한, 이렇게 가능한 값들의 집합이 연속적인 경우에는 확률 밀도 함수를 ..

IT관련 2023.04.25
반응형