태지쌤

로봇 & 코딩교육 No.1 크리에이터

Data Science 88

data science 분야에 사용되는 두 용어의 차이점은? analysis, analytics

The terms "analysis" and "analytics" are often used interchangeably, but they actually have different meanings. Data analysis is the process of inspecting, cleaning, transforming, and modeling data with the goal of discovering useful information, informing conclusions, and supporting decision-making. Data analytics, on the other hand, is the science of analyzing data using statistical, mathemati..

Data Science 2023.05.02

데이터사이언티스트가 될 수 있는 방법

데이터사이언티스트가 되기 위해서는 다음과 같은 방법들을 따라가면 됩니다.필수적인 기술과 지식을 습득하라: 데이터 사이언스를 위한 필수적인 기술과 지식을 습득하는 것이 가장 중요합니다. 통계, 선형대수학, 머신러닝, 딥러닝, 자연어 처리 등과 같은 학문적 배경을 보유해야 합니다. 이를 위해서는 수학과 컴퓨터 과학 관련 학과를 전공하거나, 온라인 강의, 책, 블로그 등을 활용하여 스스로 학습할 수 있습니다.프로그래밍 언어 습득: Python, R, SQL과 같은 프로그래밍 언어는 데이터사이언티스트에게 필수적인 도구입니다. 이러한 언어를 습득하고, 데이터를 다루고 분석할 수 있는 능력을 기르는 것이 중요합니다.데이터 처리 및 분석 도구 습득: 데이터 처리 및 분석 도구는 데이터사이언티스트에게 매우 중요합니다...

Data Science 2023.04.13

코딩 때문에 포기한 사람 여기 모여라! 코딩없이 배우는 데이터과학

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. ​ 오늘 소개해드릴 책은 성안북스에서 나온 "코딩 없이 배우는 데이터 과학"이에요. ​ 굉장히 책 제목부터 자극적이죠? 사실 대부분의 사람들에게 데이터과학, 데이터분석, 데이터시각화하면 당연히 코딩은 기본 베이스라는게 상식처럼 되어있기 때문인데요. 정말 데이터 과학이 코딩없이 가능한지? 태지쌤이 꼼꼼하게 읽어보았습니다. ​ ​ 코딩 없이 배우는 데이터 과학 이 책은 황보현우, 한노아 공동저자구요. 두 분 모두 학계와 기업체 경력이 있는 빅데이터 인공지능 관련 권위자라고 할 수 있어요. ​ ​ 코딩없이 배우는 데이터 과학 사실 이 책의 핵심은 챕터1에 나와있습니다. 기존에는 데이터과학을 위해선 R이나 파이썬과 같은 프로그래밍 언어가 필수였다면..

Data Science 2023.03.25

SVM(Support Vector Machine)은 지도 학습 알고리즘

SVM(Support Vector Machine)은 지도 학습(supervised learning) 알고리즘 중 하나로, 분류(classification)와 회귀(regression) 문제를 해결하는 데 사용됩니다. ​ SVM의 기본 개념은 다음과 같습니다: 1. 데이터를 공간 상에 점으로 표현합니다. 2. 서로 다른 범주(클래스)의 점들을 가장 잘 구분할 수 있는 경계선 (보통 하이퍼플레인이라 불립니다)을 찾습니다. 3. 이 경계선은 서로 다른 범주의 점들과 최대한 멀리 떨어져야 합니다. 이를 마진(margin)이라고 부릅니다. ​ SVM의 핵심 아이디어는 마진을 최대화하는 경계선을 찾는 것입니다. 이러한 경계선은 서포트 벡터라고 불리는 데이터 포인트들에 의해 결정되며, 이 점들이 결국 알고리즘의 이름..

Data Science 2023.03.20

[AI와빅데이터경영입문] 트리분석 graphviz

트리 분석(Tree Analysis) 알고리즘은 데이터를 분류(Classification)하거나 예측(Prediction)하기 위한 방법 중 하나입니다. 트리 분석 알고리즘은 일련의 결정 규칙들로 이루어진 트리(Tree)를 만들어 데이터를 분류하거나 예측합니다. 이 트리는 뿌리(Root)에서 시작하여 분기(Branch)를 반복하며 종단 노드(Leaf node)에 이르는데, 각 분기마다 하나의 변수를 선택하고 그 변수를 기준으로 데이터를 분류합니다. 트리 분석 알고리즘은 다양한 종류가 있습니다. 대표적으로는 의사결정나무(Decision Tree)와 랜덤포레스트(Random Forest)가 있습니다. 의사결정나무는 단일 트리로 구성되어 있으며, 랜덤포레스트는 여러 개의 의사결정나무를 조합하여 구성된 앙상블(..

Data Science 2023.03.09

[AI와빅데이터경영입문] 나이브베이즈

from sklearn import datasets irisData = datasets.load_iris() x_total = irisData.data y_total = irisData.target # 데이터 분할 from sklearn.model_selection import train_test_split x_train, x_test, y_train, y_test = train_test_split(x_total, y_total, test_size=0.50, random_state=10) # 모형 학습 from sklearn.naive_bayes import GaussianNB gNB = GaussianNB() gNB.fit(x_train, y_train) # 학습 결과 및 성능 평가 predictedC..

Data Science 2023.03.09
반응형