태지쌤

로봇 & 코딩교육 No.1 크리에이터

Data Science 76

데이터 엔지니어(링)를 위한 97가지 조언

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. 오늘 소개해드릴 책은 데이터 엔지니어를 위한 97가지 조언이라는 책이에요. 출판사는 길벗이구요. 약간 독특한 컨셉의 책이에요. 대표 저자가 토비아스 메이시로 되어있지만 실은 구글, 트위터, 마이크로소프트, 링크드인 등에 근무하고 있는 현직 데이터 엔지니어 97명의 노하우를 담고 있는 책이거든요. ​ ​ 21세기 가장 핫한 직업이라고 불리우는 데이터 과학자, 엔지니어, 분석가! 이 분야에서 한걸음 더 성장하고 싶다면 전문가들의 경험과 지식을 빠르게 습득하면 도움이 될거에요.​ ​ ​ 이 책은 목차만 5페이지에 이를만큼 다양한 사람들의 조언을 담고 있구요. 그 조언이 길지 않고 짧게 요약되어 있구요. IT전문도서들이 내용이 어려워서 이해하면서 ..

Data Science 2023.11.06

MySQL 설치 오류 해결방법 Initializing database

데이터베이스 실습을 위해서 MySQL 설치를 하실 때 Initializing database 오류가 나면서 설치 진행이 안되는 경우가 있어요. ​ ​ 로그 탭으로 가면 정확한 원인을 알 수 있다고 하네요. 로그 탭으로 이동합니다. ​ ​ 원인은 컴퓨터의 이름이 한글로 되어있는 경우입니다. 실제로 왼쪽처럼 한글로 되어있었구요. 영문으로 바꾼 후 재부팅까지 완료하니 이후에는 설치 진행되더라구요. ​ ​ MySQL 설치하다가 오류가 나서 막히는 경우 컴퓨터 이름이 한글인지 혹시 점검해주시고 영어로 변경해서 진행해주세요~

Data Science 2023.11.04

머신러닝(기계학습)에서 목적함수의 정의

머신러닝은 기본적으로 컴퓨터가 데이터로부터 학습하여 특정 문제를 해결하도록 하는 기술입니다. 예를 들어, 우리는 머신러닝 모델에게 사진들을 보여주고 그 사진이 고양이인지 개인지 판별하도록 학습시킬 수 있습니다. 이렇게 머신러닝 모델을 학습시키는 과정에서 중요한 역할을 하는 것이 바로 '목적함수'입니다. 목적함수는 머신러닝 모델의 성능을 측정하는 방법을 정의합니다. 이 함수의 값이 작아질수록 (또는 경우에 따라서는 커질수록) 모델의 성능이 좋아진다고 판단합니다. 예를 들어, 우리가 개와 고양이를 구분하는 머신러닝 모델을 만든다고 가정해보겠습니다. 이 때 목적함수는 간단하게 "모델이 잘못 분류한 사진의 수"로 정의할 수 있습니다. 따라서 이 목적함수의 값은 "0"에 가까울수록 좋은 성능을 나타내며, 우리는 ..

Data Science 2023.10.13

[학교 선생님을 위한 파이썬교재] 나는 파이썬으로 머신러닝한다

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이라고 합니다. 오늘은 학교선생님들을 위한 파이썬 교재 '나는 파이썬으로 머신러닝한다'를 소개할게요.​ ​ ​ 이 책은 씨마스에서 출간되었어요. 씨마스는 코딩 관련 많은 책들을 많이 냈구요. 저도 씨마스에서 펴낸 책 여러 권 갖고 있어요. 2022년 6월 발행된 아주 따끈따끈한 책이구요.​ ​ ​ 파이썬? 인공지능? 머신러닝? 사실 비전공자 입장에서 쉽지 않은 주제에요. 아무리 쉽게 풀어썼다고해도.... 그 분야의 초보자의 입장에서는 어려운게 사실이에요. 이 책은 학교 현장에서 학생들에게 머신러닝을 가르친 경험과 노하우를 담았어요. 초보자도 머신러닝을 이해할 수 있도록 구성하였어요.​ ​ ​ 이 책의 공동저자 두 분 모두 현직 학교 선생님이고 정보 ..

Data Science 2023.08.09

[데이터탐색] 히트맵 중복 영역 제거 코드 heatmap vs 클러스터맵 clustermap

히트맵과 클러스터맵은 모두 데이터의 관계를 시각화하는 데 사용되는 시각화 방법입니다. ​ 히트맵은 데이터의 값을 2차원 격자에 매핑하여 데이터의 분포를 보여줍니다. ​ sns.heatmap(df.corr(), cmap='viridis') ​ ​ 클러스터맵은 히트맵의 데이터를 클러스터링하여 데이터의 군집을 보여줍니다. ​ sns.clustermap(df.corr(), annot = True, cmap = 'RdYlBu_r', vmin = -1, vmax = 1, ) ​ ​ 히트맵과 클러스터맵의 차이점은 히트맵은 데이터의 분포만을 보여줍니다. 반면, 클러스터맵은 데이터의 분포와 군집을 모두 보여줍니다. 따라서 클러스터맵은 히트맵보다 데이터의 관계를 이해하는 데 더 도움이 될 수 있습니다. ​ 예를 들어, 고..

Data Science 2023.06.09

[데이터과학] 왜도(skewness)와 첨도(kurtosis)

데이터 과학 분야에서 왜도(skewness)와 첨도(kurtosis)는 데이터의 분포를 설명하는 두 가지 중요한 개념입니다. ​ 왜도는 데이터 분포의 비대칭성을 나타내는 지표입니다. 데이터 분포가 왼쪽으로 치우쳐져 있으면 왜도 값은 음수가 되고, 오른쪽으로 치우쳐져 있으면 왜도 값은 양수가 됩니다. 데이터 분포가 좌우 대칭인 경우에는 왜도 값은 0에 가까워집니다. 왜도는 분포의 비대칭성을 측정하기 때문에, 데이터의 중심성과 꼬리의 길이를 파악하는 데에 도움이 됩니다. 예를 들어, 주식 시장의 수익률 데이터 분포가 왼쪽으로 치우쳐져 있다면, 이는 주식 시장에서 음수의 수익이 더 자주 발생한다는 것을 의미할 수 있습니다. ​ df.skew() ​ 첨도는 데이터 분포의 뾰족한 정도를 나타내는 지표입니다. 첨도..

Data Science 2023.06.09

[용인 명지대 맛집] 호접몽 맛있는데 음식에서 ㅇㅇ이 나왔어요

용인예술과학대학교에서 코딩 특강수업을 마치고 근처에 있는 용인 명지대 맛집인 호접몽에 들러서 점심을 먹었어요. 언덕 위에 위치해 있구요. 주차장도 있습니다. ​ ​ 호접몽 입구에요. ​ ​ 11:30~14:30까지 런치세트를 운영해요. 17000원이니까 럭셔리 점심이네요^^;; ​ ​ 호접몽의 메뉴판입니다. 럭셔리 중식답게 코스요리부터 메뉴가 정말 다양합니다. ​ ​ 제가 고른 메뉴는 해물볶음짜장 가격은 1만원 ​ ​ 내부는 이런식으로 생겼구요. 룸도 있어서 단체 회식으로도 좋겠더라구요. 한창 피크 시간대라서 손님이 많아서 전체 모습은 못 찍었어요. ​ ​ 기본 밑반찬이구요. 식기류는 위생적으로 관리되고 있었어요. ​ ​ 드디어 나온 해물볶음짜장 ​ ​ 새싹(?)이 올려져있어서 시각적으로 고급스러워보이네..

Data Science 2023.05.25

[인공지능] 지도학습 분류 vs 비지도학습 군집화 비교

​ 지도학습과 비지도학습은 머신러닝의 두 가지 주요 패러다임입니다. 이들 간에는 몇 가지 중요한 차이점이 있습니다. ​ 1. 목표와 지도 데이터의 존재 여부: - 지도학습: 명시적인 목표가 있으며, 레이블된 지도 데이터를 사용하여 모델을 학습시키는 방법입니다. 모델은 입력 데이터와 그에 대한 정답 레이블 사이의 관계를 학습하여 예측을 수행할 수 있습니다. - 비지도학습: 명시적인 목표가 없으며, 레이블되지 않은 데이터를 사용하여 숨겨진 구조나 특성을 발견하는 방법입니다. 모델은 데이터의 패턴, 유사성, 군집 등을 파악하고 추론합니다. ​ 2. 데이터의 형태와 사용 방법: - 지도학습: 입력 데이터와 해당하는 출력(레이블) 사이의 관계를 학습하는 방식으로, 데이터에 대한 사전 정보(레이블)가 필요합니다. ..

Data Science 2023.05.23

[책리뷰] 전공책 이해안될 때 '이렇게 쉬운 통계학'

오늘 소개해 드릴 책은 한빛미디어에서 나온 이렇게 쉬운 통계학입니다. 2019년에 발행된 책이구요. 저는 전자책으로 읽어보았어요.​​ ​ ​ 저자는 일본인이고 이 책은 번역본입니다.​​ ​ ​ '이렇게 쉬운'이라는 수식어가 붙어있는것처럼 이 책은 최대한 통계학을 쉽게 접근하려고 했어요. 인공지능 붐이 일면서 통계학에 대한 관심도 높아지고 있어요. 그런데 그만큼 내용이 어려운 게 사실이에요. 이 책은 최대한 개념을 쉽게 그리고 독자의 개념 이해를 돕기 위해 적절한 일러스트를 제시하고 있어요. ​ 예를 들어 평균, 중앙값, 최빈값이 일반인들은 헷갈릴 수 있어서 아래와 같은 일러스트로 개념을 소개하는거죠. 그림을 보면 차이점을 쉽게 알 수 있어요.​​ ​ ​ 평균은 특이값에 약한 대푯값임을 설명하고 이를 그림..

Data Science 2023.05.20
반응형