태지쌤

로봇 & 코딩교육 No.1 크리에이터

Data Science 52

DTM(Document-Term Matrix, 문서 단어 행렬)

DTM(Document-Term Matrix, 문서-용어 행렬)은 텍스트 마이닝과 자연어 처리(NLP)에서 문서 컬렉션 내의 용어 빈도를 설명하기 위해 사용되는 수학적 행렬입니다. 이 행렬은 각 문서를 행으로, 코퍼스 내의 모든 고유 용어를 열로 나타내며, 각 셀에는 문서 내에서 해당 용어가 나타나는 빈도(또는 가중치)가 포함됩니다.DTM의 구성행(Rows): 각각의 행은 다른 문서를 나타냅니다. 만약 분석하고자 하는 문서 컬렉션이 100개의 문서를 포함하고 있다면, DTM은 100개의 행을 갖게 됩니다.열(Columns): 각 열은 코퍼스 내의 고유한 용어를 나타냅니다. 예를 들어, 모든 문서에서 총 1,000개의 고유 용어가 발견되었다면, DTM은 1,000개의 열을 갖게 됩니다.값(Values): ..

Data Science 2024.04.29

워드 클라우드 파이썬 몰라도 AI 코디니로 코딩없이 뚝딱!

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. ​ 워드 클라우드라고 들어보셨죠? 워드 클라우드는 텍스트 데이터의 특징을 시각적으로 표현하는 방법 중 하나입니다. 워드 클라우드는 '단어 구름'이라고도 불리며, 이는 특정 텍스트나 데이터 세트에서 가장 빈번하게 등장하는 단어를 크고 눈에 띄게 표시하고, 그 외의 단어들은 상대적으로 작게 표시하는 방식으로 정보를 전달합니다. 즉, 큰 글씨로 표시된 단어는 그 텍스트에서 가장 중요하거나 빈번하게 등장한다는 것을 의미하며, 이를 통해 사용자는 한눈에 해당 텍스트의 주요 키워드를 파악할 수 있습니다. 이는 블로그 글이나 뉴스 기사, 연구 보고서 등 다양한 텍스트에서 주요 테마나 키워드를 빠르게 이해하는 데 도움을 줍니다. 이렇게 워드 클라우드를 활..

Data Science 2024.02.22

초거대 언어 모델(LLM, 챗GPT) 사용법 AI 코디니로 배우기

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. 생성형 AI에 대한 관심이 아주 뜨거워요. 생성형AI를 교육에 활용하고자 하는 움직임도 활발하구요. 특히 엔트리에 비해 후발주자인 AI 코디니는 엔트리에 없는 몇 가지 기능이 들어있어요. 워드 클라우드가 그렇구요. 다른 하나는 생성 모델에 대한 콘텐츠도 탑재되어있어요. ​ -초거대 언어 모델 -애니메이션 변환 -화풍 변환 ​ AI 코디니에 소개된 초거대 언어 모델 LLM에 대한 설명이에요. 방대한 양의 텍스트 데이터를 학습한 머신 러닝 모델로써, 주로 LLM(Large Language Model)으로 부릅니다. LLM은 텍스트를 생성하고, 언어를 번역하고, 질문에 답하고, 창의적인 콘텐츠를 작성하는 등 다양한 작업을 수행할 수 있습니다. 코..

Data Science 2024.02.22

AI 코디니의 인공지능 튜터에서 배우는 변수

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. AI코디니에 인공지능 튜터가 도입되었어요. 오늘은 코딩에서 중요한 개념 중 하나인 변수에 대해서 AI 튜터와 함께 알아봐요.​​ ​ ​ 기초 및 초급 강좌에 있는 변수를 활용한 보물 찾기 프로젝트에요. ​ 오늘의 학습 개요구요. 크게 6가지에 대해 배워 볼 예정이에요.​​ ​ ​ 화면 우측에 있는 개념 익히기 버튼을 눌러볼까요?​​ ​ ​ 변수란? 데이터를 저장할 수 있는 공간에 이름을 붙여준 것 변수 안에 들어가는 데이터는 변수 값이라고 해요.​​ ​ ​ 변수의 특징으로 한 개의 변수에는 하나의 데이터만 저장할 수 있으며 여러 개의 데이터를 저장하려면 데이터의 갯수만큼 변수를 만들어야 해요. (나중에 리스트라는 개념도 배우게 됩니다)​​ ..

Data Science 2024.02.15

ChatGPT 인공지능을 활용한 파이썬 업무 자동화 및 데이터분석

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. 벌써 2024년 구정이 지났습니다. 새해에 세웠던 자기개발을 위한 굳은 다짐들을 지키기 위해서 설 연휴에도 강의를 수강했습니다. 바로 마소캠퍼스의 생성AI를 활용한 세상에서 제일 쉬운 파이썬 개발 클래스 ​ ​ 이미 마소캠퍼스에서 다른 강좌를 여러 번 수강한 이력이 있었고 그만큼 강의력에 신뢰가 있었기 때문에 주저하지 않고 수강신청 할 수 있었어요. ​ ​ ChatGPT의 도움을 받아서 파이썬으로 개발하기 때문에 비전공자도 쉽게 이해할 수 있는 강의에요. ​ 모든 강의에서는 강사가 가장 중요하거든요. 이번 ChatGPT를 활용한 파이썬 개발 강의는 현 마소캠퍼스 대표인 김진 교수님께서 진행해주셨어요. 비전공자, 코딩 초보자라면 처음에 파이썬..

Data Science 2024.02.13

[패스트캠퍼스] 한번에 끝내는 데이터사이언스 환불 후기

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. ​ 오늘 소개해 드릴 강의후기는 패스트캠퍼스의 한번에 끝내는 데이터사이언스에요. ​ 얼마전에 패스트캠퍼스에서 이벤트를 진행했었거든요. 안심환불보장~! ​ ​ 일주일동안 마음껏 강의를 들어보고 마음에 안들면 묻지도 따지지도 않고 전액을 환불해주는 이벤트였어요. 그래서 저도 하나 신청해봤어요. 한번에 끝내는 데이터사이언스 ​ ​ 수강료는 368000원 적지 않은 금액이에요. ​ ​ 크게 4개의 주제를 다루고 있어요. 1.데이터 사이언스란(개괄) 2.데이터엔지니어링 with SQL 3.데이터분석 with python 4.머신러닝 with python ​ ​ SQL 파트를 제외하고는 패스트캠퍼스 소속 강사인 김용담 강사가 진행해요. 기본적으로 말발..

Data Science 2024.02.02

ITUP(잇업)에서 K-디지털 기초역량훈련으로 엑셀 R SQL을 한번에!

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. ​ 2024년 새해가 되었어요. 새해가 되면 목표 하나씩은 세우게 되죠. 특히 자기개발에 대한 목표가 있을거에요. 저는 데이터분석에 관심이 많아졌어요. 이 글을 읽고 계신분들도 취업준비나 이직을 위해서 혹은 본인 업무의 역량향상을 위해서 데이터활용 및 데이터분석에 관심이 많을거에요. ​ 이때 학원을 다니려고하면 왔다 갔다 시간과 비싼 학원비에 망설이게 되고 디지털교육은 편하긴 하지만... 진짜 내 실력을 제대로 키워줄 수 있을지 염려가 되기도 하죠. ​ 저는 'K-디지털 기초역량훈련'을 통해 이런 고민을 해결했어요. ​ 'K-디지털 기초역량훈련'을 처음 들어보신 분도 있을 테니 간단히 말씀드리면 고용노동부에서 대학생부터 구직자, 재직자 등 ..

Data Science 2024.01.17

코딩앤플레이에서 인공지능교육지도사 자격증 취득하기

안녕하세요? 로봇 & 코딩교육 No.1 크리에이터 태지쌤이에요. 요새 핫한 인공지능~! 이런 인공지능에 대한 교육이 초중등 교육에서도 메가 트렌드에요. 코딩교육 강사라면 코딩교육지도사말고도 인공지능교육지도사 자격증 취득을 고민하고 계실거에요. 아래의 링크로 방문하시면 코딩앤플레이에서 발행하는 인공지능교육지도사 자격증을 온라인 과정을 통해서 쉽게 취득할 수 있어요. codingnplay.ezcampus.me ​ 1강부터 18강까지 체계적인 커리큘럼으로 되어있구요. 짧은 영상으로 끊어서 제작되었기 때문에 틈나는 시간에 잠깐씩 수강하기에도 좋아요. ​ ​ 오프라인 교육과정이 아니고 이지캠퍼스를 활용한 100% 온라인 교육과정이라서 손쉽게 인공지능교육지도사 자격증을 취득하실 수 있어요. ​ 강의는 로봇 & 코딩..

Data Science 2024.01.10

구글 코랩 colab에 한글폰트 설치방법

구글 코랩 colab에서 맷플롯립으로 그래프 그릴 때 한글이 깨지는 경우가 발생해요. 아래의 코드를 볼까요? import matplotlib.pyplot as plt # plt.rc('font', family='NanumGothic') x = [1, 2, 3, 4] y = [10, 4, 15, 9] plt.plot(x,y, label='수학') plt.title('한글 그래프') plt.xlabel('학번') plt.ylabel('점수') plt.legend() plt.show() 그래프 제목부터 범례, 축이름까지 한글이라 전부 깨져요.​ ​ ​ 주피터 노트북은 내 컴퓨터에서 프로그램을 작성하고 실행하기 때문에 내 컴퓨터에 설치된 폰트를 사용하지만 코랩은 구글 서버 상에서 프로그램을 실행하기 때문에 내 ..

Data Science 2024.01.06
반응형