태지쌤

로봇 & 코딩교육 No.1 크리에이터

딥러닝 4

텍스트 분석의 단어 가방 모형

​안녕하세요! 오늘은 텍스트 분석의 중요한 개념 중 하나인 '단어 가방 모형'에 대해 알아보겠습니다. 이 모형은 1954년 젤리그 해리스의 논문에서 처음 소개되었으며, 텍스트의 특징을 벡터로 표현하는 데 큰 역할을 하고 있습니다. 그럼, 하나씩 살펴보도록 하겠습니다.​단어 가방 모형의 정의단어 가방 모형(Bag of Words Model)은 텍스트를 단어의 집합으로 간주하여 각 단어의 출현 빈도를 기반으로 텍스트를 분석하는 방법입니다. 이 모형은 문장의 순서나 문법적 구조를 무시하고, 단어의 존재 여부와 빈도만을 고려합니다. 이러한 접근 방식은 텍스트의 의미를 간단하게 표현할 수 있는 장점이 있습니다.​젤리그 해리스의 기여젤리그 해리스는 현대 언어학의 중요한 인물 중 하나로, 그의 연구는 언어의 구조와 ..

Data Science 2024.10.31

텐서플로 활용 MNIST 필기숫자 인식을 위한 CNN 프로그램

from tensorflow.keras import datasets, models from tensorflow.keras import Sequential, optimizers from tensorflow.keras.layers \ import Flatten, Dense, Conv2D, MaxPooling2D # MNIST 필기체 숫자 데이터세트 가져오기 (train_imgs, train_labels), (test_imgs, test_labels) \ = datasets.mnist.load_data() # 픽셀 값을 0~1 사이로 정규화 train_imgs, test_imgs \ = train_imgs / 255.0, test_imgs / 255.0 # Conv2D에 맞게 데이터 reshape train_..

Data Science 2023.12.01

혼자공부하는 머신러닝 + 딥러닝(ch1) k-최근접 이웃 알고리즘

# -*- coding: utf-8 -*- """혼공머신러닝_ch1.ipynb Automatically generated by Colaboratory. Original file is located at https://colab.research.google.com/drive/1yyi3uGfURyYiKYLsQsXAJUsR9X-n9rML """ # 데이터의 특성 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 3..

Data Science 2023.02.16
반응형