태지쌤

로봇 & 코딩교육 No.1 크리에이터

2024/10/31 2

텍스트 분석의 단어 가방 모형

​안녕하세요! 오늘은 텍스트 분석의 중요한 개념 중 하나인 '단어 가방 모형'에 대해 알아보겠습니다. 이 모형은 1954년 젤리그 해리스의 논문에서 처음 소개되었으며, 텍스트의 특징을 벡터로 표현하는 데 큰 역할을 하고 있습니다. 그럼, 하나씩 살펴보도록 하겠습니다.​단어 가방 모형의 정의단어 가방 모형(Bag of Words Model)은 텍스트를 단어의 집합으로 간주하여 각 단어의 출현 빈도를 기반으로 텍스트를 분석하는 방법입니다. 이 모형은 문장의 순서나 문법적 구조를 무시하고, 단어의 존재 여부와 빈도만을 고려합니다. 이러한 접근 방식은 텍스트의 의미를 간단하게 표현할 수 있는 장점이 있습니다.​젤리그 해리스의 기여젤리그 해리스는 현대 언어학의 중요한 인물 중 하나로, 그의 연구는 언어의 구조와 ..

Data Science 2024.10.31

텍스트 분석의 n-gram 기법

​안녕하세요! 오늘은 텍스트 분석의 중요한 기법 중 하나인 n-gram 기법에 대해 알아보겠습니다. n-gram은 자연어 처리(NLP)에서 많이 사용되는 기법으로, 텍스트 데이터를 분석하고 의미 있는 패턴을 발견하는 데 도움을 줍니다. 그럼 시작해볼까요? 😊​n-gram 기법의 정의n-gram은 연속된 n개의 단어 또는 문자로 구성된 조합을 의미합니다. 예를 들어, "나는 학교에 간다"라는 문장이 있을 때, 이 문장에서 2개의 단어로 이루어진 조합인 바이그램(bigram)은 "나는 학교에", "학교에 간다"와 같이 생성됩니다. 이러한 방식으로 텍스트를 분석하면, 단어 간의 관계를 파악하고, 문맥을 이해하는 데 큰 도움이 됩니다.​n-gram의 종류n-gram은 n의 값에 따라 여러 종류로 나뉩니다.유니..

Data Science 2024.10.31
반응형