태지쌤

로봇 & 코딩교육 No.1 크리에이터

파이썬

[파이썬 프로젝트] 네이버 영화 리뷰 크롤링

태지쌤 2022. 7. 6. 15:53
반응형

크롤링이란? 검색 엔진의 데이터 수집 방법

1) 웹 페이지 정보 가져오기(requests 라이브러리 사용)

2) HTML 소스 파싱(분석)하여 원하는 정보 얻기 : BeautifulSoup 라이브러리 사용

import requests
from bs4 import BeautifulSoup

# 네이버 영화 리뷰 - 트롤
url = "https://movie.naver.com/movie/bi/mi/review.nhn?code=191633"
# html 소스 가져오기
res = requests.get(url)

# html 파싱
soup = BeautifulSoup(res.text, 'lxml')

# 리뷰 리스트
ul = soup.find('ul', class_="rvw_list_area")
lis = ul.find_all('li')

# 리뷰 제목 출력
count=0
for li in lis:
    count += 1
    print(f"[{count}th] ", li.a.string)

결과 화면

반응형