파이썬
[파이썬 프로젝트] 네이버 영화 리뷰 크롤링
태지쌤
2022. 7. 6. 15:53
반응형
크롤링이란? 검색 엔진의 데이터 수집 방법
1) 웹 페이지 정보 가져오기(requests 라이브러리 사용)
2) HTML 소스 파싱(분석)하여 원하는 정보 얻기 : BeautifulSoup 라이브러리 사용
import requests
from bs4 import BeautifulSoup
# 네이버 영화 리뷰 - 트롤
url = "https://movie.naver.com/movie/bi/mi/review.nhn?code=191633"
# html 소스 가져오기
res = requests.get(url)
# html 파싱
soup = BeautifulSoup(res.text, 'lxml')
# 리뷰 리스트
ul = soup.find('ul', class_="rvw_list_area")
lis = ul.find_all('li')
# 리뷰 제목 출력
count=0
for li in lis:
count += 1
print(f"[{count}th] ", li.a.string)
결과 화면
반응형