반응형
크롤링이란? 검색 엔진의 데이터 수집 방법
1) 웹 페이지 정보 가져오기(requests 라이브러리 사용)
2) HTML 소스 파싱(분석)하여 원하는 정보 얻기 : BeautifulSoup 라이브러리 사용
import requests
from bs4 import BeautifulSoup
# 네이버 영화 리뷰 - 트롤
url = "https://movie.naver.com/movie/bi/mi/review.nhn?code=191633"
# html 소스 가져오기
res = requests.get(url)
# html 파싱
soup = BeautifulSoup(res.text, 'lxml')
# 리뷰 리스트
ul = soup.find('ul', class_="rvw_list_area")
lis = ul.find_all('li')
# 리뷰 제목 출력
count=0
for li in lis:
count += 1
print(f"[{count}th] ", li.a.string)
결과 화면
반응형
'파이썬' 카테고리의 다른 글
믿고 선택한 홍정모 파이썬 추월코스 강의 후기 (0) | 2022.07.07 |
---|---|
[파이썬 프로젝트] 파이썬으로 PPT 편집 (0) | 2022.07.06 |
[파이썬 프로젝트] 카카오 이미지 검색 OpenAPI 호출 (0) | 2022.07.06 |
[파이썬 활용] 웹 이미지 파일 저장 import requests (0) | 2022.07.06 |
[파이썬 스터디] 파일 읽고 쓰기 write / read() (0) | 2022.07.06 |