Web_Crawler

naver news, naver blog, daum news, youtube crawler 입니다.

jupyter notebook(.ipynb)에서 실행 결과를 확인할 수 있습니다.

웹 크롤링에 대한 가이드 자료는 웹 크롤링 가이드에서 확인할 수 있습니다.

Usage

필요한 library 설치

$ pip install selenium, beautifulsoup4, requests

selenium library를 사용하기 위한 현재 사용중인 브라우저 버전에 맞는 web driver 다운 필요(가이드 19페이지 참조)

크롤링한 데이터는 기본적으로 ./data/ 안에 저장되므로 디렉토리 생성 필요

$ mkdir data

naver news, naver blog, daum news, youtube crawler

Language:Jupyter Notebook 99.1%Language:Python 0.9%