naver news, naver blog, daum news, youtube crawler 입니다.
jupyter notebook(.ipynb
)에서 실행 결과를 확인할 수 있습니다.
웹 크롤링에 대한 가이드 자료는 웹 크롤링 가이드에서 확인할 수 있습니다.
필요한 library 설치
$ pip install selenium, beautifulsoup4, requests
selenium library를 사용하기 위한 현재 사용중인 브라우저 버전에 맞는 web driver 다운 필요(가이드 19페이지 참조)
크롤링한 데이터는 기본적으로 ./data/
안에 저장되므로 디렉토리 생성 필요
$ mkdir data
** Contributor
Soonki Kwon : kwonrince@gmail.com
Hyunho Lee : lake8000@ds.seoultech.ac.kr