"Introduction to Practical Data Science (IPDS)" (2017)
책 웹사이트: https://dataninja.me/ipds-kr/
- 데이터 과학이란?
- 데이터 분석환경 구성하기
- 자료 처리와 dplyr, SQL
- 자료 시각화 I: ggplot2
- 코딩 스타일
- 통계개념복습
- 자료 종류에 따른 분석 기법
- 빅데이터 분류분석 I: 기본개념과 로지스틱모형
- 빅데이터 분류분석 II: 라쏘와 랜덤포레스트
- 분석결과 정리와 공유, R 마크다운
- 빅데이터 회귀분석 I. 산불(forest fire) 자료분석
- 빅데이터 회귀분석 II. 자전거 렌탈수요(bike sharing) 자료분석
- 자료시각화 II: 단어구름을 사용한 텍스트자료의 시각화
- 실리콘 밸리에서 데이터 과학자 되기
- R https://www.r-project.org/
- R스튜디오 (RStudio) https://www.rstudio.com/
- 컴퓨터에 git clone 클론해서 사용하세요.
- 각 서브디렉토리는 RStudio 프로젝트입니다.
- 각 서브디렉토리 안에 있는 *.Rproject 파일을 열면 R스튜디오 프로젝트가 열립니다.
- *.R 파일들을 열어서 책을 따라 실행해 보세요.