6mini / cother19

☀️ 데이터 파이프라인 프로젝트 기상으로 예측하는 서울시 코로나 확진자 수 앱 😷

Home Page:https://cother.herokuapp.com

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Hits

Project3 001

Welcome to CO-THER 19 🙋🏻‍♂️

문제 정의

  • 플라스크(Flask) 웹 구현을 목표로 시작하는 데이터 파이프라인 구축 프로젝트이다.
  • 머신 러닝 모델을 서빙할 예정이고 머신 러닝 성능보다 무에서 파이프라인을 만들어 보는데 의의를 두려고 한다.
  • 태블로를 활용한 분석 및 배포까지 해보고 싶다.
  • 주제는 아무래도 코로나 때문에 굉장히 힘들어하고 있는 한 사람으로서, 기상 변인으로 서울시의 확진자 수를 예측하는 머신 러닝 모델을 만들어보려한다.

데이터 파이프라인

윤민쓰 의뢰 001

머신러닝 모델링

Project3 005

  • 코로나 확진자수가 유의하게 존재하는 기간은 그렇게 오래 되지 않았기 때문에 지금으로부터 1년 전까지의 데이터만 사용했다.
  • 59가지의 기상 데이터를 사용 시 R²: 0.9
  • 기상 입력값을 받아 확진자 예측을 해야하기 때문에, 59가지나 되는 기상을 사용할 수 없다.
    또한 기상예보에서 알려주는 데이터가 아닐 경우, 서비스의 유용력이 굉장히 떨어질거라 생각해서 기상예보로 확인할 수 있는 7가지의 기상 데이터만 사용했다.
  • 7가지의 기상 데이터를 사용 시 R²: 0.5
  • 모두 사용했을때보다 성능이 굉장히 아쉬웠지만, 그래도 0.5라는 수치는 강력하진 않지만 중간정도의 효과 크기로 간주되기 때문에 이 모델로 웹서비스를 진행했다.

간략 회고

  • 전체 회고 보러가기
  • 머신러닝을 접목해서 서비스를 한다는 것 자체가 개인적으로 사고를 높이는데 한단계 발전 할 수 있었던 프로젝트였다고 생각한다.
  • 어떤 학습을 시켜야하는지 문제정의를 하는 것부터, 어떤 데이터를 어떻게 파이프라인으로 꾸려야하는지를 생각하는게 까다롭고 힘들다는 것을 느꼈다.
  • 분석을 하면서도 느꼈고 도메인에 대해 탐색하면서도 느낀 점이지만 코로나가 기상과의 연관성이 크지 않아서 사실 서비스에대한 유용성을 스스로도 크게 느끼지 못한 것 같다.
  • 사실 데이터도 굉장히 부족해서 앞서 R2 값이 0.9가 나왔지만 과적합의 위험도 크고, 7개의 변인으로만 사용한 모델은 설명력이 굉장히 부족하기 때문에 결과가 포부를 따라가지 못해 아쉬운 마음이 큰 프로젝트 였다.
  • 시간의 한계 때문에 서울에 대해서만 모델링을 진행했는데, 전국적으로 또 전 세계적으로 오랜시간 연구하다보면 나름대로 유의미한 결과를 도출해낼 수도 있을거란 생각을 한다.

미리보기

스크린샷 2021-10-10 17 01 47

스크린샷 2021-10-10 17 01 52

스크린샷 2021-10-10 17 01 56

스크린샷 2021-10-10 17 02 00

스크린샷 2021-10-10 17 02 39

스크린샷 2021-10-10 17 02 04

스크린샷 2021-10-10 17 02 15

About

☀️ 데이터 파이프라인 프로젝트 기상으로 예측하는 서울시 코로나 확진자 수 앱 😷

https://cother.herokuapp.com


Languages

Language:Jupyter Notebook 45.5%Language:CSS 16.9%Language:HTML 11.7%Language:Sass 10.9%Language:Python 8.4%Language:JavaScript 4.7%Language:SCSS 1.9%