hsh6449 / 2021Public_BigData_Internship

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

공공빅데이터 청년인턴_분석기획 워크숍 (Public_BigData_Internship)

주제 : 등급 세분화를 통한 장애인 활동보조자 임금 책정에서 보여주기위한 전처리


1. 기획의도

  • 국민연금공단에서 시행하고있는 '장애등록심사'는 그 기준이 아주 세세하고 잘 분류
  • 장애인분들을 도와줄 수 있는 활동보조자제도에서 힘든 곳은 기피하는 현상이 발생
  • 그 이유는 세세한 분류에도 불구하고 업무강도의 편차가 있기 때문에 소외되는 유형이 발생
  • 실제 필요한 분들의 수요를 충족시켜주고 싶어서 기획

2. 사용한 데이터

서울특별시에서 제공한 서울특별시_ 장애유형별, 등급별 장애인등록현황 이용

3. 사용한 코드

모듈

import pandas as pd

전처리

pop = pd.read_csv('C:/Users/user/Downloads/data.csv', encoding = 'euc-kr')
pop = pop.drop([0]) # 첫행 삭제

t = pop.sum()
tt = pd.DataFrame(t).T #가로로 보는게 편해서 transpose..
tt = tt.drop(['유형'], axis = 1) 
tt.describe()

사람 수 별로 매핑

ttt = tt.T # 다시 돌려

ttt['rank'] = 0
ttt.loc[(ttt['합계']>=10000) & (ttt['합계']<25000),] # 위치 찾는 코드 숫자만 바꿔가며 찾았다

ttt.loc[(ttt['합계']<1000),'rank'] =0
ttt.loc[(ttt['합계']>=1000) & (ttt['합계']<5000),'rank']  = 1 
ttt.loc[(ttt['합계']>=5000) & (ttt['합계']<10000),'rank'] = 2
ttt.loc[(ttt['합계']>=10000) & (ttt['합계']<25000),'rank'] =3 #매핑

4. 결과 및 정리

  • 간단하게 기획단계에서 보여주기 위한 전처리였기때문에 간단하게 코드를 정리
  • 여기서 고려한 것은 only 장애인 명수
  • 더 많은 데이터가 있으면 세분화해서 매핑 및 분류 알고리즘을 짤 수 있을것 같았다.

About


Languages

Language:Jupyter Notebook 100.0%