공공빅데이터 청년인턴_분석기획 워크숍 (Public_BigData_Internship)

주제 : `등급 세분화를 통한 장애인 활동보조자 임금 책정`에서 보여주기위한 전처리

1. 기획의도

국민연금공단에서 시행하고있는 '장애등록심사'는 그 기준이 아주 세세하고 잘 분류
장애인분들을 도와줄 수 있는 활동보조자제도에서 힘든 곳은 기피하는 현상이 발생
그 이유는 세세한 분류에도 불구하고 업무강도의 편차가 있기 때문에 소외되는 유형이 발생
실제 필요한 분들의 수요를 충족시켜주고 싶어서 기획

2. 사용한 데이터

서울특별시에서 제공한 서울특별시_ 장애유형별, 등급별 장애인등록현황 이용

3. 사용한 코드

모듈

import pandas as pd

전처리

pop = pd.read_csv('C:/Users/user/Downloads/data.csv', encoding = 'euc-kr')
pop = pop.drop([0]) # 첫행 삭제

t = pop.sum()
tt = pd.DataFrame(t).T #가로로 보는게 편해서 transpose..
tt = tt.drop(['유형'], axis = 1) 
tt.describe()

사람 수 별로 매핑

ttt = tt.T # 다시 돌려

ttt['rank'] = 0
ttt.loc[(ttt['합계']>=10000) & (ttt['합계']<25000),] # 위치 찾는 코드 숫자만 바꿔가며 찾았다

ttt.loc[(ttt['합계']<1000),'rank'] =0
ttt.loc[(ttt['합계']>=1000) & (ttt['합계']<5000),'rank']  = 1 
ttt.loc[(ttt['합계']>=5000) & (ttt['합계']<10000),'rank'] = 2
ttt.loc[(ttt['합계']>=10000) & (ttt['합계']<25000),'rank'] =3 #매핑

4. 결과 및 정리

간단하게 기획단계에서 보여주기 위한 전처리였기때문에 간단하게 코드를 정리
여기서 고려한 것은 only 장애인 명수
더 많은 데이터가 있으면 세분화해서 매핑 및 분류 알고리즘을 짤 수 있을것 같았다.

hsh6449 / 2021Public_BigData_Internship

공공빅데이터 청년인턴_분석기획 워크숍 (Public_BigData_Internship)

주제 : `등급 세분화를 통한 장애인 활동보조자 임금 책정`에서 보여주기위한 전처리

1. 기획의도

2. 사용한 데이터

3. 사용한 코드

4. 결과 및 정리

About

Languages

공공빅데이터 청년인턴_분석기획 워크숍 (Public_BigData_Internship)

주제 : 등급 세분화를 통한 장애인 활동보조자 임금 책정에서 보여주기위한 전처리

1. 기획의도

2. 사용한 데이터

3. 사용한 코드

4. 결과 및 정리

About

Languages

주제 : `등급 세분화를 통한 장애인 활동보조자 임금 책정`에서 보여주기위한 전처리