- 국민연금공단에서 시행하고있는 '장애등록심사'는 그 기준이 아주 세세하고 잘 분류
- 장애인분들을 도와줄 수 있는 활동보조자제도에서 힘든 곳은 기피하는 현상이 발생
- 그 이유는 세세한 분류에도 불구하고 업무강도의 편차가 있기 때문에 소외되는 유형이 발생
- 실제 필요한 분들의 수요를 충족시켜주고 싶어서 기획
서울특별시에서 제공한
서울특별시_ 장애유형별, 등급별 장애인등록현황
이용
모듈
import pandas as pd
전처리
pop = pd.read_csv('C:/Users/user/Downloads/data.csv', encoding = 'euc-kr')
pop = pop.drop([0]) # 첫행 삭제
t = pop.sum()
tt = pd.DataFrame(t).T #가로로 보는게 편해서 transpose..
tt = tt.drop(['유형'], axis = 1)
tt.describe()
사람 수 별로 매핑
ttt = tt.T # 다시 돌려
ttt['rank'] = 0
ttt.loc[(ttt['합계']>=10000) & (ttt['합계']<25000),] # 위치 찾는 코드 숫자만 바꿔가며 찾았다
ttt.loc[(ttt['합계']<1000),'rank'] =0
ttt.loc[(ttt['합계']>=1000) & (ttt['합계']<5000),'rank'] = 1
ttt.loc[(ttt['합계']>=5000) & (ttt['합계']<10000),'rank'] = 2
ttt.loc[(ttt['합계']>=10000) & (ttt['합계']<25000),'rank'] =3 #매핑
- 간단하게 기획단계에서 보여주기 위한 전처리였기때문에 간단하게 코드를 정리
- 여기서 고려한 것은 only
장애인 명수
- 더 많은 데이터가 있으면 세분화해서 매핑 및 분류 알고리즘을 짤 수 있을것 같았다.