data-platform-impl

나 혼자 데이터 플랫폼 구축하기

아키텍처

상황: 서비스용 WAS, DB 만 있는 상태. 로그 등을 수집했지만 사용하기 힘듦

문제점

상황: 데이터 기반의 의사결정을 위해 데이터 분석이 필요한 상황. 데이터 분석할 도구가 없어 도입 필요

프로덕션 서비스 DB, 로그 스토리지의 데이터를 일일 배치 처리로 가공된 데이터를 조회할 수 있도록 인프라 구축

TODO:

문제점

상황: 실시간 데이터 분석 필요성과 분석 엔진 효율성 필요

데이터 분석 효율성 - 실시간 데이터를 바로 처리하여 즉시 활용할 수 있도록 인프라 구축

CDC
ETL, EDA 클러스터 오토 스케일링
- ETL 클러스터의 시스템 리소스의 지속적인 모니터링 필요
  - 효율적인 인스턴스 타입 선택을 위함
- 컨테이너 기반, K8S 도입

문제점

상황: 프로덕트가 성장 및 확장하여 테이블이 증가하였지만 수동적인 입수 작업 존재

자동화 - 데이터 프로덕트 개발

상황: 머신러닝 엔지니어 및 데이터 사이언티스트의 추가로 머신러닝 요구사항 추가