jaealways / mint

뮤직카우 음악저작권 자산 분석 엔진 MINT입니다.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

MINT: Musical asset INTeligence, 음악 자산 분석 엔진


뮤직카우 서비스 내의 음악저작권 자산을 분석하여, 자체 엔진을 만들었습니다.

Hyperlink

Engine Demonstration Video

Video Label

이미지를 클릭하면 해당 영상으로 이동합니다.
엔진 시연 영상

Web service hyperlink

해당 엔진을 기반으로, 정보를 제공하는 musicowlabs 웹서비스를 만들었습니다.

(2023.04.07 서비스 종료)
musicowlabs
위의 링크가 안될경우

project MuTech article hyperlink

프로젝트 과정, 시행착오가 담긴 아티클입니다.

[MuTech] 1. Introduction: 데이터로 보는 음악 저작권 투자
[MuTech] 2. SNS index: 음악 저작권료를 예측할 수 있을까?
[MuTech] 3. time-series clustering: 서로 다른 음악저작권을 분류할 수 있을까?
[MuTech] 4. PER, BETA: 음악 저작권 시장에서 금융지표가 작동할까?
[MuTech] 5. 공포탐욕지수로 보는 음악저작권
[MuTech] 6. 금융 텍스트 활용하기
[MuTech] 7. Topic Modeling: 뉴스로 보는 음악저작권 투자
[MuTech] 8. MINT: 음악저작권 분석 엔진
[MuTech] 9. PLM을 활용한 토픽 모델링
[MuTech] 10. 프로젝트 MuTech 일지


Architecture

Architecture by timeline

Figure1

Architecture by directory

  1. technical_analysis: 보통 EDA나 모델을 테스트한 스크립트를 모았습니다. 유의미한 결과를 보이면 엔진의 모델링 부분에 추가합니다.
  2. crawlers, data_crawling: 데이터 크롤링과 관련된 스크립트가 있습니다.
  3. data_modeling: 자연어처리나 금융지표 계산 같은 모델링 스크립트가 있습니다.
  4. data_preprocessing: raw 데이터를 전처리하는 스크립트가 있습니다.
  5. data_transformation: mongodb에 적재된 raw data를 data_preprocessing에 있는 로직을 이용해 mysql에 적재시킵니다.

Data

Crawling Data

500여 아티스트에 대한 네이버 뉴스기사 하루 2000개 내외
1000여 곡에 대한 가격, 거래량, 저작권료 데이터
MCPI(음악저작권지수) 데이터

Output Data

500여 아티스트 중 일정 기사 수를 충족한 100여명의 토픽 모델 생성
1000여 곡의 시가총액, PER, 베타, 공포탐욕지수, 턴오버 다섯가지 금융지표 생성
MCPI(음악저작권지수) 공포탐욕지수, 총 거래량 데이터 생성

Contributors

이윤수
분석엔진: 여러 데이터 가공 및 분석
웹서비스: 웹 페이지 개발
이재형
분석엔진: 금융데이터 분석 및 지표 제작, 뉴스기사 토픽모델링, 분석부분 엔진 구축
웹서비스: 웹 페이지 시각화 개발
정예원
분석엔진: 데이터 크롤링 코드 구현


About

뮤직카우 음악저작권 자산 분석 엔진 MINT입니다.


Languages

Language:Jupyter Notebook 98.8%Language:Python 1.2%