hobinkwak / Fintech_project

21년 한국핀테크지원센터 pre-internship 과정 프로젝트

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Fintech_project

21년 한국핀테크지원센터 pre-internship 과정 프로젝트

주요기능

추출식 문서요약 (TextRank)

참고 : https://github.com/labft3231/NLP

  1. 보유 종목에 관한 최신 기사를 3줄 요약하여 전달
  2. 기사 내 문장을 TF-IDF로 벡터화한 후 이를 그래프화하고 문장 간의 중요도를 계산하고 중요도가 높은 3개의 문장을 요약문장으로 판단 (TextRank 알고리즘)

Hidden Markov Model 기반의 주가 패턴인식

  1. 상태는 ‘상승’, ‘보합(변동성)’, ‘하락’으로 가정 (Hidden State 개수 3개로 가정)
  2. 은닉 마르코프 모형을 통한 보유 종목(테마)의 수익률에 대한 동적 클러스터링으로 (은닉)상태를 판단
  3. 보유 종목이 2개 이상일 경우 시가총액가중방식으로 지수화하여 모델링
  4. 은닉상태(보유 종목의 수익률)를 Gaussian 확률변수로 보고 Baum-Welch 알고리즘을 통하여 은닉상태의 확률분포 및 관측된 수익률 시퀀스에 대응되는 은닉상태의 시퀀스를 예측.

종목추천

  1. 아이템을 구성하는 개별 종목에 대한 종목 추천 기능
  2. 최종 추천 종목은 다음과 같은 선별 과정을 거침

2.1 Word2Vec의 skip-gram 방식을 활용하여 보유 종목과 일별 수익률 분포(움직임)가 유사한 종목들을 계산

2.2 InfoStocks 테마주 데이터 상에서 ‘보유 종목’과 같은 테마로 분류되는 유사종목을 선별

2.3 최근 10년간의 주가에 대해 보유 종목과의 공적분 검정 유의확률이 0.05 이하인 유사종목들을 재선별하여 테마와 함께 추천 종목으로 출력

About

21년 한국핀테크지원센터 pre-internship 과정 프로젝트


Languages

Language:Jupyter Notebook 93.8%Language:Python 6.2%