fairy-of-9 / korean-ner-cnn-bilstm

CNN+BiLSTM 기반 한국어 개체명 인식기입니다

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

CNN-BiLSTM model for Korean NER

CNN과 BiLSTM을 이용한 한국어 개체명 인식기입니다.

사용한 자질은 다음과 같습니다.

  • 형태소 non-static word2vec, static word2vec (mecab 사용, gensim으로 word2vec)
  • 음절단위 (character cnn)
  • POS (mecab 사용)
  • 사전정보 (gazette)

Requirements

  • pytorch
  • konlpy, mecab
  • gensim

데이터셋

  • 엑소브레인 언어분석 말뭉치(ETRI)

성능

classification_report

결과 예제

NER_result

모델

NER_model

Future work

  • CRF + Viterbi

About

CNN+BiLSTM 기반 한국어 개체명 인식기입니다

License:MIT License


Languages

Language:Python 75.1%Language:Jupyter Notebook 24.9%