CNN-BiLSTM model for Korean NER
CNN과 BiLSTM을 이용한 한국어 개체명 인식기입니다.
사용한 자질은 다음과 같습니다.
- 형태소 non-static word2vec, static word2vec (mecab 사용, gensim으로 word2vec)
- 음절단위 (character cnn)
- POS (mecab 사용)
- 사전정보 (gazette)
Requirements
pytorch
konlpy, mecab
gensim
데이터셋
- 엑소브레인 언어분석 말뭉치(ETRI)
성능
결과 예제
모델
Future work
- CRF + Viterbi