Transformer 기반 한국어 seq2seq Chatbot

CUDA 10.1

python train.py

KoBERT (encoder)를 freeze 후, Transformer decoder를 질문/답변 데이터셋으로 fine-tuning

KoBERT 사용 후, validation accuracy 10% 상승

학습 시 50% 확률로 Teacher forcing을 사용하지 않았을 때, validation accuracy 9% 상승

Decoder layer 개수를 3개에서 6개로 늘렸을 때, validation accuracy 2% 상승

scripts/prediction_notebook.ipynb

About

Korean BERT pre-trained cased (KoBERT)

Apache License 2.0

Language:Jupyter Notebook 92.9%Language:Python 7.1%