Tập dữ liệu các bài báo tiếng Việt được sử dụng trong paper A Comparative Study on Vietnamese Text Classification Methods( Cong Duy Vu Hoang, Dien Dinh, Le Nguyen Nguyen, Quoc Hung Ngo. In Proceedings of IEEE International Conference on Research, Innovation and Vision for the Future (RIVF 2007) (long), 2007.)
link: https://github.com/duyvuleo/VNTC
Để tiền xử lý dữ liêu, chạy file Preprocessing
Để khám phá tập dữ liệu, chạy file EDA
Để train các model Machine Learning, chạy file Model
Để train model Deep Learning, chạy file Model_deep