undertheseanlp / sent_tokenize

Vietnamese Sentence Boundary Detection

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Tách câu tiếng Việt

Dự án nghiên cứu về bài toán tách câu tiếng Việt, được phát triển bởi nhóm nghiên cứu xử lý ngôn ngữ tự nhiên tiếng Việt - underthesea. Chứa mã nguồn các thử nghiệm cho việc xử lý dữ liệu, huấn luyện và đánh giá mô hình, cũng như cho phép dễ dàng tùy chỉnh mô hình đối với những tập dữ liệu mới.

Nhóm tác giả

Tham gia đóng góp

Mọi ý kiến đóng góp hoặc yêu cầu trợ giúp xin gửi vào mục Issues của dự án. Các thảo luận được khuyến khích sử dụng tiếng Việt để dễ dàng trong quá trình trao đổi.

Nếu bạn có kinh nghiệm trong bài toán này, muốn tham gia vào nhóm phát triển với vai trò là Developer, xin hãy đọc kỹ Hướng dẫn tham gia đóng góp.

Bản quyền

Mã nguồn của dự án được phân phối theo giấy phép GPL-3.0.

About

Vietnamese Sentence Boundary Detection


Languages

Language:Python 100.0%