ncarkaci / tr-preprocessing

Türkçe metinler için metin ön işleme kütüphanesi; küçük harfe dönüştürme, şapkalı karakterleri eşleniği il değiştirme, stopwords'leri çıkarma, noktalama işaretlerini kaldırma, stopwords'ün geçerliliğini kontrol etme, klasör altındaki birden çok dosyayı birleştirip aynı anda işleme, rakamları, boşlukşarı, yeni satırları kaldırma yada olduğu gibi bıırakma gibi metin işleme de ihtiyaç duyulan işlemleri yapılabileceği python kütüphanesi. Genelde makine öğrenmesi çalışmalarında veriler toplandıktan sonra çalışma öncesinde ön işleme tabi tutulurlar. Bu işlemde Türkçe karakterler ile ilgili problemler yaşanabilmektedir. Geliştirilen kütüphanede tüm işlemleri tek bir kütüphane altında toplanmıştır.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

ncarkaci/tr-preprocessing Issues

No issues in this repository yet.