EgorGumin / StemmingAndSpellChecking

Сравнение результатов работы стеммера на словах с ошибками и опечатками и исправленных словах.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

StemmingAndSpellChecking

Сравнение результатов работы стеммера на словах с ошибками и опечатками и исправленных словах.

Используется библиотека Languagetool

Стемминг с помощью Стеммера Портера

Начало работы

  • Склонируйте репозиторий
$ git clone https://github.com/GuminEgor/StemmingAndSpellChecking.git
  • Загрузите train.csv с сайта SNA Hakathon 2014 и поместите в директорию resources
  • Запустите Main.java
  • В результате работы будет сгенерирован файл res.csv, опираясь на который Вы сможете построить диаграмму частотности (пример в файле Diagram.xlsx)

About

Сравнение результатов работы стеммера на словах с ошибками и опечатками и исправленных словах.

License:MIT License


Languages

Language:Java 100.0%