MaksimSvinin / gui-fresheye

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

gui-fresheye

Программа для поиска близко расположенных одинаковых слов (повторов) и частотного анализа употребления слов в русском тексте.

За основу была взята программа https://gitlab.com/opennota/fresheye

Как использовать программу

Программа не требует установки. Нужно выбрать подходящую вам версию, скачать на свой компьютер и запустить файл.

Для начала работы необходимо загрузить анализируемый текст в левое окно. Это можно сделать двумя способами:

  • Нажать иконку «Файл» и выбрать пункт «Открыть файл». Найти необходимый файл на дисках вашего компьютера. Этот способ загрузки поддерживается только для формата .txt (в планах .doc и .docs)
  • Скопировать фрагмент текста из любого текстового редактора. Навести курсор на левое поле. Нажать левую кнопку мыши и выбрать пункт меню «Paste».

Когда текст загружен в левое окно, нужно выбрать параметры анализа во второй строке меню в верхней части окна.

Для начала анализа текста нужно нажать кнопку «Анализ»

После окончания анализа на левой панели появится список слов, отсортированных по частоте употребления.

Теперь нужно выбрать, отметив курсором, те слова, которые необходимо найти в тексте. Возможно выбрать все слова, нажав кнопку «Выделить всё». Окраска найденного слова от желтого к бордовому означает частоту его употребления в тексте.

Чтобы увидеть пары слов, расположенные ближе выбранного расстояния, нужно нажать кнопки «Выделить всё», «Показывать только близкие слова» и ещё раз нажать «Показать выделенные слова»

Описание пунктов верхнего меню и параметров анализа

  • Пункты «Порог чувствительности» и «Размер контекста» определяет глубину анализа для пар слов.
  • Пункт «Количество выводимых слов» определяет длину списка слов в левой панели.
  • Пункт «Расстояние между парами слов в символах» определяет расстояние между одинаковыми словами в символах, для которых работает функция «Показывать только близкие слова»
  • Пункт «Исключать имена собственные» исключает из частотного анализа слова, которые содержатся во внутреннем словаре собственных имён.
  • Пункт win 1251 кодировка необходим для чтения файлов в системе windows. Если он выключен, используется кодировка Unicode (utf-8)

About


Languages

Language:Go 91.9%Language:Makefile 8.1%