MitPitt / BookViz

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Презентация По ссылке презентация.

Можно визуализировать книгу в виде barcode или матрицы

Пока книгу можно визуализировать только если она есть в Национальном корпусе русского языка.

Там точно есть большинство русской классики, но насчет другого можно быть уверенным только после проверки.

В ноутбуке RussianLiteratureColors.ipynb есть кнопка, чтобы открыть его в Google Colab. Там в последней главе надо просто вставить нужную ссылку в функцию.

Чтобы получить ссылку, надо проделать такой путь:

"Поиск в корпусе" -> "Основной корпус" -> "Задать подкорпус" -> Вписать там нужное название/автора -> "Далее..." -> "Сохранить подкорпус и перейти к странице поиска" -> В одно поле "Семант. признаки" вписать "t:physq:color" (это и обозначает любой цвет) -> "Искать" -> Если присутствует искомая книга, то жмите "Все примеры". Теперь вы на странице с нужным URL, копируйте его и вставляйте в код.

Аналогичным способом можно искать произведения и в других корпусах, например, в поэтическом.

Возможно, существует более простой способ. Если найдете, сообщите мне, пожалуйста.

В неопределенном будущем прикручу языковую модель и перепишу все, чтобы можно было визуализировать любые книги, а не только те, что есть в НКРЯ.

About


Languages

Language:Jupyter Notebook 100.0%