Dekromatia / animals_in_books

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Корпус состоит 63 книг, авторов:

1.	Виталий Валентинович Бианки - советский писатель
2.	Джеральд Даррелл - английский натуралист, писатель, основатель “ зоопарка в Джерси”
3.	Джеймс Хэрриот — английский писатель, ветеринар и лётчик, автор книг о животных и о людях
4.	Эрнест Сетон-Томпсон - канадский писатель, художник-анималист, естествоиспытатель
5.	Евге́ний Па́влович Спа́нгенберг — советский орнитолог, писатель-натуралист, кандидат биологических наук
6.	И́горь Ива́нович Аки́мушкин — советский учёный-биолог, писатель, популяризатор биологии, автор научно-популярных книг о жизни животных
7.	Альфред Эдмунд Брем — немецкий учёный-зоолог и путешественник, автор знаменитой научно-популярной работы «Brehms Tierleben»

Исследовательский вопрос:
"Какие тексты ближе к друг другу по описываемому в них миру природы?"

С помощью Python для кажлого текста был выполненв:
токенизация
лемматизация. 
убраны стоп слова
После для каждой книги был создан список животных.
создан словарь вида: 
ключ = животное 
значение = список авторов
удалены животные для которых был только 1 автор.

И записанн в текстовый файл для дальнейшего создания csv-файла в Easy Linavis.
Далее полученный файл был подгружен в GEFI

вершины - это книги 
ребро: если животное есть в 2 книгах

Чем жиреннее связь тем больше одинаковых животных
и чем жиренее узел 
Цвета примерно покаывают набор разных животных

Возможно стоило сгруппировать животных в группы по географическому признаку

About


Languages

Language:JavaScript 78.8%Language:CSS 7.8%Language:Jupyter Notebook 6.9%Language:HTML 3.6%Language:Python 2.8%