Bot that parses music articles
Название проекта: TelegramBotArticleParser
Какую задачу решает мой проект: По ссылке на веб-страницу с музыкальной статьёй бот возвращает список песен, упомянутых в этой статье.
Языки программирования и технологии: Проект написан на языке Python 3.6. Для парсинга веб-страниц используется библиотека BeautifulSoup. Далее с помощью Last.fm API программа пытается распознать в тексте названия песен. Для взаимодействия с Телеграмом используется билиотека PyTelegramBotApi. После этого проект был задеплоен с помощью бесплатного сервера, предоставленного Heroku (для этого нужны Procfile и requirements.txt).
Ссылка на видео с примером использования: https://youtu.be/LQxy5zcTqw4
Процесс работы программы:
-
Пользователь вводит url сайта.
-
Этот сайт парсится с помощью BeautifulSoup и из него возвращается чистый текст без html-разметки.
-
Далее программа проходится по тексту; если встречается текст в кавычках, запрос с текстом внутри отправляется на last.fm.
-
Если по такому запросу находится песня, результат записывается в строку ответов, если в строке такого ещё нет (проверяется с помощью set).
-
Строка ответов выводится пользователю.
Запуск программы: Программа запущена на сервере на Heroku, так что запускать её не надо. Для работы с ботом надо найти его в телеграме по нику @MusicArticlesParserBot.