WhiteTeaDragon / TelegramBotArticleParser

Bot that parses music articles

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

TelegramBotArticleParser

Bot that parses music articles

Название проекта: TelegramBotArticleParser

Какую задачу решает мой проект: По ссылке на веб-страницу с музыкальной статьёй бот возвращает список песен, упомянутых в этой статье.

Языки программирования и технологии: Проект написан на языке Python 3.6. Для парсинга веб-страниц используется библиотека BeautifulSoup. Далее с помощью Last.fm API программа пытается распознать в тексте названия песен. Для взаимодействия с Телеграмом используется билиотека PyTelegramBotApi. После этого проект был задеплоен с помощью бесплатного сервера, предоставленного Heroku (для этого нужны Procfile и requirements.txt).

Ссылка на видео с примером использования: https://youtu.be/LQxy5zcTqw4

Процесс работы программы:

  1. Пользователь вводит url сайта.

  2. Этот сайт парсится с помощью BeautifulSoup и из него возвращается чистый текст без html-разметки.

  3. Далее программа проходится по тексту; если встречается текст в кавычках, запрос с текстом внутри отправляется на last.fm.

  4. Если по такому запросу находится песня, результат записывается в строку ответов, если в строке такого ещё нет (проверяется с помощью set).

  5. Строка ответов выводится пользователю.

Запуск программы: Программа запущена на сервере на Heroku, так что запускать её не надо. Для работы с ботом надо найти его в телеграме по нику @MusicArticlesParserBot.

About

Bot that parses music articles


Languages

Language:Python 100.0%