bladeofsteel / habr_to_fb2

Экспорт избранного хабрахабра в fb2

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Скачиваем избранное хабрахабра в формат fb2

В принципе, скрипт уже работает - прописываем в файле config.php в переменной $login нужный логин, переходим на страничку index.php - и запускаем скачивание. Полноценный аккаунт не нужен, ключи разработчика не нужны, работает быстро, памяти много не ест.

Конфигурируется через файл config.php.

Но есть проблемы:

  • Основная проблема - не идеальная и не 100% конвертация из HTML в fb2. На некоторых статьях может генерироваться битый код, который ломает дальенйший просмотр книги. Не найден надежный способ заменять тэг
    (при замене на

    есть шанс получить невалидный, сломанный файл). Так что читаемость получившегося файла зависит от читалки. (Cool Reader, например, прочитает с любыми ошибками, FBReader - уже нет).

  • ленивая обработка ошибок (неудачно скачанные картинки, статьи или файлы просто отбрасываются, нет логгировани)
  • не скачиваются комментарии (нет идей, как их показывать)

Без разрешения первой проблемы остальные править бесполезно. Есть мысли на основе этого конвертера сделать конвертер в epub-формат.

About

Экспорт избранного хабрахабра в fb2


Languages

Language:PHP 100.0%