a0ivanov / ljsave.com

Исходники сайта LJSave.com. Принимайте участие в разработке.

Home Page:https://ljsave.com

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

LJSave.com состоит из трех частей:

1. Скрапер (парсер)

Нужен, чтобы скачать блог с livejournal.com вместе с раскрытыми комментариями.

Лежит в папке /scraper/.

Представляет собой ruby-скрипты, которые запускают браузер Chrome при помощи Selenium и скачивают посты с livejournal.com.

Во время парсинга из страниц вырезаются лишние скрипты, формы логина и т.д.

После этого при помощи wget скачиваются все нужные для отображения файлы - картинки, стили и т.д.

Затем мы строим файл json, в котором перечислены скачанные нами посты и информация о них - название, дата, кол-во комментариев.

Теперь локальная копия блога ЖЖ готова. Чтобы ее отобразить, используется вторая часть:

2. Сайт на Ruby on Rails

Сайт берет локальные копии ЖЖ-постов из /public/lj и показывает посетителям.

Для удобства мы:

  1. Добавляем нужные нам скрипты, стили и мета-теги
  2. Добавляем navigation bar вверху страницы
  3. Заменяем некоторые ссылки на локальные

3. Скачанные данные

Данные из /public/lj/ мы храним в отдельном репозитории https://github.com/mgz/ljsave.com-data

Их нужно положить в папку /public/lj/

USE_CACHE=1 DEBUG_LOG=0 brake scraper:download username=USER

About

Исходники сайта LJSave.com. Принимайте участие в разработке.

https://ljsave.com


Languages

Language:Ruby 59.4%Language:HTML 20.1%Language:Shell 12.9%Language:CSS 3.7%Language:Dockerfile 2.7%Language:JavaScript 0.8%Language:SCSS 0.6%