ahushh / perlchanwiper

Музейный экспонат вайпалки нульчана

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Описание
~~~~~~~~
Консольная вайпалка/бампалка для имиджборд на движках Kusaba и Wakaba

Полностью поддерживаемые борды
~~~~~~~~~~~~~~~~~~~~
Нульчан        — Nullchan

Частично поддерживаемые борды
~~~~~~~~~~~~~~~~~~~~
Ычан           — IIchan
Сосач          — Mochan

Любая другая борда на вакабе/кусабе после настройки конфигов.

Режимы работы
~~~~~~~~~~~~~
* Wipe         — вайп доски/тредов/рандомных тредов
* AutoBump     — автобампалка, следящая за положением треда на доске и удаляющая за собой посты
* ProxyChecker — прокси чекер специально для чанов
* Delete       — удалялка постов

Файлы и каталоги
~~~~~~~~~~~~~~~~
* cpcw         — запуск через консоль
* wpcw         — запуск веб-интерфейса
* config.pl    — настройки изображений/видео/текста, распознавания капчи
* configs      — настройки для режимов работы (Wipe, AutoBump, Delete, ProxyChecker)
* captcha      — сохраненные файлы капчи (см. опцию 'save_captcha' режима wipe)
* chans        — файлы конфигурации чанов
 
* OCR          — скрипты, распознающие капчу
* lib          — сторонние модифицированные библиотеки и бинарники
* extra        — разный дополнительный мусор
- proxychecker — простой прокси чекер, работающий на основе WWW:ProxyChecker
- proxyparser  — очищает прокси листы от мусора и повторов, приводя их удобный формат
- goldpoetry   — выкачивает стихи с сайта goldpoetry.ru
 

Веб-морда
~~~~~~~~~~~~~~~~~~~~~
http://localhost:3000

Пароль по-умолчанию: desu
Изменяется в 11-ой строчке файла wpcw:
 my $PASSWORD = 'новый-пароль;
вход по паролю так же можно отключить:
 my $PASSWORD = '';

Под windows не работает и не будет.

Примеры использования
~~~~~~~~~~~~~~~~~~~~~
Запуск сервера веб-интерфейса:
 ./wpcw daemon
или, например, на 7777 порте:
 ./wpcw daemon -l http://127.0.0.1:7777

Вайп:
 ./cpcw --mode Wipe --chan Nullchan --proxy proxy/my/0chan

Автобамп:
 ./cpcw --mode AutoBump --chan Nullchan --loglevel 2

Можно так же сокращать имена параметров до очевидных:
 ./cpcw --mo AutoBump --ch Nullchan --logl 2

Проверить прокси из файлы proxy/my/all на возможность постинга на доске:
 ./cpcw --mo ProxyChecker --ch Nullchan
Список хороших прокси будет напечатан при выходе или сохранен в файл (см. конфиг)

Просто прочекать прокси из файла proxy/my/all и сохранить хорошие в proxy/my/checked
 ./extra/proxychecker proxy/my/all proxy/my/checked

Для винды:
 perl .\cpcw [...]

Примечания
~~~~~~~~~
* Под виндой не тестировалось. Так что может работать, а может и нет.
* Для отключения каталога (например для автобампа 2.0 досок на нульчане)
  в файле конфигурации чана в секции 'urls' закомментировать строку
  catalog => ...

Установка
~~~~~~~~~
./INSTALL.pl
или
perl INSTALL.pl
или
sudo perl ./INSTALL.pl

Добавление новых чанов
~~~~~~~~~~~~~~~~~~~~~~
См. файлы 'chans/wakaba.example.pl' и 'chans/kusaba.example.pl'

FAQ
~~~
Где взять прокси?
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

http://tools.rosinstrument.com/raw_free_db.htm?t=0 - большая БД бесплатных прокси
https://hidemyass.com/proxy-list
(скачать все страницы можно, например, с помощью imacros)

Что-то не работает или работает не так, как надо. WTF?
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

Сперва обновиться до версии последнего коммита: https://bitbucket.org/ahushh/perlchanwiper
Если это не помогло, написать на мыло или в тред (http://0chan.hk/i/res/2.html) о проблеме,
указав версию перла, системы и вайпалки, а так же выхлоп с ключом --loglevel 4

Как установить диапазон символов, которые будет распознавать tesseract?
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

1.  Создать конфиг (например 'englishletters') в tessdate/configs - обычно
    /usr/share/tesseract/tessdata/configs
    или
    /usr/share/tesseract-ocr/tessdata/configs
    для винды
    c:\program files\tesseract-ocr\tessdata\configs

2.  Отредактировать его например так (для английских строчных буквы):
    tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz

    На месте 'abcdefghijklmnopqrstuvwxyz указываются допустимые для
    распознавания символы.

    Или так (распознаваться будут только цифры):
    tessedit_char_whitelist 0123456789
    Строчная кириллица:
    tessedit_char_whitelist АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ 

3.  Отредактировать общий конфиг (./config.pl):
    config => 'englishletters',
     
Контакты
~~~~~~~~
ahushh@gmail.com

About

Музейный экспонат вайпалки нульчана

License:GNU General Public License v3.0


Languages

Language:Perl 90.2%Language:Perl 6 9.8%