tmux a -t 0
python update.py
tmux a -t 3
python crawl_all.py
Khi muốn dừng tool: ấn tổ hợp phím: Ctrl+B X Y (Bấm và giữ Ctrl sau đó ấn B, sau đó nhả 2 phím và ấn X, sau đó nhả phím và ấn Y)
Khi muốn chạy lại tool:
tmux new -s 0 (hoặc 3 - crawl all)
cd /root/nettruyen_madara
source /venv/bin/activate
python update.py (hoặc python crawl_all.py)
-
SAVE_CHAPTER_IMAGES_TO_S3: True - Lưu ảnh vào amazon S3 (False - Ko lưu ảnh vào amazon S3, lưu ảnh vào Local)
-
AWS_ACCESS_KEY_ID: S3 Access Key
-
AWS_SECRET_ACCESS_KEY: S3 Secret Access Key
-
S3_BUCKET: S3 Bucket để lưu ảnh của chapters
-
S3_BUCKET_IMAGE_URL_PREFIX: Link ảnh lấy từ S3 (Không bao gồm tên ảnh lưu trên S3)
-
user, password, host, port, database: Kết nối tới database
-
TABLE_PREFIX: Bắt đầu tên table trong database (Hiện tại là XBFUe_)
-
CHAPTER_PREFIX: Dòng chữ nhỏ ở trên mỗi chapter
-
CUSTOM_CDN: Domain site lưu ảnh cho truyện
-
UPLOAD_FOLDER: Folder gốc để lưu ảnh (nên để ở /var/www/html/ để dễ config nginx)
-
IMAGE_SAVE_PATH: Folder để lưu ảnh của từng chapter
-
THUMB_SAVE_PATH: Folder lưu ảnh covers (Sau đó sẽ copy lên hosting - tự động 1 phút / lần)
-
TELEGRAM_BOT_TOKEN: Token của bot telegram (tạo trong chat với BotFather). Điền vào giữa dấu ""
-
TELEGRAM_CHAT_ID: Telegram ID của user hoặc group nhận thông báo khi domain nettruyen có thể die. Điền vào giữa dấu ""
-
WAIT_BETWEEN_LATEST: Thời gian đợi giữa 2 lần cào page 1 nettruyen để update: 5 * 60 là 5 phút
-
WAIT_BETWEEN_ALL: Thời gian đợi giữa 2 lần cào từ page 2 tới page cuối của nettruyen để cào các truyện còn lại: 1 * 20 là 20 giây
-
NETTRUYEN_HOMEPAGE: Domain của nettruyen (Đổi trong trường hợp nettruyen đổi)
cd nettruyen_madara
tmux new -s 0
source /venv/bin/activate
Bấm và giữ Ctrl sau đó ấn B, sau đó nhả 2 phím và ấn D (dùng để ẩn session tmux - vẫn chạy bình thường)
tmux new -s 3
source /venv/bin/activate
Bấm và giữ Ctrl sau đó ấn B, sau đó nhả 2 phím và ấn D
Sau đó sử dụng theo hướng dẫn trên