tudoanh / pyjobs_crawlers

Scrapy crawlers for jobs.pymi.vn

Home Page:http://jobs.pymi.vn

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Jobs.pymi.vn Crawlers

CircleCI

Run all spiders by

./runner

Or run single spider

./runner careerbuilder

Test / lint

Để test style/lint chạy:

make lint

Chú ý, máy bạn cần cài sẵn make.

Để test các spider, chạy:

make test

Đóng góp

Các tiêu chí về spider

  • Mỗi job phải có tối thiểu 5 thông tin:
    ['name', 'province', 'url', 'work', 'specialize']
    
  • Code chuẩn Pep8, độ dài mỗi dòng giới hạn là 100 ký tự.
  • Python 2 (project được tạo trước khi Scrapy hỗ trợ Python3)

Spiders

Cài đặT

python-dev, libffi-dev

Chạy lệnh sau để cài trên Ubuntu (các hệ điều hành khác sẽ có gói tương tự).

sudo apt-get install -y python-dev libffi-dev

để khỏi gặp lỗi

    c/_cffi_backend.c:2:20: fatal error: Python.h: No such file or directory

libssl-dev

sudo apt-get install -y libssl-dev

để khỏi gặp lỗi

    build/temp.linux-x86_64-2.7/_openssl.c:423:25: fatal error: openssl/aes.h: No such file or directory
    compilation terminated.
    error: command 'x86_64-linux-gnu-gcc' failed with exit status 1

TODO

  • Thêm status của các crawler vào web

About

Scrapy crawlers for jobs.pymi.vn

http://jobs.pymi.vn


Languages

Language:Python 97.4%Language:Shell 2.3%Language:Makefile 0.3%