kenson2998 / Izakaya

crawl Izakaya

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

[爬取練習]居酒屋清單

爬取對象:

愛評網

環境:

python3.6
selenium 2.53.2
pillow
pytesseract 

初步實現:

因網頁中的電話號碼是圖片格式的關係,無法直接取得文字,所以使用selenium獲取圖片在用OCR進行解析,在速度上不是很有效率,還有很多地方需要完善。

About

crawl Izakaya


Languages

Language:Python 100.0%