zhuizhu21 / spider

:star2::octocat: powered by python3( simple learning of spider) 百度文库;网易云歌曲; 豆瓣电影; GitHub; 京东; QQ空间; 天气; vip解析助手; TED文本内容; wifi破解脚本; 必应图片设置为桌面等爬取

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

python3.x 爬虫小项目


自己平时做数据分析时爬的数据 就当做练习爬虫了 😸

  • 爬取豆瓣国漫----2017/10

  • 爬取QQ好友所有说说----2017/11

  • 爬取赛氪网信息(未完成----2017/11

  • 爬取知乎用户信息(基于轮子哥 scrapy)----2017/11

  • 爬取WeChat(用itchat)----2017/12

  • 机器验证破解(未完成)----2017/12

  • 爬取星巴克信息----2018/1

  • 爬取网易云音乐评论 (持续更新)---- 2018/1

  • 爬取京东特定的商品评论---- 2018/1

  • 爬取豆瓣神秘巨星短评---- 2018/2

  • 爬取github--- 2018/2

  • vip视频解析助手--- 2018/2

    image

  • 抖音APP视频爬取下载(Fiddler)---2018/2
  • scrapy学习(依赖官方文档) ---2018/3
  • xpath学习 ---2018/3
  • 文件下载(浏览器下载的太慢了,ubuntu上还未发现好的下载软件,就自己简单实现了一个) ---/2018/3
  • 爬取ted的视频的文本内容,为后续的分析准备
  • WIFI 暴力破解

image

image

image

  • 添加百度文库的爬取(最近在用百度文库,经常提示粘贴超过用量,就弄了该脚本)

About

:star2::octocat: powered by python3( simple learning of spider) 百度文库;网易云歌曲; 豆瓣电影; GitHub; 京东; QQ空间; 天气; vip解析助手; TED文本内容; wifi破解脚本; 必应图片设置为桌面等爬取


Languages

Language:Python 80.8%Language:JavaScript 11.6%Language:HTML 4.2%Language:Julia 3.5%