Paladnix / spider_demo

music_simple_api

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

spider_demo

music_simple_api

2017-09-30 初步实现搜索歌手,返回热门50首歌曲,抓取对应歌词和热评到本地

next 完善歌单和专辑的搜索以及对应的信息抓取

next 对获取的数据进行分词分析

2017-10-01

更新搜索函数,更新了返回的数据结构

初步测试了结巴分词

烦人...配置了ssh

next 进行大量内容爬取,进行数据可视化

2017-10-3

更换了两个之前跟网上教程学的抓取动态页面的操作,换了个url就好了

next 完善异常处理和多线程

测试记录:

爬取了1295份歌单,1.2W+的歌曲信息,基本稳定

About

music_simple_api


Languages

Language:Python 100.0%