爬虫基本结构+一个小重点:JSON数据处理。
import json
json =json.load(jsonText)
接下来就用处理字典的方式来获取想要的信息。
拿到图片数据以后借助工具Foto-Mosaik-Edda,效果如下:
json包中有几个常用但易混淆的方法:load(),loads()和dump(),dumps()
load()和loads()是将str转化为json数据的字典,而dump()和dumps()是将json字典转化为str。
loads()和dumps()都是对str直接操作的,而load()和dump()是对文件或者urlopen()拿下来的页面信息包括一些具有read()的文本对象进行操作。
浅拷贝:只复制地址,不复制内容 深拷贝:物理存储器开辟新空间,再将内容复制放入
import copy
#浅拷贝的两种方法。
a = 'ssss'
b = a
#② b = copy.copy(a)
#深拷贝
b = copy.deepcopy(a)