blue03 / Analysis-of-Wechat-history-

微信聊天记录分析并生成对应词云图

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Analysis of Wechat history

运行环境

Python3

功能说明

获取微信聊天记录,分析词频并根据词频生成对应外形的词云图

环境配置

openpyxl

pip install openpyxl

对于Python中生成词云,需要安装WordCloud,他的安装不像上面的简单,如果只是通过pip安装的话会出现很多莫名其妙的错误。

下载相应版本的whl文件,从http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
进入相应文件件
在管理员环境下运行python -m pip install

其余的所需环境不再一一赘述,请缺少的自行谷歌百度搜索安装。

使用步骤

一.获取微信聊天记录

1.有一部已经ROOT的安卓手机(IOS系统获取微信聊天记录比较简单不再赘述) 2.获取聊天记录的保存文件 /data/data/com.tencent.mm/MicroMsg/一大串长文件夹/EnMicroMsg.db 这文件存放着微信聊天记录,把它拷贝到根目录,接着拷贝到电脑桌面 3.对聊天记录文件进行解锁 钥匙 KEY = IMEI (手机序列号) + UIN(用户信息号)手机输入 *#06# 能得到IMEI在哪里找到UIN呢?文件路径:/data/data/com.tencent.mm/shared_prefs/system_config_prefs.xml拷贝到电脑,右键记事本打开,uin在最下面钥匙 KEY= IMEI (手机序列号) + UIN(用户信息号)= 864587027946418-1342131695 把这一层拷贝到网站计算MD5值, 网站地址:免费 MD5 散列计算器 把前7位拷贝下来当做钥匙KEY:69fd600

4.下载打开数据库的软件SQLite Database Browser,打开如下点击File,OpenDatabase,选择刚才的EnMicroMsg.db文件弹出一个框,输入刚才7位的钥匙,就能顺利打开了微信数据库了打开效果如下

5.选择导出成Excel即可 6.找到对应ID的聊天记录并且导入到另一个Excel表中

二.处理需要的照片文件

将如下的照片文件抠出主体 变成下面的样子,保存为png文件 保存名为1.png

二.运行代码

导出的聊天记录文件表重命名为message.xlsx即可

代码流程

处理message.xlsx将有效的聊天内容存入test.txt文件内

读取test文件的聊天记录进行词频分析

根据设定背景绘制词云图

运行结果式样

欢迎关注本项目并且关注我的Github账户

About

微信聊天记录分析并生成对应词云图


Languages

Language:Python 100.0%