eastmountyxz / Book2-Python-DataAnalysis

该资源为杨秀璋作者《Python网络数据爬取及分析从入门到精通(分析篇)》书籍所有源代码,包括可视化分析、聚类分析、回归分析、分类分析、词云和LDA分析等内容。所有代码已修改为Python3实现,希望对您有所帮助,一起加油。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Book2-Python-DataAnalysis

该资源为杨秀璋作者《Python网络数据爬取及分析从入门到精通(分析篇)》书籍所有源代码,包括可视化分析、聚类分析、回归分析、分类分析、词云和LDA分析等内容。所有代码已修改为Python3实现,希望对您有所帮助,一起加油。


  • 第1章 网络数据分析概述
    1.1 数据分析
    1.2 相关技术
    1.3 Anaconda开发环境
    1.4 常用数据集

  • 第2章 Python数据分析常用库
    2.1 常用库
    2.2 NumPy
    2.3 Pandas
    2.4 Matplotlib
    2.5 Sklearn

  • 第3章 Python可视化分析
    3.1 Matplotlib可视化分析
    3.2 Pandas读取文件可视化分析
    3.3 ECharts可视化技术初识

  • 第4章 Python回归分析
    4.1 回归
    4.2 线性回归分析
    4.3 多项式回归分析
    4.4 逻辑回归分析

  • 第5章 Python聚类分析
    5.1 聚类
    5.2 K-Means
    5.3 BIRCH
    5.4 树状图聚类
    5.5 降维处理

  • 第6章 Python分类分析
    6.1 分 类
    6.2 决策树
    6.3 KNN分类算法
    6.4 SVM 分类算法

  • 第7章 Python关联规则挖掘分析
    7.1 基本概念
    7.2 Apriori算法
    7.3 Apriori算法的实现

  • 第8章 Python数据预处理及文本聚类
    8.1 数据预处理概述
    8.2 中文分词
    8.3 数据清洗
    8.4 特征提取及向量空间模型
    8.5 权重计算
    8.6 文本聚类

  • 第9章 Python词云热点与主题分布分析
    9.1 词 云
    9.2 WordCloud的安装及基本用法
    9.3 LDA

  • 第10章 复杂网络与基于数据库技术的分析
    10.1 复杂网络
    10.2 基于数据库技术的数据分析
    10.3 基于数据库技术的博客行为分析

  • 后记

About

该资源为杨秀璋作者《Python网络数据爬取及分析从入门到精通(分析篇)》书籍所有源代码,包括可视化分析、聚类分析、回归分析、分类分析、词云和LDA分析等内容。所有代码已修改为Python3实现,希望对您有所帮助,一起加油。


Languages

Language:Python 100.0%