gxh-ray / DataMining2

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

DataMining2

RelationshipMining 选择1个数据集进行频繁模式和关联规则挖掘

文件介绍:

RS_Mining.py 文件为源码

RS_Mining.pdf 文件为实验分析报告

RS_Mining.ipynb 文件是Jupyter Notebook格式文件

generate_rules.txt 为实验生成的关系规则文件

环境:

  • pyCharm
  • Anaconda+Jupyter Notebook
  • python3.6

分析报告内容包括

一、数据

  • 1.1 数据集选择
    Wine Reviews:winemag-data-130k-v2.csv 数据集包括(国家,酒的评分)

  • 1.2 编程语言:python


二、数据分析要求

  • 2.1 对数据集进行处理,转换成适合进行关联规则挖掘的形式

  • 2.2 找出频繁模式

  • 2.3 生成关联规则,计算其支持度和置信度

  • 2.4 对规则进行评价,可使用Lift、卡方和其它教材中提及的指标,至少2种(这里采用了3种评价指标分别是:Lift、KULC、IR)

  • 2.5 对挖掘结果进行分析

  • 2.6 对挖掘结果可视化

About


Languages

Language:Jupyter Notebook 95.2%Language:Python 4.8%