xingzhexiaozhu / DASCAN

运用DBScan算法对学生按上网时间进行聚类的一个应用

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

DASCAN

DBScan算法的详细介绍参考CSDN中Blog的介绍http://blog.csdn.net/u012050154/article/details/50502154

DBScan算法:基于密度的空间聚类算法 ,这里基于Spark平台对部分学生上网时间进行聚类,得到研究对象月上网时间分布。实例中将初始数据抽取有用信息,得到<MACAddress,OnlineTime>形式的有效数据,MACAddress作为对象标识,OnlineTime是该对象的上网时间,度量对象与对象的距离就是一维空间下的绝对值距离(即:Distance=|OnlineTime1-OnlineTime2|)

TestData.txt中是程序测试用例,给出的是学生上网的数据,根据学生上网时间的时长进行密度聚类

About

运用DBScan算法对学生按上网时间进行聚类的一个应用


Languages

Language:Java 100.0%