qingnia / DataMing--FPgrowth

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

本程序为大三下数据挖掘课程设计。
1.简介
	输入为twitter用户和关注对象, 数据结构如下:
		struct node
		{
			int	id;
			.....;
		};
		struct edge
		{
			int	source;
			int	target;
		};
	输出为用户关联度:如用户关注A,则该用户同时关注B的概率(A->B)
2.方法
	采用FP—growth算法,构造一个FP树,然后遍历得到关系集
	关系集为文件形式输出,文件名为FP_set
3.问题
	1.支持度统计严重过大。应该是在t_list计数的时候重复或者s_list删除节点的时候有失误
	2.FP树虽然生成了,但是没有按照预期顺序遍历s_list,貌似生成算法不完善
	3.计算支持度的时候不能正确查找右兄弟节点,某些节点如1125号甚至不能正确查找左孩子节点。


因为要急着交报告,因此就没再改。BUG以后有缘再改吧。
			电子科大计算机--2012级陈帅

About


Languages

Language:C 100.0%