2021 ICM ProblemD 音乐影响网络
模型
音乐影响网络
- 建立加权有向图,基础权重取决于influencer和follower的流派一致性,权重根据被影响者受到的影响人数目进行修正。
- 使用python(networkx库)计算图的连通性、聚集系数、度分布情况,并确定网络为幂律分布(无标度网络),基于极大似然估计计算幂律指数,使用KS检验分布。
- 计算节点的Cluster Coefficient、Degree Centrality、Closeness Centrality、Betweenness Centrality、Weighted PageRank,以上指标均尽可能利用图的有向性和权重进行计算。例如,PageRank在计算时,为节点分配不同的权重,取决于节点的出度。
- 计算节点的总影响力,为以上各个指标的加权平均,系数的确定后续进行敏感性分析。
子网分析
- 选取一个音乐人,使用dfs深度优先遍历,得到以其为初始点的一个子图,计算子图的各个指标,并结合实际情况对影响关系进行分析。
- 数据来源于Networkx库,导出数据,图使用Gephi进行制作。
具体影响力
- 具体影响力定义为点到点的影响力,基于前文计算的网络影响力和传播距离、传播路径权重计算。一个节点的影响力随着传播距离递减,每个传播路径上的影响力和这条传播路径的权重有关(即取决于被影响者收到影响人的数目)
- 分组影响力基于点到点的影响计算。
相似度计算
- 基于欧式距离和余弦相似度进行加权,权重后续敏感性分析得到。
- 其他相关均基于相似度进行计算,包括考虑时序、分组相似度等等