图自编码器模型作为网络表示学习的代表性方法,在链路预测和节点分类任务方面性能表现优异。然而,图自编码器模型在处理社区发现任务时通常只考虑局部节点连边的重建而忽略了社区全局结构的影响,尤其是在多个社区存在重叠节点的情况下,难以准确判断节点归属关系和社区分布。针对此问题,该文提出了一种面向重叠社区发现的无监督模块度感知图自编码器模型(modularity-aware graph autoencoder model for overlapping community detection,GAME),GAME采用一种高效的模块度损失函数,该函数在网络嵌入过程中保留社区关系的同时,能重构损失并更新编码器的参数,以提高模型针对重叠社区发现任务的性能,进而将GAME得到的社区隶属度矩阵以概率-节点形式进行社区分配。该文提出的GAME在10个公开数据集上进行实验验证,并与主流的基于表示学习的重叠社区发现模型进行对比。实验结果表明:在归一化互信息(normalized mutual information,NMI)评估指标下,GAME模型性能优于主流模型,证明该模型有效。
社会网络的数据规模在不断扩大,现存的异常检测算法对复杂社会网络进行检测的效果不理想,提出了一种基于图模块度聚类的异常检测算法(anomaly detection algorithm based on graph modularity clustering,GMC_AD),该算法适用于解决受网络规模以及复杂度的限制导致检测效率不高的问题。GMC_AD算法在分析网络拓扑结构的基础上,通过引入异常节点加权机制和模块度聚类算法进行异常检测。GMC_AD算法主要在三个方面进行改进:a)设计网络中节点演化的量化策略,以此识别具有异常演化行为的节点来得到异常节点集合;b)通过模块度聚类的方法降低网络规模;c)在计算网络波动值的过程中使用加权机制合理考虑异常节点的影响,再通过网络波动值变化来检测异常。基于真实社会网络VAST、EU_E-mail和ENRON进行对比实验,GMC_AD算法准确地检测出异常发生的时段,实验结果显示在事件检测敏感性上提高了50%~82%,在异常检测运行效率上提高了30%~70%。实验结果表明,GMC_AD算法不仅提高了异常检测算法的准确率和敏感性,还提高了异常检测算法的效率。