李博 作品数:9 被引量:79 H指数:5 供职机构: 中南大学软件学院 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于SP_LDA模型的商品推荐算法 被引量:3 2016年 在电子商务的商品推荐系统中,为了给用户提供个性化的商品推荐,不少研究者提出了各自的推荐方法.由于方法中考虑的影响因素小等原因使得一些问题仍未得到解决,如:精准度不高、时间复杂度较高等.针对以上问题,在LDA主题挖掘模型的基础上提出了一种新的适用于商品(SP)推荐的数据挖掘模型:SP_LDA模型.通过该模型进行推导,得到商品概率的计算公式.通过对用户的历史购买数据和浏览数据进行分析,以计算的方式求解商品被推荐的概率,最终得到用户潜在感兴趣的商品.实验表明本模型能够高效地对商品进行挖掘,合理地向用户推荐感兴趣的商品. 郑祥云 陈志刚 黄瑞 李博关键词:电子商务系统 数据挖掘 基于推进的非平衡数据分类算法研究 被引量:1 2009年 在现实世界的数据分类应用中,通常会遇到数据不平衡的问题,即数据中一类数据的数量要大于另一类数据的数量。在目前针对非平衡数据的分类问题的解决方案中,推进算法因其能通过多次迭代提高少数类的分类指标来提高分类器的整体性能而有着较好的应用前景。从分析非平衡数据分类性能差的原因入手,通过抑制过度拟合与对少数类的F度量的控制对经典推进算法进行改进,提出了一种改进算法RIFBoost,然后将算法在WEKA系统上与几个传统的分类算法进行了比较。实验结果表明,RIFBoost算法在保留整体精度的同时对少数类的F度量的性能有了一定的提高。 潘俊 李宏 李博关键词:非平衡数据 基于LDA模型的音乐推荐算法 被引量:15 2016年 互联网的普及以及音乐资源的电子化使得人们可以更方便地获得音乐资源。但随着音乐库变得越来越大、资源越来越丰富,人们已经很难准确及时地找到自己喜欢的音乐。因此,对于音乐网站而言,需要一个合适的音乐推荐算法向用户推荐音乐。根据已有的基于音频信息的音乐推荐以及协同过滤方法,分析用户的音乐试听数据以及下载数据,并结合Latent Dirichlet分配(LDA)主题挖掘模型,提出一种音乐推荐算法。实验结果表明,与基于用户的协同过滤算法以及基于项目的协同过滤算法相比,该算法可以更加高效地向用户推荐感兴趣的音乐。 李博 陈志刚 黄瑞 郑祥云关键词:协同过滤 主题挖掘 LATENT 一种基于关联规则的多类标分类算法 被引量:5 2009年 提出了一种基于关联规则的多类标算法(MLAC),利用多类标FP-tree来分解组合生成多类标规则,并通过组合多重关联规则分类器进行分类预测,降低了由高维属性带来的高计算复杂度,有效地提高了算法的性能和效率.针对多类标数据集的实验结果表明,MLAC算法在性能和效率等方面均优于ML-KNN等多类标分类算法. 李宏 李博 吴敏 陈松乔关键词:关联规则 机会网络中基于节点探测的能量均衡机制 被引量:5 2017年 机会网络中节点在转发数据包之前,需要通过探测发现与自己发生接触的其它节点,而探测过程需要消耗能量,探测周期与探测到的接触数间有一种均衡关系.针对这种关系提出一种在机会网络中基于节点探测的能量均衡机制,该机制首先通过泊松分布模型建模得到有效探测概率,然后根据提出的表达式得到有效探测接触数,最后通过分析探测周期与有效探测接触数之间的关系,找到不同情况下探测周期与探测有效性的均衡点.结果表明,可以根据节点所处的环境来设置探测周期,达到节能的目的. 龙增艳 陈志刚 徐成林 李博 邓伊琴关键词:机会网络 均衡点 基于主题模型的个性化图书推荐算法 被引量:35 2015年 针对传统推荐算法精准度不高的问题,在潜在狄利克雷分布(LDA)主题挖掘模型的基础上提出了一种新的适用于图书推荐(BR)的数据挖掘模型——BR_LDA模型。通过对目标借阅者的历史借阅数据与其他图书数据进行内容相似度分析,得到与目标借阅者历史借阅图书内容相似度较高的其他图书。通过对目标借阅者的历史借阅数据及其他借阅者的历史借阅数据进行相似性分析,得到最近邻借阅者的历史借阅数据。通过求解图书被推荐的概率,最终得到目标借阅者潜在感兴趣的图书。特别地,当推荐数量为4 000时,BR_LDA模型比基于多特征方法和关联规则方法精准度分别提高了6.2%、4.5%;当推荐数量为500时,BR_LDA模型比协同过滤的近邻方法和矩阵分解方法分别提高了2.1%、0.5%。实验表明本模型能够更准确地向目标借阅者推荐历史感兴趣类别的新图书及潜在感兴趣的新类别的图书。 郑祥云 陈志刚 黄瑞 李博关键词:图书推荐 图书管理系统 数据挖掘 用于在线社交网络的链路预测好友推荐算法JAFLink 被引量:9 2017年 现在的社交网络不只是人们现实生活社交圈的一个反映,同时也在一定程度上扩展着人们的交际范围,使得用户在社交网上找到更多适合自己的朋友.但是,由于社交网络发展迅速,用户量巨大,对于用户来说,自己从中找到自己的好友是比较困难的,这就需要社交网站向用户提供一个比较好的推荐算法,从而使得网站真正能够改变用户的生活.本文提出的JAFLink(Jaccad-Adamic Adar-Feature)链路加权方法,结合jaccad和Adamic Adar并考虑了社交网络用户属性,构成JAFLink加权方法,用来计算节点对建立链接的可能性.实验表明,JAFLink相比只考虑网络拓扑结构或者用户属性而言更加高效. 李博 陈志刚 黄瑞 郑祥云 徐成林 周清清 龙增艳关键词:链路预测 用户属性 用于社区发现的LPA_LRDC标签传播算法 被引量:7 2017年 由于传统的LPA算法,在节点标签更新的顺序以及标签传播过程中存在较大的随机性,给社区发现的准确性和稳定性造成了很大的影响.本文提出LRDC(Leader Rank algorithm considered degree and clustering coefficient)算法并用其来衡量节点的重要性,然后按照节点的重要性大小排序作为LPA算法中初始化节点标签的依据,并在标签传播过程中综合考虑节点重要性以及邻居标签的数量提出LPA_LRDC(Label Propagation Algorithm based on LRDC)标签传播社区发现算法.通过在人工和真实的网络数据集上的实验结果表明,本文提出的标签传播社区发现算法能够显著的提高社区发现的准确性和稳定性. 徐成林 陈志刚 黄瑞 龙增艳 李博 周清清 邓伊琴关键词:LEADER RANK 在线社交网络Sybil账号检测 被引量:1 2017年 在线社交网络中的Sybil账号日益猖獗,他们会制造各种恶意活动,这些严重危害到了社交网络和用户的安全.针对Sybil账号检测这个问题,提出一个非常高效的Sybil账号检测模型.该模型提出使用受害者预测来提高检测准确性,将抽取的特征属性进行建模得到分类器,使用分类器进行受害者预测.再将预测结果应用到社交网络图模型中,最后,使用修改的随机游走对图节点进行排序.实验结果证明Sybil账号节点排在序列的底部,从而将Sybil账号从正常账号中分离出来.该模型的准确性达到了95%,这表明本文提出的检测模型是可行和有效的. 周清清 陈志刚 黄瑞 李博 徐成林关键词:分类器 随机游走