山东省自然科学基金(ZR2012FM037)
- 作品数:9 被引量:157H指数:6
- 相关作者:马军陈竹敏郭磊王帅强崔超然更多>>
- 相关机构:山东大学山东财经大学更多>>
- 发文基金:山东省自然科学基金国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Weighted-Tau Rank:一种采用加权Kendall Tau的面向排序的协同过滤算法被引量:3
- 2014年
- 已知的面向排序的协同过滤算法主要有两个缺点:计算用户相似度时只考虑用户对同一产品对的偏好是否一致,而忽略了用户对产品对的偏好程度以及该偏好在用户间的流行度;进行偏好融合和排序时需要中间步骤来构建价值函数然后才能利用贪婪算法产生推荐列表。为解决上述问题:我们利用类TF-IDF加权策略对用户的偏好程度及偏好流行度进行综合考量,使用加权的Kendall Tau相关系数计算用户间的相似度;进行偏好融合与排序时则使用基于投票的舒尔茨方法直接产生推荐列表。在两个电影数据集上,本文提出的算法在评测指标NDCG上的效果要明显优于其他流行的协同过滤算法。
- 孙建凯王帅强马军
- 关键词:协同过滤TAU
- GeoPMF:距离敏感的旅游推荐模型被引量:6
- 2017年
- 虽然目前旅游者可以利用Web搜索引擎来选择旅游景点,但往往难以获得较好符合自身需要的旅游规划.而旅游推荐系统是解决上述问题的有效方式.一个好的旅游推荐模型应具有个性化并能考虑用户时间和费用的限制.调研表明,用户在选择旅游景点时,目的地与用户常居地的距离常常是一个需要考虑的问题.因为旅行距离往往可以间接地反映了时间和费用的影响.于是,在贝叶斯模型和概率矩阵分解模型的基础上,提出一个旅行距离敏感的旅游推荐模型(geographical probabilistic matrix factorization,GeoPMF).主要思想是基于每个用户的旅游历史,推算出一个最偏好的旅游距离,并作为一种权重,添加到传统的基于概率矩阵分解的推荐模型中.在携程网站的旅游数据集上的实验表明,与基准方法相比,GeoPMF的RMSE(root mean square error)可以降低近10%;与传统概率矩阵分解模型(PMF)相比,通过考虑距离因子,RMSE平均降幅近3.5%.
- 张伟韩林玉张佃磊任鹏杰马军陈竹敏
- 关键词:推荐系统
- 一种信任关系强度敏感的社会化推荐算法被引量:40
- 2013年
- 为了进一步提高推荐算法的准确率,更好地对用户间的信任关系进行建模,首先提出了一种信任关系强度敏感的社会化推荐算法(StrengthMF).与以往的算法相比,该算法假设建立信任关系的两个用户之间并不一定存在着相似的兴趣爱好.在推荐过程中,StrengthMF算法通过共享的潜在用户特征空间来对信任关系强度和用户兴趣进行建模,通过进一步识别出那些与目标用户有着共同爱好的朋友来对求解的过程进行优化.为了验证算法所估计出的信任关系强度的准确性,接着又在SocialMF算法的基础上,提出了一种使用所估计的信任关系对其重新训练和学习的InfluenceMF算法.实验结果表明,与目前较为流行的方法相比,新方法能在RMSE和MAE上取得更好的推荐结果,其所推导出的信任关系强度能进一步提高已有推荐算法的性能.
- 郭磊马军陈竹敏
- 关键词:推荐系统社会化推荐协同过滤
- 一种综合语义和时效性意图的检索结果多样化方法被引量:7
- 2015年
- 当前,检索结果多样化作为一种提升用户满意度的有效方法已成为Web和数据库检索、文本摘要及推荐系统等领域的研究热点之一.但已有研究工作大都只考虑语义多样化策略.而实际上,多样化是一个非常复杂的优化问题,还需考虑许多其他的策略,如新颖性、质量、价值等.众所周知,Web是一个动态的信息空间,用户的查询需求也随时间不断演化,只有在一个特定的时间模式下,检索系统才能返回满意的结果.故该文提出一种新的结合语义和时效性两个维度的查询结果多样化方法.该文首先给出了多维度查询结果多样化框架的通用定义.然后,对于给定的查询,探讨了如何基于文档、词和查询频率来计算其时效性意图的概率分布.之后,提出一种新的针对时效性多样化的评价方法.最后,构建了针对多维度多样化问题的真实数据集,并通过实验证明该文提出的方法,不管是在传统的多样化评价指标上,还是在该文提出的时效性多样化指标上,性能都超过了当前主流的基准方法.
- 任鹏杰陈竹敏马军隋雪芹吴凯
- 关键词:语义社交网络社会计算
- LinkMF:结合Linked Data的协同过滤推荐算法
- 2016年
- 协同过滤(CF)是推荐系统中应用最为广泛的推荐算法之一,然而数据稀疏性和冷启动问题是协同过滤方法的两个主要挑战。由于Linked Data整合了关于实体的丰富且结构化的特征,可以作为额外的信息源来缓解以上两种挑战。该文中我们首次提出了结合Linked Data改进CF推荐算法,基于矩阵分解提出了一种新的CF模型——LinkMF,在保证推荐准确度的基础上利用Linked Data缓解数据稀疏性和冷启动问题。首先,我们从Linked Data中抽取项目的特征表示并为项目建模;然后提出新的相似度度量方法计算项目相似度;最后利用项目相似度约束和指导MF分解过程产生推荐。在MovielLens和YAGO标准数据集上的大量实验结果表明,LinkMF优于现有的一些CF方法,特别在缓解数据稀疏性和冷启动问题上取得很好地效果。
- 黄山山马军郭磊王帅强
- 关键词:推荐系统矩阵分解DATA数据稀疏性冷启动
- 一种结合推荐对象间关联关系的社会化推荐算法被引量:73
- 2014年
- 随着社会化媒体的兴起,信息资源的数量呈现爆炸式增长,如何在海量的信息中帮助用户发现有用的知识成为亟需解决的问题.社会化推荐方法作为一种有效的信息过滤技术,由于能够结合社会网络的特点,模拟现实社会中的推荐过程,在分析用户历史行为的基础上,主动向用户推荐满足他们兴趣和需求的信息,受到了研究者们的广泛关注.但目前已有的方法大都只从用户间社会关系的角度出发,仅认为相互信任的朋友间具有相似的兴趣爱好,而忽略了推荐对象间的关联关系对推荐结果产生的影响.针对以上存在的问题,文中从推荐对象间关联关系的角度出发,假设具有关联关系的推荐对象更容易受到同一用户的关注,并进而在已有的社会化推荐算法的基础上,提出了一种结合推荐对象间关联关系进行推荐的算法.算法使用共享的潜在特征空间对目标函数的求解过程进行约束,使其在考虑用户间社会关系的同时,也考虑到推荐对象间关联关系所起到的重要作用.实验结果表明,与主流的推荐算法相比,文中所提出的方法在分类准确率和评分误差等多种评价指标上都取得了更好的结果.
- 郭磊马军陈竹敏姜浩然
- 关键词:社会网络矩阵分解推荐系统协同过滤社会化推荐
- LDA-CF:一种混合协同过滤方法被引量:16
- 2014年
- 推荐系统是一种克服信息过载的重要工具,其中最流行的方法是协同过滤。该文提出一种结合潜在因素模型和邻域方法的混合协同过滤方法 LDA-CF。我们首先将评分矩阵转换成伪文档集合,使用LDA(Latent Dirichlet Allocation)主题模型发现用户和物品潜在因素向量;然后在低维潜在因素空间计算用户和物品相似度;最后采用邻域方法预测未知评分。在MovieLens 100k数据集上的实验表明:在评分预测任务中,LDA-CF取得的MAE性能指标优于传统的邻域方法。因此,LDA可以有效地从评分矩阵中发现对计算相似度十分有用的用户和物品低维特征表示,在一定程度上缓解了数据稀疏问题。
- 廉涛马军王帅强崔超然
- 关键词:推荐系统协同过滤主题模型
- 基于动态主题建模的Web论坛文档摘要被引量:8
- 2012年
- 针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖和偏移问题.在使用GibbsEM采样算法来确定动态主题模型的参数后,通过计算句子中主题权重之和来确定各个主题的重要程度;最后根据动态主题模型中主题的概率分布计算各句子的权重并得到文档的摘要.实验结果表明,新方法在各个ROUGE评测标准上均优于其他各种对比的摘要方法.
- 任昭春马军陈竹敏
- 关键词:WEB论坛主题建模
- 一种结合相关性和多样性的图像标签推荐方法被引量:12
- 2013年
- 为了帮助用户高效地组织和检索图像资源,多数图像分享站点允许用户为图像添加标签.图像标签推荐系统旨在提供一组标签候选项来方便用户完成添加标签的过程.以往的图像标签推荐方法往往利用标签间的共现信息进行标签推荐.但是,由于忽略了图像的视觉内容信息和被推荐标签之间的多样性,以往方法的推荐结果常存在标签歧义和标签冗余的问题.为了解决上述问题,文中提出了一种新的图像标签推荐方法,该方法综合考虑了被推荐标签的相关性和多样性.首先,利用视觉语言模型,该方法分别计算标签与图像的相关性和标签之间的视觉距离.然后,基于上述计算,给出一个贪心搜索算法来找到能合理地平衡相关性和多样性的标签集合,将该集合作为最终的推荐.在Flickr数据集上的实验结果表明,该方法在准确率、主题覆盖率和F1测度上均优于目前的代表性方法.
- 崔超然马军
- 关键词:多样性