李志宇
- 作品数:16 被引量:299H指数:9
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家大学生创新性实验计划更多>>
- 相关领域:自动化与计算机技术经济管理社会学文化科学更多>>
- 在线商品评论效用排序模型研究被引量:28
- 2013年
- 从研究在线评论效用的影响因素入手,建立评论效用指标体系。采用模糊层次分析法确定指标的相对权重,通过语义挖掘对评论内容的各项指标进行量化处理,最后统计每条评论的效用总分。模型应用部分选取国内淘宝商城某商品的近2 000条商品评论信息进行实证分析。研究对比发现,经过排序模型处理后,大量的无用评论被后置,新排序中靠前的评论内容信息含量非常丰富,评论效用较高,能够有效地辅助其他消费者进行购物决策。
- 李志宇
- 关键词:信息挖掘
- 在线社会网络谣言检测综述被引量:37
- 2018年
- 大数据环境下,在线社会网络与人们的生活、娱乐以及工作逐渐融为一体.然而"信息过载"和"信息污染"已成为在线社会网络诸多应用发展面临的主要瓶颈之一,并同时造成了用户的"信息焦虑"和"信息迷航"等一系列问题,因此在线社会网络谣言检测是改善在线社会网络信息生态环境质量、提升用户体验的有效手段.在线社会网络谣言检测隶属于信息可信度检测研究范畴,但谣言的不确定性、较强的时效性、主观性和关联性等特征又使得其与虚假信息检测有着本质区别.基于以上,该文从在线社会网络谣言的基本概念和特征研究出发,分别基于目标、对象和时间三个属性,分析了在线社会网络谣言检测研究基本问题的形式化定义,并介绍了研究中数据采集和标注的不同方法.然后,分别对不同类别和应用场景的在线社会网络谣言检测方法和谣言源检测方法进行了分析和总结.最后,该文讨论了在线社会网络谣言检测技术未来发展面临的若干挑战以及可能的研究方向.
- 陈燕方李志宇梁循齐金山
- 关键词:在线社会网络谣言虚假信息
- 面向社会网络融合的关联用户挖掘方法综述被引量:13
- 2017年
- 现阶段大多数社会网络的研究都集中于单一的社会网络内部.社会网络融合为社会计算等各项研究提供更充分的用户行为数据和更完整的网络结构,从而更有利于人们通过社会网络理解和挖掘人类社会,具有重要的理论价值和实践意义.准确、全面、快速地关联用户挖掘,是大型社会网络融合的根本问题.社会网络中的关联用户挖掘旨在通过挖掘不同社会网络中同属于同一自然人的不同账号,从而实现社会网络的深度融合,近年来已引起人们的广泛关注.然而,社会网络的自身数据量大、用户属性相似、稀疏且存在虚假和不一致等特点,给关联用户挖掘带来了极大的挑战.分析了面向社会网络融合的关联用户挖掘所存在的困难,从用户属性、用户关系及其综合这3个方面梳理了当前关联用户挖掘的研究现状.最后,总结并展望了关联用户挖掘的研究方向.
- 周小平梁循赵吉超李志宇马跃峰
- 关键词:社会网络用户属性用户关系
- 社会网络背景下的企业舆情研究述评与展望被引量:18
- 2017年
- 对社会网络背景下的企业舆情研究的相关概念、特点、意义等进行较为详尽的回顾,在分析社会网络的内容和结构的基础上,具体从文本情感分析、图像内容和社区发现、个性化推荐等不同维度梳理舆情管理的研究现状,并从企业在线舆情的分析预警、干预处置、平台构建、网络营销等多个方面总结出企业舆情管理控制的方法。在新型的企业舆情管理中,必须牢牢抓住社会网络的结构、内容、用户这3个核心,使企业舆情管理达到新境界。
- 梁循许媛李志宇马跃峰刘宇
- 关键词:社会网络企业舆情
- 内嵌时空信息的照片数据中的游览模式探索被引量:2
- 2018年
- 随着人们越来越多地在社交网上分享他们的照片,研究者可以获得更多内嵌时空信息的照片数据对用户行为进行挖掘.本文根据在Flickr上获得的用户在北京地区拍摄的照片,发现在该地拍摄照片的用户的停留时间和旅游模式,在此基础上提出一种针对连续拍摄照片的时间分割准则,并基于密度峰值聚类定义拍摄兴趣区和游览路径(关键径).为了更准确地表达用户游览兴趣区的偏好,还定义了紧邻后向频率,紧邻前向频率,全局后向频率和平均全局后向频率.基于在北京地区拍摄的20万张照片的时空信息,使用提出的方法对游客游览北京的模式进行了分析,验证了该方法的可行性与合理性.
- 徐志明梁循梁循李志宇
- 关键词:照片时空数据旅游模式
- 基于属性主题分割的评论短文本词向量构建优化算法被引量:6
- 2016年
- 从词向量的训练模式入手,研究了基于语料语句分割(BWP)算法,分隔符分割(BSP)算法以及属性主题分割(BTP)算法三种分割情况下的词向量训练结果的优劣。研究发现,由于评论短文本的自身特征,传统的无分割(NP)训练方法,在词向量训练结果的准确率和相似度等方面与BWP算法、BSP算法以及BTP算法具有明显的差异。通过对0.7亿条评论短文本进行词向量构建实验对比后发现,该文所提出的BTP算法在同义词(属性词)测试任务上获得的结果是最佳的,因此BTP算法对于优化评论短文本词向量的训练,评论短文本属性词的抽取以及情感倾向分析等在内的,以词向量为基础的应用研究工作具有较为重要的实践意义。同时,该文在超大规模评论语料集上构建的词向量(开源)对于其他商品评论文本分析的应用任务具有较好可用性。
- 李志宇梁循周小平
- 关键词:相似度计算
- 本地生活服务平台发展现状与优化策略
- 2012年
- 文章首先对本地生活服务平台的定义和特点进行了描述,并介绍了本地生活服务电子商务化发展的现状,然后就当前存在问题进行分析,最后从用户体验角度出发,提出了一系列关于本地生活服务平台的优化策略。
- 陈燕方李志宇
- 极限学习机前沿进展与趋势被引量:109
- 2019年
- 极限学习机(Extreme Learning Machine,ELM)作为前馈神经网络学习中一种全新的训练框架,在行为识别、情感识别和故障诊断等方面被广泛应用,引起了各个领域的高度关注和深入研究.ELM最初是针对单隐层前馈神经网络的学习速度而提出的,之后又被众多学者扩展到多隐层前馈神经网络中.该算法的核心思想是随机选取网络的输入权值和隐层偏置,在训练过程中保持不变,仅需要优化隐层神经元个数.网络的输出权值则是通过最小化平方损失函数,来求解Moore - Penrose广义逆运算得到最小范数最小二乘解.相比于其它传统的基于梯度的前馈神经网络学习算法,ELM具有实现简单,学习速度极快和人为干预较少等显著优势,已成为当前人工智能领域最热门的研究方向之一.ELM的学习理论表明,当隐层神经元的学习参数独立于训练样本随机生成,只要前馈神经网络的激活函数是非线性分段连续的,就可以逼近任意连续目标函数或分类任务中的任何复杂决策边界.近年来,随机神经元也逐步在越来越多的深度学习中使用,而ELM可以为其提供使用的理论基础.本文首先概述了ELM的发展历程,接着详细阐述了ELM的工作原理.然后对ELM理论和应用的最新研究进展进行了归纳总结,着重讨论并分析了自ELM提出以来的主要学习算法和模型,包括提出的原因、核心思想、求解方法、各自的优缺点以及相关问题.最后,针对当前的研究现状,指出了ELM存在的争议、问题和挑战,并对未来的研究方向和发展趋势进行了展望。
- 徐睿梁循齐金山李志宇张树森
- 关键词:极限学习机网络结构正则化并行计算
- 电子商务服务业对我国现代服务业加速发展的意义及建议浅析
- 2012年
- 文章从广义电子商务服务业与现代服务业的关系探讨切入,论述了目前我国现代服务业发展所存在的问题,并通过分析广义电子商务服务业对我国现代服务业发展的重要意义,提出了如何利用电子商务服务业来推动现代服务业的加速发展的政策与建议。
- 李志宇
- 关键词:电子商务服务业现代服务业
- 基于评论产品属性情感倾向评估的虚假评论识别研究被引量:20
- 2014年
- 【目的】提出一种基于评论产品属性情感倾向评估模型(Review Attribute of Product-Based Emotion Evaluate,RAPBEE模型),用于在线商品虚假评论的识别。【方法】针对在线商品虚假评论采用评论产品属性情感倾向离群度量方法,结合已有评论效用研究对评论结果进行综合排序,从而得出评论的可信度序列。【结果】基于R语言实现,在模型试验集上,通过RAPBEE模型识别处理后的评论序列和当前商品真实情况的符合度为86.2%,实验结果表明RAPBEE模型有较强的实际应用能力与适应度。【局限】需要依赖于已有属性词典的建模方式,在大规模的数据运行效率上有待改进。【结论】提供一种新的针对中文商品虚假评论识别处理方法,具有较强的扩展能力。
- 陈燕方李志宇
- 关键词:情感倾向垃圾评论