张婷婷
- 作品数:9 被引量:65H指数:5
- 供职机构:华中师范大学信息管理学院更多>>
- 发文基金:国家自然科学基金国家留学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 多维特征下社会化问答社区答案排序研究被引量:8
- 2020年
- [目的/意义]研究多维特征对社会化问答社区答案排序的影响,以提高问答社区服务质量并尽可能优化用户体验。[方法/过程]从答案特征、回答者特征和投票者特征多个维度构建社会化问答社区答案排序特征体系,比较基于深度学习、树、神经网络、支持向量机等11种排序学习算法在问答社区数据集上的适用性,并训练随机森林分类算法,得到每个特征的重要程度。[结果/结论]实验结果表明,基于深度学习的排序学习算法在NDCG@k和MRR指标上的性能均优于其他排序算法,投票者的影响力特征最为重要,其次是答案内容特征,最后是回答者的专业度特征,可以考虑从增加答案排序方式的多样性和提高答案排序算法的综合性两个维度进一步优化答案排序。
- 易明张婷婷李梓奇
- 大众性问答社区答案质量排序方法研究被引量:9
- 2019年
- 【目的】针对大众性问答社区答案质量参差不齐的现状,对答案质量排序方法进行探讨。【方法】依据信息接受模型,从感知价值角度构建答案质量排序初始指标体系;采用K-Medoids聚类算法对初始指标进行离散化,同时利用粗糙集理论对初始指标进行约简并赋予权值,进而修正指标体系;运用加权灰色关联分析计算答案的加权灰色关联度,以产生排序结果。【结果】针对"知乎"6类话题下6个问题的2 297条相关数据进行实验分析,排序靠前的答案通常采用图文结合的表达方式、答案所含信息量高,且回答者社区参与度较高,从而答案的质量较高。【局限】数据规模需要扩大,对排序方法的评价还可以优化。【结论】73名"知乎"用户对原始排序与本研究排序进行满意度评价,结果表明本文方法具有优越性。
- 易明张婷婷
- 关键词:感知价值粗糙集理论
- 基于微博公众情感状态的新产品市场预测研究被引量:13
- 2017年
- 使用社交网络数据获取公众情感,进而预测新产品市场趋势已成为社会化网络环境下市场信息预测研究的新方法。本文研究了基于中文微博情感分析的新产品市场预测的相关问题。首先,根据心理学的《心境状态量表》(POMS),从《同义词词林》中提取出七维度心境词汇种子词集;利用《同义词词林》及word2vec构建中文心境状态词汇语义网络,并通过马尔可夫随机游走算法计算词汇各心境状态维度值,自动化地构建了一个多维度、细粒度的情感状态词典,以便获取微博公众情感状态信息。进一步提出一个整合微博公众情感状态、微博提及数、评论情感及其数量的预测特征模型,采用多任务机器学习方法处理不同提前期的新产品市场预测问题。基于电影数据的实例分析表明,公众情感状态特征能在更长的时段内反映新产品市场趋势,且基于整合的预测特征模型和多任务机器学习方法具有较好的预测效力和预测提前期。
- 王伟军黄英辉李颖刘辉张婷婷刘凯
- 关键词:情感分析
- 基于语言评价信息的移动电子商务服务质量评价研究被引量:2
- 2017年
- [目的 /意义]针对现有移动电子商务服务质量评价指标不客观的问题,重点研究移动电子商务环境下评价服务质量的模型及方法,为消费者科学选择电商服务提供参考,为企业改善服务质量提供建议。[方法 /过程]引入群决策理论中的对语言评价信息的处理方法,首先将7粒度短语评价信息转化为三角模糊数,然后收集用户给出的语言短语形式评价信息,计算各个评价指标的质量评价值,最后计算评价值与三角模糊数之间的相似度,相似度最高的语言短语即为其对应的服务质量评价等级。[结果 /结论]以手机淘宝服务质量为评价对象进行实证分析,验证了基于语言评价信息的移动电子商务服务质量评价方法的科学性和有效性。
- 王伟军汤璐侯银秀张婷婷
- 关键词:移动电子商务语言评价信息服务质量
- 科研人员Web数据自动抓取模式及其开源解决方案
- 大数据时代的科研竞争是数据之争,高质量数据的获取往往决定着研究结论的优劣乃至项目的成败.然而对于科研人员的Web 数据自动抓取问题,学界目前尚未有系统性研究成果出现.本文对数据抓取的基本模式进行分析,归纳出四类科研人员W...
- 张婷婷汤璐刘凯王伟军
- 科研人员Web数据自动抓取模式及其开源解决方案被引量:9
- 2015年
- 大数据时代的科研竞争是数据之争,高质量数据的获取往往决定着研究结论的优劣乃至项目的成败。然而对于科研人员的Web数据自动抓取问题,学界目前尚未有系统性研究成果出现。本文对数据抓取的基本模式进行分析,归纳出四类科研人员Web数据抓取的基本模式:单站静态抓取模式、跨站静态抓取模式、单站动态抓取模式及跨站动态抓取模式及其技术难点。本文同时也提出了科研人员Web数据自动抓取技术的两种开源解决方案:基于开源爬虫和自行定制爬虫,最后详细探讨了各方案的软件架构并给出了基本代码框架。
- 张婷婷刘凯王伟军
- 关键词:开源软件
- 基于话语标记理论的在线商品评分修正方法被引量:4
- 2016年
- 尽管在线商品评论是消费者购买决策的重要依据之一,然而现实中评论内容与评分间的不一致将对购买决策的制订形成干扰,折射出解决评论与评分真实性问题的重要性和现实性。当前关于评论与评分偏差的研究主要围绕语法、语义层面进行,矫正的效果和速度存在较大局限。本文则在语义与语用层面,通过引入语言学的话语标记理论,构建商品评论话语标记语库,设计包含可信度、评论立场、情感态度的评分修正体系,并采用改进后层次分析法得到各评价指标的权重,提出评论评分偏差的修正方法;最后,通过京东商城的真实评论数据修正结果验证了本方法的可行性和有效性,从而深化并拓展了对在线商品评论分析的研究。
- 王伟军宋艳秋张婷婷黄英辉陈博洋
- 关键词:话语标记
- 基于屏幕视觉热区的中文短文本关键词实时提取方法被引量:2
- 2016年
- 准确地获取用户偏好信息是个性化推荐的基础,而关键词提取技术则是用户偏好信息提取技术的关键。区别于传统的对整个网页页面进行关键词提取,本文提出的基于屏幕视觉热区的中文短文本关键词实时提取方法,主要针对用户浏览网页存在的屏幕视觉热区内的短文本进行关键词提取。首先,人工抽取屏幕视觉热区中的中文短文本作为原始数据,针对实时性的要求,选取TF-IWF、位置统计性分布、词距三个特征项构建中文短文本提取模型。实验数据表明,位置统计性分布及词距对关键词提取的准确率并没有显著提高,仅TF-IWF一种特征,准确率就能达到70%,同时经过实际验证本方法具有良好的稳定性,且实时性已经达到用户满意的程度,远远小于用户所能接受的容忍时域。
- 张婷婷王伟军黄英辉刘凯胡祥恩
- 关键词:关键词提取用户偏好
- 基于用户偏好与商品属性情感匹配的图书个性化推荐研究被引量:22
- 2017年
- 【目的】识别并获取细粒度的用户偏好信息,优化图书个性化推荐的效果。【方法】使用情感分析方法对用户图书评论进行属性层文本挖掘,通过用户本身的图书评论获取用户对图书属性的偏好;基于每本图书的所有评论的情感计算获得其属性评分;将用户偏好矩阵、图书属性得分矩阵进行匹配,从而实现用户对图书属性情感偏好的个性化推荐。【结果】利用亚马逊图书评论数据作为数据来源分别对传统的协同过滤方法与本文提出的推荐方法进行实验对比。结果表明,本文提出的方法在准确性、召回率、覆盖率上分别提高了0.030、0.097、0.2812。【局限】未考虑时间因素对用户偏好的影响,并且属性类型的全面程度受亚马逊图书评论数量和质量的限制。【结论】本文计算用户对图书属性的情感得分,得到细粒度的用户偏好信息,并通过与图书属性的得分进行匹配,提升了图书个性化推荐的效果。
- 侯银秀李伟卿王伟军张婷婷
- 关键词:用户偏好