左家莉 作品数:40 被引量:131 H指数:6 供职机构: 江西师范大学计算机信息工程学院 更多>> 发文基金: 国家自然科学基金 江西省自然科学基金 江西省教育厅科学技术研究项目 更多>> 相关领域: 自动化与计算机技术 更多>>
中文微博句子倾向性分类中特征抽取研究 被引量:2 2015年 针对中文微博句子倾向性分类问题,在充分降低由于情感词典的扩充工作带来系统开销的基础上,抽取了中文微博句子中标点符号、情感词权重、词汇级和句法级等新型平面和结构化特征,探索了有效的特征选择方法.在基准COAE和NLP&CC中文微博语料上进行双向交叉和独立实验,并研究了有效的不平衡性语料的处理方法.实验结果表明:采用该文提出的特征后,中文微博句子倾向性分类的性能得到显著提升. 徐雄飞 徐凡 王明文 左家莉 罗文兵关键词:特征抽取 基于样本重要性原理的KNN文本分类算法 被引量:6 2015年 KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点,并计算出每个样本点的边界值,生成每个样本点的重要性得分,将样本重要性与KNN方法融合形成一种新的分类模型——SI-KNN.在中英文文本语料上的实验表明:改进的SI-KNN分类模型相比于传统的KNN方法有一定的提高. 万韩永 左家莉 万剑怡 王明文关键词:文本分类 KNN 结合句子级别检索的信息检索模型 被引量:6 2016年 查询词之间的距离较为接近的文档,相关的可能性更大,将这种距离信息用于信息检索模型的构造可有效提高检索的性能。然而直接估计查询词在文档中的距离需要大量的训练文本,且计算复杂度高。该文提出了一种结合句子级别检索的信息检索模型,将文档分为若干个窗口,通过计算句子和查询的相关度考察查询词在给定窗口中的共现性,该方法可增大那些查询词彼此靠近的文档的相关度,从而使得检索模型可返回更为相关的文档。标准数据集上的实验结果表明所提出的模型可以取得较好的性能。 左家莉 王明文 吴水秀 万剑怡关键词:信息检索模型 基于情感分析的“真假美猴王”存疑研究 被引量:1 2019年 《西游记》是我国四大名著之一。"真假美猴王"事件作为《西游记》的高潮部分,留下了不少伏笔,也引发了多种解读。该文通过运用情感分析的方法,对"真假美猴王"事件前后孙悟空与其他角色的对话进行分析。通过比较孙悟空在"真假美猴王"事件前后,对其他角色情感值的变化,得到了"孙悟空并没有被如来打死,‘真假美猴王’事件消灭的‘心魔’是孙悟空的反抗精神。事件之后,孙悟空选择屈服于神权"的结论。初步探索了情感分析技术对文学研究的可行性。 张辰麟 王明文 谭亦鸣 陈志明 左家莉 罗远胜关键词:情感分析 情感词典 《西游记》 高校舆情信息采集系统设计与实现 被引量:1 2015年 如何引导网络空间中的高校舆情信息是现今的一项重要课题。本系统运用Java开发常使用的SSH(Struts+Spring+Hibernate)框架、MVC(Model、View、Controller)模式等技术,对高校舆情信息采集系统相关概念进行介绍,着重介绍了该系统的用户注册、用户登录、用户舆情信息查看、爬虫管理、舆情信息管理以及用户权限管理等功能模块。 罗文兵 黄园 左家莉关键词:高校舆情 信息采集 网络爬虫 基于多层Markov网络的信息检索模型 被引量:7 2016年 随着信息检索技术的不断发展,挖掘更加有效的信息来提高检索精度成为研究热点,已有的研究表明在检索过程中有效地融合各种信息将得到更好的检索效果。对一个具体查询而言,可以充分利用与已有查询的相关性、词语相关性和文档相关性等信息进行查询扩展和重构。基于这种思路,该文分别构造查询网络、词网络和文档网络,提出了多层Markov网络的信息检索模型,模型可以融合词间关系、文档间关系和查询间关系,为了有效降低计算量,给出了基于团计算模型。在标准数据集上的实验表明该文的模型能够有效融合三类信息,并较大幅度地提高检索效果。 廖亚男 王明文 左家莉 吴根秀 甘丽新关键词:信息检索 查询扩展 基于时空上下文信息的POI推荐模型研究 被引量:2 2021年 随着基于位置的社交网络(LBSN)技术的快速发展,为移动用户提供个性化服务的兴趣点(POI)推荐成为关注重点。由于POI推荐面临着数据稀疏、影响因素多和用户偏好复杂的挑战,因此传统的POI推荐往往只考虑签到频率以及签到时间和地点对用户的影响,而忽略了签到序列中用户前后行为的关联影响。为了解决上述问题,该文通过序列的表示考虑签到数据的时间影响和空间影响,建立了时空上下文信息的POI推荐模型(STCPR),为POI推荐提供了更精准的个性化偏好。该模型基于序列到序列的框架下,将用户信息、POI信息、类别信息和时空上下文信息进行向量化后嵌入GRU网络中,同时利用了时间注意力机制、全局和局部的空间注意力机制来综合考虑用户偏好与变化趋势,从而向用户推荐感兴趣的Top-N的POI。该文通过在两个真实的数据集上实验来验证模型的性能。实验的结果表明,该文所提出的方法在召回率(Recall)和归一化折损累计增益(NDCG)方面优于几种现有的方法。 叶继华 杨思渝 左家莉 王明文关键词:上下文 基于多尺度区域协方差的显著性特征提取方法 被引量:4 2018年 针对显著性检测得到区域边界不精确且比较模糊,提出了基于多尺度区域协方差的显著性特征提取算法。提取图像多尺度特征,结合区域协方差提取图像底层特征,计算图像多尺度不确定度权值,对权值进行了优化处理,通过融合得到图像显著性特征。通过与常用的显著性特征提取算法进行比较,实验结果表明该算法提取的区域结果更加接近对象实际边缘,在显著性特征提取过程中对多尺度赋予不同的权值,突出人眼关注部分,能提升显著性特征提取效果。 王仕民 叶继华 王明文 左家莉 刘长红关键词:显著性特征 多尺度变换 多特征融合 基于Markov网络的信息检索模型 随着计算机和网络的出现和迅速发展,人们能接触到的信息越来越多。用户一方面可以迅速、方便地接触到丰富的信息,在另一方面,如何在如此繁杂的信息中找到所真正需要的信息却一直是一个难题。在这种背景下,信息检索技术在最近几十年得到... 左家莉关键词:信息检索 查询扩展 MARKOV网络 文献传递 融合Emoji情感分布的多标签情绪识别方法 2024年 随着基于互联网的社交媒体兴起,Emoji由于具有以图形化方式快速准确地表达情绪的特点,目前已经成为用户在日常交流中广泛使用的图像文本。已有研究工作表明,在基于文本的情绪识别模型中考虑Emoji信息,对于提升模型性能具有重要的作用。目前,考虑Emoji信息的情绪识别模型大多采用词嵌入模型学习Emoji表示,得到的Emoji向量缺乏与目标情绪的直接关联,Emoji表示蕴含的情绪识别信息较少。针对上述问题,该文通过软标签为Emoji构建与目标情绪直接关联的情感分布向量,并将Emoji情感分布信息与基于预训练模型的文本语义信息相结合,提出融合Emoji情感分布的多标签情绪识别方法(Emoji Emotion Distribution Information Fusion for Multi-label Emotion Recognition,EIFER)。EIFER方法在经典的二元交叉熵损失函数的基础上,通过引入标签相关感知损失对情绪标签间存在的相关性进行建模,以提升模型的多标签情绪识别性能。EIFER方法的模型结构由语义信息模块、Emoji信息模块和多损失函数预测模块组成,采用端到端的方式对模型进行训练。在SemEval2018英文数据集上的情绪预测对比实验结果表明,该文提出的EIFER方法比已有的情绪识别方法具有更优的性能。 刘烨 刘仕鑫 曾雪强 左家莉关键词:情绪识别