-
王红斌
-
-
- 所属机构:昆明理工大学信息工程与自动化学院
- 所在地区:云南省 昆明市
- 研究方向:自动化与计算机技术
- 发文基金:国家自然科学基金
相关作者
- 王红斌
- 作品数:301被引量:831H指数:16
- 供职机构:昆明理工大学
- 研究主题:膨润土 语料 农药残留 固相萃取 向量
- 线岩团
- 作品数:216被引量:230H指数:8
- 供职机构:昆明理工大学
- 研究主题:越南语 自然语言处理技术 文本 新闻文本 语料
- 余正涛
- 作品数:855被引量:1,218H指数:15
- 供职机构:昆明理工大学
- 研究主题:自然语言处理技术 越南语 机器翻译 跨语言 语料
- 毛存礼
- 作品数:180被引量:196H指数:8
- 供职机构:昆明理工大学
- 研究主题:自然语言处理技术 越南语 跨境民族 抽取方法 缅甸语
- 丁家满
- 作品数:196被引量:184H指数:7
- 供职机构:昆明理工大学
- 研究主题:字典序 候选集 APP 标签 不确定性
- 结合对比学习的新闻文本与评论相似度计算
- 2023年
- 新闻文本与新闻评论相似度计算旨在筛选出与新闻文本相关的评论,而大部分评论以短文本的形式对新闻文本做出评价,因此新闻文本与评论的相似度计算本质上是长文本与短文本的相似度计算.传统长文本处理方法易导致文本信息缺失、文章主题不明确等问题,降低相似度计算的准确率.针对新闻文本与评论的长度差距,结合评论的特点,该文提出了结合对比学习的新闻文本与评论相似度计算方法,该方法通过关键词的提取实现新闻文本压缩同时减少文本的冗余信息;将关键词序列与新闻标题拼接作为新闻文本的表示;然后通过BERT预训练模型使用对比学习的方法实现文本正负例的构造;最后通过交叉熵和相对熵损失函数对预训练模型进行微调,实现文本的相似度计算.实验表明,该文提出的方法较近几年的长文本处理方法在准确率上提高了3.6%,并在中文文本相似度计算的公共数据集上也取得了较好的效果.
- 王红斌张卓赖华
- 关键词:文本相似度关键词提取
- 应用于服务组合的改良粒子群算法
- 2022年
- 当今社会,互联网、物联网、云计算以及大数据的快速发展和普及使得网络应用越来越广,越来越多的行业和相应的网络进行越来越深地融合。许多原本属于线下的服务经过封装后被搬上了网络上,同类型的服务也越来越多。如何在互联网大数据环境下快速找到满足用户个性化需求的服务组合已经成为亟需解决的问题。为了解决这个问题,本论文提出了一种改良粒子群服务组合方法,此改良粒子群算法根据服务组合问题的特点分别从四个方面加入了逃出局部最优的机制,根据用户的服务组合请求去快速组合出更优的服务组合方案。本文通过实验与其他相关的服务组合优化算法在最优性、时间复杂度以及收敛性三个指标进行了对比。根据实验结果分析,本文所提出的方法在最优性、时间复杂度以及收敛性三个方面整体上表现出来良好的性能。
- 丁洋丁洋
- 关键词:服务质量优化算法粒子群算法
- 基于关系指数和表示学习的领域集成实体链接被引量:1
- 2021年
- 本文针对现有方法不能很好结合文本信息和知识库信息的问题,提出一种基于关系指数和表示学习的领域集成实体链接方法.首先,本文构建了特定领域知识库;其次,运用表示学习从文本信息中得到的向量表示计算实体指称项的上下文、主题关键词、扩展词三个特征的相似度;然后,利用知识库中的关系信息计算候选实体的关系指数;最后,将这三种相似度及关系指数相融合,用于实体链接.实验结果表明,相较于现有方法,本文方法能够有效地提高F1值,并且该方法不需要标注语料,更加简单高效,适应于缺少标注语料的特定领域.
- 蒋胜臣王红斌王红斌余正涛线岩团
- 基于对抗自学习的跨域绝缘子检测算法被引量:4
- 2020年
- 为实现在海量线路巡检图像中对绝缘子的自动识别,提出一种基于对抗自学习的跨域绝缘子识别方法。该方法由对抗学习和自训练学习2个阶段组成。在对抗学习阶段,通过特征提取器和分类器之间的对抗学习,使模型分别获得对玻璃绝缘子和复合绝缘子具有鲁棒性的分类特征。在自训练学习阶段,首先,采用有标签的玻璃绝缘子样本对模型进行预训练;然后,将无标签的复合绝缘子样本输入网络,并选择置信度高的样本赋予软标签对模型进行再次训练,使模型最终获得在不同域上的泛化能力。与现有方法相比,该文方法采用分属不同材质的绝缘子样本对深度神经网络进行2个阶段的训练,在有效降低模型训练过程中样本标注量的同时,解决了跨域识别不同材质的绝缘子的问题。
- 李凡李凡王红斌王红斌王红斌徐开雄李爽
- 关键词:绝缘子线路巡检图像玻璃绝缘子复合绝缘子
- 融合类别先验Mixup数据增强的罪名预测方法被引量:4
- 2022年
- 罪名预测是人工智能技术应用于司法领域的代表性任务.该任务根据案情描述和事实预测被告人被判的罪名.由于各类罪名样本数量高度不平衡,分类模型训练时分类器易偏向高频罪名类别,从而导致低频罪名预测性能不佳.针对罪名预测类别不平衡问题,提出融合类别先验Mixup数据增强策略的罪名预测模型,改进低频罪名预测效果.该模型利用双向长短期记忆网络与结构化自注意力机制学习文本向量表示,在此基础上,通过Mixup数据增强策略在向量表示空间中合成伪样本,并利用类别先验使合成样本的标签偏向低频罪名类别,以此来扩增低频罪名训练样本.实验结果表明,与现有方法相比,该方法在准确率、宏精确率、宏召回率和宏F1值上都获得了大幅提升,低频罪名预测的宏F1值提升达到13.5%.
- 线岩团陈文仲余正涛张亚飞王红斌
- 双边非局部均值滤波图像去噪算法被引量:16
- 2016年
- 为提高图像去噪的视觉效果,本文根据自然图像通常包含较多的重复性结构这一现象,以及双边滤波器的在图像去噪中所具有的优点,提出了一种新的基于双边滤波与非局部均值(NLM)的图像去噪算法。利用NLM思想对当前的像素灰度值进行估计。过程中,不仅考虑到了当前像素的灰度值对预测结果的影响,而且考虑到了当前像素的位置与周围像素位置之间的关系,构建了非局部邻域内的位置系数来对预测结果进行约束,最后考虑到非局部邻域内同质像素的相似性,设计了双边NLM滤波器。实验结果表明:本文算法比双边滤波算法运行时间快了0.114 s、峰值信噪比(PSNR)提高了0.9、图像相似度(MSSIM)提高了0.181,图像保真度(VIF)提高了0.214 7。本文提出的方法能够更好地保留图片信息的完整性,提高了图像的亮度和图像纹理的清晰度。
- 韩震王红斌余正涛朱映柔
- 关键词:图像去噪双边滤波非局部均值距离加权
- 基于word2vec和依存分析的事件识别研究被引量:6
- 2017年
- 如何从大量信息中获取事件已成为关注的焦点,因此事件识别也就越来越重要。传统对于事件抽取采用字典和机器学习方法,字典包含触发词数量有限,机器学习需要大量语料和众多特征。针对传统方法的不足,提出了基于词向量和依存分析的方法。该方法利用word2vec模型找到触发词的大量同义词来进行对触发词的扩展,利用依存分析可以发现词与词间的依赖性从而为分类提供特征。最后通过实验进行验证,实验结果表明,该方法是可行的,并且在事件识别和事件要素抽取方面取得了较好结果。
- 王红斌郜洪奎
- 关键词:依存分析
- 融合LSTM和LDA差异的新闻文本关键词抽取方法被引量:3
- 2020年
- 针对语义信息对TextRank的影响,同时考虑新闻标题信息高度浓缩以及关键词的覆盖性与差异性的特点,提出一种新的融合LSTM和LDA差异的关键词抽取方法。首先对新闻文本进行预处理,得到候选关键词;其次通过LDA主题模型得到候选关键词的主题差异影响度;然后结合LSTM模型和word2vec模型计算候选关键词与标题的语义相关性影响度;最后将候选关键词节点按照主题差异影响度和语义相关性影响度进行非均匀转移,得到最终的候选关键词排序,抽取关键词。该方法融合了关键词的语义重要性、覆盖性以及差异性的不同属性。在搜狗全网新闻语料上的实验结果表明,该方法的抽取结果相比于传统方法在准确率和召回率上都有明显提升。
- 宁珊严馨周枫王红斌王红斌
- 关键词:抽取新闻标题LDA模型
- 基于形成性评价的软件工程课程导学探索被引量:4
- 2023年
- 针对学生软件工程课程学习中主动性及针对性不足的现状,基于课程前期开展的基于混合式教学的课程导学、以直播为特征的课程在线导学相关实践,提出基于形成性评价的软件工程课程导学方法,并介绍导学设计与实践过程,最后通过导学情况对比数据说明教学效果。
- 姜瑛王红斌丁家满贾连印游进国
- 关键词:软件工程导学课程目标混合式教学
- 泰语新闻事件触发词抽取研究
- 2017年
- 自然语言领域内事件抽取是信息抽取中一项重要的研究课题。事件触发词的识别与抽取在事件抽取中扮演着重要角色。针对目前缺少对泰语触发词识别与抽取的技术研究,提出了通过中文事件触发词入手构建初始泰语新闻事件触发词表,并根据初始泰语新闻事件触发词表自动抽取泰语触发词。实验结果表明此方法很好有效的实现了泰语新闻事件触发词的识别与抽取。
- 彭籍冲王红斌线岩团
- 关键词:事件抽取新闻事件