公共文化服务平台

王中卿: 作品数：78 被引量：222H指数：9; 供职机构：苏州大学计算机科学与技术学院更多>>; 发文基金：国家自然科学基金模式识别国家重点实验室开放课题基金江苏省高校自然科学研究项目更多>>; 相关领域：自动化与计算机技术文化科学更多>>

合作作者

细粒度科技论文摘要句子分类方法被引量：3: 2012年; 以科技论文摘要句子为研究对象,提出一种两阶段的细粒度句子分类方法,通过结合摘要内各个句子的位置、关键词和上下文信息,选择部分易于分辨语境类型的句子,将其作为种子样本训练获得分类模型。利用机器学习的方法对摘要句子的背景知识、论文主题、研究方法和实验结果进行自动分类。实验结果表明,该方法中的F度量值比其他细粒度分类方法平均高3%～5%。; 华秀丽徐凡王中卿李培峰; 关键词：细粒度语境

基于对话结构的多轮对话生成模型被引量：5: 2022年; 目前,多轮对话生成研究大多使用基于RNN或Transformer的编码器-解码器架构.但这些序列模型都未能很好地考虑到对话结构对于下一轮对话生成的影响.针对此问题,在传统的编码器-解码器模型的基础上,使用图神经网络结构对对话结构信息进行建模,从而有效地刻画对话的上下文中的关联逻辑.针对对话设计了基于文本相似度的关联结构、基于话轮转换的关联结构和基于说话人的关联结构,利用图神经网络进行建模,从而实现对话上下文内的信息传递及迭代.基于DailyDialog数据集的实验结果表明,与其他基线模型相比,该模型在多个指标上有一定的提升.这说明使用图神经网络建立的模型能够有效地刻画对话中的多种关联结构,从而有利于神经网络生成高质量的对话回复.; 姜晓彤王中卿李寿山周国栋; 关键词：人机对话

基于字词联合表示的中文事件检测方法被引量：4: 2021年; 事件检测作为事件抽取的一个子任务,是当前信息抽取的研究热点之一。它在构建知识图谱、问答系统的意图识别和阅读理解等应用中有着重要的作用。与英文字母不同,中文中的字在很多场合作为单字词具有特定的语义信息,且中文词语内部也存在特定的结构形式。根据中文的这一特点,文中提出了一种基于字词联合表示的图卷积模型JRCW-GCN(Joint Representation of Characters and Words by Graph Convolution Neural Network),用于中文事件检测。JRCW-GCN首先通过最新的BERT预训练语言模型以及Transformer模型分别编码字和词的语义信息,然后利用词和字之间的关系构建对应的边,最后使用图卷积模型同时融合字词级别的语义信息进行事件句中触发词的检测。在ACE2005中文语料库上的实验结果表明,JRCW-GCN的性能明显优于目前性能最好的基准模型。; 吴凡朱培培王中卿李培峰朱巧明

层次化精准编译原理实践教学被引量：3: 2020年; 《编译原理》作为计算机专业一门重要的专业课,理论性强且较为抽象。实践教学可以辅助理论教学,训练学生思维,加强学生对理论知识的深度了解及设计编译程序的能力。针对现有实践教学体系的问题,在编译原理核心算法和编译器的设计两方面,分别对教学内容及实践难度进行了层次化创新,从而对学生进行步步引导,提高编译原理的教学质量。; 王中卿朱培培; 关键词：实践教学词法分析语法分析

基于Transformer的自然语言处理预训练语言模型概述被引量：6: 2022年; 在自然语言处理领域,谷歌提出Transformer模型之后,以生成式预训练模型(Generative Pre-Training,GPT)和深度双向预训练语言模型(Bidirectional Encoder Representat ions from Transformers,BERT)等为代表的一些基于Transformer的预训练语言模型(Transformer-based Pre-trained Language Models,TPLM)相继被提出,在大部分自然语言处理任务上取得很好的效果。TPLM使用自监督学习方法学习来自大量文本数据的通用语言表示,并将这些知识转移到下游任务中,为其提供了背景知识,避免了重新开始训练新任务模型的情况。笔者主要研究了基于Transformer的预训练语言模型与基于TPLM的“预训练+微调”的自然语言处理预训练新技术模式。首先,介绍预训练模型的发展背景;其次,解释各种有关TPLM的核心概念,如预训练、预训练方法、预训练任务、自监督学习与迁移学习等;再次,简要介绍相关TPLM模型与目前的进展;最后,提出改进TPLM的方法并总结。; 史童月王中卿; 关键词：TRANSFORMER 自然语言处理

基于不平衡数据的中文情感分类: 近些年来,情感分类在自然语言处理研究领域获得了显著的发展。然而,大部分已有的研究都假设参与分类的正类样本和负类样本一样多,而实际情况中正负类数据的分布往往是不平衡的。本文收集四个产品领域的中文评论文本,发现正类样本的数目...; 王中卿李寿山朱巧明李培峰周国栋; 关键词：中文信息处理情感分类; 文献传递

基于wav2vec的语音情感识别方法: 本申请涉及一种基于wav2vec的语音情感识别方法，属于语音信号智能处理领域，该方法包括：获取样本语音信号并对样本语音信号进行预处理，获得处理后的样本语音信号；构建预设分类模型，所述预设分类模型由特征抽取网络和与特征抽取...; 李寿山李林钦王中卿周国栋; 文献传递

基于情感信息的商品评论生成式摘要: 2023年; 近些年来,随着电商平台的飞速发展,越来越多的人会选择在网上购物并且对商品进行评价。对于较长篇幅的评论,进行摘要可以让用户快速地了解到商品的优缺点。目前主流的生成式摘要模型大多只考虑文本的序列化信息,而对一个商品评论来说,评论中的商品属性信息和情感信息极为重要。为了让模型学习到评论中的商品属性及情感信息,该文提出了一种融合评论中属性及情感信息的生成式摘要方法。该方法通过将不同种类的情感和属性信息嵌入生成模型的编码阶段的方式,从而有效的结合这些信息。实验证明,该方法可生成更高质量的摘要,生成的摘要在ROUGE评价指标上会有较大幅度的提升。; 冯仁杰王中卿; 关键词：神经网络

基于阅读理解框架的中文事件论元抽取被引量：2: 2022年; 传统的事件论元抽取方法把任务当作句子中实体提及的多分类或序列标注任务,论元角色的类别在这些方法中只能作为向量表示,而忽略了论元角色的先验信息。实际上,论元角色的语义和论元本身有很大关系。对此,该文提议将其当作机器阅读理解任务,把论元角色转换为自然语言描述的问题,通过在上下文中回答这些问题来抽取论元。该方法更好地利用了论元角色类别的先验信息,在ACE2005中文语料上的实验证明了该方法的有效性。; 陈敏吴凡李培峰王中卿朱巧明; 关键词：先验信息

基于质心迁移的领域适应性情感分类被引量：4: 2011年; 针对监督学习方法在文本的跨领域情感分析效果较差的问题,提出基于质心迁移的领域间适应性情感分类方法。该方法利用源领域的标注文本对目标领域的大量未标注文本进行分类,选择一部分可信度高的文本加入到训练集,同时去除源领域中距离目标领域测试集质心较远的文本,通过迭代逐渐缩小两个领域间的质心距离,减小领域间差异。实验结果表明,该方法能提高跨领域倾向性分析的精度。; 杨文让王中卿李培峰朱巧明; 关键词：情感分析

王中卿

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

王中卿

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈