曹付元 作品数:67 被引量:364 H指数:10 供职机构: 山西大学计算机与信息技术学院 更多>> 发文基金: 国家自然科学基金 山西高校科技研究开发项目 山西省自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 经济管理 交通运输工程 更多>>
持续学习的研究进展与趋势 2024年 随着深度学习技术的发展与应用,特别是资源受限场景和数据安全场景对序列任务和数据进行快速学习需求的增多,持续学习逐渐成为机器学习领域关注的一个新热点.不同于人类所具备的持续学习和迁移知识的能力,现有深度学习模型在序列学习过程中容易遭受灾难性遗忘的问题.因此,如何在动态、非平稳的序列任务及流式数据中不断学习新知识、同时保留旧知识是持续学习研究的核心.首先,通过对近年来持续学习国内外相关工作的调研与总结,将持续学习方法分为基于回放、基于约束、基于结构三大类,并对这3类方法做进一步的细分.具体而言,根据所使用的样本来源将基于回放的方法细分为采样回放、生成回放、伪样本回放3类;根据训练约束的来源将基于约束的方法细分为参数约束、梯度约束、数据约束3类;根据对于模型结构的使用方式将基于结构的方法细分为参数隔离、模型拓展2类.通过对比相关工作的创新点,对各类方法的优缺点进行总结.其次,对国内外研究现状进行分析.最后,针对持续学习与其他领域相结合的未来发展方向进行展望. 李文斌 熊亚锟 范祉辰 邓波 曹付元 高阳关键词:知识迁移 含缺失标签的大规模多标签分类算法 被引量:2 2022年 在对大规模多标签数据进行人工标注时极易产生标签的缺失。现有算法大多利用被所有实例共享的全局标签相关性来解决该问题,即对不同实例而言,标签之间的相关性是相同的。然而在实际应用中,不同实例的标签相关性并非完全相同,此时采用局部方式获取的标签相关性将更加准确。因此,本文提出一种基于局部标签相关性的解决方法。该方法利用局部标签相关性来恢复缺失标签,利用低秩矩阵分解技术来构造适用于大规模数据的分类器。此外,为了加快模型的训练,该方法将这两个过程融合到一个统一的框架中,并采用迭代优化的方式进行求解。大量实验结果表明,该方法在预测准确度上至少比现有算法高2个百分点,在训练速度上至少提升5个百分点。 刘依璐 曹付元Rough集理论在多值信息系统中的扩充 被引量:1 2006年 Pawlak所提出的经典Rough集理论主要是针对完备信息系统的,利用不可分辨关系这种等价关系来对对象进行上近似和下近似分类。对于不完备信息系统的处理,需要对经典Rough集理论进行扩充,主要是对不可分辨关系进行扩充。对多值信息系统而言,目前有相似关系,但相似关系存在一定程度的局限性,为此提出一种基于类相似关系的扩充Rough集模型,并对该模型和相似关系模型之间的性能进行了比较,实例表明该模型具有较好的应用前景。 陈炯 曹付元关键词:ROUGH集 不可分辨关系 多值信息系统 函数型数据的分裂转移式层次聚类算法 被引量:2 2022年 针对函数型数据无穷维、低信噪比和动态时变等导致传统聚类方法性能降低、运行速度变慢和结果可解释性变差等问题,提出一种分裂转移式层次聚类(split transfer hierarchical clustering,STHC)算法,与传统层次聚类算法相比,具有能够发现内部层次关系和无需设定聚类个数的特点,选择适当的函数主成分个数重构样本,达到降低曲线噪声的作用。对重构样本进行分裂转移式层次聚类,根据内部准则选出最优聚类个数,并在仿真数据和真实数据上与其他几种函数型数据聚类方法进行试验比较。结果表明,本研究提出的STHC算法具有良好的性能表现和较低的运行时间,同时能够识别出函数型数据的多层次结构,提高聚类结果的可解释性。 孟银凤 杨佳宇 曹付元关键词:函数型数据 聚类分析 层次聚类 面向中文客户评论的产品属性抽取方法研究 被引量:4 2012年 针对现有的中文客户评论产品属性识别方法存在的不足,通过采用词法分析、句法分析、同义词词林等多项技术和资源,挖掘真实语料中蕴藏的语言知识,提出了一种基于模板的产品属性识别方法。该方法对评论语料进行词法、句法分析和人工标注,从标注结果中综合分析和归纳评论句的全局语言规则,提取属性词和评价词之间的词性和依存关系序列,借助同义词词林构建产品属性模板,使用属性模板识别产品属性。对比实验结果表明了提出方法的有效性。 陈炯 张虎 曹付元 张永奎关键词:依存句法分析 同义词词林 面向中文客户评论的评价搭配识别研究 被引量:3 2013年 评价搭配识别是评论挖掘的研究热点之一。针对现有方法存在的不足,通过对真实语料的观察和分析,提出了一种基于语法模板的评价搭配识别方法。该方法借助HowNet和语法分析等资源和工具,从大规模的真实评论语料中自动获取反映评价搭配规律的候选语法模板,对候选模板进行泛化和遴选,通过生成的模板识别待分析的评论句的搭配关系。在手机和数码相机两种电子产品领域上的对比实验验证了该方法是有效的。 陈炯 张虎 曹付元关键词:知网 依存句法分析 基于短语模式的文本情感分类研究 被引量:41 2008年 文本倾向识别的研究在诸多领域有着广阔的发展前景,短语模式的文本情感分类是问答系统、信息安全、网上调查等研究的基础。本文从语言学角度出发,首先,分析词典中对词语义定义的特点,采用"情感倾向定义"权重优先的计算方法获得短语中各词的语义倾向度,然后分析短语中各词组合方式的特点,提出中心词概念来对各词的倾向性进行计算来识别短语的倾向性和倾向强度。实验表明,本文的方法对短语的倾向分类识别效果较好,可为更大粒度的文本倾向识别打好基础,具有一定的实用价值。 李钝 曹付元 曹元大 万月亮关键词:情感倾向 知网 短语结构 中心词 应用云计算的舰船电子信息系统入侵检测技术 被引量:2 2022年 本文着重分析云计算的体系结构以及特点,研究船舶电子信息系统结构以及软件设计结构,构建了云计算环境下船舶电子信息系统入侵检测模型,提出云计算下资源分配方法。研究云计算环境下舰船电子信息系统入侵检测技术的研究,对船舶信息安全的发展有着一定的推动作用。 杨芳 曹付元关键词:云计算技术 入侵检测技术 具有可持续竞争力的计算机创新人才培养改革实践 2021年 文章首先阐述了具有可持续竞争力的计算机创新人才培养改革模式,然后论述了具有可持续竞争力的计算机创新人才培养改革模式实践,最后说明了具有可持续竞争力的计算机创新人才培养改革模式实践成效。 吕国英 曹付元 李茹 白亮 高嘉伟关键词:计算机 课程群 深度多视图聚类方法、装置、电子设备及可读存储介质 本发明属于数据处理技术领域,尤其涉及一种深度多视图聚类方法、装置、电子设备及可读存储介质,具体方案包括:使用深度自编码器提取各视图的特定表示;引入注意力机制学习每个视图的权重系数,对来自不同视图的互补信息进行融合得到跨视... 曹付元 冯天婵