李宇峰 作品数:23 被引量:33 H指数:3 供职机构: 南京大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
面向开放场景的鲁棒机器学习专刊前言 2022年 近年来,随着学术界与工业界在机器学习和人工智能领域越来越多的投入和关注,相关技术获得飞速发展,机器学习已经被应用到社会生活的方方面面,并产生巨大社会价值.机器学习模型主要依赖大量高质量数据的封闭训练,随着机器学习模型付诸于开放场景,例如,数据分布的变化、数据特征的变化、数据标记的偏差、任务目标的变化、恶意样本的攻击、设备能力的受限等,其往往面临模型失效、性能不佳等风险隐患.基于此,研究人员亟需探索开放场景下的鲁棒机器学习模型.具体而言,包括分布变化的机器学习、弱监督学习、模型复用、表示学习、强化学习、对抗学习、迁移学习以及更多实际领域问题中的应用等.为此,我们组织了面向开放场景的的鲁棒机器学习专刊. 陈恩红 李宇峰 邹权关键词:人工智能 数据分布 数据特征 一种快速提升文本分类性能的机器学习方法和装置 本发明公开了一种快速提升文本分类性能的机器学习方法和装置,主要用于实现文本分类性能的快速提升。本发明主要的技术方案为:获取与目标任务相关的一组模型;通过复用已有模型选择出需要查询的本文样本,过滤掉不必要的查询,帮助获得更... 李宇峰 石锋文献传递 一种应对增量式新类图像数据的鲁棒弱监督分类方法 本发明公开一种应对增量式新类图像数据的鲁棒弱监督分类方法。具体而言,在开放场景下,数据增量涌现,其中包括未标记、已标记、新类图像。对于已标注图像,加入模型并更新标注数据集合。对于新来的未标注图像,通过特征描述和弱监督学习... 李宇峰 周志华 朱永南文献传递 一种基于在线反绎学习的流式数据分类方法及其实现装置 本发明公开一种基于在线反绎学习的流式数据分类方法及其实现装置,通过将输入的无标记(或弱监督标记)流式数据放入当前学习器,从而获得对当前流式数据预测的伪标记;对预测得到的伪标记,通过利用知识库(和弱监督标记),执行反绎推理... 李宇峰 周志华 黄宇轩一种面向边角类别图像的稳健检测方法 本发明公开一种面向边角类别图像的稳健检测方法,用于提升机器学习算法在测试阶段检测边角类别(Corner Class)图像的能力,一方面防止了模型边角类别图像的错误预测,另一方面降低了边角类别图像的人工标注成本。本发明主要... 李宇峰 周植 金苡萱 程战战一种基于预测结果筛选的鲁棒数字图像标注方法 本发明公开了一种基于预测结果筛选的鲁棒机器学习方法,用于获得更可靠的数字图像标注结果。具体而言,本发明采用机器学习中的经典思想——最大化间隔原理,对待标注的数字图像在多种相似度度量下得到的预测结果进行筛选,选取其中间隔最... 李宇峰 王少博 周志华一种针对图像分类任务的学件查搜与复用的方法 本发明公开一种针对图像分类任务的学件查搜与复用的方法,通过在学件规约构造的过程中利用文本‑图像预训练模型进行统一数据表示,并且同时考虑训练数据分布和模型性能表现,提升学件规约对模型功能描述的准确性,从而在面临新的图像分类... 郭兰哲 李宇峰 周志华 金苡萱 周植面向开集识别的稳健测试时适应方法 2024年 开集识别旨在研究测试阶段突现未见类别对于机器学习模型的挑战,以期学习模型既能分类已见类别又可识别/拒绝未见类别,是确保机器学习模型能够在开放世界中高效稳健部署的重要技术.既有开集识别技术通常假设已见类别的协变量分布在训练与测试阶段维持不变.然而在实际场景中,类别的协变量分布常不断变化.直接利用既有技术不再奏效,其性能甚至劣于基线方案.因此,亟需研究新型开集识别方法,使其能不断适应协变量分布偏移,以期模型在测试阶段既能稳健分类已见类别又可识别未见类别.将此新问题设置命名为开放世界适应问题(AOW),并提出了一种开放测试时适应方法(OTA).该方法基于无标注测试数据优化自适应熵损失与开集熵损失更新模型,维持对已见类的既有判别能力,同时增强了识别未见类的能力.大量实验分析表明,该方法在多组基准数据集、多组不同协变量偏移程度下均稳健地优于现有先进的开集识别方法. 周植 张丁楚 李宇峰 张敏灵关键词:图像识别 流数据 弱监督学习专题简介 2021年 在许多现实任务中,数据对象的标注过程成本很高,学习系统通常难以获得完全、具体、精确的强监督信息.近年来,面向监督信息不充分、不具体、不精确等场景的弱监督学习范式已成为机器学习的热点研究领域.SCIENCE CHINA Information Sciences组织出版"弱监督学习专题"(Special Focus on Weakly Supervised Learning),旨在报道弱监督学习算法与应用方面的前沿进展. 张敏灵 李宇峰关键词:数据对象 一种安全的半监督学习方法 本发明公开一种安全的半监督学习方法,包括构建多个半监督分类器步骤和构建最终安全半监督分类器步骤;首先对于给定训练数据集构建多个差异性大的半监督分类器;然后通过最坏情况下最大化性能提高来构建最终安全半监督分类器。本发明的方... 周志华 李宇峰文献传递