贾彩燕
- 作品数:47 被引量:165H指数:9
- 供职机构:北京交通大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学自然科学总论更多>>
- 基于图自监督对比学习的社交媒体谣言检测
- 2023年
- 网络社交媒体的快速发展提供了便捷的信息获取方式,但也滋生了谣言和虚假新闻,现有的谣言检测模型在有标注数据充足时能有效解决分类问题,然而谣言可用的标注数据有限,各种针对谣言特点精心设计的模型倾向于过拟合,同时,现有模型的鲁棒性不足,谣言传播者恶意破坏谣言传播结构会使模型出现分类错误.针对以上问题,采用自监督的图对比学习方法,对原始谣言传播图进行不同方式的数据增强来模拟对原图的扰动,建立自监督对比学习任务,使图编码器捕获谣言更趋本质的特征,缓解了过拟合,提高了模型的鲁棒性与泛化性能.在来源于主流社交媒体平台的三个公开数据集Twitter15,Twitter16和PHEME上进行了对比实验,实验结果显示,提出的模型的准确率比基准模型分别提高3.4%,1.8%和1.2%,证实了图自监督对比学习方法在谣言检测任务上的有效性.
- 乔禹涵贾彩燕
- 一种基于复杂网络的感认知行为与分子网络机制关联方法
- 本发明提供了一种基于复杂网络的感认知行为与人体分子网络关联方法。该方法包括:构建感知与认知行为表型相关的分子网络;构建神经、免疫、内分泌和微生态相关的分子网络;基于构建的分子网络利用网络平均最短路径长度和网络相关性指标,...
- 杨扩周雪忠贾彩燕董鑫
- 基于统计推理的社区发现模型综述
- 社区有助于揭示复杂网络结构和个体间的关系,研究人员从不同视角提出很多社区发现方法,用来识别团内紧密、团间稀疏的网络结构。自2006 年提出了一些基于统计推理的社区发现方法,其可识别实际网络中更多的潜在结构,以其可靠的理论...
- 柴变芳贾彩燕于剑
- 文献传递
- 面向自然语言推理的基于截断高斯距离的自注意力机制被引量:1
- 2020年
- 在自然语言理解任务中,注意力机制由于可以有效捕获词在上下文语境中的重要程度并提高自然语言理解任务的有效性而受到了人们的普遍关注。基于注意力机制的非递归深度网络Transformer,不仅以非常少的参数和训练时间取得了机器翻译学习任务的最优性能,还在自然语言推理(Gaussian-Transformer)、词表示学习(Bert)等任务中取得了令人瞩目的成绩。目前Gaussian-Transformer已成为自然语言推理任务性能最好的方法之一。然而,在Transformer中引入Gaussian先验分布对词的位置信息进行编码,虽然可以大大提升邻近词的重要程度,但由于Gaussian分布中非邻近词的重要性会快速趋向于0,对当前词的表示有重要作用的非邻近词的影响会随着距离的加深消失殆尽。因此,文中面向自然语言推理任务,提出了一种基于截断高斯距离分布的自注意力机制,该方法不仅可以凸显邻近词的重要性,还可以保留对当前词表示具有重要作用的非邻近词的信息。在自然语言推理基准数据集SNLI和MultiNLI上的实验结果证实,截断高斯距离分布自注意力机制能够更有效地提取句子中词语的相对位置信息。
- 张鹏飞张鹏飞贾彩燕
- 样本加权的多视图聚类算法被引量:12
- 2019年
- 大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,这些数据常呈现出多源性和异构性.如何对这些多源数据进行有效的聚类(也称为多视图聚类)已成为当今机器学习研究关注的焦点之一.现有的多视图聚类算法主要从“全局”角度关注不同视图和特征对簇结构的贡献,没有考虑不同样本间存在的“局部”信息间的差异.因此,提出一种新的多视图样本加权聚类算法(sample-weighted multi-view clustering, SWMVC),该算法对每个样本的不同视图进行加权,采用交替方向乘子法自适应学习样本权值,不仅可以学习不同样本点间不同视图权重的“局部”差异,还可以从学习到的“局部”差异反映出不同视图对簇结构贡献的“全局”差异,具有较好的灵活性.多个数据集上的实验表明:SWMVC方法在异质视图数据上具有较好的聚类效果.
- 洪敏贾彩燕贾彩燕于剑
- 关键词:数据挖掘多视图聚类
- 适用于大规模信息网络的语义社区发现方法被引量:1
- 2017年
- 对节点带有内容的信息网络进行语义社区发现是新的研究方向。融合节点内容增加了算法的复杂度。提出了一种在线性时间内进行语义社区发现的标签传播算法,用LDA(latent Dirichlet allocation)主题模型表示节点内容,以节点内容相似度和传播影响力的乘性模型作为标签传播的策略,在归一化过程中,自然融合节点内容和网络结构信息,标签迭代过程中,采用节点与绝大部分邻居节点内容不相同才进行更新的策略,保证算法的运行效率。通过在不同规模的12个真实数据集上进行实验,以模块度和纯度作为度量标准,验证了算法在语义社区发现上的有效性和可行性。
- 沈桂兰贾彩燕于剑杨小平
- 关键词:内容相似度
- 应用非负矩阵分解模型的社区发现方法综述被引量:9
- 2016年
- 非负矩阵分解(nonnegative matrix factorization,NMF)在提取高维数据中隐含模式和结构方面具有良好性能,已成为数据挖掘领域的热点研究之一。NMF作为无监督学习的有效工具,在模式识别、文本处理、多媒体数据分析以及生物信息学等研究领域得到了广泛应用。目前,已有工作将NMF模型应用于网络数据挖掘,发现网络中隐含的社区结构。对基于NMF的社区发现方法进行了总结,包括无监督的社区发现方法和半监督的社区发现方法,通过在实际网络和人工网络进行实验,比较分析了不同算法的性能,进一步研究了当前基于NMF发现社区结构所面临的挑战,并对下一步研究方向进行了展望。
- 李亚芳贾彩燕于剑
- 关键词:数据挖掘非负矩阵分解
- 一种注意力增强的自然语言推理模型被引量:2
- 2020年
- 在自然语言处理任务中使用注意力机制可准确衡量单词重要度。为此,提出一种注意力增强的自然语言推理模型aESIM。将词注意力层以及自适应方向权重层添加到ESIM模型的双向LSTM网络中,从而更有效地学习单词与句子表示,同时提高前提与假设文本之间局部推理的建模效率。在SNLI、MultiNLI及Quora数据集上的实验结果表明,与ESIM、HBMP、SSE等模型相比,aESIM模型的准确率能够提升0.5%~1%。
- 李冠宇张鹏飞张鹏飞
- 关键词:自然语言处理
- 面向社区检测的一种新的非负矩阵初始化方法
- 经过多年的发展,非负矩阵分解已经成为一个相对成熟的数据分析手段,在很多领域都得到了广泛应用。本文对非负矩阵分解的初始化进行研究,提出了一种新的非负矩阵初始化方法(基于网络中心性的交替最小二乘初始化方法),并与其他初始化算...
- 秦瑶瑶贾彩燕李亚芳
- 关键词:非负矩阵分解初始化
- 基于统计推理的社区发现模型综述被引量:4
- 2012年
- 社区有助于揭示复杂网络结构和个体间的关系。研究人员从不同视角提出很多社区发现方法,用来识别团内紧密、团间稀疏的网络结构。自2006年以来,提出了一些基于统计推理的社区发现方法,它们可识别实际网络中更多的潜在结构,并以其可靠的理论基础和优越的结构识别能力成为当前的主流。该类方法的主要目标是建立符合实际网络的生成模型以拟合观测网络,将社区发现问题转化为贝叶斯推理问题。首先给出社区发现中生成模型的相关定义;其次按照模型中社区组成元素将已有统计推理模型分为节点社区推理模型和链接社区推理模型,并深入探讨各种模型的设计思想及实现算法;再次,总结各模型适用的网络类型及规模、发现的社区结构、算法复杂度等,给出一种选择已有基于统计推理的社区发现模型的方法,并利用基准数据集对已有典型统计推理模型进行验证及分析;最后探讨了基于统计推理模型的社区发现存在的主要问题和未来发展的方向。
- 柴变芳贾彩燕于剑