搜索到106篇“ 混合属性数据“的相关文章
混合属性数据深度无监督融合特征学习方法
2024年
高质量的特征表示是实现数据精准挖掘的关键。针对现有特征学习方法难以有效提取混合属性数据中不同属性之间关联和数据内部真实信息的问题,提出一种面向混合属性数据的深度无监督融合特征学习模型(DUFERM)。该模型建立了一个双模态自编码器框架,对分类属性和数值属性采用不同路径进行建模,并采用深度多模态融合策略加深两种属性之间的联系;针对分类属性构建基于加权异构网络的离散特征自编码器,充分挖掘分类属性内部的结构和语义信息,针对数值属性构建连续特征自编码器,两个独立的自编码器以联合表示的形式组合在公共潜在表示层中;最后以预训练和联合训练相结合的无监督训练方式获得混合属性数据的融合特征表示。在10个公开数据集上的大量实验表明,所提DUFERM模型在各项评价指标上的综合性能优于现有经典的和新颖的混合属性数据特征学习方法,可以充分提取混合属性数据内部潜在特征,取得高质量的融合特征表示结果并提升下游数据挖掘任务的准确性。
何慧霞武森魏桂英谢嘉瑶高晓楠
关键词:混合属性数据数据挖掘
一种基于多特征融合的混合属性数据表示方法及系统
本发明提供了一种基于多特征融合的混合属性数据表示方法及系统。包括:获取包括N个样本的混合属性数据样本集;基于混合属性数据样本集获取序数属性内表示矩阵、名义属性内表示矩阵、序数‑序数关系矩阵、序数‑名义关系矩阵、名义‑序数...
李秋德梁祖鹏吉胜芬余洋胡思贵陈森
混合属性数据上的分类数据编码方法研究
梁祖鹏
DCKPDP:改进k-prototype聚类的差分隐私混合属性数据发布方法被引量:8
2022年
当前混合属性数据发布中隐私保护方法大多存在隐私保护效果不佳或数据效用较差的问题,采用差分隐私与优化的k-prototype聚类方法相结合,提出改进k-prototype聚类的差分隐私混合属性数据发布方法(DCKPDP)。为解决传统k-prototype聚类算法没有考虑不同数值型属性对聚类结果有较大影响的问题,利用信息熵为每个数值型属性添加属性权重;为解决聚类初始中心点人为规定或者由随机算法随机确定,导致聚类结果精确度不高的问题,结合数据对象的局部密度和高密度对聚类过程中初始中心点进行自适应选择;为解决数据信息泄露风险较高的问题,对聚类中心值进行差分隐私保护。实验结果表明,DCKPDP算法满足差分隐私保护所需的噪声量更小,数据的可用性更好。
张星张兴
关键词:混合属性数据信息熵
基于混合属性数据的高校图书馆文献精准检索方法被引量:4
2022年
针对检索效率低、查全率低以及检索精度低的问题,提出基于随机游走模型的高校图书馆文献精准检索方法。在信息熵概念基础上建立距离矩阵,结合数值属性数据欧式距离和分类属性数据距离建立混合属性数据距离矩阵,利用混合属性数据距离矩阵对高校图书馆文献实现降维处理;采用设计的游走模型锁定文献的主题词,根据词语的相似性聚类分析出具体过程,完成文献的精准检索。经过测试得知,研究方法的检索时间小于20 s,查全率达到80%以上,且具有理想的检索精度。
高萍
关键词:随机游走模型数据降维
基于网络模型的混合属性数据集离群点检测方法研究
离群点检测作为数据挖掘的主要研究方向,已得到学术界和工业界的广泛研究和应用。对于许多工程实际问题,数据集往往同时包含数值型和分类型属性,即,混合属性数据集,因此,对混合属性数据集中的离群点进行检测和研究具有重要的理论意义...
王宇
关键词:离群点检测网络模型
一种基于多视图深度度量学习的混合属性数据转换方法
本发明提供了一种基于多视图深度度量学习的混合属性数据转换方法,包括:获取包括至少一个待转换样本的待转换样本集,将待转换样本集输入预先训练好的多视图深度度量学习模型获得待转换样本集的转换结果,多视图深度度量学习模型包括:多...
李秋德吉胜芬余洋胡思贵熊庆宇
混合属性数据流聚类算法研究
随着大数据时代的到来,数据流在很多领域得到应用,作为数据挖掘领域的一大分支,数据流聚类成为一项意义深远而且具有挑战性的任务。现实生活中大部分数据流都是混合属性数据,然而大多数算法都是建立在只有数值属性数据或者只有分类属性...
王幸达
关键词:数据流聚类混合属性数据LLE
文献传递
混合属性数据集分布一致性度量的新方法被引量:2
2021年
数据分布一致性的度量是大数据随机样本划分生成过程中的一个关键问题,如何针对混合属性数据集进行合理有效的分布一致性度量是目前随机样本划分技术研究的重点.提出一种新的基于深度编码和最大平均差异的混合属性数据集分布一致性度量方法,不直接对两个不同的原始数据集进行分布一致性的度量,而是首先对混合属性中的离散属性进行独热编码,得到独热编码数据集;之后对独热编码数据集进行自编码处理,得到深度编码数据集;最后基于最大均值差异指标对两个不同的深度编码数据集进行分布一致性的度量.在Adult、Australian、CRX和German标准混合属性数据集上对所提方法进行性能实验验证,结果表明,与基于离散属性独热编码的最大平均差异方法和基于连续属性二进制化的相似性度量方法相比,新方法能够更加准确地对混合属性数据进行分布一致性的度量.
何玉林何玉林金一黄柏皓黄家杰
关键词:人工智能混合属性数据
复杂网络混合属性数据流密度检测方法研究
2021年
为了缩短混合属性数据流的密度检测时间,提高密度检测能力,提出了复杂网络混合属性数据流密度检测方法研究.采用判断矩阵的方式将异常混合属性数据流剔除,基于复杂网络混合属性数据流的采集流程,完成复杂网络混合属性数据流的采集;通过混合属性数据流密度的控制方程,确定了混合属性数据流密度的检测应力与应变之间的关系,利用混合属性数据流在复杂网络中传输的位移关系式,完成了复杂网络混合属性数据流密度检测模型的构建;最后通过混合属性数据流密度检测算法设计,实现了复杂网络混合属性数据流的密度检测.对比实验结果证明,提出的混合属性数据流密度检测方法与基于模糊计算的密度检测方法相比,大大缩短了复杂网络混合属性数据流的密度检测时间.
魏欢
关键词:复杂网络数据流密度检测

相关作者

陈华
作品数:4被引量:9H指数:2
供职机构:中华人民共和国国家民族事务委员会
研究主题:混合属性数据 AC 应急决策 管理信息系统 信息系统
刘勇奎
作品数:94被引量:587H指数:13
供职机构:大连民族学院计算机科学与工程学院
研究主题:计算机图形学 链码 模式识别 六角网格 整数运算
陈晋音
作品数:640被引量:479H指数:11
供职机构:浙江工业大学
研究主题:防御方法 防御 网络 攻击防御 图像
冀进朝
作品数:7被引量:32H指数:3
供职机构:吉林大学计算机科学与技术学院
研究主题:混合属性数据 数据挖掘 冲突消解 海明距离 计算方法
周晓锋
作品数:73被引量:219H指数:9
供职机构:中国科学院沈阳自动化研究所
研究主题:故障诊断 振动加速度 网络 复杂工业过程 变速器