李云 作品数:86 被引量:205 H指数:7 供职机构: 南京邮电大学计算机学院 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 江苏省高校自然科学研究项目 更多>> 相关领域: 自动化与计算机技术 电子电信 理学 机械工程 更多>>
基于模型过滤的多任务回归在帕金森症预测中的应用 被引量:1 2018年 传统基于语音的帕金森症(PD)病情预测方法则是分别预测运动症状评分(motor-UPDRS)和总体症状评分(total-UPDRS)。为解决在单任务预测过程中,传统方法无法利用任务之间的共享信息和预测性能不佳的问题,提出了一种基于模型过滤的多任务回归方法来预测帕金森症患者的motor-UPDRS和total-UPDRS。首先,考虑到子任务语音特征对预测motor-UPDRS和total-UPDRS不同的影响,添加L1正则化项进行特征选择;其次,在构建模型的同时,根据不同帕金森患者对象分布在不同的域,添加了过滤机制,来提高预测精度。在远程帕金森数据集仿真实验中,基于模型过滤的多任务回归方法在预测UPDRS时,较单任务条件下最小二乘法(LS)模型预测motor值准确度提高了67.2%,预测total值则提高了83.3%;相比单任务条件下决策回归树(CART)模型预测motor值提高了64%,预测total值则提高了78.4%。实验结果表明,基于模型过滤的多任务回归算法对UPDRS预测要优于单任务回归算法。 刘峰 季薇 李云关键词:帕金森症 语音 一种跨云数据中心的能效预测方法 本发明公开了一种跨云数据中心的能效预测方法,该方法将采集的多个云数据中心设备能耗数据及其能效PUE值作为训练样本,待测云数据中心的历史能耗数据及其能效PUE值作为校准样本,对采集的能耗数据进行特征提取;对每个云数据中心,... 李云 沈子钰 刘峥 夏彬 徐小龙文献传递 一种基于多带谱减法的帕金森语音增强方法 本发明揭示了一种多带谱减法的帕金森语音增强方法,包括以下步骤:通过非接触式方式对帕金森患者进行语音信号采集;采集到的帕金森病患者语音进行采样和短时帧划分;对每一帧语音进行短时能量计算,并根据短时能量进行自适应频带划分;计... 季薇 林钢 李云一种基于MapReduce的并行化轨迹压缩方法 本发明公开了一种基于MapReduce的并行化轨迹压缩方法,将待压缩GPS轨迹序列按两种方式分段,第1种方式分为N段、标记为1,第2种方式分为N‑1段、标记为2,并以三元组形式表示;将所有三元组轨迹分段记录进行哈希处理后... 吴家皋 夏轩 李云文献传递 基于改进排序算法的用户查询优化的研究 2015年 互联网的迅速发展使信息检索的环境发生了重大变化。而基于互联网的搜索引擎的排序算法直接关系到用户在新的环境里进行信息检索的使用体验。文中提出一种将PageRank算法、分类技术、文档TF-IDF(词频-逆向词频)值相结合的方法,对排序算法进行改进。该算法对于用户查询的关键字进行预分类,判断用户的输入关键字最可能属于的文本类型。基于此优先从Solr库中取出类别相似的数据,使得主题相关的文本靠前显示。实验结果表明,该排序算法具有较快的查询响应时间和较高的查准率。 吴家皋 刘杰 钱科宇 李云关键词:搜索引擎 PAGERANK 排序 深度优先局部聚合哈希 被引量:2 2021年 已有的深度监督哈希方法不能有效地利用提取到的卷积特征,同时,也忽视了数据对之间相似性信息分布对于哈希网络的作用,最终导致学到的哈希编码之间的区分性不足.为了解决该问题,提出了一种新颖的深度监督哈希方法,称之为深度优先局部聚合哈希(Deep Priority Local Aggregated Hashing,DPLAH).DPLAH将局部聚合描述子向量嵌入到哈希网络中,提高网络对同类数据的表达能力,并且通过在数据对之间施加不同权重,从而减少相似性信息分布倾斜对哈希网络的影响.利用Pytorch深度框架进行DPLAH实验,使用NetVLAD层对Resnet18网络模型输出的卷积特征进行聚合,将聚合得到的特征进行哈希编码学习.在CIFAR-10和NUS-WIDE数据集上的图像检索实验表明,与使用手工特征和卷积神经网络特征的非深度哈希学习算法的最好结果相比,DPLAH的平均准确率均值要高出11%,同时,DPLAH的平均准确率均值比非对称深度监督哈希方法高出2%. 龙显忠 程成 李云关键词:卷积神经网络 图像检索 一种基于注意力机制的时序数据缺失值插补方法 本发明公开了一种基于注意力机制的时序数据缺失值的插补方法,其包括:获取有缺失值的时序数据;将有缺失值的时序数据输入训练后的生成器,获取插补后的时序数据;其中,生成器的训练包括:将有缺失值的时序数据输入生成器,基于注意力机... 季微 金博斌 李云文献传递 基于多源语音信息融合的帕金森病辅助检测方法 2023年 在病程早期,帕金森病患者由于发声器官的灵活协调能力下降,会出现发音困难、发音不稳定等症状。为分析受试者的言语能力,专家基于上述生理现象设计了包括持续元音、重复音节以及情景对话在内的多类型语料。已有的帕金森病语音检测研究大多基于单类型语料,可评估受试者部分声学器官的协调能力,但无法全面地反映受试者的发声状况,且易受采集环境、个体差异等因素的影响。针对上述问题,本文提出一种用于帕金森病辅助检测的多源语音信息融合模型,旨在充分利用多类型语料获得的多源语音数据,提取丰富全面的病理信息,抵御非病理性因素的影响。所提模型由编码器模块、解码器模块和分类器模块组成。其中,编码器模块通过多个支路分别学习各单源语音数据中的特有信息,并通过一个基于多头注意力机制的多源信息融合分支实现更细粒度的信息交互,学习多源语音数据的共有信息,从而全面提取多源数据所携带的病理信息;解码器模块帮助编码器模块实现信息压缩去冗余;分类器模块根据编码器输出完成帕金森病检测,并辅助编码器模块学习紧凑的病理信息表示。为进一步确保特有信息和共有信息的提取,模型对特有信息和共有信息实施了正交约束。本文在包含340个语音样本的自采数据集上进行了多个对比实验。实验结果显示,所提模型在帕金森病检测的准确率、敏感度和F1分数等各项性能指标上相较于基于单源语音数据的模型分别提高了6%、3%、6%;同时,共有信息与特有信息的有效整合,也使得所提模型相较于其他信息融合模型在准确率指标上提高了2.8%以上。 季薇 王传瑜 李云 郑慧芬关键词:帕金森病 语音信号处理 多源信息融合 混合式的K-匿名特征选择算法 被引量:4 2021年 K-匿名算法通过对数据的泛化、隐藏等手段使得数据达到K-匿名条件,在隐藏特征的同时考虑数据的隐私性与分类性能,可以视为一种特殊的特征选择方法,即K-匿名特征选择。K-匿名特征选择方法结合K-匿名与特征选择的特点使用多个评价准则选出K-匿名特征子集。过滤式K-匿名特征选择方法难以搜索到所有满足K-匿名条件的候选特征子集,不能保证得到的特征子集的分类性能最优,而封装式特征选择方法计算成本很大,因此,结合过滤式特征排序与封装式特征选择的特点,改进已有方法中的前向搜索策略,设计了一种混合式K-匿名特征选择算法,使用分类性能作为评价准则选出分类性能最好的K-匿名特征子集。在多个公开数据集上进行实验,结果表明,所提算法在分类性能上可以超过现有算法并且信息损失更小。 杨柳 李云关键词:混合式 隐私保护 K-匿名 M3-SVM在帕金森疾病UPDRS分类中的应用 被引量:2 2018年 根据帕金森疾病对男女患者语音的影响不同这一现实依据,提出将性别这一先验知识融入到最小最大模块化支持向量机(M3-SVM)中,实现对统一帕金森评定量表(UPDRS)的分类。首先将性别作为先验知识,对UPDRS分类问题进行任务分解;其次,对经过任务分解后的训练样本集合运用支持向量机(SVM)进行训练得到基分类器;最后,通过MIN、MAX规则对所有基分类器的预测结果进行集成得出最终的分类结果。在两类及三类远程帕金森数据集的仿真实验中,基于性别划分得到的最好的F-measure值分别为80.19%和69.26%,与随机划分相比,分别提高了3.75%和5.19%,与超平面划分相比,分别提高了0.96%和4.15%。实验结果表明,使用性别划分能够更加准确地根据实际情况分解数据,基于性别划分的M3-SVM提高了UPDRS分类的准确率。 汪学明 季薇 李云关键词:帕金森疾病