广东省自然科学基金(9151806001000025)
- 作品数:14 被引量:106H指数:4
- 相关作者:刘宏杨戈李霞王娜刘国胜更多>>
- 相关机构:北京大学深圳大学北京师范大学珠海分校更多>>
- 发文基金:国家自然科学基金广东省自然科学基金深圳市科技计划项目更多>>
- 相关领域:自动化与计算机技术自然科学总论电子电信更多>>
- 电视背景环境下语音命令识别系统被引量:1
- 2011年
- 设计了一种电视背景环境下的非特定人语音控制命令识别系统,包括基于隐马尔可夫模型的孤立词识别子系统和基于扩展信息最大化(Infomax)独立成分分析算法的语音分离子系统.本语音识别系统的语音库包括8 400个电视机转台控制命令的语音数据.在无噪环境下对特定语音命令的识别率可达93.2%,正常电视背景环境下的识别率降至49.0%,对电视背景下通过分离后的语音命令识别率可达85.8%.
- 范婷刘宏
- 关键词:语音识别隐马尔可夫模型
- 基于句类模型的人机对话系统语句库设计
- 2011年
- 针对目前人机对话系统智能性较低、语句库领域受限的现状,设计了面向日常生活常用话题的机器人回复语句库,用于日常生活聊天.语句库以汉语句子类型中的句类为模型,构建了涵盖日常生活常用的28个话题范围的900句语句库.通过关键词语的替换可以扩展出更多的语句,从而用于更广泛领域的人机对话交流,增加了语句库的完善性,尽量避免了出现答非所问的情形.同时该构建方法降低了人工构建语句库的工作量,而且由于语句库较小,确保了系统实现的实时性.人机交互对比实验表明:该语句库实现了使用较少的语句就基本可以进行日常话题的对话,满意度高于对比网络聊天机器人小i,使得人机交互更加友好.
- 梁子琳丁润伟刘宏
- 关键词:人机对话聊天机器人句类自然语言处理
- 基于成对约束半监督学习的数据相关核优化方法
- 2011年
- 核函数及其参数的选择决定着核方法的性能.本文基于半监督学习思想,通过构建一个目标函数,利用无标签数据和成对约束信息来优化核函数,使得核函数尽可能适应数据集,从而改善核函数性能.为验证方法的有效性,将其应用于核主成分分析(KPCA)的核函数优化中,在人工数据和UCI数据集上对KPCA提取特征的分类和聚类性能进行评估,实验结果说明提出方法改进了分类和聚类性能.
- 王娜刘国胜李霞
- 关键词:半监督学习核主成分分析
- P2P的流媒体复制技术综述
- 2012年
- 流媒体将是未来通信中的杀手业务,P2P(Peer-to-Peer)网络是未来通信的重要组成形式之一,本文提出流媒体复制技术应该具有的特性,综述了基于P2P的流媒体的复制技术,包括复制对象的选择,需要副本的个数,副本放置的位置(副本的定位)和更新控制等问题的研究现状和解决方案,通过分析它们的优缺点,总结解决方案的特点,并指出了P2P流媒体复制技术的未来研究方向.
- 杨戈刘宏樊秀梅
- 关键词:流媒体对等网副本
- 基于特征子空间邻域的局部保持流形学习算法被引量:1
- 2012年
- 局部保持流形学习算法通过保持局部邻域特性来挖掘隐藏在高维数据中的内在流形结构。然而,对于缺乏足够训练样本的高维数据集,或者高维数据集存在非线性结构和高维数据特征中存在冗余、干扰特征,使得在原特征空间中利用欧式距离定义的邻域关系并不能真实反映数据的内在流形结构,从而影响算法的性能。提出利用正约束寻找特征子空间的方法,使得在此子空间中更多的同类样本紧聚,并进一步在该子空间中构建邻域关系来挖掘高维数据的内在流形,形成基于特征子空间邻域特性的局部保持流形学习算法(NFS-LPP和NFS-NPE)。它们在一定程度上克服了高维小样本数据集难以正确挖掘内在流形结构的问题,在Yale和ORL人脸库上的分类和聚类实验验证了其有效性。
- 王娜李霞刘国胜
- 关键词:特征子空间流形学习
- 智能机器人PengPeng Ⅱ的系统集成与性能测试
- 2011年
- 基于人机安全友好交互的设计理念,提出了一种智能交互机器人的结构设计和系统集成方案.系统集成包括硬件与软件的整合,由举手检测跟踪、视觉人体定位、语音识别、语音定位、运动控制、表情交互和主控程序7个模块组成.通过对该系统性能测试实验表明智能交互机器人"PengPeng Ⅱ"能够与服务对象之间安全、自主、和谐、友好地交互.
- 赵浩李林刘宏
- 关键词:机器人智能交互系统设计系统集成
- 基于NMF的语音和音乐信号半盲分离算法
- 语音和音乐信号的分离是基于内容的音频信号检索的关键技术。针对语音与音乐信号的频谱特性,本文提出基于音乐信号的先验知识的非负矩阵分解(Nonnegative Matrix Factorization,NMF)算法。在传统的...
- 蔡毅郑能恒李霞
- 关键词:非负矩阵分解信号分离语音
- 文献传递
- 基于监督信息特性的主动半监督谱聚类算法被引量:36
- 2010年
- 半监督聚类是利用少部分监督信息辅助大量未标签数据进行非监督的学习,其聚类性能的改善依赖于监督信息,因此挖掘适合半监督聚类的监督信息非常关键.提出了一种基于监督信息特性的主动学习策略,即找出同一类中距离相对较远的数据对象对和不同类中距离相对较近的数据对象对组成监督信息,并将其引入谱聚类算法,构建新颖的主动半监督谱聚类算法ASSC(Active Semi-supervised Spectral Clustering).利用该监督信息调整谱聚类中点与点之间的距离矩阵,使类内各点紧聚,类间散布.通过对UCI基准数据集以及人工数据集的实验结果表明,ASSC算法优于采用随机选取监督信息的谱聚类性能.
- 王娜李霞
- 关键词:谱聚类半监督聚类
- 基于模型在线更新和平滑处理的音乐分割算法被引量:2
- 2011年
- 针对音乐分割中预训练模型和待分割信号间的不匹配问题,提出基于置信测度的自适应模型更新算法.在基于预训练模型的识别结果中,通过置信测度选择可靠的数据进行高斯混合模型在线自适应更新,获得与待分割音乐信号更匹配的声乐/非声乐模型.通过对识别结果进行平滑处理,进一步去除瞬时突变错误.实验表明,与初始模型和采用全部数据进行模型更新相比,该算法可获得与待分割信号更匹配的高斯混合模型,分割效果更佳.
- 郑能恒张亚磊李霞
- 关键词:声学语音处理高斯混合模型
- 基于视觉阈值的结构相似度图像质量评价算法被引量:7
- 2010年
- 针对空间域结构相似度测量(image measure of structural similarity,SSIM)没有考虑人类视觉系统亮度掩蔽和对比度掩蔽对视觉感知的影响,提出基于人类视觉阈值理论的结构相似度图像质量评价算法(visibility threshold SSIM,VTSSIM).通过计算局部标准方差,将图像分为平坦区域、细节区域和一般区域;基于图像视觉阈值的临界可视误差分布,确定平坦区域中的亮度掩蔽极端区域和细节区域中的对比度掩蔽极端区域;分别对这两个极端区域及其他区域进行视觉阈值加权处理,得到整幅图像的质量评价.结果表明,VTSSIM比SSIM更符合人眼视觉特性,尤其适合评价失真较小的图像.
- 胡媛媛牛夏牧
- 关键词:图像处理图像质量评价人类视觉系统