国家高技术研究发展计划(863-306-ZD03-01-2)
- 作品数:13 被引量:203H指数:8
- 相关作者:高文王兆其王作英马继勇王春立更多>>
- 相关机构:中国科学院哈尔滨工业大学清华大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金中国科学院“百人计划”更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于SOFM/HMM模型的非特定人手语识别系统被引量:9
- 2002年
- 手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音 .目前最新发展水平的手语识别系统在实际应用中应该解决非特定人手语识别问题 .该文在分析非特定人手语识别特点——数据多且差异大、模型训练难收敛、对不同人数据的特征提取需求更迫切——的基础上 ,提出了 SOFM/ HMM模型 ,将自组织特征映射 (SOFM)很强的特征提取功能和隐马可夫模型 (HMM)良好的处理时间序列属性结合在一个新颖的框架下 ,并把该模型应用到非特定人中国手语识别中 .实验结果表明 ,SOFM/ HMM模型手语识别率比传统的 HMM模型提高近 5 % .
- 方高林高文王春立陈益强
- 关键词:自组织特征映射EM算法HMM模型计算机
- 基于WEB的手语新闻虚拟主持人的研究与实现被引量:15
- 2001年
- 介绍了我们提出的一种基于WEB的手语新闻虚拟主持人的系统实现方法。本文利用Internet和WWW开发上的主导技术ActiveX[1],集成了虚拟人合成、虚拟人姿态控制、中国手语合成等技术,开发了一个通用的浏览器插件[2],实现了基于WEB的用手语进行新闻发布的虚拟主持人系统。
- 杨长水王兆其高文
- 关键词:手语合成虚拟主持人ACTIVEX
- 基于多模式接口技术的聋人与正常人交流系统被引量:38
- 2000年
- 讨论了利用多模式接口技术处理异种语言模式交流的问题 .作为连接聋哑人和听力正常人的一个桥梁 ,我们将手语识别、手语合成、唇读、人脸特征检测以及特定人面部动画相结合 ,构成了手语转换和口语交流的代理 .文中对汉语手语识别和合成中的一些特殊问题进行了讨论 .对手语识别采用数据手套作为手语输入的数据采集设备 .对于一些同形异意的手语词汇 ,利用唇读得到的辅助信息可以达到提高识别率的效果 .对手语的合成 ,采用运动跟踪获得的信息来加强原来基于手工建模的三维虚拟人合成 ,增强了手语合成与显示的自然逼真度 .
- 高文陈熙霖马继勇王兆其
- 关键词:手语合成人脸特征检测手语识别
- 基于轴变形技术的实时人体肌肉变形被引量:1
- 2002年
- 1引言
真实感虚拟人的建模是计算机图形学领域中最具挑战性的工作之一.自七十年代以来,人体建模的计算模型出现了包括从杆状模型、简单的多边形模型到曲面模型甚至有限元模型,生成的3D人物在虚拟现实系统、视频游戏、电影和电视广告中得到了广泛的应用.虽然研究人员在表示和变形虚拟人体形状已取得了很大进展,但人体的逼真动画还没有取得较为满意的结果,其中一个最主要的挑战在于:人体运动时皮肤的自动与真实的变形.对于逼真人体的实时变形模拟,国内外的研究相对较少,随着计算机硬件的飞速发展,虚拟社区、虚拟战场等实时分布式虚拟现实技术的应用需求的不断增加,需要虚拟人不仅具有非常强的真实感,而且能够实时地做出各种动作和姿态.这就为虚拟人建模提出了更高的要求.……
- 左力李锦涛王兆其
- 多模式语音合成
- 传统语音合成是单模式的,本文首次提出并实现一种多模式语音合成系统,系统在播放合成语音同时,还伴随有唇动,面部行为以及身体手势动作等.在多模式合成系统中,各模式之间的同步以及协同是至关重要的,本文由此提出基于聚类,统计以及...
- 陈益强高文王兆其杨长水姜大龙
- 文献传递
- 基于机器学习的普通话韵律规则提取被引量:10
- 2001年
- 韵律规则对于语音识别和语音合成研究具有重要意义 .目前的韵律规则大多是根据语言学的研究得出的一些定性的描述 .为了提取出更精确的定量描述的韵律规则 ,利用聚类分析提取出句子中音节的基频模式 ,在此基础上使用决策树进行韵律规则的学习 ,获得了较好的实验结果 .文中首先讨论韵律规则和聚类分析及决策树 ,然后给出数据预处理技术及所采用的学习算法 。
- 朱廷劭高文
- 关键词:聚类分析决策树语音识别语音合成
- 基于标注图像的MPEG-4人脸运动参数获取方法被引量:2
- 2001年
- 提出了一种基于标注图像的MPEG-4人脸运动参数(FAP)获取方法。首先对人脸进行手工标点,然后使用摄像机拍摄人脸运动序列并录制语音数据,通过图像分割与标记点定位等操作提取标记点位置信息,再根据人脸特征点的几何分布确认标记点对应的三维FDP参数,最后经过计算得到人脸运动参数。将获取的结果数据应用到基于MPEG-4的语音驱动的三维人脸合成与动画系统中,取得了很好的效果。
- 左力李治国李锦涛高文
- 关键词:MPEG-4图像分割
- 用于语音识别的鲁棒自适应麦克风阵列算法被引量:8
- 2004年
- 对现实环境中存在的混响以及非平稳干扰语音信源等因素导致的算法性能下降,提出了一种用于语音识别的鲁棒旁瓣对消算法。讨论了旁瓣对消算法在自适应麦克风阵列中的应用,分析了算法在不同的混响条件下、不同的干扰源的噪声抑制能力。该算法通过分帧处理将输入信号划分为一系列短时平稳的信号片段。根据当前帧的信噪比决定自适应滤波器的权系数更新方式。采用一定的范数约束来限制自适应滤波器权系数的误调整。实验结果表明该麦克风阵列在混响的现实环境中能够有效抑制平稳噪声源和交叠谈话背景干扰,提高了语音识别器的抗噪性能。
- 赵贤宇王作英
- 关键词:语音识别麦克风阵列自适应信号处理
- 基于内容的图象检索系统被引量:63
- 2001年
- 分析了传统的图象检索方法的困难,比较了基于内容的图象检索系统所具有的优点、系统结构及一般的处理方法。着重探讨了视觉特征的提取及表示、图象检索的性能优化方法及现有图象检索系统。最后,对基于内容的图象检索提出了一些值得进一步研究的问题。
- 唐立军段立娟高文
- 关键词:特征提取图像检索系统图象处理计算机视觉
- 基于数据挖掘的普通话韵律规则学习被引量:6
- 2000年
- 普通话韵律规则对于语音合成和语音学研究具有重要意义 .为了更有效地进行韵律规则学习 ,该文利用数据挖掘技术从语料库中提取规则 .通过聚类分析进行基频模式提取 ,并以此进行基频序列的离散化 ;由语言学分析的结果得出训练句子中每个音节的参数 ,利用决策树和神经网络学习音节的韵律变化规则 .测试表明基于数据挖掘的韵律规则学习取得了较好的结果 ,证实了方法的有效性 .
- 朱廷劭高文
- 关键词:数据挖掘语音合成语音学