辽宁省自然科学基金(2001113)
- 作品数:7 被引量:18H指数:3
- 相关作者:李晶皎张广渊赵骥张俐王丽君更多>>
- 相关机构:东北大学鞍山科技大学清华大学更多>>
- 发文基金:辽宁省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于贝斯准则和待定词集模糊矩阵的满文识别后处理被引量:1
- 2004年
- 将满文单词识别系统的识别信息和满文的词组信息有机地结合起来,建立满文词组和待定词集统计信息库,利用贝叶斯准则,综合满文待定词的后验概率和词组的先验概率信息,建立合理有效便于实现的数据结构,对满文单词识别系统输出存在的拒识词和错识词进行检测和纠正,从而有效地提高满文识别系统的识别率·实验表明:后处理性能除取决于语言模型外,还取决于后概率的精确估计·另外,在单词识别系统识别率高的情况下,后处理的纠错能力会增强·
- 李晶皎赵骥
- 关键词:满文模糊矩阵贝叶斯准则特征矢量词组库
- 满文矢量字库和罗马转写满文输入法的实现被引量:3
- 2003年
- 通过研究满文文字的特征,提出满文搭配字母和满文字根的概念,并在满文字根的基础上构建Windows通用矢量字库,由满文字根拼接成满文字母,再由满文字母拼接成满文,最终实现基于矢量字库满文文字的显示·在依据满文搭配字母和拼接规则构建的满文搭配字母表的基础上设计标准罗马转写向满文编码转换算法,基于该算法的罗马转写满文输入法实现了在Windows下应用程序对满文文字的调用和处理,经过多种应用程序测试,满文的显示和输入法使用效果良好·
- 张广渊李晶皎张俐
- 关键词:满文输入法矢量字库
- 基于HMM的满文文本识别后处理的研究被引量:4
- 2006年
- 将满文单词识别系统的识别信息和满文的词组信息有机的结合起来,建立满文词组和待定词集统计信息库,采用基于统计的隐马尔可夫模型的方法,依据贝叶斯准则,综合满文待定词的后验概率和词组的先验概率信息,建立合理有效便于实现的数据结构,采用动态规划法对满文单词识别系统输出存在的拒识词和错识词进行检测和纠正,从而有效的提高满文文本识别系统的识别率。实验表明:后处理性能除取决于语言模型外,还取决于概率的精确估计。另外,在单词识别系统识别率高的情况下,后处理的纠错能力会增强。
- 赵骥李晶皎王丽君张继生
- 关键词:中文信息处理满文后处理模糊矩阵贝叶斯准则特征矢量
- 基于统计的满文识别后处理的研究和实现被引量:1
- 2005年
- 目前的技术不能使单字识别系统的识别率达到100%,单字识别系统会产生错判和拒判。因此,将满文中单词识别系统的识别信息和满文的词组信息有机的结合起来,建立满文词组和待定词集统计信息库,采用基于统计的隐马尔可夫模型的方法,利用Viterbi动态规划法求最佳路径,对满文的单字识别输出进行后处理,可以有效的提高识别系统的识别率。实验表明,单字识别系统的识别率越高,后处理的纠错能力越强。
- 赵骥王丽君李晶皎
- 关键词:满文模糊矩阵隐马尔可夫模型
- 脱机手写体满文文本识别系统的设计与实现被引量:6
- 2006年
- 通过研究手写体圈点满文文字特征,提出采用基于笔画序列的脱机手写满文识别方法,首先使用数字图像处理方法对识别目标实现单词提取和预处理操作,然后将处理后的单词分解为笔画基元,采用统计模式识别方法进行识别,得到笔画序列,再把笔画序列转换为字根序列,使用模糊串匹配算法实现满文罗马转写的输出,最后再采用基于隐马尔可夫模型方法对单词识别结果进行后处理,进一步提高系统识别率。实验表明,在单一字体笔画学习和大语料双词同现概率统计的基础上,系统的识别率和自适应能力都较好。
- 赵骥李晶皎张广渊王杰
- 关键词:满文文字识别
- 脱机手写满文笔画基元的提取和识别被引量:9
- 2007年
- 笔画的正确提取对文字识别结果至关重要。该文提出并实现了一种全新的满文笔画提取方法。基于满文文字的结构和特征,首先对处理目标进行预处理,确定笔画主干,创建笔画生长法对满文文字笔画实现自动提取。对提取得到的笔画进行分类,然后对照笔画特征库进行识别。试验表明,该方法对规整手写的满文文字的笔画提取和识别有令人满意的效果,为进一步脱机手写满文识别研究奠定了坚实的基础。
- 张广渊李晶皎王爱侠
- 关键词:满文笔画模式识别
- 满文罗马转写与圈点满文转换算法的实现被引量:3
- 2003年
- 通过研究满文文字的特征,在给出圈点满文和满文罗马转写单词定义BNF范式的基础上,按照总结出的圈点满文与其拉丁化方案之间相互转换的规则,构建了满文罗马转写与圈点满文之间的相互转换算法,并着重解决了圈点满文向罗马转写转换过程中的编码冲突问题,对不符合规则的文字编码提出了解决方案,从而实现罗马转写文本和圈点满文之间的双向一一对应转换·通过对测试文本的转换试验,表明了所提出的转换算法的有效性·
- 张广渊李晶皎张俐
- 关键词:满文字符拉丁化