洪锦玲
- 作品数:7 被引量:18H指数:2
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金中国科学院西部行动计划项目电子信息产业发展基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 在LibreOffice上实现支持Unicode编码的蒙文办公套件系统
- 2015年
- 通过分析LibreOffice的使用功能和源代码,在LibreOffice基础上实现了一套支持蒙文竖排(自左向右)和支持Unicode编码变形显现的蒙文办公软件,该软件以开源软件LibreOffice为基础,实现了蒙文编辑排版所需基本功能,符合蒙文使用习惯。
- 洪锦玲吴健
- 关键词:OFFICE办公软件UNICODE编码
- 藏文基本字符集的支持在OpenOffice.org中的实现方法被引量:2
- 2007年
- 以开源项目OpenOffice.org为基础,针对藏文基本字符集在OpenOffice.org办公套件本地化的过程中出现的技术难点,根据藏文自身的特点结合OpenOffice.org中文本显示模块Icu的结构,解决了藏文小字符集在OpenOffice.org办公套件中显示、排序和转写等和文化与文字紧密相关的问题。该本地化软件可以跨Windows和Linux平台运行。
- 洪锦玲贾彦民朱峰吴健
- 基于大规模网络语料的藏文音节拼写错误统计与分析被引量:6
- 2017年
- 针对从互联网获取的一份包含19万藏文网页,总计427万句、9 328万音节字的藏文文本语料,该文按照预定的规则对其中的藏文音节拼写错误情况进行了统计与分析。数据显示,在语料中出现的共计20 743个藏文音节中,含有拼写错误的音节共有9 700个,占藏文音节总数的46.762 8%,错误音节在语料中共出现27 427次,仅占0.030 8%,说明这份语料的文本质量是相当高的。文中还详细统计了各种不同表现形式的错误音节所占比重,并分析了导致拼写错误的四个主要原因:一是输入了多余的元音符号;二是音节点或句尾空格缺失;三是同一字丁/字符存在多种表达形式;四是错误地使用了相似字符。
- 刘汇丹洪锦玲诺明花吴健
- 关键词:拼写检查藏文信息处理中文信息处理
- 跨平台的藏文办公套件
- 吴健欧珠洛桑土美贾彦民朱峰大罗桑朗杰顿珠次仁仁青诺布益西桑布糜宏斌洪锦玲次仁罗布珠杰常福良拉巴泽仁
- (1)支持《藏文编码字符集扩充集A》和《藏文编码字符集扩充集B》国家报批标准; (2)支持符合藏文语言特征的藏文布局规则与排版规则,包括:断行规则、边界处理等; (3)支持完全的藏文操作界面,包括菜单、按钮、提示消息、求...
- 关键词:
- 关键词:办公套件跨平台藏文处理
- 一种字形加粗方法
- 本发明提供一种字形加粗方法,包括以下步骤:从字库中读取字形信息;通过字形信息判断字形的类别;若字形是点阵字形,则采用笔画线上像素点复制平移叠加的方法进行字形加粗;并且,将x方向的加粗幅度dx在字形高度H的1/72和1/4...
- 刘汇丹洪锦玲芮建武吴健刘奎恩
- 文献传递
- 基于词典的汉藏句子对齐研究与实现被引量:10
- 2011年
- 双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,针对藏文语言的特殊性,提出基于词典的汉藏句子对齐。整理了对齐所用双语词典,并对其词语覆盖率进行了评价。在汉藏句子对齐过程中发现汉语与藏文的分词粒度不同的问题,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。
- 于新吴健洪锦玲
- 关键词:词典平行语料库藏文信息处理
- 一种字形加粗方法
- 本发明提供一种字形加粗方法,包括以下步骤:从字库中读取字形信息;通过字形信息判断字形的类别;若字形是点阵字形,则采用笔画线上像素点复制平移叠加的方法进行字形加粗;并且,将x方向的加粗幅度dx在字形高度H的1/72和1/4...
- 刘汇丹洪锦玲芮建武吴健刘奎恩