2025年1月3日
星期五
|
欢迎来到海南省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
关真珍
作品数:
3
被引量:9
H指数:1
供职机构:
中国科学院计算机语言信息工程研究中心
更多>>
发文基金:
国家自然科学基金
国家高技术研究发展计划
国家科技型中小企业技术创新基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
陈肇雄
中国科学院计算机语言信息工程研...
冯冲
中国科学院计算机语言信息工程研...
黄河燕
中国科学院计算机语言信息工程研...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
1篇
会议论文
领域
3篇
自动化与计算...
主题
2篇
督导
2篇
分词
1篇
信息处理
1篇
语言模型
1篇
软件体系结构
1篇
体系结构
1篇
中文
1篇
中文分词
1篇
中文信息
1篇
中文信息处理
1篇
最大期望算法
1篇
基于WEB服...
1篇
分词算法
1篇
EM算法
1篇
WEB服务
机构
2篇
中国科学院
1篇
华中科技大学
1篇
中国科学技术...
作者
3篇
关真珍
2篇
黄河燕
2篇
冯冲
2篇
陈肇雄
传媒
1篇
中文信息学报
年份
1篇
2006
2篇
2004
共
3
条 记 录,以下是 1-3
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于Multigram语言模型的主动学习中文分词
被引量:8
2006年
分词是中文处理中的重要基础问题。为了克服Web文本分析中传统方法在适应繁杂的专业领域和多变的语言现象时存在的困难,本文以无督导分词方法为基本框架,使用EM算法建立n元multigram语言模型,提出了一种基于置信度的主动学习分词算法,使得系统在主要利用大量未标注数据的同时,还能够主动选择少量最有价值的数据提交人工标注。实验结果表明算法性能优于相关的几种无督导分词算法。
冯冲
陈肇雄
黄河燕
关真珍
关键词:
中文信息处理
分词
EM算法
基于Web服务的机助翻译系统体系结构研究
网络技术的进步为数据密集或计算密集型的应用提供了大规模、分布式的处理能力。考虑到语言工程所必需的大量数据以及分析这些数据所需的高强度计算,结合新一代网络技术的软件体系结构研究将在语言工程领域发挥日益重要的作用。本文对基于...
冯冲
陈肇雄
黄河燕
关真珍
关键词:
WEB服务
软件体系结构
文献传递
基于半督导机器学习的分词算法的设计与实现
词是最小的能独立运用的语言单位,汉语、日语等东方语言的一个显著特点是文本中词与词之间没有显式的分隔标记。因此,分词在机器翻译、信息检索、文本分类等中文信息处理的各项任务中都发挥着基础性的重要作用。 研究工作具有以下特点...
关真珍
关键词:
最大期望算法
分词算法
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张