搜索到131 篇“ 术语自动抽取 “的相关文章
生成式情报学术语 自动 抽取 与多维关联知识挖掘研究 2024年 情报学术语 承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语 对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动 术语 抽取 替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语 抽取 方法(generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取 式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取 情报学术语 。对于抽取 结果,本文进一步开展了情报学领域术语 发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语 自身、术语 间关联、时间信息等维度,对术语 的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语 角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语 抽取 实验中的表现超越了全部13种主流生成式和抽取 式模型,展现出较强的小样本学习能力,为领域信息抽取 提供了新的思路。 胡昊天 邓三鸿 孔玲 闫晓慧 杨文霞 王东波 王东波关键词:术语自动抽取 面向农业领域的中文专利术语 自动 抽取 研究 呼文秀面向军事领域的土耳其语术语 自动 抽取 研究 2022年 文章以土耳其语军事领域术语 语言特征研究为基础,提出一种规则与统计相结合的术语 抽取 方法,先后通过关键词、停止词、形态分析序列模式、点互信息、左右信息熵和临接词缀等特征对单语文本中的候选项进行筛选,在W-data和N-data大小两组单语文本中进行实验,结果表明该方法能够有效地从实验数据中抽取 土耳其语军事术语 。 张贵林 易绵竹 李宏欣 闫丹辉 孙玥莹基于语言特征和复合测量的农业术语 自动 抽取 研究 被引量:2 2022年 术语 是语料库、机器翻译、人工智能实时翻译建设的基础,但传统术语 抽取 方法存在不全面、错误率高的问题。即便是采用人工抽取 的方式,除了耗时耗力难以适应大数据时代社会化大生产的要求,也存在不同的专家观点不一致的问题。从术语 的语言特征和复合测量方法出发,综合使用词性特征数值、词长比特征数值、C值法和词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)数值抽取 术语 。同时,以农业领域的语料为例进行术语 抽取 ,实验结果表明:本文方法抽取 的术语 精确度和召回率都较高,能有效提高术语 抽取 的准确率。 周志浩 李建波关键词:语言特征 农业领域 一种基于异常子图检测的领域术语 自动 抽取 方法 本发明公开一种基于异常子图检测的领域术语 自动 抽取 方法。首先,对文本数据进行预处理操作并进行词性标注;通过n‑gram方法和/或语法规则来选取所有可能的词语,并使用停用词和词频进行过滤;构建网络,将选出的候选术语 集合作为节... 李存壮 武南南 王文俊文献传递 非物质文化遗产传统音乐术语 自动 抽取 被引量:16 2020年 【目的】围绕实体识别任务实现以传统音乐为对象的非物质文化遗产术语 抽取 。【方法】构建基于中国非物质文化遗产网的国家级非物质文化遗产代表性项目的术语 标注语料库,并基于CRF模型、LSTM模型、LSTM-CRF模型、BERT模型构建实体识别框架。【结果】通过性能对比得知,采用BERT模型进行术语 抽取 取得了最好的效果,平均F1值达91.77%。【局限】仅对独有术语 进行抽取 ,且训练集偏小。【结论】基于BERT的实体识别模型能够较好地完成传统音乐术语 的自动 抽取 任务,为非物质文化遗产相关研究提供可靠借鉴。 刘浏 秦天允 王东波关键词:非物质文化遗产 术语抽取 英汉双语术语 自动 抽取 工具效率对比实验报告 高效的计算机辅助翻译在很大程度上取决于高质量的翻译记忆库和术语 库。双语术语 自动 抽取 是构建大规模双语术语 库的关键步骤。探讨双语术语 的自动 抽取 方法、完善现有双语术语 自动 抽取 工具成为计算机辅助翻译研究的重要内容。 本研究以“... 张冠东关键词:自动抽取 计算机辅助翻译 文献传递 一种具有扫描功能的长术语 自动 抽取 装置 本发明公开了一种具有扫描功能的长术语 自动 抽取 装置,装置包括:壳体,壳体上具有输入接口和输出接口;控制板,其设置在壳体内,并且控制板中包括:主控制器和通过主控制器发出信号进行控制的图像扫描控制电路;图像扫描控制电路包括:可... 隽会云文献传递 《习近平谈治国理政》双语术语 自动 抽取 效率对比实验报告 计算机辅助翻译工具广泛应用于翻译实践中,不仅能够提高译员的工作效率,还能保证译文质量.术语 管理是计算机辅助翻译非常重要的一项内容,在翻译实践中发挥着日趋重要的作用.术语 抽取 是术语 管理的第一步,其效率高低关乎整个术语 管理工... 张贝贝关键词:政治文本 文献传递 基于术语 自动 抽取 的科技文献翻译辅助系统的设计 被引量:4 2017年 设计了一种中韩科技信息综合平台中的翻译辅助系统.首先,依据关键词确定的组词特证获取候选术语 ,并使用互信息评估候选术语 以实现术语 自动 提取.其次,将已有术语 、抽取 到的新术语 、术语 译文和历史翻译记录等信息存储到系统数据库中建立术语 库.最后,设计翻译工作者的用户接口,使其通过该接口获取已有术语 的译文信息、新术语 的相似译文信息和译文记忆库为基础的历史翻译数据.测试结果表明,本文设计的术语 自动 抽取 功能和辅助译文生成功能达到了预定的设计目标,术语 自动 抽取 算法召回率达到61.8%,结合优化方法进行优化后达到66.9%;辅助译文生成平均延时为0.031s,MRR为0.951,测试结果满足用户需求. 黄政豪 崔荣一关键词:术语抽取
相关作者
张海军 作品数:53 被引量:224 H指数:7 供职机构:新疆师范大学计算机科学技术学院 研究主题:谣言 中文分词 情感分析 未登录词 卷积 张二艳 作品数:2 被引量:5 H指数:1 供职机构:哈尔滨工业大学计算机科学与技术学院 研究主题:似然比 术语自动抽取 信息熵 C-VALUE VALUE 刘建舟 作品数:22 被引量:72 H指数:5 供职机构:湖北工业大学 研究主题:网络 句子相似度 知网 基于语义 文本分类 王东波 作品数:217 被引量:1,222 H指数:20 供职机构:南京农业大学 研究主题:条件随机场 典籍 古文 人文 古籍 何婷婷 作品数:144 被引量:829 H指数:18 供职机构:华中师范大学 研究主题:语料 中文信息处理 自动文摘 自然语言处理 HOWNET