搜索到131篇“ 术语自动抽取“的相关文章
生成式情报学术语自动抽取与多维关联知识挖掘研究
2024年
情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法(generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。
胡昊天邓三鸿孔玲闫晓慧杨文霞王东波王东波
关键词:术语自动抽取
面向农业领域的中文专利术语自动抽取研究
呼文秀
面向军事领域的土耳其语术语自动抽取研究
2022年
文章以土耳其语军事领域术语语言特征研究为基础,提出一种规则与统计相结合的术语抽取方法,先后通过关键词、停止词、形态分析序列模式、点互信息、左右信息熵和临接词缀等特征对单语文本中的候选项进行筛选,在W-data和N-data大小两组单语文本中进行实验,结果表明该方法能够有效地从实验数据中抽取土耳其语军事术语
张贵林易绵竹李宏欣闫丹辉孙玥莹
基于语言特征和复合测量的农业术语自动抽取研究被引量:2
2022年
术语是语料库、机器翻译、人工智能实时翻译建设的基础,但传统术语抽取方法存在不全面、错误率高的问题。即便是采用人工抽取的方式,除了耗时耗力难以适应大数据时代社会化大生产的要求,也存在不同的专家观点不一致的问题。从术语的语言特征和复合测量方法出发,综合使用词性特征数值、词长比特征数值、C值法和词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)数值抽取术语。同时,以农业领域的语料为例进行术语抽取,实验结果表明:本文方法抽取术语精确度和召回率都较高,能有效提高术语抽取的准确率。
周志浩李建波
关键词:语言特征农业领域
一种基于异常子图检测的领域术语自动抽取方法
本发明公开一种基于异常子图检测的领域术语自动抽取方法。首先,对文本数据进行预处理操作并进行词性标注;通过n‑gram方法和/或语法规则来选取所有可能的词语,并使用停用词和词频进行过滤;构建网络,将选出的候选术语集合作为节...
李存壮武南南王文俊
文献传递
非物质文化遗产传统音乐术语自动抽取被引量:16
2020年
【目的】围绕实体识别任务实现以传统音乐为对象的非物质文化遗产术语抽取。【方法】构建基于中国非物质文化遗产网的国家级非物质文化遗产代表性项目的术语标注语料库,并基于CRF模型、LSTM模型、LSTM-CRF模型、BERT模型构建实体识别框架。【结果】通过性能对比得知,采用BERT模型进行术语抽取取得了最好的效果,平均F1值达91.77%。【局限】仅对独有术语进行抽取,且训练集偏小。【结论】基于BERT的实体识别模型能够较好地完成传统音乐术语自动抽取任务,为非物质文化遗产相关研究提供可靠借鉴。
刘浏秦天允王东波
关键词:非物质文化遗产术语抽取
英汉双语术语自动抽取工具效率对比实验报告
高效的计算机辅助翻译在很大程度上取决于高质量的翻译记忆库和术语库。双语术语自动抽取是构建大规模双语术语库的关键步骤。探讨双语术语自动抽取方法、完善现有双语术语自动抽取工具成为计算机辅助翻译研究的重要内容。  本研究以“...
张冠东
关键词:自动抽取计算机辅助翻译
文献传递
一种具有扫描功能的长术语自动抽取装置
本发明公开了一种具有扫描功能的长术语自动抽取装置,装置包括:壳体,壳体上具有输入接口和输出接口;控制板,其设置在壳体内,并且控制板中包括:主控制器和通过主控制器发出信号进行控制的图像扫描控制电路;图像扫描控制电路包括:可...
隽会云
文献传递
《习近平谈治国理政》双语术语自动抽取效率对比实验报告
计算机辅助翻译工具广泛应用于翻译实践中,不仅能够提高译员的工作效率,还能保证译文质量.术语管理是计算机辅助翻译非常重要的一项内容,在翻译实践中发挥着日趋重要的作用.术语抽取术语管理的第一步,其效率高低关乎整个术语管理工...
张贝贝
关键词:政治文本
文献传递
基于术语自动抽取的科技文献翻译辅助系统的设计被引量:4
2017年
设计了一种中韩科技信息综合平台中的翻译辅助系统.首先,依据关键词确定的组词特证获取候选术语,并使用互信息评估候选术语以实现术语自动提取.其次,将已有术语抽取到的新术语术语译文和历史翻译记录等信息存储到系统数据库中建立术语库.最后,设计翻译工作者的用户接口,使其通过该接口获取已有术语的译文信息、新术语的相似译文信息和译文记忆库为基础的历史翻译数据.测试结果表明,本文设计的术语自动抽取功能和辅助译文生成功能达到了预定的设计目标,术语自动抽取算法召回率达到61.8%,结合优化方法进行优化后达到66.9%;辅助译文生成平均延时为0.031s,MRR为0.951,测试结果满足用户需求.
黄政豪崔荣一
关键词:术语抽取

相关作者

张海军
作品数:53被引量:224H指数:7
供职机构:新疆师范大学计算机科学技术学院
研究主题:谣言 中文分词 情感分析 未登录词 卷积
张二艳
作品数:2被引量:5H指数:1
供职机构:哈尔滨工业大学计算机科学与技术学院
研究主题:似然比 术语自动抽取 信息熵 C-VALUE VALUE
刘建舟
作品数:22被引量:72H指数:5
供职机构:湖北工业大学
研究主题:网络 句子相似度 知网 基于语义 文本分类
王东波
作品数:217被引量:1,222H指数:20
供职机构:南京农业大学
研究主题:条件随机场 典籍 古文 人文 古籍
何婷婷
作品数:144被引量:829H指数:18
供职机构:华中师范大学
研究主题:语料 中文信息处理 自动文摘 自然语言处理 HOWNET