毛存礼
- 作品数:173 被引量:189H指数:8
- 供职机构:昆明理工大学更多>>
- 发文基金:国家自然科学基金云南省自然科学基金云南省中青年学术和技术带头人后备人才项目更多>>
- 相关领域:自动化与计算机技术文化科学语言文字理学更多>>
- 结合词向量和Bootstrapping的领域实体上下位关系获取与组织被引量:6
- 2018年
- 实体上下位关系是构建领域知识图谱不可或缺的一种重要的语义关系,传统抽取上下位关系的方法大多不考虑关系的组织。提出一种结合词向量和Bootstrapping的方法来实现领域实体上下位关系的获取与组织。首先,选取旅游领域的种子语料集;然后,采用基于词向量的相似度计算方法对种子集中包含的上下位关系模式进行聚类,筛选出置信度高的模式并对未标注语料进行上下位关系识别,得到候选关系实例,同时选择置信度高的关系实例加入到种子集中,进行下一轮的迭代,直到得到所有的关系实例;最后,根据领域实体上下位关系对的向量偏移并结合领域实体层级关系的特点,采用映射的学习方法进行领域实体层级关系组织。实验结果表明,与传统的方法相比,所提方法的F值提高了近10%。
- 马晓军郭剑毅线岩团毛存礼严馨余正涛
- 关键词:上下位关系关系抽取
- 基于BiLSTM-CNN的英缅双语平行句对抽取方法及装置
- 本发明涉及基于BiLSTM‑CNN的英缅双语平行句对抽取方法及装置,属于自然语言处理技术领域。本发明首先通过Muse工具预训练出双语词向量,然后利用缅甸语虚词和助词识别缅语的主谓宾的特点对句子进行功能标记,把每个词的句法...
- 毛存礼梁昊远余正涛张少宁张亚飞朱浩东
- 文献传递
- 受限域汉语问答系统普适性理论与方法研究
- 余正涛郭剑毅毛存礼线岩团邹俊杰吴则建张宜浩
- 基于国家基金和云南省基金重点项目,针对受限域汉语问答系统不同领域普适性问题,研究从非结构领域文本中自动获取知识单元及知识关系,解决不同领域问答对领域知识的需求问题;研究特定领域问句分类模型的领域迁移方法,解决问句分类在新...
- 关键词:
- 关键词:汉语问答系统
- 旅游领域实体答案的抽取被引量:2
- 2009年
- 提出一种基于模式匹配与命名实体识别相结合的领域答案抽取方法,该方法用答案模式串、答案模式权值和答案类型三要素来定义并构建答案模式库,结合旅游领域命名实体识别方法和模式匹配方法,实现了旅游领域实体答案的抽取。在旅游领域进行实体答案抽取实验,取得了较好的效果,其中召回率达88.78%,准确率达86.04%。
- 李桂兰余正涛毛存礼郭剑毅侯波线岩团
- 关键词:答案抽取命名实体识别
- 利用问句语义结构构建旅游领域数据库查询
- 2009年
- 为了提高数据库查询的准确率,提出一种利用问句语义结构构建领域自然语言数据库查询方法。该方法通过定义问句语义模板,借助领域知识,对领域问句进行语义分析,提取问句语义块,并通过语义模式匹配实现问句语义模板向SQL的转换,从而实现自然语言数据库查询。在云南旅游领域实验的结果表明,该方法取得了较好的效果。
- 王凤林余正涛毛存礼郭剑毅
- 关键词:自然语言查询数据库查询
- 融合语言特性的越南语兼类词消歧被引量:2
- 2019年
- 兼类词歧义直接影响词性标注的准确率。本文针对越南语兼类词歧义问题提出一种融合语言特性的越南语兼类词消歧方法。通过构建越南语兼类词词典和兼类词语料库,分析越南语的语言特征和兼类词特点,选取有效的特征集;然后利用条件随机场能添加任意特征等优点,在使用词和词性上下文信息的同时,引入句法成分和指示词特征,得到消歧模型。最后在兼类词语料上实验,准确率达到了87.23%。实验表明本文所提出的越南语兼类词消歧方法有效可行,可以提高词性标注正确率。
- 郭剑毅赵晨刘艳超毛存礼余正涛
- 关键词:语言特征条件随机场模型越南语
- 基于多层标注策略的跨境民族文化实体关系抽取方法及装置
- 本发明涉及基于多层标注策略的跨境民族文化实体关系抽取方法及装置,属于自然语言处理技术领域。跨境民族文化领域文本中实体关系特征主要体现在单个实体重叠关系、实体对重叠关系以及多个实体对关系,在文本中还存在大量的领域词语问题,...
- 毛存礼杨振平余正涛黄于欣高盛祥张勇丙
- 基于跨语言双语预训练及Bi-LSTM的汉-越平行句对抽取方法
- 本发明涉及跨语言双语预训练及Bi‑LSTM汉‑越平行句对抽取方法,属于自然语言技术领域。本发明首先收集汉越可比语料,从可比语料中抽取汉越平行句对。然后在预训练中需要一个汉越种子词典及大量汉越单语,通过将汉越双语映射到公共...
- 高盛祥刘畅余正涛毛存礼黄于欣王振晗
- 文献传递
- 汉语语言处理接口的集成与应用
- 汉语语言处理研究目前已经有很多成熟的底层处理接口,如分词、词性标注、词语相似度计算、句子相似度计算等,为了有效地利用这些接口资源,提出集成这些接口,采用JAVA开发平台,对这些接口进行二次封装,实现接口间的无缝调用,从而...
- 邓锦辉余正涛章程毛存礼郭剑毅
- 关键词:相似度计算
- 文献传递
- 基于音节切分和词切分联合学习的多任务泰语分词方法
- 本发明涉及基于音节切分和词切分联合学习的多任务泰语分词方法。本发明包括:预处理泰语文本数据集;使用窗口化的方式选择泰语字符特征和字符类别特征作为特征输入;之后利用注意力机制获得丰富的上下文特征;最后输出层使用线性变换和S...
- 线岩团王悦寒余正涛相艳毛存礼
- 文献传递