搜索到160篇“ 模式抽取“的相关文章
- 一种高速公路不合格绿通车模式抽取方法
- 本申请涉及大数据技术领域,公开了一种高速公路不合格绿通车模式抽取方法,包括:A.数据获取并对所获取的数据进行预处理,以构建有效数据集;B.实体定义及标注;C.构建BERT‑BiLSTM‑CRF模型进行文本数据集的命名实体...
- 陈娇娜 张瑾张静
- 一种基于文本生成的电力生产知识多模式抽取方法
- 本发明公开了一种基于文本生成的电力生产知识多模式抽取方法,包括:收集电力生产文本数据,并定义知识模式schema,完成知识标注;将目标生产文本数据进行SEL结构化转换,并添加额外的语义角色,随后向SEL结构化后的目标生产...
- 艾力黄睿张远来汪庆宁刘兴龙
- 一种基于短语相似度的攻击模式抽取方法
- 本发明涉及一种基于短语相似度的攻击模式抽取方法,属于信息安全技术领域。本发明能够从非结构化威胁情报文本中提取出特定的攻击模式,即攻击者对于目标所使用的攻击方法的抽象,并将其映射到ATT&CK矩阵,能够更准确地提取...
- 薛晓萱李宁郭敏韩磊闫子淇陈志桓琦
- 基于并行计算的时间序列区分模式抽取方法、系统及介质
- 本发明公开了一种基于并行计算的时间序列区分模式抽取方法、系统及介质,本发明方法包括确定数据集D和候选序列集S;通过GPU进行DTW距离计算得到距离计算结果F并将其存储在全局内存中;将数据集D中时间序列的数量N大于设定值,...
- 邓仰东赵斯杰姜友友肖罡杨迪刘小兰杨钦文万可谦
- 基于主动学习的领域知识多模式抽取框架
- 2022年
- 随着信息抽取与知识结构化技术的快速发展与应用,快速的抽取出结构化的领域知识(structured domain knowledge,SDK)已经成为企业软件应用的迫切需求.然而,结构化领域知识的快速抽取仍然存在问题:(1)领域模型语料往往比较稀少,AI模型抽取效果比较差.(2)语料标注工作量庞大,无法短时间内找到并标注质量高的样本,快速提升模型效果.(3)在不同领域知识需求下,抽取定制化策略与代码多样,难以复用,导致面对一个新领域,系统自动化抽取知识效率低下,无法快速的上线并应用.为解决上述问题,本文提出了基于主动学习的领域知识多模式抽取框架(Active Learning Based Domain Knowledge Multi-mode Extract Framework,以下简称ADKE),其中包括:领域词典、正则表达式模板、AI模型和规则引擎的多模式知识抽取,基于主动学习方式的词典和未标注样本选择优化策略,以此提升AI模型语料标注效率,并进一步的提升知识抽取效率,完成该框架应用与进化的闭环.通过实际项目的应用落地,验证了该框架可以有效地优化系统冷启动、数据低资源问题,提高新领域知识的抽取效率,降低开发复杂度.
- 文辉徐永林于敬
- 关键词:领域词典规则引擎
- 无线视频共享系统中基于相似播放模式抽取的共享方法
- 无线视频共享系统中基于相似播放模式抽取的共享方法,包括:S1、视频服务器根据节点改变视频播放点的行为感知节点对视频内容的兴趣程度;S2、视频服务器根据所有节点对同一视频内容的兴趣程度抽取出若干个播放模式,并根据播放模式对...
- 贾世杰张瑞玲林春杰张永新郭凯尚莞璐赵晖李哲宏
- 文献传递
- 一种基于约束依赖性分析的RDFS模式抽取方法被引量:3
- 2020年
- 为了验证RDFS(resource description framework schema)本体的正确性所执行的推理是一项计算开销很大的任务,该任务在附加约束存在的条件下变得更加复杂.提出了一种旨在不改变推理结果的前提下,对RDFS模式进行抽取的方法.该方法基于对约束间的依赖关系进行分析.为了获取RDFS模式的精确语义,首先,将模式元素和约束形式化为一阶谓词逻辑中的析取嵌入依赖;接着,根据约束间的相互影响建立约束依赖图,在此基础上,提出了删除与推理任务无关的边和节点的策略;最后,通过重构造过程获取RDFS子模式.该方法使得推理验证可以在抽取后的小规模本体上进行.实验结果显示,该方法可以显著地提高RDFS本体验证过程的效率,抽取过程的平均耗时为0.60s,与推理检测时间相比几乎可以忽略,而获得的效率提升则为2.00倍~22.97倍不等.
- 赵晓非史忠植田东平刘建伟
- 关键词:DESCRIPTION本体抽取
- 面向共指事件识别的同义表述模式抽取研究被引量:2
- 2020年
- 在共指消解领域,目前已经有大量研究工作围绕实体共指问题展开,而有关事件共指方面的研究则相对较少。由于事件表述的灵活性,共指事件识别的研究重点之一在于如何构建事件表述相似度的计算模型。而在对同一事件的相似表述中,不仅包含词级别的同义表述,还包含语句级别的同义表述。针对该状况,本文基于新闻报道语料的特点,一方面针对词级别同义表述模式的抽取,设计了同义词知识库的自动构建策略,并考虑了缩略语、同位语等情况的处理;另一方面在词级别同义表述模式抽取的基础上,设计了语句级别同义表述实例的识别策略,进而可以抽取同义表述模式并剔除模式中的冗余成分。通过在实际数据集合上的实验,表明了本文策略的有效性。基于抽取到的词级别和语句级别的同义表述模式,可以有效提升共指事件识别的效果;本文工作也可以视为对共指事件识别现有策略的有益补充。
- 王君泽宋小炯杜洪涛
- 关键词:共指消解同义词识别
- 基于sentence2vec与半监督算法的中文问答提问模式抽取
- 2019年
- 关系抽取是信息抽取中的一项重要任务。在处理问答对形式的文本时,除了文本中实体间的关系抽取之外,作为连接问句与答句之间关系的提问模式同样需要抽取。通过有监督的标注算法(条件随机场)与基于模板元组自举的半监督算法的结合在抽取实体间关系时有不错的表现,但传统半监督中发现句式模板的方式难以迁移到提问模式抽取中。针对这种情况,通过引入句向量计算文本相似度并选取句式模板,提出一种基于sentence2vec技术与半监督算法结合的模型。对于最终实验,采用随机抽样进行验证。实验结果表明,相较于传统的半监督算法,该方法得到了更高的准确率和召回率。
- 张金壬章韵王宇
- 关键词:关系抽取提问模式条件随机场自举
- 无线视频共享系统中基于相似播放模式抽取的共享方法
- 无线视频共享系统中基于相似播放模式抽取的共享方法,包括:S1、视频服务器根据节点改变视频播放点的行为感知节点对视频内容的兴趣程度;S2、视频服务器根据所有节点对同一视频内容的兴趣程度抽取出若干个播放模式,并根据播放模式对...
- 贾世杰张瑞玲林春杰张永新郭凯尚莞璐赵晖李哲宏
- 文献传递
相关作者
- 蒙德龙

- 作品数:4被引量:17H指数:3
- 供职机构:上海大学计算机工程与科学学院
- 研究主题:半结构化数据 模式抽取 OEM 查询 P2P网络
- 何莹

- 作品数:6被引量:6H指数:2
- 供职机构:泰州师范高等专科学校
- 研究主题:信息检索 网络信息集成 XML 关系数据库 模式抽取
- 林春杰

- 作品数:43被引量:76H指数:5
- 供职机构:洛阳师范学院
- 研究主题:视频共享 视频资源 查询效率 车辆 车联网
- 潘顺

- 作品数:7被引量:37H指数:3
- 供职机构:东南大学计算机科学与工程学院
- 研究主题:XML 数据库 结构化数据 语义约束 半结构化数据
- 冯鹏展

- 作品数:2被引量:0H指数:0
- 供职机构:沈阳航空航天大学
- 研究主题:模式抽取 查询扩展 信息过滤 基于网络 基于WEB