罗明
- 作品数:5 被引量:53H指数:4
- 供职机构:上海财经大学信息管理与工程学院更多>>
- 发文基金:上海市科技人才计划项目上海市“科技创新行动计划”上海市科学技术委员会科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于词汇-语义模式的金融事件信息抽取方法被引量:17
- 2018年
- 信息抽取是自然语言处理工作中的重要任务之一。针对由于自然语言的多样性、歧义性和结构性而导致的信息抽取困难的问题,提出了一种面向金融事件信息抽取的层次化词汇-语义模式方法。首先,定义了一个金融事件表示模型;然后应用基于深度学习的词向量方法来实现自动生成同义概念词典;最后采用基于有限状态机驱动的层次化词汇-语义规则模式实现了对各类金融事件信息自动抽取的目标。实验结果表明,所提方法可以从金融新闻文本中准确地抽取出各类金融事件信息,并且对26类金融事件的微平均识别准确率达到93.9%,微平均召回率达到86.9%,微平均F1值达到90.3%。
- 罗明黄海量
- 关键词:信息抽取金融事件概念词典
- 一种基于语义标注特征的金融文本分类方法被引量:9
- 2018年
- 针对基于词袋的机器学习文本分类方法所存在的高维度、高稀疏性、不能识别同义词、语义信息缺失等问题,和基于规则模式的文本分类所存在的虽然准确率较高但鲁棒性较差的问题,提出了一种采用词汇—语义规则模式从金融新闻文本中提取事件语义标注信息,并将其作为分类特征用于机器学习文本分类中的新方法。实验证明采用该方法相比基于词袋的文本分类方法在采用相同的特征选择算法和分类算法的基础上,F1值提高8.6%,查准率提高7.7%,查全率提高8.8%。本方法融合了知识驱动和数据驱动在文本分类中的优点,同时避免了它们所存在的主要缺点,具有显著的实用性和研究参考价值。
- 罗明黄海量
- 关键词:文本分类语义标注有限状态机
- 基于语义分析的金融事件文本挖掘研究
- 互联网时代,来自互联网综合门户网站(例如:新浪、腾讯等)和垂直门户网站(例如:东方财富、和讯网、巨潮资讯)的各类财经新闻、政策法规、财务报告等正规新闻资讯信息已经成为影响机构投资者和个人投资者进行股票、期货、债券等交易决...
- 罗明
- 关键词:语义分析信息提取知识图谱
- 一种基于有限状态机的中文地址标准化方法被引量:14
- 2016年
- 由于中文的内涵多义性和形式多样性的特点,使中文地址长期以来存在着难以标准化的问题,对进一步开展地址定位、区域网格分析和社情、舆情定位等工作都造成了较大的障碍。针对这个问题提出了基于地址分级模型和有限状态机驱动的新方法,并通过软件开发对这种方法的地址识别率和匹配准确率进行了验证,实验结果显示该方法对中文地址能够达到96%左右的识别率,匹配准确率也达到了85%左右,并且还能实现标准地址库的自动化更新。因此,采取该方法能够有效地解决中文地址标准化困难的问题,具有显著的实用性和研究参考价值。
- 罗明黄海量
- 关键词:中文地址有限状态机
- 基于加权频繁模式树的通信网络告警规则挖掘方法被引量:13
- 2016年
- 传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则自动挖掘方法,将原始告警数据按时间窗口方式进行分段处理,通过BP神经网络、支持向量机、层次分析法生成告警设备的权重信息,并采用WFP-tree算法自动挖掘加权频繁项集。实验结果表明,与传统Apriori和FP-growth算法相比,WFP-tree算法在通信网络告警分析方面具有更好的频繁项压缩效果及更强的重要关联规则发现能力。
- 罗明孟传伟黄海量
- 关键词:关联规则加权频繁项集FP-GROWTH算法