韩士雄
- 作品数:3 被引量:3H指数:1
- 供职机构:华北计算技术研究所更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种智能化的信息采集系统的研究与实现
- 信息采集系统一般需要用户手动设置采集规则,对采集结果不进行处理并返回大量信息。为了简化用户的操作并直接得到所需结果,提出了一种智能化信息采集系统。
- 高博朱东华韩士雄
- 关键词:信息采集网页识别智能化系统
- 文献传递
- 一种智能化的信息采集系统的研究与实现被引量:3
- 2009年
- 信息采集系统一般需要用户手动设置采集规则,对采集结果不进行处理并返回大量信息。为了简化用户的操作并直接得到所需结果,提出了一种智能化信息采集系统。面向专家信息的采集,基于搜索引擎,根据专家的姓名、工作单位和领域关键词,利用搜索引擎搜索与专家信息相关的网页,对网页文档进行规范化处理,并对网页的主体进行提取。经过语义相关度的计算来实现专家信息智能识别。测试结果显示,系统的采准率约为83.87%.
- 高博朱东华韩士雄
- 关键词:信息采集智能化网页识别
- 基于分布式工作流日志挖掘的流程识别算法
- 2011年
- 为了识别出分布式环境下工作流的执行流程,对分布式工作流管理系统进行了研究,通过对分布式工作流执行站点中XML格式的系统运行日志进行分析,提出了一种增量式工作流挖掘算法。该算法通过对大量工作流执行站点中的活动执行时间序列进行分析与合并,从而重构出分布式环境下的工作流模型。该算法主要由两个重要部分组成:一个是时间序列挖掘算法,用于从工作流执行日志中挖掘出活动间的执行时间序列;另一个是工作流程识别算法,在时间序列挖掘算法得出的活动执行时间序列基础上,识别出结构化的工作流模型。通过实例结果表明了该算法的有效性。
- 韩士雄
- 关键词:分布式工作流管理系统工作流挖掘事件日志时间序列