叶苏南
- 作品数:3 被引量:34H指数:2
- 供职机构:华南理工大学计算机科学与工程学院更多>>
- 发文基金:广东省自然科学基金广州市科技攻关项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于平行坐标的聚类过程可视化的研究与实现
- 可视化数据挖掘技术是数据挖掘技术和可视化技术的有机融合,这种融合使得数据挖掘技术的应用更加直观和形象,它将人们的认知能力、创造性、领域知识同数据挖掘过程相结合,并充分发挥两者的优势,即体现了用户的核心作用,又提高了数据挖...
- 叶苏南
- 关键词:数据挖掘可视化数据挖掘
- 文献传递
- 基于MVC架构的数据挖掘平台的设计与实现被引量:9
- 2010年
- 为了增强数据挖掘软件各功能模块的可扩展性和复用性,分析了现有数据挖掘工具的优缺点,并综合考虑数据挖掘过程的实际特点,提出了一个基于MVC架构的数据挖掘平台设计方案。在此基础上,利用Eclipse plug-in,RCP,GEF等技术,实现了一个数据挖掘平台原型系统。该平台遵循CRISP-DM过程标准,在软件架构上实现了低耦合、高复用,为用户提供了一个友好、灵活、易重用、可扩展的数据挖掘应用环境。
- 叶苏南彭宏覃姜维
- 关键词:数据挖掘软件复用ECLIPSE插件模型-视图-控制器
- 基于DOM树的可适应性Web信息抽取被引量:24
- 2009年
- Web信息抽取通常采用的是一种归纳学习方法,从给定的训练样本网页中学习到抽取规则,这种方法虽然能够准确地抽取出信息,但是当网站的模版发生改变后,必须重新获得抽取规则,因而这种抽取器的维护成本比较高,可适应性差。提出一种新的可适应性Web信息抽取方法,该方法首先通过聚类方法获取商品在网页中频繁出现的关键词组,然后利用网页的DOM树结构来确定包含这些关键词的信息块,从而实现Web信息的自动抽取。对大量商业网站进行信息抽取的实验表明,该算法不仅能有效抽取出商品信息,而且是一种与站点结构无关的可适应性信息抽取方法。
- 李朝彭宏叶苏南张欢杨亲遥
- 关键词:DOM树信息抽取可适应性