2025年1月4日
星期六
|
欢迎来到海南省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
胡东东
作品数:
2
被引量:36
H指数:1
供职机构:
中国人民大学信息学院
更多>>
发文基金:
教育部科学技术研究重点项目
教育部“优秀青年教师资助计划”
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
孟小峰
中国人民大学信息学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
会议论文
领域
2篇
自动化与计算...
主题
2篇
语义块
2篇
树结构
2篇
WEB
2篇
抽取
2篇
抽取方法
机构
2篇
中国人民大学
作者
2篇
孟小峰
2篇
胡东东
传媒
1篇
计算机研究与...
年份
2篇
2004
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种基于树结构的Web数据自动抽取方法
介绍了一种基于树结构的自动从HTML页面中抽取数据的方法.在HTML页面的树形结构之上,提出了基于语义块的HTML页面结构模型:HTML页面中的数据值主要存在于语义块中,不同的HTML页面的主要区别在于语义块的区别.基于...
胡东东
孟小峰
关键词:
WEB
抽取
树结构
语义块
文献传递
一种基于树结构的Web数据自动抽取方法
被引量:36
2004年
介绍了一种基于树结构的自动从HTML页面中抽取数据的方法 在HTML页面的树形结构之上 ,提出了基于语义块的HTML页面结构模型 :HTML页面中的数据值主要存在于语义块中 ,不同的HTML页面的主要区别在于语义块的区别 基于语义块的结构模型 ,自动抽取通过 4个步骤完成 :通过HTML页面比较发现语义块 ;区分语义块中数据值的角色 ;推导数据模式和推导抽取规则 在实际HTML页面上的实验已经证明 ,这种方法能够达到较高的正确率 ,同时 ,随着文档的增大 。
胡东东
孟小峰
关键词:
WEB
抽取
树结构
语义块
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张