公共文化服务平台

2025年1月9日星期四

|

欢迎来到海南省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

唐黎: 作品数：2 被引量：2H指数：1; 供职机构：重庆大学计算机学院更多>>; 发文基金：中央高校基本科研业务费专项资金重庆市自然科学基金中国博士后科学基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

冯永重庆大学计算机学院
陈贞重庆大学计算机学院
贺迅重庆大学计算机学院
陈显勇重庆大学计算机学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇中文期刊文章

领域

2篇自动化与计算...

主题

1篇页面
1篇知识管理
1篇视觉
1篇中文
1篇中文分词
1篇中文分词算法
1篇自适
1篇自适应
1篇自适应算法
1篇文本
1篇文本处理
1篇分词
1篇分词算法
1篇CSS样式
1篇DEEP_W...
1篇DOM树
1篇查询

机构

2篇重庆大学

作者

2篇冯永
2篇唐黎
1篇陈显勇
1篇贺迅
1篇陈贞

传媒

2篇重庆大学学报...

年份

1篇2012
1篇2010

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

视觉与标签信息的Deep Web查询页面内容提取被引量：1: 2012年; 提出了一种结合页面视觉信息和标签信息来提取页面内容结构的方法——DVS。DVS首先通过分析页面的CSS样式信息、DOM树以获得页面的视觉信息和标签信息,初步得到页面的视觉树;然后利用树的路径相似算法,既考虑标签信息又考虑视觉信息来计算树中模块的相似性,对模块进行聚类,最终得到页面的视觉树,即页面的内容结构。DVS主要的特色在于从视觉信息和标签信息两方面来提取页面的内容结构;采用树形结构表示视觉信息,将分析视觉信息转换成分析'视觉属性'树。实验采用UIUC的TEL数据集,分别与WTS算法、VIPS算法进行了比较,文中算法可以获得更高的准确性。; 冯永唐黎; 关键词：DOM树 CSS样式

面向文本知识管理的自适应中文分词算法被引量：1: 2010年; 针对传统字典匹配分词法在识别新词和特殊词处理方面的不足,结合2元统计模型提出了面向文本知识管理的自适应中文分词算法——SACWSA。SACWSA在预处理阶段结合应用有限状态机理论、基于连词的分隔方法和分治策略对输入文本进行子句划分,从而有效降低了分词算法的复杂度;在分词阶段应用2元统计模型,结合局部概率和全局概率,完成子句的切分,从而有效地提升了新词的识别率并消除了歧义;在后处理阶段,通过建立词性搭配规则来进一步消除2元分词结果的歧义。SACWSA主要的特色在于利用'分而治之'的思想来处理长句和长词,用局部概率与全局概率相结合来识别生词和消歧。通过在不同领域语料库的实验表明,SACWSA能准确、高效地自动适应不同行业领域的文本知识管理要求。; 冯永贺迅唐黎陈显勇陈贞; 关键词：知识管理文本处理自适应算法

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@海南省图书馆 2014－2015 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张