江苏省教育厅自然科学基金(L0112419925)
- 作品数:3 被引量:10H指数:2
- 相关作者:王加俊黄贤武郭玮玮仲兴荣徐艳更多>>
- 相关机构:苏州大学东南大学更多>>
- 发文基金:江苏省教育厅自然科学基金国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 文本页面图像的图文分割与分类算法被引量:6
- 2004年
- 为了能对包含不规则图片区和表格的倾斜文本页面图像进行图文分割与分类 ,提出了一种新的图文分割和分类算法。该算法先采用数学形态学和分级霍夫变换来进行文本倾斜的检测和校正 ;然后为了使算法能够对包含不规则图片区的文本页面图像进行处理 ,提出在传统的投影轮廓切割算法中 ,引入中点切割的过程 ,以便利用一系列的矩形来近似地逼近不规则的图片区。对于分割后的图像 ,则提出利用黑白像素比 (Rbw)和近邻像素间的交叉相关性 (Rcc)两个特征来作为分类的判据。实验结果证明 ,算法速度快、可靠性高。该算法只适用于二值图像。
- 王加俊黄贤武郭玮玮仲兴荣
- 关键词:文本图像形态学霍夫变换二值图像电子文件
- 使用拼贴误差直方图的分形图像检索被引量:4
- 2006年
- 拼贴误差是值域块与“最匹配的”定义域块相似性的一个度量,然而很多基于分形编码参数的分形图像检索技术却忽略了拼贴误差。该文使用拼贴误差直方图作为检索条件,来判定图像的相似度。对有200多张纹理图像的数据库的实验显示,该方法不仅减少了计算的复杂度,而且也有一定的检索准确率。
- 徐艳王加俊
- 关键词:拼贴误差直方图
- 表格文本图像中文字的提取算法被引量:1
- 2004年
- 提出了一种从含有表格的文本图像的页面中提取文字的算法。该算法通过模板扫描形成包围图像前景像素的矩形框 ,从而提取出前景像素 ,进而组合矩形框形成模式链。利用模式的最大黑游程、长、宽三个统计特征实现对模式的分类。实验结果表明 ,该算法不仅对普通的表格有效 ,而且还可以从倾斜的表格及流程图中成功地提取出文字。本算法只适用于二值图像。
- 王加俊李艳玲黄贤武何振亚
- 关键词:文本图像文字二值图像游程中文