李佐 作品数:12 被引量:132 H指数:6 供职机构: 南京大学 更多>> 相关领域: 自动化与计算机技术 社会学 经济管理 天文地球 更多>>
计算机读图技术研究 蔡士杰 宋继强 曹阳 路通 杨若瑜 苏丰 陈克彰 李恒 王姝华 张习文 邹荣金 李佐 胡笳 蔡敏 杨大纲 王仪科 杨华飞 本项目提出了一种全新的“对象式逐步简化的矢量化模型”,有效地解决了工程图矢量化中处理线线相交、字线相交和字线粘连的难题。提出了以特征方向为指导的直线和圆弧的象素跟踪方法,克服了现有线条识别方法因为相交、粘连造成线条的分段...关键词:关键词:矢量化 计算机读图 连通区的页面分割与分类方法 被引量:6 2002年 页面分割与分类是文档处理的关键步骤 ,但目前多数方法对页面的块和倾斜进行了限制 .文中提出一种新的基于连通区的页面分割与分类方法 .首先采用快速算法抽取页面内的连通区 ,然后利用改进的 RL SA算法分割页面 ,并根据连通区的分布情况以及块的特征对块进行分类 .该方法将页面分割与分类紧密结合 ,充分考虑到块的局部特征 ,保证块分类的正确性 。 王姝华 曹阳 李佐 蔡士杰关键词:文档处理 页面分割 PLSA 图像处理 计算机 基于遗传算法的以线段和圆弧为基元的曲线拟合 被引量:30 2002年 采用线段和圆弧作逼近基元是数字曲线拟合中的一个难点 ,文中给出一种基于改进遗传算法的拟合方法 .通过对点列进行二进制编码 ,以拟合段数较少和拟合误差较小为优化目标 ,变异概率和交叉概率自适应生成 ,并根据相关知识控制分界点间隙 ,所得最优解中值为 1的基因对应数字曲线的分界点 .对线段与圆弧相交和相切以及具有噪声等多种情况进行检测 ,可同时提取尖点和切点 ,还可得到逼近基元及其之间关系 ,较好地解决了用线段和圆弧拟合曲线问题 . 张习文 李佐 蔡士杰 欧宗瑛关键词:遗传算法 线段 圆弧 基元 计算机视觉 用于油藏描述的三维地质构造可视化处理 该文介绍了用于三维地质构造可视化处理的一些核心技术.首先,介绍了采用克里金技术和空间分割技术的三维数据网格化方法,即将观测区域内某点的值看作是周围已知点对其影响的结果,然后通过编码的方法实现现空间区域的分割,然后在各个区... 李佐关键词:油藏描述 地质构造 基于特征行必要-充分性匹配的字符识别方法 被引量:14 2002年 字符识别系统的性能在很大程度上依赖于所选取的字符特征.提出了一种基于特征行必要-充分性匹配的OCR(optical character recognition)方法.该方法使用字符模板的特征行集,通过对待识字符位图进行必要性和充分性双向匹配来识别字符.并采用基线对齐归一化方法在特征匹配时准确定位,使识别率和识别速度都较为理想.同时,对字符位图特征行的交互选择、测试和调整等方法做了详细介绍.另外,还提出了字符骨架与位图重叠显示的方案,有效地提高了对识别结果校对的速度.最后,通过测试和比较,对识别效率进行了分析. 李佐 王姝华 蔡士杰关键词:计算机图形学 字符识别 特征抽取 基于最小二乘法的文档图像倾斜检测方法 被引量:17 2001年 在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节。本文提出了一个基于最小二乘法的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,将特征点用最小二乘法拟合出基线的方向,即为页面倾斜方向。同时,本文介绍了一种基于直线拟合的快速倾斜校正算法。实验证明,该算法速度快,准确度高。 王姝华 李佐 蔡士杰关键词:倾斜校正 文档图像 最小二乘法 图像处理 办公自动化 一种基于前端预测识别的粘连字符分割方法 被引量:28 2001年 在字符识别领域 ,对粘连字符的识别是一个被广泛关注的技术难点 ,未能准确分割粘连字符是产生识别错误的主要原因之一 .在总结已有方法的特点及不足的基础上 ,提出了基于前端预测识别来分割粘连字符的方法 .首先根据粘连字符图像的特征初步确定前端字符的候选字符集 ,并通过验证候选字符与前端字符图像匹配的必要条件进一步对其筛选 ,然后使用候选字符的屏蔽码自适应地提取前端字符图像 ,最后由分类器对提取结果加以验证 ,达到分割和识别粘连字符的目的 .该方法可以适应多种类型的粘连字符 ,准确性高 ,且在字符图像质量较差时具有较强的鲁棒性 . 李佐 王姝华 蔡士杰关键词:字符识别 抗干扰 基于直线连续性的页面倾斜检测与校正 被引量:31 2001年 在文档扫描过程中 ,输入的文档图像不可避免地会发生倾斜现象 ,而布局分析及字符识别算法对页面倾斜都十分敏感 ,因此倾斜检测和校正是文档分析预处理的重要环节 .文中提出了一个基于直线连续性的倾斜检测方法 .它将字符连通区包围盒底边中心点作为特征点 ,利用文本行中特征点与基线的关系 ,计算出基线的方向 ,即为页面倾斜方向 .接着 ,介绍了一种基于偏移值的倾斜校正方法 .实验证明 ,该算法速度快 ,准确度高 . 王姝华 李佐 蔡士杰关键词:文档处理 计算机 字符识别 文档识别与理解技术研究 文档识别与理解是指将纸质文档扫描输入计算机后,对所得扫描位图加以分析、识别并生建其逻辑内容的过程.重建的内容即为电子文档.电子文档在保存、检索、修改以及数据交换等方面具有纸质文档不可比拟的优点,将纸质文档转化为了电子文档... 李佐关键词:字符识别 标书文档识别处理系统VHTender的设计与实现 2003年 本文介绍了英文标书文档处理系统VHTender的设计和实现过程,该系统能够从纸质标书的扫描图象中抽取文档信息将其转换成电子标书。本文从功能实现的角度,介绍了该系统在一些关键性技术中所采用的方法和策略。 李佐 王姝华 余波 蔡士杰关键词:办公自动化系统 电子文档 字符识别