项〓导 (亿嘉和科技股份有限公司,江苏 南京〓210012) 摘要:为了实现机器人对数显仪表的准确、高效巡检,提出了一种基于几何布局分析的自动数字定位和识别方法。数显仪表显示的数字具有规则的几何布局,通过对数字的单像素边缘进行提取、截断和配对处理,并对边缘之间的相对布局关系进行分析,可以实现边缘的筛选和字符定位,进而实现准确的数字识别。实验结果表明,该方法的准确率高达99.5%,并且每张样本图片的识别时间只需要317 ms,能满足实时性要求,可用于巡检机器人对数显仪表的自动识读。 关键词:边缘提取;数字字符分割;几何布局;数字字符识别 中图分类号:TP24〓〓〓文献标识码:A〓〓〓文章编号:2095-509X(2021)11-0112-05
1〓相关研究 七段数码管是由多个发光二极管(LED)按照“8”字型规则排列并封装在一起实现数字显示功能的电子元器件,通过控制不同二极管段的亮和灭可以组合显示不同的字符,具有易于辨识、稳定可靠、节能等优点,在工业领域有着非常广泛的应用,例如在电网变电站和配电房内显示各类电气设备的工作状态[1]。图1给出了几种典型的数显仪表示例。近年来,随着电网智能化运维建设的推进,巡检机器人在电网中的应用也越来越广泛。而具备高准确率、高实时性的数显仪表数字自动识别算法的开发和应用,是实现机器人替代人工巡检、提高电网智能化水平的关键 [1-4]。
图1〓典型LED数显仪表示例 〓〓数显仪表数字字符识别算法通常由字符分割和识别两个核心模块构成。字符分割算法主要分为3种:1) 基于显著性检测的方法[1],即通过提取图像中的显著性区域,将字符从图像中分割出来。该方法只适用于单行数显仪表,并且无法识别液晶屏数显仪表中的字符(如图1(d)所示)。2) 基于模板匹配的方法[5],如利用相关匹配法以及模板区域与字符的相对位置关系来定位字符区域。该方法在图像存在光照或者仿射变化时,容易产生较大定位误差。3)基于二值化的方法[2,6-7],即通过局部或者全局阈值对图像进行二值化,再利用连通域分析分割出字符区域。该方法对光照变化较为敏感,并且阈值设置较为依赖人的经验。 字符识别的原理主要是利用待识别字符的几何布局信息和统计先验知识等来进行字符判定,包括基于模板匹配的识别算法[2]、穿针引线法[4]、基于卷积神经网络的分类算法[8]、提取字符特征向量并分类[9]等。文献[2]利用预先设计的字符模板实现字符识别,当字符存在亮度、尺度或者旋转变化时,容易误识别。文献[8]利用卷积神经网络对LED数字字符进行分类识别,该方法的字符识别精度很高,但是依赖大量学习样本对模型进行训练,并且对运行资源要求较高。 已有的字符定位和识别算法对仪表样式、光照及仿射变化或者算法运行资源等提出了较高要求。 机器人在巡检数显仪表时,受仪表安装方式、采集〖CM)〗
作者简介:项导(1989—),男,高级工程师,博士,主要研究方向为机器人仪表视觉识别、运动控制等 |