带有边痕的喷码识别方法及系统.pdf

上传人:奻奴 文档编号:10122997 上传时间:2021-06-04 格式:PDF 页数:19 大小:859.02KB
收藏 版权申诉 举报 下载
带有边痕的喷码识别方法及系统.pdf_第1页
第1页 / 共19页
带有边痕的喷码识别方法及系统.pdf_第2页
第2页 / 共19页
带有边痕的喷码识别方法及系统.pdf_第3页
第3页 / 共19页
文档描述:

《带有边痕的喷码识别方法及系统.pdf》由会员分享,可在线阅读,更多相关《带有边痕的喷码识别方法及系统.pdf(19页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202011006929.7 (22)申请日 2020.09.23 (71)申请人 北京智通云联科技有限公司 地址 100020 北京市朝阳区慧忠北里219号 楼19幢六层601号 (72)发明人 么新新刘伟华张学龙谭培波 (74)专利代理机构 北京八月瓜知识产权代理有 限公司 11543 代理人 秦莹 (51)Int.Cl. G06K 9/32(2006.01) G06K 7/14(2006.01) (54)发明名称 带有边痕的喷码识别方法及系统 (57)摘要 本发明公开了一种。

2、带有边痕的喷码识别方 法及系统, 所述方法包括: 采集包装上的带有边 痕的喷码图像; 对喷码图像中的喷码区域进行定 位, 获取喷码区域的位置信息, 并根据喷码区域 的位置信息, 将喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差异的喷码区域图像; 将喷码区域图像输入到预先训练好的基于序列 识别的神经网络模型中进行识别, 获得与喷码区 域图像对应的喷码字符串。 本发明能够有效消除 影响喷码识别结果的因素, 提高喷码识别结果的 准确率。 权利要求书3页 说明书10页 附图5页 CN 112149668 A 2020.12.29 CN 112149668 A 1.一种带有边痕的喷码识别方法, 。

3、其特征在于, 包括: 采集包装上的带有边痕的喷码图像; 对所述喷码图像中的喷码区域进行定位, 获取所述喷码区域的位置信息, 并根据所述 喷码区域的位置信息, 将所述喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差 异的喷码区域图像; 将所述喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别, 获得与所述喷码区域图像对应的喷码字符串。 2.根据权利要求1所述的方法, 其特征在于, 所述方法进一步包括: 对所述基于序列识别的神经网络模型进行训练, 具体包括: 获取预先保存的字符类型、 喷码规则、 以及根据所述字符类型生成的单字符图像集; 根据所述喷码规则生成训练喷码字符串, 。

4、依次从所述训练喷码字符串的每个字符所对 应的单字符图像集中抽取该字符对应的图像, 对每个字符所对应的图像进行拼接, 得到所 述训练喷码字符串对应的训练喷码图像, 其中, 所述训练喷码图像中包括带有边痕的喷码 图像; 将所述训练喷码字符串和所述训练喷码图像输入所述基于序列识别的神经网络模型, 对所述基于序列识别的神经网络模型进行训练, 最终得到训练好的基于序列识别的神经网 络模型。 3.根据权利要求2所述的方法, 其特征在于, 根据所述字符类型生成单字符图像集具体 包括: 采集一定数量的包装上的喷码图像, 其中, 所述喷码图像中包括带有边痕的喷码图像; 对所述喷码图像中的喷码区域进行定位, 获取。

5、所述喷码区域的位置信息, 并根据所述 喷码区域的位置信息, 将所述喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差 异的喷码区域图像; 将所述喷码区域图像以字符为基准进行切割, 得到单字符图像, 并根据所述字符类型, 将所述单字符图像进行分组, 生成不同字符类型的单字符图像集。 4.根据权利要求3所述的方法, 其特征在于, 将所述喷码区域图像以字符为基准进行切 割具体包括: 根据所述喷码规则计算所述喷码区域图像所包含的字符个数n, 将所述喷码区域图像 的水平方向分成n份, 得到n-1个初始字符分界线; 根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域, 获得n-1条最终 字符分。

6、界线; 根据所述最终字符分界线对所述喷码区域图像进行水平方向的切割, 获取n个字符图 像; 根据用户的输入获取所述n个字符图像所对应的n个字符, 并将字符与字符图像进行关 联。 5.根据权利要求1或3所述的方法, 其特征在于, 对所述喷码图像中的喷码区域进行定 位, 获取所述喷码区域的位置信息, 并根据所述喷码区域的位置信息, 将所述喷码区域的上 下边界进行扩展, 获得边痕和喷码具有明显差异的喷码区域图像具体包括: 对所述喷码图像中的喷码区域进行定位, 并根据所述喷码区域的倾斜角度对所述喷码 权利要求书 1/3 页 2 CN 112149668 A 2 区域进行倾斜校正, 获取校正后的所述喷码。

7、区域的位置坐标; 根据所述喷码区域的位置信息, 计算喷码的整体宽度, 并从预先保存的喷码规则中获 取喷码字符的个数, 根据所述喷码的整体宽度和所述喷码字符的个数计算喷码的单字符宽 度; 根据所述单字符宽度确定延申长度, 根据所述延申长度将所述喷码区域的上下边界分 别向外延申, 并对上下边界的两个延申区域进行横线消除处理, 最终获得延申后的边痕和 喷码具有明显差异的喷码区域图像。 6.一种带有边痕的喷码识别系统, 其特征在于, 包括: 采集模块, 用于采集包装上的带有边痕的喷码图像; 处理模块, 用于对所述喷码图像中的喷码区域进行定位, 获取所述喷码区域的位置信 息, 并根据所述喷码区域的位置信。

8、息, 将所述喷码区域的上下边界进行扩展, 获得边痕和喷 码具有明显差异的喷码区域图像; 识别模块, 用于将所述喷码区域图像输入到预先训练好的基于序列识别的神经网络模 型中进行识别, 获得与所述喷码区域图像对应的喷码字符串。 7.根据权利要求6所述的系统, 其特征在于, 所述识别模块进一步包括: 训练子模块, 用于对所述基于序列识别的神经网络模型进行训练, 所述训练子模块具 体用于: 获取预先保存的字符类型、 喷码规则、 以及根据所述字符类型生成的单字符图像集; 根据所述喷码规则生成训练喷码字符串, 依次从所述训练喷码字符串的每个字符所对 应的单字符图像集中抽取该字符对应的图像, 对每个字符所对。

9、应的图像进行拼接, 得到所 述训练喷码字符串对应的训练喷码图像, 其中, 所述训练喷码图像中包括带有边痕的喷码 图像; 将所述训练喷码字符串和所述训练喷码图像输入所述基于序列识别的神经网络模型, 对所述基于序列识别的神经网络模型进行训练, 最终得到训练好的基于序列识别的神经网 络模型。 8.根据权利要求7所述的系统, 其特征在于, 所述训练子模块具体用于: 采集一定数量的包装上的喷码图像, 其中, 所述喷码图像中包括带有边痕的喷码图像; 对所述喷码图像中的喷码区域进行定位, 获取所述喷码区域的位置信息, 并根据所述 喷码区域的位置信息, 将所述喷码区域的上下边界进行扩展, 获得边痕和喷码具有明。

10、显差 异的喷码区域图像; 将所述喷码区域图像以字符为基准进行切割, 得到单字符图像, 并根据所述字符类型, 将所述单字符图像进行分组, 生成不同字符类型的单字符图像集。 9.根据权利要求8所述的系统, 其特征在于, 所述训练子模块具体用于: 根据所述喷码规则计算所述喷码区域图像所包含的字符个数n, 将所述喷码区域图像 的水平方向分成n份, 得到n-1个初始字符分界线; 根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域, 获得n-1条最终 字符分界线; 根据所述最终字符分界线对所述喷码区域图像进行水平方向的切割, 获取n个字符图 像; 权利要求书 2/3 页 3 CN 11214966。

11、8 A 3 根据用户的输入获取所述n个字符图像所对应的n个字符, 并将字符与字符图像进行关 联。 10.根据权利要求6或8所述的方法, 其特征在于, 所述处理模块和所述训练子模块具体 用于: 对所述喷码图像中的喷码区域进行定位, 并根据所述喷码区域的倾斜角度对所述喷码 区域进行倾斜校正, 获取校正后的所述喷码区域的位置坐标; 根据所述喷码区域的位置信息, 计算喷码的整体宽度, 并从预先保存的喷码规则中获 取喷码字符的个数, 根据所述喷码的整体宽度和所述喷码字符的个数计算喷码的单字符宽 度; 根据所述单字符宽度确定延申长度, 根据所述延申长度将所述喷码区域的上下边界分 别向外延申, 并对上下边界。

12、的两个延申区域进行横线消除处理, 最终获得延申后的边痕和 喷码具有明显差异的喷码区域图像。 11.一种带有边痕的喷码识别装置, 其特征在于, 包括: 存储器、 处理器及存储在所述存 储器上并可在所述处理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现 如权利要求1至5中任一项所述的带有边痕的喷码识别方法的步骤。 12.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有信息传 递的实现程序, 所述程序被处理器执行时实现如权利要求1至5中任一项所述的带有边痕的 喷码识别方法的步骤。 权利要求书 3/3 页 4 CN 112149668 A 4 带有边痕的喷码识别方法。

13、及系统 技术领域 0001 本发明涉及计算机技术领域, 尤其是涉及一种带有边痕的喷码识别方法及系统。 背景技术 0002 在现有技术中, 赋码监管是工厂生产中商品管理的一个重要环节, 喷码字符作为 常用的商品监管码, 其检测、 识别有着举足轻重的地位。 若采用人工进行喷码识别, 生产线 生产速度远大于人眼可接收的视觉变换速度, 例如, 蒙牛工厂中生产奶包的速度每秒可达 10-20包, 人眼无法做到快速识别进行有效剔除不合规商品, 随着机器学习以及计算机硬件 的高速发展, 可使用计算机视觉的方法解决这一难题。 在现有技术中, 喷码识别的采用以下 流程进行: 步骤1, 基于深度学习或传统图像处理的。

14、喷码定位; 步骤2, 对喷码定位进行优化; 步骤3, 进行喷码的OCR识别。 0003 不同商品的包装以及喷码位置是不同的, 因此喷码识别的方法存在差异。 针对包 装上有边痕且影响到喷码识别的情况, 一般采用的方法是先做边痕的消除, 然后再进行喷 码识别。 然而, 这种方法存在的以下问题: 0004 问题1, 喷码机进行赋码时, 因包装边痕处平面不平滑, 若有多余墨汁溅入边痕中, 会产生冗余的笔画, 当其和边痕附近的字符关联在一起时, 很容易导致边痕无法有效消除, 进而引起识别出错。 0005 问题2, 喷码机进行赋码时, 若有字符恰好位于边痕处, 进行边痕消除很容易导致 正常字符残缺化, 也。

15、会导致识别出错。 0006 因此, 目前亟须解决上述技术问题的技术方案。 发明内容 0007 本发明的目的在于提供一种带有边痕的喷码识别方法及系统, 旨在解决现有技术 中的上述问题。 0008 本发明提供一带有边痕的喷码识别方法, 包括: 0009 采集包装上的带有边痕的喷码图像; 0010 对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并根据喷码区域 的位置信息, 将喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差异的喷码区域 图像; 0011 将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别, 获得与喷码区域图像对应的喷码字符串。 0012 本发明提。

16、供一种带有边痕的喷码识别系统, 包括: 0013 采集模块, 用于采集包装上的带有边痕的喷码图像; 0014 处理模块, 用于对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并 根据喷码区域的位置信息, 将喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差 异的喷码区域图像; 说明书 1/10 页 5 CN 112149668 A 5 0015 识别模块, 用于将喷码区域图像输入到预先训练好的基于序列识别的神经网络模 型中进行识别, 获得与喷码区域图像对应的喷码字符串。 0016 本发明实施例还提供一种带有边痕的喷码识别装置, 包括: 存储器、 处理器及存储 在所述存储器上并可。

17、在所述处理器上运行的计算机程序, 所述计算机程序被所述处理器执 行时实现上述带有边痕的喷码识别方法的步骤。 0017 本发明实施例还提供一种计算机可读存储介质, 所述计算机可读存储介质上存储 有信息传递的实现程序, 所述程序被处理器执行时实现上述带有边痕的喷码识别方法的步 骤。 0018 采用本发明实施例, 通过将喷码区域的上下边界进行扩展, 强化了边痕与喷码字 符的差异, 解决了现有技术中先做边痕消除而后进行喷码识别带来的多余笔画或字符残缺 引起的识别不准的问题, 能够有效消除影响喷码识别结果的因素, 提高喷码识别结果的准 确率。 0019 上述说明仅是本发明技术方案的概述, 为了能够更清楚。

18、了解本发明的技术手段, 而可依照说明书的内容予以实施, 并且为了让本发明的上述和其它目的、 特征和优点能够 更明显易懂, 以下特举本发明的具体实施方式。 附图说明 0020 为了更清楚地说明本发明具体实施方式或现有技术中的技术方案, 下面将对具体 实施方式或现有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的 附图是本发明的一些实施方式, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前 提下, 还可以根据这些附图获得其他的附图。 0021 图1是本发明实施例的带有边痕的喷码识别方法的流程图; 0022 图2是本发明实施例的包装上的带有边痕的喷码的示意图; 0023 图。

19、3是本发明实施例的带有边痕的喷码识别方法的系统架构示意图; 0024 图4a是本发明实施例的采集的原始喷码图像的示意图; 0025 图4b是本发明实施例的表倾斜校正及喷码初始位置的示意图; 0026 图4c是本发明实施例的将喷码区域扩展后的喷码图像区域的示意图; 0027 图5是本发明实施例的单字符图片集的生成的示意图; 0028 图6是本发明实施例的喷码字符切割的示意图; 0029 图7是本发明实施例的单字符图片的示意图; 0030 图8是本发明实施例的带有边痕的喷码识别系统的示意图; 0031 图9是本发明实施例的带有边痕的喷码识别装置的示意图。 具体实施方式 0032 下面将结合实施例对。

20、本发明的技术方案进行清楚、 完整地描述, 显然, 所描述的实 施例是本发明一部分实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技 术人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范 围。 0033 在本发明的描述中, 需要理解的是, 术语 “中心” 、“纵向” 、“横向” 、“长度” 、“宽度” 、 说明书 2/10 页 6 CN 112149668 A 6 “厚度” 、“上” 、“下” 、“前” 、“后” 、“左” 、“右” 、“坚直” 、“水平” 、“顶” 、“底” 、“内” 、“外” 、“顺时 针” 、“逆时针” 等指示的方位或位置关系为基。

21、于附图所示的方位或位置关系, 仅是为了便于 描述本发明和简化描述, 而不是指示或暗示所指的装置或元件必须具有特定的方位、 以特 定的方位构造和操作, 因此不能理解为对本发明的限制。 0034 此外, 术语 “第一” 、“第二” 仅用于描述目的, 而不能理解为指示或暗示相对重要性 或者隐含指明所指示的技术特征的数量。 由此, 限定有 “第一” 、“第二” 的特征可以明示或者 隐含地包括一个或者更多个所述特征。 在本发明的描述中,“多个” 的含义是两个或两个以 上, 除非另有明确具体的限定。 此外, 术语 “安装” 、“相连” 、“连接” 应做广义理解, 例如, 可以 是固定连接, 也可以是可拆卸。

22、连接, 或一体地连接; 可以是机械连接, 也可以是电连接; 可以 是直接相连, 也可以通过中间媒介间接相连, 可以是两个元件内部的连通。 对于本领域的普 通技术人员而言, 可以具体情况理解上述术语在本发明中的具体含义。 0035 方法实施例 0036 根据本发明实施例, 提供了一种带有边痕的喷码识别方法, 在执行本发明实施例 之前, 首先需要预先对基于序列识别的神经网络模型进行训练, 具体包括如下处理: 0037 步骤1, 获取预先保存的字符类型(例如, 1, 3, a, b等均为一种字符类型)、 喷码规 则、 以及根据字符类型生成的单字符图像集; 具体地, 字符种类指喷码字符串中可能出现的 。

23、字符类型, 例如, 1, 2, a, b等; 喷码字符规则指喷码中单个字符组合成字符串的规则, 因同个 包装的商品上的喷码中字符的组合是由一定的含义和规则, 例如, 一般为产地代号+生产年 月日+产线代号+生产时分; 单字符图像集指每种类型的字符的图像集, 用于生成序列识别 神经网络模型训练时所需的训练语料。 在步骤1中, 根据字符类型生成单字符图像集具体包 括如下处理: 0038 步骤11, 采集一定数量的包装上的喷码图像, 其中, 喷码图像中包括带有边痕的喷 码图像; 0039 步骤12, 对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并根据喷 码区域的位置信息, 将喷码区域。

24、的上下边界进行扩展, 获得边痕和喷码具有明显差异的喷 码区域图像; 0040 步骤13, 将喷码区域图像以字符为基准进行切割, 得到单字符图像, 并根据字符类 型, 将单字符图像进行分组, 生成不同字符类型的单字符图像集。 0041 其中, 在步骤13中, 将喷码区域图像以字符为基准进行切割具体包括如下处理: 0042 步骤131, 根据喷码规则计算喷码区域图像所包含的字符个数n, 将喷码区域图像 的水平方向分成n份, 得到n-1个初始字符分界线; 需要说明的是, x轴方向的切割为水平方 向的切割, y轴方向的切割为垂直方向的切割。 0043 步骤132, 根据用户操作将初始字符分界线移动至相。

25、邻的两个字符的中间区域, 获 得n-1条最终字符分界线; 0044 步骤133, 根据最终字符分界线对喷码区域图像进行水平方向的切割, 获取n个字 符图像; 0045 步骤134, 根据用户的输入获取n个字符图像所对应的n个字符, 并将字符与字符图 像进行关联。 0046 步骤2, 根据喷码规则生成训练喷码字符串, 依次从训练喷码字符串的每个字符所 说明书 3/10 页 7 CN 112149668 A 7 对应的单字符图像集中抽取该字符对应的图像, 对每个字符所对应的图像进行拼接, 得到 训练喷码字符串对应的训练喷码图像, 其中, 训练喷码图像中包括带有边痕的喷码图像; 0047 步骤3, 。

26、将训练喷码字符串和训练喷码图像输入基于序列识别的神经网络模型, 对 基于序列识别的神经网络模型进行训练, 最终得到训练好的基于序列识别的神经网络模 型。 0048 图1是本发明实施例的带有边痕的喷码识别方法的流程图, 得到了训练好的基于 序列识别的神经网络模型后, 如图1所示, 根据本发明实施例的带有边痕的喷码识别方法具 体包括: 0049 步骤101, 采集包装上的带有边痕的喷码图像; 0050 步骤102, 对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并根据 喷码区域的位置信息, 将喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差异的 喷码区域图像; 0051 步骤1。

27、03, 将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中 进行识别, 获得与喷码区域图像对应的喷码字符串。 0052 步骤102和神经网络模型训练时的步骤12具体包括如下处理: 0053 对喷码图像中的喷码区域进行定位, 并根据喷码区域的倾斜角度对喷码区域进行 倾斜校正, 获取校正后的喷码区域的位置坐标; 0054 根据喷码区域的位置信息, 计算喷码的整体宽度, 并从预先保存的喷码规则中获 取喷码字符的个数, 根据喷码的整体宽度和喷码字符的个数计算喷码的单字符宽度; 0055 根据单字符宽度确定延申长度, 根据延申长度将喷码区域的上下边界分别向外延 申, 并对上下边界的两个延申区域。

28、进行横线消除处理, 最终获得延申后的边痕和喷码具有 明显差异的喷码区域图像。 0056 以下结合附图, 对本发明实施例的上述技术方案进行详细说明。 0057 对于商品包装上带有边痕的喷码识别, 如图2所示, 由于边痕和喷码字符存在灰度 值、 高度的明显差异性, 可以利用深度学习模型在训练过程中自动学习样本数据的内存规 律, 自动习得喷码字符和边痕的差异性, 基于此, 发明实施例的技术方案提出了一种基于序 列识别的神经网络模型对带有边痕的喷码进行识别。 在本发明实施例中, 为了强化边痕与 喷码字符的差异, 在神经网络模型识别前将喷码区域的上下边界进行扩展, 并在神经网络 模型训练阶段生成大量带有。

29、边痕的训练语料。 0058 如图3所示, 本发明实施例的一个实例中, 带有边痕的喷码识别方法的系统结构可 以从上往下分为3层: 识别层、 模型层、 数据层。 其中, 识别层负责具体的应用部分, 具体操作 是进行喷码定位后, 进行喷码上下边界的扩展, 而后利用深度学习进行识别。 模型层用于训 练和提供基于序列识别的神经网络模型, 数据层提供模型层训练神经网络模型时所需要的 数据。 0059 下面首先对识别层的喷码识别处理进行详细说明。 0060 步骤1-1, 获取喷码图像: 0061 因商品的喷码区域多为黑色, 在实际应用中, 可采用黑白工业相机架设到生产线 上进行喷码图像的采集。 0062 步。

30、骤1-2, 进行喷码区域的定位: 说明书 4/10 页 8 CN 112149668 A 8 0063 在实际应用中, 可以采用基于文本检测深度学习模型或传统的图像处理方法进行 喷码区域的定位。 如图4a所示, 由于生产线上商品本身摆放不固定, 会导致在生产线上拍摄 到的喷码区域是倾斜的。 因此需要根据喷码区域的倾斜角度, 对步骤1-1采集的喷码图像进 行倾斜校正, 如图4b所示, 最终获取校正后的喷码图像以及喷码的位置坐标。 0064 步骤1-3, 进行喷码区域的扩展; 0065 如图2所示, 边痕和喷码的高度有明显差异, 为了使差异更加明显, 本发明实施例 将喷码区域上下边界进行扩展, 具。

31、体操作为: 首先, 进行单字符宽度的预估: 因每一条生产 线的喷码规则是固定的, 字符种类及字符个数也是固定的, 因此, 需要根据步骤1-2获取的 喷码区域来计算喷码宽度, 再将喷码宽度/字符个数计算得到预估的单字符宽度。 然后, 将 喷码区域上下边界进行扩展, 将步骤1-2输出的倾斜校正后的喷码图像中喷码区域的上下 边界分别向外延申至少一个字符的预估宽度, 且对两个延申的区域分别进行水平方向的腐 蚀膨胀从而消除横线。 如图4c所示, 最终输出上下边界扩展后的喷码区域图像。 0066 步骤1-4, 进行喷码识别, 即采用基于序列识别的神经网络模型进行喷码字符串的 识别。 0067 将步骤1-3。

32、输出的喷码区域图像输入到神经网络模型, 得到喷码字符串。 其中, 神 经网络模型采用的是用于序列识别的结构, 相比于单字符识别, 序列识别是指将图像识别 成字符串, 常见的用于序列识别的神经网络模型如CNN+RNN/LSTM/GRU+CTC。 0068 下面对于数字层进行详细说明: 0069 在数据层中, 包含字符种类、 喷码字符规则和单字符图像集, 字符种类指喷码字符 串中可能出现的字符类型, 例如, 1, 2, a, b等; 喷码字符规则指喷码中单个字符组合成字符 串的规则, 因同个包装的商品上的喷码中字符的组合是由一定的含义和规则, 例如, 一般为 产地代号+生产年月日+产线代号+生产时。

33、分; 单字符图像集指每种类型的字符的图像集, 用 于生成序列识别神经网络模型训练时所需的训练语料。 0070 其中, 单字符图像集的生成的具体步骤如图5所示, 具体包括: 0071 步骤2-1, 进行喷码图像的采集; 0072 由于商品包装边痕的位置是固定的, 为了使得每种类型字符的图像集均有包含边 痕的喷码图像, 需经过一定时间的采集及积累; 如针对某个类型的奶包, 边痕影响的字符一 般是日期中具体的某天, 一般需要进行连续10天的喷码图像收集。 0073 步骤2-2, 进行喷码区域图像集的获取; 0074 针对步骤2-1采集的喷码图像集的每张喷码图像, 进行喷码区域的处理, 进而获取 大量。

34、的喷码区域图像, 形成喷码区域图像集, 其中喷码区域的处理操作具体包括: 0075 步骤2-2-1, 进行喷码区域的定位: 0076 基于文本检测深度学习模型或传统的图像处理方法进行喷码区域的定位。 由于生 产线上商品本身摆放时可能是倾斜, 因此根据喷码区域的倾斜角度, 对喷码图像进行倾斜 校正, 最终获取校正后的喷码图像以及喷码的位置坐标。 0077 步骤2-2-2, 进行喷码区域的扩展: 0078 首先进行单字符宽度的预估, 根据喷码字符规则得到喷码所包含的字符个数, 根 据步骤2-2-1获取的喷码区域计算喷码宽度, 计算喷码宽度/字符个数得到单字符的预估宽 度。 然后将喷码区域上下边界进。

35、行扩展, 将步骤2-2-1输出的倾斜校正后的喷码图像中喷码 说明书 5/10 页 9 CN 112149668 A 9 区域的上下边界分别延申至少一个字符的预估宽度, 且对两个延申的区域分别进行水平方 向的腐蚀膨胀从而消除横线, 最终输出上下边界扩展后的喷码区域图像。 0079 步骤2-3, 进行字符的切割; 0080 将步骤2-2输出喷码区域图像集中每张喷码区域图像以字符为基准进行切割; 得 到单字符图像, 将同种类型的字符图像放在一起即可获取单字符图像集。 如图6所示, 其中 针对每张喷码区域图像具体的切割操作具体包括: 0081 根据喷码字符规则得到喷码所包含的字符个数n, 将喷码区域图。

36、像水平方向分成n 份, 得到n-1个初始字符分界线, 针对初始分界线人为校对将其移动至相邻的两个字符中间 区域, 获得真实的n-1条字符分界线, 用其对喷码区域图像进行水平方向的切割即可获得n 个单字符图像; 人为输入喷码的n个字符, 进而可将字符与单字符图像进行关联, 如图7所 示, 其中每张单字符图像的命名方式为 “字符类型-唯一标识” 。 0082 下面, 对模型层的神经网络模型的训练过程进行详细说明。 0083 基于序列识别的神经网络模型的训练过程具体步骤如下: 0084 步骤3-1, 训练语料的生成, 即大量喷码字符串及其对应的图像的获取, 其中, 有些 喷码图像中带有边痕; 008。

37、5 基于喷码规则生成大量符合条件的字符串; 针对每一个字符串, 依次从每个字符 的单字符图像集中随机抽取一张, 然后进行拼接得到该字符串对应的喷码图像, 进而获得 大量的符合喷码规则的字符串及其对应的喷码图像, 其中包括带有边痕的喷码图像。 0086 步骤3-2, 用于序列识别的神经网络模型训练: 0087 将步骤3-1输出的喷码字符串及其对应的图像输入到基于序列识别的神经网络模 型进行训练, 得到可用于字符串识别的模型。 0088 综上所述, 借助于本发明实施例的技术方案, 在模型识别前将喷码区域的上下边 界进行扩展, 强化了边痕与喷码字符的差异, 在模型训练阶段生成大量带有边痕的训练语 料。

38、。 同时可以解决先做边痕消除而后进行喷码识别带来的多余笔画或字符残缺引起的识别 不准的问题。 0089 系统实施例 0090 根据本发明实施例, 提供了一种带有边痕的喷码识别系统, 图8是本发明实施例的 带有边痕的喷码识别系统的示意图, 如图8所示, 根据本发明实施例的带有边痕的喷码识别 系统具体包括: 0091 采集模块80, 用于采集包装上的带有边痕的喷码图像; 0092 处理模块82, 用于对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并根据喷码区域的位置信息, 将喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显 差异的喷码区域图像; 0093 识别模块84, 用于将喷。

39、码区域图像输入到预先训练好的基于序列识别的神经网络 模型中进行识别, 获得与喷码区域图像对应的喷码字符串。 0094 在本发明实施例中, 识别模块84进一步包括: 0095 训练子模块, 用于对基于序列识别的神经网络模型进行训练, 训练子模块具体用 于: 0096 获取预先保存的字符类型、 喷码规则、 以及根据字符类型生成的单字符图像集; 说明书 6/10 页 10 CN 112149668 A 10 0097 根据喷码规则生成训练喷码字符串, 依次从训练喷码字符串的每个字符所对应的 单字符图像集中抽取该字符对应的图像, 对每个字符所对应的图像进行拼接, 得到训练喷 码字符串对应的训练喷码图像。

40、, 其中, 训练喷码图像中包括带有边痕的喷码图像; 0098 将训练喷码字符串和训练喷码图像输入基于序列识别的神经网络模型, 对基于序 列识别的神经网络模型进行训练, 最终得到训练好的基于序列识别的神经网络模型。 0099 其中, 上述训练子模块具体用于: 0100 采集一定数量的包装上的喷码图像, 其中, 喷码图像中包括带有边痕的喷码图像; 0101 对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并根据喷码区域 的位置信息, 将喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差异的喷码区域 图像; 0102 将喷码区域图像以字符为基准进行切割, 得到单字符图像, 并根据字符。

41、类型, 将单 字符图像进行分组, 生成不同字符类型的单字符图像集。 0103 上述训练子模块具体用于: 0104 根据喷码规则计算喷码区域图像所包含的字符个数n, 将喷码区域图像的水平方 向分成n份, 得到n-1个初始字符分界线; 0105 根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域, 获得n-1条 最终字符分界线; 0106 根据最终字符分界线对喷码区域图像进行水平方向的切割, 获取n个字符图像; 0107 根据用户的输入获取n个字符图像所对应的n个字符, 并将字符与字符图像进行关 联。 0108 上述处理模块82和训练子模块具体用于: 0109 对喷码图像中的喷码区域进行定。

42、位, 并根据喷码区域的倾斜角度对喷码区域进行 倾斜校正, 获取校正后的喷码区域的位置坐标; 0110 根据喷码区域的位置信息, 计算喷码的整体宽度, 并从预先保存的喷码规则中获 取喷码字符的个数, 根据喷码的整体宽度和喷码字符的个数计算喷码的单字符宽度; 0111 根据单字符宽度确定延申长度, 根据延申长度将喷码区域的上下边界分别向外延 申, 并对上下边界的两个延申区域进行横线消除处理, 最终获得延申后的边痕和喷码具有 明显差异的喷码区域图像。 0112 本发明实施例是与上述方法实施例对应的系统实施例, 各个模块的具体操作可以 参照方法实施例的描述进行理解, 在此不再赘述。 0113 装置实施。

43、例一 0114 本发明实施例提供一种带有边痕的喷码识别装置, 如图9所示, 包括: 存储器90、 处 理器92及存储在所述存储器90上并可在所述处理器92上运行的计算机程序, 所述计算机程 序被所述处理器92执行时实现如下方法步骤: 0115 首先需要预先对基于序列识别的神经网络模型进行训练, 具体包括如下处理: 0116 步骤1, 获取预先保存的字符类型(例如, 1, 3, a, b等均为一种字符类型)、 喷码规 则、 以及根据字符类型生成的单字符图像集; 具体地, 字符种类指喷码字符串中可能出现的 字符类型, 例如, 1, 2, a, b等; 喷码字符规则指喷码中单个字符组合成字符串的规则。

44、, 因同个 包装的商品上的喷码中字符的组合是由一定的含义和规则, 例如, 一般为产地代号+生产年 说明书 7/10 页 11 CN 112149668 A 11 月日+产线代号+生产时分; 单字符图像集指每种类型的字符的图像集, 用于生成序列识别 神经网络模型训练所需的训练语料。 0117 在步骤1中, 根据字符类型生成单字符图像集具体包括如下处理: 0118 步骤11, 采集一定数量的包装上的喷码图像, 其中, 喷码图像中包括带有边痕的喷 码图像; 0119 步骤12, 对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并根据喷 码区域的位置信息, 将喷码区域的上下边界进行扩展, 。

45、获得边痕和喷码具有明显差异的喷 码区域图像; 0120 步骤13, 将喷码区域图像以字符为基准进行切割, 得到单字符图像, 并根据字符类 型, 将单字符图像进行分组, 生成不同字符类型的单字符图像集。 0121 其中, 在步骤13中, 将喷码区域图像以字符为基准进行切割具体包括如下处理: 0122 步骤131, 根据喷码规则计算喷码区域图像所包含的字符个数n, 将喷码区域图像 的水平方向分成n份, 得到n-1个初始字符分界线; 0123 步骤132, 根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域, 获 得n-1条最终字符分界线; 0124 步骤133, 根据最终字符分界线对喷码区。

46、域图像进行水平方向的切割, 获取n个字 符图像; 0125 步骤134, 根据用户的输入获取n个字符图像所对应的n个字符, 并将字符与字符图 像进行关联。 0126 步骤2, 根据喷码规则生成训练喷码字符串, 依次从训练喷码字符串的每个字符所 对应的单字符图像集中抽取该字符对应的图像, 对每个字符所对应的图像进行拼接, 得到 训练喷码字符串对应的训练喷码图像, 其中, 训练喷码图像中包括带有边痕的喷码图像; 0127 步骤3, 将训练喷码字符串和训练喷码图像输入基于序列识别的神经网络模型, 对 基于序列识别的神经网络模型进行训练, 最终得到训练好的基于序列识别的神经网络模 型。 0128 根据。

47、本发明实施例的带有边痕的喷码识别方法具体包括: 0129 步骤101, 采集包装上的带有边痕的喷码图像; 0130 步骤102, 对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并根据 喷码区域的位置信息, 将喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差异的 喷码区域图像; 0131 步骤103, 将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中 进行识别, 获得与喷码区域图像对应的喷码字符串。 0132 步骤102和神经网络模型训练时的步骤12具体包括如下处理: 0133 对喷码图像中的喷码区域进行定位, 并根据喷码区域的倾斜角度对喷码区域进行 倾斜校正, 。

48、获取校正后的喷码区域的位置坐标; 0134 根据喷码区域的位置信息, 计算喷码的整体宽度, 并从预先保存的喷码规则中获 取喷码字符的个数, 根据喷码的整体宽度和喷码字符的个数计算喷码的单字符宽度; 0135 根据单字符宽度确定延申长度, 根据延申长度将喷码区域的上下边界分别向外延 申, 并对上下边界的两个延申区域进行横线消除处理, 最终获得延申后的边痕和喷码具有 说明书 8/10 页 12 CN 112149668 A 12 明显差异的喷码区域图像。 0136 装置实施例二 0137 本发明实施例提供一种计算机可读存储介质, 所述计算机可读存储介质上存储有 信息传输的实现程序, 所述程序被处理。

49、器92执行时实现如下方法步骤: 0138 首先需要预先对基于序列识别的神经网络模型进行训练, 具体包括如下处理: 0139 步骤1, 获取预先保存的字符类型(例如, 1, 3, a, b等均为一种字符类型)、 喷码规 则、 以及根据字符类型生成的单字符图像集; 具体地, 字符种类指喷码字符串中可能出现的 字符类型, 例如, 1, 2, a, b等; 喷码字符规则指喷码中单个字符组合成字符串的规则, 因同个 包装的商品上的喷码中字符的组合是由一定的含义和规则, 例如, 一般为产地代号+生产年 月日+产线代号+生产时分; 单字符图像集指每种类型的字符的图像集, 用于生成序列识别 神经网络模型所需的。

50、训练语料。 0140 在步骤1中, 根据字符类型生成单字符图像集具体包括如下处理: 0141 步骤11, 采集一定数量的包装上的喷码图像, 其中, 喷码图像中包括带有边痕的喷 码图像; 0142 步骤12, 对喷码图像中的喷码区域进行定位, 获取喷码区域的位置信息, 并根据喷 码区域的位置信息, 将喷码区域的上下边界进行扩展, 获得边痕和喷码具有明显差异的喷 码区域图像; 0143 步骤13, 将喷码区域图像以字符为基准进行切割, 得到单字符图像, 并根据字符类 型, 将单字符图像进行分组, 生成不同字符类型的单字符图像集。 0144 其中, 在步骤13中, 将喷码区域图像以字符为基准进行切割。

展开阅读全文
内容关键字: 带有 识别 方法 系统
关于本文
本文标题:带有边痕的喷码识别方法及系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10122997.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1 
 


收起
展开