CN109299718A

CN109299718A - 一种字符识别方法及装置

Info

Publication number: CN109299718A
Application number: CN201811109858.6A
Authority: CN
Inventors: 璐轰匠; 贺佳
Original assignee: New H3C Security Technologies Co Ltd
Current assignee: New H3C Security Technologies Co Ltd
Priority date: 2018-09-21
Filing date: 2018-09-21
Publication date: 2019-02-01
Anticipated expiration: 2038-09-21
Also published as: CN109299718B

Abstract

本申请实施例提供了一种字符识别方法及装置，涉及信息处理技术领域，其中，上述方法包括：确定图像中待识别字符所在的的待识别图像区域；根据所述待识别图像区域的宽度和高度，判断是否需要对所述待识别图像区域进行切分处理；若为是，确定所述待识别图像区域的切分位置，并根据所确定的切分位置对所述待识别图像区域进行切分处理，得到所述待识别图像区域的图像子区域；分别对各个图像子区域进行字符识别，并根据识别结果获得所述待识别图像区域的字符识别结果。应用本申请实施例提供的方案进行字符识别，能够提高字符识别的准确率。

Description

一种字符识别方法及装置

技术领域

本申请涉及信息处理技术领域，特别是涉及一种字符识别方法及装置。

背景技术

在进行字符识别时，现有技术中，通常会直接对图像中需要识别的字符区域进行识别。考虑到需要识别的字符之间通常具有关联性，因此将需要识别的字符区域作为一个整体进行字符识别，兼顾了字符与字符之间的相关性，能够得到较为准确的字符识别结果。

然而不管采用哪种算法进行字符识别，在识别字符过程中，用于保存字符识别路径的节点数量有限，这样在需要识别的字符较多的情况下，容易导致最佳字符识别路径在字符识别的过程中途丢失，从而使得字符识别的准确率低。其中，一条字符识别路径对应一种字符识别结果。

发明内容

本申请实施例的目的在于提供一种字符识别方法及装置，以实现提高字符识别的准确率。具体技术方案如下：

第一方面，本申请实施例提供了一种字符识别方法，所述方法包括：

确定图像中待识别字符所在的待识别图像区域；

根据所述待识别图像区域的宽度和高度，判断是否需要对所述待识别图像区域进行切分处理；

若为是，确定所述待识别图像区域的切分位置，并根据所确定的切分位置对所述待识别图像区域进行切分处理，得到所述待识别图像区域的图像子区域；

分别对各个图像子区域进行字符识别，并根据识别结果获得所述待识别图像区域的字符识别结果。

第二方面，本申请实施例提供了一种字符识别装置，所述装置包括：

区域确定模块，用于确定图像中待识别字符所在的待识别图像区域；

切分判断模块，用于根据所述待识别图像区域的宽度和高度，判断是否需要对所述待识别图像区域进行切分处理，若为是，触发位置确定模块；

所述位置确定模块，用于确定所述待识别图像区域的切分位置，

区域切分模块，用于根据所确定的切分位置对所述待识别图像区域进行切分处理，得到所述待识别图像区域的图像子区域；

字符识别模块，用于分别对各个图像子区域进行字符识别，并根据识别结果获得所述待识别图像区域的字符识别结果。

第三方面，本申请实施例提供了一种电子设备，包括处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令，所述处理器被所述机器可执行指令促使：实现第一方面所述的字符识别方法步骤。

第四方面，本申请实施例提供了一种机器可读存储介质，存储有机器可执行指令，在被处理器调用和执行时，所述机器可执行指令促使所述处理器：实现第一方面所述的字符识别方法步骤。

由以上可见，本申请实施例提供的方案中，确定图像中待识别字符所在的待识别图像区域后，若根据待识别图像区域的宽度和高度判断出需要对待识别图像区域进行切分处理，确定待识别图像区域的切分位置，并根据确定出的切分位置对待识别图像区域进行切分处理，得到待识别图像区域的图像子区域，分别对各个图像子区域进行字符识别，并根据识别结果获得待识别图像区域的字符识别结果。可见，本申请实施例提供的方案中不仅以字符所在的图像区域为单元进行字符识别，而且还会依据图像区域的宽度、高度对图像区域进行切分处理，因此，在进行字符识别的过程中，需要识别的字符不会过多，也就不易导致对应于字符识别结果的最佳字符识别路径在字符识别过程中丢失，从而能够提高字符识别的准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a为本申请实施例提供的第一种字符识别方法的流程示意图；

图1b为本申请实施例提供的一种图像子区域的示意图；

图2为本申请实施例提供的第二种字符识别方法的流程示意图；

图3为本申请实施例提供的一种区域示意图；

图4为本申请实施例提供的第一种字符识别装置的结构示意图；

图5为本申请实施例提供的第二种字符识别装置的结构示意图；

图6为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

由于现有技术中在进行字符识别时，存在字符识别准确率低的问题，为解决这一技术问题，本申请实施例提供了一种字符识别方法及装置。

本申请的一个实施例中，提供了一种字符识别方法，该方法包括：

确定图像中待识别字符所在的待识别图像区域；

根据待识别图像区域的宽度和高度，判断是否需要对待识别图像区域进行切分处理；

若为是，确定待识别图像区域的切分位置，并根据所确定的切分位置对待识别图像区域进行切分处理，得到待识别图像区域的图像子区域；

分别对各个图像子区域进行字符识别，并根据识别结果获得待识别图像区域的字符识别结果。

由以上可见，本实施例提供的方案中不仅以字符所在的图像区域为单元进行字符识别，而且还会依据图像区域的宽度、高度对图像区域进行切分处理，因此，在进行字符识别的过程中，需要识别的字符不会过多，也就不易导致对应于字符识别结果的最佳字符识别路径在字符识别过程中丢失，从而能够提高字符识别的准确率。

下面先对本申请实施例中涉及的部分变量标识进行说明。

line_left表示图像中待识别图像区域最左侧边缘点的横坐标。

line_right表示图像中待识别图像区域最右侧边缘点的横坐标。

line_bottom表示图像中待识别图像区域最下侧边缘点的纵坐标。

line_top表示图像中待识别图像区域最上侧边缘点的纵坐标。

下面再对本申请各个实施例所提供字符识别方法的执行主体进行说明。上述执行主体可以是台式机、笔记本电脑、平板电脑、智能手机等各种电子设备。本申请并不对上述执行主体的具体形态进行限定。

下面再通过具体实施例对本申请实施例提供的字符识别方法进行详细说明。

图1a为本申请实施例提供的第一种字符识别方法的流程示意图，该方法如下所示。

S101：确定图像中待识别字符所在的待识别图像区域。

上述图像为包含待识别字符的图像。该图像可以是采用光学方式对纸质文档等进行图像采集而获得的黑白点阵图像。

具体的，上述图像中包含的待识别字符可以是中文字符、英文字符、法文字符、德文字符等等，本申请并不对此进行限定。

由于文档中可能会包含多个字符行，则图像中也可能会包含多个字符行，每一字符行在图像中占据一定的图像区域。为便于进行字符识别，可以先确定出图像中各字符行所在的图像区域。确定图像中各字符行所在的图像区域时，可以采用现有技术中用于确定图像中字符行所在区域的方式进行确定，本申请并不对此进行限定。

上述待识别图像区域可以为图像中任一字符行所在的图像区域。

S102：根据待识别图像区域的宽度和高度，判断是否需要对待识别图像区域进行切分处理。若为是，执行S103。

在确定待识别图像区域后，可以获得待识别图像区域的宽度和高度，一般情况下，上述宽度和高度采用像素点个数进行表示。

本申请的一个实施例中，根据待识别图像区域的宽度和高度，判断是否需要对待识别图像区域进行切分处理时，可以判断采用以下表达式计算得到的比例是否小于预设阈值。若小于预设阈值，判定不需要对待识别图像区域进行切分处理。若不小于预设阈值，判定需要对待识别图像区域进行切分处理。

ratio＝line_width/line_height

其中，ratio表示上述比例，line_width表示待识别图像区域的宽度，line_height表示待识别图像区域的高度。

上述预设阈值可以为25、50等等。

由于待识别图像区域的高度在一定程度上能够表征位于这一区域的字符行中字符的高度，而字符的宽度和高度通常呈正比例，因此，上述比例能够反映待识别图像区域中字符的数量。上述比例大于预设阈值，说明待识别图像区域中包含的字符较多，为保证字符识别的准确度，可以对待识别图像区域进行切分处理。

本申请的另一个实施例中，根据待识别图像区域的宽度和高度，判断是否需要对待识别图像区域进行切分处理时，还可以判断待识别图像区域的高度是否在第一预设范围内。

若在第一预设范围内，进一步判断待识别图像区域的宽度是否超过第二预设范围，得到判断结果。

若上述判断结果表征待识别图像区域的宽度超过第二预设范围，则判定需要对待识别图像区域进行切分处理；

若上述判断结果表征待识别图像区域的宽度未超多第二预设范围，判定不需要对待识别图像区域进行切分处理。

由于上述第一预设范围可以认为是表示图像中字符常见高度的范围，鉴于此，本申请的一个实施例中，若待识别图像区域的高度不在第一预设范围内，则可以认为待识别区域中包含的字符高度异常，可以结束上述判断是否需要对待识别图像区域进行切分处理的流程，认为待识别字符区域不需要进行切分处理。

另外，上述第一预设范围和第二预设范围可以是开发人员根据经验值设定的。在其他方式中，第二预设范围可以是根据第一预设范围、通常情况下字符的宽度和高度之间的比值、以及需要进行切分处理时图像区域中所包含字符数量的最小值确定。

例如，可以设定第一预设范围为：[10，30]个像素点，上述比值为：1，上述最小值为：10，则上述第二预设范围可以是：大于100个像素点。

在一个示例中，第二预设范围可以是以下数值的乘积：第一预设范围、通常情况下字符的宽度和高度之间的比值、以及需要进行切分处理时图像区域中所包含字符数量的最小值。例如，可以设定第一预设范围为：[10，30]个像素点，上述比值为：1，上述最小值为：10，则上述第二预设范围可以是：[100，300]个像素点。

需要说明的是，本申请仅仅以上述为例进行说明，并限定判断是否对待识别图像区域进行切分处理的方式。

S103：确定待识别图像区域的切分位置，并根据所确定的切分位置对待识别图像区域进行切分处理，得到待识别图像区域的图像子区域。

对待识别图像区域进行切分处理时，可以根据待识别图像区域的具体情况，确定将待识别图像区域切分为多少个图像子区域。例如，由于上述比例ratio可以在一定程度上表征待识别图像区域中包含的字符数量，因此可以依据上述比例确定将待识别图像区域切分为几个图像子区域。

如，上述比例在[25，50)范围内时，将待识别图像区域切分为两个图像子区域；

上述比例在[50，100)范围内时，将待识别图像区域切分为三个图像子区域等等。

当然，在待识别图像区域需要进行切分处理时，切分得到的图像子区域的数量也可以是预先设定的。

鉴于上述描述，本步骤中确定得到的上述切分位置可能是一个也可能是多个。

本申请的一个实施例中，确定待识别图像区域的切分位置时，可以按照以下方式实现。

确定待识别图像区域的初始切分位置；

确定待识别图像区域中横坐标位于[line_slice_initial-offset1，line_slice_initial+offset1]范围内的区域为第一字符区域，其中，line_slice_initial表示初始切分位置的横坐标，offset1表示预设的第一偏移量；

确定第一字符区域内像素值之和最小的像素列的横坐标为第一取值；

将待识别图像区域中横坐标为第一取值的位置确定为切分位置。

下面结合图1b对待识别图像区域对应的坐标系进行说明，该坐标系可以以“新华三信息”所在区域的左下角顶点为坐标原点，以水平方向为横坐标轴，以垂直方向为纵坐标轴。本申请仅仅以此为例进行说明，并不对本申请构成限定。

本实施例提供的方案中，确定初始切分位置后，并未直接将初始切分位置确定为最终的切分位置，而是在初始切分位置的周围进一步寻找更加合适的切分位置，因此可以提高最终确定的、待识别图像区域的切分位置的准确度，进而提高字符识别的准确度。

另外，本领域技术人员可以理解的是，在以1比特表示一个像素点的情况下，上述图像可以为以0、1分别表示黑色和白色的二值图；在以8比特表示一个像素点的情况下，上述图像也可以是以0、255分别表示黑色和白色的黑、白图像。而通常情况下，图像中的字符是以黑色表示的，图像中的背景色是以白色表示的，又由于从上述描述可见0小于1，0小于255，也就是，黑色像素点的像素值小于白色像素点的像素值，因此，第一字符区域内像素值之和最小的像素列中包含的黑色像素点(即构成字符的像素点)最多，又由于大多数字符的边缘包含的像素点较多，所以上述第一取值取上述像素值之和最小的像素列的横坐标可以保证对图像区域进行切分时，从字符的边缘处进行切分，也就在一定程度上减少字符被从中间切分的情况，进而后续准确识别字符提供保障。

当然，图像中的字符也可以是以白色表示的，图像中的背景色是以黑色表示的，又由于黑色像素点的像素值小于白色像素点的像素值，这种情况下，可以确定第一字符区域内像素值之和最大的像素列中包含的白色像素点最多，也就是可以将上述像素值之和最大的像素列的横坐标确定为上述第一取值。

除上述两种情况外，还可以确定第一字符区域内像素值之和最接近预设数值的像素列的横坐标为上述第一取值。

需要说明的是，本申请仅仅以上述为例进行说明，并不对确定第一取值的方式进行限定。

上述offset1的取值可以为待识别图像区域的高度。

确定待识别图像区域的初始切分位置的实现方式可以是：根据要切分得到的图像子区域的数量，采用平分的方式得到各个初始切分位置。

初始切分位置的数量与切分位置的数量相同，也就是，一个切分位置可以根据与该切分位置对应的一个初始切分位置得到。

假设，待识别图像区域需要进行切分处理时，切分得到的图像子区域的数量为：2，则存在一个切分位置及与该切分位置对应的一个初始切分位置，该初始切分位置的横坐标可以根据以下表达式计算得到：

line_slice_initial＝line_left+line_width/2

另外，上述第一字符区域可以是矩形区域，则上述第一字符区域可以以该矩形区域的左下角顶点(line_slice_initial-offset1，line_bottom)和右上角顶点(line_slice_initial+offset1，line_top)表示，还可以以该矩形区域的左上角顶点(line_slice_initial-offset1，line_top)和右下角顶点(line_slice_initial+offset1，line_bottom)表示。

S104：分别对各个图像子区域进行字符识别，并根据识别结果获得待识别图像区域的字符识别结果。

具体的，对各个图像子区域进行字符识别时，可以基于LSTM(Long Short-TermMemory，长短期记忆网络)算法等对各个图像子区域进行字符识别。

由于图像子区域中可能会包含多个字符，而对每一字符进行识别时，可能会得到多个识别结果，对图像子区域中的每一字符进行识别后，识别得到的结果与前面已识别完的字符对应的一个结果依次形成的组合，称为字符识别路径。在对每一图像子区域进行字符识别时，可能会得到多条字符识别路径，进而会得到多个字符识别结果。另外，在字符识别过程中，除了得到字符识别结果外，还可以得到每一个字符识别结果的置信度。其中，每一字符识别结果的置信度可以理解为：图像子区域中字符是上述字符识别结果中字符的概率。

这种情况下，可以将上述多个字符识别结果中置信度最高的字符识别结果作为图像子区域的最终字符识别结果。在置信度取值越大表示置信度越高的情况下，也就是将上述多个字符识别结果中置信度取值最大的字符识别结果作为图像子区域的最终字符识别结果。

例如，假设图像子区域中实际包含的字符为ABC。

对A进行识别时，得到的识别结果为：A、N，也就是，字符识别算法认为被识别的A一定概率为A，一定概率为N。

对B进行识别时，得到的识别结果为：B、E，也就是，字符识别算法认为被识别的B一定概率为B，一定概率为E。

这时形成四条字符识别路径：

A->B、A->E、N->B、N->E。

对C进行识别时，得到的识别结果为：C、L，也就是，字符识别算法认为被识别的C一定概率为C，一定概率为L。

这时形成八条字符识别路径：

A->B->C、A->B->L、A->E->C、A->E->L、N->B->C、N->B->L、N->E->C、N->E->L。

由于上述图像子区域中共计包含三个字符，所以对C进行识别后，完成了对图像子区域的字符识别，因此上述八条字符识别路径也就代表了八种字符识别结果。

假设，上述八条字符识别路径对应的八种字符识别结果的置信度依次为：

98％、25％、45％、50％、73％、30％、56％、67％

则置信度最高的字符识别结果为：A->B->C这一字符识别路径对应的字符识别结果ABC。

本申请的一个实施例中，可以分别对各个图像子区域进行字符识别，然后直接将各个图像子区域的识别结果进行合并，得到待识别图像区域的字符识别结果。

本申请的另一个实施例中，分别对各个图像子区域进行字符识别时可以通过以下步骤A-E实现，直至遍历各个图像子区域。

步骤A：将待识别图像区域中的第一个图像子区域确定为待识别对象。

步骤B：对待识别对象进行字符识别，获得第一识别结果。

步骤C：判断第一识别结果中包含的字符个数是否小于第一预设数量，若为是，执行步骤D，若为否，执行步骤E。

具体的，上述第一预设数量可以为3、4等等。

步骤D：直接将下一图像子区域作为下一待识别对象，并返回上述步骤B。

步骤E：根据第一识别结果中最后第二预设数量个字符在待识别对象中的区域和下一图像子区域确定下一待识别对象，并返回上述步骤B。

由于所确定出的切分位置可能会将一个常见词分割开来，例如，将“技术”这一常见词分割开来等，这样不利于进行字符识别，而上述步骤E中将待识别对象中的最后一部分区域一并确定为下一待识别对象，可以使得被分割开来的常见词出现在同一待识别对象中，有利于提高识别结果的准确度。

具体的，上述第二预设数量可以是2、3、4等等。

另外，上述第一预设数量和第二预设数量可以由开发人员根据经验值进行设定。

下面结合图1b对上述步骤A-步骤E进行说明。

假设，图像区域如图1b所示，该图像区域被划分为三个图像子区域，在图1b中分别对应三个矩形框所在区域，一个图像子区域称为子区域X，其中的内容为：新华三信息，另一图像子区域称为子区域Y，其中的内容为：安全技术，再一图像子区域称为子区域Z，其中的内容为：有限公司。上述第一预设数量为：3，第二预设数量为：2。

对子区域X和Y进行字符识别的过程如下：

步骤A1：将子区域X作为待识别对象。

步骤B1：对待识别对象进行字符识别，也就是对子区域X进行字符识别，得到识别结果1，识别结果1的内容为：新华三信息，包含5个中文字符。

步骤C1：识别结果1中包含5个字符大于3个。

步骤E1：将识别结果1中最后两个字符在子区域X中的区域，也就是“信息”两个字符在子区域X中的区域和子区域Y一起形成的新区域1作为待识别对象。

步骤B2：对新区域1进行字符识别，得到识别结果2，识别结果2的内容为：信息安全技术，包含6个中文字符。

步骤C2：识别结果2中包含6个字符大于3个。

步骤E2：将识别结果2中最后两个字符在子区域Y中的区域，也就是“技术”两个字符在子区域Y中的区域和子区域Z一起形成的新区域2作为待识别对象。

步骤B3：对新区域2进行字符识别，得到识别结果3，识别结果2的内容为：技术有限公司。

由于子区域Z是图像区域中的最后一个子区域，执行完上述步骤B3后可以继续执行上述步骤C-E对应的步骤，也可以不再执行。

为便于描述，将第一识别结果中最后第二预设数量个字符在待识别对象中的区域称为第一区域。

由于待识别图像区域属于图像中的区域，所以各个图像子区域也为图像中的一部分区域，基于此，上述第一识别结果中各个字符也对应于图像中的一部分区域。

又由于上述第二预设数量个字符是第一识别结果中最后第二预设数量个字符，因此，上述第一区域和下一图像子区域在图像中的区域是相邻的，基于此，本申请的一个实施例中，可以直接将第一区域与下一图像子区域合并，合并得到的区域作为下一待识别对象。

另外，由于确定第一区域时可能存在误差，为此确定上述第一区域后，可以基于上述第一区域的最左侧边缘点的横坐标，对上述第一区域进行修正，然后将修正后第一区域和下一图像子区域合并得到的区域作为下一待识别对象。

具体的，对第一区域进行修正时，可以将待识别图像区域中横坐标为第二取值的位置确定为第一区域修正后的左侧边缘。

其中，上述第二取值为：第二字符区域内像素值之和最小的像素列的横坐标，第二字符区域为：待识别图像区域中横坐标位于[box_left-offset2，box_left+offset3]范围内的区域，box_left表示上述第一区域最左侧边缘点的横坐标，offset2和offset3表示预设的第二偏移量和第三偏移量。

由于通常情况下图像中的字符是以黑色表示的，图像中的背景色是以白色表示的，又由于黑色像素点的像素值小于白色像素点的像素值，因此，第二字符区域内像素值之和最小的像素列中包含的黑色像素点(即构成字符的像素点)最多，又由于大多数字符的边缘包含的像素点较多，所以上述第二取值取上述像素值之和最小的像素列的横坐标可以保证对图像区域进行切分时，从字符的边缘处进行切分，也就在一定程度上减少字符被从中间切分的情况，进而后续准确识别字符提供保障。

当然，图像中的字符也可以是以白色表示的，图像中的背景色是以黑色表示的，又由于黑色像素点的像素值小于白色像素点的像素值，这种情况下，可以确定第二字符区域内像素值之和最大的像素列中包含的白色像素点最多，也就是可以将上述像素值之和最大的像素列的横坐标确定为上述第二取值。

除上述两种情况外，还可以确定第二字符区域内像素值之和最接近预设数值的像素列的横坐标为上述第二取值。

需要说明的是，本申请仅仅以上述为例进行说明，并不对确定第二取值的方式进行限定。

上述offset2、offset3的取值可以根据待识别图像区域的高度确定。例如，offset2＝0.2*line_height，offset3＝0.15*line_height等。其中，line_height前面的系数可以根据具体情况进行调整，以防止将左右结构的字符被从中间误拆分。

由于上述步骤E中根据第一区域和下一图像子区域确定下一待识别对象，因此，相邻两个图像子区域的识别结果中会存在针对第一区域的重复识别结果，这种情况下，可以选择针对第一区域的识别结果中，置信度最高的识别结果作为第一区域的最终识别结果。

由以上可见，本实施例提供的方案中，确定图像中待识别字符所在的待识别图像区域后，若根据待识别图像区域的宽度和高度判断出需要对待识别图像区域进行切分处理，确定待识别图像区域的切分位置，并根据确定出的切分位置对待识别图像区域进行切分处理，得到待识别图像区域的图像子区域，分别对各个图像子区域进行字符识别，并根据识别结果获得待识别图像区域的字符识别结果。可见，本实施例提供的方案中不仅以字符所在的图像区域为单元进行字符识别，而且还会依据图像区域的宽度、高度对图像区域进行切分处理，因此，在进行字符识别的过程中，需要识别的字符不会过多，也就不易导致对应于字符识别结果的最佳字符识别路径在字符识别过程中丢失，从而能够提高字符识别的准确率。

本申请的一个实施例中，参见图2，提供了第二种字符识别方法的流程示意图，与前述图1所示实施例相比，本实施例中，在S101确定图像中待识别字符所在的待识别图像区域后，还包括按照以下方式对待识别图像区域的每一边缘进行重定位。

在S105：确定从边缘向待识别图像区域外延伸预设边缘偏移量的区域，作为目标区域。

由于采用现有技术中大多数方式确定图像中的待识别图像区域时，会存在字符边缘被切割的情况，因此，为保证得到较为准确的待识别图像区域，本实施例通过预先设定边缘偏移量的方式，对待识别图像区域的每一边缘进行重定位。

对于待识别图像区域的不同边缘，可以设定不同的边缘偏移量。假设，待识别图像区域为矩形区域，则该区域具有上、下、左、右四个边缘，为此，可以针对这四个边缘分别设定边缘偏移量。

上述边缘是指待识别图像区域字符的任一边缘。

以待识别图像区域为矩形区域为例，上述边缘为矩形区域的上边缘时，上述目标区域为：从上边缘向上延伸预设边缘偏移量的区域，这时目标区域的左右边缘为上述矩形区域的左右边缘向上的延长线。如图3所示，其中，区域1为上述矩形区域，区域2为目标区域。

上述边缘为矩形区域的左边缘时，上述目标区域为：从左边缘向左延伸预设边缘偏移量的区域，这时目标区域的上下边缘为上述矩形区域的上下边缘向左的延长线。如图3所示的区域3。

在S106：采用目标区域内的像素单元，对待识别图像区域进行边缘重定位。

其中，上述像素单元为：边缘所在的像素行或者像素列。

由于上述区域的边缘可能是区域的上边缘、下边缘、左边缘或者右边缘，又由于上边缘和下边缘是对应于图像中像素行的，而左边缘和右边缘是对应于图像中像素列的，因此，当前所针对边缘不同时，上述像素单元可以是像素行或者像素列。示例性的，针对上边缘和下边缘，像素单元可以是边缘所在的像素行。针对左边缘和右边缘，像素单元可以是边缘所在的像素列。

本申请的一个实施例中，采用目标区域内的像素单元，对待识别图像区域进行边缘重定位时，可以按照以下步骤F-G实现。

步骤F：确定目标区域中满足以下表达式、且相邻的第一像素单元对：

|Sum₁-Sum₂|＜Th₃

其中，Sum₁表示第一像素单元对中一个像素单元的所有像素点的像素值之和，Sum₂表示第一像素单元对中另一像素单元的所有像素点的像素值之和，Th3表示第三预设数量。

对于不同边缘，上述Th3可以相同，也可以不同。

具体的，上述Th3的取值可以为10、20、30等等。上述Th3的取值可以依据具体应用场景中图像的具体情况进行设定。

在确定目标区域中的第一像素单元对时，可以按照一定的顺序逐像素行或者逐像素列确认第一像素单元对。

例如，为保证快速找到离待识别图像区域上边缘最近的第一像素单元对，可以按照从下到上的顺序逐像素行确认第一像素单元对；

为保证快速找到离前待识别图像区域下边缘最近的第一像素单元对，可以按照从上到下的顺序逐像素行确认第一像素单元对；

为保证快速找到离前待识别图像区域左边缘最近的第一像素单元对，可以按照从右到左的顺序逐像素列确认第一像素单元对；

为保证快速找到离前待识别图像区域右边缘最近的第一像素单元对，可以按照从左到右的顺序逐像素列确认第一像素单元对。

步骤G：将待识别图像区域的边缘重定位为第一像素单元对中的任一像素单元。

本申请的一个实施例中，在目标区域中不存在第一像素单元时，还可以确定目标区域中第一绝对值最大、且相邻的第二像素单元对，其中，第一绝对值为＝|Sum₁-Sum₂|；将待识别图像区域的边缘重定位为第二像素单元对中的任一像素单元。

确定待识别图像区域时，受算法精度等因素的影响，所确定出的待识别图像区域可能存在字符边缘被切割的情况，应用本实施例提供的方案，确定出待识别图像区域后，进一步对待识别图像区域的每一边缘进行重定位，能够有效避免上述字符别切割的情况出现，进而提高字符识别过程中所针对图像区域的准确度，有利于提高字符识别的准确度。

鉴于上述情况，本实施例中上述S102根据待识别图像区域的宽度和高度，判断是否需要对待识别图像区域进行切分处理，具体为：

S102A：根据重定位边缘后待识别图像区域的宽度和高度，判断是否需要对重定位边缘后的待识别图像区域进行切分处理。

由以上可见，本实施例提供的方案中，确定待识别图像区域之后，还对待识别图像区域进行边缘重定位，从而降低字符边缘被切割的概率，使得字符识别的准确率能够进一步提高。

下面再以待识别图像区域为矩形区域为例，对区域的边缘重定位过程进行介绍。

一、对区域的上边缘进行重定位

假设，上边缘对应的预设边缘偏移量为：offset4，该offset4的区域可以为0.1*line_height。上边缘对应的第三预设数量为：Th3_t。

确定目标区域为：左下角顶点为(line_left，line_top)、右上角顶点为(line_right，line_top+offset4)的矩形区域。

按照像素行从下到上的顺序遍历目标区域中的各像素行，确定目标区域中像素和之差小于Th3_t、且相邻的像素行，记为：pixel(y1)、pixel(y1+1)。

将区域的上边重定位至纵坐标为y1的像素行。

二、对区域的下边缘进行重定位

假设，下边缘对应的预设边缘偏移量为：offset5，该offset5的区域可以为0.1*line_height。下边缘对应的第三预设数量为：Th3_b。

确定目标区域为：左下角顶点为(line_left，line_bottom-offset5)、右上角顶点为(line_right，line_bottom)的矩形区域。

按照像素行从上到下的顺序遍历目标区域中的各像素行，确定目标区域中像素和之差小于Th3_b、且相邻的像素行，记为：pixel(y2)、pixel(y2+1)。

将区域的下边重定位至纵坐标为y2的像素行。

三、对区域的左边缘进行重定位

假设，左边缘对应的预设边缘偏移量为：offset6，该offset6的区域可以为0.35*line_height。左边缘对应的第三预设数量为：Th3_l。

确定目标区域为：左下角顶点为(line_left-offset6，line_bottom)、右上角顶点为(line_left，line_top)的矩形区域。

按照像素列从左到右的顺序遍历目标区域中的各像素列，确定目标区域中像素和之差小于Th3_l、且相邻的像素列，记为：pixel(x1)、pixel(x1+1)。

将区域的左边重定位至横坐标为x1的像素列。

四、对区域的右边缘进行重定位

假设，右边缘对应的预设边缘偏移量为：offset7，该offset7的区域可以为0.35*line_height。右边缘对应的第三预设数量为：Th3_r。

确定目标区域为：左下角顶点为(line_right，line_bottom)、右上角顶点为(line_right+offset7，line_top)的矩形区域。

按照像素列从右到左的顺序遍历目标区域中的各像素列，确定目标区域中像素和之差小于Th3_r、且相邻的像素列，记为：pixel(x2)、pixel(x2+1)。

将区域的左边重定位至横坐标为x1的像素列。

与上述字符识别方法相对应，本申请实施例还提供了一种字符识别装置。

图4为本申请实施例提供的第一种字符识别装置的结构示意图，该装置包括：

区域确定模块401，用于确定图像中待识别字符所在的待识别图像区域；

切分判断模块402，用于根据所述待识别图像区域的宽度和高度，判断是否需要对所述待识别图像区域进行切分处理，若为是，触发位置确定模块403；

所述位置确定模块403，用于确定所述待识别图像区域的切分位置，

区域切分模块404，用于根据所确定的切分位置对所述待识别图像区域进行切分处理，得到所述待识别图像区域的图像子区域；

字符识别模块405，用于分别对各个图像子区域进行字符识别，并根据识别结果获得所述待识别图像区域的字符识别结果。

本申请的一个实施例中，所述位置确定模块403，包括：

初始位置确定单元，用于确定所述待识别图像区域的初始切分位置；

第一区域确定单元，用于确定所述待识别图像区域中横坐标位于[line_slice_initial-offset1，line_slice_initial+offset1]范围内的区域为第一字符区域，其中，line_slice_initial表示所述初始切分位置的横坐标，offset1表示预设的第一偏移量；

取值确定单元，用于确定第一字符区域内像素值之和最小的像素列的横坐标为第一取值；

切分位置确定单元，用于将所述待识别图像区域中横坐标为所述第一取值的位置确定为切分位置。

本申请的一个实施例中，所述字符识别模块405，包括：

第一对象确定单元，用于将所述待识别图像区域中的第一个图像子区域确定为待识别对象；

字符识别单元，用于对所述待识别对象进行字符识别，获得第一识别结果；

个数判断单元，用于判断所述第一识别结果中包含的字符个数是否小于第一预设数量，若为是，触发第二对象确定单元，若为否，触发第三对象确定单元；

所述第二对象确定单元，用于直接将下一图像子区域作为下一待识别对象，并触发所述字符识别单元，直至遍历各个图像子区域；

所述第三对象确定单元，用于根据所述第一识别结果中最后第二预设数量个字符在所述待识别对象中的区域和下一图像子区域确定下一待识别对象，并触发所述字符识别单元，直至遍历各个图像子区域。

本申请的一个实施例中，参见图5，提供了第二种字符识别装置的结构示意图，与前述图4所示实施例相比，本实施例中，上述字符识别装置还包括：

边缘重定位模块406，用于在所述区域确定401模块确定图像中的待识别图像区域后，对所述待识别图像区域的每一边缘进行重定位；

其中，所述边缘重定位模块406，包括：

第二区域确定单元406A，用于确定从边缘向所述待识别图像区域外延伸预设边缘偏移量的区域，作为目标区域；

边缘重定位单元406B，用于采用所述目标区域内的像素单元，对所述待识别图像区域进行边缘重定位，所述像素单元为：边缘所在的像素行或者像素列；

所述切分判断模块402，具体用于根据重定位边缘后所述待识别图像区域的宽度和高度，判断是否需要对重定位边缘后的所述待识别图像区域进行切分处理。

本申请的一个实施例中，所述边缘重定位单元406B，包括：

第一单元对确定子单元，用于确定所述目标区域中满足以下表达式、且相邻的第一像素单元对：

|Sum₁-Sum₂|＜Th₃

其中，Sum₁表示第一像素单元对中一个像素单元的所有像素点的像素值之和，Sum₂表示第一像素单元对中另一像素单元的所有像素点的像素值之和，Th3表示第三预设数量；

第一边缘重定位子单元，用于将所述待识别图像区域的边缘重定位为所述第一像素单元对中的任一像素单元。

本申请的一个实施例中，所述边缘重定位单元406，还包括：

第二单元对确定子单元，用于在所述目标区域中不存在所述第一像素单元时，确定所述目标区域中第一绝对值最大、且相邻的第二像素单元对，其中，所述第一绝对值为＝|Sum₁-Sum₂|；

第二边缘重定位子单元，用于将所述待识别图像区域的边缘重定位为所述第二像素单元对中的任一像素单元。

与上述字符识别方法相对应，本申请实施例还提供了一种电子设备。

图6提供了一种电子设备的结构示意图，包括：处理器601和机器可读存储介质602，所述机器可读存储介质602存储有能够被所述处理器601执行的机器可执行指令，所述处理器601被所述机器可执行指令促使：实现本申请实施例提供的字符识别方法。

本申请的一个实施例中，提供了一种字符识别方法，所述方法包括：

确定图像中待识别字符所在的待识别图像区域；

需要说明的是，上述处理器601被机器可执行指令促使实现的字符识别方法的其他实施例，与前述方法实施例部分提及的其他实施例相同，这里不再赘述。

上述机器可读存储介质可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，上述机器可读存储介质还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

由以上可见，本实施例提供的电子设备在进行字符识别时，不仅以字符所在的图像区域为单元进行字符识别，而且还会依据图像区域的宽度、高度对图像区域进行切分处理，因此，在进行字符识别的过程中，需要识别的字符不会过多，也就不易导致对应于字符识别结果的最佳字符识别路径在字符识别过程中丢失，从而能够提高字符识别的准确率。

与上述字符识别方法相对应，本申请实施例还提供了一种机器可读存储介质，存储有机器可执行指令，在被处理器调用和执行时，所述机器可执行指令促使所述处理器：实现本申请实施例提供的字符识别方法。

确定图像中待识别字符所在的待识别图像区域；

需要说明的是，上述机器可执行指令促使处理器实现的字符识别方法的其他实施例，与前述方法实施例部分提及的其他实施例相同，这里不再赘述。

由以上可见，通过执行本实施例提供的机器可读存储介质中存储的机器可执行指令进行字符识别时，不仅以字符所在的图像区域为单元进行字符识别，而且还会依据图像区域的宽度、高度对图像区域进行切分处理，因此，在进行字符识别的过程中，需要识别的字符不会过多，也就不易导致对应于字符识别结果的最佳字符识别路径在字符识别过程中丢失，从而能够提高字符识别的准确率。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备和机器可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

1.一种字符识别方法，其特征在于，所述方法包括：

确定图像中待识别字符所在的待识别图像区域；

2.根据权利要求1所述的方法，其特征在于，所述确定所述待识别图像区域的切分位置，包括：

确定所述待识别图像区域的初始切分位置；

确定所述待识别图像区域中横坐标位于[line_slice_initial-offset1，line_slice_initial+offset1]范围内的区域为第一字符区域，其中，line_slice_initial表示所述初始切分位置的横坐标，offset1表示预设的第一偏移量；

将所述待识别图像区域中横坐标为所述第一取值的位置确定为切分位置。

3.根据权利要求1或2所述的方法，其特征在于，所述分别对各个图像子区域进行字符识别，包括：

将所述待识别图像区域中的第一个图像子区域确定为待识别对象；

对所述待识别对象进行字符识别，获得第一识别结果；

判断所述第一识别结果中包含的字符个数是否小于第一预设数量；

若为是，直接将下一图像子区域作为下一待识别对象；

若为否，根据所述第一识别结果中最后第二预设数量个字符在所述待识别对象中的区域和下一图像子区域确定下一待识别对象；

返回所述对所述待识别对象进行字符识别，获得第一识别结果的步骤，直至遍历各个图像子区域。

4.根据权利要求1或2所述的方法，其特征在于，在所述确定图像中待识别字符所在的待识别图像区域后，还包括：

按照以下方式对所述待识别图像区域的每一边缘进行重定位：

确定从边缘向所述待识别图像区域外延伸预设边缘偏移量的区域，作为目标区域；

采用所述目标区域内的像素单元，对所述待识别图像区域进行边缘重定位，所述像素单元为：边缘所在的像素行或者像素列；

所述根据所述待识别图像区域的宽度和高度，判断是否需要对所述待识别图像区域进行切分处理，包括：

根据重定位边缘后所述待识别图像区域的宽度和高度，判断是否需要对重定位边缘后的所述待识别图像区域进行切分处理。

5.根据权利要求4所述的方法，其特征在于，所述采用所述目标区域内的像素单元，对所述待识别图像区域进行边缘重定位，包括：

确定所述目标区域中满足以下表达式、且相邻的第一像素单元对：

|Sum₁-Sum₂|＜Th₃

将所述待识别图像区域的边缘重定位为所述第一像素单元对中的任一像素单元。

6.根据权利要求5所述的方法，其特征在于，在所述目标区域中不存在所述第一像素单元时，还包括：

确定所述目标区域中第一绝对值最大、且相邻的第二像素单元对，其中，所述第一绝对值为＝|Sum₁-Sum₂|；

将所述待识别图像区域的边缘重定位为所述第二像素单元对中的任一像素单元。

7.一种字符识别装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述位置确定模块，包括：

9.根据权利要求7或8所述的装置，其特征在于，所述字符识别模块，包括：

10.根据权利要求7或8所述的装置，其特征在于，所述装置还包括：

边缘重定位模块，用于在所述区域确定模块确定图像中的待识别图像区域后，对所述待识别图像区域的每一边缘进行重定位；

其中，所述边缘重定位模块，包括：

第二区域确定单元，用于确定从边缘向所述待识别图像区域外延伸预设边缘偏移量的区域，作为目标区域；

边缘重定位单元，用于采用所述目标区域内的像素单元，对所述待识别图像区域进行边缘重定位，所述像素单元为：边缘所在的像素行或者像素列；

所述切分判断模块，具体用于根据重定位边缘后所述待识别图像区域的宽度和高度，判断是否需要对重定位边缘后的所述待识别图像区域进行切分处理。

11.根据权利要求10所述的装置，其特征在于，所述边缘重定位单元，包括：

|Sum₁-Sum₂|＜Th₃

12.根据权利要求11所述的装置，其特征在于，所述边缘重定位单元，还包括：

13.一种电子设备，其特征在于，包括处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令，所述处理器被所述机器可执行指令促使：实现权利要求1-6任一所述的方法步骤。

14.一种机器可读存储介质，其特征在于，存储有机器可执行指令，在被处理器调用和执行时，所述机器可执行指令促使所述处理器：实现权利要求1-6任一所述的方法步骤。