[go: up one dir, main page]

CN109062942A - 数据查询方法和装置 - Google Patents

数据查询方法和装置 Download PDF

Info

Publication number
CN109062942A
CN109062942A CN201810644027.2A CN201810644027A CN109062942A CN 109062942 A CN109062942 A CN 109062942A CN 201810644027 A CN201810644027 A CN 201810644027A CN 109062942 A CN109062942 A CN 109062942A
Authority
CN
China
Prior art keywords
unit
inquiry
value
primitive
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810644027.2A
Other languages
English (en)
Inventor
孙海涌
张默
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Moshanghua Technology Co Ltd
Original Assignee
Beijing Moshanghua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Moshanghua Technology Co Ltd filed Critical Beijing Moshanghua Technology Co Ltd
Priority to CN201810644027.2A priority Critical patent/CN109062942A/zh
Publication of CN109062942A publication Critical patent/CN109062942A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据查询方法。该方法包括将第一查询元素按照第一预设规则转换为第二查询元素;在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,其中,所述特征数据库包括特征集和目录集;所述特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示特征集中对应特征元素来自于原始数据库中的哪个或哪些原始元素;获取与所述最接近的特征元素对应的所述原始元素;根据所获取的所述原始元素确定查询结果。本申请还提供了一种数据查询装置。本申请解决了解决了百万量级人脸识别特征库的特征查找效率低的技术问题。

Description

数据查询方法和装置
技术领域
本申请涉及通信领域,具体而言,涉及一种数据查询方法。
背景技术
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别技术的核心部分则为人脸图像特征提取以及匹配与识别。一般而言,提取的人脸特征为归一化后的N维向量(N通常为128、512等)。通过对人脸库中的图像逐一提取人脸特征,可以建立一个人脸特征库。在相关技术中,当需要查找可疑人脸时,采用人脸识别算法提取可疑人脸的特征数据,然后与人脸特征库中的每一个特征进行对比,找出最相近的特征作为查找结果。
人脸识别主要用于身份识别,近年来已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。随着需求的不断提升,用于比对的人脸库可达百万、千万乃至亿级别,相关技术中的提取人脸特征后的查找过程计算量因此线性放大,使得人脸图像特征提取、匹配与识别的过程效率低下。
针对相关技术中在百万级以上人脸特征库中特征提取、匹配与识别效率低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种数据查询方法,以解决上述问题。
为了实现上述目的,根据本申请的一个方面,提供了一种数据查询方法,包括:
将第一查询元素按照第一预设规则转换为第二查询元素;在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,其中,所述特征数据库包括特征集和目录集;所述特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示特征集中对应特征元素来自于原始数据库中的哪个或哪些原始元素;获取与所述最接近的特征元素对应的所述原始元素;根据所获取的所述原始元素确定查询结果。
进一步的,如前述的方法,所述第一查询元素为向量;将所述第一查询元素按照第一预设规则转换为第二查询元素,包括:S11.将所述第一查询元素的各个值通过Sigmoid函数投影为在0和1之间;S12.将所述所有在0和1之间的各个值按照第三预设规则投影为各个值为0或1;所述各个值为0或1的元素为第二查询元素。
进一步的,如前述的方法,所述S12,包括:S121.获取各个值在0和1之间的欲投影的元素中的值;S122.判断所述值是否大于0.5;S123.若所述值大于0.5,则将所述值投影为1;S124.若所述值不大于0.5,则将所述值投影为0;S125.重复S121至S124,直至所述元素的所有值为0或1。
进一步的,如前述的方法,所述在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,包括:S21.获取所述特征数据库的所述特征集中的一个特征元素;S22.将所述第二查询元素的各个值与所述特征元素的各个对应的值一一对比,若相同则计数为0,若不同则计数为1;计算所述第二查询元素的所有值的对比计数之和;S23.重复步骤S21至S22,直至所述第二查询元素与所述特征集中所有的特征元素对比完成;S24.比较所有所述对比计数之和,选取对比计数之和最小的特征元素为所述最接近的特征元素。
进一步的,如前述的方法,所述根据所获取的所述原始元素确定查询结果,包括:S41.判断所述原始元素的个数是否大于1;S42.若所述原始元素的个数不大于1,则所述原始元素为所述查询结果;S43.若所述原始元素的个数大于1,则计算所述第一查询元素与各个所述原始元素的距离;S44.比较各个所述距离,选取与所述第一查询元素距离最小的原始元素为所述查询结果。
为了实现上述目的,根据本申请的另一方面,提供了一种数据查询装置,包括:转换单元、查找单元、获取单元和确定单元;所述转换单元,用于将第一查询元素按照第一预设规则转换为第二查询元素;所述查找单元,用于在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,其中,所述特征数据库包括特征集和目录集;所述特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示特征集中对应特征元素来自于原始数据库中的哪个或哪些原始元素;所述获取单元,用于获取与所述最接近的特征元素对应的所述原始元素;所述确定单元,用于根据所获取的所述原始元素确定查询结果。
进一步的,如前述的装置,所述第一查询元素为向量;所述转换单元包括第一投影单元和第二投影单元;所述第一投影单元,用于将所述第一查询元素的各个值通过Sigmoid函数投影为在0和1之间;所述第二投影单元,用于将所述所有在0和1之间的各个值按照第三预设规则投影为各个值为0或1;所述各个值为0或1的元素为第二查询元素。
进一步的,如前述的装置,所述第二投影单元,包括第一判断单元和第一赋值单元;所述第一判断单元,用于判断各个值在0和1之间的欲投影的元素中的值是否大于0.5;所述第一赋值单元,用于在所述值大于0.5时,将所述值投影为1;所述第一赋值单元,还用于在所述值不大于0.5时,将所述值投影为0。
进一步的,如前述的装置,所述查找单元,包括对比单元、第一计算单元、第一比较单元和第一选择单元;所述对比单元,用于将所述第二查询元素的各个值与所述特征数据库的所述特征集中的各个特征元素的各个对应的值一一对比,若相同则计数为0,若不同则计数为1;所述第一计算单元,用于所述第二查询元素的所有值的对比计数之和;所述第一比较单元,用于比较所有所述对比计数之和;所述第一选择单元,用于选取对比计数之和最小的特征元素为所述最接近的特征元素。
进一步的,如前述的装置,所述确定单元,包括第二判断单元、第二选择单元、第二计算单元和第二比较单元;所述第二判断单元,用于判断所述原始元素的个数是否大于1;所述第二选择单元,用于在所述原始元素的个数不大于1时,将所述原始元素定为所述查询结果;所述第二计算单元,用于在若所述原始元素的个数大于1时,计算所述第一查询元素与各个所述原始元素的距离;所述第二比较单元,用于比较各个所述距离;所述第二选择单元,还用于选取与所述第一查询元素距离最小的原始元素为所述查询结果。
在本申请实施例中,采用查找人脸特征时先与压缩的特征数据库对比的方式,通过目录库再与原始数据库的特征对比,达到了数据库分级查找的目的,从而实现了提高人脸特征查找效率的技术效果,进而解决了百万量级人脸识别特征库的特征查找效率低的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请一个实施例提供的一种数据查询方法的流程示意图;
图2是本申请一个实施例提供的一种0或1转换的流程示意图;
图3是本申请一个实施例提供的一种将在0和1之间的值转换为0或1的方法的流程示意图;
图4是本申请一个实施例提供的一种获取与查询元素最接近的特征元素的方法的流程示意图;
图5是本申请一个实施例提供的一种根据原始元素确定查询结果的方法的流程示意图;
图6是本申请一个实施例提供的一种数据查询装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本发明实施例,提供了一种数据查询方法,如图1所示,该方法包括如下的步骤S1至步骤S4:
S1.将第一查询元素按照第一预设规则转换为第二查询元素;
进一步地,所述第一查询元素为向量;如图2所示,所述S1,包括:
S11.将所述第一查询元素的各个值通过Sigmoid函数投影为在0和1之间;
S12.将所述所有在0和1之间的各个值按照第三预设规则投影为各个值为0或1;所述各个值为0或1的元素为第二查询元素。
更进一步地,如图3所示,所述S12,包括:
S121.获取各个值在0和1之间的欲投影的元素中的值;
S122.判断所述值是否大于0.5;
S123.若所述值大于0.5,则将所述值投影为1;
S124.若所述值不大于0.5,则将所述值投影为0;
S125.重复S121至S124,直至所述元素的所有值为0或1。
具体地,例如,取第一查询元素q1(0,1,-1);将q1进行Sigmoid转换,Sigmoid函数的表达式为
因此S(q1)=(1/2,1/(1+1/e),1/(1+e));再将S(q1)进行二进制转换,即若值大于0.5,则将所述值投影为1,若值不大于0.5,则将所述值投影为0,因此bin_S(q1)=(0,1,0),则第二查询元素为q1’(0,1,0)。
S2.在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,其中,所述特征数据库包括特征集和目录集;所述特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示特征集中对应特征元素来自于原始数据库中的哪个或哪些原始元素;
进一步地,如图4所示,所述S2,包括:
S21.获取所述特征数据库的所述特征集中的一个特征元素;
S22.将所述第二查询元素的各个值与所述特征元素的各个对应的值一一对比,若相同则计数为0,若不同则计数为1;计算所述第二查询元素的所有值的对比计数之和;
S23.重复步骤S21至S22,直至所述第二查询元素与所述特征集中所有的特征元素对比完成;
S24.比较所有所述对比计数之和,选取对比计数之和最小的特征元素为所述最接近的特征元素。
具体地,例如,特征集中有两个特征元素k1(0,0,1)和k2(0,1,1);获取第一个特征元素k1(0,0,1),将q1’(0,1,0)的各个值与k1(0,0,1)各个对应的值一一对比,若相同则计数为0,若不同则计数为1,然后计算所有值的对比计数之和,即第一个值相同,后两个值不同,total_count_1=0+1+1=2;获取第二个特征元素k2(0,1,1),将q1’(0,1,0)的各个值与k2(0,1,1)各个对应的值一一对比,若相同则计数为0,若不同则计数为1,然后计算所有值的对比计数之和,即前两个值相同,最后一个值不同,total_count_2=0+0+1=1;则选取第二个特征元素k2为最接近的特征元素。
S3.获取与所述最接近的特征元素对应的所述原始元素;
具体地,根据与特征元素对应的目录集中的目录元素获取原始数据库中的原始元素;特征集和目录集的具体获得方式如下:
例如,原人脸特征数据库包含M个人脸特征,其中M为100万,每个人脸特征为一个长度为N的一维向量(N通常为128、512等),则原数据库O为矩阵(M,N);
获取第一个人脸特征a1(0,2,3)(为简化处理,此处用N取3来举例),此时第一特征集K为空,则将a1(0,2,3)添加到第一特征集中,并将a1(0,2,3)在矩阵O(M,N)中的身份信息O_a1添加到目录集C的对应目录元素A中,此时第一特征集更新为K(a1),目录集更新为C(A),目录元素A更新为A(O_a1);
获取第二个人脸特征b1(0,5,8),此时第一特征集K已不为空,计算b1(0,5,8)与a1(0,2,3)的点积d=a1·b1=0·0+2·5+3·8=34,由于目前K中只有a1一个特征元素,所以a1为最近特征元素,44为最近距离;
预设阈值Th为30,判断34大于预设阈值Th,则将b1(0,5,8)添加到第一特征集中,并将b1(0,5,8)在矩阵O(M,N)中的身份信息O_b1添加到目录集C的对应目录元素B中,此时第一特征集更新为K(a1,b1),目录集更新为C(A,B),目录元素B更新为B(O_b1);
获取第三个人脸特征a2(0,2,4),此时第一特征集K已不为空,计算a2(0,2,4)与a1(0,2,3)的点积d1=a1·a2=0·0+2·2+3·4=16,计算a2(0,2,4)与b1(0,5,8)的点积d1=b1·a2=0·0+5·2+8·4=42,比较16<42,所以a1为最近特征元素,16为最近距离;
判断16小于预设阈值Th=30,则将K中的a1替换为a1’=(a1+a2)/2=(0,2,7/2),并将a2在矩阵O(M,N)中的身份信息O_a2添加到目录集C的对应目录元素A中,此时第一特征集更新为K(a1’,b1),目录集更新为C(A’,B),目录元素A更新为A’(O_a1,O_a2);目录元素B为B(O_b1);
重复以上步骤,直至矩阵O(M,N)中所有特征元素的身份信息都添加到目录集C中;
取第一特征集K中的特征元素a1’(0,2,7/2);将a1’进行Sigmoid转换,Sigmoid函数的表达式为
因此S(a1’)=(1/2,1/(1+1/e2),1/(1+1/e7/2));再将S(a1’)进行二进制转换,即若值大于0.5,则将所述值投影为1,若值不大于0.5,则将所述值投影为0,因此bin_S(a1’)=(0,1,1);然后将bin_S(a1’)添加到第二特征集B_K中,则第二特征集B_K中的特征元素的值为0或1。
因此,通过特征元素和与其对应的目录元素可获得原始数据库中的一个或多个原始元素。
S4.根据所获取的所述原始元素确定查询结果。
进一步地,如图5所示,所述S4,包括:
S41.判断所述原始元素的个数是否大于1;
S42.若所述原始元素的个数不大于1,则所述原始元素为所述查询结果;
S43.若所述原始元素的个数大于1,则计算所述第一查询元素与各个所述原始元素的距离;
S44.比较各个所述距离,选取与所述第一查询元素距离最小的原始元素为所述查询结果。
具体地,例如最近特征元素k3(0,0,0)的原始元素为a3(0,-1,-2),只有一个原始元素,因此a3(0,-1,-2)为查询结果;再例如,最近特征元素k2(0,1,1)的原始元素为a1(0,2,3)与a2(0,2,4),分别计算第一查询元素q1(0,1,-1)与a1(0,2,3)和a2(0,2,4)的点积,d1=q1·a1=(0·0+1·2+(-1)·3)=-1,d2=q1·a2=(0·0+1·2+(-1)·4)=-2,|d1|<|d2|,则原始元素a1(0,2,3)为查询结果。
从以上的描述中,可以看出,本发明实现了如下技术效果:采用查找人脸特征时先转化为二进制特征对比再与高度缩小范围的特征对比的方式,将通常使用的距离比较方式简化为整型数的异或运算,大大降低了计算复杂度,达到了数据库分级查找的目的,从而实现了提高人脸特征查找效率的技术效果,进而解决了百万量级人脸识别特征库的特征查找效率低的技术问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述数据查询方法的数据查询装置,如图6所示,该装置包括:转换单元、查找单元、获取单元和确定单元;
所述转换单元,用于将第一查询元素按照第一预设规则转换为第二查询元素;
进一步地,如前述的装置,所述第一查询元素为向量;所述转换单元包括第一投影单元和第二投影单元;
所述第一投影单元,用于将所述第一查询元素的各个值通过Sigmoid函数投影为在0和1之间;
所述第二投影单元,用于将所述所有在0和1之间的各个值按照第三预设规则投影为各个值为0或1;所述各个值为0或1的元素为第二查询元素;
更进一步地,所述第二投影单元,包括第一判断单元和第一赋值单元;
所述第一判断单元,用于判断各个值在0和1之间的欲投影的元素中的值是否大于0.5;
所述第一赋值单元,用于在所述值大于0.5时,将所述值投影为1;
所述第一赋值单元,还用于在所述值不大于0.5时,将所述值投影为0。
具体地,例如,取第一查询元素q1(0,1,-1),第一投影单元将q1进行Sigmoid转换,Sigmoid函数的表达式为
因此S(q1)=(1/2,1/(1+1/e),1/(1+e));第二投影单元再将S(q1)进行二进制转换,第一判断单元判断S(q1)中的值是否大于0.5,若值大于0.5,第一赋值单元则将所述值投影为1,若值不大于0.5,第一赋值单元则将所述值投影为0,因此bin_S(q1)=(0,1,0),则第二查询元素为q1’(0,1,0)。
所述查找单元,用于在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,其中,所述特征数据库包括特征集和目录集;所述特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示特征集中对应特征元素来自于原始数据库中的哪个或哪些原始元素;
进一步地,所述查找单元,包括对比单元、第一计算单元、第一比较单元和第一选择单元;
所述对比单元,用于将所述第二查询元素的各个值与所述特征数据库的所述特征集中的各个特征元素的各个对应的值一一对比,若相同则计数为0,若不同则计数为1;
所述第一计算单元,用于所述第二查询元素的所有值的对比计数之和;
所述第一比较单元,用于比较所有所述对比计数之和;
所述第一选择单元,用于选取对比计数之和最小的特征元素为所述最接近的特征元素。
具体地,例如,特征集中有两个特征元素k1(0,0,1)和k2(0,1,1);获取第一个特征元素k1(0,0,1),对比单元将q1’(0,1,0)的各个值与k1(0,0,1)各个对应的值一一对比,若相同则计数为0,若不同则计数为1,然后第一计算单元计算所有值的对比计数之和,即第一个值相同,后两个值不同,total_count_1=0+1+1=2;获取第二个特征元素k2(0,1,1),对比单元将q1’(0,1,0)的各个值与k2(0,1,1)各个对应的值一一对比,若相同则计数为0,若不同则计数为1,然后第一计算单元计算所有值的对比计数之和,即前两个值相同,最后一个值不同,total_count_2=0+0+1=1;第一比较单元比较得知total_count_1>total_count_2,则第一选择单元选取第二个特征元素k2为最接近的特征元素。
所述获取单元,用于获取与所述最接近的特征元素对应的所述原始元素;
具体地,获取单元根据与特征元素对应的目录集中的目录元素获取原始数据库中的原始元素;特征集和目录集的具体获得方式如下:
例如,原人脸特征数据库包含M个人脸特征,其中M为100万,每个人脸特征为一个长度为N的一维向量(N通常为128、512等),则原数据库O为矩阵(M,N);
获取第一个人脸特征a1(0,2,3)(为简化处理,此处用N取3来举例),此时第一特征集K为空,则将a1(0,2,3)添加到第一特征集中,并将a1(0,2,3)在矩阵O(M,N)中的身份信息O_a1添加到目录集C的对应目录元素A中,此时第一特征集更新为K(a1),目录集更新为C(A),目录元素A更新为A(O_a1);
获取第二个人脸特征b1(0,5,8),此时第一特征集K已不为空,计算b1(0,5,8)与a1(0,2,3)的点积d=a1·b1=0·0+2·5+3·8=34,由于目前K中只有a1一个特征元素,所以a1为最近特征元素,44为最近距离;
预设阈值Th为30,判断34大于预设阈值Th,则将b1(0,5,8)添加到第一特征集中,并将b1(0,5,8)在矩阵O(M,N)中的身份信息O_b1添加到目录集C的对应目录元素B中,此时第一特征集更新为K(a1,b1),目录集更新为C(A,B),目录元素B更新为B(O_b1);
获取第三个人脸特征a2(0,2,4),此时第一特征集K已不为空,计算a2(0,2,4)与a1(0,2,3)的点积d1=a1·a2=0·0+2·2+3·4=16,计算a2(0,2,4)与b1(0,5,8)的点积d1=b1·a2=0·0+5·2+8·4=42,比较16<42,所以a1为最近特征元素,16为最近距离;
判断16小于预设阈值Th=30,则将K中的a1替换为a1’=(a1+a2)/2=(0,2,7/2),并将a2在矩阵O(M,N)中的身份信息O_a2添加到目录集C的对应目录元素A中,此时第一特征集更新为K(a1’,b1),目录集更新为C(A’,B),目录元素A更新为A’(O_a1,O_a2);目录元素B为B(O_b1);
重复以上步骤,直至矩阵O(M,N)中所有特征元素的身份信息都添加到目录集C中;
取第一特征集K中的特征元素a1’(0,2,7/2);将a1’进行Sigmoid转换,Sigmoid函数的表达式为
因此S(a1’)=(1/2,1/(1+1/e2),1/(1+1/e7/2));再将S(a1’)进行二进制转换,即若值大于0.5,则将所述值投影为1,若值不大于0.5,则将所述值投影为0,因此bin_S(a1’)=(0,1,1);然后将bin_S(a1’)添加到第二特征集B_K中,则第二特征集B_K中的特征元素的值为0或1。
因此,通过特征元素和与其对应的目录元素可获得原始数据库中的一个或多个原始元素。
所述确定单元,用于根据所获取的所述原始元素确定查询结果。
进一步地,所述确定单元,包括第二判断单元、第二选择单元、第二计算单元和第二比较单元;
所述第二判断单元,用于判断所述原始元素的个数是否大于1;
所述第二选择单元,用于在所述原始元素的个数不大于1时,将所述原始元素定为所述查询结果;
所述第二计算单元,用于在若所述原始元素的个数大于1时,计算所述第一查询元素与各个所述原始元素的距离;
所述第二比较单元,用于比较各个所述距离;
所述第二选择单元,还用于选取与所述第一查询元素距离最小的原始元素为所述查询结果。
具体地,例如最近特征元素k3(0,0,0)的原始元素为a3(0,-1,-2),第二判断单元判断只有一个原始元素,因此第二选择单元判定a3(0,-1,-2)为查询结果;再例如,最近特征元素k2(0,1,1)的原始元素为a1(0,2,3)与a2(0,2,4),第二判断单元判断有两个原始元素,第二计算单元分别计算第一查询元素q1(0,1,-1)与a1(0,2,3)和a2(0,2,4)的点积,d1=q1·a1=(0·0+1·2+(-1)·3)=-1,d2=q1·a2=(0·0+1·2+(-1)·4)=-2,第二比较单元比较得知|d1|<|d2|,则第二选择单元选择原始元素a1(0,2,3)为查询结果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种数据查询方法,其特征在于,包括:
将第一查询元素按照第一预设规则转换为第二查询元素;
在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,其中,所述特征数据库包括特征集和目录集;所述特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示特征集中对应特征元素来自于原始数据库中的哪个或哪些原始元素;
获取与所述最接近的特征元素对应的所述原始元素;
根据所获取的所述原始元素确定查询结果。
2.根据权利要求1所述的方法,其特征在于,所述第一查询元素为向量;将所述第一查询元素按照第一预设规则转换为第二查询元素,包括:
S11.将所述第一查询元素的各个值通过Sigmoid函数投影为在0和1之间;
S12.将所述所有在0和1之间的各个值按照第三预设规则投影为各个值为0或1;所述各个值为0或1的元素为第二查询元素。
3.根据权利要求2所述的方法,其特征在于,所述S12,包括:
S121.获取各个值在0和1之间的欲投影的元素中的值;
S122.判断所述值是否大于0.5;
S123.若所述值大于0.5,则将所述值投影为1;
S124.若所述值不大于0.5,则将所述值投影为0;
S125.重复S121至S124,直至所述元素的所有值为0或1。
4.根据权利要求1或3所述的方法,其特征在于,所述在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,包括:
S21.获取所述特征数据库的所述特征集中的一个特征元素;
S22.将所述第二查询元素的各个值与所述特征元素的各个对应的值一一对比,若相同则计数为0,若不同则计数为1;计算所述第二查询元素的所有值的对比计数之和;
S23.重复步骤S21至S22,直至所述第二查询元素与所述特征集中所有的特征元素对比完成;
S24.比较所有所述对比计数之和,选取对比计数之和最小的特征元素为所述最接近的特征元素。
5.根据权利要求1或3所述的方法,其特征在于,所述根据所获取的所述原始元素确定查询结果,包括:
S41.判断所述原始元素的个数是否大于1;
S42.若所述原始元素的个数不大于1,则所述原始元素为所述查询结果;
S43.若所述原始元素的个数大于1,则计算所述第一查询元素与各个所述原始元素的距离;
S44.比较各个所述距离,选取与所述第一查询元素距离最小的原始元素为所述查询结果。
6.一种数据查询装置,其特征在于,包括:转换单元、查找单元、获取单元和确定单元;
所述转换单元,用于将第一查询元素按照第一预设规则转换为第二查询元素;
所述查找单元,用于在特征数据库中按照第二预设规则查找与所述第二查询元素最接近的特征元素,其中,所述特征数据库包括特征集和目录集;所述特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示特征集中对应特征元素来自于原始数据库中的哪个或哪些原始元素;
所述获取单元,用于获取与所述最接近的特征元素对应的所述原始元素;
所述确定单元,用于根据所获取的所述原始元素确定查询结果。
7.根据权利要求6所述的装置,其特征在于,所述第一查询元素为向量;所述转换单元包括第一投影单元和第二投影单元;
所述第一投影单元,用于将所述第一查询元素的各个值通过Sigmoid函数投影为在0和1之间;
所述第二投影单元,用于将所述所有在0和1之间的各个值按照第三预设规则投影为各个值为0或1;所述各个值为0或1的元素为第二查询元素。
8.根据权利要求7所述的装置,其特征在于,所述第二投影单元,包括第一判断单元和第一赋值单元;
所述第一判断单元,用于判断各个值在0和1之间的欲投影的元素中的值是否大于0.5;
所述第一赋值单元,用于在所述值大于0.5时,将所述值投影为1;
所述第一赋值单元,还用于在所述值不大于0.5时,将所述值投影为0。
9.根据权利要求6或8所述的装置,其特征在于,所述查找单元,包括对比单元、第一计算单元、第一比较单元和第一选择单元;
所述对比单元,用于将所述第二查询元素的各个值与所述特征数据库的所述特征集中的各个特征元素的各个对应的值一一对比,若相同则计数为0,若不同则计数为1;
所述第一计算单元,用于所述第二查询元素的所有值的对比计数之和;
所述第一比较单元,用于比较所有所述对比计数之和;
所述第一选择单元,用于选取对比计数之和最小的特征元素为所述最接近的特征元素。
10.根据权利要求6或8所述的装置,其特征在于,所述确定单元,包括第二判断单元、第二选择单元、第二计算单元和第二比较单元;
所述第二判断单元,用于判断所述原始元素的个数是否大于1;
所述第二选择单元,用于在所述原始元素的个数不大于1时,将所述原始元素定为所述查询结果;
所述第二计算单元,用于在若所述原始元素的个数大于1时,计算所述第一查询元素与各个所述原始元素的距离;
所述第二比较单元,用于比较各个所述距离;
所述第二选择单元,还用于选取与所述第一查询元素距离最小的原始元素为所述查询结果。
CN201810644027.2A 2018-06-21 2018-06-21 数据查询方法和装置 Pending CN109062942A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810644027.2A CN109062942A (zh) 2018-06-21 2018-06-21 数据查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810644027.2A CN109062942A (zh) 2018-06-21 2018-06-21 数据查询方法和装置

Publications (1)

Publication Number Publication Date
CN109062942A true CN109062942A (zh) 2018-12-21

Family

ID=64821337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810644027.2A Pending CN109062942A (zh) 2018-06-21 2018-06-21 数据查询方法和装置

Country Status (1)

Country Link
CN (1) CN109062942A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573681A (zh) * 2015-02-11 2015-04-29 成都果豆数字娱乐有限公司 一种人脸识别方法
CN105354902A (zh) * 2015-11-10 2016-02-24 深圳市商汤科技有限公司 一种基于人脸识别的安保管理方法及系统
WO2016112630A1 (zh) * 2015-01-12 2016-07-21 芋头科技(杭州)有限公司 一种影像识别系统及方法
CN105808709A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸识别快速检索方法及装置
CN107577990A (zh) * 2017-08-09 2018-01-12 武汉世纪金桥安全技术有限公司 一种基于gpu加速检索的大规模人脸识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016112630A1 (zh) * 2015-01-12 2016-07-21 芋头科技(杭州)有限公司 一种影像识别系统及方法
CN104573681A (zh) * 2015-02-11 2015-04-29 成都果豆数字娱乐有限公司 一种人脸识别方法
CN105354902A (zh) * 2015-11-10 2016-02-24 深圳市商汤科技有限公司 一种基于人脸识别的安保管理方法及系统
CN105808709A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸识别快速检索方法及装置
CN107577990A (zh) * 2017-08-09 2018-01-12 武汉世纪金桥安全技术有限公司 一种基于gpu加速检索的大规模人脸识别方法

Similar Documents

Publication Publication Date Title
US7184577B2 (en) Image indexing search system and method
CN111198959A (zh) 一种基于卷积神经网络的两阶段图像检索方法
Lee et al. Object matching for information integration: A profiler-based approach
Duan et al. Dga-gnn: Dynamic grouping aggregation gnn for fraud detection
CN109711228B (zh) 一种实现图像识别的图像处理方法及装置、电子设备
Aly et al. Indexing in large scale image collections: Scaling properties and benchmark
CN107291895B (zh) 一种快速的层次化文档查询方法
Jaffe et al. Gallery filter network for person search
Wang et al. Research on money laundering detection based on improved minimum spanning tree clustering and its application
CN111539285A (zh) 一种基于特征编码的高效人脸聚类方法
CN112966652A (zh) 轨迹汇聚方法、装置、计算机设备及存储介质
Hu et al. Real-time target tracking based on pcanet-csk algorithm
Karampidis et al. File type identification-computational intelligence for digital forensics
CN109871891A (zh) 一种物体识别方法、装置和存储介质
CN111291785B (zh) 目标检测的方法、装置、设备及存储介质
Costache et al. Categorization based relevance feedback search engine for earth observation images repositories
CN109062942A (zh) 数据查询方法和装置
Chen et al. Effective and efficient content redundancy detection of web videos
Schlake et al. Towards automated clustering
Cho et al. A novel virus infection clustering for flower images identification
Su et al. Churn prediction in telecommunications industry based on conditional Wasserstein GAN
CN115048682B (zh) 一种土地流转信息的安全存储方法
CN117891819A (zh) 一种集合聚集k-means法的数据库实现方法
Rayatidamavandi et al. A comparison of hash-based methods for trajectory clustering
Boukerma et al. A local patterns weighting approach for optimizing content-based image retrieval using a differential evolution algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20181221

Assignee: Apple R&D (Beijing) Co.,Ltd.

Assignor: BEIJING MOSHANGHUA TECHNOLOGY Co.,Ltd.

Contract record no.: 2019990000055

Denomination of invention: Sh interface data query method and device

License type: Common License

Record date: 20190211

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221