[go: up one dir, main page]

RU2844774C1 - Method for non-biometric verification of persons - Google Patents

Method for non-biometric verification of persons

Info

Publication number
RU2844774C1
RU2844774C1 RU2024133724A RU2024133724A RU2844774C1 RU 2844774 C1 RU2844774 C1 RU 2844774C1 RU 2024133724 A RU2024133724 A RU 2024133724A RU 2024133724 A RU2024133724 A RU 2024133724A RU 2844774 C1 RU2844774 C1 RU 2844774C1
Authority
RU
Russia
Prior art keywords
images
faces
face
verification
neural network
Prior art date
Application number
RU2024133724A
Other languages
Russian (ru)
Inventor
Юлия Сергеевна Чернышова
Александр Владимирович Шешкус
Никита Алексеевич Яковлев
Original Assignee
Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС"
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" filed Critical Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС"
Application granted granted Critical
Publication of RU2844774C1 publication Critical patent/RU2844774C1/en

Links

Abstract

FIELD: information security.
SUBSTANCE: method includes steps of: obtaining two facial images for verification, constructing a single image, applying a convolutional neural network to the single image, the output of this network is the similarity of faces on the two original images score, wherein neural network training is performed on data set, where X is plurality of face images, Y is a plurality of marks that one-to-one correspond to images from plurality X, where mark is a class – unique for each person identifier, further generating, using said set of data, positive and negative pairs of images, further, for these pairs, marking is automatically created, which indicates whether this pair is negative or positive.
EFFECT: high information security of the face verification process on two source images due to that verification takes place without calculation, transmission or storage of biometric data of the user.
1 cl, 4 dwg, 1 tbl

Description

Заявленное техническое решение относится к области информационной безопасности, а именно к сверке лица на двух исходных изображениях без расчета, передачи или сохранения биометрических данных пользователя.The claimed technical solution relates to the field of information security, namely to the verification of a face on two original images without calculating, transmitting or storing the user's biometric data.

Сверка лиц - это широко используемая технология верификации личности человека, которая на основе двух изображений лица выносит вердикт о принадлежности этих лиц одному человеку. В патентах на методы сверки лиц, а также в патентах на системы, использующие сверку лиц, предлагается реализовывать сверку путем независимого расчета биометрических данных по изображениям двух сравниваемых лиц, например - в CN110555450B (опублик. 28.06.2022), CN107194341B (опублик. 21.04.2020), JP7165746B2 (опублик. 04.11.2022), WO2016/131083A1 (опублик. 25.08.2016). Также во многих патентах (например, CN105407042 (опублик. 04.01.2019), RU2249248C2 (опублик. 27.03.2005), RU2638775C2 (опублик. 15.12.2017)) предполагается схема, в которой расчет биометрических данных для одного из изображений производится заранее, и эти данные сохраняются в базе данных в качестве эталона для последующего сравнения.Face verification is a widely used technology for human identity verification, which, based on two facial images, makes a verdict on whether the faces belong to the same person. Patents for face verification methods, as well as patents for systems using face verification, propose to implement verification by independently calculating biometric data from the images of two compared faces, for example, in CN110555450B (published on 28.06.2022), CN107194341B (published on 21.04.2020), JP7165746B2 (published on 04.11.2022), WO2016/131083A1 (published on 25.08.2016). Also, many patents (for example, CN105407042 (published 04.01.2019), RU2249248C2 (published 27.03.2005), RU2638775C2 (published 15.12.2017)) suggest a scheme in which the calculation of biometric data for one of the images is performed in advance, and this data is stored in the database as a standard for subsequent comparison.

Таким образом, стандартным и широко принятым способом сверки лиц на двух изображениях является независимый расчет тем или иным методом векторов признаков каждого лица и последующее сравнение двух этих векторов. В патентах CN110414305A (опублик. 05.11.2019), CN106096538B (опублик. 23.08.2019), US10747989B2 (опублик. 18.08.2020) в качестве метода расчета вектора признаков предлагается использовать искусственную нейронную сеть. Как правило, такие сети обучаются при помощи триплетной функции потерь (triplet loss) или парной функции потерь (contrastive loss). Для обучения с помощью триплетной функции потерь используются так называемые генераторы триплетов - генераторы троек изображений, где одно изображение называется "якорем" и имеет класс А, еще одно изображение имеет такой же класс А и образует с якорем позитивную пару, третье изображение имеет класс В и образует с якорем негативную пару. При обучении с помощью парной функции потерь используются генераторы пар, которые из исходной выборки создают позитивные и негативные пары. Такой способ сверки лиц несет существенные угрозы информационной безопасности личности, подвергаемой проверке. Угроза заключается в потенциальной утечке биометрических данных его лица. Современные генеративные модели позволяют на основе биометрических признаков лиц восстановить изображение лица жертвы, что позволяет обманывать системы распознавания лиц [1, 2].Thus, the standard and widely accepted method for comparing faces in two images is to independently calculate the feature vectors of each face using one method or another and then compare the two vectors. Patents CN110414305A (published 05.11.2019), CN106096538B (published 23.08.2019), US10747989B2 (published 18.08.2020) propose using an artificial neural network as a method for calculating the feature vector. As a rule, such networks are trained using a triplet loss function or a contrastive loss function. For training using the triplet loss function, so-called triplet generators are used - generators of image triplets, where one image is called an "anchor" and has class A, another image has the same class A and forms a positive pair with the anchor, the third image has class B and forms a negative pair with the anchor. When training using the pair loss function, pair generators are used that create positive and negative pairs from the original sample. This method of face verification poses significant threats to the information security of the person being checked. The threat lies in the potential leakage of biometric data of his face. Modern generative models allow, based on biometric features of faces, to reconstruct the image of the victim's face, which allows deceiving face recognition systems [1, 2].

Задачей заявленного изобретения является устранение недостатков известного уровня техники. Технический результат заключается в обеспечении способа небиометрической сверки лиц, который позволяет обеспечить возможность сверить лица на двух исходных изображениях без расчета, передачи или сохранения биометрических данных пользователя, а также обеспечивает повышение информационной безопасности процесса сверки.The objective of the claimed invention is to eliminate the disadvantages of the known level of technology. The technical result consists in providing a method for non-biometric verification of faces, which makes it possible to verify faces on two original images without calculating, transmitting or storing the user's biometric data, and also ensures increased information security of the verification process.

Поставленная задача решается, а заявленный технический результат достигается посредством заявленного способа небиометрической сверки лиц. Заявленный способ небиометрической сверки лиц заключается в том, что получают два изображения лица для сверки, строят единое изображение из двух изображений лиц, далее применяют сверточную нейронную сеть к построенному единому изображению, выходом данной сети является оценка схожести лиц на двух исходных изображениях, причем обучение нейронной сети производят на наборе данных, где X - это множество изображений лиц, Y - множество меток, которые взаимно однозначно соответствуют изображениям из множества X, где метка представляет из себя класс - уникальный для каждого лица идентификатор, далее генерируют с помощью этого набора данных позитивные и негативные пары изображений, далее для этих пар автоматически создается разметка, показывающая негативная или позитивная данная пара, при этом для использования в процессе обучения изображения лиц предварительно нормализуются, при этом по каждой паре сеть предсказывает вероятность того, что два лица на изображении принадлежат одному классу, в качестве функции потерь используют бинарная кросс-энтропия.The stated problem is solved and the claimed technical result is achieved by means of the claimed method of non-biometric verification of faces. The claimed method of non-biometric verification of faces consists in obtaining two images of a face for verification, constructing a single image from the two images of faces, then applying a convolutional neural network to the constructed single image, the output of this network is an assessment of the similarity of faces in two original images, and the neural network is trained on a data set, where X is a set of face images, Y is a set of labels that mutually uniquely correspond to images from set X, where the label is a class - a unique identifier for each face, then positive and negative pairs of images are generated using this data set, then a markup is automatically created for these pairs, showing whether the given pair is negative or positive, and for use in the training process, the face images are preliminarily normalized, and for each pair the network predicts the probability that two faces in the image belong to the same class, binary cross-entropy is used as a loss function.

На фигурах представлены:The figures show:

Фиг. 1: Примеры изображений одного лица (одна строка - одно лицо).Fig. 1: Examples of images of one face (one line - one face).

Фиг 2: Пример изображений разных лиц.Fig. 2: Example of images of different faces.

Фиг. 3: Пример нормализации лица.Fig. 3: Example of face normalization.

Фиг. 4: Алгоритм заявленного способа.Fig. 4: Algorithm of the claimed method.

Осуществление заявленного способа заключается в следующем.The implementation of the claimed method is as follows.

На входе имеем два изображения лица для сверки. Сначала строится единое изображение из двух изображений лиц (например, за счет увеличения канальности изображения, то есть, из двух изображения лица, каждое размером W×H×1, построено одно изображение размером W×H×2). Построение единого изображения необходимо, так как при последовательной или параллельной подачи двух раздельных изображений лиц в сеть неизбежно происходит построения биометрических признаков лиц (так как именно такие признаки являются ответом нейронной сети). Далее идет основной этап предложенного метода - применение сверточной нейронной сети к построенному единому изображению. Ни на одном из слоев не происходит разделения обрабатываемой информации на два набора признаков. Выходом данной сети является оценка схожести лиц на двух исходных изображениях.At the input we have two images of a face for verification. First, a single image is constructed from two images of faces (for example, by increasing the channelization of the image, i.e., from two images of a face, each measuring W×H×1, one image measuring W×H×2 is constructed). Construction of a single image is necessary, since when two separate images of faces are fed to the network sequentially or in parallel, biometric features of faces are inevitably constructed (since these features are the response of the neural network). Next comes the main stage of the proposed method - application of a convolutional neural network to the constructed single image. No layer divides the processed information into two sets of features. The output of this network is an assessment of the similarity of faces in two original images.

Данные для обучения нейронной сетиData for training a neural network

Пусть X - это множество изображений лиц. Y - множество меток, которые взаимно однозначно соответствуют изображениям из множества X. Метка представляет из себя класс - уникальный для каждого лица идентификатор. Это означает, что разные изображения одного и того же лица относятся к одному и тому же классу, а изображения разных лиц - к разным классам (см. фиг. 1, 2).Let X be a set of face images. Y be a set of labels that correspond one-to-one to images from the set X. A label represents a class - a unique identifier for each face. This means that different images of the same face belong to the same class, and images of different faces belong to different classes (see Fig. 1, 2).

С помощью этого набора данных создаются пары изображений: позитивные и негативные. Позитивные пары - это пары различных изображений одного класса. Негативные пары - пары изображений разных классов. Для этих пар автоматически создается разметка, показывающая негативная или позитивная данная пара.Using this dataset, pairs of images are created: positive and negative. Positive pairs are pairs of different images of the same class. Negative pairs are pairs of images of different classes. For these pairs, a markup is automatically created showing whether the pair is negative or positive.

Для использования в процессе обучения изображения лиц предварительно нормализуются (см. фиг. 3), то есть приводятся в виду в анфас, где лицо занимается большую часть изображения.For use in the training process, the images of faces are first normalized (see Fig. 3), that is, they are presented in full face, where the face occupies most of the image.

Также в процессе обучения могут использоваться различные аугментации, например:Also, various augmentations can be used in the learning process, for example:

1. Размытие изображения с фильтром Гаусса1. Blur an image with a Gaussian filter

2. Наложение импульсного шума.2. Imposition of impulse noise.

3. Наложение нескольких тонких линий черного или белого цвета.3. Overlaying several thin lines of black or white color.

4. Наложение бликов.4. Applying highlights.

5. Поворот вокруг вертикальной оси.5. Rotation around the vertical axis.

6. Повороты изображения на несколько градусов (до трех).6. Image rotations by several degrees (up to three).

7. Небольшое масштабирование изображения7. Slightly scaling the image

Обучение нейронной сетиTraining a neural network

Два изображения в паре объединяются в одно (как было описано ранее). Используемая нейронная сеть представляет из себя последовательность слоев с функциями активации. По каждой паре сеть предсказывает вероятность того, что два лица на изображении принадлежат одному классу, то есть классифицирует пары по двум классам (см. фиг. 4). В качестве функции потерь используется бинарная кросс-энтропия.Two images in a pair are combined into one (as described earlier). The neural network used is a sequence of layers with activation functions. For each pair, the network predicts the probability that two faces in the image belong to the same class, i.e. it classifies pairs into two classes (see Fig. 4). Binary cross-entropy is used as a loss function.

Особенности обучения нейронной сетиFeatures of neural network training

При обучении такой нейронной сети важно иметь информацию не о принадлежности каждого изображения лица к определенному классу, а о принадлежности лиц в каждой из пар к одному классу. Эту информацию можно получить из стандартных наборов данных, в том числе из открытых, где каждому лицу соответствует идентификатор класса, к которому оно принадлежит. Саму сеть можно обучать с использованием генератора триплетов для триплетной функции потерь. Из каждого триплета составляется пара лиц, принадлежащих одному классу (якорь и позитивный элемент) и пара лиц, принадлежащих разным классам (якорь и негативный элемент). Далее сеть обучается с использованием стандартной кросс энтропии вместо триплетной функции потерь именно как классифицирующая сеть, а не как метрическая.When training such a neural network, it is important to have information not about the belonging of each face image to a certain class, but about the belonging of faces in each pair to the same class. This information can be obtained from standard data sets, including open ones, where each face has an identifier of the class to which it belongs. The network itself can be trained using a triplet generator for the triplet loss function. Each triplet is made up of a pair of faces belonging to the same class (anchor and positive element) and a pair of faces belonging to different classes (anchor and negative element). The network is then trained using standard cross entropy instead of the triplet loss function, namely as a classifying network, not as a metric one.

Раскрытие оборудования:Equipment disclosure:

Реализация такой сверки возможна на разном оборудовании, способном запустить используемую нейронную сеть. Так, сеть предложенной архитектуры может быть запущена на центральном процессоре или GPU персонального компьютера, центральном процессоре или GPU смартфона, центральном процессоре или GPU планшетного компьютера.The implementation of such verification is possible on different equipment capable of launching the neural network used. Thus, the network of the proposed architecture can be launched on the central processor or GPU of a personal computer, the central processor or GPU of a smartphone, the central processor or GPU of a tablet computer.

Пример осуществления:Example of implementation:

Создание объединенного изображения может осуществлено операцией поканальной склейки по одной из размерностей, например, если склеивать по каналам, то из двух изображения лица, каждое размером W×H×C, построено одно изображение размером W×H×2C.The creation of a combined image can be carried out by the operation of channel-by-channel gluing along one of the dimensions, for example, if gluing along channels, then from two images of a face, each of size W×H×C, one image of size W×H×2C is constructed.

В качестве сети, строящей оценку, предлагается использовать сверточную сеть, состоящую из нескольких последовательных слоев свертку, пример которой приведен в таблице 1.It is proposed to use a convolutional network consisting of several successive convolution layers as the network that builds the assessment, an example of which is given in Table 1.

При этом, в других вариантах реализации могут использоваться сети самых различных архитектур, например, сети с остаточными связями (ResNet), сети со слоями внимания, рекуррентные сети, в том числе LSTM и другие архитектуры. Выходом нейронной сети может являться как одно число на фиксированном интервале, например, на непрерывном интервале [0, 1]. В другой реализации выходом сети может являться два класса с оценками, где один класс соответствует одинаковым лица, а второй - разным.In other implementations, networks of various architectures can be used, such as networks with residual connections (ResNet), networks with attention layers, recurrent networks, including LSTM and other architectures. The output of a neural network can be a single number on a fixed interval, such as on a continuous interval [0, 1]. In another implementation, the output of the network can be two classes with ratings, where one class corresponds to identical faces, and the second to different faces.

Для обучения используются изображения ~1 млн разных людей разных рас, пол, возраста, изображения людей с аксессуарами, мешающими распознаванию, например, бородой, очками.For training, images of ~1 million different people of different races, genders, ages, images of people with accessories that interfere with recognition, such as beards and glasses, are used.

Список источников:List of sources:

1 D. Deb, J. Zhang and А.K. Jain, "AdvFaces: Adversarial Face Synthesis," 2020 IEEE International Joint Conference on Biometrics (IJCB), Houston, TX, USA, 2020, pp. 1-10, doi: 10.1109/IJCB48548.2020.93048981 D. Deb, J. Zhang and A.K. Jain, "AdvFaces: Adversarial Face Synthesis," 2020 IEEE International Joint Conference on Biometrics (IJCB), Houston, TX, USA, 2020, pp. 1-10, doi: 10.1109/IJCB48548.2020.9304898

2 Yujun Shen, Ping Luo, Junjie Yan, Xiaogang Wang, Xiaoou Tang; Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018, pp. 821-8302 Yujun Shen, Ping Luo, Junjie Yan, Xiaogang Wang, Xiaoou Tang; Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018, pp. 821-830

Claims (1)

Способ небиометрической сверки лиц, заключающийся в том, что получают два изображения лица для сверки, строят единое изображение из двух изображений лиц, далее применяют сверточную нейронную сеть к построенному единому изображению, выходом данной сети является оценка схожести лиц на двух исходных изображениях, причем обучение нейронной сети производят на наборе данных, где X - это множество изображений лиц, Y - множество меток, которые взаимно однозначно соответствуют изображениям из множества X, где метка представляет из себя класс - уникальный для каждого лица идентификатор, далее генерируют с помощью этого набора данных позитивные и негативные пары изображений, далее для этих пар автоматически создается разметка, показывающая, негативная или позитивная данная пара, при этом для использования в процессе обучения изображения лиц предварительно нормализуются, при этом по каждой паре сеть предсказывает вероятность того, что два лица на изображении принадлежат одному классу, в качестве функции потерь используют бинарная кросс-энтропия.A method for non-biometric verification of faces, which consists in obtaining two images of a face for verification, constructing a single image from the two images of faces, then applying a convolutional neural network to the constructed single image, the output of this network is an assessment of the similarity of faces in two original images, wherein the neural network is trained on a data set, where X is a set of images of faces, Y is a set of labels that mutually one-to-one correspond to images from set X, where the label is a class - an identifier unique to each face, then positive and negative pairs of images are generated using this data set, then a markup is automatically created for these pairs, showing whether the given pair is negative or positive, wherein the images of faces are pre-normalized for use in the training process, wherein for each pair the network predicts the probability that two faces in the image belong to the same class, binary cross-entropy is used as a loss function.
RU2024133724A 2024-11-11 Method for non-biometric verification of persons RU2844774C1 (en)

Publications (1)

Publication Number Publication Date
RU2844774C1 true RU2844774C1 (en) 2025-08-06

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7837045B2 (en) * 2005-04-04 2010-11-23 Siemens Aktiengesellschaft Osterreich Rail vehicle with coupling connection adapted for crash
AU2013213886B2 (en) * 2012-02-03 2017-07-13 See-Out Pty Ltd. Notification and privacy management of online photos and videos
CN110598535A (en) * 2019-07-31 2019-12-20 广西大学 Face recognition analysis method used in monitoring video data
CN107967677B (en) * 2017-12-15 2020-02-04 Oppo广东移动通信有限公司 Image processing method, image processing device, computer-readable storage medium and computer equipment
US20200065563A1 (en) * 2018-08-21 2020-02-27 Software Ag Systems and/or methods for accelerating facial feature vector matching with supervised machine learning

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7837045B2 (en) * 2005-04-04 2010-11-23 Siemens Aktiengesellschaft Osterreich Rail vehicle with coupling connection adapted for crash
AU2013213886B2 (en) * 2012-02-03 2017-07-13 See-Out Pty Ltd. Notification and privacy management of online photos and videos
CN107967677B (en) * 2017-12-15 2020-02-04 Oppo广东移动通信有限公司 Image processing method, image processing device, computer-readable storage medium and computer equipment
US20200065563A1 (en) * 2018-08-21 2020-02-27 Software Ag Systems and/or methods for accelerating facial feature vector matching with supervised machine learning
CN110598535A (en) * 2019-07-31 2019-12-20 广西大学 Face recognition analysis method used in monitoring video data

Similar Documents

Publication Publication Date Title
Manisha et al. Cancelable biometrics: a comprehensive survey
Tolosana et al. Biometric presentation attack detection: Beyond the visible spectrum
Jia et al. 3D face anti-spoofing with factorized bilinear coding
Zeng et al. Hand-crafted feature guided deep learning for facial expression recognition
Jagadeesan et al. Secured cryptographic key generation from multimodal biometrics: feature level fusion of fingerprint and iris
CN112639809A (en) User adaptation for biometric authentication
WO2019152983A2 (en) System and apparatus for face anti-spoofing via auxiliary supervision
Rehman et al. Face liveness detection using convolutional-features fusion of real and deep network generated face images
Sudhakar et al. Cancelable biometrics using deep learning as a cloud service
Abdul-Al et al. The evolution of biometric authentication: A deep dive into multi-modal facial recognition: A review case study
Mira Deep learning technique for recognition of deep fake videos
CN114036553A (en) A Pedestrian Identity Privacy Protection Method Combined with k Anonymity
Ibrahim et al. Deep fingerprint classification network
Zeng et al. Occlusion‐invariant face recognition using simultaneous segmentation
Diarra et al. Study of deep learning methods for fingerprint recognition
George et al. A comprehensive evaluation on multi-channel biometric face presentation attack detection
Jasmine et al. A privacy preserving based multi-biometric system for secure identification in cloud environment
Martin et al. A biometric encryption system for the self-exclusion scenario of face recognition
Hassan et al. Fusion of face and fingerprint for robust personal verification system
RU2844774C1 (en) Method for non-biometric verification of persons
JP2021093144A (en) Sensor-specific image recognition device and method
Akasaka et al. Model-free template reconstruction attack with feature converter
Nawshad et al. Boosting facial recognition capability for faces wearing masks using attention augmented residual model with quadruplet loss
Hashem et al. Key generation method from fingerprint image based on deep convolutional neural network model
Shaker et al. Identification Based on Iris Detection Technique.