WO2012038654A1 - Procede de classification de donnees biometriques - Google Patents
Procede de classification de donnees biometriques Download PDFInfo
- Publication number
- WO2012038654A1 WO2012038654A1 PCT/FR2011/052151 FR2011052151W WO2012038654A1 WO 2012038654 A1 WO2012038654 A1 WO 2012038654A1 FR 2011052151 W FR2011052151 W FR 2011052151W WO 2012038654 A1 WO2012038654 A1 WO 2012038654A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- biometric data
- distributions
- biometric
- bit
- individual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Definitions
- the invention relates to the field of biometric authentication computer processes, systems and program products.
- the invention relates more particularly to a method for classifying biometric data belonging to a continuous and limited observation space corresponding to at least one biometric sensor of a given type.
- the biometrics allowing the authentication of an individual include, for example, his voice, his gestures, his fingerprints or palm prints, the structure of his iris, the venous networks of his retina or the palm. in his hand, the morphology of his hand, as well as the features of his face.
- Each biometry is collected by at least one biometric sensor of a specific type, for example a microphone to pick up the voice of an individual.
- the sensor transforms the biometry that it captures into an analog signal.
- the analog signal is defined in a continuous and limited observation space.
- this signal is sampled then, during a parameterization step, a contiguous set of samples is transformed, for example by implementing transformations of Fourier, to obtain at least one multidimensional vector of determined parameters defined in a first representation space.
- An analog signal is thus represented in the first representation space by a sequence of multidimensional vectors of parameters.
- each occurrence of the terms 'biometric data' refers to a multidimensional vector of parameters and each occurrence of the terms 'set or collection of biometric data' refers to one or more multidimensional parameter vector sequences.
- the main methods of biometric authentication are based on the statistical modeling of the first representation space in a second representation space.
- This statistical modeling is based in particular on the hypothesis that a set of biometric data can be represented and classified in the second representation space in the form of a distribution of probability. This hypothesis is reasonable within certain limits not discussed here and has the advantage of defining each set of biometric data in a form that can be easily manipulated mathematically. It is possible to define the distribution of the biometric data in the second representation space by a set of simple statistical distributions, each characterized by a limited set of parameters. In the case of a universal collection of biometric data, the set of distributions representing the universal collection constitutes an average statistical model, called the universal statistical model.
- the classification methods are based on the statistical modeling of the acoustic space in a representation space defined by a mixture of Gaussian distributions or GMM (for Gaussian Mixture Model according to the English terminology) in which is classified a universal collection of voice signatures from a large number of speakers.
- GMM Gaussian Mixture Model according to the English terminology
- UBM Universal Background Model according to English terminology
- the universal statistical model derived from this statistical modeling constitutes a mean reference against which individual models can be derived through an adapter or estimator known as the Maximum A Posteriori (MAP), adapting or estimating all or part of the parameters describing the model. universal.
- MAP Maximum A Posteriori
- the model thus adapted to an individual or a class of individuals represents the specificities of the individual or the class of individuals. Since the universal model must have a large number of statistical distributions to be generic and an individual or class of individual is specified using a limited collection of biometric data, only a small part of the statistical distributions, ie parameters describing these distributions, is adapted to a speaker or a given class.
- the statistical distributions composing the universal model are called "components" of said model.
- a likeness score is obtained by comparing the likelihood of these data with the individual model against the likelihood of the same data with the universal model.
- the function corresponding to these likelihood scores is called the "likelihood ratio" and is usually projected into the logarithmic space to define the so-called log likelihood ratio function, or LLR (for Log Likelihood Ratio).
- Figure 1 illustrates both the general principle of statistical modeling and its main limitations.
- Figure 1 more particularly illustrates the probability distribution function F of a universal statistical model such as UBM (composed of only four components in a one-dimensional representation space) and the probability distribution function G of an individual model derived from this statistical model by MAP adaptation (of a single component of the universal model and by adapting among the parameters describing this component only the parameters of average).
- Figure 1 also illustrates the LLR function, referenced L, relating to the individual model and the universal model considered. The comments below with reference to Figure 1 help to understand the limitations of the statistical modeling approach.
- the point M in FIG. 1 represents the average of the adapted component of the individual model. This average represents information specific to the individual from the biometric learning data of the individual.
- the point E1 a represents the local maximum of the probability distribution function G of the individual model which is closest to the point M and the point E1b represents the local minimum of the probability distribution function G of the individual model which is the closer to the point M. It is observed that the points E1a and E1b do not have the same abscissa, nor are they symmetrically distributed around the point M. This is due not only to the adaptation by MAP, but also to the limitation number of components of the universal statistical model. The latter is directly linked to the need to have reliable statistical estimates that make it possible to obtain an individual model in which a significant part of the components show parameters that vary significantly from those of the universal model from which it derives.
- the log-likelihood ratio shows a maximum E2a and a minimum E2b that are distant from the point M.
- a first evolution of the usual statistical modeling approach consists in considering the universal statistical model (USM) as a definition of a space of representation of new data defined by the concatenation of the parameters of means of each component constituting said model, these new data being known as Supervisors (SV).
- USM universal statistical model
- SV Supervisors
- This space denoted supervisor space, allows the use of Support Vector Machine (SVM) machines which are a set of supervised learning techniques to solve problems of discrimination and of regression.
- SVM Support Vector Machine
- a second evolution of the usual statistical modeling approach consists in a direct modeling of the variability of sessions in the supervisors space by using a joint factorial analysis known under the acronym JFA (for Joint Factor Analysis according to the English terminology).
- JFA Joint Factor Analysis according to the English terminology.
- TS total variability space
- iV iVector
- the supervisors' space has a very large number of dimensions (usually hundreds of thousands of dimensions), making its joint factor analysis difficult.
- the extraction of the iVector corresponds precisely to a reduction in dimensionality to only a few thousand dimensions, which mainly makes it possible to apply simpler approaches to differentiate the variability of sessions and the variability of speakers; the iVector extraction techniques are similar to the techniques of joint factor analysis because these two types of techniques work in the same type of space, the space of the supervisors.
- the present invention provides a method of classifying biometric data to overcome one or more of the aforementioned disadvantages.
- the method for classifying biometric data belonging to a first continuous and limited representation space corresponding to at least one biometric sensor of a determined type comprises:
- each biometric data item is represented by a first distribution so that the biometric data are represented by a first set of first distributions, the first distributions obeying the same law of probability; a function of at least a first parameter, so that the first set of first distributions is defined by a first set of first parameters determined according to the biometric data,
- the first statistical model being defined by at least one second finite set of second distributions, the second distributions obeying the same probability law according to at least one second parameter and being distributed in the second representation space according to at least a second set second parameters, so that each second distribution defines a subspace of the second representation space comprising a plurality of first distributions representative of a portion of said universal collection of biometric data,
- the second set of second parameters being optimized by a first implementation of a likelihood maximization algorithm, so that the second finite set of second distributions represents with the maximum likelihood the first set of first distributions corresponding to said universal collection of biometric data,
- the first statistical model thus being at least adapted to match any biometric data with a given subspace, each subspace being associated with a plurality of biometric data, and
- a second step of constructing a second statistical model comprising a plurality of statistical sub-models in automatic classification of a set of first individual collections of biometric data, each sub-model being defined in a corresponding subspace of the second space; of representation,
- the second construction step comprising, for each representative distribution of each biometric data item of each individual collection, the determination of the corresponding subspace according to the first statistical model and, in this subspace, its classification in the corresponding sub-model , so that each submodel is defined by a third set of first distributions,
- the second constructing step further comprising, for each subspace, a step of selecting first distributions from said third set of first distributions by implementing an iterative coverage maximization and redundancy minimization algorithm, to determine a fourth minimum set of first distributions maximizing the subspace coverage, such that each submodel is defined by the fourth minimum set of first distributions corresponding thereto,
- the second statistical model is thus at least adapted to allow, for any biometric data of a subspace determined according to the first statistical model, to determine at least the first distribution with which its likelihood is maximal among the first distributions of the fourth minimum set of corresponding first distributions.
- the classification method thus makes it possible to construct, on the basis of a first universal statistical model, a second statistical model taking into account the biometric specificities of an individual or a class of individuals.
- a second statistical model taking into account the biometric specificities of an individual or a class of individuals.
- the method further comprises a first step of generating a set of likelihood vectors from a second individual collection of biometric data, the generation step comprising, for each first representative distribution of each biometric data item. of the second individual collection:
- the joint use of the first and second statistical models makes it possible to generate highly discriminating information representing the identity of an individual according to his or her biometric data, whether the latter are part of said universal collection of biometric data or of said set of first individual collections.
- the method further comprises a step of generating a set of first binary vectors from the second individual collection of biometric data, this step consisting for each likelihood vector to perform a statistical sampling determined among those consisting of at :
- each biometric datum corresponds to a first binary vector.
- the classification method thus makes it possible to represent the highly discriminating information representing the identity of an individual in a binary form whose storage, computer manipulation and transfer are easy and to make available authentication methods and systems. the wide scope of applications defined in the binary space.
- the method further comprises a step of generating at least a second binary vector from the set of first bit vectors or subsets of first binary vectors, this step of performing, between first binary vectors of the set or of each subset, a logical operation among those consisting of:
- a majority voting algorithm for determining, by sequential bit-to-bit comparisons between the first binary vectors considered, said at least one second binary vector by a distributed set of bits equal to 1, each corresponding to an average occurrence of bits equal to 1 greater than a second determined threshold value, or
- said at least one second bit vector comprising the same number of bits as each of said first bit vectors and the choice of logical operation being dictated by the number of bits equal to 1 of said at least one second bit vector obtained.
- the method thus makes it possible to easily control the identity of an individual by the simple comparison of two second independently determined binary vectors, a second reference binary vector and a second so-called authentication binary vector.
- each first or second binary vector comprises a number of bits equal to 1 determined among others according to one of the first, second and third threshold values, this number being at least an order of magnitude less than the number bits equal to 0.
- the method makes it possible to ensure a finely controlled discrimination level and to easily define and adjust a tolerance threshold for the decision.
- authentication method resulting from the comparison between a second reference binary vector and a second authentication binary vector, the tolerance threshold being for example defined by a number of differences in terms of bits or bit sequences over a total number of bits of each of said second bit vectors or a number of identical bit sequences determined by the comparison between these two bit vectors, respectively.
- the first statistical model is a hidden Markov model defined by the second finite set of second distributions as a function of sets of parameters including at least one set of state probabilities, each associated with a biometric datum, and a set of transition probabilities between states, the first implementation of implementing the so-called Baum-Welch likelihood maximization algorithm.
- the method thus makes it possible to construct a first statistical model that takes into account the sequence of processing the biometric data.
- the first statistical model is a Gaussian mixture model defined by the second finite set of second distributions as a function of sets of parameters including a set of vectors of means, a set of covariance matrices and a set of probabilities a priori, the first implementation to implement the so-maximization likelihood maximization algorithm according to a given maximum likelihood criterion.
- the method thus makes it possible to construct a first statistical model independent of the sequence of processing of the biometric data, which allows an automatic unsupervised learning and / or classification.
- each of said first distributions is a Gaussian distribution
- each statistical sub-model of the second statistical model is defined by a third set of Gaussian distributions as a function of sets of parameters including a set of vectors of means, a set of covariance matrices and a set of probabilities a priori.
- the method thus makes it possible to construct a second statistical model which, once constructed, is easily simplifiable in a very good approximation, if its construction is complex.
- the implementation of the iterative algorithm for maximizing coverage and minimizing redundancy is simplified in the approximation of the average covariance matrix.
- the set of first individual collections of biometric data is derived from a division of the universal collection of biometric data.
- the invention also relates to a biometric authentication method essentially such that it comprises at least:
- the comparison step consists of an implementation of an algorithm for determining the synchronism of displacements between the second reference binary vector and the second binary vector to determine the occurrence of identical bit sequences equal to 1 between these two vectors.
- the decision step of authenticating an individual or not comprises a step of defining and setting a tolerance threshold for the authentication decision, the tolerance threshold being defined by a number of differences in bit terms or bit sequences on a total number of bits of each of said second bit vectors or on a number of identical bit sequences between these two bit vectors determined in the comparing step, respectively.
- the invention also relates to a biometric authentication system essentially as it comprises:
- a sensor of a specific type capable of capturing a determined biometry and transforming it into a second individual collection of biometric data representative of an individual to be authenticated
- a first storage medium capable of storing at least the first and second statistical models and a computer capable of implementing at least one step of the method for classifying biometric data, as described above, in order to obtain at least one second authentication binary vector from the second individual collection of biometric data transmitted to it by the sensor,
- a comparator module for comparing the second authentication binary vector with a second reference binary vector previously generated and stored in a second storage medium connected to the comparator module
- a decision module for deciding whether to authenticate an individual.
- the system is thus able to authenticate an individual whether or not his or her biometric data are part of the collections of biometric data that have made it possible to generate the first and second statistical models.
- the system is such that the storage medium, the computer, the comparator module and the decision module are embedded in the same communicating device by wire or radio frequency link.
- the first embodiment of the system is thus able to control access to secure premises or access to a service, for example a banking service, offered via wireless communication networks.
- a service for example a banking service
- the system is such that:
- the first storage medium and the computer are embedded in a first device communicating by wire or radio frequency link and connected to the sensor, and
- the second storage medium, the comparator module and the decision module are embedded in a second device communicating by wire connection or radio frequency with the first communicating device.
- the second embodiment of the system thus makes it possible to process at the second device only the steps of the authentication method consisting of the comparison step and the decision step, so that the second device requires only light storage and processing means.
- the invention also relates to a biometric authentication computer program product comprising program code portions recorded on a computer readable medium, for implementing at least one step of the biometric data classification method described above. when the program runs on a computer.
- FIG. 1 represents a graph illustrating the limits of the statistical modeling approach according to the prior art
- FIG. 2 diagrammatically represents different evolutions of the statistical modeling approach according to the prior art as illustrated by FIG.
- FIG. 3 represents a diagram illustrating the steps of the method for classifying biometric data enabling the construction of a second statistical model according to the invention
- FIG. 4 represents two graphs illustrating the distribution in a subspace of interest of a distribution set representative of the specificities of an individual or a class of individuals
- FIG. 5 shows the second graph of FIG. 4 and corresponds to it the step of selecting a distribution set. representative of the specificities of an individual or a class of individuals according to the method of classifying biometric data
- - Figure 6 schematically represents the step of generating a set of likelihood vectors and the generation step. of a set of first binary vectors from the second individual collection of biometric data.
- the method of classification of biometric data according to the invention consists in classifying biometric data belonging to a first continuous and limited representation space corresponding to at least one biometric sensor of a certain type.
- the method can therefore be used indifferently to classify biometric data from different biometries, such as those mentioned in the introduction, the only condition being that these biometrics can each be represented in the form of biometric data belonging to a first representation space continuous and limited corresponding.
- the method includes a step of defining a second representation space.
- This second representation space is defined so that each biometric data is represented by a first distribution.
- the biometric data are thus represented by a first set of first distributions.
- the first distributions obey the same probability law function of at least a first parameter.
- the first set of first distributions is thus defined by at least a first set of first parameters determined according to the biometric data.
- said probability law is the multinormal law and each first distribution is a Gaussian distribution defined by a vector of means. , a covariance matrix and a priori probability.
- this projection is a matter of defining a projection function of the biometric data in a space in which they are in a form that can be easily manipulated mathematically.
- This projection also makes it possible to process in a similar way an observed biometric data item and a set of potential biometric data, not yet observed and located near the known biometric data item.
- this projection is virtual and is seen as a step of generalization of the input biometric data.
- a biometric data is represented by a Gaussian distribution whose mean is constituted by the biometric data itself.
- the variance parameters are either ignored or set to a minimum value.
- each biometric data consists of a multidimensional vector of parameters defined in the first representation space.
- the multidimensional vector of parameters is of a size equal to 50
- said representation space is also of a size equal to 50 and each first distribution is defined in this space by at least a first set of first 50 parameters .
- the method further comprises a first step of constructing a first statistical model in automatic classification of a universal collection of biometric data in the second previously defined representation space. This step is described below with reference to FIG.
- the first statistical model 3 is defined by at least a second finite set of second distributions 31. That the second set of second distributions is finite means that the cardinal of this set is a fixed number, for example equal to 2048. In addition, to consider that the second set of second distributions is finite is justified by the fact that the first representation space is limited. Thus, the first set of first distributions that are representative of a collection of biometric data or of another is projected, as described above, in a limited space of said second representation space, so that said second finite set of second distributions 31 is at least adapted to cover said limited space.
- the second distributions obey the same probability law function of at least one second parameter and are distributed in the second representation space according to at least a second set of second parameters.
- said probability law is the multinormal law and each second distribution is a Gaussian distribution defined by a vector of means, a covariance matrix and a priori probabilities.
- Each second distribution defines a subspace of the second representation space.
- each second Gaussian distribution of the second set of distributions intersects each of the other second distributions of the set.
- the second set of second Gaussian distributions obviously covers entirely the second representation space and in particular each point of the representation space.
- a subspace of the representation space must be interpreted as considering that each point of this subspace, situated outside an intersection zone between neighboring second distributions, is described only by the second distribution of the set with the highest value at this point. The limits of the subspaces are defined between them by the intersection zones between second adjacent distributions.
- the first statistical model is constructed to represent the universal collection 1 1 of biometric data with maximum likelihood.
- the second set of second parameters is optimized by a first implementation 7 of a likelihood maximization algorithm.
- the first statistical model thus constructed is a hidden Markov model defined by the second finite set of second distributions as a function of sets of parameters including at least one set of state probabilities, each associated with a biometric data, and a set of transition probabilities between states, the first implementation 7 of implementing the so-called Baum-Welch likelihood maximization algorithm.
- the method thus makes it possible to construct a first statistical model that takes into account the sequence of processing the biometric data.
- the first statistical model thus constructed is a Gaussian mixture model defined by the second finite set of the second distributions as a function of sets of parameters including a set of means, a covariance matrix and a set of prior probabilities, each associated with a biometric datum, the first implementation 7 of implementing the likelihood maximization algorithm called expectation-maximization according to a maximum likelihood criterion.
- the method thus makes it possible to construct a first statistical model independent of the sequence of processing of the biometric data, which allows an automatic unsupervised learning and / or classification.
- the first statistical model consists of a model known under the acronym UBM for Universal Background Model. Since the present invention is in no way limited to this particular field of application, the present Applicant has endeavored to define the first statistical model as generically as possible, the person skilled in the art possibly referring to the more specific approach, and therefore easier, to build said UBM.
- the first statistical model 3 constructed in the manner described above is thus at least adapted to match any biometric data item 1, whether or not it belongs to said universal collection, a determined subspace.
- each second distribution comprising a plurality of first representative distributions of a portion of said universal collection 1 1 of biometric data
- each subspace is associated with a plurality of biometric data.
- the method further comprises a second step of constructing a second statistical model comprising a plurality of statistical sub-models in automatic classification of a set of first individual collections of biometric data, each sub-model being defined in a subspace corresponding of the second representation space. This step is described below with reference to FIG.
- the second step of constructing the second statistical model 4 comprises, for each representative distribution of each biometric data item of each individual collection 12, the determination of the corresponding subspace according to the first statistical model 3. In this way, it is possible to classifying, during a classification step 8, each biometric data item of each individual collection 12 in the submodel 41 corresponding to the subspace determined for this biometric data item by the first statistical model 3.
- a large distribution set is created for each sub-model of the first statistical model.
- at least one parameter of the universal model is adapted to obtain a model close to the biometric data considered in the MAP sense, by using the expectation-maximization algorithm.
- the degree of freedom of MAP factor regulation, in English
- At least one of the distributions associated with each sub-model of the considered model is placed in the corresponding distribution set.
- biometric data may consist of a partition of the universal collection per individual, they may just as well be partially or completely decorrelated. In the latter case, the biometric data of each universal collection were not used to construct the first statistical model. However, and this is the power of the approach in statistical modeling, whatever the input biometric data, the first statistical model is able to match a specific subspace.
- each sub-model 41 is defined by a third set of first distributions 2.
- each statistical sub-model 41 of the second statistical model 4 is defined by a third set of Gaussian distributions as a function of sets of parameters including a set of means and a set of standard deviations.
- the second step of constructing the second statistical model further comprises, for each subspace, a step of selecting 9 first distributions among said third set of first distributions.
- This selection 9 is performed by implementing an iterative algorithm for maximizing coverage and minimizing redundancy.
- This algorithm considers one by one the distributions of the third set of first distributions and is iterated a large number of times to determine a fourth minimum set 21 of first distributions 2 maximizing the subspace coverage.
- the large number of iterations is determined by a convergence criterion of the algorithm. It should be noted that, for a minimal set, we mean together having the smallest cardinal possible.
- the desired minimum cardinal of each fourth set is not known a priori, but is a result of the implementation of the iterative algorithm of maximizing coverage and minimizing redundancy.
- each submodel 41 is defined by the fourth minimum set 21 of first distributions corresponding thereto.
- the result of the selecting step is that the plurality of statistical sub-models 41 is defined by a plurality of fourth minimum sets of first distributions.
- each of said first distributions 2 is a Gaussian distribution
- the implementation of said iterative algorithm for maximizing the coverage and minimizing the redundancy can advantageously be simplified by not considering a set of standard deviations determining said fourth minimum set 21 of first distributions, but an average covariance matrix 42, averaged over said set of standard deviations.
- the second statistical model 4 as constructed in the manner defined above is thus at least adapted to allow, for any biometric data of a subspace determined according to the first statistical model 3, to determine the first distribution with its likelihood is maximal among the first distributions of the fourth minimum set 21 corresponding first distributions.
- the classification method thus makes it possible to construct, on the basis of a first universal statistical model, a second statistical model taking into account the biometric specificities of an individual or a class of individuals.
- a second statistical model taking into account the biometric specificities of an individual or a class of individuals.
- the information voluntarily lost during the construction of the first statistical model, so that it presents the power of the statistical modeling approach that we know, is reintroduced, and organized and controlled.
- the method of classifying biometric data further comprises a first step of generating a set of likelihood vectors from a second individual collection 13 of biometric data.
- This individual collection 13 of biometric data is resulting from the capture by a sensor of a given type of a biometry of an individual. Such capture must be performed at least twice to enable the authentication of the individual: once to deduce information constituting a reference and once to deduce an authentication information by its comparison to the reference information .
- the step of generating a set of likelihood vectors from the second individual collection 13 of biometric data includes, for each first representative distribution of each biometric data item 1 of the second individual collection:
- the step of generating a set of likelihood vectors 5 thus makes it possible to generate from each data of said second individual collection 13 of biometric data and for each statistical sub-model 41 of the second statistical model 4, a likelihood vector 5 composed of the selected 51 likelihood values.
- the joint use of the first and second statistical models makes it possible to generate highly discriminating information representing the identity of an individual according to his or her biometric data, whether the latter are part of said universal collection of biometric data or of said set of first individual collections.
- the likelihood values are real numbers. Therefore, each likelihood vector is composed of sequences of real numbers including heavy to handle and store.
- the biometric data classification method further comprises a step of generating a set of first binary vectors 6 from the set of previously generated likelihood vectors, and by extension from the second individual collection 13 of biometric data.
- This step consisting for each vector likelihood 5 to perform a statistical sampling 10 to project each likelihood vector in the bit space in which the real likelihood values are represented by a bit 61 equal to 1 or by a bit 62 equal to 0.
- the statistical sampling 10 consists more particularly of replacing the likelihood values 51 greater than a first threshold value determined by a bit equal to 1 and replacing the others by a bit equal to 0.
- the statistical sampling 10 more particularly consists in replacing a number N of the highest likelihood values 51 by a bit equal to 1 and replace the others by a bit equal to 0, the number N being predetermined or the N number being estimated from the biometric data considered.
- the result of the step of generating a set of first binary vectors is that, with each biometric data item 1 of the individual collection 13, corresponds a first binary vector 6.
- the classification method thus makes it possible to represent the highly discriminating information representing the identity of an individual in a binary form whose storage, computer manipulation and transfer are easy and to make available authentication methods and systems. the wide scope of applications defined in the binary space.
- the method of classifying biometric data further comprises a step of generating at least a second binary vector from the set of first bit vectors or subsets of first binary vectors. This step consists in producing, between the first bit vectors of the set or of each subset, a logical operation among those consisting of:
- a majority voting algorithm for determining, by sequential bit-to-bit comparisons between the first binary vectors considered, said at least one second binary vector by a distributed set of bits equal to 1, each corresponding to an average occurrence of bits equal to 1 greater than a second determined threshold value, or
- said at least one second bit vector comprises the same number of bits as each of said first bit vectors.
- the choice of the logical operation is dictated by the number of bits equal to 1 of said at least one second binary vector obtained.
- the method of classification of biometric data thus makes it possible to easily control the identity of an individual by the simple comparison of two second determined binary vectors independently, a second reference binary vector and a second binary authentication vector.
- Each first or second binary vector comprises a number of bits equal to 1 determined among others according to one of the first, second and third threshold values. This number is at least an order of magnitude less than the number of bits equal to 0.
- the method makes it possible to ensure a high and finely controlled discrimination level and to easily define and adjust a tolerance threshold for the authentication decision resulting from the comparison between a second reference binary vector and a second authentication binary vector.
- the tolerance threshold is for example defined by a number of differences in terms of bits or sequences of bits over a total number of bits of each of said second bit vectors or on a number of identical bit sequences determined by the comparison between these two binary vectors, respectively.
- the invention also relates to a biometric authentication method.
- the biometric authentication method comprises at least one step of capturing a biometry determined by a sensor of a given type and processing the captured biometry to transform it into a second individual collection 13 of biometric data representative of an individual. .
- the biometric authentication method further comprises at least one step of the method of classifying biometric data 1 as described above.
- the implementation of the classification method is intended to determine a second reference binary vector and then a second authentication binary vector from said individual collection of biometric data.
- the biometric authentication method further comprises a step of comparing these two second binary vectors, and a decision step of authenticating or not an individual on the basis of the result of the preceding comparison step.
- the comparison step consists more particularly in an implementation of an algorithm for determining the synchronism of displacements between the second reference binary vector and the second authentication binary vector for determine the occurrence of sequences of bits equal to 1 identical between these two vectors.
- the decision step of authenticating or not an individual more particularly comprises a step of defining and adjusting a tolerance threshold for the authentication decision.
- the tolerance threshold is defined by a number of differences in terms of bits or sequences of bits on a total number of bits of each of said second bit vectors or on a number of identical bit sequences between these two bit vectors determined at the time. comparison step, respectively.
- the steps of comparison and decision to authenticate or not an individual require little computing resources and storage capacity. They can advantageously be implemented on small portable devices, such as a smart card of a payment card or access to a secure premises.
- the invention also relates to a biometric authentication system which comprises:
- a sensor of a determined type capable of capturing a determined biometry and transforming it into a second individual collection of biometric data representative of an individual to be authenticated
- a first storage medium capable of storing at least the first and second statistical models and a calculator capable of enabling the implementation of at least one step of the method for classifying biometric data 1 described above, so as to obtain at least a second authentication binary vector from the second individual collection 13 of biometric data transmitted to it by the sensor,
- a comparator module for comparing the second authentication binary vector with a second reference binary vector previously generated and stored in a second storage medium connected to the comparator module
- a decision module for deciding whether to authenticate an individual.
- the storage medium, the computer, the comparator module and the decision module are embedded in the same communicating device by wire connection or radiofrequency.
- the system consists of a mobile phone communicating the result of voice recognition to a bank server to authorize a transfer of funds.
- the system is installed at the entrance of a secure room and is used to authenticate the individual who arrives at the entrance by facial and / or voice recognition, and transmit the result of the authentication to a locking / unlocking device of the secure premises entrance door.
- the first storage medium and the computer are embedded in a first device communicating by wire or radiofrequency link and connected to the sensor, and the second storage medium, the comparator module and the decision module are embedded in a second device communicating via a wired or radio frequency link with the first communicating device, for transmitting to the first device or to a third party device the result of the authentication.
- said first device is a cash register type device and the second device is a chip payment card.
- the authentication of an individual advantageously does not require the transfer of the actual biometric data, which could then be stolen, but the transfer of a second binary vector, moreover easier.
- the invention also relates to a biometric authentication computer program product comprising program code portions recorded on a computer readable medium, for implementing at least one step of the biometric data classification method described above. when the program is running on a computer.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Collating Specific Patterns (AREA)
Abstract
L'invention concerne le domaine des procédés, systèmes et produits programmes d'ordinateur d'authentification biométrique et plus particulièrement un procédé de classification de données biométriques 1 consistant à construire, sur la base d'un premier modèle statistique 3 universel et à partir d'un ensemble de premières collections individuelles 12 de données biométriques, un second modèle statistique 4 comprenant une pluralité de sous-modèles statistiques 41 et prenant en compte les spécificités biométriques d'un individu ou d'une classe d'individus, de sorte que les premier et second modèles statistiques définissent conjointement un modèle statistique universel hautement discriminant. L'invention concerne également un procédé d'authentification biométrique, un système d'authentification biométrique et un produit programme d'ordinateur d'authentification biométrique.
Description
PROCEDE DE CLASSIFICATION DE DONNEES BIOM ETRIQUES
L'invention concerne le domaine des procédés, systèmes et produits programmes d'ordinateur d'authentification biométrique.
L'invention concerne plus particulièrement un procédé de classification de données biométriques appartenant à un espace d'observation continu et limité correspondant à au moins un capteur biométrique d'un type déterminé.
Dans le domaine de l'authentification biométrique, les biométries permettant l'authentification d'un individu comprennent par exemples sa voix, sa gestuelle, ses empreintes digitales ou palmaires, la structure de son iris, les réseaux veineux de sa rétine ou de la paume de sa main, la morphologie de sa main, ainsi que les traits de son visage.
Chaque biométrie est collectée par au moins un capteur biométrique d'un type déterminé, par exemple un microphone pour capter la voix d'un individu. Le capteur transforme la biométrie qu'il capte en un signal analogique. De par les caractéristiques techniques du capteur (grandeur physique captée, précision, ...), le signal analogique est défini dans un espace d'observation continu et limité. De façon connue, lors d'une étape d'échantillonnage, par exemple en temps, ce signal est échantillonné puis, lors d'une étape de paramétrisation, un ensemble contigu d'échantillons est transformé, par exemple en mettant en œuvre des transformées de Fourier, pour obtenir au moins un vecteur multidimensionnel de paramètres déterminés défini dans un premier espace de représentation. Un signal analogique est ainsi représenté dans le premier espace de représentation par une séquence de vecteurs multidimensionnels de paramètres. Dans la suite du texte, chaque occurrence des termes 'donnée biométrique' fait référence à un vecteur multidimensionnel de paramètres et chaque occurrence des termes 'ensemble ou collection de données biométriques' fait référence à une ou plusieurs séquences de vecteurs multidimensionnels de paramètres.
Les principaux procédés d'authentification biométrique sont basés sur la modélisation statistique du premier espace de représentation dans un second espace de représentation. Cette modélisation statistique repose notamment sur l'hypothèse qu'un ensemble de données biométriques peut être représenté et classé dans le second espace de représentation sous la forme d'une distribution de
probabilité. Cette hypothèse est raisonnable dans certaines limites non discutées ici et présente l'avantage de définir chaque ensemble de données biométriques sous une forme aisément manipulable mathématiquement. Il est possible de définir la distribution des données biométriques dans le second espace de représentation par un ensemble de distributions statistiques simples, chacune caractérisée par un jeu limité de paramètres. Dans le cas d'une collection universelle de données biométriques, l'ensemble de distributions représentant ladite collection universelle constitue un modèle statistique moyen, appelé modèle statistique universel. Par exemple, dans le domaine de la reconnaissance vocale, les procédés de classification sont basés sur la modélisation statistique de l'espace acoustique dans un espace de représentation défini par un mélange de distributions gaussiennes ou GMM (pour Gaussian Mixture Model selon la terminologie anglaise) dans lequel est classée une collection universelle de signatures vocales provenant d'un grand nombre de locuteurs. Le modèle statistique universel ainsi construit est bien connu sous le sigle UBM (pour Universal Background Model selon la terminologie anglaise). Le modèle statistique universel issu de cette modélisation statistique constitue une référence moyenne par rapport à laquelle peuvent être dérivés des modèles individuels grâce à un adaptateur ou estimateur dit du Maximum A Posteriori (MAP), adaptant ou estimant tout ou une partie des paramètres décrivant le modèle universel. En général, seuls les paramètres correspondant aux moyennes des distributions gaussiennes sont adaptés. Le modèle ainsi adapté à un individu ou à une classe d'individus représente les spécificités dudit individu ou de la classe d'individus. Comme le modèle universel doit comporter un grand nombre de distributions statistiques pour être générique et qu'un individu ou une classe d'individu est spécifié à l'aide d'une collection limitée de données biométriques, seule une petite partie des distributions statistiques, i.e. des paramètres décrivant ces distributions, est adaptée à un locuteur ou une classe donnée. Les distributions statistiques composant le modèle universel sont appelées « composantes » dudit modèle. Lorsqu'une collection de données biométriques doit être comparée à un modèle individuel donné, un score de ressemblance est obtenu par comparaison de la vraisemblance de ces données avec le modèle individuel par rapport à la vraisemblance des mêmes données avec le modèle universel. La fonction correspondant à ces scores de vraisemblance est appelée « rapport de vraisemblance » et est en général projetée dans l'espace logarithmique pour définir
la fonction dite de « logarithme du rapport de vraisemblance », ou LLR (pour Log Likelihood Ratio).
Toutefois, si cette approche basée sur la modélisation statistique est puissante et très largement utilisée, il convient de noter qu'elle présente des limites. La figure 1 illustre à la fois le principe général de la modélisation statistique et ses principales limites. La figure 1 illustre plus particulièrement la fonction de distribution de probabilité F d'un modèle statistique universel tel que l'UBM (composé de seulement quatre composantes dans un espace de représentation à seulement une dimension) et la fonction de distribution de probabilité G d'un modèle individuel dérivé de ce modèle statistique par adaptation MAP (d'une seule composante du modèle universel et en n'adaptant parmi les paramètres décrivant cette composante que les paramètres de moyenne). La figure 1 illustre également la fonction LLR, référencée L, relative au modèle individuel et au modèle universel considérés. Les commentaires ci-dessous faits en référence à la figure 1 aident à comprendre les limites de l'approche par modélisation statistique.
Le point M sur la figure 1 représente la moyenne de la composante adaptée du modèle individuel. Cette moyenne représente une information spécifique à l'individu issue des données biométriques d'apprentissage de l'individu. Le point E1 a représente le maximum local de la fonction de distribution de probabilité G du modèle individuel qui est le plus proche du point M et le point E1 b représente le minimum local de la fonction de distribution de probabilité G du modèle individuel qui est le plus proche du point M. On observe que les points E1 a et E1 b ne présentent pas la même abscisse, ni ne sont symétriquement distribués autour du point M. Ceci est du non seulement à l'adaptation par MAP, mais également à la limitation du nombre de composantes du modèle statistique universel. Cette dernière est directement liée à la nécessité d'avoir des estimations statistiques fiables permettant d'obtenir un modèle individuel dont une partie significative des composantes montrent des paramètres variant significativement de ceux du modèle universel dont il est issu.
Toujours en référence à la figure 1 , le rapport de log-vraisemblance montre un maximum E2a et un minimum E2b qui sont éloignés du point M. Deux points H et E du rapport de log-vraisemblance respectivement d'abscisses x(H) et x(E) légèrement différents, de sorte que la distance x(H)-x(E) est de l'ordre de grandeur de la distance x(E2a)-x(M), donnent un score positif et négatif respectivement. Ainsi,
d'une petite variation ou erreur sur l'axe des abscisses peut résulter des décisions différentes quant à savoir si la fonction de distribution de probabilité G du modèle individuel est vraisemblante ou non. Ainsi, il apparaît que la décision n'est pas directement liée à l'information spécifique à l'individu.
Ces observations permettent d'illustrer que l'approche par modélisation statistique usuelle manque de robustesse par rapport à un décalage d'une petite variation ou erreur sur les données biométriques, car l'effet de ce décalage sur la décision peut être critique. Notons qu'un décalage peut être simplement du à une des sources de variabilités (ou de bruit), par exemple l'utilisation de microphones différents pour collecter les signatures vocales ou la captation de signatures vocales dans des milieux acoustiques différents (clos ou en extérieur). Ces sources de variabilités sont bien connues dans le domaine de l'authentification biométrique et de nombreux documents de l'art antérieur, par exemple la demande internationale référencée WO 2010/049695 ou la demande internationale référencée WO 2007/131530, proposent des solutions destinées à permettre d'accroître la robustesse de l'approche en modélisations statistiques usuelle par rapport aux sources de variabilités, sans toutefois remettre en cause cette approche.
Il est également connu de l'art antérieur différentes évolutions de l'approche par modélisation statistique présentée ci-dessous. Ces évolutions sont brièvement décrites ci-dessous, notamment en référence à la figure 2.
Une première évolution de l'approche par modélisation statistique usuelle consiste à considérer le modèle statistique universel (USM) comme une définition d'un espace de représentation de nouvelles données définies par la concaténation des paramètres de moyennes de chacune des composantes constituant ledit modèle, ces nouvelles données étant connues sous le nom de supervecteurs (SV). Cet espace, dénoté espace des supervecteurs, permet d'utiliser des machines à vecteurs de support ou séparateurs à vaste marge (en anglais Support Vector Machine, SVM) qui sont un ensemble de techniques d'apprentissage supervisé destinées à résoudre des problèmes de discrimination et de régression.
Une seconde évolution de l'approche par modélisation statistique usuelle consiste en une modélisation directe des variabilités de sessions dans l'espace des supervecteurs en utilisant une analyse factorielle conjointe connue sous le sigle JFA (pour Joint Factor Analysis selon la terminologie anglaise).
Plus récemment, le concept d'espace de variabilité totale (TS) a été introduit qui consiste à modéliser la variabilité totale dans l'espace des supervecteurs de façon à construire un espace plus petit qui concentre l'information et dans lequel il est plus aisé de modéliser de façon jointe les variabilités de sessions et de locuteurs. Plus particulièrement, à chaque vecteur de l'espace des supervecteurs correspond un vecteur, dénoté iVector (iV), dans l'espace de variabilité totale.
Plusieurs remarques peuvent être faites sur ces dernières approches. Premièrement, l'espace des supervecteurs compte un très grand nombre de dimensions (couramment une centaine de milliers de dimensions), ce qui rend son analyse factorielle conjointe difficile. Deuxièmement, l'extraction du iVector correspond justement à une réduction de la dimensionnalité à quelques milliers de dimensions seulement, ce qui permet principalement d'appliquer des approches plus simples pour différencier les variabilités de sessions et les variabilités de locuteurs ; les techniques d'extraction du iVector sont similaires aux techniques d'analyse factorielle conjointe du fait que ces deux types de techniques travaillent dans un même type d'espace, l'espace des supervecteurs. Troisièmement, l'espace des supervecteurs dans l'approche par modélisation statistique d'une collection universelle de données biométriques avec un modèle de mélange de gaussiennes et l'espace de dimensionnalité réduite liée à l'extraction du iVector sont construits suivant le même schéma : une étape de reparamétrisation considérant en entrée un ensemble de données biométriques (DB) et donnant en sortie un seul vecteur représentant l'ensemble d'entrée. La figure 2 schématise ces deux étapes de reparamétrisation et illustre la réduction de la taille des données associée.
L'approche par modélisation statistique par l'utilisation de supervecteurs et/ou de la variabilité totale présente donc des avantages, mais possède aux moins deux limites ci-après discutées.
Premièrement, comme un ensemble de données biométriques est représenté par un unique point dans l'espace de représentation, il est difficile dans cette approche d'exploiter des informations de façon temporelle ou séquentielle, par exemple dans le cadre d'un apprentissage non-supervisé, aussi bien que d'appliquer cette approche pour remplir d'autres tâches, telles que l'indexation ou la segmentation du signal analogique fourni par le capteur biométrique.
Deuxièmement, l'espace des supervecteurs et l'espace de variabilité totale reposent tous deux sur le concept d'information globale et générale : une information
est importante parce qu'elle apparaît fréquemment. De ce fait, ces espaces ne prennent pas en compte intrinsèquement les spécificités discriminantes d'un individu ou d'une classe d'individu, or le but de toute classification biométrique est justement de prendre en compte ces spécificités discriminantes. En cela, ces espaces présentent les défauts énoncés dans les commentaires faits en référence à la figurel .
Dans ce contexte, la présente invention propose un procédé de classification de données biométriques permettant de pallier un ou plusieurs des inconvénients précédemment évoqués.
A cette fin, le procédé de classification de données biométriques appartenant à un premier espace de représentation continu et limité correspondant à au moins un capteur biométrique d'un type déterminé, tel qu'il comprend :
- une étape de définition d'un second espace de représentation dans lequel chaque donnée biométrique est représentée par une première distribution de sorte que les données biométriques y sont représentées par un premier ensemble de premières distributions, les premières distributions obéissant à une même loi de probabilité fonction d'au moins un premier paramètre, de sorte que le premier ensemble de premières distributions est défini par un premier ensemble de premiers paramètres déterminés en fonction des données biométriques,
- une première étape de construction d'un premier modèle statistique en classification automatique d'une collection universelle de données biométriques dans le second espace de représentation,
le premier modèle statistique étant défini par au moins un deuxième ensemble fini de deuxièmes distributions, les deuxièmes distributions obéissant à une même loi de probabilité fonction d'au moins un deuxième paramètre et étant réparties dans le second espace de représentation selon au moins un deuxième ensemble de deuxièmes paramètres, de sorte que chaque deuxième distribution définit un sous- espace du second espace de représentation comprenant une pluralité de premières distributions représentative d'une partie de ladite collection universelle de données biométriques,
le deuxième ensemble de deuxièmes paramètres étant optimisé par une première implémentation d'un algorithme de maximisation de vraisemblance, de sorte que le deuxième ensemble fini de deuxièmes distributions représente avec le
maximum de vraisemblance le premier ensemble de premières distributions correspondant à ladite collection universelle de données biométriques,
le premier modèle statistique étant ainsi au moins propre à faire correspondre à n'importe quelle donnée biométrique un sous-espace déterminé, chaque sous- espace étant associée à une pluralité de données biométriques, et
- une deuxième étape de construction d'un second modèle statistique comprenant une pluralité de sous-modèles statistiques en classification automatique d'un ensemble de premières collections individuelles de données biométriques, chaque sous-modèle étant défini dans un sous-espace correspondant du second espace de représentation,
la deuxième étape de construction comprenant, pour chaque distribution représentative de chaque donnée biométrique de chaque collection individuelle, la détermination du sous-espace qui lui correspond selon le premier modèle statistique et, dans ce sous-espace, sa classification dans le sous-modèle correspondant, de sorte que chaque sous-modèle est défini par un troisième ensemble de premières distributions,
la deuxième étape de construction comprenant en outre, pour chaque sous- espace, une étape de sélection de premières distributions parmi ledit troisième ensemble de premières distributions par implémentation d'un algorithme itératif de maximisation de la couverture et de minimisation de la redondance, pour déterminer un quatrième ensemble minimal de premières distributions maximisant la couverture du sous-espace, de sorte que chaque sous-modèle est défini par le quatrième ensemble minimal de premières distributions lui correspondant,
de sorte que la pluralité de sous-modèles statistiques du second modèle statistique est défini par une pluralité de quatrièmes ensembles minimaux de premières distributions,
le second modèle statistique étant ainsi au moins propre à permettre, pour n'importe quelle donnée biométrique d'un sous-espace déterminé selon le premier modèle statistique, de déterminer au moins la première distribution avec laquelle sa vraisemblance est maximale parmi les premières distributions du quatrième ensemble minimal de premières distributions correspondant.
Le procédé de classification permet ainsi de construire, sur la base d'un premier modèle statistique universel, un second modèle statistique prenant en compte les spécificités biométriques d'un individu ou d'une classe d'individus. Ces
deux modèles statistiques définissent conjointement un modèle statistique universel hautement discriminant.
Selon une particularité, le procédé comprend en outre une première étape de génération d'un ensemble de vecteurs de vraisemblance à partir d'une seconde collection individuelle de données biométriques, l'étape de génération comprenant, pour chaque première distribution représentative de chaque donnée biométrique de la seconde collection individuelle :
- la détermination du sous-espace qui lui correspond en fonction du premier modèle statistique,
- dans ce sous-espace, le calcul d'une valeur de vraisemblance entre la première distribution représentative de la donnée biométrique considérée et chacune des premières distributions du quatrième ensemble minimal correspondant au sous- espace, et
- la sélection d'au moins une vraisemblance parmi les plus élevées,
de sorte à générer à partir de chaque donnée de ladite seconde collection individuelle de données biométriques et pour chaque sous-modèle statistique du second modèle statistique un vecteur de vraisemblance composé des valeurs de vraisemblance sélectionnées.
Ainsi, l'utilisation conjointe des premier et second modèles statistiques permet de générer une information hautement discriminante représentant l'identité d'un individu en fonction de ses données biométriques, que ces dernières fassent ou non partie de ladite collection universelle de données biométriques ou dudit ensemble de premières collections individuelles.
Selon une autre particularité, le procédé comprend en outre une étape de génération d'un ensemble de premiers vecteurs binaires à partir de la seconde collection individuelle de données biométriques, cette étape consistant pour chaque vecteur de vraisemblance à réaliser un échantillonnage statistique déterminé parmi ceux consistant à :
- remplacer les valeurs de vraisemblance supérieures à une première valeur seuil déterminée par un bit égal à 1 et remplacer les autres par un bit égal à 0, ou
- remplacer un nombre N des valeurs de vraisemblances les plus élevées par un bit égal à 1 et remplacer les autres par un bit égal à 0, le nombre N étant prédéterminé ou le nombre N étant estimé à partir de la donnée biométrique
considérée,
de sorte qu'à chaque donnée biométrique correspond un premier vecteur binaire.
Le procédé de classification permet ainsi de représenter l'information hautement discriminante représentant l'identité d'un individu sous une forme binaire dont le stockage, la manipulation informatique et le transfert sont aisés et de mettre à la disposition de procédés et systèmes d'authentification le large champ d'applications défini dans l'espace binaire.
Selon une autre particularité, le procédé comprend en outre une étape de génération d'au moins un second vecteur binaire à partir de l'ensemble de premiers vecteurs binaires ou de sous-ensembles de premiers vecteurs binaires, cette étape consistant à réaliser, entre les premiers vecteurs binaires de l'ensemble ou de chaque sous-ensemble, une opération logique parmi celles consistant en :
- une implémentation d'un algorithme de vote majoritaire pour déterminer, par comparaisons séquentielles bit à bit entre les premiers vecteurs binaires considérés, ledit au moins un second vecteur binaire par un ensemble réparti de bits égaux à 1 , chacun correspondant à une occurrence moyenne de bits égaux à 1 supérieure à une seconde valeur seuil déterminée, ou
- une implémentation d'un algorithme de comparaisons séquentielles bit à bit logiques de type 'ET' ou OU exclusif entre les premiers vecteurs binaires considérés pour déterminer ledit au moins un second vecteur binaire par un ensemble réparti de bits égaux à 1 , chacun correspondant à une occurrence totale de bits égaux à 1 ou à une occurrence unique d'un bit égal à 1 parmi les premiers vecteurs binaires considérés, respectivement, ou
- une implémentation d'un algorithme de détermination de synchronie de déplacements vecteur à vecteur parmi les premiers vecteurs binaires considérés, pour déterminer ledit au moins un second vecteur binaire par un ensemble de bits égaux à 1 répartis selon une séquence de bits égaux à 1 des premiers vecteurs binaires observée avec une occurrence moyenne supérieure à une troisième valeur seuil déterminée.
ledit au moins un second vecteur binaire comprenant le même nombre de bits que chacun desdits premiers vecteurs binaires et le choix de l'opération logique étant dicté par le nombre de bits égaux à 1 dudit au moins un second vecteur binaire obtenu.
Le procédé permet ainsi de contrôler aisément l'identité d'un individu par la comparaison simple de deux seconds vecteurs binaires déterminés indépendamment, un second vecteur binaire dit de référence et un second vecteur binaire dit d'authentification.
Selon une autre particularité, chaque premier ou second vecteur binaire comprend un nombre de bits égaux à 1 déterminé entre autres en fonction d'une des première, seconde et troisième valeurs seuils, ce nombre étant inférieur d'au moins un ordre de grandeur au nombre de bits égaux à 0.
En définissant des vecteurs binaires 'creux', autrement dit comprenant plus de bits égaux à 0 que de bits égaux à 1 , le procédé permet d'assurer un niveau de discrimination finement contrôlé et de définir et régler aisément un seuil de tolérance pour la décision d'authentification issue de la comparaison entre un second vecteur binaire de référence et un second vecteur binaire d'authentification, le seuil de tolérance étant par exemple défini par un nombre de différences en termes de bits ou de séquences de bits sur un nombre total de bits de chacun desdits seconds vecteurs binaires ou sur un nombre de séquences de bits identiques déterminé par la comparaison entre ces deux vecteurs binaires, respectivement.
Selon une autre particularité, le premier modèle statistique est un modèle de Markov caché défini par le deuxième ensemble fini des deuxièmes distributions en fonction d'ensembles de paramètres dont au moins un ensemble de probabilités d'état, chacune associée à une donnée biométrique, et un ensemble de probabilités de transition entre états, la première implémentation consistant à implémenter l'algorithme de maximisation de vraisemblance dit de Baum-Welch.
Le procédé permet ainsi de construire un premier modèle statistique qui tient compte de la séquence de traitement des données biométriques.
Selon une autre particularité, le premier modèle statistique est un modèle de mélange de gaussiennes défini par le deuxième ensemble fini des deuxièmes distributions en fonction d'ensembles de paramètres dont un ensemble de vecteurs de moyennes, un ensemble de matrices de covariance et un ensemble de probabilités a priori, la première implémentation consistant à implémenter
l'algorithme de maximisation de vraisemblance dit d'espérance-maximisation selon un critère de maximum de vraisemblance déterminé.
Le procédé permet ainsi de construire un premier modèle statistique indépendant de la séquence de traitement des données biométriques, ce qui autorise un apprentissage et/ou une classification automatiques non-supervisés.
Selon une autre particularité, chacune desdites premières distributions est une distribution gaussienne, de sorte que chaque sous-modèle statistique du second modèle statistique est défini par un troisième ensemble de distributions gaussiennes en fonction d'ensembles de paramètres dont un ensemble de vecteurs de moyennes, un ensemble de matrices de covariance et un ensemble de probabilités à priori.
Le procédé permet ainsi de construire un second modèle statistique qui, une fois construit, est aisément simplifiable dans une très bonne approximation, si sa construction est complexe. Notamment, l'implémentation de l'algorithme itératif de maximisation de la couverture et de minimisation de la redondance est simplifiée dans l'approximation de la matrice de covariance moyenne.
Selon une autre particularité, l'ensemble de premières collections individuelles de données biométriques est issu d'un découpage de la collection universelle de données biométriques.
L'invention concerne également un procédé d'authentification biométrique essentiellement tel qu'il comprend au moins :
- une étape de captation d'une biométrie déterminée par un capteur d'un type déterminé et de traitement de la biométrie captée pour la transformer en une seconde collection individuelle de données biométriques représentatives d'un individu,
- une étape du procédé de classification de données biométriques, tel que décrit ci-dessus, pour déterminer un second vecteur binaire de référence et un second vecteur binaire d'authentification à partir de ladite collection individuelle de données biométriques,
- une étape de comparaison de ces deux seconds vecteurs binaires, et - une étape de décision d'authentifier ou non un individu sur la base du résultat de l'étape précédente de comparaison.
Selon une particularité, l'étape de comparaison consiste en une implémentation d'un algorithme de détermination de synchronie de déplacements entre le second vecteur binaire de référence et le second vecteur binaire
d'authentification pour déterminer l'occurrence de séquences de bits égaux à 1 identiques entre ces deux vecteurs.
Selon une autre particularité, l'étape de décision d'authentifier ou non un individu comprend une étape de définition et de réglage d'un seuil de tolérance pour la décision d'authentification, le seuil de tolérance étant défini par un nombre de différences en termes de bits ou de séquences de bits sur un nombre total de bits de chacun desdits seconds vecteurs binaires ou sur un nombre de séquences de bits identiques entre ces deux vecteurs binaires déterminés lors de l'étape de comparaison, respectivement.
L'invention concerne également un système d'authentification biométrique essentiellement tel qu'il comprend :
- un capteur d'un type déterminé propre à capter une biométrie déterminée et à la transformer en une seconde collection individuelle de données biométriques représentatives d'un individu à authentifier,
- un premier support de mémorisation propre à stocker au moins les premier et second modèles statistiques et un calculateur propre à permettre la mise en œuvre d'au moins une étape du procédé de classification de données biométriques, tel que décrit ci-dessus, pour obtenir au moins un second vecteur binaire d'authentification à partir de la seconde collection individuelle de données biométriques lui ayant été transmise par le capteur,
- un module comparateur pour comparer le second vecteur binaire d'authentification à un second vecteur binaire de référence précédemment généré et stocké dans un second support de mémorisation relié au module comparateur, et
- un module de décision pour décider d'authentifier ou non un individu.
Le système est ainsi propre à authentifier un individu que ses données biométriques fassent ou non partie des collections de données biométriques ayant permis de générer les premier et second modèles statistiques.
Selon un premier mode de réalisation, le système est tel que le support de mémorisation, le calculateur, le module comparateur et le module de décision sont embarqués dans un même dispositif communicant par liaison filaire ou radiofréquence.
Le premier mode de réalisation du système est ainsi propre à contrôler l'accès à un local sécurisé ou l'accès à un service, par exemple un service bancaire, offert via les réseaux de communications sans fil.
Selon un deuxième mode de réalisation, le système est tel que :
- le premier support de mémorisation et le calculateur sont embarqués dans un premier dispositif communicant par liaison filaire ou radiofréquence et relié au capteur, et
- le second support de mémorisation, le module comparateur et le module de décision sont embarqués dans un second dispositif communicant par liaison filaire ou radiofréquence avec le premier dispositif communicant.
Le deuxième mode de réalisation du système permet ainsi de ne traiter au niveau du second dispositif que les étapes du procédé d'authentification consistant en l'étape de comparaison et l'étape de décision, de sorte que le second dispositif ne nécessite que de légers moyens de stockage et de traitement.
L'invention concerne également un produit programme d'ordinateur d'authentification biométrique comprenant des portions de code de programme enregistrés sur un support lisible par un ordinateur, pour mettre en œuvre au moins une étape du procédé de classification de données biométriques décrit ci-dessus lorsque le programme fonctionne sur un ordinateur.
D'autres caractéristiques et avantages de l'invention ressortiront clairement de la description qui en est faite ci-après, à titre indicatif et nullement limitatif, en référence aux dessins annexés, dans lesquels :
- la figure 1 représente un graphique illustrant les limites de l'approche par modélisation statistique selon l'art antérieur,
- la figure 2 représente schématiquement différentes évolutions de l'approche par modélisation statistique selon l'art antérieur tel qu'illustré par la figure 1 ,
- la figure 3 représente un schéma illustrant les étapes du procédé de classification de données biométriques permettant la construction d'un second modèle statistique selon l'invention,
- la figure 4 représente deux graphes illustrant la répartition dans un sous- espace d'intérêt d'un ensemble de distribution représentative des spécificités d'un individu ou d'une classe d'individus,
- la figure 5 reprend le deuxième graphe de la figure 4 et lui fait correspondre l'étape de sélection d'un ensemble de distribution
représentative des spécificités d'un individu ou d'une classe d'individus selon le procédé de classification de données biométriques, et - la figure 6 représente schématiquement l'étape de génération d'un ensemble de vecteurs de vraisemblance et l'étape de génération d'un ensemble de premiers vecteurs binaires à partir de la seconde collection individuelle de données biométriques.
Le procédé de classification de données biométriques selon l'invention consiste à classer des données biométriques appartenant à un premier espace de représentation continu et limité correspondant à au moins un capteur biométrique d'un type déterminé. Le procédé peut donc être mis indifféremment en œuvre pour classer des données biométriques issues de différentes biométries, telles que celles citées en introduction, la seule condition étant que ces biométries puissent chacune être représentée sous la forme de données biométriques appartenant à un premier espace de représentation continu et limité correspondant.
Le procédé comprend une étape de définition d'un second espace de représentation. Ce second espace de représentation est défini de sorte que chaque donnée biométrique y est représentée par une première distribution. Les données biométriques y sont ainsi représentées par un premier ensemble de premières distributions. Les premières distributions obéissent à une même loi de probabilité fonction d'au moins un premier paramètre. Le premier ensemble de premières distributions est ainsi défini par au moins un premier ensemble de premiers paramètres déterminés en fonction des données biométriques, Par exemple, ladite loi de probabilité est la loi multinormale et chaque première distribution est une distribution gaussienne définie par un vecteur de moyennes, une matrice de covariance et une probabilité a priori.
Plus particulièrement, il s'agit de définir une fonction de projection des données biométriques dans un espace dans lequel elles se présentent sous une forme aisément manipulable mathématiquement. Cette projection permet également de traiter de manière analogue une donnée biométrique observée et un ensemble de données biométriques potentielles, non encore observées et localisées près de la donnée biométrique connue. En pratique, cette projection est virtuelle et est vue comme une étape de généralisation de la donnée biométrique d'entrée.
Par exemple, dans le cas où des distributions gaussiennes sont utilisées, une donnée biométrique est représentée par une distribution gaussienne dont la
moyenne est constituée par la donnée biométrique elle-même. Les paramètres de variance étant alors soit ignorés, soit fixés à une valeur minimale.
Comme mentionné en introduction, chaque donnée biométrique consiste en un vecteur multidimensionnel de paramètres défini dans le premier espace de représentation. Par exemple, si le vecteur multidimensionnel de paramètres est d'une dimension égal à 50, ledit espace de représentation est également d'une dimension égale à 50 et chaque première distribution est définie dans cet espace par au moins un premier ensemble de 50 premiers paramètres.
Le procédé comprend en outre une première étape de construction d'un premier modèle statistique en classification automatique d'une collection universelle de données biométriques dans le second espace de représentation précédemment défini. Cette étape est décrite ci-dessous en référence à la figure 3.
Au prix de certaines approximations non discutées ici, il est possible de définir ledit premier modèle statistique 3 tel que décrit ci-après. Le premier modèle statistique est défini par au moins un deuxième ensemble fini de deuxièmes distributions 31 . Que le deuxième ensemble de deuxièmes distributions soit fini signifie que le cardinal de cet ensemble est un nombre fixé, par exemple égale à 2048. En outre, considérer que le deuxième ensemble de deuxièmes distributions est fini se justifie du fait que le premier espace de représentation est limité. Ainsi, le premier ensemble de premières distributions qu'il soit représentatif d'une collection de données biométriques ou d'une autre est projeté, tel que décrit ci-dessus, dans un espace limité dudit second espace de représentation, de sorte que ledit deuxième ensemble fini de deuxièmes distributions 31 est au moins propre à couvrir ledit espace limité.
Les deuxièmes distributions obéissent à une même loi de probabilité fonction d'au moins un deuxième paramètre et sont réparties dans le second espace de représentation selon au moins un deuxième ensemble de deuxièmes paramètres. Par exemple, ladite loi de probabilité est la loi multinormale et chaque deuxième distribution est une distribution gaussienne définie par un vecteur de moyennes, une matrice de covariance et une probabilités a priori.
Chaque deuxième distribution définit un sous-espace du second espace de représentation. Dans l'exemple précédent, si une distribution gaussienne couvre par définition tout l'espace sur lequel elle est définie, chaque deuxième distribution gaussienne du deuxième ensemble de distributions intersecte chacune des autres
deuxièmes distributions de l'ensemble. Ainsi, le deuxième ensemble de deuxièmes distributions gaussiennes couvre évidemment entièrement le second espace de représentation et en particulier chaque point de l'espace de représentation. Faire correspondre à chaque deuxième distribution un sous-espace de l'espace de représentation doit être interprété comme le fait de considérer que chaque point de ce sous-espace, situé en dehors d'une zone d'intersection entre deuxièmes distributions voisines, n'est décrit que par la deuxième distribution de l'ensemble présentant la plus grande valeur en ce point. Les limites des sous-espaces sont définies entre eux par les zones d'intersection entre deuxièmes distributions voisines entre elles.
Le premier modèle statistique est construit de façon à représenter la collection universelle 1 1 de données biométriques avec le maximum de vraisemblance. Pour ce faire, le deuxième ensemble de deuxièmes paramètres est optimisé par une première implémentation 7 d'un algorithme de maximisation de vraisemblance.
Dans un mode de réalisation du procédé, le premier modèle statistique ainsi construit est un modèle de Markov caché défini par le deuxième ensemble fini des deuxièmes distributions en fonction d'ensembles de paramètres dont au moins un ensemble de probabilités d'état, chacune associée à une donnée biométrique, et un ensemble de probabilités de transition entre états, la première implémentation 7 consistant à implémenter l'algorithme de maximisation de vraisemblance dit de Baum-Welch.
Le procédé permet ainsi de construire un premier modèle statistique qui tient compte de la séquence de traitement des données biométriques.
Dans un autre mode de réalisation du procédé, le premier modèle statistique ainsi construit est un modèle de mélange de gaussiennes défini par le deuxième ensemble fini des deuxièmes distributions en fonction d'ensembles de paramètres dont un ensemble de moyennes, une matrice de covariance et un ensemble de probabilités a priori, chacun associé à une donnée biométrique, la première implémentation 7 consistant à implémenter l'algorithme de maximisation de vraisemblance dit d'espérance-maximisation selon un critère de maximum de vraisemblance.
Le procédé permet ainsi de construire un premier modèle statistique indépendant de la séquence de traitement des données biométriques, ce qui autorise un apprentissage et/ou une classification automatiques non-supervisés.
Dans le domaine d'application à la reconnaissance vocale, le premier modèle statistique consiste en un modèle connu sous le sigle UBM pour Universal Background Model. La présente invention n'étant aucunement limitée à ce domaine particulier d'application, la présente demanderesse s'est appliquée à définir le premier modèle statistique de la façon la plus générique possible, l'homme de métier pouvant au besoin se référer à l'approche plus spécifique, et donc plus facile, permettant de construire ledit UBM.
Le premier modèle statistique 3 construit de la façon décrite ci-dessus est ainsi au moins propre à faire correspondre à n'importe quelle donnée biométrique 1 , que celle-ci appartienne ou non à ladite collection universelle, un sous-espace déterminé. Précisons que chaque deuxième distribution comprenant une pluralité de premières distributions représentatives d'une partie de ladite collection universelle 1 1 de données biométriques, chaque sous-espace est associé à une pluralité de données biométriques.
Le procédé comprend en outre une deuxième étape de construction d'un second modèle statistique comprenant une pluralité de sous-modèles statistiques en classification automatique d'un ensemble de premières collections individuelles de données biométriques, chaque sous-modèle étant défini dans un sous-espace correspondant du second espace de représentation. Cette étape est décrite ci- dessous en référence à la figure 3.
La deuxième étape de construction du second modèle statistique 4 comprend, pour chaque distribution représentative de chaque donnée biométrique de chaque collection individuelle 12, la détermination du sous-espace qui lui correspond selon le premier modèle statistique 3. De cette façon, il est possible de classer, lors d'une étape de classification 8, chaque donnée biométrique de chaque collection individuelle 12 dans le sous-modèle 41 correspondant au sous-espace déterminé pour cette donnée biométrique par le premier modèle statistique 3.
Pour construire le deuxième modèle statistique, un large ensemble de distribution est constitué pour chaque sous modèle du premier modèle statistique. Pour chaque collection individuelle de donnée biométrique disponible, au moins un paramètre du modèle universel est adapté pour obtenir un modèle proche des données biométriques considérées au sens du MAP, en employant l'algorithme espérance-maximisation. Le degré de liberté de MAP (régulation factor, en anglais) est choisi de manière à rapprocher MAP du critère de Maximum de Vraisemblance.
Au moins une des distributions associées à chaque sous modèle du modèle considéré est placée dans l'ensemble de distribution correspondant.
Il convient de noter ici que si les collections individuelles 12 de données biométriques peuvent consister en une partition de la collection universelle par individu, elles peuvent tout aussi bien être établies de façon partiellement ou entièrement décorrélée. Dans ce dernier cas, les données biométriques de chaque collection universelle n'ont pas servi à construire le premier modèle statistique. Toutefois, et c'est là la puissance de l'approche en modélisation statistique, quelque soit la donnée biométrique d'entrée, le premier modèle statistique est propre à lui faire correspondre un sous-espace déterminé.
Le résultat de l'étape de la classification 8 est que chaque sous-modèle 41 est défini par un troisième ensemble de premières distributions 2. Par exemple dans le cas où chacune desdites premières distributions 2 est une distribution gaussienne, chaque sous-modèle statistique 41 du second modèle statistique 4 est défini par un troisième ensemble de distributions gaussiennes en fonction d'ensembles de paramètres dont un ensemble de moyennes et un ensemble d'écart-types.
La deuxième étape de construction du second modèle statistique comprend en outre, pour chaque sous-espace, une étape de sélection 9 de premières distributions parmi ledit troisième ensemble de premières distributions. Cette sélection 9 est réalisée par implémentation d'un algorithme itératif de maximisation de la couverture et de minimisation de la redondance. Cet algorithme considère une à une les distributions du troisième ensemble de premières distributions et est itéré un grand nombre de fois pour déterminer un quatrième ensemble minimal 21 de premières distributions 2 maximisant la couverture du sous-espace. Le grand nombre d'itérations est déterminé par un critère de convergence de l'algorithme. Il convient de noter que, par ensemble minimal, on entend ensemble présentant le plus petit cardinal possible. Le cardinal désiré minimal de chaque quatrième ensemble n'est pas connu a priori, mais est un résultat de l'implémentation de l'algorithme itératif de maximisation de la couverture et de minimisation de la redondance.
Pour chaque sous-modèle, le résultat de l'étape de sélection 9, notamment tel qu'illustré sur la figure 4, est que chaque sous-modèle 41 est défini par le quatrième ensemble minimal 21 de premières distributions lui correspondant. Et pour la pluralité de sous-modèles statistiques 41 du second modèle statistique 4, le résultat de
l'étape de sélection est que la pluralité de sous-modèles statistiques 41 est défini par une pluralité de quatrièmes ensembles minimaux de premières distributions.
Par exemple dans le cas où chacune desdites premières distributions 2 est une distribution gaussienne, il est à noter que l'implémentation dudit algorithme itératif de maximisation de la couverture et de minimisation de la redondance peut avantageusement être simplifiée en considérant non pas un ensemble d'écart-types déterminant ledit quatrième ensemble minimal 21 de premières distributions, mais une matrice de covariance moyenne 42, issue d'une moyenne sur ledit ensemble d'écart-types.
Le second modèle statistique 4 tel que construit de la façon définie ci-dessus est ainsi au moins propre à permettre, pour n'importe quelle donnée biométrique d'un sous-espace déterminé selon le premier modèle statistique 3, de déterminer la première distribution avec laquelle sa vraisemblance est maximale parmi les premières distributions du quatrième ensemble minimal 21 de premières distributions correspondant.
Le procédé de classification permet ainsi de construire, sur la base d'un premier modèle statistique universel, un second modèle statistique prenant en compte les spécificités biométriques d'un individu ou d'une classe d'individus. En effet, l'information volontairement perdue lors de la construction du premier modèle statistique, afin que celui-ci présente la puissance de l'approche par modélisation statistique qu'on lui connaît, est ainsi réintroduite, et de façon organisée et contrôlée. Ces deux modèles statistiques définissent conjointement un modèle statistique universel hautement discriminant.
De plus, et comme cela apparaîtra clairement dans la suite de la description, notamment sa partie faite en référence à la figure 5, les caractéristiques techniques ci-dessus exposées dudit modèle statistique universel hautement discriminant permettent d'atteindre une grande robustesse du procédé de classification par rapport à des petites variations ou erreurs sur les données biométriques d'entrée et par rapport aux sources de variabilités, évoquées en introduction.
En référence à la figure 6, le procédé de classification de données biométriques comprend en outre une première étape de génération d'un ensemble de vecteurs de vraisemblance 5 à partir d'une seconde collection individuelle 13 de données biométriques. Cette collection individuelle 13 de données biométriques est
issue de la captation par un capteur d'un type déterminé d'une biométrie d'un individu. Une telle captation doit être réalisée au moins deux fois pour permettre l'authentification de l'individu : une fois pour en déduire une information constituant une référence et une fois pour en déduire une information d'authentification par sa comparaison à l'information de référence.
L'étape de génération d'un ensemble de vecteurs de vraisemblance 5 à partir de la seconde collection individuelle 13 de données biométriques comprend, pour chaque première distribution représentative de chaque donnée biométrique 1 de la seconde collection individuelle :
- la détermination du sous-espace qui lui correspond en fonction du premier modèle statistique 3,
- dans ce sous-espace, le calcul d'une valeur de vraisemblance 51 entre la première distribution 1 représentative de la donnée biométrique considérée et chacune des premières distributions du quatrième ensemble minimal 21 correspondant au sous-espace, et
- la sélection d'au moins une vraisemblance parmi les plus élevées.
L'étape de génération d'un ensemble de vecteurs de vraisemblance 5 permet ainsi de générer à partir de chaque donnée de ladite seconde collection individuelle 13 de données biométriques et pour chaque sous-modèle statistique 41 du second modèle statistique 4, un vecteur de vraisemblance 5 composé des valeurs de vraisemblance 51 sélectionnées.
Ainsi, l'utilisation conjointe des premier et second modèles statistiques permet de générer une information hautement discriminante représentant l'identité d'un individu en fonction de ses données biométriques, que ces dernières fassent ou non partie de ladite collection universelle de données biométriques ou dudit ensemble de premières collections individuelles. Toutefois, les valeurs de vraisemblance sont des nombres réels. Par conséquent, chaque vecteur de vraisemblance est composé de séquences de nombres réels notamment lourdes à manipuler et à stocker.
En référence à la figure 6, le procédé de classification de données biométriques comprend en outre une étape de génération d'un ensemble de premiers vecteurs binaires 6 à partir de l'ensemble de vecteurs de vraisemblance précédemment générés, et par extension à partir de la seconde collection individuelle 13 de données biométriques. Cette étape consistant pour chaque vecteur
de vraisemblance 5 à réaliser un échantillonnage statistique 10 pour projeter chaque vecteur de vraisemblance dans l'espace binaire dans lequel les valeurs de vraisemblance, réelles, sont représentées par un bit 61 égal à 1 ou par un bit 62 égal à 0. Par un premier exemple, l'échantillonnage statistique 10 consiste plus particulièrement à remplacer les valeurs de vraisemblance 51 supérieures à une première valeur seuil déterminée par un bit égal à 1 et remplacer les autres par un bit égal à 0.
Par un deuxième exemple, l'échantillonnage statistique 10 consiste plus particulièrement à remplacer un nombre N des valeurs de vraisemblance 51 les plus élevées par un bit égal à 1 et remplacer les autres par un bit égal à 0, le nombre N étant prédéterminé ou le nombre N étant estimé à partir de la donnée biométrique considérée.
Le résultat de l'étape de génération d'un ensemble de premiers vecteurs binaires est que, à chaque donnée biométrique 1 de la collection individuelle 13, correspond un premier vecteur binaire 6.
Le procédé de classification permet ainsi de représenter l'information hautement discriminante représentant l'identité d'un individu sous une forme binaire dont le stockage, la manipulation informatique et le transfert sont aisés et de mettre à la disposition de procédés et systèmes d'authentification le large champ d'applications défini dans l'espace binaire.
En référence à la figure 5, il apparaît clairement qu'une fois projetés dans l'espace binaire deux vecteurs de vraisemblance différents du fait de petites variations ou erreurs sur les données biométriques d'entrée et/ou du fait des sources de variabilités donnent deux premiers vecteurs binaires présentant au moins la même séquence de bits égaux à 1 . Ceci est directement lié à la façon dont est construit le second modèle statistique et plus particulièrement à l'étape de sélection 9. Or, et comme nous le verrons ci-dessous, le score et la décision d'authentification dépendant selon la présente invention de la comparaison entre des vecteurs binaires, cette caractéristique rend peu variable le score et la décision d'authentification par rapport à des petites variations ou erreurs sur les données
biométriques d'entrée et par rapport aux sources de variabilités. Ces considérations illustrent la robustesse de la présente approche.
Le procédé de classification de données biométriques comprend en outre une étape de génération d'au moins un second vecteur binaire à partir de l'ensemble de premiers vecteurs binaires ou de sous-ensembles de premiers vecteurs binaires. Cette étape consiste à réaliser, entre les premiers vecteurs binaires de l'ensemble ou de chaque sous-ensemble, une opération logique parmi celles consistant en :
- une implémentation d'un algorithme de vote majoritaire pour déterminer, par comparaisons séquentielles bit à bit entre les premiers vecteurs binaires considérés, ledit au moins un second vecteur binaire par un ensemble réparti de bits égaux à 1 , chacun correspondant à une occurrence moyenne de bits égaux à 1 supérieure à une seconde valeur seuil déterminée, ou
- une implémentation d'un algorithme de comparaisons séquentielles bit à bit logiques de type ΈΤ' ou OU exclusif entre les premiers vecteurs binaires considérés pour déterminer ledit au moins un second vecteur binaire par un ensemble réparti de bits égaux à 1 , chacun correspondant à une occurrence totale de bits égaux à 1 ou à une occurrence unique d'un bit égal à 1 parmi les premiers vecteurs binaires considérés, respectivement, ou
- une implémentation d'un algorithme de détermination de synchronie de déplacements vecteur à vecteur parmi les premiers vecteurs binaires considérés, pour déterminer ledit au moins un second vecteur binaire par un ensemble de bits égaux à 1 répartis selon une séquence de bits égaux à 1 des premiers vecteurs binaires observée avec une occurrence moyenne supérieure à une troisième valeur seuil déterminée.
Cette étape conserve le nombre de bits par vecteur. Ainsi, ledit au moins un second vecteur binaire comprend le même nombre de bits que chacun desdits premiers vecteurs binaires. Le choix de l'opération logique est dicté par le nombre de bits égaux à 1 dudit au moins un second vecteur binaire obtenu.
Comme annoncé plus haut, le procédé de classification de données biométriques permet ainsi de contrôler aisément l'identité d'un individu par la comparaison simple de deux seconds vecteurs binaires déterminés
indépendamment, un second vecteur binaire dit de référence et un second vecteur binaire dit d'authentification.
Chaque premier ou second vecteur binaire comprend un nombre de bits égaux à 1 déterminé entre autres en fonction d'une des première, seconde et troisième valeurs seuils. Ce nombre est inférieur d'au moins un ordre de grandeur au nombre de bits égaux à 0.
En définissant des vecteurs binaires 'creux', autrement dit comprenant plus de bits égaux à 0 que de bits égaux à 1 , ou vice versa, le procédé permet d'assurer un niveau de discrimination haut et finement contrôlé et de définir et régler aisément un seuil de tolérance pour la décision d'authentification issue de la comparaison entre un second vecteur binaire de référence et un second vecteur binaire d'authentification. Le seuil de tolérance est par exemple défini par un nombre de différences en termes de bits ou de séquences de bits sur un nombre total de bits de chacun desdits seconds vecteurs binaires ou sur un nombre de séquences de bits identiques déterminé par la comparaison entre ces deux vecteurs binaires, respectivement.
L'invention concerne également un procédé d'authentification biométrique. Le procédé d'authentification biométrique comprend au moins une étape de captation d'une biométrie déterminée par un capteur d'un type déterminé et de traitement de la biométrie captée pour la transformer en une seconde collection individuelle 13 de données biométriques représentatives d'un individu.
Le procédé d'authentification biométrique comprend en outre au moins une étape du procédé de classification de données biométriques 1 tel que décrit ci- dessus. La mise en œuvre du procédé de classification est destinée à déterminer un second vecteur binaire de référence, puis un second vecteur binaire d'authentification à partir de ladite collection individuelle de données biométriques.
Le procédé d'authentification biométrique comprend en outre une étape de comparaison de ces deux seconds vecteurs binaires, et une étape de décision d'authentifier ou non un individu sur la base du résultat de l'étape précédente de comparaison.
L'étape de comparaison consiste plus particulièrement en une implémentation d'un algorithme de détermination de synchronie de déplacements entre le second vecteur binaire de référence et le second vecteur binaire d'authentification pour
déterminer l'occurrence de séquences de bits égaux à 1 identiques entre ces deux vecteurs.
L'étape de décision d'authentifier ou non un individu comprend plus particulièrement une étape de définition et de réglage d'un seuil de tolérance pour la décision d'authentification. Le seuil de tolérance est défini par un nombre de différences en termes de bits ou de séquences de bits sur un nombre total de bits de chacun desdits seconds vecteurs binaires ou sur un nombre de séquences de bits identiques entre ces deux vecteurs binaires déterminé lors de l'étape de comparaison, respectivement.
Les étapes de comparaison et de décision d'authentifier ou non un individu requièrent peu de ressources calculatoires et de capacité de stockage. Elles peuvent avantageusement être mises en œuvre sur de petits dispositifs portables, tels qu'une carte à puce d'une carte de paiement ou d'accès à un local sécurisé.
L'invention concerne également un système d'authentification biométrique qui comprend :
- un capteur d'un type déterminé propre à capter une biométrie déterminée et à la transformer en une seconde collection individuelle 13 de données biométriques représentatives d'un individu à authentifier,
- un premier support de mémorisation propre à stocker au moins les premier et second modèles statistiques et un calculateur propre à permettre la mise en œuvre d'au moins une étape du procédé de classification de données biométriques 1 décrit ci-dessus, pour obtenir au moins un second vecteur binaire d'authentification à partir de la seconde collection individuelle 13 de données biométriques lui ayant été transmise par le capteur,
- un module comparateur pour comparer le second vecteur binaire d'authentification à un second vecteur binaire de référence précédemment généré et stocké dans un second support de mémorisation relié au module comparateur, et
- un module de décision pour décider d'authentifier ou non un individu.
Dans un mode de réalisation du système, le support de mémorisation, le calculateur, le module comparateur et le module de décision sont embarqués dans un même dispositif communicant par liaison filaire ou radiofréquence. Par exemple, le système consiste en un téléphone portable communicant le résultat de la reconnaissance vocale à un serveur bancaire pour autoriser un transfert de fonds. Par un autre exemple, le système est installé en entrée d'un local sécurisé et sert à
authentifier l'individu qui se présente à l'entrée par reconnaissance faciale et/ou vocale, et transmettre le résultat de l'authentification à un dispositif de verrouillage/déverrouillage de la porte d'entrée du local sécurisé.
Dans un autre mode de réalisation, le premier support de mémorisation et le calculateur sont embarqués dans un premier dispositif communicant par liaison filaire ou radiofréquence et relié au capteur, et le second support de mémorisation, le module comparateur et le module de décision sont embarqués dans un second dispositif communicant par liaison filaire ou radiofréquence avec le premier dispositif communicant, pour transmettre au premier dispositif ou à un dispositif tiers le résultat de l'authentification.
Par exemple ledit premier dispositif est un dispositif de type caisse enregistreuse et le second dispositif est une carte de paiement à puce. L'authentification d'un individu ne requiert avantageusement pas le transfert des données biométriques proprement dites, qui pourraient alors être volées, mais le transfert d'un second vecteur binaire, par ailleurs plus aisé.
L'invention concerne également un produit programme d'ordinateur d'authentification biométrique comprenant des portions de code de programme enregistrés sur un support lisible par un ordinateur, pour mettre en œuvre au moins une étape du procédé de classification de données biométriques décrit ci-dessus, lorsque le programme fonctionne sur un ordinateur.
Il doit être évident pour les personnes versées dans l'art que la présente invention permet des modes de réalisation sous de nombreuses autres formes spécifiques sans l'éloigner du domaine d'application de l'invention comme revendiqué. Par conséquent, les présents modes de réalisation doivent être considérés à titre d'illustration, mais peuvent être modifiés dans le domaine défini par la portée des revendications jointes.
Claims
1 . Procédé de classification de données biométriques (1 ) appartenant à un premier espace de représentation continu et limité correspondant à au moins un capteur biométrique d'un type déterminé, caractérisé en qu'il comprend :
- une étape d'acquisition par ledit au moins un capteur d'un type déterminé de données biométriques sous forme d'un ensemble de vecteurs multidimensionnels de paramètres,
- une étape de définition d'un second espace de représentation dans lequel chaque donnée biométrique (1 ) est représentée par une première distribution (2) de sorte que les données biométriques y sont représentées par un premier ensemble de premières distributions, les premières distributions obéissant à une même loi de probabilité fonction d'au moins un premier paramètre, de sorte que le premier ensemble de premières distributions est défini par un premier ensemble de premiers paramètres déterminés en fonction des données biométriques,
- une première étape de construction d'un premier modèle statistique (3) en classification automatique d'une collection universelle (1 1 ) de données biométriques dans le second espace de représentation,
le premier modèle statistique étant défini par au moins un deuxième ensemble fini de deuxièmes distributions (31 ), les deuxièmes distributions obéissant à une même loi de probabilité fonction d'au moins un deuxième paramètre et étant réparties dans le second espace de représentation selon au moins un deuxième ensemble de deuxièmes paramètres, de sorte que chaque deuxième distribution définit un sous-espace du second espace de représentation comprenant une pluralité de premières distributions représentative d'une partie de ladite collection universelle (1 1 ) de données biométriques,
le deuxième ensemble de deuxièmes paramètres étant optimisé par une première implémentation (7) d'un algorithme de maximisation de vraisemblance, de sorte que le deuxième ensemble fini de deuxièmes distributions représente avec le maximum de vraisemblance, le premier ensemble de premières distributions (2) correspondant à ladite collection universelle de données biométriques,
le premier modèle statistique (3) étant ainsi au moins propre à faire correspondre à n'importe quelle donnée biométrique (1 ) un sous-espace déterminé, chaque sous-espace étant associé à une pluralité de données biométriques, et - une deuxième étape de construction d'un second modèle statistique (4) comprenant une pluralité de sous-modèles statistiques (41 ) en classification automatique d'un ensemble de premières collections individuelles (12) de données biométriques, chaque sous-modèle étant défini dans un sous-espace correspondant du second espace de représentation,
la deuxième étape de construction comprenant, pour chaque distribution représentative de chaque donnée biométrique de chaque collection individuelle (12), la détermination du sous-espace qui lui correspond selon le premier modèle statistique (3) et, dans ce sous-espace, sa classification (8) dans le sous-modèle correspondant, de sorte que chaque sous-modèle (41 ) est défini par un troisième ensemble de premières distributions (2),
la deuxième étape de construction comprenant en outre, pour chaque sous- espace, une étape de sélection (9) de premières distributions parmi ledit troisième ensemble de premières distributions par implémentation d'un algorithme itératif de maximisation de la couverture et de minimisation de la redondance, pour déterminer un quatrième ensemble minimal (21 ) de premières distributions (2) maximisant la couverture du sous-espace, de sorte que chaque sous-modèle (41 ) est défini par le quatrième ensemble minimal (21 ) de premières distributions lui correspondant,
de sorte que la pluralité de sous-modèles statistiques (41 ) du second modèle statistique (4) est défini par une pluralité de quatrièmes ensembles minimaux de premières distributions,
le second modèle statistique (4) étant ainsi au moins propre à permettre, pour n'importe quelle donnée biométrique d'un sous-espace déterminé selon le premier modèle statistique (3), de déterminer la première distribution avec laquelle sa vraisemblance est maximale parmi les premières distributions du quatrième ensemble minimal (21 ) de premières distributions correspondant,
- une étape d'enregistrement sur un support de mémorisation des premier et second modèles statistiques, de sorte à permettre leur utilisation ultérieure en classification automatique de données biométriques.
2. Procédé selon la revendication 1 , caractérisé en ce qu'il comprend en outre une première étape de génération d'un ensemble de vecteurs de vraisemblance (5) à partir d'une seconde collection individuelle (13) de données biométriques, l'étape de génération comprenant, pour chaque première distribution représentative de chaque donnée biométrique (1 ) de la seconde collection individuelle : - la détermination du sous-espace qui lui correspond en fonction du premier modèle statistique (3),
- dans ce sous-espace, le calcul d'une valeur de vraisemblance (51 ) entre la première distribution (1 ) représentative de la donnée biométrique considérée et chacune des premières distributions du quatrième ensemble minimal (21 ) correspondant au sous-espace, et
- la sélection d'au moins une vraisemblance parmi les plus élevées,
de sorte à générer à partir de chaque donnée biométrique de ladite seconde collection individuelle (13) de données biométriques et pour chaque sous-modèle statistique (41 ) du second modèle statistique (4) un vecteur de vraisemblance (5) composé des valeurs de vraisemblance (51 ) sélectionnées.
3. Procédé selon la revendication 2, caractérisé en ce qu'il comprend en outre une étape de génération d'un ensemble de premiers vecteurs binaires (6) à partir de la seconde collection individuelle (13) de données biométriques, cette étape consistant pour chaque vecteur de vraisemblance (5) à réaliser un échantillonnage statistique (10) déterminé parmi ceux consistant à :
- remplacer les valeurs de vraisemblance (51 ) supérieures à une première valeur seuil déterminée par un bit égal à 1 (61 ) et remplacer les autres par un bit égal à 0 (62), ou
- remplacer un nombre N des valeurs de vraisemblance (51 ) les plus élevées par un bit égal à 1 (61 ) et remplacer les autres par un bit égal à 0 (62), le nombre N étant prédéterminé ou le nombre N étant estimé à partir de la donnée biométrique considérée,
de sorte qu'à chaque donnée biométrique (1 ) correspond un premier vecteur binaire (6).
4. Procédé selon la revendication 3, caractérisé en ce qu'il comprend en outre une étape de génération d'au moins un second vecteur binaire à partir de l'ensemble de premiers vecteurs binaires (6) ou de sous-ensembles de premiers vecteurs binaires (6), cette étape consistant à réaliser, entre les premiers vecteurs binaires de l'ensemble ou de chaque sous-ensemble, une opération logique parmi celles consistant en :
- une implémentation d'un algorithme de vote majoritaire pour déterminer, par comparaisons séquentielles bit à bit entre les premiers vecteurs binaires (6) considérés, ledit au moins un second vecteur binaire par un ensemble réparti de bits égaux à 1 , chacun correspondant à une occurrence moyenne de bits égaux à 1 supérieure à une seconde valeur seuil déterminée, ou
- une implémentation d'un algorithme de comparaisons séquentielles bit à bit logiques de type 'ET' ou OU exclusif entre les premiers vecteurs binaires (6) considérés pour déterminer ledit au moins un second vecteur binaire par un ensemble réparti de bits égaux à 1 , chacun correspondant à une occurrence totale de bits égaux à 1 ou à une occurrence unique d'un bit égal à 1 parmi les premiers vecteurs binaires considérés, respectivement, ou
- une implémentation d'un algorithme de détermination de synchronie de déplacements vecteur à vecteur parmi les premiers vecteurs binaires considérés, pour déterminer ledit au moins un second vecteur binaire par un ensemble de bits égaux à 1 répartis selon une séquence de bits égaux à 1 des premiers vecteurs binaires observée avec une occurrence moyenne supérieure à une troisième valeur seuil déterminée,
ledit au moins un second vecteur binaire comprenant le même nombre de bits que chacun desdits premiers vecteurs binaires et le choix de l'opération logique étant dicté par le nombre de bits égaux à 1 dudit au moins un second vecteur binaire obtenu.
5. Procédé selon la revendication 3 ou la revendication 4, caractérisé en ce que chaque premier ou second vecteur binaire comprend un nombre de bits égaux à 1 déterminé entre autres en fonction d'une des première, seconde et troisième valeurs seuils, ce nombre étant inférieur d'au moins un ordre de grandeur au nombre de bits égaux à 0.
6. Procédé selon la revendication 1 , caractérisé en ce que le premier modèle statistique (3) est un modèle de Markov caché défini par le deuxième ensemble fini des deuxièmes distributions (31 ) en fonction d'ensembles de paramètres dont au moins un ensemble de probabilités d'état, chacune associée à une donnée biométrique (1 ), et un ensemble de probabilités de transition entre états, la première implémentation (7) consistant à implémenter l'algorithme de maximisation de vraisemblance dit de Baum-Welch.
7. Procédé selon la revendication 1 , caractérisé en ce que le premier modèle statistique (3) est un modèle de mélange de gaussiennes défini par le deuxième ensemble fini des deuxièmes distributions (31 ) en fonction d'ensembles de paramètres dont un ensemble de moyennes, chacune associée à une donnée biométrique (1 ), et un ensemble d'écart-types, chacun associé à une donnée biométrique (1 ), la première implémentation (7) consistant à implémenter l'algorithme de maximisation de vraisemblance dit d'espérance-maximisation selon un critère de maximum de vraisemblance déterminé.
8. Procédé selon la revendication 1 , caractérisé en ce que chacune desdites premières distributions (2) est une distribution gaussienne, de sorte que chaque sous-modèle statistique (41 ) du second modèle statistique (4) est défini par un troisième ensemble de distributions gaussiennes en fonction d'ensembles de paramètres dont un ensemble de moyennes, chacune associée à une donnée biométrique (1 ), et une matrice de covariance moyenne (42), issue d'une moyenne sur un ensemble d'écart-types.
9. Procédé selon la revendication 1 , caractérisé en ce que l'ensemble de premières collections individuelles (12) de données biométriques est issu d'un découpage de la collection universelle (1 1 ) de données biométriques.
10. Procédé d'authentification biométrique, caractérisé en ce qu'il comprend : - une étape de captation d'une biométrie déterminée par un capteur d'un type déterminé et de traitement de la biométrie captée pour la transformer en une seconde collection individuelle (13) de données biométriques représentatives d'un individu,
- une étape de mise en œuvre du procédé de classification de données biométriques (1 ) selon l'une au moins des revendications 1 à 9, pour déterminer un second vecteur binaire de référence et un second vecteur binaire d'authentification à partir de ladite collection individuelle de données biométriques,
- une étape de comparaison de ces deux seconds vecteurs binaires, et
- une étape de décision d'authentifier ou non un individu sur la base du résultat de l'étape précédente de comparaison.
1 1 . Procédé d'authentification biométrique selon la revendication 10, caractérisé en ce que l'étape de comparaison consiste en une implémentation d'un algorithme de détermination de synchronie de déplacements entre le second vecteur binaire de référence et le second vecteur binaire d'authentification pour déterminer l'occurrence de séquences de bits égaux à 1 identiques entre ces deux vecteurs.
12. Procédé d'authentification biométrique selon la revendication 10 ou la revendication 1 1 , caractérisé en ce que l'étape de décision d'authentifier ou non un individu comprend une étape de définition et de réglage d'un seuil de tolérance pour la décision d'authentification, le seuil de tolérance étant défini par un nombre de différences en termes de bits ou de séquences de bits sur un nombre total de bits de chacun desdits seconds vecteurs binaires ou sur un nombre de séquences de bits identiques entre ces deux vecteurs binaires déterminé lors de l'étape de comparaison, respectivement.
13. Système d'authentification biométrique caractérisé en ce qu'il comprend :
- un capteur d'un type déterminé propre à capter une biométrie déterminée et à la transformer en une seconde collection individuelle (13) de données biométriques représentatives d'un individu à authentifier,
- un premier support de mémorisation propre à stocker au moins des premier et second modèles statistiques (3 et 4) et un calculateur propre à permettre la mise en œuvre du procédé de classification de données biométriques (1 ) selon l'une au moins des revendications 1 à 9, pour obtenir au moins un second vecteur binaire d'authentification à partir de la seconde collection individuelle (13) de données biométriques lui ayant été transmise par le capteur,
- un module comparateur pour comparer le second vecteur binaire d'authentification à un second vecteur binaire de référence précédemment généré et stocké dans un second support de mémorisation relié au module comparateur, et
- un module de décision pour décider d'authentifier ou non l'individu.
14. Système d'authentification biométrique selon la revendication 13, caractérisé en ce que le support de mémorisation, le calculateur, le module comparateur et le module de décision sont embarqués dans un même dispositif communicant par liaison filaire ou radiofréquence.
15. Système d'authentification biométrique selon la revendication 13, caractérisé en ce que :
- le premier support de mémorisation et le calculateur sont embarqués dans un premier dispositif communicant par liaison filaire ou radiofréquence et relié au capteur, et - le second support de mémorisation, le module comparateur et le module de décision sont embarqués dans un second dispositif communicant par liaison filaire ou radiofréquence avec le premier dispositif communicant, pour transmettre au premier dispositif le résultat de l'authentification.
16. Produit programme d'ordinateur d'authentification biométrique comprenant des portions de code de programme enregistrés sur un support lisible par un ordinateur, pour mettre en œuvre le procédé de classification de données biométriques selon l'une au moins des revendications 1 à 9, lorsque le programme fonctionne sur un ordinateur.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US13/825,711 US9104976B2 (en) | 2010-09-24 | 2011-09-19 | Method for classifying biometric data |
| EP11771226.5A EP2619713A1 (fr) | 2010-09-24 | 2011-09-19 | Procede de classification de donnees biometriques |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR1057732A FR2965377A1 (fr) | 2010-09-24 | 2010-09-24 | Procede de classification de donnees biometriques |
| FR1057732 | 2010-09-24 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2012038654A1 true WO2012038654A1 (fr) | 2012-03-29 |
Family
ID=44070078
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/FR2011/052151 Ceased WO2012038654A1 (fr) | 2010-09-24 | 2011-09-19 | Procede de classification de donnees biometriques |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US9104976B2 (fr) |
| EP (1) | EP2619713A1 (fr) |
| FR (1) | FR2965377A1 (fr) |
| WO (1) | WO2012038654A1 (fr) |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9589565B2 (en) | 2013-06-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
| US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
| US10157272B2 (en) | 2014-02-04 | 2018-12-18 | Qualcomm Incorporated | Systems and methods for evaluating strength of an audio password |
| US9324321B2 (en) * | 2014-03-07 | 2016-04-26 | Microsoft Technology Licensing, Llc | Low-footprint adaptation and personalization for a deep neural network |
| US9529794B2 (en) * | 2014-03-27 | 2016-12-27 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
| KR20170025083A (ko) * | 2015-08-27 | 2017-03-08 | 삼성전기주식회사 | 지문 감지 장치 및 이를 포함하는 전자 장치 |
| US11073828B2 (en) * | 2017-12-08 | 2021-07-27 | Samsung Electronics Co., Ltd. | Compression of semantic information for task and motion planning |
| US10602207B2 (en) * | 2018-08-03 | 2020-03-24 | Facebook, Inc. | Neural network based content distribution in an online system |
| US11195619B2 (en) * | 2018-09-18 | 2021-12-07 | International Business Machines Corporation | Real time sensor attribute detection and analysis |
| CN112541247B (zh) * | 2019-09-23 | 2023-03-10 | 华为技术有限公司 | 控制系统的控制参数向量的搜索方法和装置 |
| US11838291B2 (en) * | 2021-07-15 | 2023-12-05 | At&T Intellectual Property I, L.P. | Distributed storage and user verification for visual feeds |
| US20230131359A1 (en) * | 2021-10-27 | 2023-04-27 | Nuance Communications | System and Method for Generating Synthetic Cohorts Using Generative Modeling |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007131530A1 (fr) | 2006-05-16 | 2007-11-22 | Loquendo S.P.A. | Compensation de la variabilité intersession pour extraction automatique d'informations à partir de la voix |
| WO2010049695A1 (fr) | 2008-10-29 | 2010-05-06 | British Telecommunications Public Limited Company | Vérification de locuteur |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2739977B1 (fr) | 1995-10-17 | 1998-01-23 | France Telecom | Capteur monolithique d'empreintes digitales |
| US7349758B2 (en) * | 2003-12-18 | 2008-03-25 | Matsushita Electric Industrial Co., Ltd. | Interactive personalized robot for home use |
| US8639506B2 (en) * | 2010-03-11 | 2014-01-28 | Telefonica, S.A. | Fast partial pattern matching system and method |
-
2010
- 2010-09-24 FR FR1057732A patent/FR2965377A1/fr not_active Withdrawn
-
2011
- 2011-09-19 US US13/825,711 patent/US9104976B2/en not_active Expired - Fee Related
- 2011-09-19 WO PCT/FR2011/052151 patent/WO2012038654A1/fr not_active Ceased
- 2011-09-19 EP EP11771226.5A patent/EP2619713A1/fr not_active Ceased
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007131530A1 (fr) | 2006-05-16 | 2007-11-22 | Loquendo S.P.A. | Compensation de la variabilité intersession pour extraction automatique d'informations à partir de la voix |
| WO2010049695A1 (fr) | 2008-10-29 | 2010-05-06 | British Telecommunications Public Limited Company | Vérification de locuteur |
Non-Patent Citations (5)
| Title |
|---|
| ANGUERA: "A Novel Speaker Binary Key Derived from Anchor Models", INTERSPEECH 2010, 26 September 2010 (2010-09-26), pages 2118 - 2121, XP055000398, Retrieved from the Internet <URL:http://lia.univ-avignon.fr/fileadmin/documents/Users/Intranet/fich_art/i10_2118.pdf> [retrieved on 20110609] * |
| DANIEL POVEY ET AL: "Universal background model based speech recognition", ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2008. ICASSP 2008. IEEE INTERNATIONAL CONFERENCE ON, IEEE, PISCATAWAY, NJ, USA, 31 March 2008 (2008-03-31), pages 4561 - 4564, XP031251613, ISBN: 978-1-4244-1483-3 * |
| MAMI ET AL: "Speaker recognition by location in the space of reference speakers", SPEECH COMMUNICATION, vol. 48, no. 2, 1 February 2006 (2006-02-01), ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM, NL, pages 127 - 141, XP005231086, ISSN: 0167-6393, DOI: 10.1016/J.SPECOM.2005.06.014 * |
| REYNOLDS D A ET AL: "SPEAKER VERIFICATION USING ADAPTED GAUSSIAN MIXTURE MODELS", DIGITAL SIGNAL PROCESSING, vol. 10, no. 1-03, 3 June 1999 (1999-06-03), ACADEMIC PRESS, ORLANDO,FL, US, pages 19 - 41, XP001076861, ISSN: 1051-2004, DOI: 10.1006/DSPR.1999.0361 * |
| ZHENCHUN LEI ET AL: "An UBM-Based Reference Space for Speaker Recognition", 18TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR'06), vol. 4, 20 August 2006 (2006-08-20) - 24 August 2006 (2006-08-24), pages 318 - 321, XP055000400, ISBN: 978-0-76-952521-1, DOI: 10.1109/ICPR.2006.265 * |
Also Published As
| Publication number | Publication date |
|---|---|
| FR2965377A1 (fr) | 2012-03-30 |
| EP2619713A1 (fr) | 2013-07-31 |
| US9104976B2 (en) | 2015-08-11 |
| US20130262356A1 (en) | 2013-10-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2012038654A1 (fr) | Procede de classification de donnees biometriques | |
| EP3640843B1 (fr) | Procédé d'extraction de caractéristiques d'une empreinte digitale représentée par une image d'entrée | |
| WO2020050966A1 (fr) | Adaptation utilisateur pour authentification biométrique | |
| EP2356773B1 (fr) | Procede d'identification ou d'autorisation, et systeme et module securise associes | |
| FR3088467A1 (fr) | Procede de classification d'une image d'entree representative d'un trait biometrique au moyen d'un reseau de neurones a convolution | |
| EP3620970B1 (fr) | Procédé d'extraction de caractéristiques d'une empreinte digitale représentée par une image d'entrée | |
| WO2006103240A1 (fr) | Procédé d'identification de visages à partir d'images de visage, dispositif et programme d'ordinateur correspondants | |
| EP2537286B1 (fr) | Procédé d'authentification biométrique, système d'authentification et programme correspondant | |
| EP4016381A1 (fr) | Procédé d'extraction d'une signature d'une empreinte digitale et dispositif mettant en oeuvre ledit procédé | |
| FR3105479A1 (fr) | Procédé et système pour une identification et une authentification biométrique avec template audiovisuel | |
| FR3050853A1 (fr) | Procede de verification d'une authentification ou d'une identification biometrique | |
| EP2517151B1 (fr) | Codage biometrique | |
| EP2804175A1 (fr) | Procédé de reconnaissance vocale visuelle par suivi des déformations locales d'un ensemble de points d'intérêt de la bouche du locuteur | |
| EP3929809A1 (fr) | Procédé de détection d'au moins un trait biométrique visible sur une image d entrée au moyen d'un réseau de neurones à convolution | |
| EP2804129A1 (fr) | Procédé de reconnaissance vocale visuelle avec sélection de groupes de points d'intérêts les plus pertinents | |
| EP2048592B1 (fr) | Procédé d'authentification biométrique, système d'authentification, programme et terminal correspondants | |
| EP4607479A1 (fr) | Méthode et système d'encodage d'une liste de minuties d'un dactylogramme | |
| WO2007060360A1 (fr) | Procede d'authentification de donnees sequentielles et equipements mettant en oeuvre un tel procede | |
| US12159483B2 (en) | System for frequency filtering in image analysis for identity verification | |
| EP4607478A1 (fr) | Méthode de comparaison de deux dactylogrammes | |
| WO2025061617A1 (fr) | Procédé d'authentification ou d'identification multi-biométrique | |
| FR3144375A3 (fr) | Méthode de contrôle d’accès robuste aux tentatives de fraude pour un système de contrôle d’accès par reconnaissance faciale | |
| EP2151785A1 (fr) | Procédé et dispositif d'authentification parcellaire et non réversible | |
| WO2006010855A1 (fr) | Procede et dispositif de signature et de reconnaissance d'un visage base sur des transformations ondelettes | |
| FR2930064A1 (fr) | Procede et dispositif de construction d'un reseau de neurones pour la reconnaissance d'une image, support de donnees, procede et dispositif de reconnaissance et produits programmes d'ordinateur correspondants. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 11771226 Country of ref document: EP Kind code of ref document: A1 |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| REEP | Request for entry into the european phase |
Ref document number: 2011771226 Country of ref document: EP |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2011771226 Country of ref document: EP |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 13825711 Country of ref document: US |