JP2009527798A5

JP2009527798A5 -

Info

Publication number: JP2009527798A5
Application number: JP2008556366A
Authority: JP
Filing date: 2007-02-13
Publication date: 2010-01-28
Anticipated expiration: 2027-02-13

Claims

ユーザにより生成された音声信号を受け取ることと、
前記音声信号に基づいて複数の混合成分のそれぞれの背景平均を含む背景モデルを適合させることによって、前記複数の混合成分のそれぞれの適合平均を形成することと、
公称ユーザ識別を受け取ることと、
前記複数の混合成分について判定された関数の合計を判定することによって前記公称ユーザにより提供されたトレーニング音声信号と前記受け取られた音声信号との間の類似性スコアを判定することであって、各関数は、前記受け取った音声信号に基づく混合成分の事後確率と、適合平均と背景平均との間の差との積を含む、前記判定することと、
前記受け取った音声信号が前記公称ユーザにより生成されたかどうかを判定するために前記類似性スコアを使用することと、
を含むことを特徴とする方法。
ユーザからのトレーニング音声信号に基づいて前記背景モデルを適合させることによって、前記複数の混合成分のそれぞれのトレーニング平均を形成することをさらに含むことを特徴とする請求項１に記載の方法。
前記各関数は、前記トレーニング音声信号に基づく混合成分の事後確率と、トレーニング平均と背景平均との間の差との積をさらに含むことを特徴とする請求項２に記載の方法。
前記公称ユーザ識別に基づいて前記関数内で使用されるトレーニング平均（１００２）を選択すること、
をさらに含むことを特徴とする請求項３に記載の方法。
話者プール内の複数の話者のそれぞれの話者プール平均を形成することをさらに含み、話者の前記話者プール平均は、前記話者からの音声に基づいて前記背景モデルを適合させることによって形成されることを特徴とする請求項１に記載の方法。
前記各関数は、対応するしきい値をさらに含み、各しきい値は、前記話者プール内の前記話者のサブセットの話者プール平均に基づくことを特徴とする請求項５に記載の方法。
前記話者プール平均および前記適合平均から判定された類似性スコアに基づいて前記話者プールから話者の前記サブセットを選択することをさらに含むことを特徴とする請求項６に記載の方法。
ユーザからのトレーニング音声信号に基づいて前記背景モデルを適合させることによって前記複数の混合成分のそれぞれのトレーニング平均を形成することと、
前記話者プール内の前記話者の第２サブセットの話者プール平均に基づいて公称ユーザしきい値を判定することであって、前記第２サブセットは、前記話者プール平均および前記トレーニング平均から判定された類似性スコアに基づいて前記話者プールから選択される、判定することと
をさらに含むことを特徴とする請求項７に記載の方法。
前記各関数は、第２しきい値をさらに含むことを特徴とする請求項８に記載の方法。
コンピュータ実行可能命令を記憶したコンピュータ可読記録媒体であって、前記コンピュータ実行可能命令はプロセッサにより実行されると以下のステップを前記プロセッサに実行させる前記コンピュータ可読記録媒体において、
第１適合平均を形成するためにテスト発話に基づいて背景平均を含む背景モデルを適合することと、
第２適合平均を形成するために格納されたユーザ発話に基づいて前記背景モデルを適合することと、
類似性スコアの第１セットを形成するために前記第１適合平均に基づいて前記テスト発話とトレーニング発話のセットのそれぞれとの間の類似性スコアを判定することと、
前記テスト発話の集団としてトレーニング発話の前記セットのサブセットを選択するために前記類似性スコアの第１セットを使用することと、
類似性スコアの第２セットを形成するために前記第２適合平均に基づいて格納された前記テスト発話とトレーニング発話の前記セットのそれぞれとの間の類似性スコアを判定することと、
格納された前記ユーザ発話の集団としてトレーニング発話の前記セットのサブセットを選択するために前記類似性スコアの第２セットを使用することと、
第１しきい値を計算するために前記テスト発話の集団を使用することと、
第２しきい値を計算するために前記格納されたユーザ発話の集団を使用することと、
前記テスト発話と前記格納されたユーザ発話との間の認証類似性スコアを計算するために前記第１しきい値、前記第２しきい値、前記第１適合平均と前記背景平均との間の差、及び前記第２適合平均と前記背景平均との間の差を使用することと
を含むステップを有することを特徴とするコンピュータ可読記録媒体。
前記テスト発話とトレーニング発話との間の類似性スコアを判定することは、前記背景モデルの前記背景平均と前記第１適合平均との間の差を判定することと、前記類似性スコアを判定するために前記差を使用することとを含むことを特徴とする請求項１０に記載のコンピュータ可読記録媒体。
前記テスト発話とトレーニング発話との間の類似性スコアを判定することは、前記テスト発話に基づいて混合成分の確率を判定することと、前記類似性スコアを判定するために、前記混合成分の前記確率と前記適合平均と前記背景平均との間の差との積を使用することとをさらに含むことを特徴とする請求項１１に記載のコンピュータ可読記録媒体。