WO2023013019A1

WO2023013019A1 - 発話フィードバック装置、発話フィードバック方法、プログラム

Info

Publication number: WO2023013019A1
Application number: PCT/JP2021/029278
Authority: WO
Inventors: 賢一野口; 和則小林; 弘章伊藤
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 2021-08-06
Filing date: 2021-08-06
Publication date: 2023-02-09
Anticipated expiration: 2024-02-06
Also published as: JPWO2023013019A1; US20250080905A1; JP7677431B2

Abstract

発話音量の程度を発話者にフィードバックする技術を提供する。発話者の音声である発話音声を収音するために当該発話者の近くに設置された第１マイクが出力する第１収音信号と、当該発話音声を収音するために第１マイクより当該発話者から遠い位置に設置された第２マイクが出力する第２収音信号から、発話音声の音量に対する評価値（以下、発話音量評価値という）を生成する発話音量評価部と、前記発話音量評価値に応じたフィードバックゲインを用いて、第１収音信号から、発話者に発話音声の音量の程度を示すフィードバック音をスピーカから放音するための信号（以下、フィードバック音信号という）を生成するフィードバック音信号生成部とを含む。

Description

発話フィードバック装置、発話フィードバック方法、プログラム

　本発明は、発話者の音声が周囲の人に迷惑となることを防ぐための音響信号処理技術に関する。

　発話者の音声が周囲の人に迷惑となることを防ぐための音響信号処理技術として、特許文献１に記載の技術がある。特許文献１に記載の技術では、スピーカから再生される遠端話者の音声が周囲の人に聞こえないようにマスキングする妨害音（以下、マスキング音という）を用いて当該音声が周囲に漏れることを防ぐとともに、マスキング音が過大となり周囲の人に迷惑となることを防ぐ。

特開２００９－２６７７９９号公報

　特許文献１の技術は、マスキング音を再生することで、周囲の人に発話内容を聞き取れないようにするものである。そのため、発話者は、どの程度の音量で発話すれば周囲の人が発話内容を聞き取れないのかを把握することができない。

　そこで本発明では、発話音量の程度を発話者にフィードバックする技術を提供することを目的とする。

　本発明の一態様は、発話者の音声である発話音声を収音するために当該発話者の近くに設置された第１マイクが出力する第１収音信号と、当該発話音声を収音するために第１マイクより当該発話者から遠い位置に設置された第２マイクが出力する第２収音信号から、発話音声の音量に対する評価値（以下、発話音量評価値という）を生成する発話音量評価部と、前記発話音量評価値に応じたフィードバックゲインを用いて、第１収音信号から、発話者に発話音声の音量の程度を示すフィードバック音をスピーカから放音するための信号（以下、フィードバック音信号という）を生成するフィードバック音信号生成部とを含む。

　本発明によれば、発話音量の程度を発話者にフィードバックすることが可能となる。

発話フィードバック装置１００の構成を示すブロック図である。発話フィードバック装置１００の動作を示すフローチャートである。発話フィードバック装置２００の構成を示すブロック図である。発話フィードバック装置２００の動作を示すフローチャートである。発話フィードバック装置３００の構成を示すブロック図である。発話フィードバック装置３００の動作を示すフローチャートである。発話フィードバック装置３０１の構成を示すブロック図である。発話フィードバック装置３０１の動作を示すフローチャートである。発話フィードバック装置３０２の構成を示すブロック図である。発話フィードバック装置３０２の動作を示すフローチャートである。発話フィードバック装置４００の構成を示すブロック図である。発話フィードバック装置４００の動作を示すフローチャートである。発話評価部４１０の構成を示すブロック図である。発話評価部４１０の動作を示すフローチャートである。本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。

　以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

　各実施形態の説明に先立って、この明細書における表記方法について説明する。

　^（キャレット）は上付き添字を表す。例えば、x^{y^z}はy^zがxに対する上付き添字であり、x_y^zはy^zがxに対する下付き添字であることを表す。また、_（アンダースコア）は下付き添字を表す。例えば、x^y_zはy_zがxに対する上付き添字であり、x_{y_z}はy_zがxに対する下付き添字であることを表す。

　ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。

＜第１実施形態＞
　以下、図１～図２を参照して発話フィードバック装置１００を説明する。図１は、発話フィードバック装置１００の構成を示すブロック図である。図２は、発話フィードバック装置１００の動作を示すフローチャートである。図１に示すように発話フィードバック装置１００は、発話音量評価部１１０と、フィードバック音信号生成部１２０と、記録部１９０を含む。記録部１９０は、発話フィードバック装置１００の処理に必要な情報を適宜記録する構成部である。また、発話フィードバック装置１００は、マイク９１０と、スピーカ９２０と接続している。マイク９１０は、発話者の音声である発話音声を収音するために発話者の近くに設置されるものである。スピーカ９２０は、発話者に発話音声の音量の程度を示すフィードバック音を放音するために設置されるものである。なお、スピーカ９２０の代わりに、ヘッドホンやイヤホンなどを用いてもよい。

　図２に従い発話フィードバック装置１００の動作について説明する。

　Ｓ１１０において、発話音量評価部１１０は、マイク９１０が出力する収音信号を入力とし、収音信号から、発話音声の音量に対する評価値（以下、発話音量評価値という）を生成し、出力する。発話音量評価部１１０は、例えば、収音信号のパワーを所定の閾値と比較することにより、発話音量評価値を生成する。なお、発話音量評価部１１０は、収音信号のパワーを計算する際、音声区間を検出するようにしてもよいし、雑音を抑圧するようにしてもよい。また、発話音量評価値は、発話音量が大きいことを示す値、発話音量が小さいことを示す値などとするとよい。

　Ｓ１２０において、フィードバック音信号生成部１２０は、マイク９１０が出力する収音信号とＳ１１０で生成した発話音量評価値を入力とし、当該発話音量評価値に応じたフィードバックゲインを用いて、収音信号から、スピーカ９２０から放音するフィードバック音の信号（以下、フィードバック音信号という）を生成し、出力する。発話者は自身の発話音声から生成されるフィーバック音を聞きながら発話することになるが、フィードバック遅延が20ms以上になると遅延が気になり、50msを超えるとフィードバック音が邪魔をし発話が困難となることが知られている。そこで、フィードバック音信号生成部１２０は、例えば、発話者による発話から発話者がフィードバック音を聴くまでの時間が20ms以内になるようにフィードバック音信号を生成するようにすればよい。

　また、フィードバック音信号生成部１２０は、発話音量評価値が大きいことを示す値であるほど、フィードバックゲインを大きな値としてもよい。例えば、発話音量評価値が過大であることを示す値である場合、一時的に歪が生じるようなフィードバックゲインを用いて、フィードバック音信号を生成してもよい。なお、発話音量評価値が過大であることを示す値であるか否かは、発話音量評価値が所定の閾値を超えるか否かで判定するとよい。

　さらに、フィードバック音信号生成部１２０は、例えば、雑音抑圧処理、音声明瞭化処理、音声帯域を強調するスペクトル処理を用いて収音信号を処理することで、フィードバック音が発話者に聞き取りやすい音になるようにしてもよい。雑音抑圧処理としてアクティブノイズコントロール(ANC: Active Noise Control)を用いる場合、フィードバック音信号生成部１２０は、発話音量評価値が大きいことを示す値であるほど、アクティブノイズコントロールの効果が大きくなるようにしてもよい。

　本発明の実施形態によれば、発話音量の程度を発話者にフィードバックすることが可能となる。これにより、発話者が自発的に発話音量を調整することができるようになる。また、フィードバック音信号を生成する際に雑音抑圧処理を用いることで、ロンバード効果を応用した形での発話音量の調整、つまり、雑音下でつい大きな声で発話してしまうことを抑制することが可能となる。

＜第２実施形態＞
　以下、図３～図４を参照して発話フィードバック装置２００を説明する。図３は、発話フィードバック装置２００の構成を示すブロック図である。図４は、発話フィードバック装置２００の動作を示すフローチャートである。図３に示すように発話フィードバック装置２００は、発話音量評価部２１０と、フィードバック音信号生成部１２０と、記録部１９０を含む。記録部１９０は、発話フィードバック装置２００の処理に必要な情報を適宜記録する構成部である。また、発話フィードバック装置２００は、第１マイク９１０－１と、第２マイク９１０－２と、スピーカ９２０と接続している。第１マイク９１０－１は、発話者の音声である発話音声を収音するために発話者の近くに設置されるものである。第２マイク９１０－２は、発話音声を収音するために第１マイク９１０－１より発話者から遠い位置に設置されるものであり、発話者の発話が周囲の人にどの程度の音量で聞こえるかを測定するために設置されるものである。スピーカ９２０は、発話者に発話音声の音量の程度を示すフィードバック音を放音するために設置されるものである。なお、第１マイク９１０－１と第２マイク９１０－２の間にパーティションを設置してもよい。具体的には、パーティションを境に、第１マイク９１０－１は発話者と同じ側に、第２マイク９１０－２は発話者と反対側になるように設置する。また、スピーカ９２０の代わりに、ヘッドホンやイヤホンなどを用いてもよい。発話フィードバック装置２００は、発話音量評価部１１０の代わりに発話音量評価部２１０を含む点と、２つのマイクと接続する点において発話フィードバック装置１００と異なる。

　図４に従い発話フィードバック装置２００の動作について説明する。

　Ｓ２１０において、発話音量評価部２１０は、第１マイク９１０－１が出力する第１収音信号と第２マイク９１０－２が出力する第２収音信号とを入力とし、第１収音信号と第２収音信号から、発話音声の音量に対する評価値（以下、発話音量評価値という）を生成し、出力する。発話音量評価部２１０は、例えば、第２収音信号のパワーを所定の閾値と比較することにより、発話音量評価値を生成する。発話音量評価部２１０は、第２収音信号のパワーを求める際、雑音の影響を除くために第１収音信号を用いて検出される音声区間を利用する。第２収音信号のパワーに基づいて発話音量評価値を生成することで、発話音量評価部２１０は、パーティションが設置されている場合にパーティションによる発話音声の減衰効果を考慮した形で、発話音量評価値を生成することができる。

　Ｓ１２０において、フィードバック音信号生成部１２０は、第１マイク９１０－１が出力する第１収音信号とＳ２１０で生成した発話音量評価値を入力とし、当該発話音量評価値に応じたフィードバックゲインを用いて、第１収音信号から、スピーカ９２０から放音するフィードバック音の信号（以下、フィードバック音信号という）を生成し、出力する。

　本発明の実施形態によれば、発話音量の程度を発話者にフィードバックすることが可能となる。主に発話音声が収音され周囲の雑音が相対的に小さい第１収音信号を用いて検出される音声区間を利用して第２収音信号のパワーを求めることで、より正確に発話音量評価値を生成することが可能となる。

＜第３実施形態＞
　以下、図５～図６を参照して発話フィードバック装置３００を説明する。図５は、発話フィードバック装置３００の構成を示すブロック図である。図６は、発話フィードバック装置３００の動作を示すフローチャートである。図５に示すように発話フィードバック装置３００は、発話音量評価部１１０と、ハウリング防止部３１０と、フィードバック音信号生成部３２０と、記録部１９０を含む。記録部１９０は、発話フィードバック装置３００の処理に必要な情報を適宜記録する構成部である。また、発話フィードバック装置３００は、マイク９１０と、スピーカ９２０と接続している。発話フィードバック装置３００は、ハウリング防止部３１０を含む点と、フィードバック音信号生成部１２０の代わりにフィードバック音信号生成部３２０を含む点において発話フィードバック装置１００と異なる。

　図６に従い発話フィードバック装置３００の動作について説明する。ここでは、ハウリング防止部３１０とフィードバック音信号生成部３２０の動作についてのみ説明する。

　Ｓ３１０において、ハウリング防止部３１０は、マイク９１０が出力する収音信号を入力とし、収音信号から、フィードバック音をスピーカから放音する場合にハウリングが生じる可能性を示すハウリング評価値を生成し、出力する。

　Ｓ３２０において、フィードバック音信号生成部３２０は、マイク９１０が出力する収音信号とＳ１１０で生成した発話音量評価値とＳ３１０で生成したハウリング評価値を入力とし、当該発話音量評価値と当該ハウリング評価値に応じたフィードバックゲインを用いて、収音信号から、スピーカ９２０から放音するフィードバック音の信号（以下、フィードバック音信号という）を生成し、出力する。フィードバック音信号生成部３２０は、ハウリング評価値が大きいことを示す値であるほど、フィードバックゲインを小さな値とする。

（変形例１）
　発話フィードバック装置は、２つのマイクと接続するようにしてもよい。

　以下、図７～図８を参照して発話フィードバック装置３０１を説明する。図７は、発話フィードバック装置３０１の構成を示すブロック図である。図８は、発話フィードバック装置３０１の動作を示すフローチャートである。図７に示すように発話フィードバック装置３０１は、発話音量評価部２１０と、ハウリング防止部３１０と、フィードバック音信号生成部３２０と、記録部１９０を含む。記録部１９０は、発話フィードバック装置３０１の処理に必要な情報を適宜記録する構成部である。また、発話フィードバック装置３０１は、第１マイク９１０－１と、第２マイク９１０－２と、スピーカ９２０と接続している。発話フィードバック装置３０１は、発話音量評価部１１０の代わりに発話音量評価部２１０を含む点と、２つのマイクと接続する点において発話フィードバック装置３００と異なる。

　図８に従い発話フィードバック装置３０１の動作について説明する。ここでは、ハウリング防止部３１０とフィードバック音信号生成部３２０の動作についてのみ説明する。

　Ｓ３１０において、ハウリング防止部３１０は、第１マイク９１０－１が出力する第１収音信号を入力とし、第１収音信号から、フィードバック音をスピーカから放音する場合にハウリングが生じる可能性を示すハウリング評価値を生成し、出力する。

　Ｓ３２０において、フィードバック音信号生成部３２０は、第１マイク９１０－１が出力する第１収音信号とＳ１１０で生成した発話音量評価値とＳ３１０で生成したハウリング評価値を入力とし、当該発話音量評価値と当該ハウリング評価値に応じたフィードバックゲインを用いて、第１収音信号から、スピーカ９２０から放音するフィードバック音の信号（以下、フィードバック音信号という）を生成し、出力する。

（変形例２）
　発話フィードバック装置は、マイクとスピーカの代わりにマイクアレイとスピーカアレイと接続するようにしてもよい。

　以下、図９～図１０を参照して発話フィードバック装置３０２を説明する。図９は、発話フィードバック装置３０２の構成を示すブロック図である。図１０は、発話フィードバック装置３０２の動作を示すフローチャートである。図９に示すように発話フィードバック装置３０２は、マイクアレイ処理部３０５と、発話音量評価部１１０と、ハウリング防止部３１０と、フィードバック音信号生成部３２０と、スピーカアレイ処理部３２５と、記録部１９０を含む。記録部１９０は、発話フィードバック装置３０２の処理に必要な情報を適宜記録する構成部である。また、発話フィードバック装置３０２は、N個（Nは２以上の整数）のマイクを含むマイクアレイ９１１と、M個（Mは２以上の整数）のスピーカを含むスピーカアレイ９２１と接続している。マイクアレイ９１１は、発話者の音声である発話音声を収音するために発話者の近くに設置されるものである。スピーカアレイ９２１は、発話者に発話音声の音量の程度を示すフィードバック音を放音するために設置されるものである。発話フィードバック装置３０２は、マイクアレイ処理部３０５とスピーカアレイ処理部３２５とを含む点と、マイク９１０とスピーカ９２０の代わりにマイクアレイ９１１とスピーカアレイ９２１と接続する点において発話フィードバック装置３００と異なる。

　図１０に従い発話フィードバック装置３０２の動作について説明する。ここでは、マイクアレイ処理部３０５とスピーカアレイ処理部３２５の動作についてのみ説明する。

　Ｓ３０５において、マイクアレイ処理部３０５は、マイクアレイ９１１に含まれるN個のマイクが出力するN個の収音信号を入力とし、当該N個の収音信号から統合収音信号を生成し、出力する。マイクアレイ処理部３０５は、例えば、所定の信号処理を用いて、発話者の方向に指向性を、スピーカアレイ９２１に含まれるスピーカの方向に死角を形成し、統合収音信号を生成するとよい。

　Ｓ３２５において、スピーカアレイ処理部３２５は、Ｓ３２０で生成したフィードバック音信号を入力とし、フィードバック音信号から、スピーカアレイ９２１に含まれるスピーカから放音するためのM個の個別フィードバック音信号を生成し、出力する。スピーカアレイ処理部３２５は、例えば、所定の信号処理を用いて、発話者の方向に指向性を、マイクアレイ９１１に含まれるマイクの方向に死角を形成するように、M個の個別フィードバック音信号を生成するとよい。発話者、マイクアレイ９１１に含まれるマイクの方向はどのような方法を用いて得られるものであってもよく、例えば、発話者の方向はマイクアレイ処理部３０５による音源方向推定により得ることができる。また、発話者、マイクアレイ９１１に含まれるマイクの位置の情報が得られる場合、これらの情報から、発話者、マイクアレイ９１１に含まれるマイクの方向を求めてもよい。なお、発話者、マイクアレイ９１１に含まれるマイクの位置の情報については、例えば、カメラで撮影した映像から位置を推定するシステム（図示しない）から得てもよいし、予めその位置の情報が得られる場合にはその情報を用いればよい。

　マイクアレイやスピーカアレイを用いて指向性を形成することにより、より正確にハウリング評価値を生成することが可能となる。

　本発明の実施形態によれば、発話音量の程度を発話者にフィードバックすることが可能となる。ハウリングを防止することにより、発話者がより的確に自発的に発話音量を調整することができるようになる。

＜第４実施形態＞
　以下、図１１～図１２を参照して発話フィードバック装置４００を説明する。図１１は、発話フィードバック装置４００の構成を示すブロック図である。図１２は、発話フィードバック装置４００の動作を示すフローチャートである。図１１に示すように発話フィードバック装置４００は、発話評価部４１０と、フィードバック音信号生成部４２０と、記録部１９０を含む。記録部１９０は、発話フィードバック装置４００の処理に必要な情報を適宜記録する構成部である。また、発話フィードバック装置４００は、マイク９１０と、スピーカ９２０と接続している。なお、スピーカ９２０の代わりに、ヘッドホンやイヤホンなどを用いてもよい。発話フィードバック装置４００は、発話音量評価部１１０の代わりに発話評価部４１０を含む点と、フィードバック音信号生成部１２０の代わりにフィードバック音信号生成部４２０を含む点において発話フィードバック装置１００と異なる。

　図１２に従い発話フィードバック装置４００の動作について説明する。

　Ｓ４１０において、発話評価部４１０は、マイク９１０が出力する収音信号を入力とし、収音信号から、発話音声に対する評価値（以下、発話評価値という）を生成し、出力する。

　以下、図１３～図１４を参照して発話評価部４１０を説明する。図１３は、発話評価部４１０の構成を示すブロック図である。図１４は、発話評価部４１０の動作を示すフローチャートである。図１３に示すように発話評価部４１０は、発話音量評価部１１０と、発話明瞭度評価部４１２と、発話評価値計算部４１４を含む。

　図１４に従い発話評価部４１０の動作について説明する。

　Ｓ１１０において、発話音量評価部１１０は、マイク９１０が出力する収音信号を入力とし、収音信号から、発話音声の音量に対する評価値（以下、発話音量評価値という）を生成し、出力する。

　Ｓ４１２において、発話明瞭度評価部４１２は、マイク９１０が出力する収音信号を入力とし、収音信号から、発話音声の明瞭度に対する評価値（以下、発話明瞭度評価値という）を生成し、出力する。発話明瞭度評価値として、例えば、短時間客観了解度(STOI: Short-Time Objective Intelligibility)や音声認識スコアを用いることができる。

　Ｓ４１４において、発話評価値計算部４１４は、Ｓ１１０で生成した発話音量評価値とＳ４１２で生成した発話明瞭度評価値を入力とし、発話音量評価値と発話明瞭度評価値との重みづけ和を計算し、当該和を発話評価値として出力する。

　Ｓ４２０において、フィードバック音信号生成部４２０は、マイク９１０が出力する収音信号とＳ４１０で生成した発話評価値を入力とし、当該発話評価値に応じたフィードバックゲインを用いて、収音信号から、スピーカ９２０から放音するフィードバック音の信号（以下、フィードバック音信号という）を生成し、出力する。

（変形例）
　発話フィードバック装置は、音を用いてフィードバックする代わりに、視覚情報を用いてフィードバックするようにしてもよい。この場合、発話フィードバック装置４００は、フィードバック音信号生成部４２０の代わりにフィードバック情報生成部４２１（図示しない）を含む。フィードバック情報生成部４２１は、Ｓ４１０で生成した発話評価値を入力とし、当該発話評価値が所定の閾値よい大きい場合、発話の音量が大きいことを示す情報を生成し、出力する。

　本発明の実施形態によれば、発話の音量と明瞭度に基づく発話の迷惑の程度を発話者にフィードバックすることが可能となる。発話の明瞭度も考慮した発話評価値を用いることにより、例えば、発話の音量は小さいが、その内容が聞き取れることで、周囲の人にとって耳障りとなる迷惑な発話についても、フィードバックすることが可能となる。

＜補記＞
　図１５は、上述の各装置を実現するコンピュータ２０００の機能構成の一例を示す図である。上述の各装置における処理は、記録部２０２０に、コンピュータ２０００を上述の各装置として機能させるためのプログラムを読み込ませ、制御部２０１０、入力部２０３０、出力部２０４０などに動作させることで実施できる。

　本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置（例えば通信ケーブル）が接続可能な通信部、ＣＰＵ（Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい）、メモリであるＲＡＭやＲＯＭ、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、ＣＤ－ＲＯＭなどの記録媒体を読み書きできる装置（ドライブ）などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。

　ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている（外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくこととしてもよい）。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。

　ハードウェアエンティティでは、外部記憶装置（あるいはＲＯＭなど）に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にＣＰＵで解釈実行・処理される。その結果、ＣＰＵが所定の機能（上記、…部、…手段などと表した各構成部）を実現する。

　本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

　既述のように、上記実施形態において説明したハードウェアエンティティ（本発明の装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ（Random Access Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ－ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

　また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

　上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。

Claims

　発話者の音声である発話音声を収音するために当該発話者の近くに設置された第１マイクが出力する第１収音信号と、当該発話音声を収音するために第１マイクより当該発話者から遠い位置に設置された第２マイクが出力する第２収音信号から、発話音声の音量に対する評価値（以下、発話音量評価値という）を生成する発話音量評価部と、
　前記発話音量評価値に応じたフィードバックゲインを用いて、第１収音信号から、発話者に発話音声の音量の程度を示すフィードバック音をスピーカから放音するための信号（以下、フィードバック音信号という）を生成するフィードバック音信号生成部と、
　を含む発話フィードバック装置。
　請求項１に記載の発話フィードバック装置であって、
　前記フィードバック音信号生成部は、発話音量評価値が大きいことを示す値であるほど、フィードバックゲインを大きな値とする
　ことを特徴とする発話フィードバック装置。
　請求項１に記載の発話フィードバック装置であって、
　前記フィードバック音信号生成部は、前記発話音量評価値が所定の閾値を超える場合、歪が生じるようなフィードバックゲインを用いて前記フィードバック音信号を生成する
　ことを特徴とする発話フィードバック装置。
　請求項１ないし３のいずれか１項に記載の発話フィードバック装置であって、
　第１収音信号を用いて、フィードバック音をスピーカから放音する場合にハウリングが生じる可能性を示すハウリング評価値を生成するハウリング防止部を含み、
　前記フィードバック音信号生成部は、ハウリング評価値が大きいことを示す値であるほど、フィードバックゲインを小さな値とする
　ことを特徴とする発話フィードバック装置。
　発話フィードバック装置が、発話者の音声である発話音声を収音するために当該発話者の近くに設置された第１マイクが出力する第１収音信号と、当該発話音声を収音するために第１マイクより当該発話者から遠い位置に設置された第２マイクが出力する第２収音信号から、発話音声の音量に対する評価値（以下、発話音量評価値という）を生成する発話音量評価ステップと、
　前記発話フィードバック装置が、前記発話音量評価値に応じたフィードバックゲインを用いて、第１収音信号から、発話者に発話音声の音量の程度を示すフィードバック音をスピーカから放音するための信号（以下、フィードバック音信号という）を生成するフィードバック音信号生成ステップと、
　を含む発話フィードバック方法。
　請求項１ないし４のいずれか１項に記載の発話フィードバック装置としてコンピュータを機能させるためのプログラム。