WO2025094322A1

WO2025094322A1 - 評価装置および評価方法

Info

Publication number: WO2025094322A1
Application number: PCT/JP2023/039481
Authority: WO
Inventors: 建井阪; 巌樹戸嶋; 淳史大塚; 篤深山; 肇能登
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2023-11-01
Filing date: 2023-11-01
Publication date: 2025-05-08
Anticipated expiration: 2026-05-01

Abstract

評価装置（１００）は、対話の参加者が発信したテキストと、対話の参加者の特徴および直近の対話の履歴を含む動的文脈情報と、記憶部（１５０）に格納された対話の履歴のうち、対話の参加者の特徴に対応する対話の履歴を含む静的文脈情報とを取得する取得部（１６２）と、テキストと、動的文脈情報と、静的文脈情報とを基にして、テキストによって伝えられる参加者の感覚の量を示す感覚情報量を算出する感覚情報量算出部（１６３）と、テキストと、感覚情報量とを出力する出力部（１６４）とを備える。

Description

評価装置および評価方法

　本発明は、評価装置および評価方法に関する。

　言語コミュニケーションにおいて、伝え手の感覚の伝達が、受け手の理解度を高め、集団としてのパフォーマンスを向上させることが知られている。たとえば、伝え手と受け手との相互理解を高めるためには、伝え手が発信したテキスト等の情報によって、伝え手の感覚を多く伝えることが重要である。

　テキストの良さを評価する従来技術として、ＡＩ（Artificial　Intelligence）よって生成されたテキストに含まれる比喩表現の良さを評価する技術がある。かかる従来技術では、比喩表現の良さを、この比喩表現が表す意味としての尤もらしさ（人間らしい表現であるかいなか）で評価する。

Tuhin　Chakrabarty　et　al.　"Generating　similes　like　a　Pro:　A　Style　Transfer　Approach　for　Simile　Generation"　Proceedings　of　the　2020　Conference　on　Empirical　Methods　in　Natural　Language　Processing,　pages　6455－6469,　November　16－20,　2020

　しかしながら、上述した従来技術では、テキストに対し、伝え手の伝えたい感覚が多く伝わっているのかを評価することができないという問題がある。

　たとえば、従来技術では、ＡＩに生成されたテキストの比喩表現等が、人間らしい表現であるかという観点から、テキストの評価を行っており、伝え手の伝えたい感覚が多く伝わっているのかを評価するものではない。

　本発明は、上記に鑑みてなされたものであって、伝え手の伝えたい感覚が多く伝わっているのかを評価することができる評価装置および評価方法を提供することを目的とする。

　上述した課題を解決し、目的を達成するために、評価装置は、対話の参加者が発信したテキストと、対話の参加者の特徴および直近の対話の履歴を含む動的文脈情報と、記憶部に格納された対話の履歴のうち、対話の参加者の特徴に対応する対話の履歴を含む静的文脈情報とを取得する取得部と、テキストと、動的文脈情報と、静的文脈情報とを基にして、テキストによって伝えられる参加者の感覚の量を示す感覚情報量を算出する感覚情報量算出部と、テキストと、感覚情報量とを出力する出力部とを備える。

　本発明によれば、伝え手の伝えたい感覚が多く伝わっているのかを評価することができる。

図１は、本実施例１にかかる評価装置の構成を示す機能ブロック図である。図２は、コミュニケーション履歴ＤＢのデータ構造の一例を示す図である。図３は、本実施例１にかかる評価装置の処理手順を示すフローチャートである。図４は、本実施例２にかかる評価装置の構成を示す機能ブロック図である。図５は、本実施例２にかかる評価装置の処理手順を示すフローチャートである。図６は、感覚情報量算出処理の処理手順を示すフローチャートである。図７は、本実施例３にかかる評価装置の構成を示す機能ブロック図である。図８は、個人特性ＤＢのデータ構造の一例を示す図である。図９は、本実施例３にかかる評価装置の処理手順を示すフローチャートである。図１０は、評価プログラムを実行するコンピュータの一例を示す図である。

　以下に、本願の開示する評価装置および評価方法の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

　本実施例１にかかる評価装置を「評価装置１００」と表記する。本実施例１では、評価装置１００は、対話中の参加者の近くに配置される。対話の参加者を、参加者Ａおよび参加者Ｂの２名として説明を行う。後述するように、評価装置１００は、参加者の音声をテキストに変換し、かかるテキストに対して、伝え手の伝えたい感覚が多く伝わっているかの評価を行う。

（本実施例１にかかる評価装置の構成例）
　まず、評価装置１００の構成例について説明する。図１は、本実施例１にかかる評価装置の構成を示す機能ブロック図である。図１に示すように、この評価装置１００は、通信制御部１１０と、入力部１２０と、表示部１３０と、マイク１４０と、記憶部１５０と、制御部１６０とを有する。

　通信制御部１１０は、ＮＩＣ（Network　Interface　Card）等で実現され、ネットワークに接続される外部装置と制御部１６０との通信を制御する。評価装置１００は、外部装置から、後述する関係性ＤＢ１５２、コミュニケーション履歴ＤＢ１５３等を取得してもよい。

　入力部１２０は、キーボード、マウス等の入力デバイスを用いて実現され、対話の参加者は、入力部１２０を操作し、制御部１６０に対して各種の情報を入力する。たとえば、参加者は対話を開始する前に、入力部１２０を操作して、参加者ＩＤを入力する。参加者ＩＤは、参加者を識別する情報である。

　表示部１３０は、制御部１６０から取得した情報を出力する出力デバイスであり、液晶ディスプレイなどの表示装置、プリンター等の印刷装置等によって実現される。たとえば、表示部１３０は、参加者の発信したテキストに対する評価結果を表示する。

　マイク１４０は、対話中の参加者の音声を集音し、集音した音声（電気信号）を制御部１６０に出力する。

　記憶部１５０は、対話履歴バッファ１５１と、関係性ＤＢ１５２と、コミュニケーション履歴ＤＢ１５３とを有する。記憶部１５０は、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。

　対話履歴バッファ１５１は、現在対話を行っている参加者Ａおよび参加者Ｂの音声のテキストを格納する。たとえば、テキストは、参加者ＩＤ毎に区別され、時系列に格納される。

　関係性ＤＢ１５２は、対話中の参加者の関係性を定義した情報を保持する。たとえば、関係性ＤＢ１５２は、対話中の参加者の参加者ＩＤの組と、参加者の関係性とを対応付ける。参加者の関係性は、「上司と部下」、「ドライバーとエンジニア」等である。

　コミュニケーション履歴ＤＢ１５３は、過去の対話の履歴の情報を保持する。図２は、コミュニケーション履歴ＤＢのデータ構造の一例を示す図である。図２に示すように、コミュニケーション履歴ＤＢ１５３は、対話参加者ＩＤ、場所、関係性、対話履歴を有する。

　対話参加者ＩＤには、該当する対話に参加した参加者の参加者ＩＤの組が設定される。場所は、該当する対話が行われた場所が設定される。関係性は、上述した参加者の関係性である。対話履歴は、該当する対話の参加者によって行われた１回の対話でやり取りされたテキストの履歴が設定される。

　「１回の対話」をどのように定義してもよいが、本実施例１では、参加者が対話を開始してから終了するまでに一連の会話のやり取りを、１回の対話とする。１回の対話の対話履歴には、対話を行った参加者の音声のテキストが格納され、各テキストは、参加者ＩＤ毎に区別され、時系列に格納される。また、１回の対話の対話履歴を、１つの文書と定義する。

　図１の説明に戻る。制御部１６０は、テキスト生成部１６１、取得部１６２、感覚情報量算出部１６３、出力部１６４を有する。制御部１６０は、ＣＰＵ、ＭＰＵ（Micro　Processing　Unit）等のプロセッサ等である。

　テキスト生成部１６１は、マイク１４０から参加者の音声（電気信号）を取得し、音声をテキストに変換する。テキスト生成部１６１は、変換したテキストと、音声を発話した参加者の参加者ＩＤとを対応付けた情報を、対話履歴バッファ１５１に登録する。テキスト生成部１６１は、どのような周知技術を用いて、音声をテキストに変換してもよい。また、テキスト生成部１６１は、参加者ＩＤと、テキストとを対応付ける際、どのような周知技術を利用してもよい。テキスト生成部１６１は、上記処理を繰り返し実行する。

　取得部１６２は、評価対象のテキストと、動的文脈情報と、静的文脈情報とを取得する処理部である。以下の説明では、評価対象のテキストを「評価対象テキスト」と表記する。たとえば、動的文脈情報は、対話の参加者の特徴および直近の対話の履歴を含む情報である。静的文脈情報は、記憶部１５０（コミュニケーション履歴ＤＢ１５３）に格納された対話の履歴のうち、現在行われている対話の参加者の特徴に対応する対話の履歴を含む情報である。取得部１６２は、取得した評価対象テキスト、動的文脈情報、静的文脈情報を、感覚情報量算出部１６３に出力する。

　取得部１６２は、入力部１２０等から、評価対象テキスト、動的文脈情報、静的文脈情報を直接取得してもよいが、以下の処理を行って、評価対象テキスト、動的文脈情報、静的文脈情報を取得してもよい。

　まず、取得部１６２が、評価対象テキストを取得する処理の一例について説明する。取得部１６２は、入力部１２０から、参加者ＩＤの指摘を受け付ける。以下の説明では、指定された参加者ＩＤを「指定ＩＤ」と表記する。取得部１６２は、対話履歴バッファ１５１に格納されたテキストのうち、指定ＩＤに対応するテキストであって、最新のテキストを評価対象テキストとして取得する。

　続いて、取得部１６２が、動的文脈情報を取得する処理の一例について説明する。たとえば、動的文脈情報には、対話の参加者の特徴および直近の対話の履歴が含まれる。取得部１６２は、直近の対話の履歴を、対話履歴バッファ１５１から取得する。

　取得部１６２は、対話の参加者の特徴を取得する場合、次の処理を実行する。取得部１６２は、入力部１２０から、対話を行う参加者の参加者ＩＤの組を取得する。取得部１６２は、取得した参加者ＩＤの組と、関係性ＤＢ１５２とを比較して、対話中の参加者の関係性を取得する。取得部１６２は、ＧＰＳ（Global　Positioning　System）等を用いて、評価装置１００の現在の位置情報を取得する。取得部１６２は、取得した現在の位置情報と、場所判定テーブル（図示を省略）とを基にして、対話の場所を取得する。たとえば、場所判定テーブルは、位置情報と、場所との関係を定義したテーブルである。なお、取得部１６２は、入力部１２０から、対話の場所を取得してもよい。取得部１６２は、上記の情報の他に、時間や、天気に関する情報を取得してもよい。

　取得部１６２は、上記の処理を実行することで、対話の参加者の特徴を取得する。たとえば、対話の参加者の特徴は、対話を行う参加者の参加者ＩＤの組、対話中の参加者の関係性、対話の場所、時間、天候等である。

　続いて、取得部１６２が、静的文脈情報を取得する処理の一例について説明する。取得部１６２は、動的文脈情報に含まれる対話の参加者の特徴と、コミュニケーション履歴ＤＢ１５３とを比較し、コミュニケーション履歴ＤＢ１５３に含まれる対話履歴のうち、対話の参加者の特徴に対応する対話履歴の集合（静的文脈情報）を取得する。たとえば、取得部１６２は、対話の参加者の特徴となる「参加者ＩＤの組（対話参加者ＩＤ）」、「場所」、「関係性」と一致するレコードの対話履歴を取得する。一つのレコードの対話履歴を、一つの文書とする。

　以上、取得部１６２が、評価対象テキスト、動的文脈情報、静的文脈情報を取得する処理の一例について説明した。

　感覚情報量算出部１６３は、評価対象テキストと、動的文脈情報と、静的文脈情報とを基にして、評価対象テキストによって伝えられる参加者（伝え手）の感覚の量を示す感覚情報量を算出する処理部である。たとえば、感覚情報量算出部１６３は、式（１）を基にして、感覚情報量ｓを算出する。

　感覚情報量ｓ＝ｔｆ×ｉｄｆ・・・（１）

　式（１）において、ｔｆ（Term-frequency）は、ある文書における、評価対象テキストの出現頻度を示す。本実施例１では、ある文書を、対話履歴バッファ１５１に格納された複数のテキストとする。

　式（１）において、ｉｄｆ（Inverse　document　frequency）は、式（２）によって定義される。式（２）において、総文書数は、静的文脈情報に設定された対話履歴の集合に含まれる対話履歴（文書）の数である。評価対象テキストが含まれる文書の数は、対話履歴の集合に含まれる対話履歴のうち、評価対象テキストを含む対話履歴の数である。

　ｉｄｆ＝ｌｏｇ（総文書数／評価対象テキストが含まれる文書の数）・・・（２）

　感覚情報量算出部１６３は、評価対象テキストと、感覚情報量ｓとを出力部１６４に出力する。

　出力部１６４は、評価対象テキストと、感覚情報量ｓとの組を、表示部１３０に出力して表示させる。

（本実施例１にかかる評価装置の処理手順）
　次に、本実施例１にかかる評価装置１００の処理手順の一例について説明する。図３は、本実施例１にかかる評価装置の処理手順を示すフローチャートである。

　図３に示すように、評価装置１００の取得部１６２は、評価対象テキスト、動的文脈情報、静的文脈情報を取得する（ステップＳ１０１）。

　評価装置１００の感覚情報量算出部１６３は、評価対象テキスト、動的文脈情報、静的文脈情報を基にして、感覚情報量を算出する（ステップＳ１０２）。評価装置１００の出力部１６４は、評価対象テキストと感覚情報量とを表示部１３０に出力する（ステップＳ１０３）。

（想定場面＜１＞）
　上司と部下の２人で、部下の仕事上の目標を設定する、という対話の場で、上記の評価装置１００が、上司の質問に対する部下の返答（評価対象テキスト）に対する感覚情報量を算出する場合について説明する。

　たとえば、想定場面＜１＞では、評価対象テキスト、動的文脈情報、静的文脈情報を以下のものとする。
　評価対象テキスト：部下が発信した「大丈夫です。」
　動的文脈情報：対話中の参加者の関係性「上司と部下」、対話の場所「会社」、現在実施中の対話の履歴「対話履歴バッファ１５１の情報」
　静的文脈情報：コミュニケーション履歴ＤＢ１５３に含まれる履歴のうち、会社における上司と部下の対話履歴の集合

　たとえば、会社における上司と部下の対話履歴の集合に含まれる対話履歴の数を「１０」とし、かかる対話履歴の集合において「大丈夫」を含む対話履歴の数を「８」とする。現在実施中の対話の履歴に含まれる「大丈夫」の数を「１」とする。この場合、評価装置１００の感覚情報量算出部１６３は、式（３）のように、感覚情報量ｓを算出する。

　ｓ＝１×ｌｏｇ（１０／８）＝０．０９７・・・（３）

　評価装置１００の出力部１６４は、評価対象テキスト「大丈夫」と、感覚情報量ｓ「０．０９７」とを対応付けた情報を、表示部１３０に出力して表示する。

　上司は、表示部１３０に表示された感覚情報量ｓを参照することで、部下の真意を引き出せている度合いを評価することが可能となる（感覚情報量ｓが高いほど、真意を引き出せている度合いが高い）。評価装置１００は、感覚情報量ｓを高くする質問を上司にサジェストすることができ、上司と部下の相互理解を深めるための介入が可能となる。

（想定場面＜２＞）
　たとえば、モータースポーツにおけるドライバーとエンジニアとが、タイムを良くするためのマシンセッティングを検討する、という対話の場で、上記の評価装置１００が、エンジニアの質問に対するドライバーの返答（評価対象テキスト）に対する感覚情報量を算出する場合について説明する。

　たとえば、想定場面＜２＞では、評価対象テキスト、動的文脈情報、静的文脈情報を以下のものとする。
　評価対象テキスト：ドライバーが発信した「コーナーがちょっと気になる」
　動的文脈情報：対話中の参加者の関係性「ドライバーとエンジニア」、対話の場所「サーキット」、現在実施中の対話の履歴「対話履歴バッファ１５１の情報」
　静的文脈情報：コミュニケーション履歴ＤＢ１５３に含まれる履歴のうち、サーキットにおけるドライバーとエンジニアの対話履歴の集合

　たとえば、サーキットにおけるドライバーとエンジニアの対話履歴の集合に含まれる対話履歴の数を「２０」とする。感覚情報量算出部１６３は、評価対象テキスト「コーナーがちょっと気になる」を形態素解析し、単語「コーナー」、「ちょっと」、「気になる」を抽出する。

　サーキットにおけるドライバーとエンジニアの対話履歴において、「コーナー」を含む対話履歴の数を「１２」とする。サーキットにおけるドライバーとエンジニアの対話履歴において、「ちょっと」を含む対話履歴の数を「２０」とする。サーキットにおけるドライバーとエンジニアの対話履歴において、「気になる」を含む対話履歴の数を「２０」とする。現在実施中の対話の履歴に含まれる「コーナー」の数を「１」とする。現在実施中の対話の履歴に含まれる「ちょっと」の数を「３」とする。現在実施中の対話の履歴に含まれる「気になる」の数を「２」とする。この場合、評価装置１００の感覚情報量算出部１６３は、式（４）のように、感覚情報量ｓを算出する。

　ｓ＝１×ｌｏｇ（２０／１２）＋３×ｌｏｇ（２０／２０）＋２×ｌｏｇ（２０／１２）＝０．２２・・・（４）

　評価装置１００の出力部１６４は、評価対象テキスト「コーナーがちょっと気になる」と、感覚情報量ｓ「０．２２」とを対応付けた情報を、表示部１３０に出力して表示する。

　エンジニアは、表示部１３０に表示された感覚情報量ｓを参照することで、ドライバーが体感したマシンの挙動を細部まで引き出せているかを評価することが可能となる（感覚情報量ｓが高いほど、マシンの挙動を細部まで引き出せている度合いが高い）。評価装置１００は、感覚情報量ｓを高くする質問をエンジニアにサジェストすることができ、レース成績が向上するようなマシンセッティングにつながる感覚を引き出す介入が可能となる。

（本実施例１にかかる評価装置１００の効果）
　次に、本実施例１にかかる評価装置１００の効果について説明する。評価装置１００は、評価対象テキスト、動的文脈情報、静的文脈情報を取得し、評価対象テキスト、動的文脈情報、静的文脈情報を基にして、感覚情報量を算出し、評価対象テキストと感覚情報量とを表示部１３０に出力する。これによって、伝え手の伝えたい感覚が多く伝わっているのかを評価することができる。

　本実施例２にかかる評価装置を「評価装置２００」と表記する。本実施例２では、評価装置２００が、チャットボットの機能を有し、一人の参加者とチャットボットとが対話を行う場面を想定する。評価装置２００は、チャットボットが、参加者が発信したテキストに対して、複数の返答文の候補を持っている場合に、複数の返答文に対して、感覚情報量ｓをそれぞれ算出し、感覚情報量が最大となる返答文を、チャットボットに返答させる。

　なお、チャットボットには、予め、所定の参加者ＩＤが設定される。たとえば、チャットボットに参加者Ａの参加者ＩＤが付与されている場合に、評価装置２００は、チャットボットが生成した返答文を「評価対象テキスト」として評価する場合、チャットボットの返答文に、参加者Ａらしい感覚が多く含まれているか否かによって、感覚情報量ｓを算出する。

（本実施例２にかかる評価装置２００の構成例）
　まず、評価装置２００の構成例について説明する。図４は、本実施例２にかかる評価装置の構成を示す機能ブロック図である。図４に示すように、この評価装置２００は、通信制御部２１０と、入力部２２０と、表示部２３０と、マイク２４０と、記憶部２５０と、制御部２６０とを有する。

　通信制御部２１０、入力部２２０、表示部２３０、マイク２４０に関する説明は、図１で説明した通信制御部１１０、入力部２２０、表示部２３０、マイク２４０に関する説明と同様である。

　記憶部２５０は、対話履歴バッファ２５１と、関係性ＤＢ２５２と、コミュニケーション履歴ＤＢ２５３とを有する。記憶部２５０は、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。

　対話履歴バッファ２５１は、一人の参加者の音声のテキストと、チャットボットが生成したテキストとを格納する。たとえば、参加者の音声のテキストには、参加者の参加者ＩＤが設定される。チャットボットが生成したテキストには、チャットボットに予め割り当てられた参加者ＩＤが設定される。

　関係性ＤＢ２５２は、対話中の参加者の関係性を定義した情報を保持する。関係性ＤＢ２５２に関する説明は、図１で説明した関係性ＤＢ１５２に関する説明と同様である。

　コミュニケーション履歴ＤＢ２５３は、過去の対話の履歴の情報を保持する。コミュニケーション履歴ＤＢ２５３に関する説明は、図１、図２等で説明したコミュニケーション履歴ＤＢ１５３に関する説明と同様である。

　制御部２６０は、テキスト生成部２６１、チャットボット処理部２６２、取得部２６３、感覚情報量算出部２６４、出力部２６５を有する。制御部２６０は、ＣＰＵ、ＭＰＵ等のプロセッサ等である。

　テキスト生成部２６１は、マイク２４０から参加者（１人の参加者）の音声（電気信号）を取得し、音声をテキストに変換する。テキスト生成部２６１は、変換したテキストを、チャットボット処理部２６２に出力する。また、テキスト生成部２６１は、変換したテキストと、音声を発話した参加者の参加者ＩＤとを対応付けた情報を、対話履歴バッファ２５１に登録する。なお、対話の参加者の参加者ＩＤは、入力部２２０を介して、参加者に指定される。テキスト生成部２６１は、上記処理を繰り返し実行する。

　チャットボット処理部２６２は、テキスト生成部２６１からテキストの入力を取得し、テキストに対応する返答文を生成する処理部である。たとえば、チャットボット処理部２６２は、過去の会話履歴等を用いて機械学習されたＮＮ（Neural　Network）等の機械学習モデルを利用して、返答文を生成する。

　チャットボット処理部２６２は、生成した返答文（テキスト）と、予め設定された参加者ＩＤとを対応付けた情報を、対話履歴バッファ２５１に登録する。また、チャットボット処理部２６２は、生成した返答文を、出力部２６５に出力する。

　ところで、チャットボット処理部２６２は、生成した返答文が複数存在する場合、複数の返答文を、対話履歴バッファ２５１に格納する。たとえば、チャットボット処理部２６２は、テキストを機械学習モデルに入力し、機械学習モデルから出力された返答文のうち、複数の返答文の尤度が閾値以上である場合に、尤度が閾値以上となる複数の返答文を、対話履歴バッファ２５１に格納する。以下の説明では、機械学習モデルを用いて、一つのテキストから生成された尤度が閾値以上となる複数の返答文を、「返答文候補群」と表記する。

　対話履歴バッファ２５１に格納された返答文候補群に対して、後述する取得部２６３、感覚情報量算出部２６４による処理が実行され、チャットボット処理部２６２は、返答文候補群に含まれる各返答文に関する感覚情報量を、感覚情報量算出部２６４から取得する。チャットボット処理部２６２は、返答文候補群から、感覚情報量が最大となる返答文を、出力部２６５に出力する。

　チャットボット処理部２６２は、上記処理を繰り返し実行する。なお、チャットボット処理部２６２は、いかなる周知技術を用いて、テキストの返答文を生成してもよい。

　取得部２６３および感覚情報量算出部２６４は、対話履歴バッファ２５１に返答文候補群が登録された場合に、返答文候補群に含まれる各返答文（テキスト）について、以下の処理を実行する。なお、以下では、一つの返答文から、感覚情報量を算出する場合の処理について説明するが、返答文候補群に含まれる他の返答文についても、同様の処理を行い、返答文候補群に含まれる各返答文の感覚情報量が算出され、チャットボット処理部２６２に通知される。

　取得部２６３は、評価対象テキストと、動的文脈情報と、静的文脈情報とを取得する。以下において、評価対象テキストを取得する処理、動的文脈情報を取得する処理、静的文脈情報を取得する処理について説明する。

　まず、取得部２６３が、評価対象テキストを取得する処理の一例について説明する。取得部２６３は、対話履歴バッファ２５１に格納された返答文候補群のうち、感覚情報量を算出していない返答文を、評価対象テキストとして取得する。

　続いて、取得部２６３が、動的文脈情報を取得する処理の一例について説明する。たとえば、動的文脈情報には、対話の参加者の特徴および直近の対話の履歴が含まれる。取得部２６３は、直近の対話の履歴を、対話履歴バッファ２５１から取得する。

　取得部２６３は、対話の参加者の特徴を取得する場合、次の処理を実行する。取得部２６３は、入力部２２０から、１人の参加者の参加者ＩＤを取得し、チャットボット処理部２６２に設定された参加者ＩＤを取得することで、対話の行う参加者の参加者ＩＤの組を取得する。取得部２６３は、取得した参加者ＩＤの組と、関係性ＤＢ２５２とを比較して、対話中の参加者の関係性を取得する。取得部２６３は、ＧＰＳ等を用いて、評価装置２００の現在の位置情報を取得する。取得部２６３は、取得した現在の位置情報と、場所判定テーブル（図示を省略）とを基にして、対話の場所を取得する。取得部２６３は、上記の情報の他に、時間や、天気に関する情報を取得してもよい。

　取得部２６３は、上記の処理を実行することで、対話の参加者の特徴を取得する。たとえば、対話の参加者の特徴は、対話を行う参加者の参加者ＩＤの組、対話中の参加者の関係性、対話の場所、時間、天候等である。

　続いて、取得部２６３が、静的文脈情報を取得する処理の一例について説明する。取得部２６３は、動的文脈情報に含まれる対話の参加者の特徴と、コミュニケーション履歴ＤＢ２５３とを比較し、コミュニケーション履歴ＤＢ２５３に含まれる対話履歴のうち、対話の参加者の特徴に対応する対話履歴の集合（静的文脈情報）を取得する。たとえば、取得部２６３は、対話の参加者の特徴となる「参加者ＩＤの組（対話参加者ＩＤ）」、「場所」、「関係性」と一致するレコードの対話履歴を取得する。一つのレコードの対話履歴を、一つの文書とする。

　以上、取得部２６３が、評価対象テキスト、動的文脈情報、静的文脈情報を取得する処理の一例について説明した。取得部２６３は、取得した評価対象テキスト、動的文脈情報、静的文脈情報を、感覚情報量算出部２６４に出力する。

　感覚情報量算出部２６４は、評価対象テキストと、動的文脈情報と、静的文脈情報とを基にして、評価対象テキストによって伝えられる参加者（チャットボット処理部２６２に設定された参加者ＩＤに対応する参加者）の感覚の量を示す感覚情報量を算出する処理部である。

　感覚情報量算出部２６４が、評価対象テキストと、動的文脈情報と、静的文脈情報とを基にして、評価対象テキストの感覚情報量ｓを算出する処理は、本実施例１で説明した、感覚情報量算出部１６３が、感覚情報量ｓを算出する処理と同様である。

　感覚情報量算出部２６４は、評価対象テキストの感覚情報量ｓを、チャットボット処理部２６２に通知する。

　出力部２６５は、チャットボット処理部２６２から取得した、返答文を表示部２３０に出力して表示させる。

（本実施例２にかかる評価装置２００の処理手順）
　次に、本実施例２にかかる評価装置２００の処理手順の一例について説明する。図５は、本実施例２にかかる評価装置の処理手順を示すフローチャートである。

　評価装置２００は、参加者の参加者ＩＤを受け付ける（ステップＳ２０１）。評価装置２００はマイク２４０を用いて、参加者の音声を取得する（ステップＳ２０２）。評価装置２００のテキスト生成部２６１は、参加者の音声を基にしてテキストを生成する（ステップＳ２０３）。

　チャットボット処理部２６２は、テキストを基にして、返答文を生成する（ステップＳ２０４）。評価装置２００は、複数の返答文が生成されていない場合には（ステップＳ２０５，Ｎｏ）、評価装置２００の出力部２６５が、返答文を出力し（ステップＳ２０６）、ステップＳ２１１に移行する。一方、評価装置２００は、複数の返答文が生成された場合には（ステップＳ２０５，Ｙｅｓ）、ステップＳ２０７に移行する。

　評価装置２００は、返答文候補群を対話履歴バッファ２５１に格納する（ステップＳ２０７）。評価装置２００は、感覚情報量算出処理を実行する（ステップＳ２０８）。チャットボット処理部２６２は、感覚情報量が最大となる返答文を選択する（ステップＳ２０９）。評価装置２００の出力部２６５は、選択された返答文を表示部２３０に出力する（ステップＳ２１０）。

　評価装置２００は、処理を継続する場合には（ステップＳ２１１，Ｙｅｓ）、ステップＳ２０２に移行する。一方、評価装置２００は、処理を継続しない場合には（ステップＳ２１１，Ｎｏ）、処理を終了する。

　次に、図５のステップＳ２０８に示した感覚情報量算出処理の処理手順の一例について説明する。図６は、感覚情報量算出処理の処理手順を示すフローチャートである。

　評価装置２００の取得部２６３は、返答文候補群から、未選択の返答文を選択する（ステップＳ３０１）。取得部２６３は、評価対象テキスト、動的文脈情報、静的文脈情報を生成する（ステップＳ３０２）。

　評価装置２００の感覚情報量算出部２６４は、評価対象テキスト、動的文脈情報、静的文脈情報を基にして、返答文の感覚情報量を算出する（ステップＳ３０３）。

　評価装置２００は、未選択の返答文が存在する場合には（ステップＳ３０４，Ｙｅｓ）、ステップＳ３０１に移行する。一方、評価装置２００は、未選択の返答文が存在しない場合には（ステップＳ３０４，Ｎｏ）、感覚情報量算出処理を終了する。

（想定場面＜３＞）
　チャットボット（チャットボット処理部２６２）に、ある特定の参加者（たとえば、参加者Ａ）らしい感覚を備えた受け答えをさせたい、という場面を想定する。上記の評価装置２００は、チャットボットが、対話の相手となる参加者Ｂの発話に対して、機械学習モデル（言語作成モデル）を用いて、複数の返答文の候補を持っているとき、各返答文に対して、感覚情報量ｓを算出し、感覚情報量ｓが最大となる返答文を出力する。

　たとえば、想定場面＜３＞では、評価対象テキスト、動的文脈情報、静的文脈情報を以下のものとする。
　評価対象テキスト：返答候補群「かわいい」、「きれい」
　動的文脈情報：対話の参加者「チャットボット（参加者Ａ）と参加者Ｂ」、対話の場所「町」、現在実施中の対話の履歴「対話履歴バッファ２５１の情報」
　静的文脈情報：コミュニケーション履歴ＤＢ２５３に含まれる履歴のうち、町における参加者Ａおよび参加者Ｂの対話履歴の集合

　たとえば、現在実施中の対話の履歴に含まれる「かわいい」の数を「５」とし、「きれい」の数を「２」とする。町における参加者Ａおよび参加者Ｂの対話履歴の集合に含まれる対話履歴の数を「１０」とし、かかる対話履歴の集合において「かわいい」を含む対話履歴の数を「１０」とし、「きれい」を含む対話履歴の数を「５」とする。

　この場合、評価装置２００の感覚情報量算出部１６３は、式（５）のように、「かわいい」の感覚情報量ｓを算出し、式（６）のように、「きれい」の感覚情報量ｓを算出する。

　ｓ（かわいい）＝５×ｌｏｇ（１０／１０）＝０・・・（５）
　ｓ（きれい）＝２×ｌｏｇ（１０／５）＝０．６・・・（６）

　評価装置２００は、かわいいの感覚情報量ｓよりも、きれいの感覚情報量ｓの方が大きいため、「きれい」という返答文（単語）のほうが参加者Ａの感覚をより正確に反映している返答文とみなし、返答文「きれい」を出力する。これにより、チャットボットを用いて本人不在の場で受け答えする場であっても、その本人に近い感覚を含む発話を自動生成することが可能となる。

（本実施例２にかかる評価装置２００の効果）
　次に、本実施例２にかかる評価装置２００の効果について説明する。評価装置２００は、チャットボット処理部２６２によって複数の返答文が生成された場合に、各返答文に対する感覚情報量を算出し、感覚情報量が最大となる返答文を出力する。これによって、チャットボット処理部２６２に、ある特定の参加者（たとえば、参加者Ａ）らしい感覚を備えた受け答えをさせたい場合に、ある特定の参加者が伝達したいであろう感覚をより多く含む返答文（テキスト）を選択することができ、コミュニケーションにおける相互理解・パフォーマンスの向上が可能となる。

　本実施例３にかかる評価装置を「評価装置３００」と表記する。本実施例３では、評価装置３００は、訓練済みの感覚情報量算出モデルを用いて、評価対象テキストの感覚情報量を算出する。

　本実施例３では、評価装置３００は、対話中の参加者の近くに配置される。対話の参加者を、参加者Ａおよび参加者Ｂの２名として説明を行う。

（本実施例３にかかる評価装置の構成例）
　まず、評価装置１００の構成例について説明する。図７は、本実施例３にかかる評価装置の構成を示す機能ブロック図である。図７に示すように、この評価装置３００は、通信制御部３１０と、入力部３２０と、表示部３３０と、マイク３４０と、記憶部３５０と、制御部３６０とを有する。

　通信制御部３１０、入力部３２０、表示部３３０、マイク３４０に関する説明は、図１で説明した通信制御部１１０、入力部１２０、表示部１３０、マイク１４０に関する説明と同様である。

　記憶部３５０は、対話履歴バッファ３５１と、関係性ＤＢ３５２と、コミュニケーション履歴ＤＢ３５３と、個人特性ＤＢ３５４と、感覚情報量算出モデル３５５とを有する。記憶部３５０は、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。

　対話履歴バッファ３５１は、現在対話を行っている参加者Ａおよび参加者Ｂの音声のテキストを格納する。たとえば、テキストは、参加者ＩＤ毎に区別され、時系列に格納される。

　関係性ＤＢ３５２は、対話中の参加者の関係性を定義した情報を保持する。関係性ＤＢ３５２に関する説明は、図１で説明した関係性ＤＢ１５２に関する説明と同様である。

　コミュニケーション履歴ＤＢ３５３は、過去の対話の履歴の情報を保持する。コミュニケーション履歴ＤＢ３５３に関する説明は、図１、図２等で説明したコミュニケーション履歴ＤＢ１５３に関する説明と同様である。

　個人特性ＤＢ３５４は、参加者に関する各種の情報を保持する。図８は、個人特性ＤＢのデータ構造の一例を示す図である。図８に示すように、個人特性ＤＢ３５４は、参加者ＩＤ、性別、年齢、環境を有する。参加者ＩＤは、参加者を識別する情報である。性別は、参加者の性別である。年齢は、参加者の年齢である。環境は、参加者が過去に対話を行った場所等が設定される。

　感覚情報量算出モデル３５５は、入力を「評価対象テキスト、動的文脈情報、静的文脈情報」とし、出力を「感覚情報量」とするモデルであり、ＮＮ等である。なお、本実施例３の動的文脈情報には、実施例１で説明した情報の他に、参加者の性別、年齢、環境が更に含まれるものとする。感覚情報量算出モデル３５５は、学習データセットを用いて、誤差逆伝播法等によって、事前に訓練されているものとする。

　制御部３６０は、テキスト生成部３６１、取得部３６２、感覚情報量算出部３６３、出力部３６４を有する。制御部３６０は、ＣＰＵ、ＭＰＵ等のプロセッサ等である。

　テキスト生成部３６１は、マイク３４０から参加者の音声（電気信号）を取得し、音声をテキストに変換する。テキスト生成部３６１は、変換したテキストと、音声を発話した参加者の参加者ＩＤとを対応付けた情報を、対話履歴バッファ３５１に登録する。その他のテキスト生成部３６１に関する説明は、実施例１のテキスト生成部１６１の説明と同様である。

　取得部３６２は、評価対象テキストと、動的文脈情報と、静的文脈情報とを取得する処理部である。取得部３６２は、取得した評価対象テキスト、動的文脈情報、静的文脈情報を、感覚情報量算出部３６３に出力する。

　取得部３６２が、評価対象テキストを取得する処理、および、静的文脈情報を取得する処理の説明は、実施例１の取得部１６２の説明と同様である。

　取得部３６２が、動的文脈情報を取得する処理の一例について説明する。たとえば、動的文脈情報には、対話の参加者の特徴および直近の対話の履歴が含まれる。取得部３６２は、直近の対話の履歴を、対話履歴バッファ３５１から取得する。

　対話の参加者の特徴には、実施例１で説明した、対話を行う参加者の参加者ＩＤの組、対話中の参加者の関係性、対話の場所、時間、天候等の他に、上記の参加者の性別、年齢、環境が更に含まれる。取得部３６２が、対話を行う参加者の参加者ＩＤの組、対話中の参加者の関係性、対話の場所、時間、天候等を取得する処理は、実施例１の取得部１６２と同様である。

　取得部３６２が、参加者の性別、年齢、環境を取得する処理の一例について説明する。取得部３６２は、入力部３２０から入力される参加者ＩＤのうち、評価対象テキストを発信した参加者の参加者ＩＤを取得する。取得部３６２は、取得した参加者ＩＤと、個人特性ＤＢ３５４とを比較して、取得した参加者ＩＤに対応する性別、年齢、環境を、個人特性ＤＢ３５４から取得する。

　なお、取得部３６２は、取得した参加者ＩＤに対応するレコードが、個人特性ＤＢ３５４に存在しない場合には、統計的な手法によって、個人特性ＤＢ３５４から、性別、年齢、環境を推定して取得する。たとえば、取得部３６２は、個人特性ＤＢ３５４の性別に登録された男性、女性の多数決を行い、多い方を参加の性別として推定する。取得部３６２は、個人特性ＤＢ３５４の性別に登録された年齢の平均値を、参加者の年齢として推定する。取得部３６２は、個人特性ＤＢ３５４の性別に登録された環境の多数決を行い、最も多い環境、参加者の環境として推定する。

　感覚情報量算出部３６３は、評価対象テキストと、動的文脈情報と、静的文脈情報とを、訓練済みの感覚情報量算出モデル３５５に入力することで、評価対象テキストの感覚情報量ｓを算出する。感覚情報量算出部３６３は、評価対象テキストと、感覚情報量ｓとを出力部３６４に出力する。

　出力部３６４は、評価対象テキストと、感覚情報量ｓとの組を、表示部３３０に出力して表示させる。

（本実施例３にかかる評価装置の処理手順）
　次に、本実施例３にかかる評価装置３００の処理手順の一例について説明する。図９は、本実施例３にかかる評価装置の処理手順を示すフローチャートである。

　図９に示すように、評価装置３００の取得部３６２は、入力部３２０から参加者の参加者ＩＤを受け付ける（ステップＳ４０１）。評価装置３００はマイク３４０を利用して、参加者の音声を取得する（ステップＳ４０２）。

　評価装置３００のテキスト生成部３６１は、参加者の音声を基にしてテキストを生成する（ステップＳ４０３）。取得部３６２は、参加者ＩＤと個人特性ＤＢ３５４とを基にして、参加者の性別、年齢、環境を取得する（ステップＳ４０４）。

　取得部３６２は、評価対象テキストと、動的文脈情報と、静的文脈情報とを取得する（ステップＳ４０４）。評価装置３００の感覚情報量算出部３６３は、評価対象テキストと、動的文脈情報と、静的文脈情報とを感覚情報量算出モデル３５５に入力して、感覚情報量を算出する（ステップＳ４０５）。

　評価装置３００の出力部３６４は、評価対象テキストと感覚情報量とを表示部３３０に出力して表示させる（ステップＳ４０６）。

　評価装置３００は、処理を継続する場合には（ステップＳ４０７，Ｙｅｓ）、ステップＳ４０２に移行する。一方、評価装置３００は、処理を継続しない場合には（ステップＳ４０７，Ｎｏ）、処理を終了する。

（本実施例３にかかる評価装置３００の効果）
　次に、本実施例３にかかる評価装置３００の効果について説明する。評価装置３００は、評価対象テキスト、動的文脈情報、静的文脈情報を取得し、評価対象テキスト、動的文脈情報、静的文脈情報を感覚情報量算出モデル３５５に入力することで、感覚情報量を算出し、評価対象テキストと感覚情報量とを表示部３３０に出力する。これによって、伝え手の伝えたい感覚が多く伝わっているのかを評価することができる。

（その他の構成例）
　上述した実施例では、マイクを有する評価装置１００（２００，３００）が、参加者の音声をテキストに変換し、テキストの評価を行っていたが、これに限定されるものではない。たとえば、ネットワーク上に、評価装置１００に相当するサーバを配置し、参加者が利用する端末装置が、評価装置１００にアクセスするような構成であってもよい。この場合、参加者の端末装置は、入力部を介して入力されるテキストを、評価装置１００に送信し、評価装置１００は、受信したテキストの評価を行う。

（評価プログラム）
　続いて、評価プログラムを実行するコンピュータの一例について説明する。図１０は、評価プログラムを実行するコンピュータの一例を示す図である。コンピュータ１０００は、たとえば、メモリ１０１０と、ＣＰＵ１０２０と、ハードディスクドライブインタフェース１０３０と、ディスクドライブインタフェース１０４０と、シリアルポートインタフェース１０５０と、ビデオアダプタ１０６０と、ネットワークインタフェース１０７０とを有する。これらの各部は、バス１０８０によって接続される。

　メモリ１０１０は、ＲＯＭ（Read　Only　Memory）１０１１およびＲＡＭ１０１２を含む。ＲＯＭ１０１１は、たとえば、ＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０３１に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１０４１に接続される。ディスクドライブ１０４１には、たとえば、磁気ディスクや光ディスク等の着脱可能な記憶媒体が挿入される。シリアルポートインタフェース１０５０には、たとえば、マウス１０５１およびキーボード１０５２が接続される。ビデオアダプタ１０６０には、たとえば、ディスプレイ１０６１が接続される。

　ここで、ハードディスクドライブ１０３１は、たとえば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３およびプログラムデータ１０９４を記憶する。上記実施形態で説明した各情報は、たとえばハードディスクドライブ１０３１やメモリ１０１０に記憶される。

　また、評価プログラムは、たとえば、コンピュータ１０００によって実行される指令が記述されたプログラムモジュール１０９３として、ハードディスクドライブ１０３１に記憶される。具体的には、上記実施例で説明したテキスト生成部１６１、取得部１６２、感覚情報量算出部１６３、出力部１６４を実行する各処理が記述されたプログラムモジュール１０９３が、ハードディスクドライブ１０３１に記憶される。

　また、評価プログラムによる情報処理に用いられるデータは、プログラムデータ１０９４として、たとえば、ハードディスクドライブ１０３１に記憶される。そして、ＣＰＵ１０２０が、ハードディスクドライブ１０３１に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して、上述した各手順を実行する。

　なお、評価プログラムにかかるプログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０３１に記憶される場合に限られず、たとえば、着脱可能な記憶媒体に記憶されて、ディスクドライブ１０４１等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、評価プログラムにかかるプログラムモジュール１０９３やプログラムデータ１０９４は、ＬＡＮやＷＡＮ（Wide　Area　Network）等のネットワークを介して接続された他のコンピュータに記憶され、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

　以上、本発明者によってなされた発明を適用した実施形態について説明したが、本実施例による本発明の開示の一部をなす記述および図面により本発明は限定されることはない。すなわち、本実施形態に基づいて当業者等によりなされる他の実施形態、実施例および運用技術等は全て本発明の範疇に含まれる。

　１００，２００，３００　　評価装置
　１１０，２１０，３１０　　通信制御部
　１２０，２２０，３２０　　入力部
　１３０，２３０，３３０　　表示部
　１４０，２４０，３４０　　マイク
　１５０，２５０，３５０　　記憶部
　１５１，２５１，３５１　　対話履歴バッファ
　１５２，２５２，３５２　　関係性ＤＢ
　１５３，２５３，３５３　　コミュニケーション履歴ＤＢ
　１６０，２６０，３６０　　制御部
　１６１，２６１，３６１　　テキスト生成部
　１６２，２６３，３６２　　取得部
　１６３，２６４，３６３　　感覚情報量算出部
　１６４，２６５，３６４　　出力部
　２６２　　チャットボット処理部
　３５４　　個人特性ＤＢ
　３５５　　感覚情報量算出モデル

Claims

　対話の参加者が発信したテキストと、対話の参加者の特徴および直近の対話の履歴を含む動的文脈情報と、記憶部に格納された対話の履歴のうち、前記対話の参加者の特徴に対応する対話の履歴を含む静的文脈情報とを取得する取得部と、
　前記テキストと、前記動的文脈情報と、前記静的文脈情報とを基にして、前記テキストによって伝えられる前記参加者の感覚の量を示す感覚情報量を算出する感覚情報量算出部と、
　前記テキストと、前記感覚情報量とを出力する出力部と、
　を有することを特徴とする評価装置。
　前記感覚情報量算出部は、前記動的文脈情報の対話の履歴における前記テキストの出現頻度と、前記静的文脈情報の対話の履歴における前記テキストの出現頻度とに基づく言語特徴量を、前記感覚情報量として算出することを特徴とする請求項１に記載の評価装置。
　前記テキストの返答となるテキストを生成するチャットボット処理部を更に有し、
　前記感覚情報量算出部は、前記チャットボット処理によって、複数のテキストが生成された場合に、前記複数のテキストに対して、前記感覚情報量をそれぞれ算出し、前記出力部は、前記複数のテキストの感覚情報量を基にして、複数のテキストからいずれかのテキストを出力する処理を更に実行することを特徴とする請求項１または２に記載の評価装置。
　対話の参加者が発信したテキストと、対話の参加者の特徴および直近の対話の履歴を含む動的文脈情報と、記憶部に格納された対話の履歴のうち、前記対話の参加者の特徴に対応する対話の履歴を含む静的文脈情報とを取得する工程と、
　前記テキストと、前記動的文脈情報と、前記静的文脈情報とを基にして、前記テキストによって伝えられる前記参加者の感覚の量を示す感覚情報量を算出する工程と、
　前記テキストと、前記感覚情報量とを出力する工程と、
　を含んだことを特徴とする評価方法。