JP7387521B2

JP7387521B2 - 論述構造推定方法、論述構造推定装置、および論述構造推定プログラム

Info

Publication number: JP7387521B2
Application number: JP2020063359A
Authority: JP
Inventors: 学森尾; 太亮尾崎; 祐太是枝; 皓文森下
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2020-03-31
Filing date: 2020-03-31
Publication date: 2023-11-28
Anticipated expiration: 2040-03-31
Also published as: JP2021163134A

Description

本発明は、テキストの論述構造推定技術に関する。

テキストに含まれる論述を介して相手に議論を試みたりすることがある。例えば、議論を行うためのオンライン掲示板において、オンライン掲示板の利用者が投稿を通して他の利用者に議論を試みる際には、主張やその主張の理由を論述的な文として組み立てる。それらの文には、事実や経験談等といった文の論述的な種類や、他の文に対する根拠づけといった論述構造が含まれている。

このようなテキストにおける論述構造を推定することは、論述の執筆支援や自動要約、ソーシャルネットワーキングサービス（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ：ＳＮＳ）の解析といった応用が見込まれる。そこで近年、テキストに含まれる論述構造を推定することを目的とした論述構造推定システムの研究が進んでいる。

このような論述構造推定システムには、機械学習手法、特に深層学習による論述構造推定の手法が用いられている。深層学習を用いた論述構造推定システムは、入力されたテキストを解析し、文の論述的役割（文種類）を分類し、文と文の間に存在する論述関係を推定する。深層学習を用いた論述構造推定システムは、また、テキストの各文に対応する文ベクトルを計算によって取得し、取得した文ベクトルを用いて文種類の推定を実施し、文ベクトルと他の文ベクトルとの演算を用いて、支持、攻撃、理由、および根拠といった文間の論述関係の推定を実施する。この時、論述構造推定システムは、文がノード、文の種類がノードのラベル、論述関係がエッジで構成される論述構造を利用者に提示する。

非特許文献１の論述構造推定装置は、単語列で構成される文の列を入力とし、各文を文ベクトルに変換する機能と、文ベクトルの並びを考慮する文ベクトル列エンコード機能と、文ベクトル列エンコード機能によって更新された各文ベクトルを用いて文種類（文種類なし、主要主張、主張、および前提、の４種類）を推定し、かつ文と文の論述的な関係（論述関係あり、および論述関係なし、の２種類）を推定する論述構造出力部を持ち、論述構造を貪欲に探索し、推定された論述構造を利用者に提示する。

Peter Potash, Alexey Romanov, Anna Rumshisky. ‘Here’s My Point:Joint Pointer Architecture for Argument Mining’, In Proceedingsof the 2017 Conference on Empirical Methods in Natural Language Processing, Sep2017, pages 1364-1373; [online], [2019年12月20日検索], インターネット＜URL： https://www.aclweb.org/anthology/D17-1143/＞ Joonsuk Park, Claire Cardie. ‘A Corpus of eRulemaking User Commentsfor Measuring Evaluability of Arguments’, In Proceedings of the EleventhInternational Conference on Language Resources and Evaluation, May 2018, pages1623-1628; [online], [2019年12月20日検索], インターネット＜URL：https://www.aclweb.org/anthology/L18-1257/＞ Andrea Galassi, Marco Lippi, Paolo Torroni. ‘Argumentative LinkPrediction using Residual Networks and Multi-Objective Learning’, InProceedings of the 5th Workshop on Argument Mining, Nov 2018, pages 1-10;[online], [2019年12月20日検索], インターネット＜URL：https://www.aclweb.org/anthology/W18-5201/＞

しかしながら、上述した従来の論述構造解析装置が出力する論述構造は、主張の文がルートノード、前提の文がその他のノードで構成される木構造を仮定しているので、論述構造が木構造でない場合に対応できない。一方、実際の論述構造の形は、さまざまである。例えば、新聞記事のように専門家によって記述された論述は、一つの主張とその前提で構成される論述構造を成すことができ、結果として木構造に帰着できる場合もあるが、オンライン掲示板のように必ずしも専門家が記述しない論述においては、論述構造はより複雑かつ恣意的である。より具体的には、１つの文が他の複数の文を支持する論述関係は、木構造を明らかに満たさない。すなわち、あらゆるテキストに木構造を仮定した論述構造が適切とは限らない。

実際に、非特許文献２は木構造を満たさない論述構造について言及しており、木構造を満たさない論述構造のデータを示している。したがって、非特許文献１の論述構造解析装置は、解析対象のテキストに含まれる論述が非特許文献２のように木構造を満たさない場合には、論述構造を正しく推定することができない。

一方、非特許文献３では、同一の文ベクトル列エンコード機能から得た文ベクトルを用いて、文ベクトルの全てのペアの組合せを比較することで、木構造を満たさない論述構造を解析する機能について言及している。しかしながら、非特許文献３の演算ではテキスト全体の文脈を考慮していないため、高精度な解析は困難である。

さらに、木構造を満たす論述構造と異なり、非木構造（多重辺を含まない有向グラフ）は、ノードから派生するエッジが可変個であるから、文種類の出力と論述関係の出力に相関が生まれにくい。非特許文献３では、文種類を出力するための文ベクトル表現と、論述関係を出力するための文ベクトル表現が区別されずに内在することになるから、文種類の推定性能の向上が、論述関係の推定性能の低下を招くというトレードオフの関係となる。そのため、文の種類と論述関係双方の性能を保ったまま論述構造の推定を行うことは困難である。

本発明は、上記を考慮してなされたものであって、テキスト内の文の論述構造をより適切に推定することを一つの目的とする。

上記課題を解決するために、本発明において、一態様として、テキストの論述構造を推定する論述構造推定方法では、コンピュータが、前記テキストに含まれる各文について、各文を構成する構成単位の順序を考慮したベクトル列の集約処理を行って、各文に対応する文ベクトル列を取得し、前記文ベクトル列に対して双線形注意モデルを用いて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する各処理を含むようにした。

本発明によれば、テキスト内の文の論述構造をより適切に推定できる。

実施例１における論述構造推定装置の機能ブロック図の一例である。論述関係種類テーブルの一例を示す図である。実施例１における論述構造推定装置の処理を示すフローチャートである。入力テキストおよび表の一例を示す図である。実施例１における論述構造出力部の出力を制御する論述構造出力制御画面の一例を示す図である。実施例２における論述構造推定装置の機能ブロック図の一例である。実施例２における論述構造推定装置の処理を示すフローチャートである。実施例３における論述構造推定装置の機能ブロック図の一例である。文種類テーブルの一例を示す説明図である。実施例３における論述構造推定装置の処理を示すフローチャートである。パラメータ入力画面の一例を示す図である。実施例３における論述構造出力部の出力を制御する論述構造出力制御画面の一例を示す図である。実施例３の論述構造出力画面の一例を示す図である。論述構造推定装置を実現するコンピュータのハードウェア構成例である。

本発明の実施例を、図面を使って詳細に説明する。以下において、同一または類似の要素および処理に同一の符号を付して差分を説明し、重複説明を省略する。また、後出の実施例では、既出の実施例との差分を説明し、重複説明を省略する。

また、以下の説明および各図で示す構成および処理は、本発明の理解および実施に必要な程度で実施形態の概要を例示するものであり、本発明に係る実施の態様を限定することを意図する趣旨ではない。また、各実施例および各変形例は、本発明の趣旨を逸脱せず、整合する範囲内で、一部または全部を組合せることができる。

また、以下の説明において、情報をテーブルやリストで説明することがあるが、情報はテーブルやリストに限らず、ドキュメントなどのその他の形式であってもよい。また、各種情報やパラメータは、揮発性または不揮発性の記憶装置に記憶される。

以下の説明において、論述構造推定装置は、単語列で構成される文の列から成るテキストを入力として、テキストを解析して、テキストに含まれる論述構造を利用者に提示する。論述構造推定装置は、単語、句、フレーズ、完全文、文章など様々な単位で構成される文の列から成るテキストを解析対象とできる。また、テキストは英語を前提として説明をするが、他の言語であってもよい。この場合、論述構造推定装置は、その言語に応じた形態素解析を実行する。また、論述構造推定装置は、新聞記事、エッセイ、論文、報告書など様々な種別のテキストに適用できる。さらに、テキストの間に図表や写真などが挿入されていてもよい。

＜実施例１の論述構造推定装置１００の構成＞
図１は、実施例１における論述構造推定装置１００の機能ブロック図の一例である。本実施例１の論述構造推定装置１００は、入力部１０１、パラメータ入力部１０２、単語ベクトル抽出部１０３、文ベクトル更新部１０４、論述関係双線形注意部１０５、双線形パラメータ１０５－１、論述構造出力部１０６、および論述関係種類テーブル１０６－１を含む。

入力部１０１は、単語列で構成される文の列から成り立つテキスト、および単語に付属する品詞などの情報を入力として受け付ける。なお、文は、単語に限らず、どのような構成単位の列で構成されていてもよい。その場合、完全文、フレーズ、および語句などで構成される様々な文が考えられる。

入力部１０１は、少なくとも１以上の単語を含む単語列で構成される文の列を入力テキスト５０１（図４参照）として受け付け、入力テキスト５０１から生成した表５０２（図４参照）を単語ベクトル抽出部１０３へ出力する。

パラメータ入力部１０２は、双線形パラメータ１０５－１を入力として受け付ける。

単語ベクトル抽出部１０３は、入力部１０１から受け付けた入力情報に基づいて、単語および単語に付属する情報に対する１または複数の特徴量を抽出し、各単語に対して、特徴量を結合して得られる特徴量を割り当てる。

なお、本実施例では各単語に割り当てられる特徴量はＮ次元ベクトルとして説明するが、特徴量はどのような型であってもよい。その場合、特徴量の型は、実数、整数、多次元ユークリッド空間の元、およびテンソルなどといった場合が考えられる。

また、１つの単語に対する特徴量が複数存在する場合は、複数の特徴量を１つに結合する方法として、加算、乗算、ベクトル結合、テンソル積などといった演算が考えられる。

単語ベクトル抽出部１０３は、各単語ベクトルがＮ次元ベクトルで構成される単語ベクトル列を、文ベクトル更新部１０４へ出力する。

文ベクトル更新部１０４は、単語ベクトル抽出部１０３から受け付けた単語ベクトル列の集約処理によって、各文に対応する文ベクトルへと変換し、論述の時系列に沿って文脈を考慮した再帰的な処理によって、新たな文ベクトル列を計算する。

なお、単語ベクトル列の集約処理は、単語ベクトル列に対する、ベクトルの和、ベクトルの積、およびベクトルの結合などといった演算を用いた、単一の文ベクトルへの変換演算が考えられる。文ベクトル更新部１０４は、文ベクトル列を、論述関係双線形注意部１０５へ出力する。

論述関係双線形注意部１０５は、文ベクトル更新部１０４から受け付けた文ベクトル列および双線形パラメータ１０５－１に基づいて、双線形演算の適用を実施し、入力テキスト５０１内の文と文の間の論述関係を推定する。論述関係双線形注意部１０５は、推定した論述関係を、論述構造出力部１０６へ出力する。

論述構造出力部１０６は、論述関係双線形注意部１０５から受け付けた論述関係をもとに、論述構造の構築および論述構造の正しさをチェックし、適切な論述構造を出力する。論述構造出力部１０６は、適切な論述構造を出力する際、例えば、論述関係双線形注意部１０５が出力する論述関係の生成確率を用いて、確率が一定の閾値を超える論述関係を採用することが考えられる。

また、論述構造出力部１０６は、論述関係種類テーブル１０６－１を照会し、当該の文と文の間の論述関係の種類を選択する。図２に示すように、論述関係種類テーブル１０６－１には、例えば、「論述関係なし」、「理由」、「支持」、および「攻撃」といった論述関係の種類が一次元リストとして格納されている。図４を参照して後述する文ｂと文ａの間の論述関係は、例えば、後述の図１３に示すように、支持と分類される。図２では、論述関係種類は４種類であるが、これに限るものではない。他には、例えば、理由、証拠、論拠、および反駁などの論述関係種類を用いてもよい。また、他には、論述関係あり、および論述関係なしの２種類でもよい。

また、論述構造出力部１０６は、非木構造だけでなく、木構造や無向グラフへ変換した論述構造を出力することも可能である。このとき、例えば、Chu-Liu/Edmondアルゴリズムを用いて、非木構造を木構造へ変換するアルゴリズムを適用することや、有向グラフの向きに関する情報を削除し、無向グラフへ変換することが考えられる。

＜実施例１の論述構造推定装置１００の処理＞
図３は、実施例１における論述構造推定装置１００の処理を示すフローチャートである。ステップＳ１１では、入力部１０１が入力テキスト５０１の入力を受け付け、パラメータ入力部１０２が双線形パラメータ１０５－１の入力を受け付ける。そして、入力部１０１は、図４に示すように、入力テキスト５０１から表５０２を生成する。図４は、入力テキスト５０１と、入力テキスト５０１から生成された単語列で構成される文の列で成り立つ表５０２を示す。

図４に示す例では、入力テキスト５０１は、３つの文で構成されている。例えば、入力テキスト５０１の３つの文に対して、出現順にａ、ｂ、およびｃの文ＩＤを割り振る。文ＩＤ：ｘの文を文ｘと呼ぶ。表５０２には、入力テキスト５０１の各文ＩＤの文が単語に分かち書きされた結果が格納される。なお、分かち書きの方法はどのような手段であっても良い。この場合、例えば、空白による分割や、形態素解析ソフトウェアや、ＯＳＳ（ＯｐｅｎＳｏｕｒｃｅＳｏｆｔｗａｒｅ）を用いた解析や、独自の分かち書き機能など、を用いることができる。また、表５０２では単語を最小単位として分かち書きを実施しているが、分かち書きの最小単位はどのような文の構成単位であってもよい。例えば、文ａの「Ｉ」「ｔｈｉｎｋ」が「Ｉｔｈｉｎｋ」のように単語を超える単位で分かち書きされていてもよい。

図４に示す入力テキスト５０１は、図表を含んでもよいし、さらにはテキストに限定されず、例えば音声であってもよい。また、入力テキスト５０１の形式（フォーマット）は、特に限定されない。表５０２は、単語ベクトル抽出部１０３への入力として与えられる。

図３に説明を戻す。ステップＳ１１に続きステップＳ１２では、単語ベクトル抽出部１０３は、入力部１０１から入力された表５０２に対して第一の変換および第二の変換を実施し、各単語ベクトルがＮ次元ベクトルで構成される単語ベクトル列を、文ベクトル更新部１０４へ出力する。以下、第一の変換および第二の変換の例について説明する。

（第一の変換）
下記式（１）は、表５０２の文ａを例として、単語ベクトル抽出部１０３における第一の変換の例を示す。

上記式（１）は、文ａの各単語から特徴量を抽出し、各単語に対する単語ベクトルを割り当てる例を示している。特徴量がＮ次元ユークリッド空間の元（N次元ベクトル）で与えられるとすると、ｗ_iは単語iに対応する単語ベクトルを表す。この第一の変換では、例えば辞書を用いることにより、単語の種類に対して唯一の単語ベクトルを与える。単語の種類に対して唯一の単語ベクトルを与える場合には、例えば、文ａの「ｈａｓ」と文ｂの「ｈａｓ」は常に同一の単語ベクトルである。

一方、単語の種類に対して唯一の単語ベクトルを与えない場合には、文ａの「ｈａｓ」と文ｂの「ｈａｓ」は同じベクトルとは限らない。例えば、文脈によって単語の意味が変化する場合は、同じ単語が同一の意味を持つことは適切でないから、異なる単語ベクトルが与えられる場合もある。

この第一の変換で、単語をベクトル化することにより、後述の機械学習を効率的に行うことができる。

（第二の変換）
下記式（２）は、表５０２の文ａを例として、単語ベクトル抽出部１０３における第二の変換の例を示す。

第二の変換は、第一の変換の出力を入力とする。同一の添え字iの入力の単語ベクトルｗ_iと出力の単語ベクトルｈ_iが対応する。上記式（２）は、再帰的ニューラルネットワーク（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ：ＲＮＮ）を用いた変換を示している。上記式（２）は、再帰的ニューラルネットワークにより、単語列の順序を考慮した単語ベクトル表現を計算することができる。第二の変換への入力は、単語の順序で並べた単語ベクトルｗ_iの列、すなわち単語ベクトル列であり、Ｎ次元ユークリッド空間の元、すなわちＮ次元ベクトルで構成されるベクトル列である。出力は、Ｍ次元ユークリッド空間の元、すなわちＭ次元ベクトルで構成されるベクトル列である。

上記式（２）で例示されたＲＮＮは、より具体的には、ＬｏｎｇＳｈｏｒｔ－ＴｅｒｍＭｅｍｏｒｙ（ＬＳＴＭ）やＧａｔｅｄＲｅｃｕｒｒｅｎｔＵｎｉｔ（ＧＲＵ）であってもよい。

ステップＳ１２に続きステップＳ１３では、文ベクトル更新部１０４は、ステップＳ１２の出力である単語ベクトル列に対して集約処理を行って各文に対応する文ベクトルへ変換し、さらに文脈を考慮した文ベクトル列を計算する。以下、集約処理および文脈を考慮した文ベクトル列への変換を説明する。

（集約処理）
下記式（３）は、文ベクトル更新部１０４における、単語ベクトル列の文ベクトル列への集約処理の例を示す。

上記式（３）の集約処理は、単語ベクトル抽出部１０３における第二の変換の出力を入力とする。上記式（３）は、ベクトルの加算を用いた集約演算によって、単語ベクトル列を文ベクトルへと変換する処理を実施している。出力はＭ次元ユークリッド空間の元、すなわちＭ次元ベクトルである。

なお、上記式（３）では、ベクトルの加算を例示しているが、これに限定しない。例えば、このとき、先頭のベクトルの選択、末尾のベクトルの選択、ベクトルの平均化、要素積、乗算、最大値プーリング（ＭａｘＰｏｏｌｉｎｇ）、平均値プーリング（ＡｖｅｒａｇｅＰｏｏｌｉｎｇ）、および減算などの演算を用いることができる。

また、文ベクトル更新部１０４は、後述の実施例２の単語ベクトル注意集約部２０４－１（図６参照）のように、いわゆる注意機構を用いて集約処理を行ってもよい。

（文脈を考慮した文ベクトル列の計算）
下記式（４）は、文ベクトル更新部１０４における、集約処理の出力の文ベクトルを入力として、テキストにおける大域的な文の流れ（文脈）を考慮した文ベクトル列を計算する処理を示す。

上記式（４）は、再帰的ニューラルネットワークを用いた変換を示している。上記式（４）により、再帰的ニューラルネットワークにより、入力テキスト５０１内における文の順序を考慮した文ベクトル表現を計算することができる。上記式（４）への入力は、文の順序で並べた文ベクトルの列、すなわち文ベクトル列であり、Ｍ次元ユークリッド空間の元、すなわちＭ次元ベクトルである。出力はＬ次元ユークリッド空間の元、すなわちＬ次元ベクトルである。上記式（４）で例示されたＲＮＮは、より具体的には、ＬＳＴＭやＧＲＵであってもよい。

なお、第一の変換、第二の変換、集約処理、および注意集約処理は、それぞれ、機械学習モデルによって実行される。さらに、これらの機械学習モデルは、文ベクトルを得るための文に関する特徴抽出器とみなすこともできる。第一の変換、第二の変換、集約処理、および注意集約処理の各処理により異なる特徴量が抽出されるため、各処理に対して、同一構成の異なる初期値の機械学習モデルを用意、または、異なる構成の機械学習モデルを用意し、機械学習を行う。この点については、他の実施例も同様である。

ステップＳ１３に続きステップＳ１４では、論述関係双線形注意部１０５は、文ベクトル更新部１０４から受け付けた文ベクトル列、および双線形パラメータ１０５－１に基づいて、双線形演算の適用を実施し、文と文の間の論述関係を推定する。以下、論述関係の推定方法を説明する。

（論述関係推定）
下記式（５）は、文ａおよび文ｂを例として、論述関係双線形注意部１０５における論述関係への変換の例を示す。

上記式（５）は、論述関係双線形注意部１０５が、双線形注意（ｂｉｌｉｎｅａｒａｔｔｅｎｔｉｏｎ）を用いて、上記式（４）の出力を入力として、文ａの文ベクトルと、文ｂの文ベクトルとの間の最も生成確率が高い論述関係を推定する処理を示す。上記式（５）のＵはテンソルのパラメータである。上記式（５）の論述関係（ａ，ｂ）は、順序性を考慮した入力テキスト５０１内の文のペアを網羅する。論述関係（ａ，ｂ）は、論述関係に応じたｏｎｅ－ｈｏｔベクトルである。

上記式（５）において、上記式（４）の出力が、多層パーセプトロンを用いて、新たなベクトル表現へ変換される。ｏｎｅ－ｈｏｔベクトルへの変換は、いわゆるソフトマックス（ｓｏｆｔｍａｘ）関数を用いているが、ｓｉｇｍｏｉｄを用いてもよい。また、双線形注意は双アフィン注意であってもよい。

これらの双線形注意モデルを用いた計算によって、文と文のペアに対する論述関係を推定することで、木構造を満たさない論述構造を推定することができる。

ステップＳ１４に続きステップＳ１５では、論述構造出力部１０６は、論述関係双線形注意部１０５から受け付けた論述関係をもとに、論述構造の構築、および論述構造の正しさをチェックし、適切な論述構造を出力する。

＜実施例１の論述構造出力制御画面１０６ａ＞
図５は、実施例１における論述構造出力部１０６の出力を制御する論述構造出力制御画面１０６ａの一例を示す図である。論述構造出力制御画面１０６ａは、利用者の入力操作による、変換アルゴリズムの指定を受け付ける。論述構造出力制御画面１０６ａは、変換アルゴリズムとして、論述構造出力部１０６が出力する論述関係の種類の指定を受け付ける。図５の例では、論述関係を、非木構造だけでなく、木構造および無向グラフへ変換した論述構造を出力するように指定できる。

また、論述構造出力制御画面１０６ａは、論述関係双線形注意部１０５から受け付ける論述関係の確率の閾値の指定を受け付ける。例えば論述関係の確率の閾値を０．５にすると、５０％以上の生成確率を持つ論述関係を論述構造出力部１０６が採用する。

論述構造出力部１０６は、論述構造出力制御画面１０６ａを介して受け付けた指定に基づいて、論述関係双線形注意部１０５の出力結果を、適切な論述構造に変換することができる。

＜実施例１の効果＞
本実施例によれば、単語列で構成される文の列で成り立つテキストを入力として、単語の特徴量を抽出し、単語の特徴量から文ベクトル列を求め、双線形注意計算によって、木構造および非木構造を含む論述構造推定を実現できる。

＜実施例２の論述構造推定装置２００の構成＞
図６は、実施例２における論述構造推定装置２００の機能ブロック図の一例である。論述構造推定装置２００は、入力部１０１、パラメータ入力部２０２、単語ベクトル抽出部１０３、文ベクトル注意更新部２０４、論述関係双線形注意部１０５、双線形パラメータ１０５－１、論述構造出力部１０６、および論述関係種類テーブル１０６－１を含む。

また、文ベクトル注意更新部２０４は、単語ベクトル注意集約部２０４－１、文ベクトル更新部２０４－２、論述関係注意集約パラメータ２０４－３、論述関係再帰パラメータ２０４－４を含む。

パラメータ入力部２０２は、論述関係注意集約パラメータ２０４－３、論述関係再帰パラメータ２０４－４、および双線形パラメータ１０５－１を入力として受け付ける。

文ベクトル注意更新部２０４は、単語ベクトル抽出部１０３から受け付けた単語ベクトル列を、単語ベクトル注意集約部２０４－１によって、各文に対応する文ベクトルへと変換し、文ベクトル更新部２０４－２によって、新たな文ベクトル列を計算する。

論述構造の推定に関して、一般的に、テキストに含まれる論述的な単語の重要度が高くなる。このとき、例えば、「ｂｅｃａｕｓｅ」、「ａｓ」、「ｔｈｅｒｅｆｏｒｅ」、「ａｇｒｅｅ」、および「ｔｈｉｎｋ」といった論述構造を推定する上で重要な単語の単語ベクトルに対する重みが高く設定されるべきである。

そこで、単語ベクトル注意集約部２０４－１は、論述関係注意集約パラメータ２０４－３に応じて各単語ベクトルの重要度を計算し、重要度を考慮して単語ベクトルを単一の文ベクトルへと集約する。論述関係注意集約パラメータ２０４－３は、重要度の算出に必要なニューロン数を決定するための、機械学習モデルのパラメータである。

また、文ベクトル更新部２０４－２は、論述関係再帰パラメータ２０４－４に応じた再帰深度で、単語ベクトル注意集約部２０４－１によって集約された文ベクトルから文脈情報を抽出し、文脈を考慮した文ベクトル列へと更新する。このとき、例えば、文ベクトル更新部２０４－２は、「ｂｅｃａｕｓｅ→ｉ→ｔｈｉｎｋ」といった論述文の流れを考慮した文脈情報を抽出する。文ベクトル注意更新部２０４は、このようにして得られた文ベクトル列を、論述関係双線形注意部１０５へ出力する。

＜実施例２の論述構造推定装置２００の処理＞
図７は、実施例２における論述構造推定装置２００の処理を示すフローチャートである。ステップＳ２１では、入力部１０１が入力テキスト５０１の入力を受け付け、パラメータ入力部２０２が双線形パラメータ１０５－１、論述関係注意集約パラメータ２０４－３、および論述関係再帰パラメータ２０４－４の入力を受け付ける。入力部１０１は、入力テキスト５０１から表５０２を生成する。

次のステップＳ２２は、実施例１のステップＳ１２（図３参照）と同様である。次にステップＳ２３では、単語ベクトル注意集約部２０４－１は、単語ベクトル抽出部１０３の出力である単語ベクトル列に対して、注意機構を用いた注意集約処理を実施し、単語の重要度を考慮して文ベクトルへ集約する。

下記式（６）は単語ベクトル注意集約部２０４－１において、注意機構を用いた注意集約処理の例を示す。

上記式（６）は、単語ベクトル注意集約部２０４－１における、注意集約処理の例を示す。添え字と出力形式は式（３）と同様である。上記式（６）は多層パーセプトロン（Ｍｕｌｔｉ－ＬａｙｅｒｅｄＰｅｒｃｅｐｔｒｏｎ：ＭＬＰ）を用いた変換を例示しているがこれに限定しない。ｖは多層パーセプトロンの演算に必要なパラメータである。多層パーセプトロンは、全結合層を含むパーセプトロンである。多層パーセプトロンを注意集約処理に用いる場合は、その活性化関数には、ｓｉｇｍｏｉｄ、ｔａｎｈ、およびＲｅＬｕなどを用いることができる。このような注意集約処理を用いることで、論述構造推定に重要な単語ベクトルの重みを算出し、重みを考慮した文ベクトルを計算することができる。

次にステップＳ２４では、文ベクトル更新部２０４－２は、単語ベクトル注意集約部２０４－１によって注意機構を用いて単語ベクトル列が集約された文ベクトルから、上記式（４）により、論述関係再帰パラメータ２０４－４に応じた再帰深度で文脈情報を抽出し、文脈を考慮した文ベクトル列へと更新する。

次のステップＳ２５およびＳ２６は、実施例１のステップＳ１４およびＳ１５と同様である。

＜実施例２の効果＞
本実施例によれば、単語列で構成される文の列で成り立つテキストを入力として、単語の特徴量を抽出し、各単語ベクトルの論述的な重要度を陽に計算することで、論述の性質に着目した文のベクトル列を求め、双線形注意計算によって、木構造および非木構造を含む論述構造推定を、より精度を向上させて実現できる。また、各単語ベクトルの論述的な重要度に基づく論述の性質に着目した文ベクトル列を計算することによって、論述構造の推定結果の根拠や解釈性を与えることができる。

実施例２で言及した注意集約処理は、出力目的に応じて区別することができる。より具体的には、実施例３では、文種類および論述関係の２つの出力目的を区別することで、文種類推定用の文ベクトル列および論述関係推定用の文ベクトル列を計算することで、出力目的に適した文ベクトル列を計算する。

＜実施例３の論述構造推定装置３００の構成＞
本実施例では、実施例１および２における論述関係の推定に加えて、文種類の推定を行い、論述関係および文種類を含んだ論述構造推定を実施する。図８は、実施例３における論述構造推定装置３００の機能ブロック図の一例である。

論述構造推定装置３００は、入力部１０１、パラメータ入力部３０２、単語ベクトル抽出部１０３、文ベクトル注意更新部３０４、論述関係双線形注意部３０５、双線形パラメータ１０５－１、文種類出力部３０５ａ、文種類出力層パラメータ３０５－１、論述構造出力部３０６、文種類テーブル３０６－１、および論述関係種類テーブル１０６－１を含む。

また、文ベクトル注意更新部３０４は、単語ベクトル注意集約部（文種類）３０４－１、文ベクトル更新部（文種類）３０４－２、文種類注意集約パラメータ３０４－３、文種類再帰パラメータ３０４－４、単語ベクトル注意集約部（論述関係）３０４－５、文ベクトル更新部（論述関係）３０４－６、論述関係注意集約パラメータ２０４－３、および論述関係再帰パラメータ２０４－４を含む。

パラメータ入力部３０２は、文種類注意集約パラメータ３０４－３、文種類再帰パラメータ３０４－４、論述関係注意集約パラメータ２０４－３、論述関係再帰パラメータ２０４－４、双線形パラメータ１０５－１、および文種類出力層パラメータ３０５－１を入力として受け付ける。

文ベクトル注意更新部３０４は、文種類の推定と論述関係の推定をそれぞれ実施するために必要な文ベクトル列を計算する。

単語ベクトル注意集約部（文種類）３０４－１は、単語ベクトル抽出部１０３から受け付けた単語ベクトル列の各単語ベクトルの重要度を、文種類注意集約パラメータ３０４－３に応じて算出する。そして、単語ベクトル注意集約部（文種類）３０４－１は、単語ベクトル抽出部１０３から入力された各文に対応する単語ベクトル列を、各単語ベクトルの重要度を考慮して単一の文ベクトルへと集約する。このとき、例えば、「ｄｉｓａｇｒｅｅ」および「ｓｈｏｕｌｄ」といった単語を含む文は主観的な意見を反映する文種類が割り当てられることが推認されるから、このような単語の単語ベクトルに対する重みを高く設定する。

文ベクトル更新部（文種類）３０４－２は、単語ベクトル注意集約部（文種類）３０４－１によって集約された文ベクトルから、文種類再帰パラメータ３０４－４に応じた再帰深度で文脈情報を抽出し、文脈を考慮した文種類推定用の文ベクトル列を計算する。このとき、例えば、文ベクトル更新部（文種類）３０４－２は「ｄｉｓａｇｒｅｅ→ｓｈｏｕｌｄ」といった文種類の流れを考慮した文脈情報を抽出する。文ベクトル更新部（文種類）３０４－２は、文種類推定用の文ベクトル列を文種類出力部３０５ａへ出力する。

また、単語ベクトル注意集約部（論述関係）３０４－５は、単語ベクトル抽出部１０３から受け付けた単語ベクトル列の各単語ベクトルの重要度を、論述関係注意集約パラメータ２０４－３に応じて算出する。そして、単語ベクトル注意集約部（論述関係）３０４－５は、単語ベクトル抽出部１０３から入力された各文に対応する単語ベクトル列を、論述関係の推定に必要な重要度を考慮した文ベクトルへと集約する。このとき、例えば、「ｂｅｃａｕｓｅ」、および「ｔｈｅｒｅｆｏｒｅ」といった単語を含む文は理由を反映する論述関係が割り当てられることが推認されるから、このような単語の単語ベクトルに対する重みを高く設定する。

文ベクトル更新部（論述関係）３０４－６は、単語ベクトル注意集約部（論述関係）３０４－５によって集約された文ベクトルから、論述関係再帰パラメータ２０４－４に応じた再帰深度で文脈情報を抽出し、文脈を考慮した論述関係推定用の文ベクトル列を計算する。このとき、例えば、文ベクトル更新部（論述関係）３０４－６は「ｔｈｅｒｅｆｏｒｅ→ｈｏｗｅｖｅｒ」といった論述関係の流れを考慮した文脈情報を抽出する。文ベクトル更新部（論述関係）３０４－６は、論述関係推定用の文ベクトル列を論述関係双線形注意部３０５へ出力する。

論述関係双線形注意部３０５は、文ベクトル更新部（論述関係）３０４－６から受け付けた論述関係推定用の文ベクトル列、および双線形パラメータ１０５－１に基づいて、論述関係を推定する。

また、文種類出力部３０５ａは、文ベクトル更新部（文種類）３０４－２から受け付けた文種類推定用の文ベクトル列、および文種類出力層パラメータ３０５－１に基づいて、文種類を推定する。

論述構造出力部３０６は、論述関係双線形注意部３０５から受け付けた論述関係、および文種類出力部３０５ａから受け付けた文種類をもとに、論述構造の構築、および論述構造の正しさをチェックし、適切な論述構造を出力する。適切な論述構造として、例えば、論述関係双線形注意部３０５が出力する論述関係の生成確率を用いて、確率が閾値を超える論述関係を採用することが考えられる。

論述構造出力部３０６は、文種類テーブル３０６－１を照会し、当該文の文種類を選択する。図９に示すように、文種類テーブル３０６－１には、例えば、「文種類なし」、「意見」、「事実」、および「経験談」といった文種類が一次元リストとして格納されている。例えば図４に示す文ａに対する論述種類は、例えば、後述の図１３に示すように、意見と分類される。図９では、文種類は４種類だが、これに限るものではない。他には、例えば、主張、前提、指示、および参照などの文種類を用いてもよい。また、他には、文種類あり、および文種類なしの２種類でもよい。

また、論述構造出力部３０６は、実施例１および２の論述構造出力部１０６と同様に、論述関係種類テーブル１０６－１を照会し、当該の文と文の間の論述関係の種類を選択する。

詳細は図１２を参照して後述するが、論述構造出力部３０６は、非木構造だけでなく、木構造、および無向グラフへ変換した論述構造を出力することも可能である。このとき、例えば、Chu-Liu/Edmondアルゴリズムを用いて、非木構造を木構造へ変換するアルゴリズムを適用することや、有向グラフの向きに関する情報を削除し、無向グラフへ変換することが考えられる。

また、論述構造出力部３０６は、文種類出力部３０５ａから受け付けた文種類を用いて、論述構造に制約をかけることもできる。このとき、例えば、文種類が事実の文から、他の事実への文に論述関係が存在しないと仮定するとすれば、論述関係双線形注意部３０５が出力する結果に事実と事実の間の論述関係が誤って含まれていたとしても、この誤った論述関係を除外することができる。

＜実施例３の論述構造推定装置３００の処理＞
図１０は、実施例３における論述構造推定装置３００の処理を示すフローチャートである。ステップＳ３１では、入力部１０１が入力テキスト５０１の入力を受け付け、パラメータ入力部３０２が双線形パラメータ１０５－１、論述関係注意集約パラメータ２０４－３、論述関係再帰パラメータ２０４－４、文種類注意集約パラメータ３０４－３、文種類再帰パラメータ３０４－４、文種類出力層パラメータ３０５－１の入力を受け付ける。パラメータ入力部３０２は、図１１に示すパラメータ入力画面３０２ａを介して、各種パラメータの入力を受け付ける。入力部１０１は、入力テキスト５０１から表５０２を生成する。

図１１に示すパラメータ入力画面３０２ａにおいて、文種類注意集約パラメータ３０４－３は、利用者により指定された、後述の式（７）におけるｖのニューロン数である。また、文種類再帰パラメータ３０４－４は、利用者により指定された、後述の式（８）におけるＲＮＮの中間ニューロン数およびＲＮＮの再帰深度（スタック数）である。また、文種類出力層パラメータ３０５－１は、利用者により指定された、後述の式（９）における多層パーセプトロンの中間ニューロン数である。また、論述関係注意集約パラメータ２０４－３は、利用者により指定された、後述の式（１１）におけるｖのニューロン数である。また、論述関係再帰パラメータ２０４－４は、利用者により指定された、後述の式（１２）におけるＲＮＮの中間ニューロン数およびＲＮＮの再帰深度（スタック数）である。また、双線形パラメータ１０５－１は、利用者により指定された式（５）および後述の式（１３）における多層パーセプトロンの中間ニューロン数である。

次のステップＳ３２は、実施例１のステップＳ１２（図３参照）と同様である。次にステップＳ３３ａでは、単語ベクトル注意集約部（文種類）３０４－１は、単語ベクトル抽出部１０３から受け付けた単語ベクトル列の各単語ベクトルの重要度を、文種類注意集約パラメータ３０４－３に応じて算出する。そして、単語ベクトル注意集約部（文種類）３０４－１は、単語ベクトル抽出部１０３から入力された各文に対応する単語ベクトル列を、各単語ベクトルの重要度を考慮して単一の文ベクトルへと集約する。

下記式（７）は、論述構造推定装置３００における単語ベクトル注意集約部（文種類）３０４－１の集約処理の一例を示す。

上記式（７）は、単語ベクトル注意集約部（文種類）３０４－１における注意集約処理の例を示す。添え字と、変換処理とは式（６）と同様である。出力はＬ（文種類）次元ユークリッド空間の元、すなわちＬ（文種類）次元ベクトルである。

このような文種類推定用の注意集約処理を用いることで、文種類の推定に重要な単語ベクトルの重みを算出し、重みを考慮した文種類推定用の文ベクトルを計算することができる。

ステップＳ３３ａに続くステップＳ３４ａでは、文ベクトル更新部（文種類）３０４－２は、単語ベクトル注意集約部（文種類）３０４－１によって集約された文ベクトルから、文種類再帰パラメータ３０４－４に応じた再帰深度で文脈情報を抽出する。そして、文ベクトル更新部（文種類）３０４－２は、抽出した文脈情報に基づいて文種類推定用の文ベクトル列を計算し、文種類出力部３０５ａへ出力する。

文種類推定用の文ベクトル列は、上記式（４）と同様にして、文脈を考慮した文ベクトル列の更新を行うこともできる。下記式（８）は、文ベクトル更新部（文種類）３０４－２における文ベクトル列の更新の例を示す。

上記式（８）は、上記式（７）の出力の文ベクトルを入力として、文種類の推定に必要な、大域的な文の流れ（文脈）の情報を考慮した文ベクトルへと変換する処理を示す。出力はＬ（文種類）次元ユークリッド空間の元、すなわちＬ（文種類）次元ベクトルである。上記式（８）は、再帰的ニューラルネットワークを用いた変換を示している。上記式（８）で例示されたＲＮＮは、より具体的には、ＬＳＴＭやＧＲＵであってもよい。

次のステップＳ３５ａでは、文種類出力部３０５ａは、文ベクトル更新部（文種類）３０４－２から受け付けた文種類推定用の文ベクトル列および文種類出力層パラメータ３０５－１に基づいて、文種類を推定する。

下記式（１０）は、文ａを例として、文種類出力部３０５ａにおける文種類への変換の処理の一例を示す。

上記式（９）は、式（８）の出力を入力として、文ベクトルを文種類に応じたｏｎｅ－ｈｏｔベクトル、すなわち最も生成確率が高い文種類（ａ）へ変換する処理を示す。式（８）の出力は、ｏｎｅ－ｈｏｔベクトルへと変換する前に、多層パーセプトロンを用いて、文種類の数のニューロン数を持つベクトル表現へ変換される。ｏｎｅ－ｈｏｔベクトルへの変換は、いわゆるソフトマックス（ｓｏｆｔｍａｘ）関数を用いているが、ｓｉｇｍｏｉｄを用いてもよい。

なお、下記式（１０）は、文ａを例として、上記式（４）の出力を入力とした場合に、文ベクトルを文種類に応じたｏｎｅ－ｈｏｔベクトル、すなわち最も生成確率が高い文種類（ａ）へ変換する処理の一例を示す。上記式（４）の出力は、ｏｎｅ－ｈｏｔベクトルへと変換する前に、多層パーセプトロンを用いて、文種類の数のニューロン数を持つベクトル表現へ変換される。ｏｎｅ－ｈｏｔベクトルへの変換は、いわゆるソフトマックス（ｓｏｆｔｍａｘ）関数を用いているが、ｓｉｇｍｏｉｄを用いてもよい。

一方、ステップＳ３３ｂでは、単語ベクトル注意集約部（論述関係）３０４－５は、単語ベクトル抽出部１０３から受け付けた単語ベクトル列の各単語ベクトルの重要度を、論述関係注意集約パラメータ２０４－３に応じて算出する。そして、単語ベクトル注意集約部（論述関係）３０４－５は、単語ベクトル抽出部１０３から入力された各文に対応する単語ベクトル列を、論述関係の推定に必要な重要度を考慮して文ベクトルへと集約する。

下記式（１１）は、論述構造推定装置３００における単語ベクトル注意集約部（論述関係）３０４－５の処理の一例を示す。

上記式（１１）において、上添え字と、変換処理とは、上記式（７）と同様である。出力はＬ（論述関係）次元ユークリッド空間の元、すなわちＬ（論述関係）次元ベクトルである。

このような論述関係推定用の注意集約処理を用いることで、論述関係の推定に重要な単語ベクトルの重みを算出し、重みを考慮した論述関係推定用の文ベクトルを計算することができる。

次にステップＳ３４ｂでは、文ベクトル更新部（論述関係）３０４－６は、上記式（４）と同様にして、単語ベクトル注意集約部（論述関係）３０４－５によって集約された文ベクトルから、文脈を考慮した論述関係推定用の文ベクトル列を計算する。下記式（１２）は、文ベクトル更新部（論述関係）３０４－６における更新の例を示す。

上記式（１２）は、上記式（１１）の出力の文ベクトルを入力として、論述関係の推定に必要な、大域的な文の流れ（文脈）の情報を考慮した文ベクトルへと変換する処理を示す。出力はＬ（論述関係）次元ユークリッド空間の元、すなわちＬ（論述関係）次元ベクトルである。上記式（１２）は、再帰的ニューラルネットワークを用いた変換を示している。上記式（９）で例示されたＲＮＮは、より具体的には、ＬＳＴＭやＧＲＵであってもよい。

次にステップＳ３５ｂでは、論述関係双線形注意部３０５は、文ベクトル更新部（論述関係）３０４－６から受け付けた論述関係推定用の文ベクトル列および双線形パラメータ１０５－１に基づいて、論述関係を推定する。

下記式（１３）は、上記式（１２）の出力を入力として、文ベクトルを論述関係に応じたｏｎｅ－ｈｏｔベクトル、すなわち最も生成確率が高い論述関係（ａ，ｂ）へ変換する処理を示す。

上記式（１２）の出力は、上記式（１３）によって、多層パーセプトロンを用いて、新たなベクトル表現へ変換される。ｏｎｅ－ｈｏｔベクトルへの変換は、いわゆるソフトマックス（ｓｏｆｔｍａｘ）関数を用いているが、ｓｉｇｍｏｉｄを用いてもよい。また、双線形注意は双アフィン注意（ｂｉａｆｆｉｎｅａｔｔｅｎｔｉｏｎ）であってもよい。上記式（１３）の論述関係（ａ，ｂ）は、順序性を考慮した入力テキスト５０１内の文のペアを網羅する。

ステップＳ３５ａおよびＳ３５ｂに続いて、ステップＳ３６では、論述構造出力部３０６は、文種類出力部３０５ａから受け付けた文種類と、論述関係双線形注意部３０５から受け付けた論述関係をもとに、入力テキスト５０１の論述構造の推定結果を構築する。論述構造出力部３０６は、文種類出力部３０５ａから受け付けた文種類および論述関係双線形注意部３０５から受け付けた論述関係に基づいて、論述構造の正しさをチェックする。

なお、論述構造出力部３０６は、文種類出力部３０５ａから受け付けた文種類を考慮して、論述関係双線形注意部３０５から受け付けた論述関係をより適切なものになるように修正してもよい。また、論述構造出力部３０６は、論述関係双線形注意部３０５から受け付けた論述関係を考慮して、文種類出力部３０５ａから受け付けた文種類をより適切なものになるように修正してもよい。このように、論述構造出力部３０６は、文種類と論述関係の不適切な組み合わせを、より適切な組み合わせとなるように、利用者の指定や過去の学習結果などの予め用意された情報に基づいて、文種類または論述関係を修正する。そして、論述構造出力部３０６は、修正した文種類または論述関係に基づいて、より適切な論述構造の推定結果を出力する。

または、論述構造出力部３０６は、文種類出力部３０５ａから受け付けた文種類と、論述関係双線形注意部３０５から受け付けた論述関係とに基づいて構築した論述構造の推定結果を、文種類および論述関係の何れか一方または両方に基づいてより適切な論述構造となるように再構築してもよい。

なお、文種類への変換および論述関係への変換は、それぞれ、機械学習モデルによって実行される。文種類への変換および論述関係への変換の各処理に対して、同一構成の異なる初期値の機械学習モデルを用意、または、異なる構成の機械学習モデルを用意し、機械学習を行う。この点については、他の実施例も同様である。

＜論述構造出力制御画面例＞
図１２は、実施例３における論述構造出力部３０６の出力を制御する論述構造出力制御画面３０６ａの一例を示す図である。図１２では、論述構造出力制御画面３０６ａは、論述構造出力制御画面１０６ａ（図５参照）と比較して、さらに、文種類の出力結果に応じて採用すべき論述関係の指定を受け付ける点が異なる。

図１２に示す例では、“文種類に応じた制約”として“事実→意見”、“経験談→意見”、“意見→意見”の３種類の制約を設けている。例えば“事実→意見”は、文種類が“事実”と“意見”の文は、“事実→意見”の論述関係を採用すべきとする制約を表す。“文種類に応じた制約”は、図１２の例示に限らず、利用者の指定がどのような制約であってもよい。また、論述構造出力制御画面３０６ａにおいて、“文種類に応じた制約”では、テキストで制約を指定しているが、表や数式で制約が指定されてもよい。これにより、論述構造の推定精度を高めることができる。

＜論述構造出力画面例＞
図１３は、実施例３の論述構造出力画面３０６ｂの一例を示す図である。論述構造出力画面３０６ｂは、図４に例示する表５０２を入力とした場合に構築された論述構造の推定結果の出力の一例である。図１３では、論述構造出力画面３０６ｂにおける表示３０６ａ－１は、論述構造出力部３０６によって推定された論述構造を有向グラフの形式で表示する。グラフのノードは文種類、有向エッジには論述関係を表示する。

また、論述構造出力画面３０６ｂは、表示３０６ａ－２のように表の形式で出力されてもよい。このとき、項目名には文ＩＤ、文種類、および論述関係を含む。表示３０６ａ－２において、文種類の項目は、当該文ＩＤに対して推定された文種類を出力し、表示３０６ａ－２において、論述関係の項目は、当該文ＩＤに対して推定された流出エッジの論述関係を出力する。表示３０６ａ－２では、論述関係は、例えば、「ａを支持」のように自然言語で記述しているが、どのような記述方法であってもよい。また、表示３０６ａ－２が、単一の表であっても、複数の表に分割されていてもよい。

また、論述構造出力画面３０６ｂや、論述構造出力画面３０６ｂが分割された複数の表において、他の情報や項目名を含んでもよい。なお、論述構造出力画面３０６ｂにおいて、“文種類”を除いたものが、実施例１および２による論述構造の出力となる。

＜実施例３の効果＞
本実施例では、単語列で構成される文の列で成り立つテキストを入力として、単語の特徴量を抽出し、文種類の推定と、論述関係の推定を、それぞれの論述的性質に考慮しながら、文種類推定用の文ベクトル列と、論述関係推定用の文ベクトル列を求める。そして、文種類用の文ベクトル列からは文種類を計算し、論述関係推定用の文ベクトル列からは、双線形注意計算によって、木構造および非木構造を含む論述構造推定を実現できる。

このように、本実施例では、文種類および論述関係の２つの出力目的に応じて注意集約処理を区別し、文種類推定用の文ベクトル列、および論述関係推定用の文ベクトル列を計算するように、出力目的に適した文ベクトル列を計算することができる。

＜論述構造推定装置を実現するコンピュータ４００のハードウェア構成例＞
図１４は、論述構造推定装置１００、２００、および３００を実現するコンピュータ４００のハードウェア構成例である。コンピュータ４００は、プロセッサ４０１と、記憶デバイス４０２と、入力デバイス４０３と、出力デバイス４０４と、通信インタフェース（ＩＦ）４０５と、を有する。上記構成要素は、バス４０６によって互いに接続される。

プロセッサ４０１は、コンピュータ４００を制御する。記憶デバイス４０２は、プロセッサ４０１の作業領域となる。記憶デバイス４０２は、プログラム、およびデータを記録する非一時的、または一時的な記憶媒体である。記憶デバイス４０２は、記憶媒体であればどのような媒体であってもよい。この場合、例えば、記憶デバイス４０２は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、フラッシュメモリがある。

具体的には、例えば、図１、図６、および図８に示した各処理部は記憶デバイス４０２に記憶されたプログラムをプロセッサ４０１が実行することによって実現される。また、図１、図６、および図８に示した各処理部において用いられる、入力テキスト、双線形パラメータ１０５－１、および論述関係種類テーブル１０６－１、文種類テーブル３０６－１などの各データは、例えば、記憶デバイス４０２に記憶されている。

プロセッサ４０１は、単一または複数の処理ユニットで構成され、単一または複数の演算ユニット、または複数の処理コアを含むことができる。プロセッサ４０１は、１つ以上の中央処理装置、マイクロプロセッサ、デジタル信号プロセッサ、マイクロコントローラ、マイクロ計算機、ステートマシン、ロジック回路、グラフィック処理装置、チップオンシステム、および／または制御指示によって信号操作を行う任意の装置として実装される。

論述構造推定装置１００、２００、および３００において、例えば、プロセッサ４０１により実行されるプログラムは、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）の他、入力プログラム、単語ベクトル抽出プログラム、文ベクトル更新プログラム、論述関係双線形注意プログラム、および論述構造出力プログラムなどの各プログラムを含むことができる。例えば、図１に示した論述構造推定装置１００において、プロセッサ４０１は、これらプログラムに従って動作することで、入力部１０１、パラメータ入力部１０２、単語ベクトル抽出部１０３、文ベクトル更新部１０４、論述関係双線形注意部１０５、および論述構造出力部１０６として機能できる。

図４において、ＯＳや各プログラムなどのソフトウェアの各要素は、記憶デバイス４０２の中のいずれの領域に格納されている。または、各プログラムは、予め可搬型記録媒体に記録され、媒体読み取り装置によって可搬型記録媒体から読み出されてもよいし、または通信媒体（ネットワークまたはネットワークを伝搬する搬送波）を介して取得されてもよい。

入力デバイス４０３は、ユーザが論述構造推定装置１００、２００、および３００に指示やデータを入力する装置である。入力デバイス４０３としては、例えば、キーボード、マウス、マイク、タッチパネル、スキャナがある。出力デバイス４０４は、データを出力する。出力デバイス４０４としては、例えば、ディスプレイ、プリンタがある。出力デバイス４０４がディスプレイの場合、論述構造出力制御画面１０６ａ（図５参照）、パラメータ入力画面３０２ａ（図１１参照）、論述構造出力制御画面３０６ａ（図１２参照）、論述構造出力画面３０６ｂ（図１３参照）を表示する。

通信ＩＦ４０５は、ネットワークと接続し、データを送受信する。入力デバイス４０３および出力デバイス４０４は省略されてもよく、論述構造推定装置、２００、および３００はネットワークを介して端末からデータを送受信してもよい。

論述構造推定装置１００、２００、および３００の機能は、１以上のプロセッサおよび非一過性の記憶媒体を含む１以上の記憶デバイスを含む１以上の計算機からなる計算機システムに実装することができる。複数の計算機はネットワークを介して通信する。この場合、論述構造推定装置の複数の機能の一部が１つの計算機に実装され、他の一部が他の計算機に実装されてもよい。

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例を含む。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、矛盾しない限りにおいて、ある実施例の構成の一部を他の実施例の構成で置き換え、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、構成の追加、削除、置換、統合、または分散をすることが可能である。また実施例で示した構成および処理は、処理結果が同一である限り、処理効率または実装効率に基づいて適宜分散、統合、または入れ替えることが可能である。

１００，２００，３００：論述構造推定装置、１０１：入力部、１０２，２０２，３０２：パラメータ入力部、１０３：単語ベクトル抽出部、１０４：文ベクトル更新部、１０５，３０５：論述関係双線形注意部、１０５－１：双線形パラメータ、１０６，３０６：論述構造出力部、１０６－１：論述関係種類テーブル、２０４，３０４：文ベクトル注意更新部、２０４－１：単語ベクトル注意集約部、２０４－２：文ベクトル更新部、２０４－３：論述関係注意集約パラメータ、２０４－４：論述関係再帰パラメータ、３０４－１：単語ベクトル注意集約部（文種類）、３０４－２：文ベクトル更新部（文種類）、３０４－３：文種類注意集約パラメータ、３０４－４：文種類再帰パラメータ、３０４－５：単語ベクトル注意集約部（論述関係）、３０４－６：文ベクトル更新部（論述関係）、３０５－１：文種類出力層パラメータ、３０５ａ：文種類出力部、３０６－１：文種類テーブル、４００：コンピュータ、４０１：プロセッサ、４０２：記憶デバイス

Claims

テキストの論述構造を推定する論述構造推定方法であって、
コンピュータが、
前記テキストに含まれる各文について、各文を構成する構成単位の順序を考慮したベクトル列の集約処理を行って、各文に対応する文ベクトル列を取得し、
前記文ベクトル列に対して、双線形パラメータによって中間ニューロン数が定まる多層パーセプトロンを用いて各文ベクトル列のそれぞれを変換したベクトル表現のうちの任意の２つの該ベクトル表現について第１のベクトル表現の転置ベクトルと或るテンソルと第２のベクトル表現との積を算出し、各積から各ワンホットベクトルを生成する双線形注意モデルを用いて、該各ワンホットベクトルを生成し、該各ワンホットベクトルに応じて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する
各処理を含んだことを特徴とする論述構造推定方法。
請求項１に記載の論述構造推定方法であって、
前記コンピュータが、
前記取得した文ベクトル列に対して、論述関係再帰パラメータによって中間ニューロン数および再帰深度が定まる再帰的ニューラルネットワークを用いた更新処理を実行して、前記テキスト内における文脈を考慮した文ベクトル列へと更新し、
前記更新した文ベクトル列に対して、前記双線形注意モデルを用いて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する
ことを特徴とする論述構造推定方法。
請求項２に記載の論述構造推定方法であって、
前記コンピュータが、
前記論述関係の推定に用いる前記構成単位の重要度を、論述関係注意集約パラメータによってニューロン数が定まる前記多層パーセプトロンを用いて該構成単位が前記論述構造を推定するために重要であるほど高く設定されるように計算し、該重要度に基づいた前記文ベクトル列を取得する
ことを特徴とする論述構造推定方法。
請求項１に記載の論述構造推定方法であって、
前記コンピュータが、
前記テキスト内の各文の文種類の推定に用いる前記構成単位の重要度を、文種類注意集約パラメータによってニューロン数が定まる前記多層パーセプトロンを用いて該構成単位が前記文種類を推定するために重要であるほど高く設定されるように計算し、該重要度に基づいた、各文に対応する文種類推定用の文ベクトル列を取得し、
前記取得した文種類推定用の文ベクトル列に対して、文種類再帰パラメータによって定まる中間ニューロン数および再帰深度が定まる再帰的ニューラルネットワークを用いた更新処理を実行し、前記テキスト内における文脈を考慮した文種類推定用の文ベクトル列へと更新し、
前記更新した文種類推定用の文ベクトル列を、文種類出力層パラメータによって中間ニューロン数が定まる前記多層パーセプトロンを用いてベクトル表現へと変換し、該ベクトル表現からワンホットベクトルを生成し、該ワンホットベクトルに応じて前記テキストに含まれる各文の文種類を推定する
ことを特徴とする論述構造推定方法。
請求項４に記載の論述構造推定方法であって、
前記コンピュータが、
論述関係の推定に用いる前記構成単位の重要度を、論述関係注意集約パラメータによってニューロン数が定まる前記多層パーセプトロンを用いて該構成単位が前記論述構造を推定するために重要であるほど高く設定されるように計算し、該重要度に基づいて論述関係推定用の文ベクトル列を取得し、
前記取得した論述関係推定用の文ベクトル列に対して、論述関係再帰パラメータによって中間ニューロン数および再帰深度が定まる再帰的ニューラルネットワークを用いた更新処理を実行し、前記テキスト内における文脈を考慮した論述関係推定用の文ベクトル列へと更新する
ことを特徴とする論述構造推定方法。
請求項５に記載の論述構造推定方法であって、
前記コンピュータが、
前記文脈を考慮した論述関係推定用の文ベクトル列に対して、前記双線形注意モデルを用いて、前記テキストに含まれる各文の間の論述関係を推定する
ことを特徴とする論述構造推定方法。
請求項６に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した文種類をノードとし、前記推定した論述関係で各ノード間を接続するエッジとして前記テキストの論述構造の推定結果を表すグラフを構築する
ことを特徴とする論述構造推定方法。
請求項７に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した文種類に対してより適切な組合せになるように前記推定した論述関係を修正、または、前記推定した論述関係に対してより適切な組合せになるように前記推定した文種類を修正し、修正した文種類または論述関係に基づいて前記テキストの論述構造の推定結果を表す前記グラフを構築する
ことを特徴とする論述構造推定方法。
請求項７に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した文種類と前記推定した論述関係とに基づいて構築した前記論述構造の推定結果を表す前記グラフを、該文種類および該論述関係の何れか一方または両方に基づいて再構築する
ことを特徴とする論述構造推定方法。
請求項１に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した論述関係を変換する変換アルゴリズムの指定を受け付け、
受け付けた前記変換アルゴリズムに応じて前記推定した論述関係を変換して前記テキストの論述構造の推定結果を表すグラフを構築し、出力する
ことを特徴とする論述構造推定方法。
請求項１に記載の論述構造推定方法であって、
前記コンピュータが、
確率の閾値の指定を受け付け、
前記推定した論述関係のうち、前記閾値以上の生成確率を持つ論述関係を採用して前記テキストの論述構造の推定結果を表すグラフを構築し、出力する
ことを特徴とする論述構造推定方法。
請求項７に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した文種類に応じて、前記推定した論述関係のうちから採用すべき論述関係の制約の指定を受け付け、
前記制約に応じて前記テキストの論述構造の推定結果を表すグラフを構築する
ことを特徴とする論述構造推定方法。
テキストの論述構造を推定する論述構造推定装置であって、
前記論述構造推定装置は、プログラムを実行するプロセッサと前記プロセッサと協働する記憶デバイスとを有し、
前記プロセッサが、
前記テキストに含まれる各文について、各文を構成する構成単位の順序を考慮したベクトル列の集約処理を行って、各文に対応する文ベクトル列を取得し、
前記文ベクトル列に対して、前記テキストに含まれる文の種類の数の中間ニューロン数を持つ多層パーセプトロンを用いて各文ベクトル列のそれぞれを変換したベクトル表現のうちの任意の２つの該ベクトル表現について第１のベクトル表現の転置ベクトルと或るテンソルと第２のベクトル表現との積を算出し、各積から各ワンホットベクトルを生成する双線形注意モデルを用いて、該各ワンホットベクトルを生成し、該各ワンホットベクトルに応じて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する
ことを特徴とする論述構造推定装置。
テキストの論述構造を推定する論述構造推定装置としてコンピュータを機能させるための論述構造推定プログラムであって、
前記コンピュータに、
前記テキストに含まれる各文について、各文を構成する構成単位の順序を考慮したベクトル列の集約処理を行って、各文に対応する文ベクトル列を取得し、
前記文ベクトル列に対して、前記テキストに含まれる文の種類の数の中間ニューロン数を持つ多層パーセプトロンを用いて各文ベクトル列のそれぞれを変換したベクトル表現のうちの任意の２つの該ベクトル表現について第１のベクトル表現の転置ベクトルと或るテンソルと第２のベクトル表現との積を算出し、各積から各ワンホットベクトルを生成する双線形注意モデルを用いて、該各ワンホットベクトルを生成し、該各ワンホットベクトルに応じて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する
各処理を実行させるための論述構造推定プログラム。