JP7387521B2 - 論述構造推定方法、論述構造推定装置、および論述構造推定プログラム - Google Patents
論述構造推定方法、論述構造推定装置、および論述構造推定プログラム Download PDFInfo
- Publication number
- JP7387521B2 JP7387521B2 JP2020063359A JP2020063359A JP7387521B2 JP 7387521 B2 JP7387521 B2 JP 7387521B2 JP 2020063359 A JP2020063359 A JP 2020063359A JP 2020063359 A JP2020063359 A JP 2020063359A JP 7387521 B2 JP7387521 B2 JP 7387521B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- vector
- argument
- estimating
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
図1は、実施例1における論述構造推定装置100の機能ブロック図の一例である。本実施例1の論述構造推定装置100は、入力部101、パラメータ入力部102、単語ベクトル抽出部103、文ベクトル更新部104、論述関係双線形注意部105、双線形パラメータ105-1、論述構造出力部106、および論述関係種類テーブル106-1を含む。
図3は、実施例1における論述構造推定装置100の処理を示すフローチャートである。ステップS11では、入力部101が入力テキスト501の入力を受け付け、パラメータ入力部102が双線形パラメータ105-1の入力を受け付ける。そして、入力部101は、図4に示すように、入力テキスト501から表502を生成する。図4は、入力テキスト501と、入力テキスト501から生成された単語列で構成される文の列で成り立つ表502を示す。
下記式(1)は、表502の文aを例として、単語ベクトル抽出部103における第一の変換の例を示す。
下記式(2)は、表502の文aを例として、単語ベクトル抽出部103における第二の変換の例を示す。
下記式(3)は、文ベクトル更新部104における、単語ベクトル列の文ベクトル列への集約処理の例を示す。
下記式(4)は、文ベクトル更新部104における、集約処理の出力の文ベクトルを入力として、テキストにおける大域的な文の流れ(文脈)を考慮した文ベクトル列を計算する処理を示す。
下記式(5)は、文aおよび文bを例として、論述関係双線形注意部105における論述関係への変換の例を示す。
図5は、実施例1における論述構造出力部106の出力を制御する論述構造出力制御画面106aの一例を示す図である。論述構造出力制御画面106aは、利用者の入力操作による、変換アルゴリズムの指定を受け付ける。論述構造出力制御画面106aは、変換アルゴリズムとして、論述構造出力部106が出力する論述関係の種類の指定を受け付ける。図5の例では、論述関係を、非木構造だけでなく、木構造および無向グラフへ変換した論述構造を出力するように指定できる。
本実施例によれば、単語列で構成される文の列で成り立つテキストを入力として、単語の特徴量を抽出し、単語の特徴量から文ベクトル列を求め、双線形注意計算によって、木構造および非木構造を含む論述構造推定を実現できる。
図6は、実施例2における論述構造推定装置200の機能ブロック図の一例である。論述構造推定装置200は、入力部101、パラメータ入力部202、単語ベクトル抽出部103、文ベクトル注意更新部204、論述関係双線形注意部105、双線形パラメータ105-1、論述構造出力部106、および論述関係種類テーブル106-1を含む。
図7は、実施例2における論述構造推定装置200の処理を示すフローチャートである。ステップS21では、入力部101が入力テキスト501の入力を受け付け、パラメータ入力部202が双線形パラメータ105-1、論述関係注意集約パラメータ204-3、および論述関係再帰パラメータ204-4の入力を受け付ける。入力部101は、入力テキスト501から表502を生成する。
本実施例によれば、単語列で構成される文の列で成り立つテキストを入力として、単語の特徴量を抽出し、各単語ベクトルの論述的な重要度を陽に計算することで、論述の性質に着目した文のベクトル列を求め、双線形注意計算によって、木構造および非木構造を含む論述構造推定を、より精度を向上させて実現できる。また、各単語ベクトルの論述的な重要度に基づく論述の性質に着目した文ベクトル列を計算することによって、論述構造の推定結果の根拠や解釈性を与えることができる。
本実施例では、実施例1および2における論述関係の推定に加えて、文種類の推定を行い、論述関係および文種類を含んだ論述構造推定を実施する。図8は、実施例3における論述構造推定装置300の機能ブロック図の一例である。
図10は、実施例3における論述構造推定装置300の処理を示すフローチャートである。ステップS31では、入力部101が入力テキスト501の入力を受け付け、パラメータ入力部302が双線形パラメータ105-1、論述関係注意集約パラメータ204-3、論述関係再帰パラメータ204-4、文種類注意集約パラメータ304-3、文種類再帰パラメータ304-4、文種類出力層パラメータ305-1の入力を受け付ける。パラメータ入力部302は、図11に示すパラメータ入力画面302aを介して、各種パラメータの入力を受け付ける。入力部101は、入力テキスト501から表502を生成する。
図12は、実施例3における論述構造出力部306の出力を制御する論述構造出力制御画面306aの一例を示す図である。図12では、論述構造出力制御画面306aは、論述構造出力制御画面106a(図5参照)と比較して、さらに、文種類の出力結果に応じて採用すべき論述関係の指定を受け付ける点が異なる。
図13は、実施例3の論述構造出力画面306bの一例を示す図である。論述構造出力画面306bは、図4に例示する表502を入力とした場合に構築された論述構造の推定結果の出力の一例である。図13では、論述構造出力画面306bにおける表示306a-1は、論述構造出力部306によって推定された論述構造を有向グラフの形式で表示する。グラフのノードは文種類、有向エッジには論述関係を表示する。
本実施例では、単語列で構成される文の列で成り立つテキストを入力として、単語の特徴量を抽出し、文種類の推定と、論述関係の推定を、それぞれの論述的性質に考慮しながら、文種類推定用の文ベクトル列と、論述関係推定用の文ベクトル列を求める。そして、文種類用の文ベクトル列からは文種類を計算し、論述関係推定用の文ベクトル列からは、双線形注意計算によって、木構造および非木構造を含む論述構造推定を実現できる。
図14は、論述構造推定装置100、200、および300を実現するコンピュータ400のハードウェア構成例である。コンピュータ400は、プロセッサ401と、記憶デバイス402と、入力デバイス403と、出力デバイス404と、通信インタフェース(IF)405と、を有する。上記構成要素は、バス406によって互いに接続される。
Claims (14)
- テキストの論述構造を推定する論述構造推定方法であって、
コンピュータが、
前記テキストに含まれる各文について、各文を構成する構成単位の順序を考慮したベクトル列の集約処理を行って、各文に対応する文ベクトル列を取得し、
前記文ベクトル列に対して、双線形パラメータによって中間ニューロン数が定まる多層パーセプトロンを用いて各文ベクトル列のそれぞれを変換したベクトル表現のうちの任意の2つの該ベクトル表現について第1のベクトル表現の転置ベクトルと或るテンソルと第2のベクトル表現との積を算出し、各積から各ワンホットベクトルを生成する双線形注意モデルを用いて、該各ワンホットベクトルを生成し、該各ワンホットベクトルに応じて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する
各処理を含んだことを特徴とする論述構造推定方法。 - 請求項1に記載の論述構造推定方法であって、
前記コンピュータが、
前記取得した文ベクトル列に対して、論述関係再帰パラメータによって中間ニューロン数および再帰深度が定まる再帰的ニューラルネットワークを用いた更新処理を実行して、前記テキスト内における文脈を考慮した文ベクトル列へと更新し、
前記更新した文ベクトル列に対して、前記双線形注意モデルを用いて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する
ことを特徴とする論述構造推定方法。 - 請求項2に記載の論述構造推定方法であって、
前記コンピュータが、
前記論述関係の推定に用いる前記構成単位の重要度を、論述関係注意集約パラメータによってニューロン数が定まる前記多層パーセプトロンを用いて該構成単位が前記論述構造を推定するために重要であるほど高く設定されるように計算し、該重要度に基づいた前記文ベクトル列を取得する
ことを特徴とする論述構造推定方法。 - 請求項1に記載の論述構造推定方法であって、
前記コンピュータが、
前記テキスト内の各文の文種類の推定に用いる前記構成単位の重要度を、文種類注意集約パラメータによってニューロン数が定まる前記多層パーセプトロンを用いて該構成単位が前記文種類を推定するために重要であるほど高く設定されるように計算し、該重要度に基づいた、各文に対応する文種類推定用の文ベクトル列を取得し、
前記取得した文種類推定用の文ベクトル列に対して、文種類再帰パラメータによって定まる中間ニューロン数および再帰深度が定まる再帰的ニューラルネットワークを用いた更新処理を実行し、前記テキスト内における文脈を考慮した文種類推定用の文ベクトル列へと更新し、
前記更新した文種類推定用の文ベクトル列を、文種類出力層パラメータによって中間ニューロン数が定まる前記多層パーセプトロンを用いてベクトル表現へと変換し、該ベクトル表現からワンホットベクトルを生成し、該ワンホットベクトルに応じて前記テキストに含まれる各文の文種類を推定する
ことを特徴とする論述構造推定方法。 - 請求項4に記載の論述構造推定方法であって、
前記コンピュータが、
論述関係の推定に用いる前記構成単位の重要度を、論述関係注意集約パラメータによってニューロン数が定まる前記多層パーセプトロンを用いて該構成単位が前記論述構造を推定するために重要であるほど高く設定されるように計算し、該重要度に基づいて論述関係推定用の文ベクトル列を取得し、
前記取得した論述関係推定用の文ベクトル列に対して、論述関係再帰パラメータによって中間ニューロン数および再帰深度が定まる再帰的ニューラルネットワークを用いた更新処理を実行し、前記テキスト内における文脈を考慮した論述関係推定用の文ベクトル列へと更新する
ことを特徴とする論述構造推定方法。 - 請求項5に記載の論述構造推定方法であって、
前記コンピュータが、
前記文脈を考慮した論述関係推定用の文ベクトル列に対して、前記双線形注意モデルを用いて、前記テキストに含まれる各文の間の論述関係を推定する
ことを特徴とする論述構造推定方法。 - 請求項6に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した文種類をノードとし、前記推定した論述関係で各ノード間を接続するエッジとして前記テキストの論述構造の推定結果を表すグラフを構築する
ことを特徴とする論述構造推定方法。 - 請求項7に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した文種類に対してより適切な組合せになるように前記推定した論述関係を修正、または、前記推定した論述関係に対してより適切な組合せになるように前記推定した文種類を修正し、修正した文種類または論述関係に基づいて前記テキストの論述構造の推定結果を表す前記グラフを構築する
ことを特徴とする論述構造推定方法。 - 請求項7に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した文種類と前記推定した論述関係とに基づいて構築した前記論述構造の推定結果を表す前記グラフを、該文種類および該論述関係の何れか一方または両方に基づいて再構築する
ことを特徴とする論述構造推定方法。 - 請求項1に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した論述関係を変換する変換アルゴリズムの指定を受け付け、
受け付けた前記変換アルゴリズムに応じて前記推定した論述関係を変換して前記テキストの論述構造の推定結果を表すグラフを構築し、出力する
ことを特徴とする論述構造推定方法。 - 請求項1に記載の論述構造推定方法であって、
前記コンピュータが、
確率の閾値の指定を受け付け、
前記推定した論述関係のうち、前記閾値以上の生成確率を持つ論述関係を採用して前記テキストの論述構造の推定結果を表すグラフを構築し、出力する
ことを特徴とする論述構造推定方法。 - 請求項7に記載の論述構造推定方法であって、
前記コンピュータが、
前記推定した文種類に応じて、前記推定した論述関係のうちから採用すべき論述関係の制約の指定を受け付け、
前記制約に応じて前記テキストの論述構造の推定結果を表すグラフを構築する
ことを特徴とする論述構造推定方法。 - テキストの論述構造を推定する論述構造推定装置であって、
前記論述構造推定装置は、プログラムを実行するプロセッサと前記プロセッサと協働する記憶デバイスとを有し、
前記プロセッサが、
前記テキストに含まれる各文について、各文を構成する構成単位の順序を考慮したベクトル列の集約処理を行って、各文に対応する文ベクトル列を取得し、
前記文ベクトル列に対して、前記テキストに含まれる文の種類の数の中間ニューロン数を持つ多層パーセプトロンを用いて各文ベクトル列のそれぞれを変換したベクトル表現のうちの任意の2つの該ベクトル表現について第1のベクトル表現の転置ベクトルと或るテンソルと第2のベクトル表現との積を算出し、各積から各ワンホットベクトルを生成する双線形注意モデルを用いて、該各ワンホットベクトルを生成し、該各ワンホットベクトルに応じて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する
ことを特徴とする論述構造推定装置。 - テキストの論述構造を推定する論述構造推定装置としてコンピュータを機能させるための論述構造推定プログラムであって、
前記コンピュータに、
前記テキストに含まれる各文について、各文を構成する構成単位の順序を考慮したベクトル列の集約処理を行って、各文に対応する文ベクトル列を取得し、
前記文ベクトル列に対して、前記テキストに含まれる文の種類の数の中間ニューロン数を持つ多層パーセプトロンを用いて各文ベクトル列のそれぞれを変換したベクトル表現のうちの任意の2つの該ベクトル表現について第1のベクトル表現の転置ベクトルと或るテンソルと第2のベクトル表現との積を算出し、各積から各ワンホットベクトルを生成する双線形注意モデルを用いて、該各ワンホットベクトルを生成し、該各ワンホットベクトルに応じて各文の間の論述関係を推定し、木構造および非木構造を含む前記テキストの論述構造を推定する
各処理を実行させるための論述構造推定プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020063359A JP7387521B2 (ja) | 2020-03-31 | 2020-03-31 | 論述構造推定方法、論述構造推定装置、および論述構造推定プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020063359A JP7387521B2 (ja) | 2020-03-31 | 2020-03-31 | 論述構造推定方法、論述構造推定装置、および論述構造推定プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021163134A JP2021163134A (ja) | 2021-10-11 |
| JP7387521B2 true JP7387521B2 (ja) | 2023-11-28 |
Family
ID=78003403
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020063359A Active JP7387521B2 (ja) | 2020-03-31 | 2020-03-31 | 論述構造推定方法、論述構造推定装置、および論述構造推定プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7387521B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPWO2024201824A1 (ja) * | 2023-03-29 | 2024-10-03 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019160259A (ja) | 2018-03-16 | 2019-09-19 | 株式会社リコー | 情報提示装置、情報提示システム、情報提示方法及びプログラム |
-
2020
- 2020-03-31 JP JP2020063359A patent/JP7387521B2/ja active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019160259A (ja) | 2018-03-16 | 2019-09-19 | 株式会社リコー | 情報提示装置、情報提示システム、情報提示方法及びプログラム |
Non-Patent Citations (4)
| Title |
|---|
| 伊藤 孝行 外5名,大規模合意形成支援システム -ICTによる議論の規模拡張,システム/制御/情報,日本,一般社団法人システム制御情報学会,2019年10月15日,第63巻 第10号,pp.440-446 |
| 栗林 樹生 外6名,複数の言語単位に対するスパン表現を用いた論述構造解析,言語処理学会第25回年次大会 発表論文集 [online],日本,言語処理学会,2019年03月04日,pp.990-993 |
| 森 幹彦 外2名,リフレクションのための逐語議事録を用いた議論の構造化法,2007年度人工知能学会全国大会(第21回)論文集 [CD-ROM],社団法人人工知能学会,2007年06月22日,pp.1-4 |
| 築山 将央 外3名,Visual Question Answeringのための多種質問回答生成とTransformerを用いたデータ拡張,電子情報通信学会技術研究報告 Vol.118 No.450 [online],日本,一般社団法人電子情報通信学会,2019年02月12日,第118巻 第450号,pp.91-96 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021163134A (ja) | 2021-10-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7122582B2 (ja) | 演算処理装置、並びに文章評価装置、及び文章評価方法 | |
| CN110287325A (zh) | 一种基于智能语音分析的电网客服业务推荐方法及装置 | |
| CN112463989B (zh) | 一种基于知识图谱的信息获取方法及系统 | |
| JP5881048B2 (ja) | 情報処理システム、及び、情報処理方法 | |
| CN111061962A (zh) | 一种基于用户评分分析的推荐方法 | |
| Huang et al. | Large-scale heterogeneous feature embedding | |
| US11868313B1 (en) | Apparatus and method for generating an article | |
| CN117708336B (zh) | 一种基于主题增强和知识蒸馏的多策略情感分析方法 | |
| JP2019211974A (ja) | 企業分析装置 | |
| Bondielli et al. | On the use of summarization and transformer architectures for profiling résumés | |
| Magdum et al. | A survey on deep learning-based automatic text summarization models | |
| CN115203570B (zh) | 预测模型的训练方法、专家推荐匹配方法、装置以及介质 | |
| CN113763031A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
| Meng | Cross-domain information fusion and personalized recommendation in artificial intelligence recommendation system based on mathematical matrix decomposition | |
| JP7387521B2 (ja) | 論述構造推定方法、論述構造推定装置、および論述構造推定プログラム | |
| Suresh | Natural language processing for internal link optimisation: Automating content relationships for better search engine optimisation | |
| CN113326348A (zh) | 一种博客质量评估方法及工具 | |
| CN113571198A (zh) | 转化率预测方法、装置、设备及存储介质 | |
| JP6867319B2 (ja) | 語彙間関係性推測装置および語彙間関係性推測方法 | |
| CN117171440A (zh) | 基于新闻事件和新闻风格联合建模的新闻推荐方法和系统 | |
| CN117093712A (zh) | 一种基于多显示图注意力网络模型的文本分类方法 | |
| Devi et al. | A Novel Approach to Sentiment Analysis using GMM-Enhanced N-gram LSTM Networks | |
| CN111582945A (zh) | 一种基于复杂网络的金融市场预测方法 | |
| CN119990291B (zh) | 一种基于语言模型进行知识数据库建立的方法 | |
| US12314325B1 (en) | Appartus and method of generating a data structure for operational inefficiency |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220629 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230523 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230530 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230712 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231024 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231115 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7387521 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |