[go: up one dir, main page]

JP6999400B2 - Text analyzer, text analysis method, and text analysis program - Google Patents

Text analyzer, text analysis method, and text analysis program Download PDF

Info

Publication number
JP6999400B2
JP6999400B2 JP2017242916A JP2017242916A JP6999400B2 JP 6999400 B2 JP6999400 B2 JP 6999400B2 JP 2017242916 A JP2017242916 A JP 2017242916A JP 2017242916 A JP2017242916 A JP 2017242916A JP 6999400 B2 JP6999400 B2 JP 6999400B2
Authority
JP
Japan
Prior art keywords
evaluation
target
analysis
subject
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017242916A
Other languages
Japanese (ja)
Other versions
JP2019109757A (en
Inventor
彰宏 是常
仁 岩下
仁史 大野
泰之 村林
毅 江澤
泰弘 北山
陽三 塩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suntory Holdings Ltd
Original Assignee
Suntory Holdings Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suntory Holdings Ltd filed Critical Suntory Holdings Ltd
Priority to JP2017242916A priority Critical patent/JP6999400B2/en
Publication of JP2019109757A publication Critical patent/JP2019109757A/en
Application granted granted Critical
Publication of JP6999400B2 publication Critical patent/JP6999400B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、多数のテキストデータを分析するためのテキスト分析装置、テキスト分析方法、及び、テキスト分析プログラムに関する。
に関する。
The present invention relates to a text analyzer for analyzing a large amount of text data, a text analysis method, and a text analysis program.
Regarding.

近年、SNS等にユーザが書き込んだ特定の商品・サービスについての評価に関する記載のあるテキストデータを収集し、その分析結果をマーケティングに用いることが行われている。そして、その手法の一つとして、収集した各テキストデータ中の商品に対する評価がポジティブであるかネガティブであるかを分析することが行われている(例えば特許4451354号公報(特許文献1))。 In recent years, text data containing a description about an evaluation of a specific product / service written by a user on an SNS or the like has been collected and the analysis result has been used for marketing. Then, as one of the methods, it is analyzed whether the evaluation of the product in each collected text data is positive or negative (for example, Japanese Patent No. 4451354 (Patent Document 1)).

特許4451354号公報Japanese Patent No. 4451354

しかし、商品に対する評価がポジティブであるかネガティブであるかに基づき、商品のどのような部分がその商品の強み(又は弱み)であるかがわかっても、競合商品も同じ部分がユーザにポジティブに評価されている場合には、その部分は競合商品との関係では強みとまではなりにくい。しかし、競合商品との比較において、その商品のどういう部分がユーザをポジティブな評価へと導いているのか(つまり、競合商品との関係での強み)、反対に、どういう部分がユーザをネガティブな評価に導いているのか(つまり、競合商品との関係での弱み)を正確に把握することは難しい。 However, even if you know what part of the product is the strength (or weakness) of the product based on whether the evaluation of the product is positive or negative, the same part of the competing product is positive to the user. If evaluated, that part is unlikely to be a strength in relation to competing products. However, in comparison with competing products, what part of the product leads the user to a positive evaluation (that is, the strength in relation to the competing product), and conversely, what part gives the user a negative evaluation. It is difficult to accurately grasp whether it leads to (that is, weaknesses in relation to competing products).

そこで、対象の商品・サービス等の強みや弱みの判断に役立つテキスト分析装置、テキスト分析方法、及び、テキスト分析プログラムが望まれる。 Therefore, a text analysis device, a text analysis method, and a text analysis program that are useful for determining the strengths and weaknesses of the target product / service are desired.

本発明に係るテキスト分析装置は、
多数のテキストデータを分析するためのテキスト分析装置であって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得部と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定部と、
前記評価判定部の判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成部と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、各テキストデータに出現する主語と当該主語に関連する語とを抽出して集計する単語集計部と、
前記評価判定部において前記評価対象項目とすべき主語を取得可能な評価対象項目取得部と、を備え、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成部は、前記マップ情報として、前記評価判定部の判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定部は、前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、前記単語集計部により集計された主語の少なくとも一部を前記評価対象項目とし、前記評価対象項目とする主語ごとに、当該主語に関連する語の集計結果に基づき、当該主語に対する評価がポジティブであるかネガティブであるかを判定するように構成されており、
前記マップ情報生成部は、前記マップ情報として、前記評価判定部により判定の行われた主語のうち、前記分析対象テキストデータ群と前記比較対象テキストデータ群とで共通する主語をマッピング対象として、前記評価判定部の判定結果に基づき、各共通する主語を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定部は、前記評価対象項目とする主語を出現頻度に応じて決定し、かつ、前記評価対象項目取得部が取得した主語については、出現頻度に関わらず、前記評価対象項目とするように構成されている
The text analyzer according to the present invention is
A text analyzer for analyzing a large amount of text data.
The text data group acquisition unit for acquiring the analysis target text data group which is the text data related to the analysis target and the comparison target text data group which is the text data related to the comparison target.
Based on the acquired text data group to be analyzed and the text data group to be compared, the evaluation of each evaluation target item is positive or negative for the analysis target and the plurality of evaluation target items related to the comparison target. An evaluation judgment unit that determines whether or not there is
A map information generation unit that generates map information for displaying an analysis map based on the judgment result of the evaluation determination unit, and a map information generation unit.
For each of the acquired text data group to be analyzed and the text data group to be compared, a word aggregation unit that extracts and aggregates the subject appearing in each text data and the word related to the subject, and the word aggregation unit.
The evaluation determination unit includes an evaluation target item acquisition unit capable of acquiring the subject to be the evaluation target item .
The analysis map is
Of the plurality of evaluation target items, the first part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is positive, and
Of the plurality of evaluation target items, the second part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is negative, and
Of the plurality of evaluation target items, the third part that maps the evaluation target item in which the evaluation in the analysis target is negative and the evaluation in the comparison target is positive, and
Among the plurality of evaluation target items, those provided with at least one of a fourth part mapping the evaluation target items in which the evaluation in the analysis target is negative and the evaluation in the comparison target is negative. And
The map information generation unit is configured to generate map information in which each evaluation target item is mapped to a corresponding portion of the analysis map based on the determination result of the evaluation determination unit .
For each of the analysis target text data group and the comparison target text data group, the evaluation determination unit sets at least a part of the subject aggregated by the word aggregation unit as the evaluation target item and sets it as the evaluation target item. For each subject, it is configured to judge whether the evaluation for the subject is positive or negative based on the aggregated result of the words related to the subject.
The map information generation unit sets the subject as the map information, which is common between the analysis target text data group and the comparison target text data group, among the subjects determined by the evaluation determination unit, as the mapping target. Based on the judgment result of the evaluation judgment unit, it is configured to generate a mapping of each common subject to the corresponding part of the analysis map.
The evaluation determination unit determines the subject to be the evaluation target item according to the appearance frequency, and the subject acquired by the evaluation target item acquisition unit is to be the evaluation target item regardless of the appearance frequency. It is configured in .

つまり、上記の分析用マップのうち、第一部分にマッピングされた項目は、分析対象と比較対象との両方がポジティブな評価であるため、分析対象の良い部分ではあっても、比較対象に対する関係では利点とはならない。これに対し、第二部分にマッピングされた項目は、分析対象における評価がポジティブであるものの、比較対象における評価がネガティブであるため、比較対象との関係における分析対象の強みとなっているといえる。また、第四部分にマッピングされた項目は、分析対象と比較対象との両方がネガティブな評価であるため、分析対象の良くない部分ではあっても、比較対象に対する関係では不利な点とはならない。これに対し、第三部分にマッピングされた項目は、分析対象における評価がネガティブであるのに、比較対象における評価がポジティブであるため、比較対象との関係で分析対象の弱みとなっているといえる。したがって、この構成によれば、複数の評価対象項目を上記の分析用マップにマッピングすることにより、各評価対象項目が、比較対象との関係で分析対象の強み又は弱みとなっているかを好適に判断することができる。また、単語の集計によりその後の分析を行い易くできる。さらに、分析者側が全ての評価対象項目を指定する場合、ユーザが評価しているものの分析者側が想定していない項目は分析結果から外れることになるが、これらの構成によれば、予め評価対象項目を定めることなく、テキストデータに含まれている主語を評価対象項目とすることができるので、ユーザが評価しているものの分析者側が想定していない項目も、確度高く分析結果に含めることができる。加えて、テキストデータの数が多いほど、そこに含まれる主語の種類は多くなるが、この構成によれば、出現頻度に応じて評価対象項目とする主語を決定するため、出現頻度の高いより重要度の高い主語に限り評価対象項目とすることが可能になる。また、分析者側が分析結果に含めたい項目について、確実に分析結果に含めることができる。 In other words, in the above analysis map, the items mapped to the first part have positive evaluations for both the analysis target and the comparison target, so even if they are good parts of the analysis target, they are related to the comparison target. It is not an advantage. On the other hand, the items mapped to the second part have a positive evaluation in the analysis target, but a negative evaluation in the comparison target, so it can be said that they are the strength of the analysis target in relation to the comparison target. .. In addition, the items mapped to the fourth part are negative evaluations for both the analysis target and the comparison target, so even if the analysis target is not good, it does not become a disadvantage in relation to the comparison target. .. On the other hand, the items mapped to the third part have a negative evaluation in the analysis target, but a positive evaluation in the comparison target, which is a weakness of the analysis target in relation to the comparison target. I can say. Therefore, according to this configuration, by mapping a plurality of evaluation target items to the above-mentioned analysis map, it is preferable whether each evaluation target item is a strength or weakness of the analysis target in relation to the comparison target. You can judge. In addition, it is possible to facilitate subsequent analysis by aggregating words. Furthermore, when the analyst specifies all the evaluation target items, the items evaluated by the user but not expected by the analyst will be excluded from the analysis results. Since the subject included in the text data can be used as the evaluation target item without defining the item, items evaluated by the user but not expected by the analyst can be included in the analysis result with high accuracy. can. In addition, as the number of text data increases, the types of subjects contained therein increase, but according to this configuration, the subject to be evaluated is determined according to the frequency of appearance, so that the frequency of appearance is higher than that of high frequency. Only the subject with high importance can be evaluated as an evaluation target item. In addition, items that the analyst wants to include in the analysis result can be surely included in the analysis result.

1つの態様として、前記評価対象項目取得部は、利用者から入力された主語を、前記評価判定部において前記評価対象項目とすべき主語として取得可能に構成されていると好適である。
この構成によれば、入力された主語については、出現頻度に関わらず、評価対象項目にできる。
1つの態様として、前記評価判定部は、各評価対象項目に対する評価を指標する評価値を算出し、算出した前記評価値に基づき当該評価対象項目がポジティブであるかネガティブであるかの判定を行うように構成されていると好適である。
As one aspect, it is preferable that the evaluation target item acquisition unit is configured so that the subject input from the user can be acquired as the subject to be the evaluation target item in the evaluation determination unit.
According to this configuration, the input subject can be evaluated as an evaluation target item regardless of the frequency of appearance.
As one embodiment, the evaluation determination unit calculates an evaluation value as an index of evaluation for each evaluation target item, and determines whether the evaluation target item is positive or negative based on the calculated evaluation value. It is preferable that it is configured as such.

この構成によれば、評価対象項目についての評価を数値化することにより、ポジティブであるかネガティブであるかを画一的に判断できる。 According to this configuration, by quantifying the evaluation of the evaluation target item, it is possible to uniformly judge whether it is positive or negative.

1つの態様として、前記マップ情報生成部は、前記評価値順に前記評価対象項目を並べてマッピングするように構成されていると好適である。 As one embodiment, it is preferable that the map information generation unit is configured to arrange and map the evaluation target items in the order of the evaluation values.

1つの態様として、前記第一~第四部分には、それぞれ前記評価値に応じた配置範囲が定められており、前記マップ情報生成部は、各評価対象項目を、当該評価対象項目の前記評価値に対応する前記配置範囲内に配置するように構成されていると好適である。 As one embodiment, the first to fourth parts each have an arrangement range corresponding to the evaluation value, and the map information generation unit evaluates each evaluation target item with the evaluation of the evaluation target item. It is preferable that it is configured to be arranged within the arrangement range corresponding to the value.

1つの態様として、前記マップ情報生成部は、前記評価値の大きさに応じて、マッピングする前記評価対象項目の表示形態を変更可能に構成されていると好適である。 As one aspect, it is preferable that the map information generation unit is configured so that the display form of the evaluation target item to be mapped can be changed according to the size of the evaluation value.

これらの構成によれば、評価対象項目の評価値に応じた表示がなされるので、どの評価対象項目が特に強み・弱みとなるかをわかりやすく判断できる。 According to these configurations, since the display is made according to the evaluation value of the evaluation target item, it is possible to easily determine which evaluation target item has a particular strength / weakness.

1つの態様として、各語には、これに関連する主語に対する評価を指標する数値が定められており、前記評価判定部は、前記評価対象項目とする主語に関連する語の集計結果に基づき、各語に対応する数値を用いて、当該主語に対する評価を指標する評価値を算出し、算出した前記評価値に基づき当該主語に対する評価がポジティブであるかネガティブであるかの判定を行うように構成されていると好適である。 As one aspect, a numerical value for indexing the evaluation of the subject related thereto is defined for each word, and the evaluation determination unit is based on the aggregation result of the words related to the subject to be the evaluation target item. An evaluation value that indicates the evaluation of the subject is calculated using the numerical value corresponding to each word, and it is determined whether the evaluation of the subject is positive or negative based on the calculated evaluation value. It is preferable that it is done.

この構成によれば、評価対象項目とする主語に対する評価を画一的に判断できる。そして、主語に関連する語として、ポジティブなものとネガティブなものとが混在する場合には、当該主語に対する評価がポジティブであるかネガティブであるかの判断が難しくなるが、各語に対応する数値から求められる評価値を用いるから、ポジティブかネガティブかの判断を容易に行える。 According to this configuration, it is possible to uniformly judge the evaluation of the subject as the evaluation target item. When positive and negative words are mixed as words related to the subject, it is difficult to judge whether the evaluation of the subject is positive or negative, but the numerical value corresponding to each word. Since the evaluation value obtained from is used, it is easy to judge whether it is positive or negative.

1つの態様として、前記マップ情報生成部は、前記分析用マップにマッピングされた主語とともに、当該主語に関連する語のうち代表的な語を併せて表示可能に構成されていると好適である。 As one embodiment, it is preferable that the map information generation unit is configured to be able to display a representative word among the words related to the subject together with the subject mapped to the analysis map.

1つの態様として、前記マップ情報生成部は、前記マップ情報として、前記分析用マップにマッピングされた主語とともに、当該主語に関連する語のうち代表的な語を併せて表示可能なものを生成するように構成されていると好適である。 As one embodiment, the map information generation unit generates the map information that can display a representative word among the words related to the subject together with the subject mapped to the analysis map. It is preferable that it is configured as such.

これらの構成によれば、評価対象項目に具体的にどういう評価がなされているかを知ることができる。 With these configurations, it is possible to know what kind of evaluation is specifically made for the evaluation target item.

本発明に係るテキスト分析方法は、
コンピュータに実行させる、多数のテキストデータを分析するためのテキスト分析方法であって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得工程と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定工程と、
前記評価判定工程での判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成工程と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、各テキストデータに出現する主語と当該主語に関連する語とを抽出して集計する単語集計工程と、
前記評価判定工程において前記評価対象項目とすべき主語を取得する評価対象項目取得工程と、を備え、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成工程では、前記マップ情報として、前記評価判定工程での判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定工程では、前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、前記単語集計工程において集計された主語の少なくとも一部を前記評価対象項目とし、前記評価対象項目とする主語ごとに、当該主語に関連する語の集計結果に基づき、当該主語に対する評価がポジティブであるかネガティブであるかを判定するように構成されており、
前記マップ情報生成工程では、前記マップ情報として、前記評価判定工程において判定の行われた主語のうち、前記分析対象テキストデータ群と前記比較対象テキストデータ群とで共通する主語をマッピング対象として、前記評価判定工程における判定結果に基づき、各共通する主語を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定工程では、前記評価対象項目とする主語を出現頻度に応じて決定し、かつ、前記評価対象項目取得工程において取得した主語については、出現頻度に関わらず、前記評価対象項目とするように構成されている
The text analysis method according to the present invention is
A text analysis method for analyzing a large amount of text data that is executed by a computer.
A text data group acquisition process for acquiring an analysis target text data group which is text data related to an analysis target and a comparison target text data group which is text data related to a comparison target.
Based on the acquired text data group to be analyzed and the text data group to be compared, the evaluation of each evaluation target item is positive or negative for the analysis target and the plurality of evaluation target items related to the comparison target. Evaluation judgment process to judge whether there is, and
A map information generation step of generating map information for displaying an analysis map based on the judgment result in the evaluation judgment step, and a map information generation step.
For each of the acquired text data group to be analyzed and the text data group to be compared, a word aggregation process of extracting and totaling a subject appearing in each text data and a word related to the subject, and a word aggregation process.
The evaluation target item acquisition step of acquiring the subject to be the evaluation target item in the evaluation determination step is provided.
The analysis map is
Of the plurality of evaluation target items, the first part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is positive, and
Of the plurality of evaluation target items, the second part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is negative, and
Of the plurality of evaluation target items, the third part that maps the evaluation target item in which the evaluation in the analysis target is negative and the evaluation in the comparison target is positive, and
Among the plurality of evaluation target items, those provided with at least one of a fourth part mapping the evaluation target items in which the evaluation in the analysis target is negative and the evaluation in the comparison target is negative. And
The map information generation step is configured to generate map information in which each evaluation target item is mapped to a corresponding portion of the analysis map based on the determination result in the evaluation determination step .
In the evaluation determination step, at least a part of the subject aggregated in the word aggregation step is set as the evaluation target item for each of the analysis target text data group and the comparison target text data group, and is used as the evaluation target item. For each subject, it is configured to judge whether the evaluation for the subject is positive or negative based on the aggregated result of the words related to the subject.
In the map information generation step, as the map information, among the subjects determined in the evaluation determination step, the subject common to the analysis target text data group and the comparison target text data group is set as a mapping target. Based on the judgment result in the evaluation judgment process, it is configured to generate a mapping of each common subject to the corresponding part of the analysis map.
In the evaluation determination step, the subject to be the evaluation target item is determined according to the appearance frequency, and the subject acquired in the evaluation target item acquisition step is to be the evaluation target item regardless of the appearance frequency. It is configured in .

本発明に係るテキスト分析プログラムは、
コンピュータに実行させる、多数のテキストデータを分析するためのテキスト分析プログラムであって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得機能と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定機能と、
前記評価判定機能による判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成機能と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、各テキストデータに出現する主語と当該主語に関連する語とを抽出して集計する単語集計機能と、
前記評価判定機能において前記評価対象項目とすべき主語を取得する評価対象項目取得機能と、を前記コンピュータに実行させ、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成機能では、前記マップ情報として、前記評価判定機能による判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定機能では、前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、前記単語集計機能において集計された主語の少なくとも一部を前記評価対象項目とし、前記評価対象項目とする主語ごとに、当該主語に関連する語の集計結果に基づき、当該主語に対する評価がポジティブであるかネガティブであるかを判定するように構成されており、
前記マップ情報生成機能では、前記マップ情報として、前記評価判定機能において判定の行われた主語のうち、前記分析対象テキストデータ群と前記比較対象テキストデータ群とで共通する主語をマッピング対象として、前記評価判定機能における判定結果に基づき、各共通する主語を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定機能では、前記評価対象項目とする主語を出現頻度に応じて決定し、かつ、前記評価対象項目取得機能において取得した主語については、出現頻度に関わらず、前記評価対象項目とするように構成されている
The text analysis program according to the present invention is
A text analysis program for analyzing a large amount of text data that is executed by a computer.
A text data group acquisition function for acquiring an analysis target text data group which is text data related to an analysis target and a comparison target text data group which is text data related to a comparison target.
Based on the acquired text data group to be analyzed and the text data group to be compared, the evaluation of each evaluation target item is positive or negative for the analysis target and the plurality of evaluation target items related to the comparison target. Evaluation judgment function to judge whether there is, and
A map information generation function that generates map information that displays an analysis map based on the judgment result of the evaluation judgment function, and a map information generation function.
A word aggregation function that extracts and aggregates the subject appearing in each text data and the words related to the subject for each of the acquired text data group to be analyzed and the text data group to be compared.
In the evaluation determination function, the computer is made to execute the evaluation target item acquisition function for acquiring the subject to be the evaluation target item .
The analysis map is
Of the plurality of evaluation target items, the first part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is positive, and
Of the plurality of evaluation target items, the second part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is negative, and
Of the plurality of evaluation target items, the third part that maps the evaluation target item in which the evaluation in the analysis target is negative and the evaluation in the comparison target is positive, and
Among the plurality of evaluation target items, those provided with at least one of a fourth part mapping the evaluation target items in which the evaluation in the analysis target is negative and the evaluation in the comparison target is negative. And
The map information generation function is configured to generate map information in which each evaluation target item is mapped to a corresponding portion of the analysis map based on the determination result by the evaluation determination function .
In the evaluation determination function, at least a part of the subject aggregated by the word aggregation function is set as the evaluation target item for each of the analysis target text data group and the comparison target text data group, and is used as the evaluation target item. For each subject, it is configured to judge whether the evaluation for the subject is positive or negative based on the aggregated result of the words related to the subject.
In the map information generation function, as the map information, among the subjects judged by the evaluation determination function, the subject common to the analysis target text data group and the comparison target text data group is set as a mapping target. Based on the judgment result in the evaluation judgment function, it is configured to generate a mapping of each common subject to the corresponding part of the analysis map.
In the evaluation determination function, the subject to be the evaluation target item is determined according to the appearance frequency, and the subject acquired by the evaluation target item acquisition function is to be the evaluation target item regardless of the appearance frequency. It is configured in .

これらの構成によれば、上記した本発明に係るテキスト分析装置によるマップ情報の生成を好適に実現できる。 According to these configurations, it is possible to suitably realize the generation of map information by the text analyzer according to the present invention described above.

本実施形態に係るテキスト分析システムの構成図Configuration diagram of the text analysis system according to this embodiment 単語集計部による集計結果の一例を示す図A diagram showing an example of the aggregation result by the word aggregation unit 分析用マップの一例を示す図Diagram showing an example of an analysis map 評価対象項目の表示形態の一例を示す図The figure which shows an example of the display form of the evaluation target item. 分析用マップの一例を示す図Diagram showing an example of an analysis map 他の分析用マップの一例を示す図Diagram showing an example of another map for analysis 他の分析用マップの一例を示す図Diagram showing an example of another map for analysis

本発明に係るテキスト分析装置、テキスト分析方法、及び、テキスト分析プログラムの実施形態について、図面を参照して説明する。以下では、本発明に係るテキスト分析装置を、利用者側の端末1からの要求に応じてテキスト分析(いわゆるテキストマイニング)を行うテキスト分析システムに組み込んだ例について説明する。図1は本実施形態に係るテキスト分析システムを示し、テキスト分析システムは、利用者側の端末1と、ネットワーク3を介して利用者側端末1と通信可能な処理サーバ(テキスト分析装置)2と、からなる。利用者側端末1には専用のアプリケーションが格納されており、利用者は、かかるアプリケーションを介して、いかなる分析を行うかについての指示と分析用のテキストデータを利用者側端末1から処理サーバ2に対して送信できるようになっている。そして、処理サーバ2は、利用者からの要求に応じて多数のテキストデータについてテキスト分析を行い、その結果を利用者側端末1に送信するようになっている。 An embodiment of a text analyzer, a text analysis method, and a text analysis program according to the present invention will be described with reference to the drawings. Hereinafter, an example in which the text analysis device according to the present invention is incorporated into a text analysis system that performs text analysis (so-called text mining) in response to a request from the terminal 1 on the user side will be described. FIG. 1 shows a text analysis system according to the present embodiment, and the text analysis system includes a terminal 1 on the user side and a processing server (text analysis device) 2 capable of communicating with the terminal 1 on the user side via a network 3. Consists of. A dedicated application is stored in the user-side terminal 1, and the user gives instructions on what kind of analysis to perform and text data for analysis from the user-side terminal 1 to the processing server 2 via the application. Can be sent to. Then, the processing server 2 performs text analysis on a large number of text data in response to a request from the user, and transmits the result to the user-side terminal 1.

また、処理サーバ2は、目的とするテキスト分析をコンピュータに実行させるための単一の又は複数からなるテキスト分析プログラムを図示しない記憶部に格納しており、図示しないCPU等の処理部により当該テキスト分析プログラムに従う処理が実行されることで、利用者からの指示に応じて順番にテキスト分析を実行可能になっている。具体的には、かかるテキスト分析プログラムに従う処理の実行により、利用者からのテキスト分析の要求(ジョブ)が連続してなされても順番に処理を行えるように、本実施形態に係る処理サーバ2は、図1に示すように、API部21と、ジョブ情報格納部22と、ファイル格納部23と、ジョブ制御部24と、ジョブ処理部25と、を備えたものとなっている。 Further, the processing server 2 stores a single or a plurality of text analysis programs for causing a computer to execute a target text analysis in a storage unit (not shown), and the text is stored in a processing unit such as a CPU (not shown). By executing the process according to the analysis program, it is possible to execute the text analysis in order according to the instruction from the user. Specifically, the processing server 2 according to the present embodiment can perform processing in order even if text analysis requests (jobs) from users are continuously made by executing processing according to the text analysis program. As shown in FIG. 1, the API unit 21, the job information storage unit 22, the file storage unit 23, the job control unit 24, and the job processing unit 25 are provided.

具体的に説明すると、API部21は、利用者側端末1からの要求を受け付けて処理し、利用者側端末1からの要求や受け付けた分析用のテキストデータをジョブ情報格納部22やファイル格納部23に送るようになっている。また、API部21は、ファイル格納部22に格納された分析結果を利用者側端末1に送信するようになっている。 Specifically, the API unit 21 receives and processes the request from the user-side terminal 1, and stores the request from the user-side terminal 1 and the received text data for analysis in the job information storage unit 22 and the file. It is designed to be sent to the department 23. Further, the API unit 21 transmits the analysis result stored in the file storage unit 22 to the user-side terminal 1.

ジョブ情報格納部22は、API部21から送られる利用者側端末1からの要求に基づきジョブ情報を生成して、生成したジョブ情報を格納するようになっている。具体的には、生成されたジョブ情報は、要求を受け付けた順番に格納されるようになっている。 The job information storage unit 22 generates job information based on the request from the user-side terminal 1 sent from the API unit 21, and stores the generated job information. Specifically, the generated job information is stored in the order in which the requests are received.

ファイル格納部23は、API部21から送られる利用者側端末1から送信される分析用のテキストデータを取得し格納するものである。また、ジョブ制御部24から送られる分析結果も格納するようになっている。 The file storage unit 23 acquires and stores text data for analysis transmitted from the user-side terminal 1 transmitted from the API unit 21. In addition, the analysis result sent from the job control unit 24 is also stored.

ジョブ制御部24は、ジョブ情報格納部22に格納されたジョブ情報の順番に従って、ジョブ処理部25に順次テキスト分析(ジョブ)を実行させるようになっている。また、ジョブ処理部25でのテキスト分析が終了すると、対応するジョブ情報をジョブ情報格納部22から消去するとともに、ジョブ処理部25からの分析結果をファイル格納部23に格納するようになっている。 The job control unit 24 causes the job processing unit 25 to sequentially execute text analysis (job) according to the order of the job information stored in the job information storage unit 22. Further, when the text analysis in the job processing unit 25 is completed, the corresponding job information is deleted from the job information storage unit 22, and the analysis result from the job processing unit 25 is stored in the file storage unit 23. ..

ジョブ処理部25については、詳しくは後述するが、ジョブ制御部24からの指示に応じて順次テキスト分析を行い、テキスト分析が終了すると分析結果をジョブ制御部24に返すようになっている。 The job processing unit 25 will be described in detail later, but the text analysis is sequentially performed according to the instruction from the job control unit 24, and when the text analysis is completed, the analysis result is returned to the job control unit 24.

このように、処理サーバ2は、API部21により利用者側端末1からの要求を受け付けて、ジョブ情報格納部22に順次ジョブ情報を格納し、格納したジョブ情報に基づきジョブ制御部24がジョブ処理部25に順次ジョブを処理させるようになっている。 In this way, the processing server 2 receives the request from the user-side terminal 1 by the API unit 21, sequentially stores the job information in the job information storage unit 22, and the job control unit 24 performs the job based on the stored job information. The processing unit 25 is configured to sequentially process jobs.

そして、特に、本実施形態のテキスト分析システムでは、分析対象に関連するテキストデータである分析対象テキストデータ群とともに、比較対象に関連するテキストデータである比較対象テキストデータ群も取得して両者についてのテキスト分析を行い、分析対象と比較対象との分析結果を、SWOT(Strengths(強み)、Weaknesses(弱み)、Opportunities(機会)、Threats(脅威))分析の考え方を利用して比較することで、分析対象の強みや弱みの判断を効果的に行えるようになっている。以下では、本実施形態のテキスト分析システムにおける、かかる分析を行うための構成について具体的に説明する。 In particular, in the text analysis system of the present embodiment, not only the analysis target text data group which is the text data related to the analysis target but also the comparison target text data group which is the text data related to the comparison target is acquired and the two are described. By performing a text analysis and comparing the analysis results of the analysis target and the comparison target using the concept of SWOT (Strengths (strengths), Weaknesses (weaknesses), Opportunities (opportunities), Threats (threats)) analysis, It is now possible to effectively judge the strengths and weaknesses of the analysis target. Hereinafter, the configuration for performing such analysis in the text analysis system of the present embodiment will be specifically described.

まず、本実施形態のテキスト分析システムにおいて、利用者側端末1では、専用のアプリケーションが、分析対象テキストデータ群とともに比較対象テキストデータ群の入力を求めるようになっている。そして、これに伴い、API部21は、利用者側端末1から、テキスト分析の要求とともに、分析対象テキストデータ群と比較対象テキストデータ群とを取得するようになっている(つまり、API部21はテキストデータ群取得部として機能する)。 First, in the text analysis system of the present embodiment, in the user-side terminal 1, a dedicated application requests input of a comparison target text data group together with an analysis target text data group. Along with this, the API unit 21 has come to acquire the analysis target text data group and the comparison target text data group from the user side terminal 1 together with the text analysis request (that is, the API unit 21). Functions as a text data group acquisition unit).

そして、ジョブ処理部25は、分析対象の強みや弱みの判断を行うべく、図1に示すように、単語集計部251と、評価判定部252と、マップ情報生成部253と、を備えている。 Then, the job processing unit 25 includes a word aggregation unit 251, an evaluation determination unit 252, and a map information generation unit 253, as shown in FIG. 1, in order to determine the strengths and weaknesses of the analysis target. ..

まず、単語集計部251は、取得された分析対象テキストデータ群と比較対象テキストデータ群とのそれぞれについて、各テキストデータに出現する主語と当該主語に関連する語とを抽出して集計するものである。具体的には、単語集計部251は、各テキストデータについて形態素解析を行い、テキストデータを単語ごとに区切る。次に、各単語について品詞分類を行ったうえで、各単語のうち、主語として名詞を抽出するとともに、述語として形容動詞、動詞、形容詞を抽出して、出現回数をカウントする。そして、これを各テキストデータ群の全テキストデータについて行って、主語及び述語の出現回数を集計して、テキストデータ群ごとに、例えば図2に示すような主語(名詞)及び述語(形容動詞、動詞、形容詞)を出現回数順に並べたリストを作成する。また、このリストとは別に、各主語について、当該主語に関連する語として、当該主語と同一の文又は当該主語の出現する文を含む一定範囲の文章(例えば主語の出現する文とその前後一文からなる文章など)に出現する述語(いわば共起語)を抽出して、全テキストデータにおける各共起語の出現回数を集計するようになっている。なお、集計を行う場合、単語は完全に一致していなくてもよく、近似する単語も同じ単語として集計するようにしてもよい。 First, the word aggregation unit 251 extracts and aggregates the subject appearing in each text data and the words related to the subject for each of the acquired text data group to be analyzed and the text data group to be compared. be. Specifically, the word aggregation unit 251 performs morphological analysis on each text data and divides the text data into words. Next, after classifying each word into part of speech, a noun is extracted as the subject of each word, and adjectives, verbs, and adjectives are extracted as predicates, and the number of occurrences is counted. Then, this is performed for all the text data of each text data group, the number of occurrences of the subject and the predicate is totaled, and the subject (noun) and the predicate (adjectival verb, as shown in FIG. 2, for example) are totaled for each text data group. Create a list of verbs and adjectives) arranged in order of the number of occurrences. In addition to this list, for each subject, as words related to the subject, a certain range of sentences including the same sentence as the subject or the sentence in which the subject appears (for example, the sentence in which the subject appears and one sentence before and after it). Predicates (so to speak, co-occurrence words) that appear in sentences consisting of) are extracted, and the number of occurrences of each co-occurrence word in all text data is totaled. In addition, when performing aggregation, the words do not have to be exactly the same, and similar words may be aggregated as the same word.

例えば、単語集計部251は、テキストデータ群に「値段が安い。」、「匂いが好き。」、「カロリーが高い。」といったテキストデータが含まれている場合、このうち「値段」、「匂い」、「カロリー」を主語(名詞)として抽出し、「安い」、「好き」、「高い」を述語(形容詞、形容動詞)として抽出し、各語に対応する出現回数に1を加算するようになっている。また、単語集計部251は、さらに、「値段」とともに現れる「安い」を「値段」の共起語として抽出し、「匂い」とともに現れる「好き」を「匂い」の共起語として抽出し、「カロリー」とともに現れる「高い」を「カロリー」の共起語として抽出し、それぞれその出現回数に1を加算するようになっている。 For example, when the word aggregation unit 251 includes text data such as "price is cheap", "smell is good", and "calorie is high" in the text data group, "price" and "smell" are included. , "Calorie" as the subject (noun), "cheap", "like", "high" as the predicate (adjective, adjective verb), and add 1 to the number of occurrences corresponding to each word. It has become. Further, the word aggregation unit 251 further extracts "cheap" that appears with "price" as a co-occurrence word of "price", and extracts "like" that appears with "smell" as a co-occurrence word of "smell". "High" that appears with "calorie" is extracted as a co-occurrence word of "calorie", and 1 is added to the number of appearances of each.

このように、単語集計部251では、各テキストデータ群について、
(1)対象のテキストデータについて形態素解析を行い、テキストデータを単語ごとに区切り、
(2)単語のうち、主語(名詞)及び述語(形容動詞、動詞、形容詞)を抽出して出現回数をカウントし、
(3)各主語について、同一の文又は一定範囲の文章に出現する共起語を抽出して出現回数をカウントする、
という(1)~(3)の工程の処理を、全テキストデータについて繰り返し行うようになっている。これにより、各テキストデータ群について、主語及び述語の出現回数や、各主語の共起語及びその出現回数を集計することができる。
In this way, in the word aggregation unit 251, for each text data group,
(1) Perform morphological analysis on the target text data, divide the text data into words, and divide the text data into words.
(2) From the words, the subject (noun) and predicate (adjectival verb, verb, adjective) are extracted and the number of occurrences is counted.
(3) For each subject, co-occurrence words that appear in the same sentence or a certain range of sentences are extracted and the number of occurrences is counted.
The processes of steps (1) to (3) are repeated for all text data. Thereby, for each text data group, the number of occurrences of the subject and the predicate, and the number of co-occurrence words of each subject and the number of appearances thereof can be totaled.

次に、評価判定部252は、分析対象及び比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定するものである。 Next, the evaluation determination unit 252 determines whether the evaluation for each evaluation target item is positive or negative for a plurality of evaluation target items related to the analysis target and the comparison target.

具体的には、評価判定部252は、まず、分析対象テキストデータ群と比較対象テキストデータ群とのそれぞれについて、単語集計部251により集計された主語の少なくとも一部を評価対象項目として決定するようになっている。そして、本実施形態では、評価判定部252は、評価対象項目とする主語を出現頻度に応じて決定するように構成されており、例えば、各テキストデータ群について、図2のリストに基づき、出現回数の多い主語(名詞)から順に、所定数(例えば20個)の主語を評価対象項目として決定する。 Specifically, the evaluation determination unit 252 first determines at least a part of the subject aggregated by the word aggregation unit 251 as the evaluation target item for each of the analysis target text data group and the comparison target text data group. It has become. Then, in the present embodiment, the evaluation determination unit 252 is configured to determine the subject as the evaluation target item according to the frequency of appearance. For example, each text data group appears based on the list in FIG. A predetermined number (for example, 20) of subjects are determined as evaluation target items in order from the subject (noun) having the highest number of times.

そして、評価判定部252は、評価対象項目とする主語ごとに、当該主語に関連する語の集計結果に基づき、当該主語に対する評価がポジティブであるかネガティブであるかを判定するように構成されている。具体的には、評価判定部252は、各評価対象項目に対する評価を指標する評価値を算出し、算出した評価値に基づき当該評価対象項目がポジティブであるかネガティブであるかの判定を行うように構成されている。特に、本実施形態では、各述語に、これに関連する主語に対する評価を指標する数値が定められており、評価判定部252は、評価対象項目とする主語に関連する語(即ち共起語)の集計結果に基づき、各共起語に対応する数値を用いて、当該主語に対する評価を指標する評価値を算出し、算出した評価値に基づき当該主語がポジティブであるかネガティブであるかの判定を行うように構成されている。 Then, the evaluation determination unit 252 is configured to determine whether the evaluation for the subject is positive or negative based on the aggregation result of the words related to the subject for each subject to be evaluated. There is. Specifically, the evaluation determination unit 252 calculates an evaluation value that indicates the evaluation of each evaluation target item, and determines whether the evaluation target item is positive or negative based on the calculated evaluation value. It is configured in. In particular, in the present embodiment, a numerical value for indexing the evaluation of the subject related thereto is defined for each predicate, and the evaluation determination unit 252 is a word (that is, a co-occurrence word) related to the subject to be evaluated. Based on the aggregated result of, the evaluation value that indicates the evaluation of the subject is calculated using the numerical value corresponding to each co-occurrence word, and it is judged whether the subject is positive or negative based on the calculated evaluation value. Is configured to do.

つまり、例えば“素晴らしい”“美味しい”といった語(述語)は、テキスト作成者が、これと関連する主語に対しポジティブな印象を持っている(又はその可能性が高い)ことを示すものであり、反対に、“悪い”“まずい”といった語(述語)は、テキスト作成者が、これと関連する主語に対しネガティブな印象を持っている(又はその可能性が高い)ことを示すものといえる。これに基づけば、各語について、その語がポジティブなものかネガティブなものか、またそのポジティブ/ネガティブの度合いはどの程度のものかといった所定の基準から、各述語について、これに関連する主語に対する評価を指標する数値を定めることができる(例えば感情極性値)。そして、ある主語についての共起語はその主語に関連して用いられている語といえ、その主語の評価を表すものといえる。そのため、ある主語についての共起語の集計結果を用い、ある主語についての全共起語の指標値を積算して当該主語に対する評価を指標する評価値を算出すれば、この評価値は、当該主語が全体的にポジティブに用いられている傾向にあるか、ネガティブに用いられている傾向にあるかを指標するものとなる。そして、例えば、単に評価値が所定の閾値を超えるか否かといった画一的な基準により、当該主語に対する評価がポジティブであるかネガティブであるかを判断できる。 So, for example, words (predicates) such as "great" and "delicious" indicate that the text writer has (or is likely to) have a positive impression of the subject associated with it. On the contrary, words (predicates) such as "bad" and "bad" can be said to indicate that the text writer has (or is likely to) have a negative impression of the subject associated with it. Based on this, for each predicate, for each predicate, for the subject associated with it, from certain criteria such as whether the word is positive or negative and what the degree of positive / negative is. A numerical value that indicates the evaluation can be determined (for example, an emotional polarity value). A co-occurrence word for a certain subject can be said to be a word used in relation to the subject, and can be said to represent the evaluation of the subject. Therefore, if the index values of all co-occurrence words for a certain subject are integrated and the evaluation value for indexing the evaluation for the subject is calculated using the aggregated result of the co-occurrence words for a certain subject, this evaluation value will be the relevant one. It is an indicator of whether the subject tends to be used positively or negatively as a whole. Then, for example, it is possible to determine whether the evaluation for the subject is positive or negative based on a uniform criterion such as whether or not the evaluation value exceeds a predetermined threshold value.

このような考えに基づき、評価判定部252では、各述語について、ポジティブなものは+の数値、ネガティブなものは-の数値とし、ポジティブ/ネガティブの度合いが高いと認められる語であるほど絶対値を大きくする、といった基準で指標値を定めてあり、演算対象とする主語についての共起語の集計結果から、当該主語についての全共起語の指標値を積算して当該主語の評価値Vを算出するように構成されている。例えば、ある主語についてn個の共起語が集計されており、各共起語の指標値がそれぞれa,a,…aであり、各共起語がそれぞれb,b,…b回出現しているとすると、その主語の評価値VはV=a×b+a×b+…+a×bで求めるようになっている。そして、このように求めた評価値Vが+である場合には、当該主語がポジティブに用いられている度合が高いということであり、当該主語に対する評価がポジティブであるといえる。これに対し、評価値Vが-である場合には、当該主語がネガティブに用いられている度合が高いということであり、当該主語に対する評価がネガティブであるといえる。つまり、評価判定部252では、このように評価値Vを求めることにより、評価値Vが+か-かから、当該主語に対する評価がポジティブであるかネガティブであるかを判断するようになっている。 Based on this idea, in the evaluation judgment unit 252, for each predicate, positive ones are positive numerical values and negative ones are negative numerical values, and the more positive / negative the word is recognized, the more absolute the value. The index value is set based on the criteria such as increasing the value, and the index values of all co-occurrence words for the subject are integrated from the aggregated results of the co-occurrence words for the subject to be calculated, and the evaluation value V of the subject is integrated. Is configured to calculate. For example, n co-occurrence words are aggregated for a certain subject, the index values of each co-occurrence word are a 1 , a 2 , ... an, and each co-occurrence word is b 1 , b 2 , respectively. If it appears b n times, the evaluation value V of the subject is obtained by V = a 1 × b 1 + a 2 × b 2 +… + an × b n . When the evaluation value V obtained in this way is +, it means that the subject is used positively, and it can be said that the evaluation for the subject is positive. On the other hand, when the evaluation value V is −, it means that the subject is used negatively, and it can be said that the evaluation for the subject is negative. That is, in the evaluation determination unit 252, by obtaining the evaluation value V in this way, it is determined whether the evaluation for the subject is positive or negative based on whether the evaluation value V is + or-. ..

そして、評価判定部252は、分析対象テキストデータ群と比較対象テキストデータ群とのそれぞれについて決定された評価対象項目ごとに、上記のように評価値Vを演算して、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定するようになっている。 Then, the evaluation determination unit 252 calculates the evaluation value V as described above for each evaluation target item determined for each of the analysis target text data group and the comparison target text data group, and evaluates each evaluation target item. Is designed to determine whether is positive or negative.

例えば、評価判定部252は、分析対象テキストデータ群において、単語集計部251により集計された主語の出現回数から、「匂い」という主語の出現回数が多い場合には、「匂い」を分析対象テキストデータ群における評価対象項目の一つとして決定する。そして、単語集計部251により集計された「匂い」の共起語の集計結果において、「好き」、「いい」、「さわやか」、「嫌い」、「悪い」の5つが「匂い」の共起語として集計されているとし、それぞれ評価値がx~xで出現回数がy1~y5であるとすると、評価判定部252は、評価対象項目「匂い」の評価値Vを、V=x×y+x×y+…+x×yにより算出する。そして、評価判定部252は、得られた評価値Vが+である場合には評価対象項目「匂い」に対する評価がポジティブであるとし、評価値Vが-である場合には評価対象項目「匂い」に対する評価がネガティブであると判定するようになっている。なお、上記の場合、「好き」・「いい」・「さわやか」はポジティブな語といえ、その評価値x~xは+の値となっているのに対し、「嫌い」・「悪い」はネガティブな語といえ、その評価値x,xは-の値となる。また、「好き」・「いい」・「さわやか」のうち、「さわやか」に比べ「好き」・「いい」はよりポジティブな表現といえ、「好き」・「いい」の評価値の絶対値は「さわやか」の評価値の絶対値に比べ、大きな値となっている。そして、「好き」・「いい」・「さわやか」の出現回数が多いような場合には、「匂い」の評価値Vは+の値となることになり、反対に、「嫌い」・「悪い」の出現回数が多いような場合には、「匂い」の評価値Vは-の値となるといえる。このように、共起語としてポジティブなものとネガティブなものとが混在する場合でも、各語に対応する数値を積算して求められる評価値を用いることで、ポジティブかネガティブかの判断を容易に行えるようになっているといえる。 For example, the evaluation determination unit 252 analyzes "smell" in the analysis target text data group when the number of appearances of the subject "smell" is large from the number of appearances of the subject aggregated by the word aggregation unit 251. Determined as one of the evaluation target items in the data group. Then, in the aggregation result of the co-occurrence words of "smell" aggregated by the word aggregation unit 251, five "like", "good", "refreshing", "dislike", and "bad" co-occurrence of "smell". Assuming that the words are aggregated and the evaluation values are x1 to x5 and the number of appearances is y1 to y5, the evaluation determination unit 252 sets the evaluation value V of the evaluation target item "smell" to V = x. Calculated by 1 x y 1 + x 2 x y 2 + ... + x 5 x y 5 . Then, the evaluation determination unit 252 considers that the evaluation for the evaluation target item "smell" is positive when the obtained evaluation value V is +, and when the evaluation value V is-, the evaluation target item "smell". Is determined to be negative. In the above case, "like", "good", and "refreshing" are positive words, and the evaluation values x1 to x3 are + values, while "dislike" and "bad". Is a negative word, and its evaluation values x4 and x5 are negative values. Of "like", "good", and "refreshing", "like" and "good" are more positive expressions than "refreshing", and the absolute value of the evaluation values of "like" and "good" is It is a large value compared to the absolute value of the evaluation value of "refreshing". When "like", "good", and "refreshing" appear frequently, the evaluation value V of "smell" becomes a + value, and conversely, "dislike" and "bad". When the number of appearances of "" is large, it can be said that the evaluation value V of "smell" is a negative value. In this way, even when positive and negative co-occurrence words are mixed, it is easy to judge whether it is positive or negative by using the evaluation value obtained by integrating the numerical values corresponding to each word. It can be said that it can be done.

このように、評価判定部252では、各テキストデータ群について、
(i)単語集計部251により集計された主語の出現回数についての集計結果を用いて、出現頻度に応じて評価対象項目とする主語を決定し、
(ii)単語集計部251により集計された各主語の共起語の出現回数についての集計結果を用いて、評価対象項目とする主語ごとに評価値Vを算出し、
(iii)算出した評価値Vに基づき、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判断する、
という(i)~(iii)の工程の処理を行うようになっている。これにより、評価判定部252により、取得された分析対象テキストデータ群と比較対象テキストデータ群とのそれぞれに基づき、分析対象及び比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかが判定されるようになっている。
In this way, in the evaluation determination unit 252, for each text data group,
(I) Using the aggregated results of the number of occurrences of the subject aggregated by the word aggregation unit 251, the subject to be evaluated is determined according to the frequency of appearance.
(Ii) Using the aggregation result of the number of occurrences of co-occurrence words of each subject aggregated by the word aggregation unit 251, the evaluation value V is calculated for each subject as the evaluation target item.
(Iii) Based on the calculated evaluation value V, it is determined whether the evaluation for each evaluation target item is positive or negative.
The processes (i) to (iii) are processed. As a result, based on each of the analysis target text data group and the comparison target text data group acquired by the evaluation determination unit 252, the evaluation for each evaluation target item is positive for the plurality of evaluation target items related to the analysis target and the comparison target. It is now determined whether it is negative or negative.

そして、マップ情報生成部253は、評価判定部252の判定結果に基づき分析用マップ4を表示するマップ情報を生成するようになっている。具体的には、マップ情報は、分析用マップ4上に、評価対象項目を判定結果に応じてマッピングしたものを表示するようになっている。そして、分析用マップ4は、分析対象についてのポジティブ/ネガティブ評価を横軸とするとともに比較対象についてのポジティブ/ネガティブ評価を縦軸とする二軸マップであり、二軸の交点の一方側(横軸では図中右側、縦軸では図中上側)では評価がポジティブであり、二軸の交点の他方側(横軸では図中左側、縦軸では図中下側)では評価がネガティブとなるようになっている。これにより、分析用マップ3は、図3に示すように、
・分析対象における評価がポジティブであり、且つ、比較対象における評価がポジティブである第一部分41
・分析対象における評価がポジティブであり、且つ、比較対象における評価がネガティブである第二部分42
・分析対象における評価がネガティブであり、且つ、比較対象における評価がポジティブである第三部分43
・分析対象における評価がネガティブであり、且つ、比較対象における評価がネガティブである第四部分44
を備えたものとなっている。なお、このうち、第一部分41がSWOT分析におけるStrengths(強み)に当たり、第二部分42がSWOT分析におけるWeaknesses(弱み)に当たり、第三部分43がSWOT分析におけるOpportunities(機会)に当たり、第四部分44がSWOT分析におけるThreats(脅威)に当たるものとなっている。
Then, the map information generation unit 253 is adapted to generate map information for displaying the analysis map 4 based on the determination result of the evaluation determination unit 252. Specifically, the map information is displayed on the analysis map 4 by mapping the evaluation target items according to the determination result. The analysis map 4 is a biaxial map having a positive / negative evaluation of the analysis target on the horizontal axis and a positive / negative evaluation of the comparison target on the vertical axis, and is one side (horizontal) of the intersection of the two axes. The evaluation is positive on the right side of the figure on the axis and the upper side of the figure on the vertical axis, and negative on the other side of the intersection of the two axes (the left side of the figure on the horizontal axis and the lower side of the figure on the vertical axis). It has become. As a result, the analysis map 3 becomes as shown in FIG.
-The first part 41 where the evaluation in the analysis target is positive and the evaluation in the comparison target is positive.
-The second part 42 where the evaluation in the analysis target is positive and the evaluation in the comparison target is negative.
-Third part 43 where the evaluation in the analysis target is negative and the evaluation in the comparison target is positive.
-Fourth part 44 where the evaluation in the analysis target is negative and the evaluation in the comparison target is negative.
It is equipped with. Of these, the first part 41 corresponds to Strengths (strengths) in SWOT analysis, the second part 42 corresponds to Weaknesses (weaknesses) in SWOT analysis, the third part 43 corresponds to Opportunities (opportunities) in SWOT analysis, and the fourth part 44. Is the Threats in SWOT analysis.

そして、マップ情報生成部253は、マップ情報として、評価判定部252により判定の行われた複数の評価対象項目(主語)のうち、分析対象テキストデータ群と比較対象テキストデータ群とで共通する評価対象項目(主語)をマッピング対象として、評価判定部252の判定結果に基づき、各共通する主語を分析用マップの対応する部分にマッピングしたものを生成するように構成されている。つまり、マップ情報生成部253は、複数の評価対象項目のうち、分析対象における評価がポジティブであり、且つ、比較対象における評価がポジティブである評価対象項目を第一部分41にマッピングし、分析対象における評価がポジティブであり、且つ、比較対象における評価がネガティブである評価対象項目を第二部分42にマッピングし、分析対象における評価がネガティブであり、且つ、比較対象における評価がポジティブである評価対象項目を第三部分43にマッピングし、分析対象における評価がネガティブであり、且つ、比較対象における評価がネガティブである評価対象項目を第四部分44にマッピングするようになっている。 Then, the map information generation unit 253 evaluates as map information common to the analysis target text data group and the comparison target text data group among the plurality of evaluation target items (subjects) determined by the evaluation determination unit 252. With the target item (subject) as the mapping target, it is configured to generate a mapping of each common subject to the corresponding part of the analysis map based on the determination result of the evaluation determination unit 252. That is, the map information generation unit 253 maps the evaluation target items having a positive evaluation in the analysis target and a positive evaluation in the comparison target to the first part 41 among the plurality of evaluation target items, and in the analysis target. The evaluation target item whose evaluation is positive and the evaluation in the comparison target is negative is mapped to the second part 42, and the evaluation target item in which the evaluation in the analysis target is negative and the evaluation in the comparison target is positive. Is mapped to the third part 43, and the evaluation target item in which the evaluation in the analysis target is negative and the evaluation in the comparison target is negative is mapped to the fourth part 44.

このような分析用マップ4に対してマッピングを行うことにより例えば次のことがわかる。まず、第一部分41にマッピングされた評価対象項目は、分析対象と比較対象との両方がポジティブな評価であるため、分析対象の強みではあっても、比較対象に対する関係では強みとまではならないと考えられる。これに対し、第二部分42にマッピングされた項目は、分析対象における評価がポジティブであるものの、比較対象における評価がネガティブであるため、比較対象との関係で分析対象の強みとなっているといえる。また、第四部分44にマッピングされた項目は、分析対象と比較対象との両方がネガティブな評価であるため、分析対象の良くない部分ではあっても、比較対象に対する関係では弱みとまではなっていない。これに対し、第三部分43にマッピングされた項目は、分析対象における評価がネガティブであるのに、比較対象における評価がポジティブであるため、比較対象との関係で分析対象の弱みとなっているといえる。 By mapping to such an analysis map 4, for example, the following can be found. First, the evaluation target items mapped to the first part 41 are positive evaluations for both the analysis target and the comparison target, so even if they are the strengths of the analysis target, they cannot be the strengths in relation to the comparison target. Conceivable. On the other hand, the items mapped to the second part 42 have a positive evaluation in the analysis target, but a negative evaluation in the comparison target, so that they are the strength of the analysis target in relation to the comparison target. I can say. In addition, the items mapped to the fourth part 44 are negative evaluations for both the analysis target and the comparison target, so even if they are not good parts of the analysis target, they are not weak in relation to the comparison target. Not. On the other hand, the item mapped to the third part 43 is a weakness of the analysis target in relation to the comparison target because the evaluation in the analysis target is negative but the evaluation in the comparison target is positive. It can be said that.

例えば、分析対象テキストデータ群と比較対象テキストデータ群とのそれぞれにおいて「値段」が評価対象項目となっており、それぞれでの評価がともにポジティブ又はネガティブである場合には、評価対象項目「値段」は第一部分41又は第四部分44にマッピングされる。そして、評価対象項目「値段」が第一部分41にマッピングされる場合には、両者の評価がポジティブであるので、分析対象において、「値段」は比較対象との関係で優位に立つ要素とまではなっていないといえる。また、評価対象項目「値段」が第四部分44にマッピングされる場合には、両者の評価がネガティブであるので、「値段」が分析対象にとって弱みとなっているような場合でも、比較対象との関係では後れを取っている要素とまではなっていないといえる。 For example, if "price" is an evaluation target item in each of the analysis target text data group and the comparison target text data group, and both evaluations are positive or negative, the evaluation target item "price" Is mapped to the first part 41 or the fourth part 44. When the evaluation target item "price" is mapped to the first part 41, both evaluations are positive. Therefore, in the analysis target, the "price" is an element that is superior in relation to the comparison target. It can be said that it has not become. In addition, when the evaluation target item "price" is mapped to the fourth part 44, both evaluations are negative, so even if "price" is a weak point for the analysis target, it is compared with the comparison target. It can be said that it is not an element that lags behind in the relationship of.

これに対し、例えば、分析対象テキストデータ群と比較対象テキストデータ群とのそれぞれにおいて「匂い」が評価対象項目となっており、それぞれでの評価が異なる(即ち一方での評価がポジティブで、他方での評価がネガティブ)場合には、評価対象項目「匂い」は第二部分42又は第三部分43にマッピングされる。そして、評価対象項目「匂い」が第二部分42にマッピングされる場合には、分析対象の評価がポジティブであるのに対し、比較対象における評価がネガティブであるため、分析対象において、「匂い」は比較対象との関係で優位に立つ要素になっているといえる。また、評価対象項目「匂い」が第三部分43にマッピングされる場合には、分析対象の評価がネガティブであるのに対し、比較対象における評価がポジティブであるため、分析対象において、「匂い」は比較対象との関係で後れを取っている要素になっているといえる。 On the other hand, for example, "smell" is an evaluation target item in each of the analysis target text data group and the comparison target text data group, and the evaluations in each are different (that is, one evaluation is positive and the other). If the evaluation in (1) is negative), the evaluation target item “smell” is mapped to the second part 42 or the third part 43. When the evaluation target item "smell" is mapped to the second part 42, the evaluation of the analysis target is positive, whereas the evaluation in the comparison target is negative, so that the "smell" in the analysis target. Can be said to be an element that has an advantage in relation to the comparison target. Further, when the evaluation target item "smell" is mapped to the third part 43, the evaluation of the analysis target is negative, whereas the evaluation in the comparison target is positive, so that the "smell" in the analysis target. Can be said to be an element that lags behind in relation to the comparison target.

このように、複数の評価対象項目を分析用マップ4にマッピングすることにより、各評価対象項目が消費者にポジティブに評価されているかネガティブに評価されているかだけでなく、ポジティブ又はネガティブと評価されている項目のうち、どの項目が比較対象との関係で分析対象の強み又は弱みとなっているかを判断することが可能となる。 By mapping a plurality of evaluation target items to the analysis map 4 in this way, not only whether each evaluation target item is evaluated positively or negatively by the consumer, but also it is evaluated as positive or negative. It is possible to determine which of the items is the strength or weakness of the analysis target in relation to the comparison target.

さらに、分析対象の強み又は弱みの判断を一層好適に行うべく、マップ情報生成部253は、さらに以下のような構成を採用している。 Further, in order to more preferably determine the strength or weakness of the analysis target, the map information generation unit 253 further adopts the following configuration.

まず、分析マップ4の各部分41~44には、それぞれ評価値に応じた配置範囲が定められており、マップ情報生成部253は、各評価対象項目を、当該評価対象項目の評価値に対応する配置範囲内に配置して、評価値順に評価対象項目を並べてマッピングするように構成されている。これにより、評価対象項目の配置から、各評価対象項目の評価値を具体的に把握できるようになっている。 First, each part 41 to 44 of the analysis map 4 has an arrangement range corresponding to the evaluation value, and the map information generation unit 253 corresponds to each evaluation target item according to the evaluation value of the evaluation target item. It is configured to arrange and map the evaluation target items in the order of evaluation values by arranging them within the arrangement range. As a result, the evaluation value of each evaluation target item can be concretely grasped from the arrangement of the evaluation target items.

特に、本実施形態では、分析マップ4は、各部分41~44について、分析対象における評価値に応じて横に3段階(例えば大中小とする)、及び、比較対象における評価値に応じて縦に3段階(例えば大中小とする)の3×3の9つに区分され、分析対象における評価値と比較対象における評価値とに応じた配置が設けられており、評価値順に評価対象項目が並べられてマッピングされるようになっている。より詳しくは、分析対象における評価値の絶対値が大きいほど、二軸の交点から左右方向に離れた配置(ポジティブな場合は絶対値が大きいほど図3中の右側の配置となり、ネガティブな場合は絶対値が大きいほど図3中の左側の配置)となり、比較対象における評価値の絶対値が大きいほど、二軸の交点から上下方向に離れた配置(ポジティブな場合は絶対値が大きいほど図3中の上側の配置となり、ネガティブな場合は絶対値が大きいほど図3中の下側の配置)となるようになっている。これにより、各部分41~44のうち、同じ部分に配置される評価対象項目の中で、分析対象の方が優位に立つのか、比較対象の方が優位に立つのかを把握できるようになっている。 In particular, in the present embodiment, the analysis map 4 has three horizontal stages (for example, large, medium and small) according to the evaluation value in the analysis target, and vertical according to the evaluation value in the comparison target for each part 41 to 44. It is divided into 9 stages of 3x3 in 3 stages (for example, large, medium and small), and arrangements are provided according to the evaluation value in the analysis target and the evaluation value in the comparison target, and the evaluation target items are arranged in the order of the evaluation value. It is designed to be arranged side by side and mapped. More specifically, the larger the absolute value of the evaluation value in the analysis target, the farther away from the intersection of the two axes in the left-right direction (the larger the absolute value, the more the arrangement on the right side in FIG. 3, and the negative case. The larger the absolute value, the more the arrangement on the left side in FIG. 3). The arrangement is on the upper side of the inside, and in the case of a negative value, the larger the absolute value, the lower the arrangement in FIG. 3). As a result, it becomes possible to grasp whether the analysis target has an advantage or the comparison target has an advantage among the evaluation target items arranged in the same part among the parts 41 to 44. There is.

これについて説明すると、例えば、分析対象及び比較対象の評価がいずれもポジティブである評価対象項目は第一部分41に配置されるが、そのうち、図3中で第一部分41の右下に配置された「主語11」は、分析対象の評価値が「大」で、比較対象の評価値が「小」である評価対象項目であり、同じポジティブの評価でも分析対象の方が優位に立つ評価対象項目であることがわかる。反対に、図3中で第一部分41の左上に配置された「主語5」は、分析対象の評価値が「小」で、比較対象の評価値が「大」である評価対象項目であり、同じポジティブの評価でも比較対象の方が優位に立つ評価対象項目であることがわかる。また、第四部分44に関していえば、例えば「主語18」と「主語24」とは分析対象及び比較対象の評価がいずれもネガティブであるものの、「主語18」は、分析対象の評価値が「中」で比較対象の評価値が「小」である評価対象項目であり、同じネガティブの評価でも比較対象の方が優位に立つ評価対象項目であることがわかる。反対に、「主語25」は、分析対象の評価値が「中」で、比較対象の評価値が「大」である評価対象項目であり、同じネガティブの評価でも分析対象の方が優位に立つ評価対象項目であることがわかる。つまり、二軸の交点を通る傾きが1の線を示す仮想線(分析対象の評価値をx、比較対象の評価値をyとしたときのy=xのグラフ)6を考えると(この仮想線6は、実際に表示されるようにしてもよい)、第一部分41のうち、仮想線6の上側に配置される評価対象項目は比較対象の方が優位に立つ評価対象項目であり、仮想線6の下側に配置される評価対象項目は分析対象の方が優位に立つ評価対象項目であることがわかる。一方、第四部分44のうち、仮想線6の上側に配置される評価対象項目は分析対象の方が優位に立つ評価対象項目であり、仮想線6の下側に配置される評価対象項目は比較対象の方が優位に立つ評価対象項目であることがわかる。このように、本実施形態によれば、評価対象項目の配置から、評価対象項目の中で、分析対象の方が優位に立つのか、比較対象の方が優位に立つのかを把握できるようになっている。 Explaining this, for example, the evaluation target items for which the evaluations of the analysis target and the comparison target are both positive are arranged in the first portion 41, and among them, the evaluation target items are arranged in the lower right of the first portion 41 in FIG. "Subject 11" is an evaluation target item in which the evaluation value of the analysis target is "large" and the evaluation value of the comparison target is "small". It turns out that there is. On the contrary, "subject 5" arranged in the upper left of the first part 41 in FIG. 3 is an evaluation target item in which the evaluation value of the analysis target is "small" and the evaluation value of the comparison target is "large". It can be seen that even with the same positive evaluation, the comparison target is an evaluation target item that is superior. Regarding the fourth part 44, for example, "subject 18" and "subject 24" have negative evaluations of both the analysis target and the comparison target, but the evaluation value of the analysis target of "subject 18" is ". It can be seen that the evaluation target item is "medium" and the evaluation value of the comparison target is "small", and the comparison target is superior to the evaluation target item even in the same negative evaluation. On the contrary, "subject 25" is an evaluation target item in which the evaluation value of the analysis target is "medium" and the evaluation value of the comparison target is "large", and the analysis target has an advantage even in the same negative evaluation. It can be seen that it is an evaluation target item. That is, consider 6 (a graph of y = x when the evaluation value of the analysis target is x and the evaluation value of the comparison target is y) 6 indicating a line having a slope of 1 passing through the intersection of the two axes (this virtual line). The line 6 may be actually displayed), of the first part 41, the evaluation target item arranged above the virtual line 6 is an evaluation target item in which the comparison target is superior, and is virtual. It can be seen that the evaluation target items arranged below the line 6 are the evaluation target items in which the analysis target has an advantage. On the other hand, among the fourth part 44, the evaluation target items arranged on the upper side of the virtual line 6 are the evaluation target items on which the analysis target has an advantage, and the evaluation target items arranged on the lower side of the virtual line 6 are. It can be seen that the comparison target is an evaluation target item that is superior. In this way, according to the present embodiment, it is possible to grasp whether the analysis target has an advantage or the comparison target has an advantage among the evaluation target items from the arrangement of the evaluation target items. ing.

なお、マップ情報生成部253は、2以上の評価対象項目を同じ配置にマッピングすべき場合には、一方を隣の位置にずらしてマッピングするようになっている。また、各部分41~44のいずれかに、10個以上の評価対象項目をマッピングすべき場合には、分析対象若しくは比較対象における出現回数、又は、双方の出現回数を合算した値の上位9個をマッピングするようになっている。 When two or more evaluation target items should be mapped to the same arrangement, the map information generation unit 253 shifts one of them to the adjacent position for mapping. When 10 or more evaluation target items should be mapped to any of the parts 41 to 44, the top 9 values of the number of appearances in the analysis target or the comparison target, or the total number of appearances of both. Is designed to be mapped.

次に、マップ情報生成部253は、評価値の大きさに応じて、マッピングする評価対象項目の表示形態を変更可能に構成されている。具体的には、本実施形態では、マップ情報生成部252は、分析対象の評価値や比較対象の評価値、又は両者を合算した値の大きさが大きいほど、評価対象項目を大きく表示するようになっている。なお、表示形態を変更する態様はこれに限らず、色を変更するなど適宜変更可能になっている。 Next, the map information generation unit 253 is configured to be able to change the display form of the evaluation target item to be mapped according to the size of the evaluation value. Specifically, in the present embodiment, the map information generation unit 252 displays the evaluation target item larger as the size of the evaluation value of the analysis target, the evaluation value of the comparison target, or the total value of both is larger. It has become. The mode for changing the display form is not limited to this, and it can be changed as appropriate, such as changing the color.

また、マップ情報生成部253は、図4に示すように、分析用マップ4にマッピングされた主語(評価対象項目)とともに、当該主語に関連する語(共起語)のうち代表的な語を併せて表示可能に構成されている(なお、図3では簡単のために省略してある)。具体的には、本実施形態では、一つの主語とともに、上側の部分51に分析対象テキストデータ群で集計された当該主語に対する共起語として代表的なもの(例えば出現回数の上位3つ)が表示され、下側の部分52に比較対象テキストデータ群で集計された当該主語に対する共起語として代表的なもの(例えば出現回数の上位3つ)が表示されるようになっている。 Further, as shown in FIG. 4, the map information generation unit 253 uses the subject (evaluation target item) mapped to the analysis map 4 and the representative words (co-occurrence words) related to the subject. It is also configured to be displayable (note that it is omitted in FIG. 3 for simplicity). Specifically, in the present embodiment, along with one subject, typical co-occurrence words for the subject aggregated in the analysis target text data group in the upper portion 51 (for example, the top three in the number of occurrences) are It is displayed, and typical co-occurrence words (for example, the top three in the number of occurrences) for the subject aggregated in the comparison target text data group are displayed in the lower portion 52.

さらに、マップ情報生成部253は、図5に示すように、マップ情報として、分析用マップ4上でいずれかの評価対象項目が指示されたとき、当該評価対象項目についてのテキストデータの一例を表示可能なものを生成するように構成されている。表示されるテキストデータとしては、評価対象項目の共起語のうち、出現回数として上位のものを含むテキストデータが挙げられ、分析対象及び比較対象のそれぞれについて表示するようにしてある。 Further, as shown in FIG. 5, the map information generation unit 253 displays an example of text data for the evaluation target item when any evaluation target item is instructed on the analysis map 4 as map information. It is configured to produce what is possible. As the displayed text data, among the co-occurrence words of the evaluation target item, the text data including the one with the higher number of occurrences is mentioned, and each of the analysis target and the comparison target is displayed.

また、マップ情報生成部253は、図3に示す分析用マップ4のみならず、利用者側端末1からの要求に応じて、図6に示すような、分析対象についての分析結果と比較対象についての分析結果とを左右に並べて表示する分析用マップ7も生成可能になっている。具体的には、分析用マップ7は、左側が分析対象の分析結果を示し、右側が比較対象の分析結果を示すようになっており、それぞれ上側に評価がポジティブな評価対象項目がマッピングされ、下側に評価がネガティブな評価対象項目がマッピングされるようになっている。また、分析用マップ7では、評価対象項目について共起語としてポジティブなものとネガティブなものとが混在する場合には、ポジティブな共起語のみについて指標値を積算して評価値を求めたものを上側にマッピングし、ネガティブな共起語のみについて指標値を積算して評価値を求めたものを下側にマッピングして、ポジティブな評価とネガティブな評価のそれぞれについてマッピングを行ってもよい。なお、分析マップ4と同様に、分析用マップ7上でいずれかの評価対象項目が指示されたとき、当該評価対象項目についてのテキストデータの一例を表示可能に構成されている。特に、同じ評価対象項目が上側(ポジティブ側)と下側(ネガティブ側)とにマッピングされている場合には、上側下側のいずれか一方の評価対象項目を指示することにより、ポジティブ側とネガティブ側との両方のテキストデータの一例が表示されるようになっている。 Further, the map information generation unit 253 not only the analysis map 4 shown in FIG. 3, but also the analysis result and the comparison target for the analysis target as shown in FIG. 6 in response to the request from the user side terminal 1. It is also possible to generate an analysis map 7 that displays the analysis results of the above side by side. Specifically, in the analysis map 7, the left side shows the analysis result of the analysis target, the right side shows the analysis result of the comparison target, and the evaluation target items having a positive evaluation are mapped on the upper side. Evaluation target items with negative evaluations are mapped to the lower side. Further, in the analysis map 7, when positive and negative co-occurrence words are mixed in the evaluation target item, the index values are integrated only for the positive co-occurrence words to obtain the evaluation value. May be mapped to the upper side, and the index value obtained by integrating the index values only for the negative co-occurrence words is mapped to the lower side, and mapping is performed for each of the positive evaluation and the negative evaluation. Similar to the analysis map 4, when any of the evaluation target items is instructed on the analysis map 7, an example of text data for the evaluation target item can be displayed. In particular, when the same evaluation target item is mapped to the upper side (positive side) and the lower side (negative side), the positive side and the negative side can be specified by specifying one of the upper and lower evaluation target items. An example of both text data with the side is displayed.

そして、このようにしてマップ情報生成部253で生成されたマップ情報は、ジョブ処理部25による分析結果として最終的に利用者側端末1へと送られ、利用者が上記の分析用マップ4,7を見ることができるようになる。このように、本実施形態によれば、比較対象との関係における分析対象の強み・弱みを好適に判断できる分析用マップ4が利用者に示されるため、分析対象の強みや弱みの判断を効果的に行える。 Then, the map information generated by the map information generation unit 253 in this way is finally sent to the user-side terminal 1 as an analysis result by the job processing unit 25, and the user can use the above-mentioned analysis map 4 and 4. You will be able to see 7. As described above, according to the present embodiment, the analysis map 4 capable of appropriately determining the strengths and weaknesses of the analysis target in relation to the comparison target is shown to the user, so that the determination of the strengths and weaknesses of the analysis target is effective. Can be done.

〔その他の実施形態〕
最後に、本発明に係るテキスト分析装置、テキスト分析方法、及び、テキスト分析プログラムのその他の実施形態について説明する。なお、以下のそれぞれの実施形態で開示される構成は、矛盾が生じない限り、他の実施形態で開示される構成と組み合わせて適用することも可能である。
[Other embodiments]
Finally, the text analyzer, the text analysis method, and other embodiments of the text analysis program according to the present invention will be described. The configurations disclosed in each of the following embodiments can be applied in combination with the configurations disclosed in other embodiments as long as there is no contradiction.

(1)上記の実施形態では、利用者端末1の側で収集した分析用のテキストデータを処理サーバ3側に送信する構成を例として説明した。しかし、本発明の実施形態はこれに限定されず、利用者端末1の側からの要求に応じて、処理サーバ3が、テキストデータ保存用のデータベースサーバなどの他装置から分析用のテキストデータを取得してもいいし、処理サーバ3が分析用のテキストデータを収集するようにしてもよい。 (1) In the above embodiment, a configuration in which the text data for analysis collected on the user terminal 1 side is transmitted to the processing server 3 side has been described as an example. However, the embodiment of the present invention is not limited to this, and the processing server 3 receives text data for analysis from another device such as a database server for storing text data in response to a request from the user terminal 1 side. It may be acquired, or the processing server 3 may collect text data for analysis.

(2)上記の実施形態では、評価判定部252は、単語集計部251により集計された主語のうち、出現回数の多い主語(名詞)から順に、所定数の主語を評価対象項目として決定する構成を例に説明した。しかし、本発明の実施形態はこれに限定されず、利用者側端末1の専用のアプリケーションでは、評価判定部252において評価対象項目とすべき主語を入力可能になっており、評価判定部252は、入力された主語については、出現頻度に関わらず、評価対象項目とするように構成してもよい(この場合、API部21が評価判定部252において評価対象項目とすべき主語を取得可能な評価対象項目取得部として機能する)。また、全ての評価対象項目をあらかじめ決めておき、テキスト分析では、収集されたテキストデータに基づいて、予め定めた各評価対象項目に対する評価を判定するようにしてもよい。 (2) In the above embodiment, the evaluation determination unit 252 determines a predetermined number of subjects as evaluation target items in order from the subject (noun) having the highest number of appearances among the subjects aggregated by the word aggregation unit 251. Was explained as an example. However, the embodiment of the present invention is not limited to this, and in the dedicated application of the user-side terminal 1, the evaluation determination unit 252 can input the subject to be the evaluation target item, and the evaluation determination unit 252 can input the subject. , The input subject may be configured to be an evaluation target item regardless of the frequency of appearance (in this case, the API unit 21 can acquire the subject to be the evaluation target item in the evaluation determination unit 252. Functions as an evaluation target item acquisition unit). Further, all the evaluation target items may be determined in advance, and in the text analysis, the evaluation for each predetermined evaluation target item may be determined based on the collected text data.

(3)上記の実施形態では、示した評価判定部252による各評価対象項目に対する評価の判定手法はあくまでも例示であり、その判定手法は適宜変更可能である。例えば、各述語について定める指標値は上記のものに限られず、ポジティブなものを+、ネガティブなものを-といった基準で分けなくてもよい。また、評価対象項目に対する評価を指標する評価値を算出するといった手法を用いなくてもよい。 (3) In the above embodiment, the evaluation determination method for each evaluation target item by the evaluation determination unit 252 shown is merely an example, and the determination method can be changed as appropriate. For example, the index value defined for each predicate is not limited to the above, and it is not necessary to divide the positive one into + and the negative one by-. In addition, it is not necessary to use a method of calculating an evaluation value as an index of evaluation for the evaluation target item.

(4)上記の実施形態では、マップ情報生成部253は、第一~第四部分41~44を有する分析用マップ4を用いた構成を例に説明した。しかし、本発明の実施形態はこれに限定されず、分析用マップ4は、第一~第四部分41~44の少なくともいずれか一つを有するものであればよい。 (4) In the above embodiment, the map information generation unit 253 has been described by taking as an example a configuration using the analysis map 4 having the first to fourth portions 41 to 44. However, the embodiment of the present invention is not limited to this, and the analysis map 4 may have at least one of the first to fourth portions 41 to 44.

(5)その他の構成に関しても、本明細書において開示された実施形態は全ての点で例示であって、本発明の範囲はそれらによって限定されることはないと理解されるべきである。当業者であれば、本発明の趣旨を逸脱しない範囲で、適宜改変が可能であることを容易に理解できるであろう。従って、本発明の趣旨を逸脱しない範囲で改変された別の実施形態も、当然、本発明の範囲に含まれる。 (5) It should be understood that with respect to other configurations, the embodiments disclosed herein are exemplary in all respects and the scope of the invention is not limited thereto. Those skilled in the art will be able to easily understand that modifications can be made as appropriate without departing from the spirit of the present invention. Therefore, another embodiment modified without departing from the spirit of the present invention is naturally included in the scope of the present invention.

本発明は、テキスト分析に利用することができる。 The present invention can be used for text analysis.

2 処理サーバ(テキスト分析装置)
21 API部(テキストデータ群取得部)
251 単語集計部
252 評価判定部
253 マップ情報生成部
4 分析用マップ
41 第一部分
42 第二部分
43 第三部分
44 第四部分
2 Processing server (text analyzer)
21 API part (text data group acquisition part)
251 Word tabulation unit 252 Evaluation judgment unit 253 Map information generation unit 4 Analysis map 41 First part 42 Second part 43 Third part 44 Fourth part

Claims (11)

多数のテキストデータを分析するためのテキスト分析装置であって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得部と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定部と、
前記評価判定部の判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成部と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、各テキストデータに出現する主語と当該主語に関連する語とを抽出して集計する単語集計部と、
前記評価判定部において前記評価対象項目とすべき主語を取得可能な評価対象項目取得部と、を備え、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成部は、前記マップ情報として、前記評価判定部の判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定部は、前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、前記単語集計部により集計された主語の少なくとも一部を前記評価対象項目とし、前記評価対象項目とする主語ごとに、当該主語に関連する語の集計結果に基づき、当該主語に対する評価がポジティブであるかネガティブであるかを判定するように構成されており、
前記マップ情報生成部は、前記マップ情報として、前記評価判定部により判定の行われた主語のうち、前記分析対象テキストデータ群と前記比較対象テキストデータ群とで共通する主語をマッピング対象として、前記評価判定部の判定結果に基づき、各共通する主語を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定部は、前記評価対象項目とする主語を出現頻度に応じて決定し、かつ、前記評価対象項目取得部が取得した主語については、出現頻度に関わらず、前記評価対象項目とするように構成されているテキスト分析装置。
A text analyzer for analyzing a large amount of text data.
The text data group acquisition unit for acquiring the analysis target text data group which is the text data related to the analysis target and the comparison target text data group which is the text data related to the comparison target.
Based on the acquired text data group to be analyzed and the text data group to be compared, the evaluation of each evaluation target item is positive or negative for the analysis target and the plurality of evaluation target items related to the comparison target. An evaluation judgment unit that determines whether or not there is
A map information generation unit that generates map information for displaying an analysis map based on the judgment result of the evaluation determination unit, and a map information generation unit.
For each of the acquired text data group to be analyzed and the text data group to be compared, a word aggregation unit that extracts and aggregates the subject appearing in each text data and the word related to the subject, and the word aggregation unit.
The evaluation determination unit includes an evaluation target item acquisition unit capable of acquiring the subject to be the evaluation target item .
The analysis map is
Of the plurality of evaluation target items, the first part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is positive, and
Of the plurality of evaluation target items, the second part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is negative, and
Of the plurality of evaluation target items, the third part that maps the evaluation target item in which the evaluation in the analysis target is negative and the evaluation in the comparison target is positive, and
Among the plurality of evaluation target items, those provided with at least one of a fourth part mapping the evaluation target items in which the evaluation in the analysis target is negative and the evaluation in the comparison target is negative. And
The map information generation unit is configured to generate map information in which each evaluation target item is mapped to a corresponding portion of the analysis map based on the determination result of the evaluation determination unit .
For each of the analysis target text data group and the comparison target text data group, the evaluation determination unit sets at least a part of the subject aggregated by the word aggregation unit as the evaluation target item and sets it as the evaluation target item. For each subject, it is configured to judge whether the evaluation for the subject is positive or negative based on the aggregated result of the words related to the subject.
The map information generation unit sets the subject as the map information, which is common between the analysis target text data group and the comparison target text data group, among the subjects determined by the evaluation determination unit, as the mapping target. Based on the judgment result of the evaluation judgment unit, it is configured to generate a mapping of each common subject to the corresponding part of the analysis map.
The evaluation determination unit determines the subject to be the evaluation target item according to the frequency of appearance, and the subject acquired by the evaluation target item acquisition unit is to be the evaluation target item regardless of the frequency of appearance. A text analyzer configured in .
前記評価対象項目取得部は、利用者から入力された主語を、前記評価判定部において前記評価対象項目とすべき主語として取得可能に構成されている請求項1に記載のテキスト分析装置。The text analyzer according to claim 1, wherein the evaluation target item acquisition unit is configured to be able to acquire a subject input from a user as a subject to be the evaluation target item in the evaluation determination unit. 前記評価判定部は、各評価対象項目に対する評価を指標する評価値を算出し、算出した前記評価値に基づき当該評価対象項目がポジティブであるかネガティブであるかの判定を行うように構成されている請求項1または2に記載のテキスト分析装置。 The evaluation determination unit is configured to calculate an evaluation value that indicates an evaluation for each evaluation target item, and to determine whether the evaluation target item is positive or negative based on the calculated evaluation value. The text analyzer according to claim 1 or 2 . 前記マップ情報生成部は、前記評価値順に前記評価対象項目を並べてマッピングするように構成されている請求項に記載のテキスト分析装置。 The text analyzer according to claim 3 , wherein the map information generation unit is configured to arrange and map the evaluation target items in the order of the evaluation values. 前記第一~第四部分には、それぞれ前記評価値に応じた配置範囲が定められており、
前記マップ情報生成部は、各評価対象項目を、当該評価対象項目の前記評価値に対応する前記配置範囲内に配置するように構成されている請求項3又は4に記載のテキスト分析装置。
In each of the first to fourth parts, an arrangement range corresponding to the evaluation value is defined.
The text analyzer according to claim 3 or 4 , wherein the map information generation unit is configured to arrange each evaluation target item within the arrangement range corresponding to the evaluation value of the evaluation target item.
前記マップ情報生成部は、前記評価値の大きさに応じて、マッピングする前記評価対象項目の表示形態を変更可能に構成されている請求項3~5のいずれか一項に記載のテキスト分析装置。 The text analyzer according to any one of claims 3 to 5 , wherein the map information generation unit is configured to be able to change the display form of the evaluation target item to be mapped according to the size of the evaluation value. .. 各語には、これに関連する主語に対する評価を指標する数値が定められており、
前記評価判定部は、前記評価対象項目とする主語に関連する語の集計結果に基づき、各語に対応する数値を用いて、当該主語に対する評価を指標する評価値を算出し、算出した前記評価値に基づき当該主語に対する評価がポジティブであるかネガティブであるかの判定を行うように構成されている請求項1~6のいずれか一項に記載のテキスト分析装置。
Each word has a numerical value that indicates the evaluation of the subject related to it.
The evaluation determination unit calculates an evaluation value as an index of evaluation for the subject by using the numerical value corresponding to each word based on the aggregated result of the words related to the subject as the evaluation target item, and the calculated evaluation. The text analyzer according to any one of claims 1 to 6 , which is configured to determine whether the evaluation of the subject is positive or negative based on the value.
前記マップ情報生成部は、前記マップ情報として、前記分析用マップにマッピングされた主語とともに、当該主語に関連する語のうち代表的な語を併せて表示可能なものを生成するように構成されている請求項1~7のいずれか一項に記載のテキスト分析装置。 The map information generation unit is configured to generate map information that can display a representative word among words related to the subject together with a subject mapped to the analysis map. The text analyzer according to any one of claims 1 to 7 . 前記マップ情報生成部は、前記分析用マップ上でいずれかの前記評価対象項目が指示されたとき、当該評価対象項目についてのテキストデータの一例を表示可能に構成されている請求項1~8のいずれか一項に記載のテキスト分析装置。 The map information generation unit is configured to display an example of text data for the evaluation target item when any of the evaluation target items is instructed on the analysis map . The text analyzer according to any one of the items . コンピュータに実行させる、多数のテキストデータを分析するためのテキスト分析方法であって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得工程と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定工程と、
前記評価判定工程での判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成工程と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、各テキストデータに出現する主語と当該主語に関連する語とを抽出して集計する単語集計工程と、
前記評価判定工程において前記評価対象項目とすべき主語を取得する評価対象項目取得工程と、を備え、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成工程では、前記マップ情報として、前記評価判定工程での判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定工程では、前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、前記単語集計工程において集計された主語の少なくとも一部を前記評価対象項目とし、前記評価対象項目とする主語ごとに、当該主語に関連する語の集計結果に基づき、当該主語に対する評価がポジティブであるかネガティブであるかを判定するように構成されており、
前記マップ情報生成工程では、前記マップ情報として、前記評価判定工程において判定の行われた主語のうち、前記分析対象テキストデータ群と前記比較対象テキストデータ群とで共通する主語をマッピング対象として、前記評価判定工程における判定結果に基づき、各共通する主語を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定工程では、前記評価対象項目とする主語を出現頻度に応じて決定し、かつ、前記評価対象項目取得工程において取得した主語については、出現頻度に関わらず、前記評価対象項目とするように構成されているテキスト分析方法。
A text analysis method for analyzing a large amount of text data that is executed by a computer.
A text data group acquisition process for acquiring an analysis target text data group which is text data related to an analysis target and a comparison target text data group which is text data related to a comparison target.
Based on the acquired text data group to be analyzed and the text data group to be compared, the evaluation of each evaluation target item is positive or negative for the analysis target and the plurality of evaluation target items related to the comparison target. Evaluation judgment process to judge whether there is, and
A map information generation step of generating map information for displaying an analysis map based on the judgment result in the evaluation judgment step, and a map information generation step.
For each of the acquired text data group to be analyzed and the text data group to be compared, a word aggregation process of extracting and totaling a subject appearing in each text data and a word related to the subject, and a word aggregation process.
The evaluation target item acquisition step of acquiring the subject to be the evaluation target item in the evaluation determination step is provided.
The analysis map is
Of the plurality of evaluation target items, the first part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is positive, and
Of the plurality of evaluation target items, the second part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is negative, and
Of the plurality of evaluation target items, the third part that maps the evaluation target item in which the evaluation in the analysis target is negative and the evaluation in the comparison target is positive, and
Among the plurality of evaluation target items, those provided with at least one of a fourth part mapping the evaluation target items in which the evaluation in the analysis target is negative and the evaluation in the comparison target is negative. And
The map information generation step is configured to generate map information in which each evaluation target item is mapped to a corresponding portion of the analysis map based on the determination result in the evaluation determination step .
In the evaluation determination step, at least a part of the subject aggregated in the word aggregation step is set as the evaluation target item for each of the analysis target text data group and the comparison target text data group, and is used as the evaluation target item. For each subject, it is configured to judge whether the evaluation for the subject is positive or negative based on the aggregated result of the words related to the subject.
In the map information generation step, as the map information, among the subjects determined in the evaluation determination step, the subject common to the analysis target text data group and the comparison target text data group is set as a mapping target. Based on the judgment result in the evaluation judgment process, it is configured to generate a mapping of each common subject to the corresponding part of the analysis map.
In the evaluation determination step, the subject to be the evaluation target item is determined according to the appearance frequency, and the subject acquired in the evaluation target item acquisition step is to be the evaluation target item regardless of the appearance frequency. A text analysis method that consists of .
コンピュータに実行させる、多数のテキストデータを分析するためのテキスト分析プログラムであって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得機能と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定機能と、
前記評価判定機能による判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成機能と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、各テキストデータに出現する主語と当該主語に関連する語とを抽出して集計する単語集計機能と、
前記評価判定機能において前記評価対象項目とすべき主語を取得する評価対象項目取得機能と、を前記コンピュータに実行させ、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成機能では、前記マップ情報として、前記評価判定機能による判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定機能では、前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、前記単語集計機能において集計された主語の少なくとも一部を前記評価対象項目とし、前記評価対象項目とする主語ごとに、当該主語に関連する語の集計結果に基づき、当該主語に対する評価がポジティブであるかネガティブであるかを判定するように構成されており、
前記マップ情報生成機能では、前記マップ情報として、前記評価判定機能において判定の行われた主語のうち、前記分析対象テキストデータ群と前記比較対象テキストデータ群とで共通する主語をマッピング対象として、前記評価判定機能における判定結果に基づき、各共通する主語を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されており、
前記評価判定機能では、前記評価対象項目とする主語を出現頻度に応じて決定し、かつ、前記評価対象項目取得機能において取得した主語については、出現頻度に関わらず、前記評価対象項目とするように構成されているテキスト分析プログラム。
A text analysis program for analyzing a large amount of text data that is executed by a computer.
A text data group acquisition function for acquiring an analysis target text data group which is text data related to an analysis target and a comparison target text data group which is text data related to a comparison target.
Based on the acquired text data group to be analyzed and the text data group to be compared, the evaluation of each evaluation target item is positive or negative for the analysis target and the plurality of evaluation target items related to the comparison target. Evaluation judgment function to judge whether there is, and
A map information generation function that generates map information that displays an analysis map based on the judgment result of the evaluation judgment function, and a map information generation function.
A word aggregation function that extracts and aggregates the subject appearing in each text data and the words related to the subject for each of the acquired text data group to be analyzed and the text data group to be compared.
In the evaluation determination function, the computer is made to execute the evaluation target item acquisition function for acquiring the subject to be the evaluation target item .
The analysis map is
Of the plurality of evaluation target items, the first part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is positive, and
Of the plurality of evaluation target items, the second part that maps the evaluation target item in which the evaluation in the analysis target is positive and the evaluation in the comparison target is negative, and
Of the plurality of evaluation target items, the third part that maps the evaluation target item in which the evaluation in the analysis target is negative and the evaluation in the comparison target is positive, and
Among the plurality of evaluation target items, those provided with at least one of a fourth part mapping the evaluation target items in which the evaluation in the analysis target is negative and the evaluation in the comparison target is negative. And
The map information generation function is configured to generate map information in which each evaluation target item is mapped to a corresponding portion of the analysis map based on the determination result by the evaluation determination function .
In the evaluation determination function, at least a part of the subject aggregated by the word aggregation function is set as the evaluation target item for each of the analysis target text data group and the comparison target text data group, and is used as the evaluation target item. For each subject, it is configured to judge whether the evaluation for the subject is positive or negative based on the aggregated result of the words related to the subject.
In the map information generation function, as the map information, among the subjects judged by the evaluation determination function, the subject common to the analysis target text data group and the comparison target text data group is set as a mapping target. Based on the judgment result in the evaluation judgment function, it is configured to generate a mapping of each common subject to the corresponding part of the analysis map.
In the evaluation determination function, the subject to be the evaluation target item is determined according to the appearance frequency, and the subject acquired by the evaluation target item acquisition function is to be the evaluation target item regardless of the appearance frequency. A text analysis program configured in .
JP2017242916A 2017-12-19 2017-12-19 Text analyzer, text analysis method, and text analysis program Active JP6999400B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017242916A JP6999400B2 (en) 2017-12-19 2017-12-19 Text analyzer, text analysis method, and text analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017242916A JP6999400B2 (en) 2017-12-19 2017-12-19 Text analyzer, text analysis method, and text analysis program

Publications (2)

Publication Number Publication Date
JP2019109757A JP2019109757A (en) 2019-07-04
JP6999400B2 true JP6999400B2 (en) 2022-01-18

Family

ID=67179911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017242916A Active JP6999400B2 (en) 2017-12-19 2017-12-19 Text analyzer, text analysis method, and text analysis program

Country Status (1)

Country Link
JP (1) JP6999400B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240070398A1 (en) * 2022-08-30 2024-02-29 Rakuten Group, Inc. Sentiment analysis system, sentiment analysis method, and information storage medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339419A (en) 2004-05-31 2005-12-08 Nomura Research Institute Ltd Web page evaluation system and Web page evaluation method
JP2010079657A (en) 2008-09-26 2010-04-08 Nec Biglobe Ltd Information processor, information processing method, and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070088743A1 (en) * 2003-09-19 2007-04-19 Toshiba Solutions Corporation Information processing device and information processing method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339419A (en) 2004-05-31 2005-12-08 Nomura Research Institute Ltd Web page evaluation system and Web page evaluation method
JP2010079657A (en) 2008-09-26 2010-04-08 Nec Biglobe Ltd Information processor, information processing method, and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
市村 由美、外3名,テキストマイニング-事例紹介,人工知能学会誌,日本,(社)人工知能学会,2001年03月01日,第16巻,第2号,p.192-200

Also Published As

Publication number Publication date
JP2019109757A (en) 2019-07-04

Similar Documents

Publication Publication Date Title
Cegan et al. Trends and applications of multi-criteria decision analysis in environmental sciences: literature review
US9342592B2 (en) Method for systematic mass normalization of titles
US20060200341A1 (en) Method and apparatus for processing sentiment-bearing text
US20170052984A1 (en) Methods and systems for optimizing data in large data sets using relevant metadata
US20140172415A1 (en) Apparatus, system, and method of providing sentiment analysis result based on text
US20110246921A1 (en) Visualizing sentiment of online content
US20120311140A1 (en) Method of processing web access information and server implementing same
US20080320037A1 (en) System, method and apparatus for tagging and processing multimedia content with the physical/emotional states of authors and users
KR102126911B1 (en) Key player detection method in social media using KeyplayerRank
Madsen Between technical features and analytic capabilities: Charting a relational affordance space for digital social analytics
KR101955244B1 (en) Method of evaluating paper and method of recommending expert
CN114238668B (en) Industry information display method, system, computer equipment and storage medium
JP2016218512A (en) Information processing device and information processing program
WO2016114790A1 (en) Reading difficulty level based resource recommendation
JP2009116457A (en) Method and device for analyzing internet site information
Jeaco Key words when text forms the unit of study: Sizing up the effects of different measures
Ntoa et al. UXAmI observer: an automated user experience evaluation tool for ambient intelligence environments
KR20160103470A (en) System and method for providing response informations of prior users on goods through network
CN112148749B (en) Data analysis method, computing device and storage medium
US10289658B1 (en) Web page design scanner
JP6999400B2 (en) Text analyzer, text analysis method, and text analysis program
US20140039876A1 (en) Extracting related concepts from a content stream using temporal distribution
CN115470251A (en) Big data analysis display device
CN113157871B (en) News and public opinion text processing method, server and medium using artificial intelligence
Guallar et al. Curation Analysis System (CAS): A method for analysing digital media content curation

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20181030

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200325

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211222

R150 Certificate of patent or registration of utility model

Ref document number: 6999400

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250