[go: up one dir, main page]

JP6730225B2 - Program, analysis apparatus and method for extracting factors affecting results - Google Patents

Program, analysis apparatus and method for extracting factors affecting results Download PDF

Info

Publication number
JP6730225B2
JP6730225B2 JP2017119280A JP2017119280A JP6730225B2 JP 6730225 B2 JP6730225 B2 JP 6730225B2 JP 2017119280 A JP2017119280 A JP 2017119280A JP 2017119280 A JP2017119280 A JP 2017119280A JP 6730225 B2 JP6730225 B2 JP 6730225B2
Authority
JP
Japan
Prior art keywords
factor
value
result
transformation
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017119280A
Other languages
Japanese (ja)
Other versions
JP2019003525A (en
Inventor
亮博 小林
亮博 小林
啓一郎 帆足
啓一郎 帆足
尚樹 今井
尚樹 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2017119280A priority Critical patent/JP6730225B2/en
Publication of JP2019003525A publication Critical patent/JP2019003525A/en
Application granted granted Critical
Publication of JP6730225B2 publication Critical patent/JP6730225B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ビッグデータから、結果に影響を与える要因を抽出する要因分析の技術に関する。 The present invention relates to a factor analysis technique for extracting a factor that influences a result from big data.

従来、満足度のようなユーザ評価に基づいて、サービスにおける改善要因を抽出する技術がある(例えば特許文献1参照)。この技術によれば、複数の要因の中で、ユーザ毎に異なる満足度に対する影響力を算出し、改善要因を優先度順に抽出することができる。具体的には、サービス提供者の所望するユーザの購買行動(結果)を得るための主要因を、推定することができる。 Conventionally, there is a technique of extracting an improvement factor in a service based on user evaluation such as satisfaction (see, for example, Patent Document 1). According to this technique, among a plurality of factors, it is possible to calculate the influence on the satisfaction level that differs for each user, and extract the improvement factors in order of priority. Specifically, the main factors for obtaining the purchasing behavior (result) of the user desired by the service provider can be estimated.

図1は、従来技術における要因分析の説明図である。 FIG. 1 is an explanatory diagram of factor analysis in the conventional technique.

図1によれば、ビッグデータとして、ユーザ毎に、当該サービスの各要因要素に対する満足度を記述したアンケートと、結果要素としてのそのユーザの購買行動とを予め収集する。そして、それら大量の要因要素及び結果要素を分析することによって、その結果要素に影響を与える要因要素を分析することができる。
尚、アンケートとして、ユーザに記述されたテキストを収集した場合、複数のカテゴリにクラスタリングし(例えば特許文献2参照)、各クラスタを要因要素とすることもできる。
According to FIG. 1, as big data, a questionnaire describing satisfaction with respect to each factor element of the service for each user, and the purchase behavior of the user as a result element are collected in advance. Then, by analyzing the large number of factor elements and result elements, the factor elements that influence the result elements can be analyzed.
In the case where the texts described by the user are collected as the questionnaire, the texts may be clustered into a plurality of categories (see Patent Document 2, for example) and each cluster may be used as a factor element.

特許5948292号公報Japanese Patent No. 5948292 特開2017−027495号公報JP, 2017-027495, A

しかしながら、推定された要因要素が、サービス提供者側で変容可能なものでなければ、結果要素に影響を与えることはできない。即ち、要因分析の結果を何ら生かすことはできない。
例えば通信サービスについて、要因要素「端末品質」を高めることによって、結果要素「契約解除」を減らすことができると分析したとする。しかしながら、サービス提供者としては、ユーザ所持の端末品質を容易に高めることはできない。そのように考えると、単に、結果要素に影響を与える要因要素を抽出することは、何ら解決策を提案することにはならない。
However, unless the estimated factor element can be changed on the service provider side, the result element cannot be influenced. That is, the result of factor analysis cannot be utilized at all.
For example, suppose that it is possible to reduce the result element "contract cancellation" by increasing the factor element "terminal quality" for communication services. However, the service provider cannot easily improve the quality of the terminal possessed by the user. With that in mind, simply extracting the factor elements that influence the result elements does not suggest any solution.

ここで、本願の発明者らは、結果要素に影響を与える要因要素であっても、サービス提供者にとって変容可能なものである必要があるのではないか、と考えた。 Here, the inventors of the present application have thought that it may be necessary for the service provider to be able to change even the factor element that affects the result element.

そこで、本発明は、ビッグデータから、結果に影響を与える変容可能な要因を抽出することができるプログラム、分析装置及び方法を提供することを目的とする。 Therefore, an object of the present invention is to provide a program, an analysis device and a method capable of extracting a changeable factor that influences a result from big data.

本発明によれば、帰属識別子毎に対応付けられた、値を含む「要因要素」及び「結果要素」を用いて、結果要素に影響を与える要因要素を抽出する装置に搭載されたコンピュータを機能させるプログラムであって、
複数の要因要素を、時系列で値が変容しにくい「不変要因要素」群と、時系列で値が変容しやすい「変容要因要素」群とに分類する要因要素群分類手段と、
帰属識別子の集合を、帰属識別子毎の各不変要因要素の値の類似度に基づいて複数のクラスタに分類するクラスタリング手段と、
クラスタ毎に、各変容要因要素について結果要素に影響を与える評価値を算出する評価値算出手段と、
結果要素の評価値に応じて、変容要因要素を抽出する要因要素抽出手段と
してコンピュータを機能させることを特徴とする。
According to the present invention, a computer mounted on an apparatus that extracts a factor element that influences a result element by using a “factor element” and a “result element” that include a value and are associated with each belonging identifier Is a program that
A factor element group classification means for classifying a plurality of factor elements into a group of "invariant factor elements" whose values are less likely to change in time series and a group of "transformation factor elements" whose values are more likely to change in time series,
Clustering means for classifying the set of belonging identifiers into a plurality of clusters based on the similarity of the values of the respective invariant factor elements for each belonging identifier,
For each cluster, an evaluation value calculation means for calculating an evaluation value that affects the result element for each transformation factor element,
It is characterized in that the computer is made to function as a factor element extracting means for extracting the change factor element according to the evaluation value of the result element.

本発明のプログラムにおける他の実施形態によれば、
要因要素群分類手段は、
各要因要素について、帰属識別子毎に、値が所定時間範囲で変容したか否かを検出し、
各要因要素について、所定の帰属識別子数に対して、値が変容した帰属識別子数の割合が、第1の閾値以上となる場合に、当該要因要素を「変容要因要素」とし、それ以外を「不変要因要素」とする
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
Factor element group classification means
For each factor element, for each attribution identifier, it is detected whether the value has changed within a predetermined time range,
For each factor element, when the ratio of the number of belonging identifiers whose value has changed with respect to the predetermined number of belonging identifiers is equal to or more than the first threshold value, the factor element is defined as “transformation factor element”, and the others are “ It is also preferable to have the computer function as an "invariant factor".

本発明のプログラムにおける他の実施形態によれば、
要因要素群分類手段は、
各要因要素について、帰属識別子毎に、値が所定時間範囲で変容した変容頻度を計数し、
各要因要素について、所定の帰属識別子数に対して、変容頻度が第2の閾値以上となる帰属識別子数の割合が、第3の閾値以上である場合に、当該要因要素を「変容要因要素」とし、それ以外を「不変要因要素」とする
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
Factor element group classification means
For each factor element, for each belonging identifier, count the frequency of change of the value within a predetermined time range,
For each factor element, if the ratio of the number of attribution identifiers whose transformation frequency is equal to or higher than the second threshold value to the predetermined number of attribution identifiers is equal to or higher than the third threshold value, the relevant factor element is designated as a “transformation factor element”. It is also preferable to cause the computer to function so that the rest are “invariant factor elements”.

本発明のプログラムにおける他の実施形態によれば、
評価値算出手段は、以下のように、各クラスタについて、変容要因要素i毎に、各結果要素に対応する帰属識別子の数に基づいて、評価値Viを算出する
n11:変容要因要素が第1値であり、且つ、結果要素が第1値である帰属識別子の数
n12:変容要因要素が第1値であり、且つ、結果要素が第2値である帰属識別子の数
n21:変容要因要素が第2値であり、且つ、結果要素が第1値である帰属識別子の数
n22:変容要因要素が第2値であり、且つ、結果要素が第2値である帰属識別子の数
n11+n12+n21+n22=クラスタの全帰属識別子の数N
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
The evaluation value calculation means calculates the evaluation value Vi for each transformation factor element i for each cluster based on the number of belonging identifiers corresponding to each result element as follows.
n11: Number of attribution identifiers whose transformation factor element has the first value and whose result element has the first value
n12: Number of attribution identifiers whose transformation factor element has the first value and whose result element has the second value
n21: Number of attribution identifiers whose transformation factor element has the second value and whose result element has the first value
n22: Number of attribution identifiers whose transformation factor element has the second value and whose result element has the second value
n11+n12+n21+n22=number N of all belonging identifiers of cluster
It is also preferable to make the computer function as described above.

本発明のプログラムにおける他の実施形態によれば、
評価値算出手段は、各クラスタについて、以下のように、結果要素に対する変容要因要素毎の評価値V1又はV2を、評価値Viとして算出する
変容要因要素の第1値における結果要素の第1値の評価値:P11=n11/(n11+n12)
変容要因要素の第1値における結果要素の第2値の評価値:P12=n12/(n11+n12)
変容要因要素の第2値における結果要素の第1値の評価値:P21=n21/(n21+n22)
変容要因要素の第2値における結果要素の第2値の評価値:P22=n22/(n21+n22)
当該変容要因要素に対する当該結果要素の第1値へ影響する評価値:V1=P11−P21
当該変容要因要素に対する当該結果要素の第2値へ影響する評価値:V2=P22−P12
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
The evaluation value calculation means calculates, for each cluster, the evaluation value V1 or V2 for each change factor element for the result element as the evaluation value Vi as follows: The first value of the result element in the first value of the change factor elements Evaluation value of: P11=n11/(n11+n12)
Evaluation value of the second value of the result element in the first value of the transformation factor element: P12=n12/(n11+n12)
Evaluation value of the first value of the result element in the second value of the transformation factor element: P21=n21/(n21+n22)
Evaluation value of the second value of the result element in the second value of the transformation factor element: P22=n22/(n21+n22)
Evaluation value that affects the first value of the result element for the transformation factor element: V1=P11-P21
Evaluation value that affects the second value of the result element for the transformation factor element: V2=P22-P12
It is also preferable to make the computer function as described above.

本発明のプログラムにおける他の実施形態によれば、
評価値算出手段は、クラスタ毎に、以下のように、赤池情報量規準(AIC:Akaike's Information Criterion)を用いて、変容要因要素sが結果要素Cに偏って出現する影響割合V(s,C)を、変容要因要素に対する結果要素の評価値Viとして算出する。
MLL_IM(s,C)=(n11+n12) log(n11+n12)
+(n11+n21) log(n11+n21)
+(n21+n22) log(n21+n22)
+(n12+n22) log(n12+n22)−2N log N
MLL_DM(s,C)=n11 log n11+n12 log n12+n21 log n21+n22 log n22−N log N
但し、N=n11+n12+n21+n22
AIC_IM(s,C)=-2 × MLL_IM(s,C) + 2×2
AIC_IM(s,C):変容要因要素sと結果要素Cとの組の従属AIC
AIC_DM(s,C)=-2 × MLL_DM(s,C) + 2×3
AIC_DM(s,C):変容要因要素sと結果要素Cとの組の独立AIC
V(s,C)=AIC_IM(s, C) − AIC_DM(s,C)
V(s,C):変容要因要素sと結果要素Cとの組の影響割合
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
The evaluation value calculating means uses the Akaike's Information Criterion (AIC) for each cluster as follows, and the influence factor V(s,C ) Is calculated as the evaluation value Vi of the result element for the transformation factor element.
MLL_IM(s,C)=(n11+n12) log(n11+n12)
+(n11+n21) log(n11+n21)
+(n21+n22) log(n21+n22)
+(n12+n22) log(n12+n22)−2N log N
MLL_DM(s,C)=n11 log n11+n12 log n12+n21 log n21+n22 log n22−N log N
However, N=n11+n12+n21+n22
AIC_IM(s,C) = -2 x MLL_IM(s,C) + 2 x 2
AIC_IM(s,C): Subordinate AIC of the set of transformation factor element s and result element C
AIC_DM(s,C) = -2 x MLL_DM(s,C) + 2 x 3
AIC_DM(s,C): Independent AIC of the set of transformation factor element s and result element C
V(s,C) = AIC_IM(s, C)-AIC_DM(s,C)
V(s,C): It is also preferable to make the computer function as the influence ratio of the set of the change factor element s and the result element C.

本発明のプログラムにおける他の実施形態によれば、
要因要素抽出手段は、各クラスタにおける結果要素に対する変容要因要素i毎の評価値Viの中で、最大値max(Vi)となる変容要因要素iを抽出する
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
It is also preferable that the factor element extracting means causes the computer to extract the transformation factor element i having the maximum value max(Vi) from the evaluation values Vi for each transformation factor element i for the result element in each cluster.

本発明のプログラムにおける他の実施形態によれば、
帰属識別子は、ユーザ識別子であり、
要因要素は、ユーザから収集可能な情報に基づくものであり、
結果要素は、ユーザ行動の有無に基づくものである
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
The attribution identifier is a user identifier,
The factor element is based on the information that can be collected from the user,
It is also preferable to have the computer function such that the result element is based on the presence or absence of user activity.

本発明のプログラムにおける他の実施形態によれば、
要因要素は、ユーザの日常行動としての利用料金、通信量、利用プラン、推奨度、通信品質、端末品質の組み合わせであり、
結果要素は、ユーザの購買行動としての契約の継続/解除である
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
The factor element is a combination of usage fee, communication volume, usage plan, recommendation level, communication quality, and terminal quality as the daily activities of the user,
The resulting element also preferably causes the computer to function as a continuation/cancellation of the contract as a purchasing behavior of the user.

本発明のプログラムにおける他の実施形態によれば、
帰属識別子は、センサ識別子であり、
要因要素は、センサから収集可能な情報に基づくものであり、
結果要素は、工程成果の有無に基づくものである
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
The attribution identifier is a sensor identifier,
The factor element is based on the information that can be collected from the sensor,
It is also preferable to cause the computer to function such that the result element is based on the presence or absence of the process result.

本発明によれば、帰属識別子毎に対応付けられた、値を含む「要因要素」及び「結果要素」を用いて、結果要素に影響を与える要因要素を抽出する分析装置であって、
複数の要因要素を、時系列で値が変容しにくい「不変要因要素」群と、時系列で値が変容しやすい「変容要因要素」群とに分類する要因要素群分類手段と、
帰属識別子の集合を、帰属識別子毎の各不変要因要素の値の類似度に基づいて複数のクラスタに分類するクラスタリング手段と、
クラスタ毎に、各変容要因要素について結果要素に影響を与える評価値を算出する評価値算出手段と、
結果要素の評価値に応じて、変容要因要素を抽出する要因要素抽出手段と
を有することを特徴とする。
According to the present invention, an analysis device for extracting a factor element that influences a result element by using a “factor element” and a “result element” including a value, which are associated with each belonging identifier,
A factor element group classification means for classifying a plurality of factor elements into a group of "invariant factor elements" whose values are less likely to change in time series and a group of "transformation factor elements" whose values are more likely to change in time series,
Clustering means for classifying the set of belonging identifiers into a plurality of clusters based on the similarity of the values of the respective invariant factor elements for each belonging identifier,
For each cluster, an evaluation value calculation means for calculating an evaluation value that affects the result element for each transformation factor element,
And a factor element extracting means for extracting the change factor element according to the evaluation value of the result element.

本発明によれば、帰属識別子毎に対応付けられた、値を含む「要因要素」及び「結果要素」を用いて、結果要素に影響を与える要因要素を抽出する装置の分析方法であって、
装置は、
複数の要因要素を、時系列で値が変容しにくい「不変要因要素」群と、時系列で値が変容しやすい「変容要因要素」群とに分類する第1のステップと、
帰属識別子の集合を、帰属識別子毎の各不変要因要素の値の類似度に基づいて複数のクラスタに分類する第2のステップと、
クラスタ毎に、各変容要因要素について結果要素に影響を与える評価値を算出する第3のステップと、
結果要素の評価値に応じて、変容要因要素を抽出する第4のステップと
を実行することを特徴とする。
According to the present invention, a method of analyzing a device that extracts a factor element that influences a result element by using a “factor element” and a “result element” that include a value and are associated with each other,
The device is
A first step of classifying a plurality of factor elements into an “invariant factor element” group whose values are less likely to change in time series and a “transformation factor element” group whose values are more likely to change value in time series;
A second step of classifying the set of attribution identifiers into a plurality of clusters based on the similarity of the values of the respective invariant factor elements for each attribution identifier;
A third step of calculating an evaluation value that affects a result element for each transformation factor element for each cluster,
The fourth step of extracting the transformation factor element is executed according to the evaluation value of the result element.

本発明のプログラム、分析装置及び方法によれば、ビッグデータから、結果に影響を与える変容可能な要因を抽出することができる。 According to the program, analysis device, and method of the present invention, it is possible to extract a changeable factor that influences a result from big data.

従来技術における要因分析の説明図である。It is explanatory drawing of the factor analysis in a prior art. 本発明における分析装置の機能構成図である。It is a functional block diagram of the analyzer in this invention. 本発明における要素情報蓄積部の説明図である。It is explanatory drawing of the element information storage part in this invention. 本発明における要因要素群分類部の説明図である。It is explanatory drawing of the factor element group classification part in this invention. 本発明におけるクラスタリング部の説明図である。It is explanatory drawing of the clustering part in this invention. 本発明における評価値算出部の説明図である。It is explanatory drawing of the evaluation value calculation part in this invention. 変容要因要素の離散二値と、結果要素の離散二値との組における集計数を表す説明図である。It is explanatory drawing showing the total number in the group of the discrete binary of a change factor element and the discrete binary of a result element. 本発明における要因分析の説明図である。It is explanatory drawing of the factor analysis in this invention.

以下、本発明の実施の形態について、図面を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図2は、本発明における分析装置の機能構成図である。 FIG. 2 is a functional configuration diagram of the analyzer according to the present invention.

本発明の分析装置1は、帰属識別子毎に対応付けられた、値を含む「要因要素」及び「結果要素」を用いて、結果要素に影響を与える要因要素を抽出する。
図2によれば、分析装置1は、要素情報蓄積部10と、要因要素群分類部11と、クラスタリング部12と、評価値算出部13と、要因要素抽出部14とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、要因分析方法としても理解できる。
The analysis apparatus 1 of the present invention extracts a factor element that influences a result element by using a “factor element” and a “result element” that include a value and are associated with each belonging identifier.
According to FIG. 2, the analysis device 1 includes an element information storage unit 10, a factor element group classification unit 11, a clustering unit 12, an evaluation value calculation unit 13, and a factor element extraction unit 14. These functional components are realized by executing a program that causes a computer mounted on the device to function. The processing flow of these functional components can also be understood as a factor analysis method.

[要素情報蓄積部10]
要素情報蓄積部10は、帰属識別子毎に、複数の要因要素及び結果要素を対応付けて記憶する。帰属識別子がユーザ識別子である場合、例えば以下のようになる。
要因要素:ユーザから収集可能な情報に基づく要素
結果要素:ユーザ行動の有無に基づく要素
[Element information storage unit 10]
The element information storage unit 10 stores a plurality of factor elements and result elements in association with each other for each belonging identifier. When the attribution identifier is a user identifier, for example, it becomes as follows.
Factor element: Element based on the information that can be collected from the user Result element: Element based on the presence or absence of user action

図3は、本発明における要素情報蓄積部の説明図である。 FIG. 3 is an explanatory diagram of the element information storage unit in the present invention.

図3によれば、通信サービスとして、時系列に、ユーザ識別子(帰属識別子)毎に、アンケートや契約情報に基づく「要因要素」と、そのユーザの購買行動に基づく「結果要素」とが対応付けられている。要因要素の値は、二値であってもよいし、例えば0〜10点で表された数値であってもよい。要因要素及び結果要素の数値を二値化する場合、分散が最も小さくなるようにすることが好ましい。
通信サービスの場合、要因要素は、ユーザの日常行動としての例えば利用料金、通信量、利用プラン、顧客への推奨度(NPS(Net Promoter Score))、通信品質、端末品質のようなものである。また、結果要素は、ユーザの購買行動としての例えば契約の継続/解除のようなものである。
According to FIG. 3, as a communication service, a “factor element” based on a questionnaire or contract information and a “result element” based on the purchasing behavior of the user are associated in time series for each user identifier (attribution identifier). Has been. The value of the factor element may be binary, or may be a numerical value represented by 0 to 10 points, for example. When binarizing the numerical values of the factor element and the result element, it is preferable to minimize the variance.
In the case of a communication service, factor factors are, for example, usage charges, communication volume, usage plan, recommendation level (NPS (Net Promoter Score)) to a customer, communication quality, and terminal quality as daily activities of a user. .. The result element is, for example, the continuation/cancellation of the contract as the purchase behavior of the user.

本発明は、図3のようなユーザにおける要因分析以外にも、工場の生産工程のような様々な要因分析に利用することができる。
例えば、工場の生産工程として、帰属識別子がセンサ識別子である場合、例えば以下のようになる。
要因要素:センサから収集可能な情報に基づく要素
結果要素:工程成果の有無に基づく要素
この場合、例えば生産物に対する正常/異常(結果要素)に影響を与える、様々なセンサ(要因要素)から収集された値を分析することができる。
The present invention can be used for various factor analyzes such as the production process of a factory, in addition to the factor analysis by the user as shown in FIG.
For example, when the belonging identifier is a sensor identifier in the production process of a factory, the process will be as follows, for example.
Factor element: Element based on information that can be collected from sensors Result element: Element based on presence/absence of process result In this case, for example, collected from various sensors (factor elements) that affect normal/abnormal (result element) of the product The value given can be analyzed.

[要因要素群分類部11]
要因要素群分類部11は、複数の要因要素を、以下の群に分類する。
時系列で値が変容しにくい「不変要因要素」群
時系列で値が変容しやすい「変容要因要素」群
要因要素群分類部11は、具体的には以下ように、複数の要因要素を分類する。
[Factor element group classification unit 11]
The factor element group classification unit 11 classifies a plurality of factor elements into the following groups.
"Invariant factor element" group in which the value is difficult to change in time series "Change factor element" group in which the value is easy to change in time series The factor element group classification unit 11 specifically classifies a plurality of factor elements as follows. To do.

図4は、本発明における要因要素群分類部の説明図である。 FIG. 4 is an explanatory diagram of the factor element group classification unit in the present invention.

(分類1)最初に、各要因要素について、帰属識別子毎に、値が所定時間範囲で変容したか否かを検出する。
図4(a)によれば、例えば要因要素「利用料金」について、ユーザDは、所定時間範囲(2017年1月〜5月)で異なる値が含まれているために、その要因要素「利用料金」は、「変容」(図中では○で表す)とする。
また、図4(a)によれば、例えば要因要素「利用プラン」について、ユーザDは、所定時間範囲で異なる値が含まれていないために、その要因要素「利用プラン」は、「不変」(図中では=で表す)とする。
(Category 1) First, for each factor element, whether or not the value has changed within a predetermined time range is detected for each attribution identifier.
According to FIG. 4A, for example, regarding the factor element “use fee”, since the user D includes different values in the predetermined time range (January to May 2017), the factor element “use fee” is included. The "charge" is "transformation" (indicated by a circle in the figure).
Further, according to FIG. 4A, for example, with respect to the factor element “usage plan”, since the user D does not include different values within the predetermined time range, the factor element “usage plan” is “invariant”. (Indicated by = in the figure).

次に、各要因要素について、例えば全ての帰属識別子を分類対象とした場合、値が変容した帰属識別子数の割合が、第1の閾値以上となる場合に、当該要因要素を「変容要因要素」とし、それ以外を「不変要因要素」とする。
値が変容したユーザ数/全ユーザ数 ≧ 第1の閾値
図4(b)によれば、例えば要因要素「利用料金」について、全てのユーザ数5に対して、値が変容したユーザ数3の割合(0.6)が、第1の閾値(0.5)以上であるので、当該要因要素「利用料金」を「変容要因要素」とする。
また、図4(b)によれば、例えば要因要素「利用プラン」について、全てのユーザ数5に対して、値が変容したユーザ数1の割合(0.2)が、第1の閾値(0.5)よりも小さいので、当該要因要素「利用プラン」を「不変要因要素」とする。
Next, regarding each factor element, for example, when all attribution identifiers are classified, if the ratio of the number of attribution identifiers whose values are changed is equal to or larger than the first threshold value, the factor element is changed to “change factor element”. And the rest are “invariant factor elements”.
Number of users whose value has changed/total number of users ≧first threshold value According to FIG. 4B, for example, regarding the factor element “use fee”, the number of users whose value has changed is 3 Since the ratio (0.6) is equal to or greater than the first threshold value (0.5), the factor element “use fee” is set as the “transformation factor element”.
Further, according to FIG. 4B, for example, in the factor element “use plan”, the ratio (0.2) of the number of users 1 whose value has changed to the total number of users 5 is the first threshold ( Since it is smaller than 0.5), the factor element “use plan” is defined as “invariant factor element”.

(分類2)最初に、各要因要素について、帰属識別子毎に、値が所定時間範囲で変容した変容頻度を計数する。
次に、各要因要素について、例えば全ての帰属識別子を分類対象とした場合、変容頻度が第2の閾値以上となる帰属識別子数の割合が、第3の閾値以上である場合に、当該要因要素を「変容要因要素」とし、それ以外を「不変要因要素」とする。
変容頻度が第2の閾値以上のユーザ数/全ユーザ数 ≧ 第3の閾値
(Category 2) First, with respect to each factor element, the frequency of change of the value within a predetermined time range is counted for each attribution identifier.
Next, regarding each factor element, for example, when all attribution identifiers are classified, if the ratio of the number of attribution identifiers whose transformation frequency is equal to or higher than the second threshold is equal to or higher than the third threshold, the factor element concerned Is the "transformation factor element" and the others are "invariance factor elements".
Number of users whose change frequency is greater than or equal to the second threshold value/total number of users ≧third threshold value

図4(c)によれば、最終的に、複数の要因要素が、以下のように分類されている。
変容要因要素:利用料金、通信量、推奨度
不変要因要素:利用プラン、通信品質、端末品質
According to FIG. 4C, finally, the plurality of factor elements are classified as follows.
Factors of change: Usage charge, communication volume, recommendation level Factors of change: Usage plan, communication quality, terminal quality

他の第1の実施形態として、要素xの値が、カテゴリカルなものである場合の分類方法がある。例えばN個の値(A1、A2、〜、AN)の中でいずれか1つの値をとるとする。ここで、異なる時刻t0、t1、〜、tnについて、あるユーザ(帰属識別子)iのカテゴリカルな要素xi(t)を観測した際に、xi(t0)、xi(t1)、〜、xi(tn)を得たとする。
m/n > 所定閾値
Am:xi(t0)、xi(t1)、〜、xi(tn)の間で最も多く取られた値
m:Amの出現回数
この場合、t0、t1、〜、tnの間、xiの値はAmが支配的であり、値は変容していないと言える。そのために、ユーザiについて、要素xは「不変要因要素」とする。
As another first embodiment, there is a classification method when the value of the element x is categorical. For example, assume that any one of N values (A1, A2,..., AN) is taken. Here, when categorical elements xi(t) of a certain user (attribution identifier) i are observed at different times t0, t1,..., Tn, xi(t0), xi(t1), ..., xi( tn).
m/n>predetermined threshold value Am: the value most often taken among xi(t0), xi(t1), ..., xi(tn)
m: Number of appearances of Am In this case, Am is dominant in the value of xi during t0, t1, to, and tn, and it can be said that the value is not changed. Therefore, for the user i, the element x is the “invariant factor element”.

他の第2の実施形態として、要素xの取りうる値の範囲を比較する場合の分類方法もある。例えば、要素xが上限値xmaxと下限値xminとなる場合、異なる時刻t0、t1、〜、tnについて、あるユーザ(帰属識別子)iの連続的な要素xi(t)を観測した際に得られた、xi(t0)、xi(t1)、〜、xi(tn)の分散ρiを算出する。
ρi/(xmax−xmin) < 所定閾値
この場合、ユーザiについて、要素xは「不変要因要素」とする。
As another second embodiment, there is also a classification method when comparing the range of possible values of the element x. For example, when the element x has the upper limit value xmax and the lower limit value xmin, it is obtained when observing continuous elements xi(t) of a certain user (attribution identifier) i at different times t0, t1, ..., tn. Further, the variance ρi of xi(t0), xi(t1), ˜, xi(tn) is calculated.
[rho]i/(xmax-xmin)<predetermined threshold value In this case, the element x is the "invariant factor element" for the user i.

[クラスタリング部12]
クラスタリング部12は、帰属識別子の集合を、帰属識別子毎の各不変要因要素の値の類似度に基づいて複数のクラスタに分類する。例えば、帰属識別子毎に、各不変要因要素の値をベクトルとして、類似度に応じてクラスタリングすることができる。即ち、類似度とは、不変要因要素の値の列を比較したものとなる。
[Clustering unit 12]
The clustering unit 12 classifies the set of belonging identifiers into a plurality of clusters based on the degree of similarity of the value of each invariant factor element for each belonging identifier. For example, clustering can be performed according to the degree of similarity using the value of each invariant factor element as a vector for each belonging identifier. That is, the degree of similarity is obtained by comparing columns of values of invariant factor elements.

図5は、本発明におけるクラスタリング部の説明図である。 FIG. 5 is an explanatory diagram of the clustering unit in the present invention.

クラスタリングには、ハードクラスタリング又はソフトクラスタリングのいずれであってもよい。また、クラスタリングとして、要因要素の値の最小単位毎に細かく分類してもよいし、k-means(k平均法)を用いてもよい。k-meansとは、非階層型クラスタリングであって、クラスタの平均を用いてk個のクラスタに分類するものである。
また、他の実施形態として、ウォード法のような階層的分類を用いてもよい。
The clustering may be either hard clustering or soft clustering. Further, as the clustering, finer classification may be performed for each minimum unit of the value of the factor element, or k-means (k-means method) may be used. The k-means is a non-hierarchical clustering, which is classified into k clusters using the average of clusters.
Further, as another embodiment, a hierarchical classification such as the Ward method may be used.

具体的には、不変要因要素を例えば「通信品質」とした場合、単純に「通信品質が良い」と考えるユーザ識別子群と、「通信品質が悪い」と考えるユーザ識別子群とに分類することができる。これによって、不変要因要素「通信品質が良い」、「通信品質が悪い」と考えるユーザ識別子群毎に、後述するように、利用料金、通信量、推奨度等の各変容要因要素と、結果要素「契約の継続」「契約の解除」とのそれぞれの関連度を評価することができる。 Specifically, when the invariant factor element is, for example, “communication quality”, it may be classified into a user identifier group that is simply considered to be “communication quality” and a user identifier group that is considered to be “poor communication quality”. it can. As a result, for each user identifier group that considers the invariant factor elements "communication quality is good" and "communication quality is poor", as will be described later, each change factor element such as usage charge, communication amount, recommendation degree, and result element. It is possible to evaluate the degree of association with each of “continuation of contract” and “cancellation of contract”.

[評価値算出部13]
評価値算出部13は、クラスタ毎に、各変容要因要素について結果要素に影響を与える評価値を算出する。
[Evaluation value calculation unit 13]
The evaluation value calculation unit 13 calculates, for each cluster, an evaluation value that affects the result element for each transformation factor element.

図6は、本発明における評価値算出部の説明図である。 FIG. 6 is an explanatory diagram of the evaluation value calculation unit in the present invention.

図6によれば、クラスタ毎に、結果要素に対する各変容要因要素の評価値を算出している。評価値算出部13は、各クラスタについて、変容要因要素i毎に、結果要素に対応する帰属識別子の数に基づいた評価値Viを算出する。 According to FIG. 6, the evaluation value of each transformation factor element with respect to the result element is calculated for each cluster. The evaluation value calculation unit 13 calculates, for each transformation factor element i, an evaluation value Vi based on the number of belonging identifiers corresponding to the result element for each cluster.

図7は、変容要因要素の離散二値と、結果要素の離散二値との組における集計数を表す説明図である。
n11:変容要因要素が第1値であり、且つ、結果要素が第1値である帰属識別子の数
n12:変容要因要素が第1値であり、且つ、結果要素が第2値である帰属識別子の数
n21:変容要因要素が第2値であり、且つ、結果要素が第1値である帰属識別子の数
n22:変容要因要素が第2値であり、且つ、結果要素が第2値である帰属識別子の数
n11+n12+n21+n22=クラスタの全帰属識別子の数N
FIG. 7 is an explanatory diagram showing the total number of sets of the discrete binary values of the transformation factor elements and the discrete binary values of the result elements.
n11: Number of attribution identifiers whose transformation factor element has the first value and whose result element has the first value
n12: Number of attribution identifiers whose transformation factor element has the first value and whose result element has the second value
n21: Number of attribution identifiers whose transformation factor element has the second value and whose result element has the first value
n22: Number of attribution identifiers whose transformation factor element has the second value and whose result element has the second value
n11+n12+n21+n22=number N of all belonging identifiers of cluster

評価値算出部13は、具体的には、以下のような評価方法を用いることができる。 Specifically, the evaluation value calculation unit 13 can use the following evaluation method.

(評価方法1)各クラスタについて、以下のように、結果要素に対する変容要因要素毎の評価値V1又はV2を、評価値Viとして算出する。
変容要因要素の第1値における結果要素の第1値の評価値:P11=n11/(n11+n12)
変容要因要素の第1値における結果要素の第2値の評価値:P12=n12/(n11+n12)
変容要因要素の第2値における結果要素の第1値の評価値:P21=n21/(n21+n22)
変容要因要素の第2値における結果要素の第2値の評価値:P22=n22/(n21+n22)
当該変容要因要素に対する当該結果要素の第1値へ影響する評価値:V1=P11−P21
当該変容要因要素に対する当該結果要素の第2値へ影響する評価値:V2=P22−P12
(Evaluation Method 1) For each cluster, the evaluation value V1 or V2 for each transformation factor element with respect to the result element is calculated as the evaluation value Vi as follows.
Evaluation value of the first value of the result element in the first value of the transformation factor element: P11=n11/(n11+n12)
Evaluation value of the second value of the result element in the first value of the transformation factor element: P12=n12/(n11+n12)
Evaluation value of the first value of the result element in the second value of the transformation factor element: P21=n21/(n21+n22)
Evaluation value of the second value of the result element in the second value of the transformation factor element: P22=n22/(n21+n22)
Evaluation value that affects the first value of the result element for the transformation factor element: V1=P11-P21
Evaluation value that affects the second value of the result element for the transformation factor element: V2=P22-P12

例えば、変容要因要素について、第1値=「低」、第2値=「高」とし、結果要素について、第1値=「解除」、第2値=「継続」とした場合、評価値算出部13は、その集計数を用いて、以下のように評価値Viを算出する。
変容要因要素「低」における契約「解除」の割合:Pl=n11/(n11+n12)
変容要因要素「高」における契約「解除」の割合:Ph=n21/(n21+n22)
当該クラスタにおける当該変容要因要素の評価値:Vi=Pl−Ph
For example, when the change factor element has the first value=“low” and the second value=“high” and the result element has the first value=“release” and the second value=“continue”, the evaluation value is calculated. The unit 13 uses the total number to calculate the evaluation value Vi as follows.
Ratio of contract cancellations in the change factor element "low": Pl=n11/(n11+n12)
Ratio of contract “cancellation” in change factor element “high”: Ph=n21/(n21+n22)
Evaluation value of the transformation factor element in the cluster: Vi=Pl−Ph

(評価方法2)クラスタ毎に、以下のように、赤池情報量規準(AIC:Akaike's Information Criterion)を用いた、変容要因要素sが結果要素Cに偏って出現する影響割合V(s,C)を、変容要因要素に対する結果要素の評価値Viとして算出する。
MLL_IM(s,C)=(n11+n12) log(n11+n12)
+(n11+n21) log(n11+n21)
+(n21+n22) log(n21+n22)
+(n12+n22) log(n12+n22)−2N log N
MLL_DM(s,C)=n11 log n11+n12 log n12+n21 log n21+n22 log n22−N log N
但し、N=n11+n12+n21+n22
AIC_IM(s,C)=-2 × MLL_IM(s,C) + 2×2
AIC_IM(s,C):変容要因要素sと結果要素Cとの組の従属AIC
AIC_DM(s,C)=-2 × MLL_DM(s,C) + 2×3
AIC_DM(s,C):変容要因要素sと結果要素Cとの組の独立AIC
V(s,C)=AIC_IM(s, C) − AIC_DM(s,C)
V(s,C):変容要因要素sと結果要素Cとの組の影響割合
(Evaluation method 2) For each cluster, the influence ratio V(s,C) in which the transformation factor element s appears biased to the result element C using the Akaike's Information Criterion (AIC) as follows: Is calculated as the evaluation value Vi of the result element for the transformation factor element.
MLL_IM(s,C)=(n11+n12) log(n11+n12)
+(n11+n21) log(n11+n21)
+(n21+n22) log(n21+n22)
+(n12+n22) log(n12+n22)−2N log N
MLL_DM(s,C)=n11 log n11+n12 log n12+n21 log n21+n22 log n22−N log N
However, N=n11+n12+n21+n22
AIC_IM(s,C) = -2 x MLL_IM(s,C) + 2 x 2
AIC_IM(s,C): Subordinate AIC of the set of transformation factor element s and result element C
AIC_DM(s,C) = -2 x MLL_DM(s,C) + 2 x 3
AIC_DM(s,C): Independent AIC of the set of transformation factor element s and result element C
V(s,C) = AIC_IM(s, C)-AIC_DM(s,C)
V(s,C): Influence ratio of the combination of the transformation factor element s and the result element C

前述したように、クラスタ毎に、変容要因要素と結果要素との関連度が高いほど、評価値も高くなる。 As described above, the higher the degree of association between the transformation factor element and the result element for each cluster, the higher the evaluation value.

クラスタ毎の不変要因要素の分散が小さい場合、結果要素と不変要因要素とは独立となり、前述した評価方法1及び2で評価することができる。
一方で、クラスタ毎の不変要因要素の内で、変容困難な要素の分散が大きい場合、結果要素と不変要因要素とが強く関係する可能性がある。
そこで、結果要素と各不変要因要素jについても、前述の評価方法1と同様にVjを算出することが好ましい。
When the variance of the invariant factor element for each cluster is small, the result element and the invariant factor element are independent and can be evaluated by the above-described evaluation methods 1 and 2.
On the other hand, among the invariant factor elements for each cluster, if the variance of the elements that are difficult to change is large, the result element and the invariant factor element may be strongly related.
Therefore, it is preferable to calculate Vj for the result element and each invariant factor element j as in the evaluation method 1 described above.

この場合、例えば以下のように評価値V'を算出する。
V'=max(Vi)−max(Vj)
又は、
V'= {max(Vi)、max(Vj)<所定閾値}
{0、max(Vj)>所定閾値}
In this case, the evaluation value V′ is calculated as follows, for example.
V'=max(Vi)-max(Vj)
Or
V′={max(Vi), max(Vj)<predetermined threshold}
{0, max(Vj)> predetermined threshold}

[要因要素抽出部14]
要因要素抽出部14は、結果要素の評価値に応じて、変容要因要素を抽出する。例えば以下のように変容要因要素を抽出することができる。
[Factor element extraction unit 14]
The factor element extraction unit 14 extracts the transformation factor element according to the evaluation value of the result element. For example, the transformation factor element can be extracted as follows.

(抽出1)クラスタ毎に、変容要因要素を抽出する。当該クラスタに対して、結果要素に対する変容要因要素i毎の評価値Viの中で、最大値max(Vi)となる変容要因要素iを抽出する。これによって、クラスタに含まれるユーザ識別子に応じて、結果要素に影響を与える変容要因要素を認識することができる。
抽出1は、オペレータの要求が、施策効果が高いクラスタはどれか?、そのクラスタに効く要素は何か?の場合に適する。
(Extraction 1) A transformation factor element is extracted for each cluster. For the cluster, the transformation factor element i having the maximum value max(Vi) is extracted from the evaluation values Vi for each transformation factor element i for the result element. As a result, it is possible to recognize the change factor element that affects the result element according to the user identifier included in the cluster.
In extraction 1, which cluster does the operator request have a high policy effect? , What is the effective factor for the cluster? Suitable for

(抽出2)全てのクラスタに対して、1つの変容要因要素を抽出する。クラスタ毎に抽出された変容要因要素i毎の評価値Viの中で、最大値max(Vi)となる変容要因要素iを抽出する。これによって、クラスタに拘わらず、結果要素に影響を与える変容要因要素を抽出することができる。
抽出2は、全ユーザに渡って最も効果が高い施策は何か?、どの要素を変更するのが良いのか?の場合に適する。
(Extraction 2) One transformation factor element is extracted for all clusters. Among the evaluation values Vi for each transformation factor element i extracted for each cluster, the transformation factor element i having the maximum value max(Vi) is extracted. This makes it possible to extract the change factor element that affects the result element regardless of the cluster.
What is Extract 2 the most effective measure for all users? , Which element should be changed? Suitable for

本発明の他の実施形態として、結果要素「契約の解除」の場合、対象となるクラスタを抽出しても、施策対象としたいユーザは「契約の解除」済みのため、結果要素(契約行動)が得られていないユーザに対して評価値を算出したいとする需要がある。
具体的には、図2のように「顧客情報」「アンケート」が観測できているが、結果要素が得られていないユーザiに対して、どのクラスタに該当するかを判別する。ユーザiがどのクラスタに所属するかは、要素の値が全て観測できていれば、クラスタの定義から一意に決定できる。
これによって、例えば未だ契約を解除していない(結果要素が得られていない)ユーザのうち、行動が変容しうる顧客を抽出するこができる。
一方で、「顧客情報」「アンケート」の要素の中で、一部の要素の値を観測できないユーザも存在する。
y:検出できた要素
z:検出できない要素
y及びzの両方とも観測できたユーザの要素の値を用いて、zを目的変数として、yを説明変数として、例えばSVM(Support Vector Machine)のような機械学習の推定器を用いることもできる。
As another embodiment of the present invention, in the case of the result element “cancel contract”, even if the target cluster is extracted, the user who wants to take measures is “cancel contract”, so the result element (contract action) There is a demand for wanting to calculate an evaluation value for a user who has not obtained.
Specifically, as shown in FIG. 2, it is determined which cluster the user i, who can observe the “customer information” and the “questionnaire” but has no result element, corresponds to which cluster. The cluster to which the user i belongs can be uniquely determined from the definition of the cluster if all the element values can be observed.
With this, for example, among users who have not yet canceled the contract (result elements have not been obtained), customers whose behavior can be changed can be extracted.
On the other hand, among the elements of “customer information” and “questionnaire”, some users cannot observe the values of some elements.
y: an element that can be detected z: an element that cannot be detected Using the values of user elements that can observe both y and z, z is an objective variable and y is an explanatory variable, such as SVM (Support Vector Machine) A simple machine learning estimator can also be used.

図8は、本発明における要因分析の説明図である。 FIG. 8 is an explanatory diagram of factor analysis in the present invention.

図8によれば、例えば任意のクラスタに含まれるユーザ群に対する通信サービスについて、「契約の継続(結果要素)」に対して、変容要因要素の評価値が算出されている。
推奨度 > 通信量 > 利用料金
この場合、「契約の継続」と「推奨度」との間で関連性が高いと認められる。この場合、通信サービスの提供者としては、「契約の継続」のために、「推奨度」を高めることが必要であると考えることができる。
According to FIG. 8, for example, with respect to the communication service for the user group included in an arbitrary cluster, the evaluation value of the transformation factor element is calculated with respect to “continuation of contract (result element)”.
Recommendation degree> Communication volume> Usage fee In this case, it is recognized that there is a high degree of relevance between “continuation of contract” and “recommendation degree”. In this case, it can be considered that the communication service provider needs to increase the “recommendation level” in order to “continue the contract”.

以上、詳細に説明したように、本発明のプログラム、分析装置及び方法によれば、ビッグデータから、結果に影響を与える変容可能な要因を抽出することができる。
特に、本発明によれば、結果要素に対して、時系列で変容しにくい不変要因要素との関連度を評価せず、時系列で変容しやすい変容要因要素との関連度のみを評価する。そのために、サービス提供者としては、高い評価値の変容要因要素に対する対策をとることによって、結果要素を改善することができる。
As described above in detail, according to the program, the analysis device and the method of the present invention, it is possible to extract a changeable factor that influences the result from the big data.
In particular, according to the present invention, the degree of association between the result element and the invariant factor element that is difficult to change in time series is not evaluated, but only the degree of association with the change factor element that is easily changed in time series is evaluated. Therefore, the service provider can improve the result element by taking measures against the change factor element having a high evaluation value.

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変容、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。 With respect to the various embodiments of the present invention described above, various changes, modifications and omissions of the technical idea and scope of the present invention can be easily made by those skilled in the art. The above description is merely an example and is not intended to be limiting. The invention is limited only by the claims and equivalents thereof.

1 分析装置
10 要素情報蓄積部
11 要因要素群分類部
12 クラスタリング部
13 評価値算出部
14 要因要素抽出部

DESCRIPTION OF SYMBOLS 1 Analysis device 10 Element information storage unit 11 Factor element group classification unit 12 Clustering unit 13 Evaluation value calculation unit 14 Factor element extraction unit

Claims (12)

帰属識別子毎に対応付けられた、値を含む「要因要素」及び「結果要素」を用いて、結果要素に影響を与える要因要素を抽出する装置に搭載されたコンピュータを機能させるプログラムであって、
複数の要因要素を、時系列で値が変容しにくい「不変要因要素」群と、時系列で値が変容しやすい「変容要因要素」群とに分類する要因要素群分類手段と、
帰属識別子の集合を、帰属識別子毎の各不変要因要素の値の類似度に基づいて複数のクラスタに分類するクラスタリング手段と、
前記クラスタ毎に、各変容要因要素について前記結果要素に影響を与える評価値を算出する評価値算出手段と、
前記結果要素の評価値に応じて、変容要因要素を抽出する要因要素抽出手段と
してコンピュータを機能させることを特徴とするプログラム。
A program that causes a computer installed in a device that extracts a factor element that influences a result element, using a “factor element” and a “result element” that include a value and is associated with each attribution identifier,
A factor element group classification means for classifying a plurality of factor elements into a group of "invariant factor elements" whose values are less likely to change in time series and a group of "transformation factor elements" whose values are more likely to change in time series,
Clustering means for classifying the set of belonging identifiers into a plurality of clusters based on the similarity of the values of the respective invariant factor elements for each belonging identifier,
Evaluation value calculation means for calculating an evaluation value that affects the result element for each transformation factor element for each cluster,
A program that causes a computer to function as factor factor extraction means for extracting a change factor factor according to the evaluation value of the result factor.
前記要因要素群分類手段は、
各要因要素について、帰属識別子毎に、値が所定時間範囲で変容したか否かを検出し、
各要因要素について、所定の帰属識別子数に対して、値が変容した帰属識別子数の割合が、第1の閾値以上となる場合に、当該要因要素を「変容要因要素」とし、それ以外を「不変要因要素」とする
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
The factor element group classification means,
For each factor element, for each attribution identifier, it is detected whether the value has changed within a predetermined time range,
For each factor element, when the ratio of the number of belonging identifiers whose value has changed with respect to the predetermined number of belonging identifiers is equal to or more than the first threshold value, the factor element is defined as “transformation factor element”, and the others are “ The program according to claim 1, which causes a computer to function as an "invariant factor element".
前記要因要素群分類手段は、
各要因要素について、帰属識別子毎に、値が所定時間範囲で変容した変容頻度を計数し、
各要因要素について、所定の帰属識別子数に対して、前記変容頻度が第2の閾値以上となる帰属識別子数の割合が、第3の閾値以上である場合に、当該要因要素を「変容要因要素」とし、それ以外を「不変要因要素」とする
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
The factor element group classification means,
For each factor element, for each belonging identifier, count the frequency of change of the value within a predetermined time range,
For each factor element, when the ratio of the number of attribution identifiers whose transformation frequency is equal to or greater than the second threshold value is equal to or greater than the third threshold value with respect to the predetermined number of attribution identifiers, the relevant factor element is changed to “transformation factor element The computer program is caused to function such that "," and the rest are "invariant factor elements".
前記評価値算出手段は、以下のように、各クラスタについて、変容要因要素i毎に、各結果要素に対応する帰属識別子の数に基づいて、評価値Viを算出する
n11:変容要因要素が第1値であり、且つ、結果要素が第1値である帰属識別子の数
n12:変容要因要素が第1値であり、且つ、結果要素が第2値である帰属識別子の数
n21:変容要因要素が第2値であり、且つ、結果要素が第1値である帰属識別子の数
n22:変容要因要素が第2値であり、且つ、結果要素が第2値である帰属識別子の数
n11+n12+n21+n22=クラスタの全帰属識別子の数N
ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。
The evaluation value calculation means calculates the evaluation value Vi for each of the transformation factor elements i based on the number of belonging identifiers corresponding to each result element for each cluster as follows.
n11: Number of attribution identifiers whose transformation factor element has the first value and whose result element has the first value
n12: Number of attribution identifiers whose transformation factor element has the first value and whose result element has the second value
n21: Number of attribution identifiers whose transformation factor element has the second value and whose result element has the first value
n22: Number of attribution identifiers whose transformation factor element has the second value and whose result element has the second value
n11+n12+n21+n22=number N of all belonging identifiers of cluster
4. The program according to claim 1, which causes a computer to function as described above.
前記評価値算出手段は、各クラスタについて、以下のように、結果要素に対する変容要因要素毎の評価値V1又はV2を、前記評価値Viとして算出する
変容要因要素の第1値における結果要素の第1値の評価値:P11=n11/(n11+n12)
変容要因要素の第1値における結果要素の第2値の評価値:P12=n12/(n11+n12)
変容要因要素の第2値における結果要素の第1値の評価値:P21=n21/(n21+n22)
変容要因要素の第2値における結果要素の第2値の評価値:P22=n22/(n21+n22)
当該変容要因要素に対する当該結果要素の第1値へ影響する評価値:V1=P11−P21
当該変容要因要素に対する当該結果要素の第2値へ影響する評価値:V2=P22−P12
ようにコンピュータを機能させることを特徴とする請求項4に記載のプログラム。
The evaluation value calculation means calculates, for each cluster, the evaluation value V1 or V2 for each change factor element with respect to the result element as the evaluation value Vi as follows. Evaluation value of 1 value: P11=n11/(n11+n12)
Evaluation value of the second value of the result element in the first value of the transformation factor element: P12=n12/(n11+n12)
Evaluation value of the first value of the result element in the second value of the transformation factor element: P21=n21/(n21+n22)
Evaluation value of the second value of the result element in the second value of the transformation factor element: P22=n22/(n21+n22)
Evaluation value that affects the first value of the result element for the transformation factor element: V1=P11-P21
Evaluation value that affects the second value of the result element for the transformation factor element: V2=P22-P12
The program according to claim 4, which causes a computer to function as described above.
前記評価値算出手段は、クラスタ毎に、以下のように、赤池情報量規準(AIC:Akaike's Information Criterion)を用いた、変容要因要素sが結果要素Cに偏って出現する影響割合V(s,C)を、変容要因要素に対する結果要素の評価値Viとして算出する
MLL_IM(s,C)=(n11+n12) log(n11+n12)
+(n11+n21) log(n11+n21)
+(n21+n22) log(n21+n22)
+(n12+n22) log(n12+n22)−2N log N
MLL_DM(s,C)=n11 log n11+n12 log n12+n21 log n21+n22 log n22−N log N
但し、N=n11+n12+n21+n22
AIC_IM(s,C)=-2 × MLL_IM(s,C) + 2×2
AIC_IM(s,C):変容要因要素sと結果要素Cとの組の従属AIC
AIC_DM(s,C)=-2 × MLL_DM(s,C) + 2×3
AIC_DM(s,C):変容要因要素sと結果要素Cとの組の独立AIC
V(s,C)=AIC_IM(s, C) − AIC_DM(s,C)
V(s,C):変容要因要素sと結果要素Cとの組の影響割合
ようにコンピュータを機能させることを特徴とする請求項4に記載のプログラム。
The evaluation value calculation means uses, for each cluster, the influence ratio V(s, V(s, C) is calculated as the evaluation value Vi of the result element for the transformation factor element
MLL_IM(s,C)=(n11+n12) log(n11+n12)
+(n11+n21) log(n11+n21)
+(n21+n22) log(n21+n22)
+(n12+n22) log(n12+n22)−2N log N
MLL_DM(s,C)=n11 log n11+n12 log n12+n21 log n21+n22 log n22−N log N
However, N=n11+n12+n21+n22
AIC_IM(s,C) = -2 x MLL_IM(s,C) + 2 x 2
AIC_IM(s,C): Subordinate AIC of the set of transformation factor element s and result element C
AIC_DM(s,C) = -2 x MLL_DM(s,C) + 2 x 3
AIC_DM(s,C): Independent AIC of the set of transformation factor element s and result element C
V(s,C) = AIC_IM(s, C)-AIC_DM(s,C)
V(s,C): The program according to claim 4, which causes a computer to function as an influence ratio of a set of a transformation factor element s and a result element C.
前記要因要素抽出手段は、各クラスタにおける結果要素に対する変容要因要素i毎の評価値Viの中で、最大値max(Vi)となる変容要因要素iを抽出する
ようにコンピュータを機能させることを特徴とする請求項1から6のいずれか1項に記載のプログラム。
The factor factor extraction means causes a computer to function so as to extract the transformation factor element i having the maximum value max(Vi) among the evaluation values Vi for each transformation factor element i for the result element in each cluster. The program according to any one of claims 1 to 6.
前記帰属識別子は、ユーザ識別子であり、
前記要因要素は、ユーザから収集可能な情報に基づくものであり、
前記結果要素は、ユーザ行動の有無に基づくものである
ようにコンピュータを機能させることを特徴とする請求項1から7のいずれか1項に記載のプログラム。
The attribution identifier is a user identifier,
The factor element is based on information that can be collected from the user,
The program according to any one of claims 1 to 7, wherein the result element causes the computer to function so as to be based on the presence or absence of a user action.
前記要因要素は、ユーザの日常行動としての利用料金、通信量、利用プラン、推奨度、通信品質、端末品質の組み合わせであり、
前記結果要素は、ユーザの購買行動としての契約の継続/解除である
ようにコンピュータを機能させることを特徴とする請求項8に記載のプログラム。
The factor element is a combination of a usage charge, communication volume, usage plan, recommendation level, communication quality, and terminal quality as a daily activity of a user,
The program according to claim 8, wherein the result element causes a computer to function as continuation/cancellation of a contract as a purchase behavior of a user.
前記帰属識別子は、センサ識別子であり、
前記要因要素は、センサから収集可能な情報に基づくものであり、
前記結果要素は、工程成果の有無に基づくものである
ようにコンピュータを機能させることを特徴とする請求項1から7のいずれか1項に記載のプログラム。
The attribution identifier is a sensor identifier,
The factor is based on information that can be collected from the sensor,
The program according to any one of claims 1 to 7, wherein the result element causes a computer to function so as to be based on the presence or absence of a process result.
帰属識別子毎に対応付けられた、値を含む「要因要素」及び「結果要素」を用いて、結果要素に影響を与える要因要素を抽出する分析装置であって、
複数の要因要素を、時系列で値が変容しにくい「不変要因要素」群と、時系列で値が変容しやすい「変容要因要素」群とに分類する要因要素群分類手段と、
帰属識別子の集合を、帰属識別子毎の各不変要因要素の値の類似度に基づいて複数のクラスタに分類するクラスタリング手段と、
前記クラスタ毎に、各変容要因要素について前記結果要素に影響を与える評価値を算出する評価値算出手段と、
前記結果要素の評価値に応じて、変容要因要素を抽出する要因要素抽出手段と
を有することを特徴とする分析装置。
An analysis device for extracting a factor element that influences a result element by using a “factor element” and a “result element” including a value, which are associated with each attribution identifier,
A factor element group classification means for classifying a plurality of factor elements into a group of "invariant factor elements" whose values are less likely to change in time series and a group of "transformation factor elements" whose values are more likely to change in time series,
Clustering means for classifying the set of belonging identifiers into a plurality of clusters based on the similarity of the values of the respective invariant factor elements for each belonging identifier,
Evaluation value calculation means for calculating an evaluation value that affects the result element for each transformation factor element for each cluster,
And a factor element extracting means for extracting a change factor element according to the evaluation value of the result element.
帰属識別子毎に対応付けられた、値を含む「要因要素」及び「結果要素」を用いて、結果要素に影響を与える要因要素を抽出する装置の分析方法であって、
前記装置は、
複数の要因要素を、時系列で値が変容しにくい「不変要因要素」群と、時系列で値が変容しやすい「変容要因要素」群とに分類する第1のステップと、
帰属識別子の集合を、帰属識別子毎の各不変要因要素の値の類似度に基づいて複数のクラスタに分類する第2のステップと、
前記クラスタ毎に、各変容要因要素について前記結果要素に影響を与える評価値を算出する第3のステップと、
前記結果要素の評価値に応じて、変容要因要素を抽出する第4のステップと
を実行することを特徴とする装置の分析方法。

A method of analyzing a device, which is associated with each attribution identifier, and uses a "factor element" and a "result element" that include a value to extract a factor element that affects the result element,
The device is
A first step of classifying a plurality of factor elements into an “invariant factor element” group whose values are less likely to change in time series and a “transformation factor element” group whose values are more likely to change value in time series;
A second step of classifying the set of attribution identifiers into a plurality of clusters based on the similarity of the values of the respective invariant factor elements for each attribution identifier;
A third step of calculating an evaluation value that affects the result element for each transformation factor element for each cluster,
And a fourth step of extracting a transformation factor element according to the evaluation value of the result element.

JP2017119280A 2017-06-19 2017-06-19 Program, analysis apparatus and method for extracting factors affecting results Active JP6730225B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017119280A JP6730225B2 (en) 2017-06-19 2017-06-19 Program, analysis apparatus and method for extracting factors affecting results

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017119280A JP6730225B2 (en) 2017-06-19 2017-06-19 Program, analysis apparatus and method for extracting factors affecting results

Publications (2)

Publication Number Publication Date
JP2019003525A JP2019003525A (en) 2019-01-10
JP6730225B2 true JP6730225B2 (en) 2020-07-29

Family

ID=65006867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017119280A Active JP6730225B2 (en) 2017-06-19 2017-06-19 Program, analysis apparatus and method for extracting factors affecting results

Country Status (1)

Country Link
JP (1) JP6730225B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464966B (en) * 2019-09-06 2024-07-02 富士通株式会社 Robustness estimating method, data processing method, and information processing apparatus

Also Published As

Publication number Publication date
JP2019003525A (en) 2019-01-10

Similar Documents

Publication Publication Date Title
CN107146089B (en) Method and device for identifying bill swiping and electronic equipment
CN107066616B (en) Account processing method and device and electronic equipment
CN109165975B (en) Label recommending method, device, computer equipment and storage medium
CN106294590B (en) A kind of social networks junk user filter method based on semi-supervised learning
CN108363821A (en) A kind of information-pushing method, device, terminal device and storage medium
CN107341268B (en) Hot searching ranking method and system
CN109934704A (en) Information recommendation method, apparatus, device and storage medium
CN111339439B (en) Collaborative filtering recommendation method and device fusing comment text and time sequence effect
US20190355021A1 (en) Heuristic customer clustering
CN105095219A (en) Weibo recommendation method and terminal
EP2864938A1 (en) Method and apparatus for inferring user demographics
CN104268572B (en) Feature extraction and feature selection approach towards backstage multi-source data
CN111340380B (en) Client resource allocation method, device and storage medium
CN112632000A (en) Log file clustering method and device, electronic equipment and readable storage medium
CN110502639B (en) Information recommendation method and device based on problem contribution degree and computer equipment
CN109961309A (en) Business recommended method and system
JP6730225B2 (en) Program, analysis apparatus and method for extracting factors affecting results
CN113065892A (en) Information pushing method, device, equipment and storage medium
CN112269937A (en) Method, system and device for calculating user similarity
CN117172825A (en) Electronic commerce data analysis method and device based on big data and computing equipment
CN110879841B (en) Knowledge item recommendation method, device, computer equipment and storage medium
KR101658714B1 (en) Method and system for predicting online customer action based on online activity history
CN113723522B (en) Abnormal user identification method and device, electronic equipment and storage medium
US20220075804A1 (en) Method and device for providing guide information for enhancement of artist&#39;s reputation
Jiang et al. Durable product review mining for customer segmentation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200702

R150 Certificate of patent or registration of utility model

Ref document number: 6730225

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150