[go: up one dir, main page]

JP7576058B2 - Information processing system, method and program - Google Patents

Information processing system, method and program Download PDF

Info

Publication number
JP7576058B2
JP7576058B2 JP2022056449A JP2022056449A JP7576058B2 JP 7576058 B2 JP7576058 B2 JP 7576058B2 JP 2022056449 A JP2022056449 A JP 2022056449A JP 2022056449 A JP2022056449 A JP 2022056449A JP 7576058 B2 JP7576058 B2 JP 7576058B2
Authority
JP
Japan
Prior art keywords
attribute
user
geographical
geographic
fact
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022056449A
Other languages
Japanese (ja)
Other versions
JP2023148436A (en
Inventor
智彦 山下
大樹 町田
垠 呉
スブラタ オシュ
麻里子 河崎
アシュリー ジェーン
卓志 梅田
カイル ミード
ヴィネーラジュ ポリヤプラム
プリンス アガルワル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Group Inc filed Critical Rakuten Group Inc
Priority to JP2022056449A priority Critical patent/JP7576058B2/en
Priority to TW112111660A priority patent/TWI868641B/en
Publication of JP2023148436A publication Critical patent/JP2023148436A/en
Application granted granted Critical
Publication of JP7576058B2 publication Critical patent/JP7576058B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本開示は、ユーザに関するスコアの算出等の評価を支援するための技術に関する。 This disclosure relates to technology for supporting evaluations such as calculating scores for users.

従来、ユーザの行動を示す行動情報を取得するユーザ情報取得部と、行動情報に基づいて、将来のユーザの融資に対する返済能力に関する信用度を判定する信用度判定部と、を備える判定装置が提案されている(特許文献1を参照)。また、ユーザ端末に表示されるフォーマットに入力されたパラメータの情報を取得する入力情報取得部と、ユーザ端末から継続的に送信されるユーザの行動履歴を取得する行動履歴取得部と、パラメータと行動履歴に基づいて、信用スコアを算出する信用スコア算出部と、を備える信用スコア管理サーバが提案されている(例えば、特許文献2を参照)。 Conventionally, a judgment device has been proposed that includes a user information acquisition unit that acquires behavioral information indicating a user's behavior, and a credit judgment unit that judges the user's creditworthiness regarding his or her future ability to repay loans based on the behavioral information (see Patent Document 1). Also proposed is a credit score management server that includes an input information acquisition unit that acquires parameter information entered into a format displayed on a user terminal, a behavior history acquisition unit that acquires the user's behavior history continuously transmitted from the user terminal, and a credit score calculation unit that calculates a credit score based on the parameters and behavior history (see, for example, Patent Document 2).

特開2021-174039号公報JP 2021-174039 A 特開2020-009226号公報JP 2020-009226 A

従来、ユーザの行動履歴に基づいてユーザの信用度等を表すユーザスコアを算出する技術が提案されている。また、ユーザの居住地等のユーザに関連する地理的位置を活用してユーザに対して提供されるサービスの利便性を向上させる技術についても、種々提案されている。しかし、ユーザスコアの算出に際しては主として対象ユーザに直接関連する情報が当該ユーザの属性として扱われており、ユーザスコアの正確性を向上させるにあたって改善の余地があった。 Conventionally, technologies have been proposed that calculate a user score that represents a user's credibility, etc., based on the user's behavioral history. In addition, various technologies have been proposed that improve the convenience of services provided to users by utilizing geographic locations related to the user, such as the user's place of residence. However, when calculating the user score, information directly related to the target user is mainly treated as the attributes of that user, and there is room for improvement in improving the accuracy of the user score.

本開示は、上記した問題に鑑み、ユーザに係る地理的位置から推測されるコンテキストをユーザの評価に反映するための情報処理を実現することを課題とする。 In view of the above problems, the present disclosure aims to realize information processing for reflecting the context inferred from the geographic location of a user in the user's evaluation.

本開示の一例は、ユーザに係る地理的位置及び所定のマップデータに基づいて、前記地理的位置に係る地理的事実属性を決定する属性決定手段と、決定された前記地理的事実属性に基づいて、前記ユーザにかかる属性データ群の少なくとも一部を推定する属性推定手段と、推定された前記属性データ群に基づいて、前記ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、を備える情報処理システムである。 An example of the present disclosure is an information processing system including an attribute determination means for determining a geographic fact attribute related to a geographic location based on a geographic location related to a user and predetermined map data, an attribute estimation means for estimating at least a part of a group of attribute data related to the user based on the determined geographic fact attribute, and a user score estimation means for estimating a user score to be set for the user based on the estimated group of attribute data.

本開示は、情報処理装置、システム、コンピュータによって実行される方法又はコンピュータに実行させるプログラムとして把握することが可能である。また、本開示は、そのようなプログラムをコンピュータその他の装置、機械等が読み取り可能な記録媒体に記録したものとしても把握できる。ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的又は化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。 The present disclosure can be understood as an information processing device, a system, a method executed by a computer, or a program executed by a computer. The present disclosure can also be understood as such a program recorded on a recording medium readable by a computer or other device, machine, etc. Here, a recording medium readable by a computer, etc. refers to a recording medium that stores information such as data and programs through electrical, magnetic, optical, mechanical, or chemical action and can be read by a computer, etc.

本開示によれば、ユーザに係る地理的位置から推測されるコンテキストをユーザの評価に反映するための情報処理を実現することが可能となる。 According to the present disclosure, it is possible to realize information processing for reflecting the context inferred from the geographical location of a user in the user's evaluation.

実施形態に係る情報処理システムの構成を示す概略図である。1 is a schematic diagram showing a configuration of an information processing system according to an embodiment. 実施形態に係る情報処理装置の機能構成の概略を示す図である。1 is a diagram illustrating an outline of a functional configuration of an information processing device according to an embodiment. 実施形態に係る地理的推定属性の推定処理の簡略図である。FIG. 2 is a simplified diagram of a geographical attribute estimation process according to an embodiment. 実施形態に係るユーザスコア推定処理の簡略図である。1 is a simplified diagram of a user score estimation process according to an embodiment. 実施形態において採用される機械学習モデルの決定木の概念を簡略図である。FIG. 1 is a simplified diagram illustrating the concept of a decision tree of a machine learning model employed in an embodiment. 実施形態に係る機械学習処理の流れを示すフローチャートである。1 is a flowchart illustrating a flow of a machine learning process according to an embodiment. 実施形態に係るユーザスコア推定処理の流れを示すフローチャートである。11 is a flowchart showing a flow of a user score estimation process according to the embodiment. 第1バリエーションに係る情報処理装置の機能構成の概略を示す図である。FIG. 13 is a diagram illustrating an outline of a functional configuration of an information processing device according to a first variation. 第2バリエーションに係るユーザスコア推定処理の簡略図である。13 is a simplified diagram of a user score estimation process according to a second variation. 第3バリエーションに係るユーザスコア推定処理の簡略図である。13 is a simplified diagram of a user score estimation process according to a third variation. 第4バリエーションに係るユーザスコア推定処理の簡略図である。13 is a simplified diagram of a user score estimation process according to a fourth variation. 第5バリエーションに係るユーザスコア推定処理の簡略図である。13 is a simplified diagram of a user score estimation process according to a fifth variation.

以下、本開示に係る情報処理装置、方法及びプログラムの実施の形態を、図面に基づいて説明する。但し、以下に説明する実施の形態は、実施形態を例示するものであって、本開示に係る情報処理装置、方法及びプログラムを以下に説明する具体的構成に限定するものではない。実施にあたっては、実施の態様に応じた具体的構成が適宜採用され、また、種々の改良や変形が行われてよい。本発明は、後述する実施形態、バリエーションの夫々における構成の少なくとも一部を適宜、互いに採用することができる。 Below, an embodiment of an information processing device, method, and program according to the present disclosure will be described with reference to the drawings. However, the embodiment described below is merely an example of an embodiment, and the information processing device, method, and program according to the present disclosure are not limited to the specific configurations described below. In implementing the present invention, a specific configuration according to the mode of implementation may be appropriately adopted, and various improvements and modifications may be made. The present invention allows at least a portion of the configurations in the embodiments and variations described below to be adopted in each other as appropriate.

本実施形態では、本開示に係る技術を、ユーザに関連する何らかの尺度(例えば、信用等)を示すユーザスコアを管理するユーザスコア管理システムのために実施した場合の実施の形態について説明する。但し、本開示に係る技術は、ユーザスコアの推定等のユーザ評価を支援するための技術について広く用いることが可能であり、本開示の適用対象は、実施形態において示した例に限定されない。 In this embodiment, an embodiment will be described in which the technology according to the present disclosure is implemented for a user score management system that manages a user score that indicates some measure related to a user (e.g., credit, etc.). However, the technology according to the present disclosure can be widely used for technology to support user evaluation, such as estimating user scores, and the application of the present disclosure is not limited to the examples shown in the embodiment.

<システムの構成>
図1は、本実施形態に係る情報処理システムの構成を示す概略図である。本実施形態に係るシステムでは、情報処理装置1と、1又は複数のサービス提供システム5と、が互いに通信可能に接続されている。ユーザは、サービス提供システム5によって提供されるサービスの利用者であり、ユーザ端末からサービス提供システム5にアクセスすることでサービスの提供を受ける。
<System Configuration>
1 is a schematic diagram showing the configuration of an information processing system according to this embodiment. In the system according to this embodiment, an information processing device 1 and one or more service providing systems 5 are connected to each other so as to be able to communicate with each other. A user is a user of a service provided by the service providing system 5, and receives the service by accessing the service providing system 5 from a user terminal.

情報処理装置1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、EEPROM(Electrically Erasable and Programmable Read Only Memory)やHDD(Hard Disk Drive)等の記憶装置14、NIC(Network Interface Card)等の通信ユニット15、等を備えるコンピュータである。但し、情報処理装置1の具体的なハードウェア構成に関しては、実施の態様に応じて適宜省略や置換、追加が可能である。また、情報処理装置1は、単一の筐体からなる装置に限定されない。情報処理装置1は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。 The information processing device 1 is a computer including a CPU (Central Processing Unit) 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, a storage device 14 such as an EEPROM (Electrically Erasable and Programmable Read Only Memory) or a HDD (Hard Disk Drive), a communication unit 15 such as a NIC (Network Interface Card), etc. However, the specific hardware configuration of the information processing device 1 can be omitted, replaced, or added as appropriate depending on the embodiment. Furthermore, the information processing device 1 is not limited to a device consisting of a single housing. The information processing device 1 may be realized by multiple devices using so-called cloud or distributed computing technology, etc.

情報処理装置1は、ユーザ毎にユーザスコアを管理し、サービス提供システム5に対してユーザスコアを提供する。サービス提供システム5は、情報処理装置1から提供されたユーザスコアに応じて、対象ユーザに対するサービスをカスタマイズすることが可能である。 The information processing device 1 manages a user score for each user and provides the user score to the service providing system 5. The service providing system 5 can customize services for the target user according to the user score provided by the information processing device 1.

サービス提供システム5は、CPU、ROM、RAM、記憶装置、通信ユニット、入力装置、出力装置等(図示は省略する)を備えるコンピュータである。また、これらのシステム及び端末は、いずれも、単一の筐体からなる装置に限定されない。これらのシステム及び端末は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。 The service providing system 5 is a computer equipped with a CPU, ROM, RAM, a storage device, a communication unit, an input device, an output device, etc. (not shown). Furthermore, these systems and terminals are not limited to devices consisting of a single housing. These systems and terminals may be realized by multiple devices using so-called cloud or distributed computing technology, etc.

サービス提供システム5によって提供されるサービスは、例えば、地図情報サービスやクレジットカード/後払い決済サービス、電子マネー決済サービス、オンラインショッピングサービス、オンライン予約サービス、オペレーションセンターサービス等である。なお、「後払い決済」には、所謂Buy Now Pay Later(BNPL)等と称されるサービスに限定されず、あらゆる後払いによる商品/サービスの購入が含まれるものとする。サービス提供システム5によって提供されるサービスは本実施形態における例示に限定されない。そして、サービス提供システム5は、サービスの提供に際してユーザから取得された当該ユーザの属性データ群221を情報処理装置1に通知する。ここで、ユーザの属性データ群221には当該ユーザによるサービスの利用履歴データが含まれる。サービスの利用履歴データの内容はサービスの内容に応じて様々であり、例えば、ユーザの位置情報の履歴データ、クレジットカード利用額/後払い決済利用額の支払履歴データ、電子マネー利用履歴データ、取引履歴データ、予約履歴データ、オペレーションセンターからのユーザに対するオペレーション履歴データ等が含まれてよい。 The services provided by the service providing system 5 are, for example, map information services, credit card/postpaid payment services, electronic money payment services, online shopping services, online reservation services, operation center services, etc. Note that "postpaid payment" is not limited to services such as Buy Now Pay Later (BNPL), but includes any purchase of products/services with postpaid payment. The services provided by the service providing system 5 are not limited to the examples in this embodiment. The service providing system 5 notifies the information processing device 1 of the attribute data group 221 of the user acquired from the user when the service is provided. Here, the attribute data group 221 of the user includes service usage history data by the user. The content of the service usage history data varies depending on the content of the service, and may include, for example, history data of the user's location information, payment history data of credit card usage amount/postpaid payment usage amount, electronic money usage history data, transaction history data, reservation history data, operation history data for the user from the operation center, etc.

図2は、本実施形態に係る情報処理装置1の機能構成の概略を示す図である。情報処理装置1は、記憶装置14に記録されているプログラムが、RAM13に読み出され、CPU11によって実行されて、情報処理装置1に備えられた各ハードウェアが制御されることで、属性決定部21、属性推定部22、ユーザスコア推定部23、及び機械学習部24を備える情報処理装置として機能する。なお、本実施形態及び後述する他の実施形態では、情報処理装置1の備える各機能は、汎用プロセッサであるCPU11によって実行されるが、これらの機能の一部又は全部は、1又は複数の専用プロセッサによって実行されてもよい。 FIG. 2 is a diagram showing an outline of the functional configuration of the information processing device 1 according to this embodiment. The information processing device 1 functions as an information processing device including an attribute determination unit 21, an attribute estimation unit 22, a user score estimation unit 23, and a machine learning unit 24, by a program recorded in the storage device 14 being read into the RAM 13 and executed by the CPU 11, which controls each piece of hardware included in the information processing device 1. Note that in this embodiment and other embodiments described below, each function included in the information processing device 1 is executed by the CPU 11, which is a general-purpose processor, but some or all of these functions may be executed by one or more dedicated processors.

属性決定部21は、ユーザに係る地理的位置及び所定のマップデータに基づいて、ユーザの地理的位置に係る地理的事実属性211を決定する。ユーザに係る地理的位置としては、例えば、ユーザの居住地、勤務地、就学地等が挙げられる。その他、ユーザに係る地理的位置としては、例えばユーザが頻繁に訪れる商業地や行楽地、観光地等が含まれてもよく、ユーザに係る地理的位置の種類は本実施形態における例示に限定されない。本実施形態において、属性決定部21は、ユーザの行動情報(行動履歴)に基づいて当該ユーザに係る地理的位置を推定し、推定されたユーザの地理的位置及び所定のマップデータに基づいて地理的位置に係る地理的事実属性211を決定する。ここで、ユーザの行動情報(行動履歴)として用いられる情報には、例えば、サービス提供システム5等から取得可能なユーザの位置情報の履歴データ等が用いられる。ここで、サービス提供システム5等によるユーザの位置情報を取得するための技術及び位置情報の種類は限定されず、GPS等のGNSSによって得られたユーザ端末の位置情報や、携帯電話基地局、衛星基地局、等の基地局とユーザ端末との信号の送受信や、Wi-Fiアクセスポイント等のビーコン発信源からのビーコンに基づいて推定されたユーザ端末の位置情報等を用いることが出来る。ここで、ビーコンとは、例として、物理ビーコンであってよく、仮想ビーコンであってよく、屋内のビーコン発信源から受信可能なビーコンであってよく、屋外のビーコン発信源から受信可能なビーコンであってよく、その組み合わせであってよい。 The attribute determination unit 21 determines the geographic fact attribute 211 related to the geographic location of the user based on the geographic location of the user and the predetermined map data. Examples of the geographic location of the user include the user's place of residence, place of work, place of study, etc. Other geographic locations of the user may include, for example, commercial areas, recreational areas, tourist spots, etc. that the user frequently visits, and the types of geographic locations of the user are not limited to the examples in this embodiment. In this embodiment, the attribute determination unit 21 estimates the geographic location of the user based on the user's behavioral information (behavioral history), and determines the geographic fact attribute 211 related to the geographic location based on the estimated geographic location of the user and the predetermined map data. Here, the information used as the user's behavioral information (behavioral history) is, for example, history data of the user's location information that can be obtained from the service provision system 5, etc. Here, the technology for acquiring user location information by the service providing system 5 and the like and the type of location information are not limited, and it is possible to use location information of the user terminal acquired by GNSS such as GPS, transmission and reception of signals between the user terminal and base stations such as mobile phone base stations and satellite base stations, location information of the user terminal estimated based on beacons from beacon sources such as Wi-Fi access points, etc. Here, the beacon may be, for example, a physical beacon, a virtual beacon, a beacon that can be received from an indoor beacon source, a beacon that can be received from an outdoor beacon source, or a combination thereof.

本実施形態において、属性決定部21は、ユーザの行動情報(行動履歴)に基づき、当該ユーザに係る地理的位置を推定する。例えば、属性決定部21は、対象ユーザについて蓄積された位置情報の履歴データを集計し、ユーザが滞在していた時間の長さやユーザが滞在していた時間帯に基づいて、ユーザに係る地理的位置を推定することが出来る。より具体的には、ユーザに係る地理的位置としてユーザの居住地を推定したい場合、属性決定部21は、ユーザが一般的に在宅している可能性が高いと考えられる所定の時間帯(例えば、18時から8時の夜間帯)にユーザの位置情報が集中している位置を、ユーザの居住地として推定することが出来る。また、ユーザに係る地理的位置としてユーザの勤務地や就学地等を推定したい場合、属性決定部21は、ユーザが一般的に就業又は就学している可能性が高いと考えられる所定の時間帯(例えば、8時から18時の昼間帯)にユーザの位置情報が集中している位置を、ユーザの勤務地等として推定することが出来る。なお、ここでは、夜間帯にユーザが滞在している位置を居住地、昼間帯にユーザが滞在している位置を勤務地等として推定する例を説明しているが、ユーザの居住地及び/又は勤務地等を推定するために参照する時間帯は、特定の時間帯に限定されない。ユーザの居住地及び/又は勤務地等を推定するために参照する時間帯は、他の属性データを参照することで得られるユーザの職種や勤務時間帯に応じて変更されてよい。 In this embodiment, the attribute determination unit 21 estimates a geographical location related to the user based on the user's behavioral information (behavioral history). For example, the attribute determination unit 21 can aggregate historical data of location information accumulated for the target user and estimate the geographical location related to the user based on the length of time the user stayed and the time period in which the user stayed. More specifically, when it is desired to estimate the user's residence as the geographical location related to the user, the attribute determination unit 21 can estimate, as the user's residence, a location where the user's location information is concentrated during a predetermined time period (for example, the nighttime period from 18:00 to 8:00) in which the user is generally likely to be at home. In addition, when it is desired to estimate the user's place of work or place of school, etc. as the geographical location related to the user, the attribute determination unit 21 can estimate, as the user's place of work, etc., a location where the user's location information is concentrated during a predetermined time period (for example, the daytime period from 8:00 to 18:00) in which the user is generally likely to be working or studying. Note that, here, an example is described in which the location where the user is staying during the nighttime is estimated as the residence, and the location where the user is staying during the daytime is estimated as the workplace, etc., but the time period referenced to estimate the user's residence and/or workplace, etc. is not limited to a specific time period. The time period referenced to estimate the user's residence and/or workplace, etc. may be changed depending on the user's occupation and working hours obtained by referring to other attribute data.

また、属性決定部21は、ユーザの滞在する場所の地理的事実属性211に応じて当該ユーザに係る地理的位置及び当該地理的位置の種類を推定してもよい。即ち、対象ユーザが所定時間以上滞在する位置が住宅街としての地理的事実属性211を有している場合には、当該位置をユーザの居住地として推定し、対象ユーザが所定時間以上滞在する位置がオフィス街としての地理的事実属性211を有している場合には、当該位置をユーザの勤務地等として推定してもよい。この際、属性決定部21は、指定された位置が住宅街であるかオフィス街であるか等の地理的事実属性211の種類を判定可能なマップデータを参照することで、ユーザに係る地理的位置の種類を推定することが出来る。 The attribute determination unit 21 may also estimate the geographical location and the type of the geographical location related to the user according to the geographical fact attribute 211 of the place where the user stays. That is, if the location where the target user stays for a predetermined time or more has the geographical fact attribute 211 of a residential area, the location may be estimated as the user's residence, and if the location where the target user stays for a predetermined time or more has the geographical fact attribute 211 of an office district, the location may be estimated as the user's workplace, etc. In this case, the attribute determination unit 21 can estimate the type of geographical location related to the user by referring to map data that can determine the type of geographical fact attribute 211, such as whether the specified location is a residential area or an office district.

なお、本実施形態では、ユーザに係る地理的位置をユーザの行動情報(行動履歴)に基づいて推定する方法を採用しているが、ユーザに係る地理的位置はその他の方法で取得されてもよい。例えば、ユーザに係る地理的位置として、ユーザ自身によって登録された住所情報や勤務先情報、就学先情報が用いられてもよい。また、ユーザの行動履歴は、所定の場所に設置されたログイン端末やカメラを用いて得られたユーザの行動履歴であってもよく、所定の場所でユーザ識別子と対応付けられたポイントカードの提示等をともなって行われたユーザによる決済処理にともない更新されるユーザの行動履歴であってもよく、所定の場所でユーザが携帯するユーザ端末によって行われた決済処理にともない更新されるユーザの行動履歴であってよく、ユーザが外出時に携帯するユーザ端末による所定の場所に設置されたコード画像の読取処理にともない更新されるユーザの行動履歴であってもよく、所定の場所に設置された非接触リーダとユーザが外出時に携帯するユーザ端末との間で行われる近距離無線通信(NFC)にともない更新されるユーザの行動履歴であってよい。 In this embodiment, a method is adopted in which the geographical location of the user is estimated based on the user's behavioral information (behavioral history), but the geographical location of the user may be obtained by other methods. For example, address information, workplace information, and school information registered by the user themselves may be used as the geographical location of the user. In addition, the user's behavioral history may be a user's behavioral history obtained using a login terminal or a camera installed at a predetermined location, a user's behavioral history updated in conjunction with a payment process performed by the user with the presentation of a point card associated with a user identifier at a predetermined location, a user's behavioral history updated in conjunction with a payment process performed by a user terminal carried by the user at a predetermined location, a user's behavioral history updated in conjunction with a code image reading process installed at a predetermined location by a user terminal carried by the user when going out, or a user's behavioral history updated in conjunction with near-field wireless communication (NFC) performed between a contactless reader installed at a predetermined location and a user terminal carried by the user when going out.

ユーザに係る地理的位置が推定されると、属性決定部21は、所定のマップデータに基づいて当該地理的位置に係る地理的事実属性211を決定する。ここで、地理的事実属性211は、ある地理的位置が何らかの属性を有しているか否か(属性、属性値の有無)、を示す情報である。地理的事実属性211は、地理的位置に対して所定の属性(地理的推定属性)が適用される蓋然性を示す地理的スコアの推定の用に適宜、供される。このため、マップデータは、地理的位置を指定することで当該位置に対応する地理的事実属性211が取得可能なデータであればよく、一般的な地図データに限定されない。また、地理的位置の指定方法についても、一般的には緯度経度等が用いられるが、市区町村を示す住所や郵便番号等が用いられてもよく、具体的な指定方法や指定のフォーマットは限定されない。マップデータとしては、以下に例示するようなデータを用いることが可能である。 When the geographical position of the user is estimated, the attribute determination unit 21 determines the geographical fact attribute 211 related to the geographical position based on the predetermined map data. Here, the geographical fact attribute 211 is information indicating whether or not a certain geographical position has some attribute (presence or absence of an attribute, attribute value). The geographical fact attribute 211 is appropriately used for estimating a geographical score indicating the probability that a predetermined attribute (geographical estimated attribute) is applied to the geographical position. For this reason, the map data is not limited to general map data as long as it is data that can acquire the geographical fact attribute 211 corresponding to the position by specifying the geographical position. In addition, the method of specifying the geographical position is generally latitude and longitude, but an address or postal code indicating a city, ward, town, or village may also be used, and the specific method of specification and format of specification are not limited. As the map data, data such as the following examples can be used.

(1)過去の状態を特定可能なマップデータ
マップデータは、地理的位置に対応する地理的事実属性211として、当該位置の過去の状態を特定可能なデータであってよい。この場合、属性決定部21は、対象ユーザに係る地理的位置に対応する過去の状態に基づいて、対象ユーザが所在し得る地理的位置にかかる地理的事実属性211を決定する。例えば、地理的位置に対応する過去の状態として旧河川や旧三業地等が挙げられ、これらの過去の状態は今後の地価等に関連する可能性があるため、何らかの推定処理等のための地理的事実属性211として扱い得る。また、例えば、地理的位置に対応する過去の状態として埋め立て前の海等が挙げられ、これらの過去の状態は今後の地価等に関連する可能性があるため、地理的事実属性211として扱い得る。
(1) Map data capable of identifying a past state The map data may be data capable of identifying a past state of a geographical location as a geographical fact attribute 211 corresponding to the geographical location. In this case, the attribute determination unit 21 determines the geographical fact attribute 211 related to the geographical location where the target user may be located based on the past state corresponding to the geographical location related to the target user. For example, examples of past states corresponding to a geographical location include an old river and an old three-industry area, and these past states may be related to future land prices, etc., and therefore may be treated as geographical fact attributes 211 for some kind of estimation processing, etc. In addition, for example, examples of past states corresponding to a geographical location include the sea before reclamation, and these past states may be related to future land prices, etc., and therefore may be treated as geographical fact attributes 211.

(2)周辺に存在する他の地理的位置との関係性を特定可能なマップデータ
マップデータは、地理的位置に対応する地理的事実属性211として、当該位置と当該位置周辺に存在する他の地理的位置との関係性を特定可能なデータであってよい。この場合、属性決定部21は、対象ユーザに係る地理的位置と当該地理的位置周辺に存在する他の地理的位置との関係性に基づいて、対象ユーザが所在し得る地理的位置にかかる地理的事実属性211を決定する。例えば、地理的位置と当該位置周辺に存在する他の地理的位置との関係性として、周囲と比べた標高差(高い/低い)や、表層地盤増幅率/表層地盤増幅率の高低、一級河川からの距離、設立400年以上の神社・寺社からの距離、1km以内に設立400年以上の神社・寺社の有無、等が挙げられ、これらの関係性は今後の地価や災害リスク等に関連する可能性があるため、地理的事実属性211として扱い得る。また、例えば、地理的位置と当該位置周辺に存在する他の地理的位置との関係性として、地理的位置の周辺における駅、病院、公園、役所、図書館等の有無、等が挙げられ、これらの関係性は今後の地価や不動産価格等に関連する可能性があるため、地理的事実属性211として扱い得る。また、例えば、地理的位置と当該位置周辺に存在する他の地理的位置との関係性として、地理的位置の周辺における社屋、工場、製造拠点等の企業拠点の有無、等が挙げられ、これらの関係性は今後の地価や税収等に関連する可能性があるため、地理的事実属性211として扱い得る。また、例えば、地理的位置と当該位置周辺に存在する他の地理的位置との関係性として、地理的位置およびその近傍におけるパチンコ店や、競馬場、競艇場、競輪場、オートレース会場等の公営競技場、等が挙げられ、これらの関係性は今後の地価等に関連する可能性があるため、地理的事実属性211として扱い得る。
(2) Map data capable of identifying a relationship between a geographical location and other geographical locations existing in the vicinity The map data may be data capable of identifying a relationship between the location and other geographical locations existing in the vicinity of the location as a geographical fact attribute 211 corresponding to the geographical location. In this case, the attribute determination unit 21 determines the geographical fact attribute 211 related to the geographical location where the target user may be located based on the relationship between the geographical location related to the target user and other geographical locations existing in the vicinity of the geographical location. For example, the relationship between a geographical location and other geographical locations existing in the vicinity of the location may include an elevation difference (high/low) compared to the surroundings, a high or low surface ground amplification rate/a high or low surface ground amplification rate, a distance from a first-class river, a distance from a shrine or temple established more than 400 years ago, and the presence or absence of a shrine or temple established more than 400 years ago within 1 km. These relationships may be related to future land prices, disaster risks, etc., and therefore may be treated as the geographical fact attribute 211. Furthermore, for example, the relationship between a geographical location and other geographical locations existing around the location includes the presence or absence of a station, hospital, park, government office, library, etc., in the vicinity of the geographical location, and these relationships may be related to future land prices, real estate prices, etc., and therefore may be treated as the geographical fact attribute 211. Furthermore, for example, the relationship between a geographical location and other geographical locations existing around the location includes the presence or absence of a corporate base such as a company building, factory, manufacturing base, etc., in the vicinity of the geographical location, and these relationships may be related to future land prices, tax revenues, etc., and therefore may be treated as the geographical fact attribute 211. Furthermore, for example, the relationship between a geographical location and other geographical locations existing around the location includes the presence or absence of a pachinko parlor, a horse racing track, a boat racing track, a bicycle racing track, a public racing track such as an auto race track, etc., in the vicinity of the geographical location, and these relationships may be related to future land prices, etc., and therefore may be treated as the geographical fact attribute 211.

(3)地域に係る情報を特定可能なマップデータ
マップデータは、地理的位置に対応する地理的事実属性211として、当該位置を含む地域に係る情報を特定可能なデータであってよい。この場合、属性決定部21は、対象ユーザに係る地理的位置を含む地域に係る情報に基づいて、対象ユーザが所在し得る地理的位置にかかる地理的事実属性211を決定する。例えば、地理的位置を含む地域に係る情報として、治安に関する統計情報や経済指標等が挙げられ、これらの地域情報は今後の地価等に関連する可能性があるため、何らかの推定処理等のための地理的事実属性211として扱い得る。また、例えば、地理的位置を含む地域に係る情報として、全域人口、人口増減、将来人口推計、年齢別人口、配偶関係別人口、日本人・外国人別人口、世帯の状況(家族類型別割合、家族類型別一般世帯数の推移)、住居の状況(住宅の建て方別住宅に住む一般世帯数の推移)、国籍別外国人人口等の国勢調査により明らかとなる人口等基本集計結果、等が挙げられ、これらの地域情報は今後の地価等に関連する可能性があるため、地理的事実属性211として扱い得る。また、例えば、地理的位置を含む地域に係る情報として、人口の労働力状態、夫婦、子供のいる世帯等の産業・職業大分類別構成等の国勢調査により明らかとなる就業状態等基本集計結果、等が挙げられ、これらの地域情報は今後の地価等に関連する可能性があるため、地理的事実属性211として扱い得る。また、例えば、地理的位置を含む地域に係る情報として、人流データ等の国土情報等が挙げられ、これらの地域情報は今後の地価等に関連する可能性があるため、地理的事実属性211として扱い得る。
(3) Map data capable of identifying information related to a region The map data may be data capable of identifying information related to a region including a geographical position as a geographical fact attribute 211 corresponding to the geographical position. In this case, the attribute determination unit 21 determines the geographical fact attribute 211 related to the geographical position where the target user may be located based on information related to the region including the geographical position related to the target user. For example, information related to the region including the geographical position includes statistical information on public safety and economic indicators, and such regional information may be related to future land prices, etc., and therefore may be treated as the geographical fact attribute 211 for some kind of estimation processing, etc. In addition, for example, information related to the region including the geographical position includes the total population, population increase/decrease, future population estimate, population by age, population by marital status, population by Japanese/foreigner, household situation (proportion by family type, trend in number of general households by family type), housing situation (trend in number of general households living in houses by construction type), basic population tabulation results such as foreigner population by nationality, etc., which are revealed by the census, and such regional information may be related to future land prices, etc., and therefore may be treated as the geographical fact attribute 211. Furthermore, for example, information relating to an area including a geographical position includes basic aggregate results of employment status and the like revealed by a national census, such as the labor force status of the population, and the composition of industrial and occupational major classifications such as married couples and households with children, and since this regional information may be related to future land prices, etc., it can be treated as the geographical fact attribute 211. Furthermore, for example, information relating to an area including a geographical position includes national land information such as people flow data, and since this regional information may be related to future land prices, it can be treated as the geographical fact attribute 211.

図3は、実施形態に係る地理的推定属性の推定処理の簡略図である。属性推定部22は、ユーザにかかる属性データ群221を推定する。ユーザにかかる属性データ群221には、サービス提供システム5から取得された利用履歴データを含む属性データが含まれるが、この際、属性推定部22は、属性決定部21によって決定された地理的事実属性211に基づいて、地理的推定属性222を、ユーザにかかる属性データ群221の少なくとも一部として推定する。なお、属性推定部22は、1又は複数の決定された地理的事実属性211に基づいて、地理的推定属性222を推定し、地理的推定属性222をユーザに係る属性データ群221の少なくとも一部として決定してよい。なお、本実施形態において、属性推定部22は、地理的推定属性222をそのままユーザにかかる属性データ群221の一部として決定し、属性データ群221として用いる。属性推定部22は、決定された地理的事実属性211に対して何らかの加工(正規化やランク化、ラベル化等)を施して属性データ群221の一部としてもよいし、決定された地理的事実属性211を用いて算出された他の種類のスコア又はラベルを属性データとしてもよい。ここで、他の種類のスコア又はラベルの算出には、他の機械学習モデルが介在してもよい。例えば、属性推定部22は、決定された地理的事実属性211を入力値とし地理的スコア222A又は地理的ラベル222Bを出力値とする教師データを用いて生成された属性推定モデル220を用いて、ユーザにかかる属性データ群221の少なくとも一部を決定してもよい。ここで、地理的スコア222Aとは、所定の属性、属性値(地理的推定属性)が適用され得る度合いを示すスコアであり、地理的ラベル222Bとは、所定の属性、属性値の種別を示す情報である。 3 is a simplified diagram of the estimation process of the geographical estimated attribute according to the embodiment. The attribute estimation unit 22 estimates the attribute data group 221 related to the user. The attribute data group 221 related to the user includes attribute data including the usage history data acquired from the service providing system 5. At this time, the attribute estimation unit 22 estimates the geographical estimated attribute 222 as at least a part of the attribute data group 221 related to the user based on the geographical fact attribute 211 determined by the attribute determination unit 21. The attribute estimation unit 22 may estimate the geographical estimated attribute 222 based on one or more determined geographical fact attributes 211 and determine the geographical estimated attribute 222 as at least a part of the attribute data group 221 related to the user. In this embodiment, the attribute estimation unit 22 determines the geographical estimated attribute 222 as a part of the attribute data group 221 related to the user as it is, and uses it as the attribute data group 221. The attribute estimation unit 22 may perform some processing (normalization, ranking, labeling, etc.) on the determined geographic fact attribute 211 to make it a part of the attribute data group 221, or may use the determined geographic fact attribute 211 to calculate other types of scores or labels as attribute data. Here, other machine learning models may be involved in the calculation of other types of scores or labels. For example, the attribute estimation unit 22 may determine at least a part of the attribute data group 221 related to the user using an attribute estimation model 220 generated using teacher data in which the determined geographic fact attribute 211 is an input value and the geographic score 222A or the geographic label 222B is an output value. Here, the geographic score 222A is a score indicating the degree to which a predetermined attribute and attribute value (geographic estimation attribute) can be applied, and the geographic label 222B is information indicating the type of the predetermined attribute and attribute value.

地理的推定属性222に含まれる地理的スコア222Aは、例えば、所定の状況にある他のユーザが所定時間を超えて所在する地域であるという地理的ラベル222Bを、ユーザにかかる地理的位置が示す地域に対して適用することに関する妥当性(蓋然性)を示すスコアである。また、地理的スコア222Aは、例えば、所定の状況にある他のユーザが在住者として占める割合が所定の割合を超過する地域であるという地理的ラベル222Bを、ユーザにかかる地理的位置が示す地域に対して適用することに関する妥当性を示すスコアである。なお、ここでの所定の状況とは、例として、ライフステージ、ライフスタイル等に基づく生活状況であってよく、収入、資産等に基づく経済状況であってよい。また、地理的推定属性222に含まれる地理的スコア222Aは、例えば、他のユーザが所定の状況に置かれる可能性がある地域であるという地理的ラベル222Bを、ユーザにかかる地理的位置が示す地域に対して適用することに関する妥当性(蓋然性)を示すスコアである。ここでの所定の状況とは、被災等により資産が被害を受ける等の状況であってよい。地理的推定属性222に含まれる地理的スコア222Aは、例えば、地理的動向と対応する地理的ラベル222Bを、ユーザにかかる地理的位置が示す地域に対して適用することに関する妥当性(蓋然性)を示すスコアである。ここでの地理的動向とは、再開発等により資産価値が向上する等の状況であってよく、物価の高騰等により生活水準が高くなる等の状況であってよく、人流の集中等により物やサービスの消費が活発化する等の状況であってよい。 The geographic score 222A included in the geographic estimation attribute 222 is, for example, a score indicating the appropriateness (probability) of applying the geographic label 222B, which indicates that the area is an area where other users in a predetermined situation are located for more than a predetermined time, to the area indicated by the geographic location of the user. The geographic score 222A is, for example, a score indicating the appropriateness of applying the geographic label 222B, which indicates that the area is an area where other users in a predetermined situation are located more than a predetermined percentage, to the area indicated by the geographic location of the user. The predetermined situation here may be, for example, a living situation based on a life stage, lifestyle, etc., or an economic situation based on income, assets, etc. The geographic score 222A included in the geographic estimation attribute 222 is, for example, a score indicating the appropriateness (probability) of applying the geographic label 222B, which indicates that the area is an area where other users may be in a predetermined situation, to the area indicated by the geographic location of the user. The predetermined situation here may be a situation in which assets are damaged by a disaster, etc. The geographic score 222A included in the geographic estimation attribute 222 is, for example, a score indicating the appropriateness (likelihood) of applying the geographic label 222B corresponding to the geographic trend to the area indicated by the geographic location of the user. The geographic trend here may be a situation in which asset values increase due to redevelopment, etc., a situation in which the standard of living increases due to rising prices, etc., or a situation in which consumption of goods and services becomes active due to the concentration of people, etc.

ここで、属性推定部22によって推定される属性データ群221には、デモグラフィック属性223、ビヘイビオラル属性224、又はサイコグラフィック属性225が含まれてよい。デモグラフィック属性223は、例えば、ユーザの性別(ジェンダー)、家族構成、年齢等であり、ビヘイビオラル属性224は、サービスの利用履歴データに基づいてよく、例えば、キャッシング利用有無、リボ払い利用有無、所定の口座に係る入出金履歴、賭博又はくじを含む何らかの商品に係る商取引履歴(オンラインマーケットプレイス等におけるオンライン取引履歴を含んでよい)等であり、サイコグラフィック属性225は、例えば、賭博又はくじに係る趣向等である。但し、利用可能なユーザの属性は、本実施形態における例示に限定されない。例えば、オペレーションセンターサービス等からの「オペレーション(架電等)に要する時間」、「クレジットカード利用額/後払い決済利用額」も、属性として用いられてよい。 Here, the attribute data group 221 estimated by the attribute estimation unit 22 may include demographic attributes 223, behavioral attributes 224, or psychographic attributes 225. The demographic attributes 223 may be, for example, the user's gender, family structure, age, etc., and the behavioral attributes 224 may be based on service usage history data, such as whether or not a cash advance has been used, whether or not a revolving payment has been used, a deposit and withdrawal history for a specific account, a commercial transaction history for some product including gambling or lottery (which may include an online transaction history in an online marketplace, etc.), etc., and the psychographic attributes 225 may be, for example, a preference for gambling or lottery. However, the available user attributes are not limited to the examples in this embodiment. For example, "time required for operation (calls, etc.)" and "credit card usage amount/deferred payment usage amount" from an operation center service, etc. may also be used as attributes.

そして、属性データ群221には、上記した属性に加えて更に、属性決定部21によって決定された地理的事実属性211に基づいて推定された地理的推定属性222が含まれる。地理的事実属性211に基づいて決定された地理的推定属性222には、例えば、地理的スコア222A(例えば、0以上1以下の連続的な値)又は地理的ラベル222B(例えば、有無や是非に応じた二値)等のデータ形式で表される居住地属性データ、勤務地属性データ、及び/又は就学地属性データ等が含まれてよい。 The attribute data group 221 further includes geographical estimated attributes 222 estimated based on the geographical fact attributes 211 determined by the attribute determination unit 21 in addition to the attributes described above. The geographical estimated attributes 222 determined based on the geographical fact attributes 211 may include, for example, residence attribute data, workplace attribute data, and/or school attribute data expressed in a data format such as a geographical score 222A (e.g., a continuous value between 0 and 1) or a geographical label 222B (e.g., a binary value corresponding to presence/absence or yes/no).

図4は、実施形態に係るユーザスコア推定処理の簡略図である。ユーザスコア推定部23は、属性データ群221に基づいて、ユーザに設定されるユーザスコア231を推定する。本実施形態において、ユーザスコア推定部23は、ユーザの属性データ群221をユーザスコア推定モデル230に入力することで、当該ユーザに設定されるユーザスコア231を推定(算出)する。ここで、ユーザスコア推定モデル230の出力値は、例として、0を最小値、1を最大値として正規化/規格化されたユーザスコアである。 Figure 4 is a simplified diagram of a user score estimation process according to an embodiment. The user score estimation unit 23 estimates a user score 231 to be set for a user based on the attribute data group 221. In this embodiment, the user score estimation unit 23 estimates (calculates) the user score 231 to be set for the user by inputting the attribute data group 221 of the user to a user score estimation model 230. Here, the output value of the user score estimation model 230 is, for example, a user score normalized/standardized with 0 as the minimum value and 1 as the maximum value.

機械学習部24は、ユーザスコア推定部23によるユーザスコア推定に用いられるユーザスコア推定モデル230を生成及び/又は更新する。ユーザスコア推定用機械学習モデルは、対象ユーザに係る1又は複数の属性データ(属性データ群221)が入力された場合に、ユーザに関連する何らかの尺度(例えば、信用等)を示すユーザスコア231を出力する機械学習モデルである。 The machine learning unit 24 generates and/or updates a user score estimation model 230 used for user score estimation by the user score estimation unit 23. The machine learning model for user score estimation is a machine learning model that outputs a user score 231 indicating some measure related to the user (e.g., trust, etc.) when one or more attribute data (attribute data group 221) related to a target user is input.

ユーザスコア推定モデル230の生成及び/又は更新にあたって、機械学習部24は、サービス提供システム5から取得したデータに基づいて、ユーザ毎に、当該ユーザのデモグラフィック属性を含む属性データ群221を入力値とし当該ユーザに係るユーザスコア231を出力値として定義した教師データを作成する。そして、機械学習部24は、当該教師データに基づいて、ユーザスコア推定モデル230を作成する。上述の通り、ユーザスコア推定モデル230に入力される属性データ群221には、属性決定部21によって決定された地理的事実属性211に基づいて推定された属性データが含まれ、対応するユーザのユーザスコア231と組み合わせられて、教師データとして機械学習部24に入力される。教師データに設定されるユーザスコア231は、ルールベースで決定されたユーザスコア231であってよく、マニュアルで設定された(アノテーションがなされた)ユーザスコア231であってもよい。また、ユーザスコア推定モデル230によって過去に出力された後で、管理者等によって修正されたユーザスコア231であってもよい。 When generating and/or updating the user score estimation model 230, the machine learning unit 24 creates teacher data for each user based on the data acquired from the service providing system 5, in which the attribute data group 221 including the demographic attributes of the user is defined as an input value and the user score 231 related to the user is defined as an output value. Then, the machine learning unit 24 creates the user score estimation model 230 based on the teacher data. As described above, the attribute data group 221 input to the user score estimation model 230 includes attribute data estimated based on the geographic fact attribute 211 determined by the attribute determination unit 21, and is combined with the user score 231 of the corresponding user and input to the machine learning unit 24 as teacher data. The user score 231 set in the teacher data may be a user score 231 determined based on a rule base, or may be a user score 231 set manually (annotated). It may also be a user score 231 corrected by an administrator or the like after being output in the past by the user score estimation model 230.

本開示に係る技術を実装するにあたりユーザスコア推定モデル230等として採用可能な機械学習モデル生成のフレームワークは、例として、アンサンブル学習アルゴリズムに基づく。当該フレームワークには、例えば、勾配ブースティング決定木(Gradient Boosting Decision Tree:GBDT)に基づく機械学習フレームワーク(例えば、LightGBM)が採用されてよい。換言すると、当該フレームワークは、前後の弱学習器(弱分類器)間で正解と予測値との誤差を引き継がせるような決定木モデルに基づく機械学習フレームワークが採用されてよい。ここでの予測値とは、例として、ユーザスコア231の予測値を指す。なお、当該フレームワークは、LightGBMの他、XGBoostやCatBoost等のブースティング手法を採用してよい。決定木を用いるフレームワークによれば、ニューラルネットワークを用いるフレームワークと比較して少ないパラメータ調整の手間で、比較的高い性能を有する機械学習モデルを生成することが出来る。但し、本開示に係る技術を実装するにあたり採用可能な機械学習モデル生成のフレームワークは、本実施形態における例示に限定されない。例えば、学習器として勾配ブースティング決定木に代えてランダムフォレスト等の他の学習器が採用されてよいし、ニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用されてもよい。また、特にニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用される場合には、アンサンブル学習が採用されなくてもよい。 A machine learning model generation framework that can be adopted as the user score estimation model 230 or the like when implementing the technology according to the present disclosure is based on an ensemble learning algorithm, for example. For example, a machine learning framework (for example, LightGBM) based on a gradient boosting decision tree (GBDT) may be adopted as the framework. In other words, the framework may be a machine learning framework based on a decision tree model that transfers the error between the correct answer and the predicted value between the previous and next weak learners (weak classifiers). The predicted value here refers to the predicted value of the user score 231, for example. In addition to LightGBM, the framework may adopt boosting methods such as XGBoost and CatBoost. According to a framework using a decision tree, a machine learning model with relatively high performance can be generated with less effort in parameter adjustment compared to a framework using a neural network. However, the framework for generating a machine learning model that can be used to implement the technology disclosed herein is not limited to the example in this embodiment. For example, instead of a gradient boosting decision tree, another learning device such as a random forest may be used as a learning device, or a learning device that is not called a weak learning device such as a neural network may be used. In particular, when a learning device that is not called a weak learning device such as a neural network is used, ensemble learning does not need to be used.

図5は、本実施形態においてユーザスコア推定モデル230等として採用される機械学習モデルの決定木の概念を簡略図である。決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークを採用する場合、決定木の各ノードの分岐条件の最適化が行われる。具体的には、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークでは、一つの親のノードから分岐した二つの子のノードの夫々が示す属性を有するユーザ群についてユーザスコア231を夫々算出し、このユーザスコア231の差分が大きくなるように(例えば、差分が最大になるように、又は所定の閾値以上になるように)、即ち、二つの子のノードがきれいに分岐するように、親のノードの分岐条件が最適化される。例えば、ノードの分岐条件として示される属性が地理的スコアである場合、分岐の閾値に設定される所定のスコアを変更したり、分岐条件を地理的スコア以外に変更したりしてよい。また、例えば、ノードの分岐条件として示される属性が年齢である場合、分岐の閾値に設定される年齢を変更したり、分岐条件を年齢以外の属性に変更したりしてもよい。このようにして、決定木の全ノードの分岐条件を再帰的に最適化することで、属性データ群221に基づくユーザスコア231の推定精度を向上させることができる。 5 is a simplified diagram showing the concept of a decision tree of a machine learning model employed as the user score estimation model 230 in this embodiment. When a gradient boosting machine learning framework based on a decision tree algorithm is employed, the branching conditions of each node of the decision tree are optimized. Specifically, in the gradient boosting machine learning framework based on a decision tree algorithm, the user scores 231 are calculated for each user group having attributes indicated by each of the two child nodes branched from one parent node, and the branching conditions of the parent node are optimized so that the difference between the user scores 231 is large (for example, so that the difference is maximized or is equal to or greater than a predetermined threshold), that is, so that the two child nodes branch neatly. For example, if the attribute indicated as the branching condition of the node is a geographic score, the predetermined score set as the branching threshold may be changed, or the branching condition may be changed to something other than the geographic score. Also, for example, if the attribute indicated as the branching condition of the node is age, the age set as the branching threshold may be changed, or the branching condition may be changed to an attribute other than age. In this way, by recursively optimizing the branching conditions of all nodes in the decision tree, the estimation accuracy of the user score 231 based on the attribute data group 221 can be improved.

また、属性推定部22が属性推定モデル220を用いて属性データ群221の少なくとも一部を推定する場合、機械学習部24は更に、属性推定部22による、地理的事実属性211に基づく地理的推定属性222の決定に用いられる属性推定モデル220を生成及び/又は更新する。属性推定モデル220は、対象ユーザに係る1又は複数の地理的事実属性211が入力された場合に、当該ユーザが所在する地理的位置に係る地理的推定属性222を出力する機械学習モデルである。 When the attribute estimation unit 22 estimates at least a part of the attribute data group 221 using the attribute estimation model 220, the machine learning unit 24 further generates and/or updates the attribute estimation model 220 used by the attribute estimation unit 22 to determine the geographical estimated attribute 222 based on the geographical fact attribute 211. The attribute estimation model 220 is a machine learning model that outputs a geographical estimated attribute 222 related to the geographical location where the user is located when one or more geographical fact attributes 211 related to the target user are input.

属性推定モデル220の生成及び/又は更新にあたって、機械学習部24は、サービス提供システム5から取得したデータに基づいて、1又は複数の地理的事実属性211を入力値とし1の地理的推定属性222を出力値として定義した教師データを作成する。そして、機械学習部24は、当該教師データに基づいて、属性推定モデル220を生成又は更新する。1又は複数の地理的推定属性222は、対応する属性データ(地理的事実属性211)と組み合わせて、教師データとして機械学習部24に入力される。また、属性推定モデル220の生成又は更新においても、採用可能な機械学習モデル生成のフレームワークは限定されないが、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークが採用されてよいことは、上記説明したユーザスコア推定モデル230と同様である。このようにして、属性推定モデル220を用いて1又は複数の地理的事実属性211に基づく出力値(地理的推定属性222)を得ることで、当該出力値には、ユーザの居住地、勤務地、就学地等にかかるコンテキストが暗黙知的に反映される。ここで、属性推定モデル220は、地理的スコア222Aの多寡でラベリングされたデータでトレーニングされてよく、別途、所定の地理的ラベル222Bの有無等でラベリングされたデータでトレーニングされてもよい。 In generating and/or updating the attribute estimation model 220, the machine learning unit 24 creates teacher data in which one or more geographic fact attributes 211 are defined as input values and one geographic estimation attribute 222 is defined as an output value based on the data acquired from the service providing system 5. Then, the machine learning unit 24 generates or updates the attribute estimation model 220 based on the teacher data. One or more geographic estimation attributes 222 are combined with corresponding attribute data (geographic fact attributes 211) and input to the machine learning unit 24 as teacher data. In addition, in generating or updating the attribute estimation model 220, a machine learning model generation framework that can be adopted is not limited, but a machine learning framework of gradient boosting based on a decision tree algorithm may be adopted, as in the user score estimation model 230 described above. In this way, by obtaining an output value (geographic estimation attribute 222) based on one or more geographic fact attributes 211 using the attribute estimation model 220, the output value implicitly reflects the context related to the user's place of residence, place of work, place of study, etc. Here, the attribute estimation model 220 may be trained with data labeled with the amount of geographical score 222A, or may be trained separately with data labeled with the presence or absence of a specific geographical label 222B.

<処理の流れ>
次に、本実施形態に係る情報処理システムによって実行される処理の流れを説明する。なお、以下に説明する処理の具体的な内容及び処理順序は、本開示を実施するための一例である。具体的な処理内容及び処理順序は、本開示の実施の形態に応じて適宜選択されてよい。
<Processing flow>
Next, a process flow executed by the information processing system according to the present embodiment will be described. Note that the specific contents and processing order of the processes described below are an example for implementing the present disclosure. The specific contents and processing order may be appropriately selected according to the embodiment of the present disclosure.

図6は、本実施形態に係る機械学習処理の流れを示すフローチャートである。本フローチャートに示された処理は、管理者によって指定されたタイミングで実行される。 Figure 6 is a flowchart showing the flow of the machine learning process according to this embodiment. The process shown in this flowchart is executed at a timing specified by the administrator.

本実施形態において、機械学習処理では、ユーザスコア推定モデル230が生成及び/又は更新される。機械学習部24は、サービス提供システム5において過去に蓄積されたユーザ毎の属性データ群221と、対応するユーザについて予め決定されたユーザスコア231と、の組み合わせを含む教師データを作成する(ステップS101)。そして、機械学習部24は、作成された教師データをユーザスコア推定モデル230に入力し、ユーザスコア推定部23によるユーザスコア推定に用いられるユーザスコア推定モデル230を生成又は更新する(ステップS102)。その後、本フローチャートに示された処理は終了する。なお、属性推定部22が属性推定のために属性推定モデル220を用いる場合、属性推定モデル220の生成及び/又は更新も、同様の処理の流れで行われてよい。 In this embodiment, in the machine learning process, the user score estimation model 230 is generated and/or updated. The machine learning unit 24 creates teacher data including a combination of the attribute data group 221 for each user previously accumulated in the service providing system 5 and the user score 231 determined in advance for the corresponding user (step S101). Then, the machine learning unit 24 inputs the created teacher data into the user score estimation model 230, and generates or updates the user score estimation model 230 used for user score estimation by the user score estimation unit 23 (step S102). Thereafter, the process shown in this flowchart ends. Note that when the attribute estimation unit 22 uses the attribute estimation model 220 for attribute estimation, the attribute estimation model 220 may also be generated and/or updated in a similar process flow.

図7は、本実施形態に係るユーザスコア推定処理の流れを示すフローチャートである。本フローチャートに示された処理は、管理者によって指定されたタイミングで、対象となるユーザ毎に実行される。 Figure 7 is a flowchart showing the flow of the user score estimation process according to this embodiment. The process shown in this flowchart is executed for each target user at a timing specified by the administrator.

ステップS201及びステップS202では、地理的事実属性211が決定される。属性決定部21は、対象ユーザの行動情報(行動履歴)に基づいて対象ユーザに係る地理的位置を推定し(ステップS201)、推定されたユーザの地理的位置及び所定のマップデータに基づいて地理的位置に係る地理的事実属性211を決定する(ステップS202)。その後、処理はステップS203へ進む。 In steps S201 and S202, the geographic fact attribute 211 is determined. The attribute determination unit 21 estimates the geographic position of the target user based on the behavioral information (behavioral history) of the target user (step S201), and determines the geographic fact attribute 211 related to the geographic position based on the estimated geographic position of the user and predetermined map data (step S202). After that, the process proceeds to step S203.

ステップS203及びステップS204では、ユーザスコア231が決定され、出力される。属性推定部22は、決定された地理的事実属性211に基づき地理的推定属性222を、ユーザにかかる属性データ群221として推定する(ステップS203)。なお、本実施形態では、地理的推定属性222がそのまま属性データ群221の少なくとも一部として推定されるため、属性推定部22は、対象ユーザについてサービス提供システム5から取得される等して予め保持されている属性データ群221に地理的推定属性222を追加することで、当該ユーザの属性データ群221を得てよい。そして、ユーザスコア推定部23は、ステップS203で決定された、対象ユーザの地理的推定属性222を含む属性データ群221をユーザスコア推定モデル230に入力し、出力された値を当該ユーザに設定されるユーザスコア231として取得する(ステップS204)。但し、ユーザスコア231の推定方法は、本実施形態における例示に限定されない。例えば、ユーザスコア231は、属性データ群221を機械学習モデルではない所定の関数や統計モデル等に入力して算出された値を含むものであってもよい。その後、本フローチャートに示された処理は終了する。 In steps S203 and S204, the user score 231 is determined and output. The attribute estimation unit 22 estimates the geographical estimated attribute 222 as the attribute data group 221 related to the user based on the determined geographical fact attribute 211 (step S203). In this embodiment, the geographical estimated attribute 222 is estimated as at least a part of the attribute data group 221 as it is, so the attribute estimation unit 22 may obtain the attribute data group 221 of the user by adding the geographical estimated attribute 222 to the attribute data group 221 that is acquired from the service providing system 5 for the target user and is previously stored. Then, the user score estimation unit 23 inputs the attribute data group 221 including the geographical estimated attribute 222 of the target user determined in step S203 into the user score estimation model 230, and acquires the output value as the user score 231 to be set for the user (step S204). However, the estimation method of the user score 231 is not limited to the example in this embodiment. For example, the user score 231 may include a value calculated by inputting the attribute data group 221 into a predetermined function or statistical model that is not a machine learning model. After that, the process shown in this flowchart ends.

ユーザ毎に設定されたユーザスコア231は、サービス提供システム5等の他のシステムに対して提供され、サービス提供システム5等の他のシステムによって対象ユーザに対して提供されるサービスのカスタマイズ等に活用される。 The user score 231 set for each user is provided to other systems such as the service providing system 5, and is used to customize services provided to the target user by the other systems such as the service providing system 5.

<効果>
本実施形態によれば、ユーザに係る地理的位置から推測されるコンテキストをユーザスコア231に反映することが可能となる。即ち、本実施形態によれば、ユーザに係る地理的位置に基づいて、明示的な属性データからは得られない、ユーザスコアに影響し得る地理的コンテキストを、ユーザスコア231に反映することが可能となる。また、様々なユーザ属性データを用いることで、対象ユーザについて一部の属性データが存在しない場合であっても、精度の高いユーザスコア231を算出することが可能となる。
<Effects>
According to this embodiment, it is possible to reflect a context inferred from a geographical location related to a user in the user score 231. That is, according to this embodiment, it is possible to reflect a geographical context that can affect the user score and cannot be obtained from explicit attribute data based on the geographical location related to a user in the user score 231. Furthermore, by using various user attribute data, it is possible to calculate a highly accurate user score 231 even when some attribute data does not exist for a target user.

<第1バリエーション>
上記説明した実施形態では、マップデータとして予め準備されたデータを用いる例について説明したが、マップデータは、属性決定部21で用いるために新たに作成されてもよい。この際、マップデータは、例えば、以下のような方法によっても作成することができる。
<First variation>
In the above-described embodiment, an example has been described in which data prepared in advance is used as the map data, but the map data may be newly created for use in the attribute determining unit 21. In this case, the map data may be created, for example, by the following method.

図8は、第1バリエーションに係る情報処理装置1bの機能構成の概略を示す図である。情報処理装置1bは、記憶装置14に記録されているプログラムが、RAM13に読み出され、CPU11によって実行されて、情報処理装置1に備えられた各ハードウェアが制御されることで、属性決定部21、属性推定部22、ユーザスコア推定部23、機械学習部24、及びマップデータ作成部25を備える情報処理装置として機能する。なお、本実施形態及び後述する他の実施形態では、情報処理装置1の備える各機能は、汎用プロセッサであるCPU11によって実行されるが、これらの機能の一部又は全部は、1又は複数の専用プロセッサによって実行されてもよい。また、本バリエーションにおいて、属性決定部21、属性推定部22、ユーザスコア推定部23、及び機械学習部24による処理の内容については、上記説明した実施形態と概略同様であるため、説明を省略する。 Figure 8 is a diagram showing an outline of the functional configuration of the information processing device 1b according to the first variation. The information processing device 1b functions as an information processing device including an attribute determination unit 21, an attribute estimation unit 22, a user score estimation unit 23, a machine learning unit 24, and a map data creation unit 25, by reading a program recorded in the storage device 14 into the RAM 13 and executing it by the CPU 11, which controls each piece of hardware included in the information processing device 1. Note that in this embodiment and other embodiments described below, each function included in the information processing device 1 is executed by the CPU 11, which is a general-purpose processor, but some or all of these functions may be executed by one or more dedicated processors. In addition, in this variation, the contents of the processing by the attribute determination unit 21, the attribute estimation unit 22, the user score estimation unit 23, and the machine learning unit 24 are roughly similar to those in the embodiment described above, so description thereof will be omitted.

マップデータ作成部25は、衛星画像の入力を受け付け、入力された衛星画像を所定の大きさのグリッドに分割する。ここで、「グリッド」とは衛星画像を何らかの形状を用いて分割したものである。グリッドの形状としては例えば矩形があるが、グリッドの形状は限定されない。グリッドの形状には、三角形や六角形等、その他の形状が採用されてもよい。そして、マップデータ作成部25は、衛星画像を画像解析することによって各グリッドに含まれる各領域がどのような地理的事実属性211に対応しているかを推定し、各グリッドの識別情報に、当該グリッドに対応する領域について推定された地理的事実属性211を関連付けることで、マップデータを作成する。ここで、衛星画像の解析によって推定される地理的事実属性211としては、例えば、市街地、住宅地、水田、山、河川、高台、傾斜、曲面、植生範囲、等がある。画像解析に用いられる技術については従来提案されているAIや機械学習モデルを用いてよいため詳細については省略するが、画像中の色情報や画像解析によって検出される形状、特徴等に基づいて、上記に例示したような地理的事実属性211を推定することが可能である。 The map data creation unit 25 accepts input of a satellite image and divides the input satellite image into grids of a predetermined size. Here, a "grid" is a satellite image divided using some shape. An example of the shape of the grid is a rectangle, but the shape of the grid is not limited. Other shapes such as a triangle or a hexagon may be adopted as the shape of the grid. The map data creation unit 25 then performs image analysis of the satellite image to estimate what geographical fact attribute 211 each area included in each grid corresponds to, and creates map data by associating the geographical fact attribute 211 estimated for the area corresponding to the grid with the identification information of each grid. Here, examples of the geographical fact attribute 211 estimated by the analysis of the satellite image include urban areas, residential areas, rice fields, mountains, rivers, hills, slopes, curved surfaces, vegetation ranges, etc. As the technology used for image analysis may use AI or machine learning models proposed in the past, details will be omitted, but it is possible to estimate the geographical fact attribute 211 as exemplified above based on color information in the image and shapes and features detected by image analysis.

また、マップデータ作成部25は、予め用意された評価マップ(例えば、ハザードマップ等のリスク評価マップ)の入力を受け付け、入力された評価マップを所定の大きさのグリッドに分割する。そして、マップデータ作成部25は、評価マップを解析することによって各グリッドに含まれる各領域がどのような地理的事実属性211に対応しているかを推定し、各グリッドの識別情報に、当該グリッドに対応する領域について推定された地理的事実属性211を関連付けることで、マップデータを作成する。ここで、評価マップの解析によって推定される地理的事実属性211としては、例えば、高洪水リスク、高土砂災害リスク、等がある。なお、本実施形態では、評価マップの例としてハザードマップを挙げているが、採用可能な評価マップの種類はハザードマップに限定されない。評価マップとしては、マップ上の地点又は地域について何らかの基準に基づいた評価が示されたマップであれば、様々な種類の評価マップを用いることが可能である。 The map data creation unit 25 also accepts input of a prepared evaluation map (e.g., a risk evaluation map such as a hazard map) and divides the input evaluation map into grids of a predetermined size. The map data creation unit 25 then analyzes the evaluation map to estimate what geographical fact attribute 211 each area included in each grid corresponds to, and creates map data by associating the identification information of each grid with the geographical fact attribute 211 estimated for the area corresponding to the grid. Here, examples of the geographical fact attribute 211 estimated by analyzing the evaluation map include high flood risk and high landslide risk. Note that in this embodiment, a hazard map is given as an example of an evaluation map, but the type of evaluation map that can be adopted is not limited to a hazard map. As the evaluation map, various types of evaluation maps can be used as long as they show an evaluation based on some criteria for points or areas on the map.

このような作成方法を採用することで、マップデータ作成処理の全部又は一部を自動化することが可能となる。そして、グリッド毎に地理的事実属性211が付されたマップデータを作成して用いることで、属性決定部21は、ユーザの地理的位置に係るグリッドを特定し、当該グリッドに関連づけられた地理的事実属性211をマップデータから取得することで、当該ユーザに係る地理的事実属性211を決定することが出来る。 By adopting such a creation method, it becomes possible to automate all or part of the map data creation process. Then, by creating and using map data in which geographical fact attributes 211 are attached to each grid, the attribute determination unit 21 can identify the grid related to the user's geographical location, and obtain the geographical fact attributes 211 associated with that grid from the map data, thereby determining the geographical fact attributes 211 related to that user.

また、作成されたマップデータは、上記実施形態においても説明したように、属性決定部21がユーザの行動情報(行動履歴)に基づいて当該ユーザに係る地理的位置を推定する際に、当該地理的位置がユーザの居住地、勤務地、就学地等のいずれ種類の地理的位置に相当するかの判定に用いられてもよい。即ち、ユーザに係る地理的位置が相当するグリッドの地理的事実属性211が住宅地である場合、属性決定部21は、当該地理的位置がユーザの居住地を示し、ユーザに係る地理的位置が相当するグリッドの地理的事実属性211が市街地である場合、属性決定部21は、当該地理的位置がユーザの勤務地を示す、等の判断を行うことが出来る。 As described in the above embodiment, the created map data may be used when the attribute determination unit 21 estimates a geographical position related to a user based on the user's behavioral information (behavioral history) to determine whether the geographical position corresponds to the user's place of residence, place of work, place of study, etc. That is, when the geographical fact attribute 211 of the grid to which the geographical position related to the user corresponds is a residential area, the attribute determination unit 21 can determine that the geographical position indicates the user's place of residence, and when the geographical fact attribute 211 of the grid to which the geographical position related to the user corresponds is an urban area, the attribute determination unit 21 can determine that the geographical position indicates the user's place of work, etc.

<第2バリエーション>
上記説明した実施形態では、ユーザスコア推定部23が、地理的推定属性222、デモグラフィック属性223、ビヘイビオラル属性224、サイコグラフィック属性225を含む属性データ群221に基づき、ユーザスコア231を推定する例について説明したが、ユーザスコア推定処理のための属性データ群221は、以下のような構成であってもよい。なお、上記説明した実施形態と概略同様の構成については、説明を省略する。
<2nd variation>
In the embodiment described above, an example has been described in which the user score estimation unit 23 estimates the user score 231 based on the attribute data group 221 including the geographic estimation attribute 222, the demographic attribute 223, the behavioral attribute 224, and the psychographic attribute 225, but the attribute data group 221 for the user score estimation process may have the following configuration: Note that a description of the configuration that is roughly the same as that of the embodiment described above will be omitted.

図9は、第2バリエーションに係るユーザスコア推定処理の簡略図である。本バリエーションにおいて、属性データ群221は、地理的推定属性222に代えて地理的事実属性211を含んでよい。また、属性データ群221は、ユーザにかかる地理的位置と対応する地理的事実属性211に加えて、当該地理的位置と隣接する他の地理的位置と対応する地理的事実属性211を含んでよく、当該地理的位置から所定距離内の他の地理的位置と対応する地理的事実属性211を含んでよく、当該地理的位置から何らかの交通手段で所定時間以内に到達可能な他の地理的位置と対応する地理的事実属性211を含んでよい。ここで、ユーザスコア推定モデル230は、属性データ群221を構成するデータの種別に応じて適宜、構築された教師データを用いてトレーニング(学習処理)がなされる。 9 is a simplified diagram of the user score estimation process according to the second variation. In this variation, the attribute data group 221 may include a geographic fact attribute 211 instead of the geographic estimation attribute 222. In addition to the geographic fact attribute 211 corresponding to the geographic location of the user, the attribute data group 221 may include a geographic fact attribute 211 corresponding to other geographic locations adjacent to the geographic location, a geographic fact attribute 211 corresponding to other geographic locations within a predetermined distance from the geographic location, or a geographic fact attribute 211 corresponding to other geographic locations that can be reached from the geographic location by some means of transportation within a predetermined time. Here, the user score estimation model 230 is trained (learned) using teacher data constructed appropriately according to the type of data constituting the attribute data group 221.

<第3バリエーション>
また、ユーザスコア推定処理のための属性データ群221は、以下のような構成であってもよい。なお、上記説明した実施形態と概略同様である構成については、説明を省略する。
<Third variation>
The attribute data group 221 for the user score estimation process may have the following configuration: Note that a description of the configuration that is roughly the same as the embodiment described above will be omitted.

図10は、第3バリエーションに係るユーザスコア推定処理の簡略図である。本バリエーションにおいて、属性データ群221は、地理的推定属性222に加えて地理的事実属性211を含んでよい。ここで、第2バリエーションと同様、属性データ群221は、ユーザにかかる地理的位置と対応する地理的事実属性211および地理的推定属性222に加えて、当該地理的位置と隣接する他の地理的位置と対応する地理的事実属性211および/または地理的推定属性222を含んでよく、当該地理的位置から所定距離内の他の地理的位置と対応する地理的事実属性211および/または地理的推定属性222を含んでよく、当該地理的位置から何らかの交通手段で所定時間以内に到達可能な他の地理的位置と対応する地理的事実属性211および/または地理的推定属性222を含んでよい。ここで、ユーザスコア推定モデル230は、属性データ群221を構成するデータの種別に応じて適宜、構築された教師データを用いてトレーニング(学習処理)がなされる。 10 is a simplified diagram of the user score estimation process according to the third variation. In this variation, the attribute data group 221 may include a geographic fact attribute 211 in addition to the geographic estimation attribute 222. Here, similar to the second variation, the attribute data group 221 may include, in addition to the geographic fact attribute 211 and the geographic estimation attribute 222 corresponding to the geographic location of the user, a geographic fact attribute 211 and/or a geographic estimation attribute 222 corresponding to other geographic locations adjacent to the geographic location, a geographic fact attribute 211 and/or a geographic estimation attribute 222 corresponding to other geographic locations within a predetermined distance from the geographic location, and a geographic fact attribute 211 and/or a geographic estimation attribute 222 corresponding to other geographic locations that can be reached from the geographic location within a predetermined time by some means of transportation. Here, the user score estimation model 230 is trained (learned) using teacher data appropriately constructed according to the type of data constituting the attribute data group 221.

<第4バリエーション>
ユーザスコア推定部23は、以下の態様で、ユーザスコア231の推定(算出)を行ってもよい。なお、上記説明した実施形態と概略同様である構成については、説明を省略する。
<Fourth variation>
The user score estimation unit 23 may estimate (calculate) the user score 231 in the following manner. Note that a description of the configuration that is generally similar to the embodiment described above will be omitted.

図11は、第4バリエーションに係るユーザスコア推定処理の簡略図である。ユーザスコア推定部23は、地理的推定属性222に応じて、複数のユーザスコア推定モデル(第1ユーザスコア推定モデル230A、第2ユーザスコア推定モデル230B、第3ユーザスコア推定モデル230C、・・・第nユーザスコア推定モデル230N(nは整数))から1のユーザスコア推定モデル230を選択し決定し、属性データ群221に基づきユーザスコア231(ユーザスコア231A、ユーザスコア231B、ユーザスコア231C、・・・ユーザスコア231N)を推定する。ここで、n>1であってよく、n=2であってよく、n=3であってよく、nが示すユーザスコア推定モデル230の数量に制限はない。また、各ユーザスコア推定モデル230は、地理的推定属性222の少なくとも一部が共通または類似する教師データでトレーニングがなされている。スコア推定対象のユーザにかかる地理的推定属性222が所定の地理的推定属性222を示す場合、当該所定の地理的推定属性222に応じて予めトレーニングされたユーザスコア推定モデル230を用いて、ユーザスコア231を推定する。なお、地理的推定属性222の少なくとも一部が共通または類似するとは、例として、地理的スコア222Aが所定の範囲内を示すことであってよく、地理的ラベル222Bが共通することであってよい。なお、本バリエーションにおいて、属性データ群221は、デモグラフィック属性223、ビヘイビオラル属性224、サイコグラフィック属性225等に加えて、スコア推定対象のユーザが所在する地理的位置に係る地理的事実属性211および/または地理的推定属性222をさらに含んでもよい。 FIG. 11 is a simplified diagram of the user score estimation process according to the fourth variation. The user score estimation unit 23 selects and determines one user score estimation model 230 from a plurality of user score estimation models (first user score estimation model 230A, second user score estimation model 230B, third user score estimation model 230C, ... n-th user score estimation model 230N (n is an integer)) according to the geographical estimation attribute 222, and estimates a user score 231 (user score 231A, user score 231B, user score 231C, ... user score 231N) based on the attribute data group 221. Here, n may be > 1, n may be 2, or n may be 3, and there is no limit to the number of user score estimation models 230 indicated by n. In addition, each user score estimation model 230 is trained with teacher data in which at least a part of the geographical estimation attribute 222 is common or similar. When the geographical estimation attribute 222 of the user to be the subject of score estimation indicates a predetermined geographical estimation attribute 222, the user score 231 is estimated using a user score estimation model 230 that has been trained in advance according to the predetermined geographical estimation attribute 222. Note that, for example, at least a part of the geographical estimation attributes 222 being common or similar may mean that the geographical score 222A indicates a predetermined range, and the geographical label 222B is common. Note that in this variation, the attribute data group 221 may further include a geographical fact attribute 211 and/or a geographical estimation attribute 222 related to the geographic location where the user to be the subject of score estimation is located, in addition to the demographic attribute 223, the behavioral attribute 224, the psychographic attribute 225, etc.

<第5バリエーション>
ユーザスコア推定部23は、以下の態様で、ユーザスコア231の推定(算出)を行ってもよい。なお、上記説明した実施形態と概略同様である構成については、説明を省略する。
<Fifth variation>
The user score estimation unit 23 may estimate (calculate) the user score 231 in the following manner. Note that a description of the configuration that is generally similar to the embodiment described above will be omitted.

図12は、第5バリエーションに係るユーザスコア推定処理の簡略図である。ユーザスコア推定部23は、属性データ群221をユーザスコア推定モデル230に入力することで得られたユーザスコア231を、スコア推定対象のユーザが所在する地理的位置にかかる地理的推定属性222に基づき調整、修正、補正、変更等してユーザスコア231Dを決定してよい。ここで、ユーザスコア推定部23は、地理的推定属性222が所定の閾値を超過する地理的スコア222Aを示す場合、ユーザスコア推定モデル230が出力したユーザスコア231の上方修正を行い、ユーザスコア231Dを決定してよい。一方、ユーザスコア推定部23は、地理的推定属性222が所定の閾値を下回る地理的スコア222Aを示す場合、ユーザスコア推定モデル230が出力したユーザスコア231の下方修正を行い、ユーザスコア231Dを決定してよい。ユーザスコア推定モデル230が出力したユーザスコア231の修正等に際し、出力されたユーザスコア231に適用する係数、付加されるスコア等は、地理的スコア222Aと所定の閾値との差分等によって適宜、決定されてよい。なお、ユーザスコア推定部23は、地理的推定属性222の代わりに地理的事実属性211に応じてユーザスコア推定モデル230が出力したユーザスコア231の修正等を行い、ユーザスコア231Dを決定してもよい。このとき、ユーザスコア推定部23は、所定の地理的事実属性211であるか否かに応じて、ユーザスコア推定モデル230が出力したユーザスコア231の修正等を行い、ユーザスコア231Dを決定してよい。 Figure 12 is a simplified diagram of the user score estimation process according to the fifth variation. The user score estimation unit 23 may determine the user score 231D by adjusting, correcting, amending, or otherwise modifying the user score 231 obtained by inputting the attribute data group 221 into the user score estimation model 230 based on the geographical estimation attribute 222 relating to the geographical location of the user to be estimated. Here, when the geographical estimation attribute 222 indicates a geographical score 222A that exceeds a predetermined threshold, the user score estimation unit 23 may upwardly correct the user score 231 output by the user score estimation model 230 to determine the user score 231D. On the other hand, when the geographical estimation attribute 222 indicates a geographical score 222A that is below a predetermined threshold, the user score estimation unit 23 may downwardly correct the user score 231 output by the user score estimation model 230 to determine the user score 231D. When correcting the user score 231 output by the user score estimation model 230, the coefficient to be applied to the output user score 231, the score to be added, etc. may be appropriately determined based on the difference between the geographical score 222A and a predetermined threshold value, etc. The user score estimation unit 23 may correct the user score 231 output by the user score estimation model 230 according to the geographical fact attribute 211 instead of the geographical estimation attribute 222, and determine the user score 231D. In this case, the user score estimation unit 23 may correct the user score 231 output by the user score estimation model 230 according to whether or not it is a predetermined geographical fact attribute 211, and determine the user score 231D.

ユーザスコア推定部23は、地理的推定属性222における地理的スコア222Aと所定の閾値との差分が別の所定の閾値を超過する場合、ユーザスコア推定モデル230が出力したユーザスコア231を無効と判定してもよい。ここで、ユーザスコア推定部23は、地理的推定属性222における地理的スコア222Aの所定の閾値に対する超過量が別の所定の閾値を超過する正の値である場合、ユーザスコア推定モデル230が出力したユーザスコア231を無効と判定してもよい。また、ここで、ユーザスコア推定部23は、地理的推定属性222における地理的スコア222Aの所定の閾値に対する超過量が別の所定の閾値を超過する負の値である場合、ユーザスコア推定モデル230が出力したユーザスコア231の修正等を行ってよい。なお、当該所定の閾値、当該別の所定の閾値等は、ユーザスコア231の多寡に応じ予め設定されていてよく、所定の範囲内のユーザスコア231が出力されたユーザの夫々にかかる地理的スコア222Aの統計的指標に基づき設定されてよい。 The user score estimation unit 23 may determine that the user score 231 output by the user score estimation model 230 is invalid when the difference between the geographic score 222A in the geographic estimation attribute 222 and the predetermined threshold exceeds another predetermined threshold. Here, the user score estimation unit 23 may determine that the user score 231 output by the user score estimation model 230 is invalid when the amount by which the geographic score 222A in the geographic estimation attribute 222 exceeds the predetermined threshold is a positive value that exceeds another predetermined threshold. Also, here, the user score estimation unit 23 may correct the user score 231 output by the user score estimation model 230 when the amount by which the geographic score 222A in the geographic estimation attribute 222 exceeds the predetermined threshold is a negative value that exceeds another predetermined threshold. Note that the predetermined threshold, the other predetermined threshold, etc. may be set in advance according to the number of user scores 231, and may be set based on a statistical index of the geographic score 222A for each user to whom the user score 231 within a predetermined range is output.

<その他のバリエーション>
上記説明した実施形態では、ユーザに係る地理的位置又は当該地理的位置を含む領域の地理的事実属性211が取得される例について説明したが、属性決定部21によって決定される地理的事実属性211は、このような態様に限定されない。例えば、属性決定部21は、ユーザに係る地理的位置又は当該地理的位置を含む領域とは異なる位置又は領域についての地理的事実属性211を取得してもよい。例えば、属性決定部21は、ユーザに係る地理的位置を基準とした所定の範囲内の他の地理的位置及び所定のマップデータに基づいて、当該他の地理的位置に係る地理的事実属性211を決定してもよい。この場合、属性推定部22は、決定された他の地理的位置に係る地理的事実属性211に基づいて、地理的推定属性222を、ユーザにかかる属性データ群221の少なくとも一部として、推定する。また、例えば、属性決定部21は、ユーザの居住地等を含むエリアに隣接する他のエリアの地理的事実属性211に従って、ユーザの地理的位置に係る地理的事実属性211を決定してもよい。このようにすることで、属性推定部22は、ユーザの居住地や勤務地等のみならず、これらの所在地に隣接するエリアの地理的事実属性211に基づいて、ユーザの属性データ群221を推定することが可能となる。
<Other variations>
In the above-described embodiment, an example in which the geographical fact attribute 211 of the geographical position related to the user or the area including the geographical position is acquired has been described, but the geographical fact attribute 211 determined by the attribute determination unit 21 is not limited to such an aspect. For example, the attribute determination unit 21 may acquire the geographical fact attribute 211 for a position or area different from the geographical position related to the user or the area including the geographical position. For example, the attribute determination unit 21 may determine the geographical fact attribute 211 related to the other geographical position based on other geographical positions within a predetermined range based on the geographical position related to the user and predetermined map data. In this case, the attribute estimation unit 22 estimates the geographical estimated attribute 222 as at least a part of the attribute data group 221 related to the user based on the geographical fact attribute 211 related to the determined other geographical position. In addition, for example, the attribute determination unit 21 may determine the geographical fact attribute 211 related to the geographical position of the user according to the geographical fact attribute 211 of another area adjacent to the area including the user's residence, etc. In this way, the attribute estimation unit 22 can estimate the user's attribute data group 221 based not only on the user's place of residence, place of work, etc., but also on the geographical fact attributes 211 of the areas adjacent to these locations.

1 情報処理装置

1. Information processing device

Claims (13)

ユーザに係る地理的位置及び所定のマップデータに基づいて、前記地理的位置に係る地理的事実属性を決定する属性決定手段と、
決定された前記地理的事実属性に基づいて、前記ユーザにかかる属性データ群の少なくとも一部を推定する属性推定手段と、
推定された前記属性データ群に基づいて、前記ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、を備え、
前記マップデータは、地理的位置に対応する前記地理的事実属性として、該位置の過去の状態を特定可能なデータであり、
前記属性決定手段は、前記ユーザに係る地理的位置に対応する過去の状態に基づいて、前記地理的位置に係る前記地理的事実属性を決定する、
情報処理システム。
an attribute determining means for determining a geographic fact attribute associated with a geographic location based on a geographic location associated with a user and predetermined map data;
an attribute estimation means for estimating at least a part of an attribute data group related to the user based on the determined geographic fact attribute;
a user score estimation means for estimating a user score to be set for the user based on the estimated attribute data group,
The map data is data that can identify a past state of a geographical location as the geographical fact attribute corresponding to the geographical location,
The attribute determining means determines the geographic fact attribute related to the geographic location based on a past state corresponding to the geographic location related to the user.
Information processing system.
前記属性推定手段は、決定された前記地理的事実属性に基づき、前記属性データ群の少なくとも一部として、地理的推定属性を推定する、
請求項1に記載の情報処理システム。
The attribute estimation means estimates a geographical estimated attribute as at least a part of the attribute data group based on the determined geographical fact attribute.
The information processing system according to claim 1 .
前記属性推定手段は、決定された前記地理的事実属性を属性推定モデルに入力して得られた出力値に基づいて、前記属性データ群の少なくとも一部を推定する、
請求項1又は2に記載の情報処理システム。
The attribute estimation means estimates at least a part of the attribute data group based on an output value obtained by inputting the determined geographical fact attribute into an attribute estimation model.
3. The information processing system according to claim 1 or 2 .
前記属性推定手段は、決定された前記地理的事実属性を入力値とし前記地理的位置に係る地理的スコア又は地理的ラベルを出力値とする教師データを用いて生成された前記属性推定モデルを用いて、前記属性データ群の少なくとも一部を推定する、
請求項3に記載の情報処理システム。
The attribute estimation means estimates at least a part of the attribute data group by using the attribute estimation model generated using training data in which the determined geographic fact attribute is an input value and a geographic score or a geographic label related to the geographic location is an output value.
The information processing system according to claim 3 .
前記属性決定手段は、前記ユーザの行動情報に基づいて該ユーザに係る地理的位置を推定し、推定された前記地理的位置及び所定のマップデータに基づいて前記地理的位置に係る地理的事実属性を決定する、
請求項1から4のいずれか一項に記載の情報処理システム。
The attribute determination means estimates a geographical position related to the user based on the behavioral information of the user, and determines a geographical fact attribute related to the geographical position based on the estimated geographical position and predetermined map data.
The information processing system according to claim 1 .
前記属性決定手段は、ユーザに係る地理的位置を基準とした所定の範囲内の他の地理的位置及び所定のマップデータに基づいて、該他の地理的位置に係る前記地理的事実属性を決定し、
前記属性推定手段は、決定された前記他の地理的位置に係る前記地理的事実属性に基づいて、前記属性データ群の少なくとも一部を推定する、
請求項1から5のいずれか一項に記載の情報処理システム。
The attribute determination means determines the geographic fact attribute related to the other geographic location based on other geographic locations within a predetermined range based on the geographic location related to the user and predetermined map data;
The attribute estimation means estimates at least a part of the attribute data group based on the geographical fact attributes related to the determined other geographical locations.
The information processing system according to claim 1 .
衛星画像を分割し、該衛星画像を画像解析することによって分割された領域毎に対応する地理的事実属性を推定し、前記領域毎に推定された前記地理的事実属性を該領域の識別情報に関連づけることで前記マップデータを作成するマップデータ作成手段を更に備え、
前記属性決定手段は、前記マップデータ作成手段によって作成された前記マップデータに基づいて前記地理的位置に係る前記地理的事実属性を決定する、
請求項1から6のいずれか一項に記載の情報処理システム。
a map data creation means for creating the map data by dividing a satellite image, estimating a geographical fact attribute corresponding to each divided area by performing image analysis on the satellite image, and associating the geographical fact attribute estimated for each area with identification information of the area;
The attribute determination means determines the geographic fact attribute related to the geographic location based on the map data created by the map data creation means.
The information processing system according to claim 1 .
マップ上の地点又は地域について何らかの基準に基づいた評価が示された評価マップを分割し、該評価マップを解析することによって分割された領域毎に対応する地理的事実属性を推定し、前記領域毎に推定された前記地理的事実属性を該領域の識別情報に関連づけることで前記マップデータを作成するマップデータ作成手段を更に備え、
前記属性決定手段は、前記マップデータ作成手段によって作成された前記マップデータに基づいて前記地理的位置に係る前記地理的事実属性を決定する、
請求項1から6のいずれか一項に記載の情報処理システム。
The present invention further comprises a map data creation means for dividing an evaluation map showing an evaluation based on some criteria for points or regions on a map, estimating geographical fact attributes corresponding to each divided region by analyzing the evaluation map, and creating the map data by associating the geographical fact attributes estimated for each region with identification information of the region,
The attribute determination means determines the geographic fact attribute related to the geographic location based on the map data created by the map data creation means.
The information processing system according to claim 1 .
前記ユーザスコア推定手段は、前記属性データ群をユーザスコア推定モデルに入力することで、該ユーザに設定されるユーザスコアを推定する、
請求項1から8のいずれか一項に記載の情報処理システム。
The user score estimation means estimates a user score to be set for the user by inputting the attribute data group into a user score estimation model.
The information processing system according to any one of claims 1 to 8 .
前記ユーザスコア推定手段は、勾配ブースティング決定木に基づく機械学習フレームワークを用いて生成された前記ユーザスコア推定モデルを用いて、前記ユーザスコアを推定する、
請求項9に記載の情報処理システム。
The user score estimation means estimates the user score using the user score estimation model generated using a machine learning framework based on a gradient boosting decision tree.
The information processing system according to claim 9 .
前記ユーザスコア推定手段は、前記属性データ群を入力値とし該ユーザに係る前記ユーザスコアを出力値とする教師データを用いて生成された前記ユーザスコア推定モデルを用いて、前記ユーザに設定されるユーザスコアを推定する、
請求項9又は10に記載の情報処理システム。
the user score estimation means estimates a user score to be set for the user by using the user score estimation model generated using teacher data having the attribute data group as an input value and the user score related to the user as an output value;
11. The information processing system according to claim 9 or 10 .
コンピュータが、
ユーザに係る地理的位置及び所定のマップデータに基づいて、前記地理的位置に係る地理的事実属性を決定する属性決定ステップと、
決定された前記地理的事実属性に基づいて、前記ユーザにかかる属性データ群の少なくとも一部を推定する属性推定ステップと、
推定された前記属性データ群に基づいて、前記ユーザに設定されるユーザスコアを推定するユーザスコア推定ステップと、を実行し、
前記マップデータは、地理的位置に対応する前記地理的事実属性として、該位置の過去の状態を特定可能なデータであり、
前記属性決定ステップは、前記ユーザに係る地理的位置に対応する過去の状態に基づいて、前記地理的位置に係る前記地理的事実属性を決定する、
方法。
The computer
an attribute determination step for determining a geographic fact attribute associated with the geographic location based on the geographic location associated with the user and predetermined map data;
an attribute estimation step of estimating at least a portion of an attribute data set related to the user based on the determined geographic fact attributes;
a user score estimating step of estimating a user score to be set for the user based on the estimated attribute data group ;
The map data is data that can identify a past state of a geographical location as the geographical fact attribute corresponding to the geographical location,
The attribute determination step determines the geographic fact attribute associated with the geographic location based on a past state corresponding to the geographic location associated with the user.
method.
コンピュータを、
ユーザに係る地理的位置及び所定のマップデータに基づいて、前記地理的位置に係る地理的事実属性を決定する属性決定手段と、
決定された前記地理的事実属性に基づいて、前記ユーザにかかる属性データ群の少なくとも一部を推定する属性推定手段と、
推定された前記属性データ群に基づいて、前記ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、として機能させ、
前記マップデータは、地理的位置に対応する前記地理的事実属性として、該位置の過去の状態を特定可能なデータであり、
前記属性決定手段は、前記ユーザに係る地理的位置に対応する過去の状態に基づいて、前記地理的位置に係る前記地理的事実属性を決定する、
プログラム。
Computer,
an attribute determining means for determining a geographic fact attribute associated with a geographic location based on a geographic location associated with a user and predetermined map data;
an attribute estimation means for estimating at least a part of an attribute data group related to the user based on the determined geographic fact attribute;
a user score estimation means for estimating a user score to be set for the user based on the estimated attribute data group;
The map data is data that can identify a past state of a geographical location as the geographical fact attribute corresponding to the geographical location,
The attribute determining means determines the geographic fact attribute related to the geographic location based on a past state corresponding to the geographic location related to the user.
program.
JP2022056449A 2022-03-30 2022-03-30 Information processing system, method and program Active JP7576058B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022056449A JP7576058B2 (en) 2022-03-30 2022-03-30 Information processing system, method and program
TW112111660A TWI868641B (en) 2022-03-30 2023-03-28 Information processing system, information processing method and program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022056449A JP7576058B2 (en) 2022-03-30 2022-03-30 Information processing system, method and program

Publications (2)

Publication Number Publication Date
JP2023148436A JP2023148436A (en) 2023-10-13
JP7576058B2 true JP7576058B2 (en) 2024-10-30

Family

ID=88288314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022056449A Active JP7576058B2 (en) 2022-03-30 2022-03-30 Information processing system, method and program

Country Status (2)

Country Link
JP (1) JP7576058B2 (en)
TW (1) TWI868641B (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117227A (en) 2000-10-05 2002-04-19 Nissho Electronics Kk Method and system for evaluating and rating credit of customer in new credit granting for individual
JP2017091245A (en) 2015-11-11 2017-05-25 ヤフー株式会社 Execution apparatus, execution method, and execution program
JP2020149363A (en) 2019-03-13 2020-09-17 ヤフー株式会社 Information processing equipment, information processing methods and information processing programs
JP2021026401A (en) 2019-08-01 2021-02-22 株式会社Nttドコモ Examination device

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282823A (en) * 1998-03-31 1999-10-15 Ricchi Hyoka Kenkyusho:Kk Land evaluation system and method, and medium storing land evaluation program
US8155877B2 (en) * 2007-11-29 2012-04-10 Microsoft Corporation Location-to-landmark
US8855901B2 (en) * 2012-06-25 2014-10-07 Google Inc. Providing route recommendations
KR20140103451A (en) * 2013-02-18 2014-08-27 대한민국(안전행정부 국립재난안전연구원장) System and method for assessing and managing inundation vulnerability
CN105430032A (en) * 2014-09-17 2016-03-23 阿里巴巴集团控股有限公司 Method of pushing information by combining geographic position of terminal, and server
CN111858937B (en) * 2016-12-14 2024-04-30 创新先进技术有限公司 A method and device for identifying false address information
CN110705477A (en) * 2019-09-30 2020-01-17 深圳市商汤科技有限公司 Behavior analysis method and apparatus, electronic device, and computer storage medium
CN111311193B (en) * 2020-02-26 2023-09-22 百度在线网络技术(北京)有限公司 Method and device for configuring public service resources

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117227A (en) 2000-10-05 2002-04-19 Nissho Electronics Kk Method and system for evaluating and rating credit of customer in new credit granting for individual
JP2017091245A (en) 2015-11-11 2017-05-25 ヤフー株式会社 Execution apparatus, execution method, and execution program
JP2020149363A (en) 2019-03-13 2020-09-17 ヤフー株式会社 Information processing equipment, information processing methods and information processing programs
JP2021026401A (en) 2019-08-01 2021-02-22 株式会社Nttドコモ Examination device

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
山田 慎也,深層学習を用いた土地価格推定モデルにおける衛星画像の有効性の評価,第12回データ工学と情報マネジメントに関するフォーラム (第18回日本データベース学会年次大会) [online] ,日本,2020年05月14日,p.3-4
金融機関向け 空間情報システム 地図情報ソリューション,地図情報ソリューションカタログ,株式会社 インフォマティクス,2021年10月14日,p.5

Also Published As

Publication number Publication date
JP2023148436A (en) 2023-10-13
TW202343282A (en) 2023-11-01
TWI868641B (en) 2025-01-01

Similar Documents

Publication Publication Date Title
US20210150625A1 (en) Customizing loan specifics on a per-user basis
US20180232767A1 (en) Smart geo-fencing using location sensitive product affinity
US20130204669A1 (en) Online exchange for personal data
US20130046636A1 (en) Location-Aware Mobile Advertising
US11153711B2 (en) Methods and systems for detecting aggregation events
JP7285521B2 (en) System and method for predicting similar mobile devices
CN109325845A (en) A kind of financial product intelligent recommendation method and system
CN114912015A (en) Object recommendation method, model training method, device, equipment and medium
KR102103670B1 (en) Method and apparatus for estimating real estates
JP7345032B1 (en) Credit screening device, method and program
JP7576058B2 (en) Information processing system, method and program
CN113034168A (en) Content item delivery method and device, computer equipment and storage medium
TWI837066B (en) Information processing devices, methods and program products
TWI815367B (en) Presumption systems, presumption methods, and program products
JP7377322B2 (en) Information processing system, method and program
US20220312150A1 (en) Estimation system, estimation method, and information storage medium
JP7273083B2 (en) Information processing device, information processing method and information processing program
US11301887B2 (en) Recommendation engine for rideshare system and vehicle routing
US20210192553A1 (en) Methods and systems for harnessing location based data for making market recommendations
CN113256401A (en) Method, device, server and storage medium for intercepting user outside pre-loan domain
CN111353873A (en) Method, system, server and storage medium for evaluating credit limit of user
JP7593984B2 (en) Information processing system, information processing method, and program
US11238385B1 (en) Dynamic electronic notifications based on contextual data
JP7366218B1 (en) Information processing device, method and program
KR102515539B1 (en) Linked discount system and method based on travel destination sharing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241018

R150 Certificate of patent or registration of utility model

Ref document number: 7576058

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150