[go: up one dir, main page]

WO2019026396A1 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
WO2019026396A1
WO2019026396A1 PCT/JP2018/019663 JP2018019663W WO2019026396A1 WO 2019026396 A1 WO2019026396 A1 WO 2019026396A1 JP 2018019663 W JP2018019663 W JP 2018019663W WO 2019026396 A1 WO2019026396 A1 WO 2019026396A1
Authority
WO
WIPO (PCT)
Prior art keywords
option
information processing
control unit
output control
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2018/019663
Other languages
English (en)
French (fr)
Inventor
真里 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of WO2019026396A1 publication Critical patent/WO2019026396A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Definitions

  • the present disclosure relates to an information processing device, an information processing method, and a program.
  • Patent Document 1 discloses a technique for presenting an appropriate meal menu according to the health condition of the user.
  • the present disclosure proposes a new and improved information processing apparatus, information processing method, and program capable of naturally guiding an appropriate selection by a user.
  • the second option and the third option are acquired based on the category value of the first option estimated from the user's behavior, the first option, the second option, and An output control unit configured to control an output of the third option, wherein the output control unit is configured such that the category value of the second option is the category value of the first option and the category value of the third option
  • An information processing apparatus is provided which acquires the second option and the third option so as to be located between the category value.
  • the processor obtains a second option and a third option based on the category value of the first option estimated from the user's behavior, and the first option, Controlling an output of the second option and the third option, wherein the controlling is performed by the category value of the second option being the category value of the first option and the third value of the third option.
  • An information processing method is provided, further comprising obtaining the second option and the third option so as to be located between the option value and the category value.
  • the computer acquires the second option and the third option based on the category value of the first option estimated from the user's behavior, and the first option, the second option
  • An output control unit configured to control an output of the second option and the third option, the output control unit further comprising: the category value of the second option being the category value of the first option and the category value of the first option
  • a program for functioning as an information processing apparatus which acquires the second option and the third option so as to be located between the third option and the category value.
  • Embodiment 1.1 Outline of embodiment 1.2.
  • System configuration example 1.3 Functional configuration example of information processing terminal 10 1.4.
  • Functional configuration example of information processing server 20 1.5.
  • the apparatus as described above also includes, for example, an apparatus that provides a presentation to help the user achieve the goal.
  • a device that assists in achieving the goal may, for example, recommend a meal with less calories, recommend action to secure more study time, recommend item or action with less expense, etc. it can.
  • FIG. 1 is a diagram for describing an overview of an embodiment of the present disclosure.
  • the upper part of FIG. 1 shows a situation where the conventional device presents an appropriate meal menu recommended to the user U1 to the user U1 aiming to lose weight.
  • the conventional device detects from the speech UO1 by the user U1 that the user U1 assumes a beef as a meal option, together with the first option O1 desired by the user , And a second option O2 for recommending a chicken with less calories is displayed on the display unit 910.
  • the conventional device outputs a speech utterance SO1 explicitly indicating that the second option is superior to the first option desired by the user.
  • an information processing server that executes processing based on an information processing method according to an embodiment of the present disclosure determines a second option and a second option based on the category value of the first option estimated from the user's action. 3 options are acquired, and the outputs of the first to third options are controlled.
  • the information processing server according to the present embodiment is configured such that the category value of the second option is located between the category value of the first option and the category value of the third option, Obtaining a third option is one of the features.
  • FIG. 1 shows a scene where the information processing server according to the present embodiment presents an appropriate meal menu recommended to the user U1.
  • the information processing server first specifies a first option O1 which is an option desired by the user U1 based on the utterance UO1 of the user U1. Subsequently, the information processing server acquires a second option O2 having a category value lower than that of the first option O1.
  • the above category value is set for each category of goal, and indicates a numerical value that is an important factor for achieving the goal.
  • the calorie corresponds to the category value. Therefore, the information processing server according to the present embodiment acquires a chicken with a calorie lower than that of the first option O1 as a second option O2.
  • the information processing server acquires a fish having a calorie lower than that of the second option O2 as the third option O3 and causes the display unit 110 to display the first to third options O1 to O3. .
  • the information processing server can use the above tendency to guide the user U1 to select the more appropriate second option O2 for achieving the goal.
  • the information processing server causes the display unit 110 to display the first to third options O1 to O3 and causes the voice utterance SO2 to be output according to the first to third options O1 to O3. It is also good.
  • the information processing server improves the attraction effect of the second option by using a modifier that is attractive to the user U1, such as "condensed umami,” without explicitly expressing the calorie. It can be done.
  • the information processing server According to the information processing server according to the present embodiment, it is possible to naturally guide the user to perform more appropriate selection without impairing the mood of the user by explicit expression. Therefore, according to the information processing server according to the present embodiment, the effect of effectively assisting the achievement of the user's goal is expected while maintaining the user's motivation high.
  • FIG. 1 shows an example in which the information processing server causes the first to third options O1 to O3 to be displayed one by one
  • the first to third options O1 to O3 according to the present embodiment are related to this. It is not limited to the example.
  • the information processing server according to the present embodiment may obtain a plurality of first to third options O1 to O3 respectively and cause the display unit 110 to display the plurality of options.
  • the information processing server can also obtain, for example, two first options O1a and O1b, four second options O2a to O2d, and two third options O3a and O3b and cause the display unit 110 to display them. is there.
  • the second option O2 may not necessarily be at the center of the presented options.
  • the information processing server may display, for example, two first choices O1a and O1b, one second choice O2, and four third choices O3a to O3d in this order. That is, the information processing server may display the second option O2 as the third option among the seven options. Also in this case, the effect of attracting the user to the second option 2 can be expected.
  • FIG. 2 is a block diagram showing an exemplary configuration of the information processing system according to the present embodiment.
  • the information processing system according to the present embodiment includes an information processing terminal 10 and an information processing server 20.
  • the information processing terminal 10 and the information processing server 20 are connected via the network 30 so as to be able to communicate with each other.
  • the information processing terminal 10 is an information processing apparatus having a function of presenting a plurality of options to the user based on control by the information processing server 20.
  • the above options include articles, services, actions, etc. recommended to the user for achieving the goal.
  • the information processing terminal 10 according to the present embodiment may have a function of collecting various information related to the user's action.
  • the information processing terminal 10 according to the present embodiment is realized as various devices having the above functions.
  • the information processing terminal 10 according to the present embodiment may be, for example, a mobile phone, a smartphone, a tablet, a wearable device, a computer, a dedicated device of a stationary type or an autonomous moving type, or the like.
  • the information processing server 20 is an information processing apparatus having a function of controlling the presentation of options by the information processing terminal 10.
  • the category value of the second option is the category value of the first option and the category value of the third option based on the first option desired by the user. It is one of the features to obtain the second option and the third option so as to be located between the category values.
  • the network 30 has a function of connecting the information processing terminal 10 and the information processing server 20.
  • the network 30 may include the Internet, a public network such as a telephone network, a satellite communication network, various LANs (Local Area Networks) including Ethernet (registered trademark), a WAN (Wide Area Network), and the like.
  • the network 30 may include a leased line network such as an Internet Protocol-Virtual Private Network (IP-VPN).
  • IP-VPN Internet Protocol-Virtual Private Network
  • the network 30 may also include a wireless communication network such as Wi-Fi (registered trademark) or Bluetooth (registered trademark).
  • the example of the system configuration of the information processing system according to the present embodiment has been described above.
  • the configuration described above with reference to FIG. 2 is merely an example, and the configuration of the information processing system according to the present embodiment is not limited to such an example.
  • the functions of the information processing terminal 10 and the information processing server 20 according to the present embodiment may be realized by a single device.
  • the configuration of the information processing system according to the present embodiment can be flexibly deformed according to the specification and the operation.
  • FIG. 3 is a block diagram showing an example of a functional configuration of the information processing terminal 10 according to the present embodiment.
  • the information processing terminal 10 according to the present embodiment includes a display unit 110, an audio output unit 120, an audio input unit 130, an imaging unit 140, a sensor unit 150, a control unit 160, and a server communication unit 170. .
  • the display unit 110 has a function of outputting visual information such as an image or text.
  • the display unit 110 according to the present embodiment may output visual information related to the first to third options based on control by the information processing server 20, for example.
  • the display unit 110 according to the present embodiment includes a display device that presents visual information. Examples of the display device include a liquid crystal display (LCD) device, an organic light emitting diode (OLED) device, and a touch panel.
  • LCD liquid crystal display
  • OLED organic light emitting diode
  • the voice output unit 120 has a function of outputting hearing information including voice utterances and the like.
  • the audio output unit 120 according to the present embodiment may output hearing information related to the first to third options based on control by the information processing server 20.
  • the audio output unit 120 according to the present embodiment includes an audio output device such as a speaker or an amplifier.
  • the voice input unit 130 has a function of collecting sound information such as an utterance by a user and a background sound.
  • the sound information collected by the voice input unit 130 is used for voice recognition and action recognition by the information processing server 20.
  • the voice input unit 130 according to the embodiment includes a microphone for collecting sound information.
  • the imaging unit 140 has a function of capturing an image including the user and the surrounding environment.
  • the image captured by the imaging unit 140 is used for user recognition and action recognition by the information processing server 20.
  • the imaging unit 140 according to the present embodiment includes an imaging device capable of capturing an image. Note that the above image includes moving images as well as still images.
  • the sensor unit 150 has a function of collecting various sensor information related to the user's behavior.
  • the sensor information collected by the sensor unit 150 is used for action recognition by the information processing server 20.
  • the sensor unit 150 includes, for example, an acceleration sensor, a gyro sensor, a geomagnetic sensor, a heat sensor, an optical sensor, a vibration sensor, a GNSS (Global Navigation Satellite System) signal receiving device, and the like.
  • GNSS Global Navigation Satellite System
  • Control unit 160 The control part 160 which concerns on this embodiment has a function which controls each structure with which the information processing terminal 10 is provided.
  • the control unit 160 controls, for example, start and stop of each component. Further, the control unit 160 can input a control signal generated by the information processing server 20 to the display unit 110 or the sound output unit 120. Moreover, the control part 160 which concerns on this embodiment may have a function equivalent to the output control part 230 of the information processing server 20 mentioned later.
  • the server communication unit 170 has a function of performing information communication with the information processing server 20 via the network 30. Specifically, the server communication unit 170 transmits, to the information processing server 20, the sound information collected by the voice input unit 130, the image information captured by the imaging unit 140, and the sensor information collected by the sensor unit 150. The server communication unit 170 also receives, from the information processing server 20, control signals and artificial voices related to the output of the first to third options.
  • the example of the functional configuration of the information processing terminal 10 according to the present embodiment has been described above.
  • the above configuration described with reference to FIG. 3 is merely an example, and the functional configuration of the information processing terminal 10 according to the present embodiment is not limited to such an example.
  • the information processing terminal 10 according to the present embodiment may not necessarily include all of the configurations shown in FIG. 3.
  • the information processing terminal 10 can be configured not to include the imaging unit 140, the sensor unit 150, and the like.
  • the control unit 160 according to the present embodiment may have the same function as the output control unit 230 of the information processing server 20.
  • the functional configuration of the information processing terminal 10 according to the present embodiment can be flexibly deformed according to the specification and the operation.
  • FIG. 4 is a block diagram showing an example of a functional configuration of the information processing server 20 according to the present embodiment.
  • the information processing server 20 according to the present embodiment includes a recognition unit 210, a determination unit 220, an output control unit 230, a voice synthesis unit 240, a storage unit 250, and a terminal communication unit 260.
  • the storage unit 250 also includes a user DB 252, a condition setting DB 254, and an option DB 256.
  • the recognition unit 210 has a function of performing recognition related to the user.
  • the recognition unit 210 can perform user recognition, for example, by comparing the speech or image of the user collected by the information processing terminal 10 with the voice feature or image of the user stored in advance in the user DB 252. .
  • the recognition unit 210 can recognize the action of the user based on the sound information, the image, and the sensor information collected by the information processing terminal 10. For example, the recognition unit 210 can perform voice recognition based on the user's utterance collected by the information processing terminal 10, and can recognize that the user is about to eat a meal. Also, for example, the recognition unit 210 can recognize that the user is exercising based on the image and the sensor information collected by the information processing terminal 10. Also, for example, the recognition unit 210 can recognize that the user is searching for a restaurant based on the search behavior of the user. As described above, the user's action recognized by the recognition unit 210 includes a speech action and a search action as well as an action accompanied by a large body movement.
  • the determination unit 220 has a function of determining whether or not the action of the user recognized by the recognition unit 210 satisfies the multiple option presentation condition. Specifically, the determination unit 220 determines whether the action recognized by the recognition unit 210 is an action that affects the attainment of the goal. For example, when the goal is weight loss, the determination unit 220 may determine whether the recognized action is a meal or exercise-related action.
  • the determination unit 220 subsequently determines whether the category value of the action exceeds a threshold.
  • the above category value is set for each category of goal, and indicates a numerical value that is an important factor for achieving the goal.
  • the determination unit 220 may determine whether the calorie intake of the meal, which is the first option the user is about to take, exceeds a threshold. At this time, when the intake calories exceed the threshold, the determination unit 220 determines that the action of the user satisfies the presentation condition of the plurality of options.
  • the determination unit 220 may determine whether the intensity of exercise that the user is going to perform or the consumed calories exceeds a threshold. At this time, when the exercise intensity and the consumed calories fall below the threshold value, the determination unit 220 determines that the action of the user satisfies the presentation condition of the plurality of options.
  • the determination unit 220 can perform the above determination based on the category corresponding to the target stored in the setting condition DB 254 and the threshold value of the category value according to the category.
  • the output control unit 230 acquires the second option and the third option based on the category value of the first option estimated from the action of the user, and selects one of the first to third options. It has a function to control the output. At this time, the output control unit 230 according to the present embodiment causes the category value of the second option to be located between the category value of the first option and the category value of the third option. And obtaining a third option is one of the features.
  • the output control unit 230 it is more appropriate for achieving the goal than the first option desired by the user, using the tendency of the user who is easy to select the middle option. It is possible to guide the user to select the second option O2.
  • the output control unit 230 may output the plurality of options in the order of the first option, the second option, and the third option. Furthermore, when outputting a plurality of options as visual information to the display unit 110, the output control unit 230 may display the second option near the center of the display area. More specifically, the output control unit 230 may perform display control such that the second option is disposed closer to the center of the display area than the first and third options. For example, the output control unit 230 may display the first option on the left side of the display area, the second option on the vicinity of the center of the display area, and the third option on the right side of the display area . Also, for example, the output control unit 230 may display the first option in the upper part of the display area, the second option in the middle of the display area, and the third option in the lower part of the display area.
  • the first to third options according to the present embodiment may be plural. Also in this case, the output control unit 230 causes the plurality of second options to be displayed at a position closer to the center of the display area than the first and third options. For example, when there is one first option, two second options, and one third option, the output control unit 230 causes the two second options to be displayed near the center of the display area. , The first option and the third option may be displayed at the edges of the two second options.
  • the second option can be physically arranged in the middle together with the category value, and a higher induction effect can be expected.
  • the output control unit 230 performs the control as described above based on the fact that the category value of the first option satisfies the predetermined condition. Specifically, when the determination unit 220 determines that the category value of the first option satisfies the presentation condition of a plurality of options, the output control unit 230 determines whether the category value of the first option is the same as the category based on the category of the first option. The second option and the third option belonging to the category are acquired from the option DB 256.
  • the output control unit 230 has a function of controlling the output mode of the first to third options so as to improve the attraction effect of the second option to the user.
  • the above-described functions of the output control unit 230 according to the present embodiment will be separately described in detail.
  • the speech synthesis unit 240 has a function of synthesizing artificial speech output by the information processing terminal 10 based on control by the output control unit 230. At this time, the voice synthesis unit 240 synthesizes the artificial voice corresponding to the output correspondence set by the output control unit 230.
  • the storage unit 250 includes a user DB 252, a condition setting DB 254, and an option DB 256.
  • the user DB 252 stores various information related to the user.
  • the user DB 252 stores, for example, a user's face image and voice feature.
  • the user DB 252 may store information such as gender, age, preference, and tendency of the user.
  • the setting condition DB 254 stores a goal to be achieved by the user, a threshold value of a category value related to the category of the goal, and the like.
  • the above target or threshold may be set by the user, or may be set dynamically by the determination unit 220 or the like.
  • the determination unit 220 can also set weight loss, increase in muscle mass, and the like as a target based on the fact that the recognition unit 210 does not recognize the exercise a small number of times.
  • the option DB 256 associates and stores a plurality of options and a category value related to the option for each target category.
  • the options and category values stored by the option DB 256 may be dynamically accumulated based on, for example, information published on the Internet.
  • the option which concerns on this embodiment does not necessarily need to be memorize
  • the output control unit 230 according to the present embodiment may acquire, for example, the second option or the third option from another device via the network 30.
  • the terminal communication unit 260 has a function of performing information communication with the information processing terminal 10 via the network 30. Specifically, the terminal communication unit 260 receives sound information, image information, and sensor information from the information processing terminal 10. Also, the terminal communication unit 260 transmits the control signal generated by the output control unit 230 and the artificial voice synthesized by the voice synthesis unit 240 to the information processing terminal 10.
  • the functional configuration of the information processing server 20 has been described.
  • the above-mentioned functional composition explained using Drawing 4 is an example to the last, and functional composition of information processing server 20 concerning this embodiment is not limited to the example concerned.
  • the information processing server 20 may not necessarily have all of the configurations shown in FIG. 4.
  • the recognition unit 210, the determination unit 220, the voice synthesis unit 240, and the storage unit 250 can be provided in another device different from the information processing server 20.
  • the functional configuration of the information processing server 20 according to the present embodiment can be flexibly deformed according to the specification and the operation.
  • output control of a plurality of options by the output control unit 230 according to the present embodiment will be described by giving a specific example.
  • the output control unit 230 according to this embodiment outputs the output modes related to the first to third options so as to improve the attraction effect of the second option to the user among the plurality of options to be presented. Can be controlled. That is, the output control unit 230 can control the outputs of the first to third options so that the second option looks more attractive to the user than the other options.
  • the above output modes include, for example, language expressions.
  • the output control unit 230 can control the linguistic expressions of the first to third options so as to improve the attraction effect of the second option. More specifically, the output control unit 230 may generate an explanatory note for the first to third options so that the second option looks attractive to the user.
  • FIG. 5 is a diagram for describing control of language expression by the output control unit 230 according to the present embodiment.
  • the upper part of FIG. 5 shows a scene in which the user U2 has lost his choice between the $ 500 chair and the $ 300 chair when purchasing a chair.
  • the determination unit 220 determines that the action of the user U2 satisfies the presentation condition of the plurality of options. More specifically, the determination unit 220 determines that the goal of the user U2 is savings, and that the amount of at least one of the chairs for which the user U2 is considering purchasing, that is, the category value, exceeds the threshold. The above determination may be made. In the example shown in FIG. 5, based on the fact that the category value is, for example, $ 400, the determination unit 220 determines a chair of $ 500 as the first option O1.
  • the output control unit 230 acquires the second option O2 and the third option O3 based on the above determination by the determination unit 220.
  • the output control unit 230 uses the chair as the second option O2 as it is.
  • the output control unit 230 sets the $ 300 chair as the second option O2, and the $ 100 chair having a category value lower than that of the second option O2 as the third option O3. It is acquired as.
  • the output control unit 230 causes the display unit 110 of the information processing terminal 10 to output the first to third options O1 to O3 and a voice indicating that another option, that is, the third option O3 has been found.
  • the speech SO3 is output to the voice output unit 120.
  • the output control unit 230 causes the voice output unit 120 to output a voice utterance SO4 corresponding to an explanatory sentence related to the first to third options following the voice utterance SO3.
  • the output control unit 230 may generate an explanatory text for the first to third options O1 to O3 so that the second option O2 looks attractive to the user U2, and may cause the voice output unit 120 to output an explanatory text.
  • the output control unit 230 is a target person who makes a recommendation “to the smart U” and a modification relating to the second and third options O2 and O3 “of a simple design”. You may control verbal expressions such as the reason for recommendation such as the word, "It looks good”.
  • the output control unit 230 can control the language expression as described above by acquiring information regarding the age, sex, preference, and the like of the user U2 stored in the user DB 252. According to the output control unit 230 according to the present embodiment, it is possible to control the language expression according to the first to third options so that the explanatory text related to the second option looks more attractive to the user. It is possible to further enhance the attraction effect of the second option for Although FIG. 5 exemplifies a case in which the output control unit 230 outputs an explanatory text by voice for the first to third options, the output control unit 230 uses the explanatory text as visual information to display the display unit 110. It may be displayed on the screen.
  • the output modes controlled by the output control unit 230 also include visual expressions.
  • the output control unit 230 can control visual expression relating to the first to third options so as to enhance the attraction effect of the second option. More specifically, the output control unit 230 may control display of images and text corresponding to the first to third options so that the second option looks attractive to the user.
  • FIG. 6 is a diagram for describing control of visual expression by the output control unit 230 according to the present embodiment.
  • FIG. 6 shows first to third options O1 to O3 displayed on the display unit 110 under the control of the output control unit 230.
  • the output control unit 230 may obtain the images I1 to I3 representing the first to third options and cause the display unit 110 to display the images I1 to I3 as illustrated. At this time, the output control unit 230 according to the present embodiment acquires the images I1 to I3 and causes the display unit 110 to display them, for example, so that the image I2 representing the second option O2 looks more attractive to the user. Can.
  • the output control unit 230 displays an image that looks more delicious for the second option O2 and the third option O3.
  • I2 and I3 may be acquired and displayed, and for the first option O1, an image I1 that looks inferior may be acquired and displayed.
  • the horizontal lines drawn in the image I1 indicate poor appearance.
  • the output control unit 230 can acquire the image I1 based on, for example, the shape and size of the dish, the lightness, the resolution, the color, and the like of the image.
  • the output control unit 230 may improve the attraction effect of the second option O2 by controlling the display effect of the acquired images I1 to I3. Specifically, the output control unit 230 controls the display effect such that the image I2 representing the second option O2 is more attractive to the user by performing image processing on the acquired images I1 to I3. be able to.
  • the above display effects include, for example, lightness, contrast, saturation, resolution, noise and the like of the image.
  • the output control unit 230 may perform the correction regarding the parameters as described above so that the appearance of the image I2 representing the second option O2 is improved.
  • the output control unit 230 can also control parameters or add noise so that the appearance of the image I1 representing the first option O1 is degraded.
  • the visual expression according to the present embodiment includes a color expression.
  • the output control unit 230 may control the color expression of the first to third options O1 to O3 so as to improve the attraction effect of the second option.
  • the output control unit 230 may enhance the attraction effect of the second option O2, for example, by using a color that affects the appetite. it can.
  • the output control unit 230 may control the background colors BC1 to BC3 related to the images I1 to I3. For example, the output control unit 230 may improve the attractiveness of the image I2 by using a warm color which is appetizing as the background color BC2 related to the second option O2. Further, the output control unit 230 may reduce the attractiveness of the image I1 by using a cold color that reduces the appetite for the background color BC1 related to the first option O1. Further, the output control unit 230 may control the color of the text related to the first to third options O1 to O3 in addition to the background colors BC to BC3.
  • the assignment of colors described above is merely an example, and the control of color expression by the output control unit 230 is not limited to such an example.
  • the output control unit 230 can appropriately select a color that the user feels more attractive based on, for example, the season, the temperature, the preference of the user, and the like.
  • the output modes controlled by the output control unit 230 also include auditory expressions.
  • the output control unit 230 can control auditory expressions related to the first to third options so as to improve the attraction effect of the second option. More specifically, the output control unit 230 may control voice utterance and background sound so that the second option looks attractive to the user.
  • FIG. 7 is a diagram for describing control of auditory expression by the output control unit 230 according to the present embodiment.
  • first to third options O1 to O3 presented to the user U3 who is going to visit a nearby library are shown together with the map information.
  • the determination unit 220 determines that the action of the user U3 satisfies the presentation condition of the plurality of options based on the speech UO3 of the user U3 of the user recognized by the recognition unit 210. More specifically, the determination unit 220 determines that the goal of the user U3 is elimination of the lack of exercise, and walking movement to a nearby library, that is, exercise intensity and calorie consumption for the first option O1 fall below the threshold. Based on the determination, it is determined that the action of the user U3 satisfies the presentation condition of multiple options.
  • the output control unit 230 acquires the second option O2 and the third option O3 based on the above determination by the determination unit 220. At this time, the output control unit 230 causes the exercise intensity to be higher than the second option O2 having a higher exercise intensity than the first option O1 and the second option O2 so as to eliminate the lack of exercise of the user U3. A third option O3 may be obtained.
  • the output control unit 230 causes the display unit 110 to display the first to third options O1 to O3 together with the map information, and finds another option, that is, the second option O2 and the third option O3.
  • the voice output unit 120 is made to output a voice utterance SO5 informing the effect.
  • the output control unit 230 may control the display of the map information so that the second option O2 is disposed near the center of the display area as illustrated. According to the above control, the second option O2 can be displayed at a position where the user U3 can easily catch the eye, and the attraction effect of the second option O2 can be enhanced.
  • the output control unit 230 can output the background sound BS to the audio output unit 120 along with the above control.
  • the output control unit 230 selects the background sound BS in which the attraction effect of the second option O2 is enhanced and causes the sound output unit 120 to output the selected background sound BS.
  • the output control unit 230 can enhance the motivation of the user U3 with respect to exercise, for example, by outputting up-tempo music.
  • the output control unit 230 may select, as the background sound BS, a music that is frequently heard by the user U3 when jogging.
  • the output control unit 230 according to the present embodiment can enhance the attraction effect of the second option by controlling the auditory expression even if the category of the plurality of options is, for example, a meal.
  • the output control unit 230 uses a music or the like as a background sound to cause the user to select a wine that is the second option. The user may be reminded of a certain France.
  • the background sound has been described above as an example of auditory expression
  • the output control unit 230 utters the explanatory text of the first to third options
  • the speed, strength and weakness of the speech utterance The attraction effect of the second option can be enhanced by controlling the height, height, length, and the like.
  • FIG. 8 is a flowchart showing the flow of output control by the information processing server 20 according to the present embodiment.
  • the recognition unit 210 of the information processing server 20 recognizes the user and the action of the user based on the sound information, the image information and the sensor information collected by the information processing terminal 10 (S1101). .
  • the determination unit 220 determines whether the action of the user recognized in step S1101 satisfies the presentation condition of multiple options (S1102). At this time, the determination unit 220 determines whether the recognized action is an action affecting target achievement, and whether the category value of the action exceeds a threshold.
  • the information processing server 20 ends the process related to the output control of the plurality of options. If the user's action recognized in step S1101 is a voice input action related to an inquiry or the like, the information processing server 20 may perform a process corresponding to the voice utterance.
  • the output control unit 230 determines the second option and the second option based on the category value of the first option estimated from the user's action.
  • the third option is acquired (S1103).
  • the output control unit 230 controls the second option and the third option such that the category value of the second option is located between the category value of the first option and the category value of the third option.
  • the output control unit 230 sets an output mode relating to the first to third options so as to improve the attraction effect of the second option to the user (S1104). Specifically, the output control unit 230 can enhance the attraction effect of the second option by controlling the linguistic expression, the visual expression, and the auditory expression according to the first to third options.
  • the output control unit 230 causes the speech synthesis unit 240 to synthesize an artificial speech used for speech utterances related to the first to third options (S1105).
  • the process in step S1105 may not be performed.
  • the terminal communication unit 260 transmits, to the information processing terminal 10, the artificial voice synthesized in step S1105 and the control signal according to the output mode set in step S1104, and outputs the first to third options. Control is executed (S1106).
  • FIG. 9 is a block diagram illustrating an exemplary hardware configuration of the information processing terminal 10 and the information processing server 20 according to an embodiment of the present disclosure.
  • the information processing terminal 10 and the information processing server 20 include, for example, a CPU 871, a ROM 872, a RAM 873, a host bus 874, a bridge 875, an external bus 876, an interface 877, and an input device 878. , An output device 879, a storage 880, a drive 881, a connection port 882, and a communication device 883.
  • the hardware configuration shown here is an example, and some of the components may be omitted. In addition, components other than the components shown here may be further included.
  • the CPU 871 functions as, for example, an arithmetic processing unit or a control unit, and controls the overall operation or a part of each component based on various programs recorded in the ROM 872, the RAM 873, the storage 880, or the removable recording medium 901.
  • the ROM 872 is a means for storing a program read by the CPU 871, data used for an operation, and the like.
  • the RAM 873 temporarily or permanently stores, for example, a program read by the CPU 871 and various parameters appropriately changed when the program is executed.
  • the CPU 871, the ROM 872, and the RAM 873 are mutually connected via, for example, a host bus 874 capable of high-speed data transmission.
  • host bus 874 is connected to external bus 876, which has a relatively low data transmission speed, via bridge 875, for example.
  • the external bus 876 is connected to various components via an interface 877.
  • Input device 8708 For the input device 878, for example, a mouse, a keyboard, a touch panel, a button, a switch, a lever, and the like are used. Furthermore, as the input device 878, a remote controller (hereinafter, remote control) capable of transmitting a control signal using infrared rays or other radio waves may be used.
  • the input device 878 also includes a voice input device such as a microphone.
  • the output device 879 is a display device such as a CRT (Cathode Ray Tube), an LCD, or an organic EL, a speaker, an audio output device such as a headphone, a printer, a mobile phone, or a facsimile. It is a device that can be notified visually or aurally. Also, the output device 879 according to the present disclosure includes various vibration devices capable of outputting haptic stimulation.
  • the storage 880 is a device for storing various data.
  • a magnetic storage device such as a hard disk drive (HDD), a semiconductor storage device, an optical storage device, a magneto-optical storage device, or the like is used.
  • the drive 881 is a device that reads information recorded on a removable recording medium 901 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, or writes information on the removable recording medium 901, for example.
  • a removable recording medium 901 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory
  • the removable recording medium 901 is, for example, DVD media, Blu-ray (registered trademark) media, HD DVD media, various semiconductor storage media, and the like.
  • the removable recording medium 901 may be, for example, an IC card equipped with a non-contact IC chip, an electronic device, or the like.
  • connection port 882 is, for example, a port for connecting an externally connected device 902 such as a USB (Universal Serial Bus) port, an IEEE 1394 port, a SCSI (Small Computer System Interface), an RS-232C port, or an optical audio terminal. is there.
  • an externally connected device 902 such as a USB (Universal Serial Bus) port, an IEEE 1394 port, a SCSI (Small Computer System Interface), an RS-232C port, or an optical audio terminal. is there.
  • the external connection device 902 is, for example, a printer, a portable music player, a digital camera, a digital video camera, an IC recorder, or the like.
  • the communication device 883 is a communication device for connecting to a network.
  • a communication card for wired or wireless LAN Bluetooth (registered trademark) or WUSB (Wireless USB), a router for optical communication, ADSL (Asymmetric Digital) (Subscriber Line) router, or modem for various communications.
  • Bluetooth registered trademark
  • WUSB Wireless USB
  • ADSL Asymmetric Digital
  • Subscriber Line Subscriber Line
  • the information processing server 20 acquires the second option and the third option based on the category value of the first option estimated from the action of the user, and Control the output of the first to third options.
  • the information processing server 20 according to the present embodiment is configured such that the category value of the second option is located between the category value of the first option and the category value of the third option.
  • obtaining a third option is one of the features. According to such a configuration, it is possible to more naturally guide the appropriate selection by the user.
  • the information processing server 20 causes the display unit 110 to mainly output the first to third options as visual information
  • the present technology is not limited to such an example.
  • the information processing server 20 can also present the first to third options to the user using only voiced speech.
  • the information processing server 20 outputs the second option and the third option one by one.
  • the information processing server 20 includes a plurality of second options and a plurality of second options. Output control can also be performed by acquiring the third option of.
  • each step concerning processing of information processing server 20 of this specification does not necessarily need to be processed in chronological order according to the order described in the flowchart.
  • the steps related to the processing of the information processing server 20 may be processed in an order different from the order described in the flowchart or may be processed in parallel.
  • the second option and the third option are acquired based on the category value of the first option estimated from the user's behavior, and the first option, the second option, and the third option are obtained.
  • Output control unit to control the output Equipped with The output control unit is configured to set the second option so that the category value of the second option is located between the category value of the first option and the category value of the third option. Get the third option, Information processing device.
  • the output control unit outputs a plurality of options in order of the first option, the second option, and the third option.
  • the output control unit causes the second option to be displayed near the center of the display area.
  • the output control unit acquires the second option and the third option belonging to the same category as the category based on the category of the first option.
  • the information processing apparatus according to any one of the above (1) to (3).
  • the output control unit acquires the second option and the third option based on the fact that the category value of the first option satisfies a predetermined condition.
  • the information processing apparatus according to any one of the above (1) to (4).
  • the output control unit controls an output aspect according to the first option, the second option, and the third option such that the attraction effect of the second option to the user is improved.
  • the information processing apparatus according to any one of the above (1) to (5).
  • the output mode includes a visual expression
  • the output control unit controls the visual representation according to the first option, the second option, and the third option such that the attraction effect of the second option is improved.
  • the visual representation includes display effects of an image representing the first option, the second option, and the third option
  • the output control unit controls a display effect of the image representing the first option, the second option, and the third option such that the attraction effect of the second option is improved.
  • the display effect of the image includes at least one of brightness, contrast, saturation, resolution, and noise.
  • the visual expression includes a color expression
  • the output control unit controls a color expression according to the first option, the second option, and the third option such that the attraction effect of the second option is improved.
  • the information processing apparatus according to any one of the above (7) to (9).
  • the output control unit acquires an image representing the first option, the second option, and the third option such that the attraction effect of the second option is improved, and outputs the image.
  • Control The information processing apparatus according to any one of the above (6) to (10).
  • the output mode includes an auditory expression, The output control unit controls the auditory expression according to the first option, the second option, and the third option such that the attraction effect of the second option is improved.
  • the information processing apparatus according to any one of the above (6) to (11).
  • the auditory expression includes background sound, The output control unit controls the output of the background sound such that the attraction effect of the second option is improved.
  • the output mode includes a linguistic expression, The output control unit controls the language expression according to the first option, the second option, and the third option so that the attraction effect of the second option is improved.
  • the linguistic expression includes the first option, the second option, and a modifier according to the third option, The output control unit controls the first option, the second option, and the modifier according to the third option such that the attraction effect of the second option is improved.
  • a recognition unit that recognizes the action of the user, Further comprising The information processing apparatus according to any one of the above (1) to (15).
  • a display unit that displays the first option, the second option, and the third option based on control by the output control unit; Further comprising The information processing apparatus according to any one of the above (1) to (16).
  • An audio output unit that outputs a voice of the first option, the second option, and the third option based on control by the output control unit; Further comprising The information processing apparatus according to any one of the above (1) to (17).
  • the processor obtains a second option and a third option based on the category value of the first option estimated from the user's behavior, the first option, the second option, and the third option.
  • Control the output of the Including The controlling may be such that the category value of the second option is located between the category value of the first option and the category value of the third option; Obtaining the third option, Further include, Information processing method.
  • Output control unit to control the output Equipped with The output control unit is configured to set the second option so that the category value of the second option is located between the category value of the first option and the category value of the third option. Get the third option, Information processing device, Program to function as.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御する出力制御部、を備え、前記出力制御部は、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得する、情報処理装置を提供することにより、ユーザによる適切な選択をより自然に誘導する。

Description

情報処理装置、情報処理方法、およびプログラム
 本開示は、情報処理装置、情報処理方法、およびプログラムに関する。
 近年、ユーザに対し、推奨する物品や行動などを提示する種々の装置が普及している。例えば、特許文献1には、ユーザの健康状態などに応じた適正な食事メニューを提示する技術が開示されている。
特開2002-329006号公報
 しかし、特許文献1に記載のシステムでは、ユーザが外食などを希望している場合であっても、健康状態に応じた適正な食事メニューが提示される。このため、ユーザによっては、食事メニューの提示に不快感を感じることや、当該提示に反発して敢えて別の食事を選択することも想定される。
 そこで、本開示では、ユーザによる適切な選択をより自然に誘導することが可能な、新規かつ改良された情報処理装置、情報処理方法、およびプログラムを提案する。
 本開示によれば、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御する出力制御部、を備え、前記出力制御部は、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得する、情報処理装置が提供される。
 また、本開示によれば、プロセッサが、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御すること、を含み、前記制御することは、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得すること、をさらに含む、情報処理方法が提供される。
 また、本開示によれば、コンピュータを、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御する出力制御部、を備え、前記出力制御部は、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得する、情報処理装置、として機能させるためのプログラムが提供される。
 以上説明したように本開示によれば、ユーザによる適切な選択をより自然に誘導することが可能となる。
 なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本開示の一実施形態の概要について説明するための図である。 同実施形態に係る情報処理システムの構成例を示すブロック図である。 同実施形態に係る情報処理端末の機能構成例を示すブロック図である。 同実施形態に係る情報処理サーバの機能構成例を示すブロック図である。 同実施形態に係る力制御部による言語表現の制御について説明するための図である。 同実施形態に係る出力制御部による視覚表現の制御について説明するための図である。 同実施形態に係る出力制御部による聴覚表現の制御について説明するための図である。 同実施形態に係る情報処理サーバによる出力制御の流れを示すフローチャートである。 本開示の一実施形態に係るハードウェア構成例を示す図である。
 以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
 なお、説明は以下の順序で行うものとする。
 1.実施形態
  1.1.実施形態の概要
  1.2.システム構成例
  1.3.情報処理端末10の機能構成例
  1.4.情報処理サーバ20の機能構成例
  1.5.出力制御の具体例
  1.6.出力制御の流れ
 2.ハードウェア構成例
 3.まとめ
 <1.実施形態>
 <<1.1.実施形態の概要>>
 まず、本開示の一実施形態の概要について説明する。上述したように、近年においては、ユーザに対し、推奨する物品や行動を提示する種々の装置が普及している。上記のような装置には、例えば、ユーザによる目標の達成を補助するための提示を行う装置も含まれる。
 上記の目標には、例えば、体重の減量、資格の取得、貯蓄などが挙げられる。この際、目標の達成を補助する装置は、例えば、よりカロリーの少ない食事を推奨したり、より勉強時間を確保する行動を推奨したり、より出費の少ない物品や行動を推奨したりすることができる。
 一方、装置による上記のような推奨情報の提示により、ユーザの機嫌が損なわれる場合も想定される。図1は、本開示の一実施形態の概要について説明するための図である。図1の上段には、体重の減量を目的とするユーザU1に対し、従来の装置がユーザU1に推奨する適切な食事メニューを提示する場面が示されている。
 図1の上段に示す一例の場合、従来の装置は、ユーザU1による発話UO1から、ユーザU1がビーフを食事の選択肢として想定していることを検出し、ユーザが希望する第1の選択肢O1と共に、よりカロリーの少ないチキンを推奨する第2の選択肢O2を表示部910に表示させている。また、従来の装置は、上記の表示と共に、ユーザが希望する第1の選択肢よりも第2の選択肢が優れていることを明示的に示す音声発話SO1を出力させている。
 しかし、従来の装置による上記のような明示的な提示では、ユーザU1の機嫌を損ね、また、反発したユーザが敢えて第1の選択肢O1を敢えて選択する状況を招く可能性がある。さらには、装置による推奨情報の提示に不快感を覚えたユーザU1が目標達成に対する熱意を失ったり、装置の使用を止めてしまう事態も想定される。
 本開示に係る技術思想は、上記の点に着目して発想されたものであり、ユーザによる適切な選択をより自然に誘導することを可能とする。このために、本開示の一実施形態に係る情報処理方法に基づく処理を実行する情報処理サーバは、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、上記第1~第3の選択肢の出力を制御する。この際、本実施形態に係る情報処理サーバは、第2の選択肢のカテゴリ値が、第1の選択肢のカテゴリ値と第3の選択肢のカテゴリ値との間に位置するよう、第2の選択肢および第3の選択肢を取得すること、を特徴の一つとする。
 図1の下段には、本実施形態に係る情報処理サーバがユーザU1に推奨する適切な食事メニューを提示する場面が示されている。情報処理サーバは、まず、ユーザU1の発話UO1に基づいて、ユーザU1が希望する選択肢である第1の選択肢O1を特定する。続いて、情報処理サーバは、第1の選択肢O1よりも低いカテゴリ値を有する第2の選択肢O2を取得する。
 ここで、上記のカテゴリ値とは、目標のカテゴリごとに設定され、当該目標の達成に対し、重要な要因となる数値を指す。図1の一例の場合、カロリーがカテゴリ値に該当する。このため、本実施形態に係る情報処理サーバは、第1の選択肢O1よりもカロリーの低いチキンを第2の選択肢O2として取得している。
 さらに、本実施形態に係る情報処理サーバは、第2の選択肢O2よりもカロリーの低いフィッシュを第3の選択肢O3として取得し、第1~第3の選択肢O1~O3を表示部110に表示させる。
 このように、複数の3つ以上の選択肢が提示された場合、人は真ん中の選択肢を選択しやすいことが知られている。上記の傾向は、ゴルディロックス効果(Goldilocks effect、またはGoldilocks principle)とも称される。本実施形態に係る情報処理サーバは、上記の傾向を利用し、ユーザU1が、目標達成のためにより適切な第2の選択肢O2を選択するよう誘導することが可能である。
 また、本実施形態に係る情報処理サーバは、第1~第3の選択肢O1~O3を表示部110に表示させると共に、第1~第3の選択肢O1~O3に係る音声発話SO2を出力させてもよい。この際、情報処理サーバは、カロリーに関する明示的な表現を行わず、「旨味の凝縮された」、など、ユーザU1にとって魅力的な修飾語を用いることで、第2の選択肢の誘引効果を向上させることができる。
 以上説明したように、本実施形態に係る情報処理サーバによれば、明示的な表現によりユーザの機嫌を損ねることなく、より適した選択を行うよう自然にユーザを誘導することが可能となる。このため、本実施形態に係る情報処理サーバによれば、ユーザのモチベーションを高く維持しながらユーザの目標達成を効果的に補助する効果が期待される。
 なお、図1では、情報処理サーバが第1~第3の選択肢O1~O3をそれぞれ一つずつ表示させる一例を示したが、本実施形態に係る第1~第3の選択肢O1~O3は係る例に限定されない。本実施形態に係る情報処理サーバは、第1~第3の選択肢O1~O3をそれぞれ複数取得し、表示部110に表示させてもよい。情報処理サーバは、例えば、2つの第1の選択肢O1aおよびO1b、4つの第2の選択肢O2a~O2d、2つの第3の選択肢O3aおよびO3bを取得し、表示部110に表示させることも可能である。この場合、上記のゴルディロックス効果により、ユーザが4つの第2の選択肢O2a~O2dのうちのいずれかを選択するよう誘導することが可能である。また、第2の選択肢O2は、必ずしも、提示される選択肢のうちの中央に位置しなくてもよい。情報処理サーバは、例えば、2つの第1の選択肢O1aおよびO1b、1つの第2の選択肢O2、4つの第3の選択肢O3a~O3dを当該順に表示させてもよい。すなわち、情報処理サーバは、7つの選択肢のうちの3つ目の選択肢として第2の選択肢O2を表示させてよい。この場合でも同様にユーザを第2の選択肢2に誘引する効果を期待することができる。
 <<1.2.システム構成例>>
 次に、本実施形態に係る情報処理システムの構成例について説明する。図2は、本実施形態に係る情報処理システムの構成例を示すブロック図である。図2を参照すると、本実施形態に係る情報処理システムは、情報処理端末10と情報処理サーバ20を備える。また、情報処理端末10と情報処理サーバ20とは、互いに通信が行えるようにネットワーク30を介して接続される。
 (情報処理端末10)
 本実施形態に係る情報処理端末10は、情報処理サーバ20による制御に基づいて、ユーザに対し複数の選択肢を提示する機能を有する情報処理装置である。上記の選択肢は、目標達成のためにユーザに推奨する物品やサービス、行動などを含む。また、本実施形態に係る情報処理端末10は、ユーザの行動に関する種々の情報を収集する機能を有してよい。
 本実施形態に係る情報処理端末10は、上記の機能を有する種々の装置として実現される。本実施形態に係る情報処理端末10は、例えば、携帯電話、スマートフォン、タブレット、ウェアラブル装置、コンピュータ、据え置き型または自律移動型の専用装置などであってもよい。
 (情報処理サーバ20)
 本実施形態に係る情報処理サーバ20は、情報処理端末10による選択肢を提示を制御する機能を有する情報処理装置である。上述したように、本実施形態に係る情報処理サーバ20は、ユーザが希望する第1の選択肢に基づいて、第2の選択肢のカテゴリ値が、第1の選択肢のカテゴリ値と第3の選択肢のカテゴリ値との間に位置するよう、第2の選択肢および第3の選択肢を取得することを、特徴の一つとする。
 (ネットワーク30)
 ネットワーク30は、情報処理端末10と情報処理サーバ20とを接続する機能を有する。ネットワーク30は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、ネットワーク30は、IP-VPN(Internet Protocol-Virtual Private Network)などの専用回線網を含んでもよい。また、ネットワーク30は、Wi-Fi(登録商標)、Bluetooth(登録商標)など無線通信網を含んでもよい。
 以上、本実施形態に係る情報処理システムのシステム構成例について説明した。なお、図2を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理システムの構成は係る例に限定されない。例えば、本実施形態に係る情報処理端末10および情報処理サーバ20が有する機能は、単一の装置により実現されてもよい。本実施形態に係る情報処理システムの構成は、仕様や運用に応じて柔軟に変形可能である。
 <<1.3.情報処理端末10の機能構成例>>
 次に、本実施形態に係る情報処理端末10の機能構成例について説明する。図3は、本実施形態に係る情報処理端末10の機能構成例を示すブロック図である。図3を参照すると、本実施形態に係る情報処理端末10は、表示部110、音声出力部120、音声入力部130、撮像部140、センサ部150、制御部160、およびサーバ通信部170を備える。
 (表示部110)
 本実施形態に係る表示部110は、画像やテキストなどの視覚情報を出力する機能を有する。本実施形態に係る表示部110は、例えば、情報処理サーバ20による制御に基づいて、第1~第3の選択肢に係る視覚情報を出力してよい。このために、本実施形態に係る表示部110は、視覚情報を提示する表示デバイスを備える。上記の表示デバイスには、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)装置、OLED(Organic Light Emitting Diode)装置、タッチパネルなどが挙げられる。
 (音声出力部120)
 本実施形態に係る音声出力部120は、音声発話などを含む聴覚情報を出力する機能を有する。特に、本実施形態に係る音声出力部120は、情報処理サーバ20による制御に基づいて、第1~第3の選択肢に係る聴覚情報を出力してよい。このために、本実施形態に係る音声出力部120は、スピーカやアンプなどの音声出力装置を備える。
 (音声入力部130)
 本実施形態に係る音声入力部130は、ユーザによる発話や背景音などの音情報を収集する機能を有する。音声入力部130が収集する音情報は、情報処理サーバ20による音声認識や行動認識に用いられる。実施形態に係る音声入力部130は、音情報を収集するためのマイクロフォンを備える。
 (撮像部140)
 本実施形態に係る撮像部140は、ユーザや周囲環境を含む画像を撮像する機能を有する。撮像部140が撮像した画像は、情報処理サーバ20によるユーザ認識や行動認識に用いられる。本実施形態に係る撮像部140は、画像を撮像することが可能な撮像装置を備える。なお、上記の画像には、静止画像のほか動画像が含まれる。
 (センサ部150)
 本実施形態に係るセンサ部150は、ユーザの行動に関する種々のセンサ情報を収集する機能を有する。センサ部150が収集したセンサ情報は、情報処理サーバ20による行動認識に用いられる。センサ部150は、例えば、加速度センサ、ジャイロセンサ、地磁気センサ、熱センサ、光センサ、振動センサ、GNSS(Global Navigation Satellite System)信号受信装置などを備える。
 (制御部160)
 本実施形態に係る制御部160は、情報処理端末10が備える各構成を制御する機能を有する。制御部160は、例えば、各構成の起動や停止を制御する。また、制御部160は、情報処理サーバ20により生成される制御信号を表示部110や音声出力部120に入力することができる。また、本実施形態に係る制御部160は、後述する情報処理サーバ20の出力制御部230と同等の機能を有してもよい。
 (サーバ通信部170)
 本実施形態に係るサーバ通信部170は、ネットワーク30を介して情報処理サーバ20との情報通信を行う機能を有する。具体的には、サーバ通信部170は、音声入力部130が収集した音情報、撮像部140が撮像した画像情報、センサ部150が収集したセンサ情報を情報処理サーバ20に送信する。また、サーバ通信部170は、情報処理サーバ20から第1~第3の選択肢の出力に係る制御信号や人工音声を受信する。
 以上、本実施形態に係る情報処理端末10の機能構成例について説明した。なお、図3を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理端末10の機能構成は係る例に限定されない。例えば、本実施形態に係る情報処理端末10は、図3に示す構成のすべてを必ずしも備えなくてもよい。情報処理端末10は、撮像部140やセンサ部150などを備えない構成をとることもできる。また、上述したように、本実施形態に係る制御部160は、情報処理サーバ20の出力制御部230と同等の機能を有してもよい。本実施形態に係る情報処理端末10の機能構成は、仕様や運用に応じて柔軟に変形可能である。
 <<1.4.情報処理サーバ20の機能構成例>>
 次に、本実施形態に係る情報処理サーバ20の機能構成例について説明する。図4は、本実施形態に係る情報処理サーバ20の機能構成例を示すブロック図である。図4を参照すると、本実施形態に係る情報処理サーバ20は、認識部210、判定部220、出力制御部230、音声合成部240、記憶部250、および端末通信部260を備える。また、記憶部250は、ユーザDB252、条件設定DB254、および選択肢DB256を備える。
 (認識部210)
 本実施形態に係る認識部210は、ユーザに係る認識を行う機能を有する。例えば、認識部210は、例えば、情報処理端末10が収集したユーザの発話や画像と、ユーザDB252に予め記憶されるユーザの音声特徴や画像とを比較することでユーザの認識を行うことができる。
 また、認識部210は、情報処理端末10が収集した音情報や画像、センサ情報に基づいて、ユーザの行動を認識することができる。例えば、認識部210は、情報処理端末10が収集したユーザの発話に基づいて音声認識を行い、ユーザが食事を取ろうとしていることを認識することができる。また、例えば、認識部210は、情報処理端末10が収集した画像やセンサ情報に基づいて、ユーザが運動を行っていることを認識することができる。また、例えば、認識部210は、ユーザの検索行動に基づいて、ユーザがレストランを探していることを認識することができる。このように、認識部210が認識するユーザの行動には、大きな体の動きを伴う行動のほか、発話行動や検索行動などが含まれる。
 (判定部220)
 本実施形態に係る判定部220は、認識部210が認識したユーザの行動が複数選択肢の提示条件を満たすか否かを判定する機能を有する。具体的には、判定部220は、認識部210が認識した行動が目標達成に影響する行動であるか否かを判定する。例えば、目標が体重の減量である場合、判定部220は、認識された行動が食事や運動に関する行動であるか否かを判定してよい。
 また、認識された行動が目標達成に影響する行動であると判定した場合、判定部220は、続いて当該行動のカテゴリ値が閾値を超えているか否かを判定する。上述したとおり、上記のカテゴリ値とは、目標のカテゴリごとに設定され、当該目標の達成に対し、重要な要因となる数値を指す。
 例えば、目標が体重の減量である場合、判定部220は、ユーザが取ろうとしている第1の選択肢である食事の摂取カロリーが閾値を超えるか否かを判定してもよい。この際、判定部220は、摂取カロリーが閾値を超えている場合、ユーザの行動が複数選択肢の提示条件を満たすと判定する。
 また、目標が体重の減量である場合、判定部220は、ユーザが行おうとしている運動の強度や消費カロリーが閾値を超えているか否かを判定してもよい。この際、判定部220は、運動強度や消費カロリーが閾値を下回る場合に、ユーザの行動が複数選択肢の提示条件を満たすと判定する。
 なお、判定部220は、設定条件DB254に記憶される目標に対応するカテゴリや、当該カテゴリに係るカテゴリ値の閾値に基づいて、上記の判定を行うことができる。
 (出力制御部230)
 本実施形態に係る出力制御部230は、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、第1~第3の選択肢の出力を制御する機能を有する。この際、本実施形態に係る出力制御部230は、第2の選択肢のカテゴリ値が、第1の選択肢のカテゴリ値と第3の選択肢のカテゴリ値との間に位置するよう、第2の選択肢および第3の選択肢を取得する、を特徴の一つとする。
 本実施形態に係る出力制御部230が有する上記の特徴によれば、真ん中の選択肢を選択しやすいユーザの傾向を利用して、ユーザが希望する第1の選択肢と比べ目標達成のためにより適切な第2の選択肢O2を選択するようユーザを誘導することが可能となる。
 また、この際、出力制御部230は、複数の選択肢を、第1の選択肢、第2の選択肢、および第3の選択肢の順に出力させてよい。さらには、複数の選択肢を視覚情報として表示部110に出力させる場合、出力制御部230は、第2の選択肢を表示領域の中央付近に表示させてもよい。より具体的には、出力制御部230は、第2の選択肢が、第1の選択肢および第3の選択肢よりも表示領域の中心に近い位置に配置されるように表示制御を行ってよい。例えば、出力制御部230は、第1の選択肢を表示領域の向かって左側に、第2の選択肢を表示領域の中央付近に、第3の選択肢を表示領域の向かって右側に表示させてもよい。また、例えば、出力制御部230は、第1の選択肢を表示領域の上段に、第2の選択肢を表示領域の中段に、第3の選択肢を表示領域の下段に表示させてもよい。
 なお、上述したように、本実施形態に係る第1~第3の選択肢は、複数であってもよい。この場合も同様に、出力制御部230は、複数の第2の選択肢を、第1の選択肢および第3の選択肢よりも表示領域の中心に近い位置に表示させる。例えば、1つの第1の選択肢、2つの第2の選択肢、1つの第3の選択肢が存在する場合、出力制御部230は、2つの第2の選択肢を表示領域の中心に近い位置に表示させ、第1の選択肢および第3の選択肢を当該2つの第2の選択肢の辺縁に表示させてもよい。
 本実施形態に係る出力制御部230による上記の制御によれば、カテゴリ値と共に第2の選択肢を物理的に真ん中に配置することができ、より高い誘導効果を期待することができる。
 なお、本実施形態に係る出力制御部230は、第1の選択肢のカテゴリ値が所定条件を満たすことに基づいて、上記のような制御を行う。具体的には、判定部220が第1の選択肢のカテゴリ値が複数選択肢の提示条件を満たすと判定した場合、出力制御部230は、第1の選択肢のカテゴリに基づいて、当該カテゴリと同一のカテゴリに属する第2の選択肢および第3の選択肢を選択肢DB256から取得する。
 また、本実施形態に係る出力制御部230は、ユーザに対する第2の選択肢の誘引効果が向上するよう、第1~第3の選択肢に係る出力態様を制御する機能を有する。本実施形態に係る出力制御部230が有する上記の機能については別途詳細に説明する。
 (音声合成部240)
 本実施形態に係る音声合成部240は、出力制御部230による制御に基づいて、情報処理端末10により出力される人工音声を合成する機能を有する。この際、音声合成部240は、出力制御部230が設定した出力対応に対応する人工音声を合成する。
 (記憶部250)
 本実施形態に係る記憶部250は、ユーザDB252、条件設定DB254、および選択肢DB256を備える。
 ((ユーザDB252))
 本実施形態に係るユーザDB252は、ユーザに関する種々の情報を記憶する。ユーザDB252は、例えば、ユーザの顔画像や音声特徴などを記憶する。また、ユーザDB252は、ユーザの性別、年齢、嗜好、傾向などの情報を記憶してもよい。
 ((設定条件DB254))
 本実施形態に係る設定条件DB254は、ユーザの達成すべき目標や当該目標のカテゴリに係るカテゴリ値の閾値などを記憶する。上記の目標や閾値は、ユーザにより設定されてもよいし、判定部220などにより動的に設定されてもよい。判定部220は、認識部210による運動の認識回数が少ないことに基づいて、体重の減量や筋肉量の増加などを目標として設定することも可能である。
 ((選択肢DB256))
 本実施形態に係る選択肢DB256は、目標のカテゴリごとに複数の選択肢と当該選択肢に係るカテゴリ値を対応付けて記憶する。選択肢DB256が記憶する選択肢およびカテゴリ値は、例えば、インターネット上に公開される情報に基づいて動的に蓄積されてもよい。なお、本実施形態に係る選択肢は、必ずしも選択肢DB256に記憶されなくてもよい。本実施形態に係る出力制御部230は、例えば、ネットワーク30を介して別の装置から第2の選択肢や第3の選択肢を取得してもよい。
 (端末通信部260)
 本実施形態に係る端末通信部260は、ネットワーク30を介して、情報処理端末10との情報通信を行う機能を有する。具体的には、端末通信部260は、情報処理端末10から音情報、画像情報、センサ情報を受信する。また、端末通信部260は、出力制御部230が生成した制御信号や、音声合成部240が合成した人工音声を情報処理端末10に送信する。
 以上、本実施形態に係る情報処理サーバ20の機能構成例について説明した。なお、図4を用いて説明した上記の機能構成はあくまで一例であり、本実施形態に係る情報処理サーバ20の機能構成は係る例に限定されない。例えば、情報処理サーバ20は、必ずしも図4に示す構成のすべてを備えなくてもよい。認識部210、判定部220、音声合成部240、および記憶部250は、情報処理サーバ20とは異なる別の装置に備えることも可能である。本実施形態に係る情報処理サーバ20の機能構成は、仕様や運用に応じて柔軟に変形可能である。
 <<1.5.出力制御の具体例>>
 次に、本実施形態に係る出力制御部230による複数の選択肢の出力制御について具体例を挙げて説明する。上述したように、本実施形態に係る出力制御部230は、提示する複数の選択肢のうち、ユーザに対する第2の選択肢の誘引効果が向上するよう、第1~第3の選択肢に係る出力態様を制御することができる。すなわち、出力制御部230は、他の選択肢に比べ第2の選択肢が、ユーザにとってより魅力的に映るように、第1~第3の選択肢の出力を制御することができる。
 (言語表現の制御)
 上記の出力態様には、例えば、言語表現が含まれる。本実施形態に係る出力制御部230は、第2の選択肢の誘引効果が向上するよう、第1~第3の選択肢に係る言語表現を制御することができる。より具体的には、出力制御部230は、第2の選択肢がユーザにとって魅力的に映るように第1~第3の選択肢に対する説明文を生成してよい。
 図5は、本実施形態に係る出力制御部230による言語表現の制御について説明するための図である。図5の上段には、ユーザU2が椅子の購入に際し、$500の椅子と$300の椅子とで選択を迷っている場面が示されている。
 この際、判定部220は、認識部210が認識したユーザU2の発話UO2に基づいて、ユーザU2の行動が複数選択肢の提示条件を満たすと判定する。より具体的には、判定部220は、ユーザU2の目標が貯蓄であり、ユーザU2が購入を検討している椅子のうち少なくとも一方の金額、すなわちカテゴリ値が閾値を超えていることに基づいて上記の判定を行ってよい。図5に示す一例の場合、カテゴリ値が例えば$400であることに基づいて、判定部220は、$500の椅子を第1の選択肢O1として判定する。
 次に、出力制御部230は、判定部220による上記の判定に基づき、第2の選択肢O2および第3の選択肢O3を取得する。この際、出力制御部230は、既にユーザU2が購入を検討している椅子のうちカテゴリ値が低い椅子のカテゴリ値が閾値を下回る場合には、当該椅子をそのまま第2の選択肢O2とすることができる。図5に示す一例の場合、出力制御部230は、$300の椅子を第2の選択肢O2として設定し、また第2の選択肢O2よりもカテゴリ値の低い$100の椅子を第3の選択肢O3として取得している。
 続いて、出力制御部230は、第1~第3の選択肢O1~O3を情報処理端末10の表示部110に出力させると共に、他の選択肢、すなわち第3の選択肢O3を見つけたことを示す音声発話SO3を音声出力部120に出力させる。
 また、出力制御部230は、音声発話SO3に続けて、第1~第3の選択肢に係る説明文に該当する音声発話SO4を音声出力部120に出力させる。この際、出力制御部230は、第2の選択肢O2がユーザU2にとって魅力的に映るように第1~第3の選択肢O1~O3に対する説明文を生成し、音声出力部120に出力させてよい。図5に示す一例の場合、出力制御部230は、「スマートなUさんには」という推薦を行う対象者や、「シンプルなデザインの」という第2および第3の選択肢O2およびO3に係る修飾語、「お似合いですね」という推薦理由などの言語表現を制御してよい。
 出力制御部230は、ユーザDB252に記憶されるユーザU2の年齢や性別、嗜好などに関する情報を取得することで、上記のような言語表現を制御することが可能である。本実施形態に係る出力制御部230によれば、第2の選択肢に係る説明文がユーザにとってより魅力的に映るように第1~第3の選択肢に係る言語表現を制御することができ、ユーザに対する第2の選択肢の誘引効果を一層に高めることが可能である。なお、図5では、出力制御部230が、第1~第3の選択肢に対する説明文を音声出力させる場合を例に述べたが、出力制御部230は、当該説明文を視覚情報として表示部110に表示させてもよい。
 (視覚表現の制御)
 また、出力制御部230が制御する出力態様には、視覚表現も含まれる。本実施形態に係る出力制御部230は、第2の選択肢の誘引効果が向上するよう、第1~第3の選択肢に係る視覚表現を制御することができる。より具体的には、出力制御部230は、第2の選択肢がユーザにとって魅力的に映るように、第1~第3の選択肢に対応する画像やテキストの表示を制御してよい。
 図6は、本実施形態に係る出力制御部230による視覚表現の制御について説明するための図である。図6には、出力制御部230による制御により表示部110に表示された第1~第3の選択肢O1~O3が示されている。
 出力制御部230は、図示するように、第1~第3の選択肢を表す画像I1~I3取得し、画像I1~I3を表示部110に表示させてよい。この際、本実施形態に係る出力制御部230は、例えば、第2の選択肢O2を表す画像I2がユーザにとってより魅力的に映るように、画像I1~I3を取得し表示部110に表示させることができる。
 具体的には、図6に示すように、選択肢O1~O3が食事に関するものである場合、出力制御部230は、第2の選択肢O2や第3の選択肢O3については、よりおいしそうに見える画像I2およびI3を取得して表示させ、第1の選択肢O1については、見た目が劣る画像I1を取得して表示させてもよい。図6においては、画像I1に引かれる横線が見た目の乏しさを表している。出力制御部230は、例えば、料理の形状、大きさ、画像の明度、解像度、色彩などに基づいて画像I1を取得することができる。
 また、出力制御部230は、取得した画像I1~I3の表示効果を制御することで、第2の選択肢O2の誘引効果を向上させてもよい。具体的には、出力制御部230は、取得した画像I1~I3に対し画像処理を施すことで、第2の選択肢O2を表す画像I2がユーザにとってより魅力的に映るように表示効果を制御することができる。
 上記の表示効果には、例えば、画像の明度、コントラスト、彩度、解像度、ノイズなどが含まれる。出力制御部230は、第2の選択肢O2を表す画像I2の見栄えが改善されるように、上記のようなパラメータに関する補正を行ってもよい。また、出力制御部230は、第1の選択肢O1を表す画像I1の見栄えが劣化するように、パラメータを制御したり、ノイズを付加することもできる。
 また、本実施形態に係る視覚表現には、色彩表現が含まれる。出力制御部230は、第2の選択肢の誘引効果が向上するよう、第1~第3の選択肢O1~O3に係る色彩表現を制御してもよい。 
 色彩は、人の感情や行動に強く影響することが広く知られている。図6に示すように、選択肢O1~O3が食事に関するものである場合、出力制御部230は、例えば、食欲に影響する色彩を利用することで、第2の選択肢O2の誘引効果を高めることができる。
 一例としては、出力制御部230は、画像I1~I3に係る背景色BC1~BC3を制御してもよい。例えば、出力制御部230は、第2の選択肢O2に係る背景色BC2に食欲をそそる暖色を用いることで画像I2の魅力度を向上させてもよい。また、出力制御部230は、第1の選択肢O1に係る背景色BC1に食欲を減退させる寒色を用いることで画像I1の魅力度を低下させてもよい。また、出力制御部230は、背景色BC~BC3のほか、第1~第3の選択肢O1~O3に係るテキストの色彩を制御してもよい。
 なお、上記の色彩の割り当てはあくまで一例であり、出力制御部230による色彩表現の制御は係る例に限定されない。出力制御部230は、例えば、季節や気温、ユーザの嗜好などに基づいて、ユーザがより魅力的に感じる色彩を適宜選択することが可能である。
 以上、本実施形態に係る出力制御部230による視覚表現の制御について説明した。本実施形態に係る出力制御部230による上記の制御によれば、第2の選択肢の誘引効果を一層に向上させ、ユーザをより効果的に誘導することが可能となる。
 (聴覚表現の制御)
 また、出力制御部230が制御する出力態様には、聴覚表現も含まれる。本実施形態に係る出力制御部230は、第2の選択肢の誘引効果が向上するよう、第1~第3の選択肢に係る聴覚表現を制御することができる。より具体的には、出力制御部230は、第2の選択肢がユーザにとって魅力的に映るように、音声発話や背景音を制御してよい。
 図7は、本実施形態に係る出力制御部230による聴覚表現の制御について説明するための図である。図7には、近隣の図書館を訪問しようとしているユーザU3に対し提示される第1~第3の選択肢O1~O3が地図情報と共に示されている。
 この際、判定部220は、認識部210が認識したユーザのユーザU3の発話UO3に基づいて、ユーザU3の行動が複数選択肢の提示条件を満たすと判定する。より具体的には、判定部220は、ユーザU3の目標が運動不足の解消であり、近隣の図書館までの徒歩移動、すなわち第1の選択肢O1に係る運動強度や消費カロリーが閾値を下回ることに基づいて、ユーザU3の行動が複数選択肢の提示条件を満たすと判定する。
 次に、出力制御部230は、判定部220による上記の判定に基づき、第2の選択肢O2および第3の選択肢O3を取得する。この際、出力制御部230は、ユーザU3の運動不足が解消されるように、第1の選択肢O1よりも運動強度の高い第2の選択肢O2と第2の選択肢O2よりもさらに運動強度が高い第3の選択肢O3を取得してよい。
 続いて、出力制御部230は、第1~第3の選択肢O1~O3を地図情報と共に表示部110に表示させると共に、他の選択肢、すなわち第2の選択肢O2および第3の選択肢O3が見つかった旨を知らせる音声発話SO5を音声出力部120に出力させる。この際、出力制御部230は、図示するように、第2の選択肢O2が表示領域の中央付近に配置されるように地図情報の表示を制御してもよい。上記の制御によれば、第2の選択肢O2をユーザU3の目を引きやすい位置に表示させることができ、第2の選択肢O2の誘引効果を高めることが可能となる。
 また、出力制御部230は、上記の制御と共に、背景音BSを音声出力部120に出力させることができる。この際、本実施形態に係る出力制御部230は、第2の選択肢O2の誘引効果が高まる背景音BSを選択して音声出力部120に出力させる。出力制御部230は、例えば、アップテンポな楽曲を出力させることで、運動に対するユーザU3のモチベーションを高めることが可能である。また、出力制御部230は、普段、ユーザU3がジョギングを行う際に聞く頻度の高い楽曲を背景音BSとして選択してもよい。
 本実施形態に係る出力制御部230による上記の制御によれば、ユーザU3が無意識のうちに第2の選択肢O2を選択する可能性を高める効果が期待され、ユーザU3の目標達成に大きく貢献することができる。
 なお、上記では、運動に対するモチベーションを向上させる聴覚表現の制御を例に説明したが、本実施形態に係る聴覚表現の制御は係る例に限定されない。本実施形態に係る出力制御部230は、例えば、複数選択肢のカテゴリが食事である場合であっても、聴覚表現の制御により第2の選択肢の誘引効果を高めることが可能である。
 例えば、夕食時における飲み物に係る複数選択肢の提示において、ユーザに第2の選択肢であるワインを選択させたい場合、出力制御部230は、シャンソンなどを背景音として用いることで、ワインの名産地であるフランスをユーザに喚起させてもよい。
 また、上記では、聴覚表現の一例として背景音を挙げて説明したが、出力制御部230は、第1~第3の選択肢の説明文を音声発話させる場合には、当該音声発話の速度、強弱、高低、長短などを制御することで、第2の選択肢の誘引効果を高めることもできる。
 <<1.6.出力制御の流れ>>
 次に、本実施形態に係る情報処理サーバ20による出力制御の流れについて詳細に説明する。図8は、本実施形態に係る情報処理サーバ20による出力制御の流れを示すフローチャートである。
 図8を参照すると、まず、情報処理サーバ20の認識部210は、情報処理端末10により収集された音情報、画像情報、センサ情報に基づいて、ユーザおよび当該ユーザの行動を認識する(S1101)。
 次に、判定部220は、ステップS1101において認識されたユーザの行動が複数選択肢の提示条件を満たすか否かを判定する(S1102)。この際、判定部220は、認識された行動が目標達成に影響する行動であるか否か、また、当該行動のカテゴリ値が閾値を超えているか否かを判定する。
 ここで、ユーザの行動が複数選択肢の提示条件を満たさない場合(S1102:No)、情報処理サーバ20は、複数選択肢の出力制御に係る処理を終了する。なお、ステップS1101において認識されたユーザの行動が、問い合わせなどに係る音声入力行動である場合には、情報処理サーバ20は、当該音声発話に対応する処理を行ってよい。
 一方、ユーザの行動が複数選択肢の提示条件を満たす場合(S1102:Yes)、出力制御部230は、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得する(S1103)。この際、出力制御部230は、第2の選択肢のカテゴリ値が、第1の選択肢のカテゴリ値と第3の選択肢のカテゴリ値との間に位置するよう、第2の選択肢および第3の選択肢を取得する。
 続いて、出力制御部230は、ユーザに対する第2の選択肢の誘引効果が向上するように第1~第3の選択肢に係る出力態様を設定する(S1104)。具体的には、出力制御部230は、第1~第3の選択肢に係る言語表現、視覚表現、聴覚表現を制御することで、第2の選択肢の誘引効果を高めることができる。
 続いて、出力制御部230は、第1~第3の選択肢に係る音声発話に用いられる人工音声を音声合成部240に合成させる(S1105)。なお、第1~第3の選択肢を視覚情報のみを用いてユーザに提示する場合においては、ステップS1105における処理は実行されなくてよい。
 次に、端末通信部260は、ステップS1105において合成された人工音声や、ステップS1104において設定された出力態様に係る制御信号を情報処理端末10に送信し、第1~第3の選択肢に係る出力制御が実行される(S1106)。
 <2.ハードウェア構成例>
 次に、本開示の一実施形態に係る情報処理端末10および情報処理サーバ20に共通するハードウェア構成例について説明する。図9は、本開示の一実施形態に係る情報処理端末10および情報処理サーバ20のハードウェア構成例を示すブロック図である。図9を参照すると、情報処理端末10および情報処理サーバ20は、例えば、CPU871と、ROM872と、RAM873と、ホストバス874と、ブリッジ875と、外部バス876と、インターフェース877と、入力装置878と、出力装置879と、ストレージ880と、ドライブ881と、接続ポート882と、通信装置883と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
 (CPU871)
 CPU871は、例えば、演算処理装置又は制御装置として機能し、ROM872、RAM873、ストレージ880、又はリムーバブル記録媒体901に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。
 (ROM872、RAM873)
 ROM872は、CPU871に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。RAM873には、例えば、CPU871に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。
 (ホストバス874、ブリッジ875、外部バス876、インターフェース877)
 CPU871、ROM872、RAM873は、例えば、高速なデータ伝送が可能なホストバス874を介して相互に接続される。一方、ホストバス874は、例えば、ブリッジ875を介して比較的データ伝送速度が低速な外部バス876に接続される。また、外部バス876は、インターフェース877を介して種々の構成要素と接続される。
 (入力装置878)
 入力装置878には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置878としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ(以下、リモコン)が用いられることもある。また、入力装置878には、マイクロフォンなどの音声入力装置が含まれる。
 (出力装置879)
 出力装置879は、例えば、CRT(Cathode Ray Tube)、LCD、又は有機EL等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置879は、触覚刺激を出力することが可能な種々の振動デバイスを含む。
 (ストレージ880)
 ストレージ880は、各種のデータを格納するための装置である。ストレージ880としては、例えば、ハードディスクドライブ(HDD)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。
 (ドライブ881)
 ドライブ881は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体901に記録された情報を読み出し、又はリムーバブル記録媒体901に情報を書き込む装置である。
 (リムーバブル記録媒体901)
リムーバブル記録媒体901は、例えば、DVDメディア、Blu-ray(登録商標)メディア、HD DVDメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体901は、例えば、非接触型ICチップを搭載したICカード、又は電子機器等であってもよい。
 (接続ポート882)
 接続ポート882は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS-232Cポート、又は光オーディオ端子等のような外部接続機器902を接続するためのポートである。
 (外部接続機器902)
 外部接続機器902は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はICレコーダ等である。
 (通信装置883)
 通信装置883は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線LAN、Bluetooth(登録商標)、又はWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は各種通信用のモデム等である。
 <3.まとめ>
 以上説明したように、本実施形態に係る情報処理サーバ20は、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、上記第1~第3の選択肢の出力を制御する。この際、本実施形態に係る情報処理サーバ20は、第2の選択肢のカテゴリ値が、第1の選択肢のカテゴリ値と第3の選択肢のカテゴリ値との間に位置するよう、第2の選択肢および第3の選択肢を取得すること、を特徴の一つとする。係る構成によれば、ユーザによる適切な選択をより自然に誘導することが可能となる。
 以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
 例えば、上記実施形態では、情報処理サーバ20が第1~第3の選択肢を主に視覚情報として表示部110に出力させる場合を例に説明したが、本技術は係る例に限定されない。情報処理サーバ20は、第1~第3の選択肢を音声発話のみを用いてユーザに提示することも可能である。
 また、上記実施形態では、情報処理サーバ20が第2の選択肢と第3の選択肢をそれぞれ1つずつ出力させる場合を例に述べたが、情報処理サーバ20は、複数の第2の選択肢および複数の第3の選択肢を取得し出力制御を行うこともできる。
 また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
 また、本明細書の情報処理サーバ20の処理に係る各ステップは、必ずしもフローチャートに記載された順序に沿って時系列に処理される必要はない。例えば、情報処理サーバ20の処理に係る各ステップは、フローチャートに記載された順序と異なる順序で処理されても、並列的に処理されてもよい。
 また、本明細書では、コンピュータを本開示の一実施形態に係る情報処理サーバとして機能させるためのプログラムが提供されることを示したが、上記プログラムを記憶させた記録媒体も併せて提供すること可能である。
 なお、以下のような構成も本開示の技術的範囲に属する。
(1)
 ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御する出力制御部、
 を備え、
 前記出力制御部は、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得する、
情報処理装置。
(2)
 前記出力制御部は、複数の選択肢を、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の順に出力させる、
前記(1)に記載の情報処理装置。
(3)
 前記出力制御部は、前記第2の選択肢を表示領域の中央付近に表示させる、
前記(1)または(2)に記載の情報処理装置。
(4)
 前記出力制御部は、前記第1の選択肢のカテゴリに基づいて、当該カテゴリと同一のカテゴリに属する前記第2の選択肢および前記第3の選択肢を取得する、
前記(1)~(3)のいずれかに記載の情報処理装置。
(5)
 前記出力制御部は、前記第1の選択肢の前記カテゴリ値が所定条件を満たすことに基づいて、前記第2の選択肢および前記第3の選択肢を取得する、
前記(1)~(4)のいずれかに記載の情報処理装置。
(6)
 前記出力制御部は、前記ユーザに対する前記第2の選択肢の誘引効果が向上するよう前記第1の選択肢、前記第2の選択肢、および第3の選択肢に係る出力態様を制御する、
前記(1)~(5)のいずれかに記載の情報処理装置。
(7)
 前記出力態様は、視覚表現を含み、
 前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る前記視覚表現を制御する、
前記(6)に記載の情報処理装置。
(8)
 前記視覚表現は、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢を表す画像の表示効果を含み、
 前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、前記第3の選択肢を表す前記画像の表示効果を制御する、
前記(7)に記載の情報処理装置。
(9)
 前記画像の表示効果は、明度、コントラスト、彩度、解像度、ノイズのうち少なくともいずれかを含む、
前記(8)に記載の情報処理装置。
(10)
 前記視覚表現は、色彩表現を含み、
 前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る色彩表現を制御する、
前記(7)~(9)のいずれかに記載の情報処理装置。
(11)
 前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢を表す画像を取得し、当該画像の出力を制御する、
前記(6)~(10)のいずれかに記載の情報処理装置。
(12)
 前記出力態様は、聴覚表現を含み、
 前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る前記聴覚表現を制御する、
前記(6)~(11)のいずれかに記載の情報処理装置。
(13)
 前記聴覚表現は、背景音を含み、
 前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記背景音の出力を制御する、
前記(12)に記載の情報処理装置。
(14)
 前記出力態様は、言語表現を含み、
 前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る前記言語表現を制御する、
前記(6)~(13)のいずれかに記載の情報処理装置。
(15)
 前記言語表現は、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る修飾語を含み、
 前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る前記修飾語を制御する、
前記(14)に記載の情報処理装置。
(16)
 前記ユーザの行動を認識する認識部、
 をさらに備える、
前記(1)~(15)のいずれかに記載の情報処理装置。
(17)
 前記出力制御部による制御に基づいて前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢を表示する表示部、
 をさらに備える、
前記(1)~(16)のいずれかに記載の情報処理装置。
(18)
 前記出力制御部による制御に基づいて前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢を音声出力する音声出力部、
 をさらに備える、
前記(1)~(17)のいずれかに記載の情報処理装置。
(19)
 プロセッサが、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御すること、
 を含み、
 前記制御することは、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得すること、
 をさらに含む、
情報処理方法。
(20)
 コンピュータを、
 ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御する出力制御部、
 を備え、
 前記出力制御部は、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得する、
 情報処理装置、
として機能させるためのプログラム。
 10   情報処理端末
 110  表示部
 120  音声出力部
 130  音声入力部
 140  撮像部
 150  センサ部
 160  制御部
 170  サーバ通信部
 20   情報処理サーバ
 210  認識部
 220  判定部
 230  出力制御部
 240  音声合成部
 250  記憶部
 252  ユーザDB
 254  設定条件DB
 256  選択肢DB
 260  端末通信部

Claims (20)

  1.  ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御する出力制御部、
     を備え、
     前記出力制御部は、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得する、
    情報処理装置。
  2.  前記出力制御部は、複数の選択肢を、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の順に出力させる、
    請求項1に記載の情報処理装置。
  3.  前記出力制御部は、前記第2の選択肢を表示領域の中央付近に表示させる、
    請求項1に記載の情報処理装置。
  4.  前記出力制御部は、前記第1の選択肢のカテゴリに基づいて、当該カテゴリと同一のカテゴリに属する前記第2の選択肢および前記第3の選択肢を取得する、
    請求項1に記載の情報処理装置。
  5.  前記出力制御部は、前記第1の選択肢の前記カテゴリ値が所定条件を満たすことに基づいて、前記第2の選択肢および前記第3の選択肢を取得する、
    請求項1に記載の情報処理装置。
  6.  前記出力制御部は、前記ユーザに対する前記第2の選択肢の誘引効果が向上するよう前記第1の選択肢、前記第2の選択肢、および第3の選択肢に係る出力態様を制御する、
    請求項1に記載の情報処理装置。
  7.  前記出力態様は、視覚表現を含み、
     前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る前記視覚表現を制御する、
    請求項6に記載の情報処理装置。
  8.  前記視覚表現は、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢を表す画像の表示効果を含み、
     前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、前記第3の選択肢を表す前記画像の表示効果を制御する、
    請求項7に記載の情報処理装置。
  9.  前記画像の表示効果は、明度、コントラスト、彩度、解像度、ノイズのうち少なくともいずれかを含む、
    請求項8に記載の情報処理装置。
  10.  前記視覚表現は、色彩表現を含み、
     前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る色彩表現を制御する、
    請求項7に記載の情報処理装置。
  11.  前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢を表す画像を取得し、当該画像の出力を制御する、
    請求項6に記載の情報処理装置。
  12.  前記出力態様は、聴覚表現を含み、
     前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る前記聴覚表現を制御する、
    請求項6に記載の情報処理装置。
  13.  前記聴覚表現は、背景音を含み、
     前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記背景音の出力を制御する、
    請求項12に記載の情報処理装置。
  14.  前記出力態様は、言語表現を含み、
     前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る前記言語表現を制御する、
    請求項6に記載の情報処理装置。
  15.  前記言語表現は、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る修飾語を含み、
     前記出力制御部は、前記第2の選択肢の前記誘引効果が向上するよう、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢に係る前記修飾語を制御する、
    請求項14に記載の情報処理装置。
  16.  前記ユーザの行動を認識する認識部、
     をさらに備える、
    請求項1に記載の情報処理装置。
  17.  前記出力制御部による制御に基づいて前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢を表示する表示部、
     をさらに備える、
    請求項1に記載の情報処理装置。
  18.  前記出力制御部による制御に基づいて前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢を音声出力する音声出力部、
     をさらに備える、
    請求項1に記載の情報処理装置。
  19.  プロセッサが、ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御すること、
     を含み、
     前記制御することは、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得すること、
     をさらに含む、
    情報処理方法。
  20.  コンピュータを、
     ユーザの行動から推定される第1の選択肢のカテゴリ値に基づいて、第2の選択肢および第3の選択肢を取得し、前記第1の選択肢、前記第2の選択肢、および前記第3の選択肢の出力を制御する出力制御部、
     を備え、
     前記出力制御部は、前記第2の選択肢の前記カテゴリ値が、前記第1の選択肢の前記カテゴリ値と前記第3の選択肢の前記カテゴリ値との間に位置するよう、前記第2の選択肢および前記第3の選択肢を取得する、
     情報処理装置、
    として機能させるためのプログラム。
PCT/JP2018/019663 2017-08-01 2018-05-22 情報処理装置、情報処理方法、およびプログラム Ceased WO2019026396A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-148814 2017-08-01
JP2017148814 2017-08-01

Publications (1)

Publication Number Publication Date
WO2019026396A1 true WO2019026396A1 (ja) 2019-02-07

Family

ID=65233710

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/019663 Ceased WO2019026396A1 (ja) 2017-08-01 2018-05-22 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
WO (1) WO2019026396A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020140670A (ja) * 2019-03-01 2020-09-03 株式会社トゥエンティーフォーセブン 食事のリコメンド方法、リコメンドシステムおよびリコメンドプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015045629A1 (ja) * 2013-09-25 2015-04-02 日産自動車株式会社 車両用情報表示装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015045629A1 (ja) * 2013-09-25 2015-04-02 日産自動車株式会社 車両用情報表示装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
3 March 2014 (2014-03-03), pages 1 - 8 *
JANNACH, DIETMAR: "Recommender systems : an introduction, first edition", KYORITSU SHUPPAN CO., LTD, 10 December 2012 (2012-12-10), pages 243 - 262 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020140670A (ja) * 2019-03-01 2020-09-03 株式会社トゥエンティーフォーセブン 食事のリコメンド方法、リコメンドシステムおよびリコメンドプログラム

Similar Documents

Publication Publication Date Title
US20210034141A1 (en) Information processing system, client terminal, information processing method, and recording medium
CN106562792B (zh) 信息提示装置的控制方法和信息提示装置
JP2019000937A (ja) コミュニケーション装置、コミュニケーションロボットおよびコミュニケーション制御プログラム
JPWO2017130486A1 (ja) 情報処理装置、情報処理方法およびプログラム
JPWO2015178078A1 (ja) 情報処理装置、情報処理方法及びプログラム
CN110996796A (zh) 信息处理设备、方法和程序
WO2020158171A1 (ja) 応答エージェントを選択する情報処理装置
WO2016181670A1 (ja) 情報処理装置、情報処理方法及びプログラム
CN109982737A (zh) 输出控制装置、输出控制方法以及程序
JP2024088283A (ja) プログラム、方法、情報処理装置
WO2016157678A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP2014030657A (ja) 刺激誘発装置、刺激誘発方法及びプログラム
US20240144562A1 (en) Selective amplification of voice and interactive language simulator
WO2019073668A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6992800B2 (ja) 情報処理装置および情報処理方法
WO2019026396A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JPWO2018198447A1 (ja) 情報処理装置および情報処理方法
JPWO2016052501A1 (ja) ユーザインタフェース装置、プログラム及びコンテンツの通知方法
EP3340240B1 (en) Information processing device, information processing method, and program
JP2021114004A (ja) 情報処理装置及び情報処理方法
CN120937014A (zh) 行动控制系统
WO2018168247A1 (ja) 情報処理装置、情報処理方法およびプログラム
US11270682B2 (en) Information processing device and information processing method for presentation of word-of-mouth information
WO2018061346A1 (ja) 情報処理装置
KR20170093631A (ko) 적응적 컨텐츠 출력 방법

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18842011

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 18842011

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP