CN116610825A - 信息提供系统、方法、以及存储介质 - Google Patents
信息提供系统、方法、以及存储介质 Download PDFInfo
- Publication number
- CN116610825A CN116610825A CN202310117200.4A CN202310117200A CN116610825A CN 116610825 A CN116610825 A CN 116610825A CN 202310117200 A CN202310117200 A CN 202310117200A CN 116610825 A CN116610825 A CN 116610825A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- explanatory
- provision
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
- G06F16/4387—Presentation of query results by the use of playlists
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/012—Head tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/13—Hearing devices using bone conduction transducers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明考虑用户地提供基于语音的信息。信息提供系统具备:位置方向获取部,获取表示用户所处的位置的位置信息、和表示视线方向的视线方向信息,该视线方向是用户的面部所朝向的方向;对象推测部,根据位置信息、视线方向信息、以及对象位置信息,推测用户正在视觉确认的对象;信息输出部,根据与信息提供相关的设定,通过语音输出关于推测出的对象的说明信息;头部动作检测部,检测用户的头部的动作;以及意愿推测部,根据输出说明信息的期间的用户的头部的动作推测用户的意愿,根据用户的意愿选择与信息提供相关的设定。在变更了与信息提供相关的设定的情况下,信息输出部根据变更后的与信息提供相关的设定来输出说明信息。
Description
技术领域
本公开涉及信息提供系统、方法、以及存储介质。
背景技术
在专利文献1中,记载了一种具备CD播放器和扬声器,向顾客提供对商品进行说明的信息的商品陈列架。在该商品陈列架中,通过CD播放器对录音了陈列的多个商品各自的说明的CD进行再现,从扬声器输出再现的语音。
专利文献1:日本特开平8-160897号公报
在专利文献1所记载的陈列架中,以预先规定的顺序再现多个商品的说明。在顾客移动至陈列架的附近时,在进行对顾客不感兴趣的商品的说明的情况下,提供顾客不想要的信息。另外,在顾客想要听取感兴趣的商品的说明的情况下,需要在陈列架的附近等待一段时间。另外,由于仅以预先规定的顺序再现商品的说明,因此在顾客漏听说明的一部分的情况下,也不能立即重新听取该部分。
这样,在专利文献1所涉及的结构中,存在不能考虑到顾客的意愿地提供基于语音的信息这一问题。
发明内容
本公开能够作为以下的方式实现。
(1)根据本公开的方式,提供信息提供系统。该信息提供系统通过声音提供信息。该信息提供系统具备:位置方向获取部,获取表示用户所处的位置的位置信息和表示视线方向的视线方向信息,该视线方向是用户的面部所朝向的方向;存储部,存储表示能成为用户的视觉确认对象的多个对象各自的位置的对象位置信息、对各个对象进行说明的说明信息、以及表示与信息提供相关的设定的信息;对象推测部,根据位置信息、视线方向信息、以及对象位置信息,推测用户正在视觉确认的对象;信息输出部,根据与信息提供相关的设定,通过语音输出关于推测出的对象的说明信息;头部动作检测部,检测用户的头部的动作;以及意愿推测部,根据输出说明信息的期间的用户的头部的动作推测用户的意愿,根据用户的意愿选择与信息提供相关的设定。在变更了与信息提供相关的设定的情况下,信息输出部根据变更后的与信息提供相关的设定来输出说明信息。
根据这样的方式,根据在输出说明信息的期间推测出的用户的意愿,选择与信息提供相关的设定。根据与信息提供相关的设定向用户提供说明信息。由此,能够根据用户的意愿,动态地变更与信息提供相关的设定。由此,能够考虑用户的意愿地提供基于语音的信息。
(2)在上述方式的信息提供系统中,存储部也可以存储第一说明信息和第二说明信息作为对对象进行说明的说明信息,上述第一说明信息是关于对象的说明,上述第二说明信息是关于对象的与第一说明信息不同的说明。与信息提供相关的设定也可以包含表示选择第一说明信息和第二说明信息中的哪一个作为说明信息的信息。
根据这样的方式,根据在输出说明信息的期间推测出的用户的意愿,选择第一说明信息和与第一说明信息不同的第二说明信息的任一个。由此,能够考虑用户的意愿地提供基于语音的信息。
(3)在上述方式的信息提供系统中,也可以存储部还存储第三说明信息作为对对象进行说明的说明信息,上述第三说明信息是关于对象的与第一说明信息以及第二说明信息不同的说明,第一说明信息是关于对象的通常的说明,第二说明信息是比第一说明信息详细的说明,第三说明信息是比第一说明信息简略的说明,与信息提供相关的设定包含表示选择第一说明信息、第二说明信息以及第三说明信息中的哪一个作为说明信息的信息。
根据这样的方式,根据在输出说明信息的期间推测出的用户的意愿,选择通常的说明、详细的说明以及简略的说明的任一个。由此,例如,当在语音输出通常的说明的期间推断为用户希望简略的说明时,切换为语音输出简略的说明。这样,能够考虑用户的意愿地提供基于语音的信息。
(4)在上述方式的信息提供系统中,也可以与信息提供相关的设定包含与语音的输出相关的设定信息。
根据这样的方式,根据在输出说明信息的期间推测出的用户的意愿,选择与语音的输出相关的设定。例如,当推测为用户感到难以听取时,变更设定以便增大音量。由此,由于在输出说明信息的期间音量增大,因此用户能够以容易听取说明信息的音量听取。这样,能够考虑用户的意愿地提供基于语音的信息。
(5)在上述方式的信息提供系统中,也可以与信息提供相关的设定包含表示是否继续说明信息的输出的信息。
根据这样的方式,根据在输出说明信息的期间推测出的用户的意愿,选择可否继续说明信息的输出。例如,当推测为用户感到不需要说明信息的输出时,将设定变更为不继续说明信息的输出。由此,不向用户进行用户不想要的说明信息的提供。
(6)在上述方式的信息提供系统中,也可以信息输出部通过语音输出对用户的提问。意愿推测部也可以根据用户的头部的动作,推测用户对提问的回答。
根据这样的方式,能够提供不是用户仅被动地接受信息的提供,而是用户能够一边参与一边接受信息提供的参与型的信息提供系统。
(7)在上述方式的信息提供系统中,对象包含移动物体。也可以在移动物体进入用户的眼睛能够观察的范围的状态持续预先设定的期间的情况下,对象推测部将移动物体推测为是用户正在视觉确认的对象。
根据这样的方式,不仅是静止物体,还能够向用户提供关于移动物体的说明信息。
(8)在上述方式的信息提供系统中,也可以还具备声源位置获取部,该声源位置获取部获取与对象分别对应的声源的虚拟位置。信息输出部也可以根据从用户的当前位置观察到的声源的虚拟位置,使佩戴于用户的头部的便携式的语音输出装置输出对表示说明信息的语音实施了立体声处理的语音。
根据这样的方式,能够在使用户感到身临其境的同时向用户提供关于视觉确认的对象的信息。
(9)在上述方式的信息提供系统中,也可以存储部存储意愿定义数据,该意愿定义数据定义了基于用户的使用语言所属的文化的非语言的动作。意愿推测部也可以根据意愿定义数据和用户的头部的动作,推测用户的意愿。
根据这样的方式,即使是使用语言不同的用户,也能够根据头部的动作推测用户的意愿。
(10)在上述方式的信息提供系统中,也可以意愿推测部通过将表示用户的头部的动作的参数、用户的移动速度、用户与对象的距离、用户相对于对象的相对角度输入至学习完毕的机器学习模型,来推测用户的意愿。
根据这样的方式,能够以较高的精度推测用户的意愿。
本公开的方式也能够以信息提供系统以外的各种方式实现。例如,能够以由用户携带的计算机通过语音提供信息的方法、存储了实现该方法的计算机程序的存储介质来实现。
附图说明
图1是表示实施方式所涉及的信息提供系统的概略结构的图。
图2是用于对以旋转角表示用户的头部的动作的方法进行说明的图。
图3是表示用户与虚拟地配置的声源的位置关系的图。
图4是信息提供处理的流程图。
图5是说明信息输出处理的流程图。
图6是动作检测处理的流程图。
图7是意愿推测处理的流程图。
附图标记的说明
100...移动终端,101...CPU,102...存储器,103...通信部,109...内部总线,110...存储部,120...位置方向获取部,130...对象推测部,140...头部动作检测部,150...意愿推测部,160...信息输出部,200...耳机,201...DSP,202...通信部,203...传感器,204...驱动器单元,209...内部总线,1000...信息提供系统,Cr...计数器,Cy...计数器,D...视线方向,N...基准方位,P...用户,SS...声源,T1...对象,r1...角度,r2...角度,r3...角度
具体实施方式
A.实施方式
图1是表示实施方式所涉及的信息提供系统1000的结构的图。信息提供系统1000针对用户正在视觉确认的对象,通过语音向用户提供对对象进行说明的说明信息。另外,信息提供系统1000进行与推测出的用户的意愿对应的信息提供。在本实施方式中,对信息提供系统1000向游览观光地的用户提供与观光景点相关的信息的例子进行说明。信息提供系统1000包含移动终端100和耳机200。
移动终端100是用户所携带的通信终端。在本实施方式中,移动终端100是用户所拥有的智能手机。假设在移动终端100中安装有用于向用户提供与观光地相关的信息的应用程序软件。以下,将该应用程序软件称为引导应用程序。用户能够通过执行引导应用程序,来从信息提供系统1000接受与观光地相关的信息的提供。假设用户随身带着移动终端100移动,游览观光地。引导应用程序具备推测用户的当前位置以及用户正在视觉确认的对象,向用户提供与观光景点相关的信息的功能。移动终端100也称为由用户携带的计算机。
耳机200是用户佩戴于头部的便携式的语音输出装置。耳机200是输出表示从移动终端100接收的信号的语音的便携式的语音输出装置。在本实施方式中,耳机200是用户自身所拥有的无线耳机。用户将耳机200佩戴于耳部,游览观光地。
移动终端100具备CPU(Central Processing Unit:中央处理器)101、存储器102、以及通信部103作为硬件结构。存储器102和通信部103经由内部总线109连接于CPU101。
通过CPU101执行储存于存储器102的各种程序,来实现移动终端100的各功能。存储器102存储CPU101所执行的程序、用于程序的执行的各种数据。另外,存储器102被用作CPU101的工作存储器。
通信部103包含网络接口电路,根据CPU101的控制与外部的装置通信。在本实施方式中,设为通信部103能够根据Wi-Fi(注册商标)的通信标准,与外部的装置通信。并且,通信部103具备GNSS(Global Navigation Satellite System:全球导航卫星系统)接收机,根据CPU101的控制从定位卫星接收信号。在信息提供系统1000中,设为使用GPS(GlobalPositioning System:全球定位系统)作为GNSS。
耳机200输出表示从移动终端100供给的信号的语音。耳机200具备DSP(DigitalSignal Processor:数字信号处理器)201、通信部202、传感器203、以及驱动器单元204。通信部202、传感器203、以及驱动器单元204经由内部总线209连接于DSP201。
DSP201控制通信部202、传感器203、以及驱动器单元204。DSP201将从移动终端100接收的语音信号输出至驱动器单元204。另外,每当从传感器203供给测定值时,DSP201将测定值发送至移动终端100。通信部202包含网络接口电路,根据DSP201的控制与外部的装置通信。通信部202例如根据Bluetooth(注册商标)标准,与移动终端100无线通信。
传感器203包含加速度传感器、角度传感器、以及角速度传感器。例如,作为加速度传感器,使用三轴加速度传感器。作为角速度传感器,使用三轴角速度传感器。传感器203每隔规定的时间实施测定,将测定出的加速度的测定值和角速度的测定值输出至DSP201。驱动器单元204将从DSP201供给的语音信号转换为声波并输出。
移动终端100功能性地具备存储部110、位置方向获取部120、对象推测部130、头部动作检测部140、意愿推测部150、以及信息输出部160。
存储部110例如存储表示美术馆、公园、观景台等的位置的位置坐标作为用户可能到访的场所的位置信息。也将用户可能到访的场所的位置信息称为场所位置信息。另外,存储部110例如存储表示美术馆内的展示物的位置的位置坐标作为能成为用户的视觉确认对象的对象的位置信息。也将能成为用户的视觉确认对象的对象的位置信息称为对象位置信息。并且,存储部110例如存储具有朗读对美术馆内的展示物进行说明的信息而得的语音信号的声源数据,作为对能成为用户的视觉确认对象的对象进行说明的说明信息。并且,在存储部110中,针对每个能成为视觉确认对象的对象,储存有表示虚拟地配置后述的声源的位置的信息。
另外,存储部110存储将用户的头部的动作和用户的意愿建立对应而得的意愿定义数据。以下记载意愿定义数据中定义的用户的头部的动作与意愿的建立对应的例子。用户歪头的动作表示用户感到无法理解。用户重复进行歪头的动作表示用户感到听不清。用户点头的动作表示用户具有积极的感情。用户摇头的动作表示用户具有消极的感情。用户反复进行摇头的动作表示用户具有更消极的感情。
存储部110存储表示与信息提供相关的设定的设定数据。与信息提供相关的设定表示通过语音输出说明信息时的设定。在实施方式中,与信息提供相关的设定包含表示说明信息的类型的选择的信息、表示输出说明信息的语音的音量的信息、表示有无说明信息的倒帧的执行的信息、以及表示是否继续说明信息的输出的信息。
在信息提供系统1000中,向用户提供的说明信息是通常版的说明信息、详细版的说明信息、以及简易版的说明信息三个类型的说明信息中的任一个。例如,设为向用户提供关于对象T1的说明信息。通常版的说明信息是通常预定向用户提供的对对象T1进行说明的信息。详细版的说明信息是与通常版的说明信息相比更详细地对对象T1进行说明的信息。简易版的说明信息是与通常版的说明信息相比更简易地对对象T1进行说明的信息。也将通常版的说明信息称为第一说明信息。也将详细版的说明信息称为第二说明信息,将简易版的说明信息称为第三说明信息。另外,也将详细版的说明信息称为第三说明信息,将简易版的说明信息称为第二说明信息。表示说明信息的类型的选择的信息表示选择通常版的说明信息、详细版的说明信息、以及简易版的说明信息中的哪一个。
表示输出说明信息的语音的音量的信息表示从耳机200输出的语音的音量。有无说明信息的倒帧的执行的设定是设定是否对之前语音输出的说明信息的一部分执行倒帧。倒帧是指将已语音输出的说明信息的一部分再次以语音输出。表示是否继续说明信息的输出的信息表示继续说明信息的基于语音的输出,还是在中途中止。表示输出说明信息的语音的音量的信息也称为与语音的输出相关的设定信息。
存储部110的功能由存储器102实现。场所位置信息、对象位置信息、说明信息、表示声源的位置的信息在向移动终端100安装引导应用程序安装时,作为用于执行引导应用程序的数据的一部分储存于存储器102。
位置方向获取部120获取表示移动终端100的当前位置的信息作为表示用户的当前位置的信息。并且,位置方向获取部120根据来自传感器203的测定值获取表示用户的视线方向的信息。位置方向获取部120的功能由CPU101实现。
对象推测部130推测用户正在视觉确认的对象。关于推测用户正在视觉确认的对象的方法后述。对象推测部130的功能由CPU101实现。
图2是用于对检测用户的头部的动作的方法进行说明的图。头部动作检测部140检测佩戴有耳机200的用户的头部的动作。在实施方式中,用户的头部的动作以旋转角表示。将沿着用户的前后方向的旋转轴定义为滚转轴,沿着用户的左右方向的旋转轴定义为俯仰轴,沿着重力方向的旋转轴定义为横摆轴。能够将用户歪头的动作表示为绕滚转轴的旋转。能够将用户点头的动作表示为绕俯仰轴的旋转。能够将用户回头的动作表示为绕横摆轴的旋转。
以下,存在将绕滚转轴的旋转角的位移量称为滚转角,将绕俯仰轴的角度的位移量称为俯仰角,将绕横摆轴的角度的位移量称为横摆角的情况。用户的头部的动作由滚转角、俯仰角、以及横摆角表示。若将用户朝向正面时设为0度,则滚转角的范围为+30度至-30度。若将用户朝向正面时设为0度,则俯仰角的范围为+45度至-45度。若将用户朝向正面时设为0度,则横摆角的范围为+60度至-60度。
头部动作检测部140根据由传感器203测定出的加速度的测定值和角速度的测定值检测滚转角、俯仰角、以及横摆角。头部动作检测部140将表示关于滚转角、俯仰角、以及横摆角的检测结果的信息供给至意愿推测部150。头部动作检测部140的功能由CPU101实现。
意愿推测部150根据由头部动作检测部140检测到的滚转角、俯仰角、以及横摆角确定用户的头部的动作。然后,意愿推测部150根据确定出的用户的头部的动作和意愿定义数据推测用户的意愿。并且,意愿推测部150根据推测出的用户的意愿选择与信息提供相关的设定。此外,也存在根据推测出的用户的意愿而未变更与信息提供相关的设定的情况。在这样的情况下,意愿推测部150选择维持目前的设定。意愿推测部150的功能由CPU101实现。
当对象推测部130推测出用户的视觉确认对象时,信息输出部160针对对推测出的对象进行说明的说明信息,根据储存于存储部110的与信息提供相关的设定使耳机200输出声音。具体而言,信息输出部160以在与信息提供相关的设定中指定的音量,使耳机200输出所选择的类型的说明信息。
在开始说明信息的输出后,根据推测出的用户的意愿变更了与信息提供相关的设定。在该情况下,信息输出部160根据变更后的与信息提供相关的设定,使耳机200输出说明信息。
图3是表示用户P与虚拟地配置的声源SS的位置关系的图。在图3中,示出从上方观察用户P和声源SS的情况。在实施方式中,信息输出部160从耳机200输出通过立体声朗读说明信息的语音。声源SS的位置被设定于与视觉确认对象相同的位置。首先,信息输出部160从存储部110读取针对推测出的视觉确认对象虚拟地配置声源SS的位置的信息。信息输出部160通过从存储部110读取表示虚拟地配置关于视觉确认对象的声源的位置的信息,来获取声源的虚拟位置。也将信息输出部160称为声源位置获取部。
并且,信息输出部160求出从用户P观察的声源SS所位于的方向相对于用户P的视线方向D的相对角度。在水平面内,视线方向D相对于基准方位N所成的角的大小为角度r1。基准方位N例如为朝向北的方向。从用户P观察的声源SS所位于的方向相对于基准方位N所成的角的大小为角度r2。信息输出部160根据视线方向D和基准方位N求出角度r1。信息输出部160根据声源SS的位置、用户P的位置、以及基准方位N求出角度r2。信息输出部160求出作为角度r1与角度r2之差的角度r3,作为声源SS所位于的方向相对于用户P的视线方向D的相对角度。
接下来,信息输出部160根据用户P的位置和声源SS的位置,求出用户P与声源SS之间的距离。信息输出部160基于求出的角度以及距离,将实施了立体声处理的语音输出至耳机200。在立体声处理中,例如使用现有的用于立体声的生成的算法。信息输出部160的功能由CPU101实现。
例如,设为将在美术馆内展示的绘画的中央部分设定为虚拟的声源的位置。在该情况下,观察该绘画的用户能够感到说明信息的语音从绘画的中央部分输出。这样,在本实施方式中,能够在使用户感到身临其境的同时向用户提供关于视觉确认的对象的信息。
图4是信息提供系统1000经由移动终端100向用户提供信息的信息提供处理的流程图。信息提供处理以规定的时间间隔开始。规定的时间间隔例如为0.5秒。此外,即使在已经过规定的时间的情况下,在相同的移动终端100中,设为在之前开始的信息提供处理未结束的情况下,不开始新的信息提供处理。另外,设为在信息提供处理开始的时刻,储存于存储部110的表示与信息提供相关的设定的信息成为初始设定的信息。
在步骤S10中,位置方向获取部120获取移动终端100的位置信息。具体而言,首先,位置方向获取部120基于从GPS卫星接收的GPS信号获取表示移动终端100的当前位置的位置坐标。在不能够接收GPS信号的情况下,位置方向获取部120基于从多个Wi-Fi(注册商标)基站接收的电波强度,获取表示移动终端100的当前位置的位置坐标。位置方向获取部120将移动终端100的位置坐标供给至对象推测部130。
在步骤S20中,位置方向获取部120确定用户的视线方向。位置方向获取部120根据由传感器203测定的加速度的测定值和角速度的测定值,判定用户是否注视某物。例如,位置方向获取部120在加速度的测定值满足预先规定的条件,并且角速度的测定值满足预先规定的条件时,判定为用户注视某物。当判定为用户注视某物时,位置方向获取部120根据加速度和角速度,确定用户的面部所朝向的方向。
用户的面部所朝向的方向能够由方位角、和仰角或者俯角表示。此处,方位角是指用户的面部所朝向的方向相对于成为基准的方位所成的角度。仰角是指观察位于上方的对象的用户的视线的方向相对于水平面所成的角度。俯角是指观察位于下方的对象的用户的视线的方向相对于水平面所成的角度。在本实施方式中,将用户的面部所朝向的方向设为用户的视线方向。也将表示用户的视线方向的信息称为视线方向信息。位置方向获取部120将表示用户的视线方向的视线方向信息供给至对象推测部130。
另一方面,当判定为用户并未注视某物时,位置方向获取部120向对象推测部130通知以不能够确定视线方向为主旨的内容。
在步骤S30中,对象推测部130判定是否存在用户正在视觉确认的对象。具体而言,首先,对象推测部130从存储部110读取关于位于以从位置方向获取部120供给的位置信息所示的用户的当前位置为中心的预先设定的范围内的对象的位置信息,作为视觉确认对象的候选的信息。对象推测部130根据位于设定的范围内的对象的位置信息、和从位置方向获取部120供给的位置信息以及视线方向信息,判别是否视觉确认对象的候选中的任一个进入用户的视野的范围。作为用户的视野的范围,对于方位角、仰角、以及俯角分别预先设定了范围。
例如设为对象推测部130判别为对象T1进入用户的视野。在该情况下,对象推测部130判别对象T1进入用户的视野的状态是否持续预先设定的期间。预先设定的期间例如为1秒钟。对象推测部130在对象T1进入用户的视野的状态持续预先设定的期间时,判别为用户正在视觉确认对象T1。在能够判定为存在视觉确认对象的情况下(步骤S30;是),对象推测部130将表示判别出的对象的信息供给至信息输出部160。
另一方面,在对象推测部130判别为不能够推测视觉确认对象的情况下(步骤S30;否),信息提供处理结束。例如,在被从位置方向获取部120通知了以不能够确定用户的视线方向为主旨的内容的情况下,对象推测部130判别为不能够推测视觉确认对象。另外,在对象T1进入用户的视野的状态未持续预先设定的期间时,对象推测部130判别为不能够推测视觉确认对象。另外,在以用户的当前位置为中心的预先设定的范围内没有能成为视觉确认对象的对象的情况下,对象推测部130判别为不能够推测视觉确认对象。
在步骤S40中,执行通过语音输出推测出的对象的说明信息的说明信息输出处理。之后,图4所示的处理结束。
图5是图4的步骤S40中的说明信息输出处理的流程图。在步骤S41中,信息输出部160读取储存于存储部110的与信息提供相关的设定数据。
在步骤S42中,信息输出部160从存储部110读取关于推测出的视觉确认对象的说明信息,开始经由耳机200的说明信息的语音输出。
在步骤S43中,信息输出部160判定是否将说明信息输出到最后。在说明信息未被输出到最后的情况下(步骤S43;否),执行步骤S44的处理。另一方面,在说明信息被输出到最后的情况下(步骤S43;是),说明信息输出处理结束。
在步骤S44中,执行基于头部动作检测部140的动作检测处理。在动作检测处理中,检测预先设定的期间的用户的头部的动作。
在步骤S45中,执行基于意愿推测部150的意愿推测处理。在意愿推测处理中,根据用户的头部的动作推测用户的意愿。并且,根据用户的意愿选择与信息提供相关的设定。
在步骤S46中,信息输出部160根据来自意愿推测部150的通知,判别与信息提供相关的设定数据是否已更新。在与信息提供相关的设定数据已更新的情况下(步骤S46;是),信息输出部160执行步骤S47的处理。另一方面,在与信息提供相关的设定数据未更新的情况下(步骤S46;否),执行步骤S43的处理。
在步骤S47中,信息输出部160中断说明信息的输出。在步骤S48中,信息输出部160从存储部110读取与信息提供相关的设定数据。在步骤S49中,信息输出部160根据更新后的与信息提供相关的设定数据再次开始说明信息的输出。之后,再次执行步骤S43的处理。
图6是图5的步骤S44所示的动作检测处理的流程图。在步骤S101中,头部动作检测部140启动计时器,开始时间测量。在实施方式中,为了推测用户的意愿,以设定的期间观察用户的头部的动作。设定的期间例如为0.5秒钟。计时器用于测量设定的期间。
在步骤S102中,头部动作检测部140获取表示用户的头部的动作的滚转角、俯仰角、以及横摆角。具体而言,头部动作检测部140根据由传感器203测定的加速度的测定值和角速度的测定值,计算表示用户的头部的动作的滚转角、俯仰角、以及横摆角。
在步骤S103中,头部动作检测部140判别是否检测到绕滚转轴的旋转。例如,在滚转角为预先规定的旋转角度以上的情况下,头部动作检测部140判别为检测到绕滚转轴的旋转。当检测到绕滚转轴的旋转时(步骤S103;是),头部动作检测部140执行步骤S106的处理。另一方面,在步骤S103中,当判别为未检测到绕滚转轴的旋转时(步骤S103;否),头部动作检测部140执行步骤S104的处理。
在步骤S104中,头部动作检测部140判别是否检测到绕横摆轴的旋转。例如,在横摆角为预先规定的旋转角度以上的情况下,头部动作检测部140判别为检测到绕横摆轴的旋转。当检测到绕横摆轴的旋转时(步骤S104;是),头部动作检测部140执行步骤S107的处理。另一方面,在步骤S104中,当判别为未检测到绕横摆轴的旋转时(步骤S104;否),头部动作检测部140执行步骤S105的处理。
在步骤S105中,头部动作检测部140判别是否检测到绕俯仰轴的旋转。例如,在俯仰角为预先规定的旋转角度以上的情况下,头部动作检测部140判别为检测到绕俯仰轴的旋转。当检测到绕俯仰轴的旋转时(步骤S105;是),头部动作检测部140执行步骤S108的处理。另一方面,在步骤S105中,当判别为未检测到绕俯仰轴的旋转时(步骤S105;否),头部动作检测部140执行步骤S109的处理。
在步骤S106中,头部动作检测部140将滚转轴的计数器Cr加1。另外,头部动作检测部140将横摆轴的计数器Cy和俯仰轴的计数器Cp复位。之后,头部动作检测部140执行步骤S109的处理。滚转轴的计数器Cr是表示检测到绕滚转轴的旋转的次数的计数器。横摆轴的计数器Cy是表示检测到绕横摆轴的旋转的次数的计数器。俯仰轴的计数器Cp是表示检测到绕俯仰轴的旋转的次数的计数器。
在步骤S107中,头部动作检测部140将横摆轴的计数器Cy加1。另外,头部动作检测部140将滚转轴的计数器Cr和俯仰轴的计数器Cp复位。之后,头部动作检测部140执行步骤S109的处理。
在步骤S108中,头部动作检测部140将俯仰轴的计数器Cp加1。另外,头部动作检测部140将滚转轴的计数器Cr和横摆轴的计数器Cy复位。之后,头部动作检测部140执行步骤S109的处理。
在步骤S109中,头部动作检测部140判别从启动计时器起是否已经过预先设定的时间。当已经过设定的时间时(步骤S109;是),头部动作检测部140将计时器停止,结束动作检测处理。另一方面,在未经过设定的时间的情况下(步骤S109;否),再次执行步骤S102的处理。
图7是图5的步骤S45中的意愿推测处理的流程图。在步骤S201中,意愿推测部150判别滚转轴的计数器Cr的值是否为1以上。在滚转轴的计数器Cr的值为1以上的情况下(步骤S201;是),意愿推测部150执行步骤S205的处理。另一方面,在滚转轴的计数器Cr的值不为1以上的情况下(步骤S201;否),意愿推测部150执行步骤S202的处理。
在步骤S202中,意愿推测部150判别横摆轴的计数器Cy的值是否为1以上。在横摆轴的计数器Cy的值为1以上的情况下(步骤S202;是),意愿推测部150执行步骤S208的处理。另一方面,在横摆轴的计数器Cy的值不为1以上的情况下(步骤S202;否),意愿推测部150执行步骤S203的处理。
在步骤S203中,意愿推测部150判别俯仰轴的计数器Cp的值是否为1以上。在俯仰轴的计数器Cp的值为1以上的情况下(步骤S203;是),意愿推测部150执行步骤S204的处理。另一方面,在俯仰轴的计数器Cp的值不为1以上的情况下(步骤S203;否),意愿推测部150执行步骤S211的处理。
在步骤S204中,意愿推测部150选择详细版的说明信息作为说明信息。意愿推测部150以选择的内容更新储存于存储部110的与信息提供相关的设定数据。之后,意愿推测部150执行步骤S211的处理。
在步骤S205中,意愿推测部150选择执行说明信息的倒帧。意愿推测部150以选择的内容更新储存于存储部110的与信息提供相关的设定数据。之后,意愿推测部150执行步骤S206的处理。
在步骤S206中,在计数器Cr的值为2以上的情况下(步骤S206;是),意愿推测部150执行步骤S207的处理。另一方面,在计数器Cr的值不为2以上的情况下(步骤S206;否),意愿推测部150执行步骤S211的处理。
在步骤S207中,意愿推测部150更新储存于存储部110的与信息提供相关的设定数据,以便将输出语音的音量的值提高预先设定的值。之后,意愿推测部150执行步骤S211的处理。
在步骤S208中,意愿推测部150选择简易版的说明信息作为说明信息。意愿推测部150以选择的内容更新与信息提供相关的设定数据。之后,意愿推测部150执行步骤S209的处理。
在步骤S209中,在计数器Cy的值为2以上的情况下(步骤S209;是),意愿推测部150执行步骤S210的处理。另一方面,在计数器Cy的值不为2以上的情况下(步骤S209;否),意愿推测部150执行步骤S211的处理。
在步骤S210中,意愿推测部150选择在中途中止说明信息的输出。意愿推测部150以选择的内容更新与信息提供相关的设定数据。之后,意愿推测部150执行步骤S211的处理。
在步骤S211中,意愿推测部150向信息输出部160通知是否更新了与信息提供相关的设定数据。然后,意愿推测处理结束。之后,执行图5所示的步骤S46的处理。
在更新后的与信息提供相关的设定数据中,选择了详细版的说明信息的情况下,信息输出部160从存储部110读取关于视觉确认对象的详细版的说明信息。信息输出部160重新开始详细版的说明信息向耳机200的输出。此外,信息输出部160从相当于之前中断的位置的详细版中的位置起输出说明信息。与此对应,耳机200从中断的地方起重新开始详细版的说明信息的输出。
例如,在向用户提供通常版的说明信息时用户点头的情况下,认为用户对说明信息具有积极的感情。在该情况下,认为用户想要听取更详细的说明。根据实施方式的结构,能够根据推测出的用户的意愿切换为提供详细版的说明信息。这样,能够考虑用户的意愿地提供基于语音的信息。
在更新后的与信息提供相关的设定数据中,选择了执行说明信息的倒帧的情况下,信息输出部160使耳机200再次输出之前输出的说明信息的一部分。与此对应,耳机200例如通过语音输出之前输出的一个句子。之后,信息输出部160从之前中断的位置起重新开始说明信息的输出。与此对应,耳机200从中断的地方起重新开始说明信息的输出。
例如,在用户歪头的情况下,认为用户漏听了之前的说明信息。在该情况下,再次输出之前输出的说明信息的一部分。由此,用户能够再次听取漏听的地方。这样,能够考虑用户的意愿地提供基于语音的信息。
在更新后的与信息提供相关的设定数据中,提高了输出语音的音量的值的情况下,信息输出部160与指定更新后的音量的指示一起,重新开始说明信息向耳机200的输出。与此对应,耳机200以更新后的音量重新开始说明信息的输出。
例如,在用户重复歪头的情况下,认为用户感到说明信息听不清。在该情况下,在实施方式所涉及的结构中,变更设定以便提高音量。由此,通过在输出说明信息的期间提高音量,用户变得容易听取说明信息。这样,能够考虑用户的意愿地提供基于语音的信息。
在更新后的与信息提供相关的设定数据中,在选择了简易版的说明信息的情况下,信息输出部160从存储部110读取关于视觉确认对象的简易版的说明信息。信息输出部160重新开始简易版的说明信息向耳机200的输出。此外,信息输出部160从相当于之前中断的位置的简易版中的位置起输出说明信息。与此对应,耳机200从中断的地方起重新开始简易版的说明信息的输出。
例如,在向用户提供通常版的说明信息时用户摇头的情况下,认为用户对说明信息具有消极的感情。在该情况下,认为用户期望简略的说明。根据实施方式所涉及的结构,能够根据推测出的用户的意愿切换为提供简易版的说明信息。这样,能够考虑用户的意愿地提供基于语音的信息。
在更新后的与信息提供相关的设定数据中,选择了说明信息的输出的中止的情况下,信息输出部160中止说明信息的输出。由此,不从耳机200重新开始说明信息的输出。
例如,在用户重复摇头的情况下,认为用户对说明信息具有更消极的感情。在该情况下,认为用户不期望说明信息的提供。根据实施方式所涉及的结构,能够根据推测出的用户的意愿切换设定以便中止说明信息的提供。由此,不向用户提供用户不想要的说明信息。
如以上说明的那样,在信息提供系统1000中,根据在输出说明信息的期间推测出的用户的意愿,选择与信息提供相关的设定。根据与信息提供相关的设定向用户提供说明信息。由此,能够根据用户的意愿,动态地变更与信息提供相关的设定。由此,能够考虑用户的意愿地提供基于语音的信息。
B1.其他实施方式1
在实施方式中,对用户正在视觉确认位置固定的对象的例子进行了说明。然而,用户视觉确认的对象也可以是移动物体。移动物体例如是船、飞机。对信息提供系统1000而言,例如在用户在有观景台的公园中从观景台观察在海上航行的船时,信息提供系统1000能够语音输出关于船的说明信息。另外,例如,在用户从机场的观景台观察起飞、降落后的飞机时,信息提供系统1000能够语音输出关于飞机的说明信息。以下,以与实施方式不同的结构为中心进行说明。
在其他实施方式1中,设为在存储部110中预先存储有表示用户有可能视觉确认移动物体的特定区域的范围的特定区域信息。特定区域例如是公园的观景台、机场的观景台。
例如,设为用户在有观景台的公园中从观景台观察在海上航行的船。位置方向获取部120获取表示移动终端100的当前位置的信息作为表示用户的当前位置的信息。并且,位置方向获取部120获取表示用户的视线方向的信息。位置方向获取部120基于从耳机200接收的加速度的测定值和角速度的测定值,确定用户的面部所朝向的方向作为用户的视线方向。
对象推测部130推测用户正在视觉确认的对象。具体而言,首先,对象推测部130根据从位置方向获取部120供给的位置信息、和储存于存储部110的特定区域信息,判别用户是否在特定区域的范围内。当判别为用户在特定区域的范围内时,对象推测部130根据用户的当前位置、日期以及时刻、航运时间表、以及航路信息,判别用户有可能视觉确认的对象的候选。并且,对象推测部130判别用户是否对视觉确认对象的候选进行视觉确认。对对象推测部130而言,在被判别为视觉确认对象的候选的对象进入用户的视野的范围的状态持续预先设定的期间的情况下,对象推测部130判别为用户对被判别为视觉确认候选的对象进行视觉确认。也将用户的视野称为用户的眼睛能够观察的范围。
当对象推测部130推测出用户的视觉确认对象时,信息输出部160从耳机200输出对推测出的对象进行说明的说明信息。信息输出部160如以下那样获取虚拟的声源的位置。信息输出部160基于用户与视觉确认对象的距离、和从用户观察的视觉确认对象的方向的相对角度,从耳机200输出实施了立体声处理的语音。由于视觉确认对象移动,信息输出部160也可以每隔规定的时间计算对象的位置作为虚拟的声源的位置。规定的时间例如为5秒钟。信息输出部160也可以基于新计算的声源的位置与用户之间的距离、从用户观察的声源所位于的方向相对于用户的视线方向的相对角度,通过立体声输出语音。在该情况下,用户也能够感到从视觉确认的对象输出说明信息。
另外,在多个对象进入用户的视野的情况下,例如,信息输出部160也可以以从靠近用户的对象至位于远处的对象的顺序输出说明信息。
意愿推测部150根据头部动作检测部140的检测结果确定用户的头部的动作,根据确定出的用户的头部的动作和意愿定义数据,推测用户的意愿。意愿推测部150根据在输出说明信息的期间推测出的用户的意愿,选择与信息提供相关的设定。
另一方面,设为对象推测部130根据从位置方向获取部120供给的位置信息、和储存于存储部110的特定区域信息,判别为用户不在特定区域的范围内。在该情况下,在信息提供系统1000中,与实施方式相同地,向用户提供关于位置固定的对象的说明信息。
B2.其他实施方式2
另外,用户视觉确认的对象也可以是星星。例如在夜间的时间段,用户在室外且表示用户的视线方向的仰角处于预先设定的范围的情况下,信息提供系统1000能够语音输出关于星座的说明信息。在该情况下,对象推测部130根据用户的当前位置、日期以及时刻、用户的视线方向、以及与方位角和日期及时间建立对应的星图,判别用户正在视觉确认的对象即可。对象推测部130也可以读取预先存储于存储部110的星图的数据。或者,对象推测部130也可以读取存储于云服务器的星图的数据。
B3.其他实施方式3
在实施方式中,用户仅听取关于视觉确认的对象的说明信息。然而,也可以在说明信息中包含对用户的提问。例如,移动终端100的信息输出部160通过语音输出针对视觉确认对象的问题。并且,信息输出部160将回答的选项与表示选项的编号一起依次通过语音输出。也可以在在输出了表示任意的选项的编号后用户点头的情况下,意愿推测部150判别为用户选择的选项是该编号所示的选项。
根据这样的方式,能够提供不是用户仅被动地接受信息的提供,而是用户能够一边参与一边接受信息提供的参与型的信息提供系统。
B4.其他实施方式4
在实施方式中,在用户进行了点头的动作时,移动终端100判别为用户肯定。然而,根据用户使用的语言所属的文化,也存在意味着肯定的非语言的动作不同的情况。非语言的动作是所谓的姿势(gesture)。根据用户使用的语言所属的文化,例如也存在纵向摇头意味着否定。
因此,也可以在移动终端100的存储部110预先存储针对每个使用语言定义的意愿定义数据。意愿推测部150也可以基于与用户使用的语言对应的意愿定义数据,推测用户的头部的动作所意味的用户的意愿。此外,意愿推测部150例如能够从对移动终端100设定的语言的设定信息中获取用户使用的语言的信息。这样,即使是使用语言不同的用户,也能够根据头部的动作推测用户的意愿。
B5.其他实施方式5
在实施方式中,意愿推测部150根据确定出的用户的头部的动作和意愿定义数据,推测用户的意愿。或者,意愿推测部150也可以利用机器学习完毕的机器学习模型来推测用户的意愿。当输入表示用户的头部的动作的参数、用户的移动速度、用户与对象的距离、以及用户相对于对象的相对角度时,该机器学习模型输出推测用户的意愿的结果。根据这样的方式,能够以较高的精度推测用户的意愿。
B6.其他实施方式6
在实施方式中,在某旋转轴的旋转角度为预先规定的旋转角度以上的情况下,意愿推测部150判别为检测到绕该旋转轴的旋转。然而,也存在在相同的定时检测到两个旋转轴上的旋转的情况。在这样的情况下,意愿推测部150也可以采用旋转角较大的一方的旋转轴的旋转。
B7.其他实施方式7
也可以在存储于存储部110的与信息提供相关的设定中,除了在实施方式中说明的信息以外,还包含有表示朗读说明信息的速度的信息。表示朗读说明信息的速度的信息表示从耳机200输出的朗读说明信息的语音的朗读速度。也将表示朗读说明信息的速度的信息称为与语音的输出相关的设定信息。
例如,也可以当推测为用户感到难以听取说明信息时,意愿推测部150更新表示朗读说明信息的速度的信息,以便减慢朗读说明信息的速度。
B8.其他实施方式8
在实施方式中,对在室内,位置方向获取部120基于从多个Wi-Fi(注册商标)基站接收的电波强度来获取表示移动终端100的当前位置的信息的例子进行了说明。或者,也可以如以下那样进行室内的移动终端100的位置信息的获取。设为移动终端100具备地磁传感器。在该情况下,位置方向获取部120也可以使用地磁传感器来获取移动终端100的位置信息。
另外,或者,位置方向获取部120首先基于从Wi-Fi(注册商标)基站接收的电波强度,获取移动终端100的位置信息。位置方向获取部120也可以在不能够获取位置信息的情况下,使用地磁传感器来获取移动终端100的位置信息。
在实施方式中,对在室外,位置方向获取部120为了获取移动终端100的当前位置而利用GPS的例子进行了说明。或者,位置方向获取部120也可以利用准天顶卫星系统这样的其他卫星定位系统。另外,或者,位置方向获取部120也可以利用GPS以及准天顶卫星系统来获取移动终端100的当前位置。
B9.其他实施方式9
在实施方式中,在存储部110存储有具有朗读关于能成为用户的视觉确认对象的对象的说明信息而得的语音信号的声源数据。然而,声源数据也可以不保存于存储部110。信息输出部160也可以访问保存于云服务器的声源数据,将声源数据中包含的语音信号发送至耳机200。在该情况下,在存储部110保存有确定保存于云服务器的声源数据的位置的URL(Uniform Resource Locator:统一资源定位器)即可。
B10.其他实施方式10
另外,在实施方式中,对向用户提供的说明信息是通常版的说明信息、详细版的说明信息、以及简易版的说明信息三个类型的说明信息中的任一个的例子进行了说明。然而,说明信息的类型不限于三个。或者,也可以向用户提供通常版的说明信息、和简易版的说明信息两个类型的说明信息的任一个。另外,或者,说明信息的类型也可以为四个以上。
在实施方式中,对三个类型的说明信息是通常版的说明信息、详细版的说明信息、以及简易版的说明信息的例子进行了说明。另外,作为说明信息,也可以按用户的年龄分别提供不同的类型的说明信息。例如,也可以根据用户的年龄提供对小学生的用户提供的类型的说明信息、对中学生以及高中生的用户提供的类型的说明信息、以及对大学生以及社会人士的用户提供的类型的说明信息的任一个。例如,信息提供系统1000在安装引导应用程序时,根据由用户输入的年龄的信息,判别用户的年龄层。各个类型的说明信息是与年龄对应地用户能够理解的内容。并且,针对各年龄的类型的每一个,分别准备通常版的说明信息、详细版的说明信息、简易版的说明信息。
或者,也可以针对特定的对象,向用户提供三个类型的说明信息中的任一个说明信息,针对其他对象,向用户提供两个类型的说明信息的任一个。
另外,在实施方式中,举出了耳机200作为语音输出装置的例子,但语音输出装置也可以是头戴式耳机,也可以是骨传导耳机。
在实施方式中,对通信部103根据Wi-Fi(注册商标)的通信标准与外部的装置通信的例子进行了说明。然而,通信部103例如也可以根据Bluetooth(注册商标)这样的其他通信标准与外部的装置通信。通信部103也可以支持多个通信标准。
另外,实现移动终端100的功能的部件不限于软件,也可以通过专用的硬件实现其一部分或者全部。例如,作为专用的硬件,也可以使用以FPGA(Field Programmable GateArray:现场可编程门阵列)或者ASIC(Application Specific Integrated Circuit:专用集成电路)为代表的电路。
在实施方式中,对作为由用户携带的计算机的移动终端100是智能手机的例子进行了说明。或者,移动终端100也可以是移动电话、平板终端等。另外,或者,移动终端100也可以是可穿戴计算机。可穿戴计算机例如是智能手表、头戴式显示器等。
在实施方式中,在根据来自意愿推测部150的通知判别为与信息提供相关的设定数据已更新的情况下,信息输出部160中断说明信息的输出。然而,信息输出部160并不必须中断说明信息的输出。例如,信息输出部160也可以在继续说明信息的基于语音的输出的同时读取更新后的设定数据,之后,根据更新后的与信息提供相关的设定数据进行说明信息的输出。
另外,在检测到绕滚转轴的旋转的情况下,信息输出部160也可以中断说明信息的输出,根据更新后的与信息提供相关的设定数据,再次输出之前输出的说明信息的一部分。在检测到绕横摆轴的旋转或者绕俯仰轴的旋转的情况下,信息输出部160也可以不中断说明信息的输出,而根据更新后的与信息提供相关的设定数据,例如将提供的说明信息切换为详细版的说明信息或者简易版的说明信息。
另外,也可以与根据用户的头部的动作推测的用户的意愿无关地,选择提供三个类型的说明信息的哪一个。例如,在较热的时期或者较寒的时期,在室外通过语音输出长时间的说明信息能成为用户逗留在室外的重要因素。在这样的情况下,例如,也可以根据日期及时间、位置信息,选择为提供简易版的说明信息。
头部动作检测部140也可以根据加速度的测定值、角速度的测定值、以及地磁强度的测定值,检测滚转角、俯仰角、以及横摆角。在该情况下,设为传感器203除了加速度传感器、角度传感器、以及角速度传感器以外,还包含地磁传感器。
本公开不局限于上述实施方式,能够在不脱离其主旨的范围内由各种结构实现。例如,为了解决上述课题的一部分或全部,或者为了实现上述效果的一部分或全部,与发明内容一栏记载的各方式中的技术特征对应的实施方式中的技术特征能够适当地进行替换、组合。另外,只要不说明该技术特征在本说明书中是必需的,则能够适当地删除。
Claims (12)
1.一种信息提供系统,是通过声音提供信息的信息提供系统,具备:
位置方向获取部,获取表示用户所处的位置的位置信息、和表示视线方向的视线方向信息,上述视线方向是上述用户的面部所朝向的方向;
存储部,存储表示能成为上述用户的视觉确认对象的多个对象各自的位置的对象位置信息、对各个上述对象进行说明的说明信息、以及表示与信息提供相关的设定的信息;
对象推测部,根据上述位置信息、上述视线方向信息、以及上述对象位置信息,推测上述用户正在视觉确认的上述对象;
信息输出部,根据与上述信息提供相关的设定,通过语音输出关于推测出的上述对象的上述说明信息;
头部动作检测部,检测上述用户的头部的动作;以及
意愿推测部,根据输出上述说明信息的期间的上述用户的头部的动作推测上述用户的意愿,根据上述用户的上述意愿选择与上述信息提供相关的设定,
在变更了与上述信息提供相关的设定的情况下,上述信息输出部根据变更后的与上述信息提供相关的设定输出上述说明信息。
2.根据权利要求1所述的信息提供系统,其中,
上述存储部存储第一说明信息和第二说明信息作为对上述对象进行说明的上述说明信息,上述第一说明信息是关于上述对象的说明,上述第二说明信息是关于上述对象的与上述第一说明信息不同的说明,
与上述信息提供相关的设定包含表示选择上述第一说明信息、和上述第二说明信息中的哪一个作为上述说明信息的信息。
3.根据权利要求2所述的信息提供系统,其中,
上述存储部还存储第三说明信息作为对上述对象进行说明的上述说明信息,上述第三说明信息是关于上述对象的与上述第一说明信息以及上述第二说明信息不同的说明,
上述第一说明信息是关于上述对象的通常的说明,上述第二说明信息是比上述第一说明信息详细的说明,上述第三说明信息是比上述第一说明信息简略的说明,
与上述信息提供相关的设定包含表示选择上述第一说明信息、上述第二说明信息、以及上述第三说明信息中的哪一个作为上述说明信息的信息。
4.根据权利要求1~3中任一项所述的信息提供系统,其中,
与上述信息提供相关的设定包含与上述语音的输出相关的设定信息。
5.根据权利要求1~3中任一项所述的信息提供系统,其中,
与上述信息提供相关的设定包含表示是否继续上述说明信息的输出的信息。
6.根据权利要求1~3中任一项所述的信息提供系统,其中,
上述信息输出部通过上述语音输出对上述用户的提问,
上述意愿推测部根据上述用户的头部的动作,推测上述用户对上述提问的回答。
7.根据权利要求1~3中任一项所述的信息提供系统,其中,
上述对象包含移动物体,
在上述移动物体进入上述用户的眼睛能够观察的范围的状态持续预先设定的期间的情况下,上述对象推测部将上述移动物体推测为是上述用户正在视觉确认的上述对象。
8.根据权利要求1~3中任一项所述的信息提供系统,其中,
还具备声源位置获取部,该声源位置获取部获取与上述对象分别对应的声源的虚拟位置,
上述信息输出部根据从上述用户的当前位置观察到的上述声源的上述虚拟位置,使佩戴于上述用户的头部的便携式的语音输出装置输出对表示上述说明信息的上述语音实施了立体声处理的语音。
9.根据权利要求1~3中任一项所述的信息提供系统,其中,
上述存储部存储意愿定义数据,该意愿定义数据定义了与上述用户的使用语言所属的文化对应的非语言的动作,
上述意愿推测部根据上述意愿定义数据、和上述用户的头部的动作推测上述用户的上述意愿。
10.根据权利要求1~3中任一项所述的信息提供系统,其中,
上述意愿推测部通过将表示上述用户的头部的动作的参数、上述用户的移动速度、上述用户与上述对象的距离、上述用户相对于上述对象的相对角度输入至学习完毕的机器学习模型,来推测上述用户的上述意愿。
11.一种方法,是由用户携带的计算机通过声音提供信息的方法,其中,包含以下步骤:
上述计算机获取表示上述用户所处的位置的位置信息、和表示视线方向的视线方向信息,上述视线方向是上述用户的面部所朝向的方向;
上述计算机根据上述位置信息、上述视线方向信息、以及针对能成为上述用户的视觉确认对象的多个对象分别预先设定的对象位置信息,推测上述用户正在视觉确认的对象;
上述计算机根据与信息提供相关的设定,通过上述语音输出关于推测出的上述对象的说明信息;
上述计算机检测上述用户的头部的动作;
上述计算机根据输出上述说明信息的期间的上述用户的头部的动作推测上述用户的意愿;
上述计算机根据推测出的上述用户的上述意愿选择与上述信息提供相关的设定;以及
在变更了与上述信息提供相关的设定的情况下,上述计算机根据变更后的与上述信息提供相关的设定,通过上述语音输出上述说明信息。
12.一种存储介质,是存储了用户所携带的计算机执行的程序的存储介质,其中,
上述程序使上述计算机实现以下功能:
获取表示上述用户所处的位置的位置信息、和表示视线方向的视线方向信息,上述视线方向是上述用户的面部所朝向的方向;
根据上述位置信息、上述视线方向信息、以及针对能成为上述用户的视觉确认对象的多个对象分别预先设定的对象位置信息,推测上述用户正在视觉确认的上述对象;
根据与信息提供相关的设定,通过语音输出关于推测出的上述对象的说明信息;
检测上述用户的头部的动作;
根据输出上述说明信息的期间的上述用户的头部的动作推测上述用户的意愿;
根据推测出的上述用户的上述意愿选择与上述信息提供相关的设定;以及
在变更了与上述信息提供相关的设定的情况下,根据变更后的与上述信息提供相关的设定,通过上述语音输出上述说明信息。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022021703A JP2023119082A (ja) | 2022-02-16 | 2022-02-16 | 情報提供システム、方法、および、プログラム |
| JP2022-021703 | 2022-02-16 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN116610825A true CN116610825A (zh) | 2023-08-18 |
Family
ID=87430720
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202310117200.4A Pending CN116610825A (zh) | 2022-02-16 | 2023-02-15 | 信息提供系统、方法、以及存储介质 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US20230259328A1 (zh) |
| JP (1) | JP2023119082A (zh) |
| CN (1) | CN116610825A (zh) |
| DE (1) | DE102023103650A1 (zh) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12423900B1 (en) | 2022-09-24 | 2025-09-23 | Apple Inc. | Methods and user interfaces based on motion |
| WO2025072854A1 (en) * | 2023-09-30 | 2025-04-03 | Apple Inc. | Techniques for motion compensation |
| US20250130631A1 (en) * | 2023-10-20 | 2025-04-24 | Microsoft Technology Licensing, Llc | Systems and methods for sensor-agnostic representation of human presence information |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2278196A (en) * | 1993-05-18 | 1994-11-23 | William Michael Frederi Taylor | Information system using GPS |
| JPH08160897A (ja) | 1994-12-09 | 1996-06-21 | Taiyo Yuden Co Ltd | 商品紹介装置 |
| JPH09170929A (ja) * | 1995-12-21 | 1997-06-30 | Sony Corp | ガイド装置 |
| KR20050061856A (ko) * | 2003-12-18 | 2005-06-23 | 한국전자통신연구원 | 가상현실을 이용한 관광 안내 서비스 시스템 및 그 서비스방법 |
| JP5103682B2 (ja) * | 2007-10-24 | 2012-12-19 | 株式会社国際電気通信基礎技術研究所 | インタラクティブ看板システム |
| EP2690407A1 (en) * | 2012-07-23 | 2014-01-29 | GN Store Nord A/S | A hearing device providing spoken information on selected points of interest |
| JP6528311B2 (ja) * | 2015-03-10 | 2019-06-12 | 成広 武田 | 行動サポート装置 |
| WO2017191713A1 (ja) * | 2016-05-02 | 2017-11-09 | ソニー株式会社 | 制御装置、制御方法及びコンピュータプログラム |
| WO2018020764A1 (ja) * | 2016-07-28 | 2018-02-01 | ソニー株式会社 | コンテンツ出力システム、端末装置、コンテンツ出力方法、および記録媒体 |
-
2022
- 2022-02-16 JP JP2022021703A patent/JP2023119082A/ja active Pending
-
2023
- 2023-02-15 DE DE102023103650.5A patent/DE102023103650A1/de active Pending
- 2023-02-15 US US18/169,458 patent/US20230259328A1/en active Pending
- 2023-02-15 CN CN202310117200.4A patent/CN116610825A/zh active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023119082A (ja) | 2023-08-28 |
| US20230259328A1 (en) | 2023-08-17 |
| DE102023103650A1 (de) | 2023-08-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9971403B1 (en) | Intentional user experience | |
| CN116610825A (zh) | 信息提供系统、方法、以及存储介质 | |
| US10132633B2 (en) | User controlled real object disappearance in a mixed reality display | |
| CN107771342B (zh) | 一种增强现实显示方法及头戴式显示设备 | |
| CA2913650C (en) | Virtual object orientation and visualization | |
| US20200252740A1 (en) | Systems and methods for determining estimated head orientation and position with ear pieces | |
| US20190278555A1 (en) | User-interfaces for audio-augmented-reality | |
| JP2016096513A (ja) | 情報処理システム、情報処理方法及びプログラム | |
| WO2018179644A1 (ja) | 情報処理装置、情報処理方法及び記録媒体 | |
| US12361708B2 (en) | Information processing apparatus, information processing method, and program | |
| JPWO2020044949A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
| JP6816492B2 (ja) | 表示制御プログラム、表示制御方法および表示制御装置 | |
| JP6272484B2 (ja) | 待ち合わせ支援システム、待ち合わせ支援プログラムおよび待ち合わせ支援方法 | |
| JP6527182B2 (ja) | 端末装置、端末装置の制御方法、コンピュータプログラム | |
| WO2016157678A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
| US11568579B2 (en) | Augmented reality content generation with update suspension | |
| JP2018067157A (ja) | 通信装置およびその制御方法 | |
| JP6306985B2 (ja) | 情報処理システム、情報処理方法及びプログラム | |
| US11240482B2 (en) | Information processing device, information processing method, and computer program | |
| EP3451149A1 (en) | Information processing device, information processing method, and program | |
| CN117063204A (zh) | 信息处理装置、信息处理方法和程序 | |
| US20240200947A1 (en) | Information processing apparatus, information processing method, information processing program, and information processing system | |
| JP7400810B2 (ja) | 情報処理装置、情報処理方法、及び記録媒体 | |
| US20240176818A1 (en) | Content playback system, information processing apparatus, and content playback controlling application | |
| JP6992336B2 (ja) | 表示制御装置、表示制御方法およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |