CN111081275A

CN111081275A - 基于声音分析的终端处理方法、装置、存储介质及终端

Info

Publication number: CN111081275A
Application number: CN201911325074.1A
Authority: CN
Inventors: 李岩
Original assignee: Huizhou TCL Mobile Communication Co Ltd
Current assignee: Huizhou TCL Mobile Communication Co Ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2020-04-28
Anticipated expiration: 2039-12-20
Also published as: CN111081275B

Abstract

本申请实施例公开了一种基于声音分析的终端处理方法、装置、存储介质及终端。该方法包括：采集当前场景下的声音信息；对所述声音信息进行分析，得到分析结果；基于所述分析结果确定当前场景的所属类型；执行与当前场景的所属类型对应的操作指令。本方案通过智能识别当前的场景状态，执行相应服务的操作指令，提升了终端的智能性，为用户带来便利。

Description

基于声音分析的终端处理方法、装置、存储介质及终端

技术领域

本申请涉及终端技术领域，尤其涉及一种基于声音分析的终端处理方法、装置、存储介质及终端。

背景技术

人工智能技术现在越来越普及到智能终端设备，给消费者带来了新的智能体验。人工智能技术的核心是要通过大量的数据学习，让机器来建立智能决策的能力，从而加以应用到用户的日常生活中，为用户带来便利。

发明内容

本申请实施例提供一种基于声音分析的终端处理方法、装置、存储介质及终端，可以提终端的智能性。

第一方面，本申请实施例提供一种基于声音分析的终端处理方法，包括：

采集当前场景下的声音信息；

对所述声音信息进行分析，得到分析结果；

基于所述分析结果确定当前场景的所属类型；

执行与当前场景的所属类型对应的操作指令。

在一些实施方式中，所述基于所述分析结果确定当前场景的所属类型，包括：

根据所述分析结果从多个样本场景类型中，确定当前场景的所属类型，其中，所述多个样本场景类型至少包括：嘈杂场景、危险场景和安静场景。

在一些实施方式中，所述执行与当前场景的所属类型对应的操作指令，包括：

若当前场景的所属类型为嘈杂场景，则获取当前的地理位置；

确定所述地理位置是否处于预设区域内；

若是，则将当前的信息提醒方式调整为震动提醒。

在一些实施方式中，在确定所述地理位置处于预设区域内之后，还包括：

当检测到终端播放第一音频信号时，对所述第一音频信号进行降噪处理。

若当前场景的所属类型为危险场景，则获取当前的环境图像信息；

基于当前的地理位置和所述环境图像信息，确定危险区域的位置覆盖范围；

根据所述位置覆盖范围生成路线指引信息；

根据所述路线指引信息对用户进行信息提示。

若当前场景的所属类型为安静场景，则当检测到待播放的第二音频信号时，调整所述第二音频信号的音量参数值至低于当音量参数值。

在一些实施方式中，所述对所述声音信息进行分析，得到分析结果，包括：

对所述声音信息进行特征提取，得到声音特征；

根据所述声音特征对所述声音信息进行识别；

基于识别结果确定所述声音信息中包含的声音种类、声音种类数量、声源数量、声音特性参数；

至少根据所述声音种类、所述声音种类数量、声源数量、声音特性参数，生成所述分析结果。

第二方面，本申请实施例提供了一种基于声音分析的终端处理装置，包括：

采集单元，用于采集当前场景下的声音信息；

分析单元，用于对所述声音信息进行分析，得到分析结果；

确定单元，用于基于所述分析结果确定当前场景的所属类型；

处理单元，用于执行与当前场景的所属类型对应的操作指令。

在一些实施方式中，确定单元用于：

在一些实施方式中，处理单元用于：

确定所述地理位置是否处于预设区域内；

若是，则将当前的信息提醒方式调整为震动提醒。

在一些实施方式中，处理单元还用于：

在确定所述地理位置处于预设区域内之后，当检测到终端播放第一音频信号时，对所述第一音频信号进行降噪处理

在一些实施方式中，处理单元用于：

根据所述位置覆盖范围生成路线指引信息；

根据所述路线指引信息对用户进行信息提示。

在一些实施方式中，处理单元用于：

在一些实施方式中，分析单元包括：

提取子单元，用于对所述声音信息进行特征提取，得到声音特征；

识别子单元，用于根据所述声音特征对所述声音信息进行识别；

确定子单元，用于基于识别结果确定所述声音信息中包含的声音种类、声音种类数量、声源数量、声音特性参数；

生成子单元，用于至少根据所述声音种类、所述声音种类数量、声源数量、声音特性参数，生成所述分析结果。

第三方面，本申请实施例还提供了一种计算机可读存储介质，所述存储介质中存储有多条指令，所述指令适于由处理器加载以执行上述的基于声音分析的终端处理方法。

第四方面，本申请实施例还提供了一种终端，包括处理器及存储器，所述处理器与所述存储器电性连接，所述存储器用于存储指令和数据，处理器用于执行上述的基于声音分析的终端处理方法。

本申请实施中，通过采集当前场景下的声音信息，并对声音信息进行分析，得到分析结果。然后，基于分析结果确定当前场景的所属类型，并执行与当前场景的所属类型对应的操作指令。本方案通过智能识别当前的场景状态，执行相应服务的操作指令，提升了终端的智能性，为用户带来便利。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的基于声音分析的终端处理方法的流程示意图。

图2是本申请实施例提供的基于声音分析的终端处理方法的场景示意图。

图3是本申请实施例提供的基于声音分析的终端处理装置的一结构示意图。

图4是本申请实施例提供的基于声音分析的终端处理装置的另一结构示意图。

图5是本申请实施例提供的终端的一结构示意图。

图6是本申请实施例提供的终端的另一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种基于声音分析的终端处理方法、装置、存储介质及终端。以下将分别进行详细说明。

在一实施例中，提供一种基于声音分析的终端处理方法，应用于智能手机、平板电脑、笔记本电脑等终端设备中。参考图1，该基于声音分析的终端处理方法的具体流程可以如下：

101、采集当前场景下的声音信息。

声音是由物体振动产生的声波，是通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。其中，声音是由物体振动产生的，声音以波的形式振动传播，正在发声的物体叫做声源。物体在一秒钟之内振动的次数叫做频率，单位是赫兹(Hz)。人的耳朵可以听到20Hz-----20000Hz的声音.最敏感是1000Hz至3000Hz之间的声音。

而本申请实施例中，终端设备内设置有麦克风，终端具体可以通过该麦克风采集外界环境中的声音信息。

在一些实施方式中，该麦克风还可以是外接设备，其可与终端设备之间建立无线链路，并将采集到的声音信息通过该无线链路发送给终端设备，以使终端获取到当前场景下的声音信息。

102、对声音信息进行分析，得到分析结果。

本实施例中，需要预先利用AI(Artificial Intelligence，人工智能)技术，对常用的环境声音数据进行标记和学习，让终端设备能够识别出当前的环境声音。

具体的，首先输入常用的声音音源数据到AI算法模型进行模型训练，标记常用的声音分类，识别产生声音的不同声源。经过大量的学习后，使得终端设备具备识别各种不同声音的能力。

实际应用中，可以采用神经网络方法、隐式马尔可夫模型方法、VQ聚类方法、多项式分类器方法等，对声音信息进行分析处理。例如，在一些实施例中，步骤“对声音信息进行分析，得到分析结果”，可以包括以下流程：

(11)对声音信息进行特征提取，得到声音特征；

(12)根据声音特征对声音信息进行识别；

(13)基于识别结果确定声音信息中包含的声音种类、声音种类数量、声源数量、声音特性参数；

(14)至少根据声音种类、声音种类数量、声源数量、声音特性参数，生成分析结果。

具体的，可以将采集到的声音信息输入到训练好的AI算法模型中，以从采集到的声音信息中提取频谱、速度、音色、音调、音量、响度等特征。然后，根据提取到的特征进行声音分类、识别，以从当前声音信息中识别所有声音，得到识别结果。进一步，根据识别结果确定声音信息中包含的声音种类、声音种类数量、声源数量、声音特性参数，并基于得到的信息生成分析结果。

其中，声音种类可以包括不同声源产生的声音，例如人类的说话声、动物的叫唤声、风声、汽车的鸣笛声、响铃声等等。声音特性参数可以包括音色、音量、响度等参数信息。

具体实施时，在对声音信息进行特征提取之前，还可以预先对声音信息进行去噪处理，以排除一些非典型(即无法分类的)的声音，以提升后续是声音分析结果的准确性。

103、基于分析结果确定当前场景的所属类型。

具体的，在一些实施例中，步骤“基于分析结果确定当前场景的所属类型”，可以包括以下流程：

根据分析结果从多个样本场景类型中，确定当前场景的所属类型，其中，多个样本场景类型至少包括：嘈杂场景、危险场景和安静场景。

在本实施例中，需要预先设定多个样本场景，不同场景下可以包括的声音种类不相同。因此，需预先不同样本场景下的声音组成成分。然后，基于上述分析结果从构建的样本场景中确定当前场景的所属场景的类型。

本实施例中，可以预先构建几个典型场景，例如嘈杂场景(含有多种不同种类的声音、以及一定数量的声源，如闹市、菜市场等环境下产生的声音)、安静场景(声音分贝较低)、危险场景(包含特殊声源产生的特殊声音，如爆炸声)。

104、执行与当前场景的所属类型对应的操作指令。

具体的，结合图1和图2，根据实际应用中不同的场景类型，所要执行的操作指令也不相同。

在一些实施例中，若当前场景的所属类型为嘈杂场景，则步骤“执行与当前场景的所属类型对应的操作指令”，可以包括以下流程：

(21)获取当前的地理位置；

(22)确定地理位置是否处于预设区域内；

(23)若是，则将当前的信息提醒方式调整为震动提醒。

具体的，可在终端设备中设置定位装置，利用GPS(Global Positioning System，全球定位系统)定位、wifi(Wireless Fidelity，无线保真)定位、蓝牙定位等定位技术，获取当前所处的地理位置信息。通过结合当前的地理位置、以及当前场景类型，确定当前是否处于闹市、饭店、菜市场等声音普遍嘈杂的预设区域内。若处于预设区域内，由于当前场景声音嘈杂，难以察觉感知到终端的来电响铃、消息提醒等声音提示信息。因此，可将当前终端的信息提醒方式更改为震动提醒的方式，以便用户更加容易感知到终端的状态。

当然，若当前的信息提醒方式为震动提醒，则无需调整方式。

在一些实施例中，在确定地理位置处于预设区域内之后，若检测到终端播放第一音频信号，则还可以对第一音频信号进行降噪处理，以便用户能更加清晰的听到音频的具体内容。

其中，第一音频信号具体可以是该终端与其他终端进行语音通话或视频通话时产生的音频信号，也可以是终端接收到对方终端发送的语音消息中携带的音频信号。

在一些实施例中，若当前场景的所属类型为危险场景，则步骤“执行与当前场景的所属类型对应的操作指令”，可以包括以下流程：

(31)获取当前的环境图像信息；

(32)基于当前的地理位置和环境图像信息，确定危险区域的位置覆盖范围；

(33)根据位置覆盖范围生成路线指引信息；

(34)根据路线指引信息对用户进行信息提示。

具体的，可以在终端中设置摄像头，终端可通过开启该摄像头采集当前的外界环境图像信息。另外，通过终端的定位功能确定当前的地理位置，并结合获取到的外界环境图像和当前的地理位置、以及上述分析结果(主要是声音响度、声音种类等)，确定危险区域的位置覆盖范围。

在确定好危险区域的覆盖范围后，可结合当前环境下的路况信息、建筑物信息等生成路线指引信息，以提示引导用户转移至安全区域，保证用户安全性。

在一些实施例中，若当前场景的所属类型为安静场景，在执行与当前场景的所属类型对应的操作指令时，具体可以是若检测到待播放的第二音频信号，则调整第二音频信号的音量参数值至低于当音量参数值，以降低当前音频播放的音量，避免在安静的环境产生过大的声响，无需用户手动调节音量，简单便捷。

由上可知，本实施例提供的基于声音分析的终端处理方法，通过采集当前场景下的声音信息，并对声音信息进行分析，得到分析结果。然后，基于分析结果确定当前场景的所属类型，并执行与当前场景的所属类型对应的操作指令。本方案通过智能识别当前的场景状态，执行相应服务的操作指令，提升了终端的智能性，为用户带来便利。

在本申请又一实施例中，还提供一种基于声音分析的终端处理装置，该基于声音分析的终端处理装置可以软件或硬件的形式集成在终端中，该终端具体可以包括手机、平板电脑、笔记本电脑等设备。如图3所示，该基于声音分析的终端处理装置300可以包括：采集单元301、分析单元302、确定单元303和处理单元304，其中：

采集单元301，用于采集当前场景下的声音信息；

分析单元302，用于对所述声音信息进行分析，得到分析结果；

确定单元303，用于基于所述分析结果确定当前场景的所属类型；

处理单元304，用于执行与当前场景的所属类型对应的操作指令。

在一些实施例中，确定单元303可以用于：

在一些实施例中，处理单元304可以用于：

确定所述地理位置是否处于预设区域内；

若是，则将当前的信息提醒方式调整为震动提醒。

在一些实施例中，处理单元304进一步可以用于：

在确定所述地理位置处于预设区域内之后，当检测到终端播放第一音频信号时，对所述第一音频信号进行降噪处理。

在一些实施例中，处理单元304可以用于：

根据所述位置覆盖范围生成路线指引信息；

根据所述路线指引信息对用户进行信息提示。

在一些实施例中，处理单元304可以用于：

参考图4，在一些实施例中，分析单元302可以包括：

提取子单元3021，用于对所述声音信息进行特征提取，得到声音特征；

识别子单元3022，用于根据所述声音特征对所述声音信息进行识别；

确定子单元3023，用于基于识别结果确定所述声音信息中包含的声音种类、声音种类数量、声源数量、声音特性参数；

生成子单元3024，用于至少根据所述声音种类、所述声音种类数量、声源数量、声音特性参数，生成所述分析结果。

由上可知，本申请实施例提供的基于声音分析的终端处理装置，通过采集当前场景下的声音信息，并对声音信息进行分析，得到分析结果。然后，基于分析结果确定当前场景的所属类型，并执行与当前场景的所属类型对应的操作指令。本方案通过智能识别当前的场景状态，执行相应服务的操作指令，提升了终端的智能性，为用户带来便利。

在本申请又一实施例中还提供一种终端，该终端可以是智能手机、平板电脑等终端设备。如图5所示，终端400包括处理器401和存储器402。其中，处理器401与存储器402电性连接。

处理器401是终端400的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或加载存储在存储器402内的应用，以及调用存储在存储器402内的数据，执行终端的各种功能和处理数据，从而对终端进行整体监控。

在本实施例中，终端400中的处理器401会按照如下的步骤，将一个或一个以上的应用的进程对应的指令加载到存储器402中，并由处理器401来运行存储在存储器402中的应用，从而实现各种功能：

采集当前场景下的声音信息；

对所述声音信息进行分析，得到分析结果；

基于所述分析结果确定当前场景的所属类型；

执行与当前场景的所属类型对应的操作指令。

在一些实施例中，在基于所述分析结果确定当前场景的所属类型时，处理器401还执行以下步骤：

在一些实施例中，在执行与当前场景的所属类型对应的操作指令时，处理器401还执行以下步骤：

确定所述地理位置是否处于预设区域内；

若是，则将当前的信息提醒方式调整为震动提醒。

在一些实施例中，在确定所述地理位置处于预设区域内之后，处理器401还执行以下步骤：

在一些实施例中，若当前场景的所属类型为危险场景，处理器401还执行以下步骤：

获取当前的环境图像信息；

根据所述位置覆盖范围生成路线指引信息；

根据所述路线指引信息对用户进行信息提示。

在一些实施例中，若当前场景的所属类型为安静场景，则当检测到待播放的第二音频信号时，处理器401还执行以下步骤：

调整所述第二音频信号的音量参数值至低于当音量参数值。

在一些实施例中，在对所述声音信息进行分析，得到分析结果时，处理器401还执行以下步骤：

对所述声音信息进行特征提取，得到声音特征；

根据所述声音特征对所述声音信息进行识别；

存储器402可用于存储应用和数据。存储器402存储的应用中包含有可在处理器中执行的指令。应用可以组成各种功能模块。处理器401通过运行存储在存储器402的应用，从而执行各种功能应用以及基于声音分析的终端处理。

在一些实施例中，如图6所示，终端400还包括：显示屏403、控制电路404、射频电路405、传声器406、传感器408以及电源409。其中，处理器401分别与显示屏403、控制电路404、射频电路405、传声器406、摄像头407、传感器408以及电源409电性连接。

显示屏403可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口，这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。

控制电路404与显示屏403电性连接，用于控制显示屏403显示信息。

射频电路405用于收发射频信号，以通过无线通信与终端或其他终端建立无线通讯，与服务器或其他终端之间收发信号。

传声器(即麦克风)406，可用于检测外界环境中的声音信号，并将声音信号转换为电信号的能量转换器件。其中，麦克风根据其换能原理可划分为电动麦克风和电容麦克风两种。

摄像头407可用于采集图像信息。其中，该摄像头可以是具有一个镜头的单摄像头，也可以具有两个或多个镜头。

传感器408用于采集外部环境信息。传感器408可以包括环境亮度传感器、加速度传感器、光传感器、运动传感器、以及其他传感器。

电源409用于给终端400的各个部件供电。在一些实施例中，电源409可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图6中未示出，终端400还可以包括扬声器、蓝牙模块等，在此不再赘述。

由上可知，本申请实施例提供的终端，通过采集当前场景下的声音信息，并对声音信息进行分析，得到分析结果。然后，基于分析结果确定当前场景的所属类型，并执行与当前场景的所属类型对应的操作指令。本方案通过智能识别当前的场景状态，执行相应服务的操作指令，提升了终端的智能性，为用户带来便利。

在一些实施例中，还提供了一种计算机可读存储介质，该存储介质中存储有多条指令，该指令适于由处理器加载以执行上述任一基于声音分析的终端处理方法。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，RandomAccess Memory)、磁盘或光盘等。

以上对本申请实施例所提供的基于声音分析的终端处理方法、装置、存储介质及终端进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种基于声音分析的终端处理方法，其特征在于，包括：

采集当前场景下的声音信息；

对所述声音信息进行分析，得到分析结果；

基于所述分析结果确定当前场景的所属类型；

执行与当前场景的所属类型对应的操作指令。

2.根据权利要求1所述的基于声音分析的终端处理方法，其特征在于，所述基于所述分析结果确定当前场景的所属类型，包括：

3.根据权利要求1所述的基于声音分析的终端处理方法，其特征在于，所述执行与当前场景的所属类型对应的操作指令，包括：

确定所述地理位置是否处于预设区域内；

若是，则将当前的信息提醒方式调整为震动提醒。

4.根据权利要求3所述的基于声音分析的终端处理方法，其特征在于，在确定所述地理位置处于预设区域内之后，还包括：

5.根据权利要求1所述的基于声音分析的终端处理方法，其特征在于，所述执行与当前场景的所属类型对应的操作指令，包括：

根据所述位置覆盖范围生成路线指引信息；

根据所述路线指引信息对用户进行信息提示。

6.根据权利要求1所述的基于声音分析的终端处理方法，其特征在于，所述执行与当前场景的所属类型对应的操作指令，包括：

7.根据权利要求1-6任一项所述的基于声音分析的终端处理方法，其特征在于，所述对所述声音信息进行分析，得到分析结果，包括：

对所述声音信息进行特征提取，得到声音特征；

根据所述声音特征对所述声音信息进行识别；

8.一种基于声音分析的终端处理装置，其特征在于，包括：

采集单元，用于采集当前场景下的声音信息；

分析单元，用于对所述声音信息进行分析，得到分析结果；

9.一种计算机可读存储介质，其特征在于，所述存储介质中存储有多条指令，所述指令适于由处理器加载以执行权利要求1-7任一项所述的基于声音分析的终端处理方法。

10.一种终端，其特征在于，包括处理器及存储器，所述处理器与所述存储器电性连接，所述存储器用于存储指令和数据；所述处理器用于执行权利要求1-7任一项所述的基于声音分析的终端处理方法。