[go: up one dir, main page]

RU2759310C1 - Method and system for bionic control of robotic devices - Google Patents

Method and system for bionic control of robotic devices Download PDF

Info

Publication number
RU2759310C1
RU2759310C1 RU2020127511A RU2020127511A RU2759310C1 RU 2759310 C1 RU2759310 C1 RU 2759310C1 RU 2020127511 A RU2020127511 A RU 2020127511A RU 2020127511 A RU2020127511 A RU 2020127511A RU 2759310 C1 RU2759310 C1 RU 2759310C1
Authority
RU
Russia
Prior art keywords
eeg
analysis
command
signal
formation
Prior art date
Application number
RU2020127511A
Other languages
Russian (ru)
Inventor
Андрей Николаевич Спиркин
Оксана Евгеньевна Безбородова
Олег Николаевич Бодин
Гульмира Куанышбаевна Бердибаева
Касымбек Адильбекович Ожикенов
Владислав Вадимович Шерстнев
Original Assignee
Оксана Евгеньевна Безбородова
Олег Николаевич Бодин
Андрей Николаевич Спиркин
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Оксана Евгеньевна Безбородова, Олег Николаевич Бодин, Андрей Николаевич Спиркин filed Critical Оксана Евгеньевна Безбородова
Priority to RU2020127511A priority Critical patent/RU2759310C1/en
Application granted granted Critical
Publication of RU2759310C1 publication Critical patent/RU2759310C1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61FFILTERS IMPLANTABLE INTO BLOOD VESSELS; PROSTHESES; DEVICES PROVIDING PATENCY TO, OR PREVENTING COLLAPSING OF, TUBULAR STRUCTURES OF THE BODY, e.g. STENTS; ORTHOPAEDIC, NURSING OR CONTRACEPTIVE DEVICES; FOMENTATION; TREATMENT OR PROTECTION OF EYES OR EARS; BANDAGES, DRESSINGS OR ABSORBENT PADS; FIRST-AID KITS
    • A61F4/00Methods or devices enabling patients or disabled persons to operate an apparatus or a device not forming part of the body

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Vascular Medicine (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

FIELD: robotics.
SUBSTANCE: invention relates to medicine, namely to methods of bionic control of robotic devices. The method performs the formation of a mental command, the formation of an electroencephalographic signal analysis channel, in which the formation of an EEG signal corresponding to a mental command is carried out, the registration of an EEG signal, the formation of a training sample of EEG signals, neural network training, neural network analysis of the registered EEG signal, the formation of a control command for a controlled robotic device and the execution of a command by a controlled robotic device. Additionally, a combined EEG analysis is carried out in the electroencephalographic signal analysis channel. Combined EEG analysis reveals EEG signs of a mental command in the frequency-time and amplitude-phase regions. The result of the combined EEG analysis is selected. When choosing the result of a combined EEG analysis, a final decision is made based on particular decisions obtained as a result of EEG analysis by different methods. A voice signal analysis channel is formed, in which a dictionary of voice commands is formed, acoustic vibrations are generated by a human voice apparatus, access to a controlled robotic device is provided using user voice authentication, a word is formed by converting an acoustic vibration into an electrical signal using a microphone, filtering based on the Hilbert-Huang transformation and word identification by comparison with words from the dictionary of voice commands is carried out.
EFFECT: increase in the reliability of recognition of the control command is achieved.
4 cl, 25 dwg

Description

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

Изобретение относится к медицинской технике и может быть использовано для удаленного управления контролируемыми робототизированными устройствами в условиях ограниченных физических возможностей оператора, также предназначено для реабилитации инвалидов, утративших двигательную активность.The invention relates to medical equipment and can be used for remote control of controlled robotic devices in conditions of limited physical capabilities of the operator, and is also intended for the rehabilitation of disabled people who have lost motor activity.

УРОВЕНЬ ТЕХНИКИLEVEL OF TECHNOLOGY

Известен способ управления экзрскелетом [1], заключающийся в регистрации двигательных намерений пользователя, основанных на измерении сигналов нейромышечной активности сохранившихся мышечных волокон с помощью поверхностных датчиков электромиографических сигналов, закрепляемых в местах расположения двигательных точек. Биоэлектрическое воздействие, передаваемое от центральной нервной системы к мышцам, отражается повышением амплитуды электромиографического сигнала в двигательных точках. Область двигательной точки является индивидуальной особенностью человека и характеризуется максимально возбудимым участком мышцы. Контроль биопотенциалов в местах расположения двигательных точек позволяет получать исходные сигналы для управления экзоскелетом.There is a known method of exroskeleton control [1], which consists in registering the user's motor intentions, based on measuring the neuromuscular activity signals of the preserved muscle fibers using surface sensors of electromyographic signals fixed at the location of motor points. The bioelectric effect transmitted from the central nervous system to the muscles is reflected by an increase in the amplitude of the electromyographic signal at motor points. The area of the motor point is an individual feature of a person and is characterized by the most excitable muscle area. The control of biopotentials at the locations of motor points allows one to obtain initial signals for controlling the exoskeleton.

Суть известных способов, основанных на анализе электромиографических сигналов, заключается в исследовании зарегистрированных биоэлектрических потенциалов, возникающих в скелетных мышцах человека, при возбуждении мышечных волокон.The essence of the known methods based on the analysis of electromyographic signals is to study the registered bioelectric potentials arising in human skeletal muscles upon excitation of muscle fibers.

Недостатком данного способа является невысокая точность распознавания двигательных намерений пользователя из-за сложности получения электромиографического сигнала об активности конкретной мышцы. Поэтому для распознавания различных движений по электромиографическим сигналам необходимо увеличивать количество электродных систем, накладываемых на мышцу, что приносит дискомфорт пользователю.The disadvantage of this method is the low accuracy of recognition of the user's motor intentions due to the difficulty of obtaining an electromyographic signal about the activity of a particular muscle. Therefore, in order to recognize various movements by electromyographic signals, it is necessary to increase the number of electrode systems applied to the muscle, which brings discomfort to the user.

Другим недостатком известного способа является трудность выявления двигательных точек, индивидуальных у каждого человека.Another disadvantage of the known method is the difficulty of identifying motor points, individual for each person.

Известен способ бионического управления техническим устройством [2], включающий формирование управляющего воздействия посредством регистрации электрического импеданса с мышц-антагонистов при выполнении движений.The known method of bionic control of a technical device [2], including the formation of a control action by registering the electrical impedance from the antagonist muscles when performing movements.

Недостатками данного способа являются недостаточная точность распознавания биоэлектрических сигналов из-за наличия перекрестных помех от соседних групп мышц, что ограничивает возможность оперативного управления исполнительными устройствами роботизированных механизмов.The disadvantages of this method are the insufficient accuracy of recognition of bioelectric signals due to the presence of cross-talk from neighboring muscle groups, which limits the possibility of operational control of the actuators of robotic mechanisms.

Наиболее близким к предлагаемому изобретению по своей технической сущности и достигаемому результату является способ классификации электроэнцефалографических (ЭЭГ) сигналов в интерфейсе мозг - компьютер [3], осуществляющий формирование мысленной команды, формирование канала анализа ЭЭГ сигнала, в котором осуществляют формирование ЭЭГ сигнала, соответствующего мысленной команде, регистрацию ЭЭГ сигнала, формирование обучающей выборки ЭЭГ сигналов, обучение нейронной сети, нейросетевой анализ зарегистрированного ЭЭГ сигнала, формирование команды и исполнение команды контролируемым роботизированным устройством.The closest to the proposed invention in terms of its technical essence and the achieved result is a method for classifying electroencephalographic (EEG) signals in the brain-computer interface [3], which forms a mental command, forms an EEG signal analysis channel, in which an EEG signal is formed corresponding to a mental command , registration of an EEG signal, formation of a training sample of EEG signals, training of a neural network, neural network analysis of a recorded EEG signal, formation of a command and execution of a command by a controlled robotic device.

Система, реализующая известный способ классификации ЭЭГ сигналов в интерфейсе мозг - компьютер, содержит последовательно соединенные энцефалограф, аналого-цифровой преобразователь, процессор компьютера, адаптер контролируемого роботизированного устройства и контролируемое роботизированное устройство, при этом электродная система энцефалографа размещена на голове пользователя.The system that implements the known method for classifying EEG signals in the brain-computer interface contains a serially connected encephalograph, an analog-to-digital converter, a computer processor, an adapter of a controlled robotic device and a controlled robotic device, while the electrode system of the encephalograph is placed on the user's head.

Как следует из описания, известный способ классификации ЭЭГ сигналов в интерфейсе мозг - компьютер представляет собой реализацию неинвазивного аппаратно-программного комплекса «мозг - компьютер - интерфейс» (Brain-Computer-Interface (BCI)), преобразующего электрическую активность мозга - импульсную и суммарную - в конкретное действие, в котором тело человека не принимает никакого участия. Посредством компьютера полностью парализованный человек может управлять контролируемым роботизтрованным устройством (например, инвалидной каляской [3]), устанавливать контакт, с окружающими, включаться активно в окружающую социальную среду и, возможно, выполнять определенные задания, заниматься полезной и интересной трудовой деятельностью.As follows from the description, the well-known method of classifying EEG signals in the brain-computer interface is an implementation of a non-invasive hardware-software complex "brain-computer-interface" (Brain-Computer-Interface (BCI)), which converts the electrical activity of the brain - impulse and total - in a specific action in which the human body does not take any part. By means of a computer, a completely paralyzed person can control a controlled robotic device (for example, a wheelchair [3]), establish contact with others, be actively involved in the surrounding social environment and, possibly, perform certain tasks, engage in useful and interesting work activities.

Недостатками BCI при неинвазивной регистрации ЭЭГ являются:The disadvantages of BCI in non-invasive EEG recording are:

- низкое пространственное разрешение. Для неинвазивной электроэнцифалограммы невозможно определить электрическую активность отдельных нейронов мозга, анализируется электрическая активность областей мозга, в которых большое количество нейронов проявляют синхронную активность. Для неинвазивной электроэнцифалограммы это составляет примерно 50 тысяч синхронно работающих нейронов [4, 5];- low spatial resolution. For a non-invasive electroencephalogram, it is impossible to determine the electrical activity of individual neurons in the brain; the electrical activity of brain regions in which a large number of neurons exhibit synchronous activity is analyzed. For a non-invasive electroencephalogram, this is about 50 thousand synchronously working neurons [4, 5];

- наличие шума и артефактов в ЭЭГ сигнале (параметры шума и сигналов артефактов превышают параметры сигналов электрической активности мозга). Шум представляет собой беспорядочные колебания различной физической природы, отличающиеся сложностью временной и спектральной структуры [6]. Под артефактом понимается процесс или образование, не свойственные изучаемому объекту в норме и возникающие обычно в ходе его исследования [7].- the presence of noise and artifacts in the EEG signal (the parameters of noise and artifact signals exceed the parameters of signals of electrical activity of the brain). Noise is random vibrations of various physical nature, characterized by the complexity of the temporal and spectral structure [6]. An artifact is understood as a process or formation that is not characteristic of the object under study in the norm and usually arises in the course of its research [7].

На фигуре 1 приведен алгоритм известного способа классификации электроэнцефалографических сигналов в интерфейсе мозг - компьютер.Figure 1 shows an algorithm for a known method for classifying electroencephalographic signals in the brain-computer interface.

На фигуре 2 приведена таблица кодирования классов мысленных движений пользователя в управляющие команды контролируемого роботизированного устройства.Figure 2 shows a table of coding classes of mental movements of the user in the control commands of the controlled robotic device.

На фигуре 3 приведена структурная схема системы, реализующей известный способ классификации электроэнцефалографических сигналов в интерфейсе мозг - компьютер.Figure 3 shows a block diagram of a system that implements a known method for classifying electroencephalographic signals in the brain-computer interface.

На фигуре 4 приведена электроэнцифалограмма с артефактами движения глаз [5].Figure 4 shows an electroencephalogram with eye movement artifacts [5].

На фигуре 5 приведены возможные физиологические артефакты при регистрации электроэнцифалограммы [4].Figure 5 shows possible physiological artifacts when registering an electroencephalogram [4].

Рассмотрим известный способ, алгоритм осуществления которого приведен на фигуре 1. Известно [4], что на поверхности головы пользователя BCI при неинвазивной регистрации электроэнцифалограммы можно увидеть осмысленный сигнал. Именно этот оцифрованный и отфильтрованный ЭЭГ сигнал в известном способе подвергается нейросетевому анализу. Заранее, согласно таблице кодирования классов мысленных движений в управляющие команды (см. фигуру 2), обученная нейронная многослойная сеть (НМС) анализирует локальные положительные максимумы амплитуды ЭЭГ сигналов от всех отведений. При этом формирование входного вектора осуществляется следующим образом: если значения двух соседних положительных максимумов отличаются менее чем на порог психофизиологического восприятия человека, то их считают равными и второй максимум исключают из последующего анализа, одновременно с выделением первого положительного t максимума. Затем от опорного отведения фиксируют значения амплитуд ЭЭГ сигналов по всем остальным отведениям, в результате получают набор амплитуд, представляющих собой первый входной вектор.Let us consider the known method, the implementation algorithm of which is shown in figure 1. It is known [4] that a meaningful signal can be seen on the surface of the BCI user's head during non-invasive recording of an electroencephalogram. It is this digitized and filtered EEG signal that is subjected to neural network analysis in the known method. In advance, according to the table of coding classes of mental movements in control commands (see figure 2), the trained neural multilayer network (NMS) analyzes the local positive maxima of the amplitude of the EEG signals from all leads. In this case, the formation of the input vector is carried out as follows: if the values of two neighboring positive maxima differ by less than the threshold of psychophysiological perception of a person, then they are considered equal and the second maximum is excluded from the subsequent analysis, simultaneously with the allocation of the first positive t maximum. Then, from the reference lead, the values of the amplitudes of the EEG signals are recorded for all other leads, as a result, a set of amplitudes is obtained, which is the first input vector.

Процедуру формирования входных векторов повторяют для каждого последующего положительного максимума опорного отведения и для каждого отдельного отведения, каждый раз принимаемого как опорное отведение, до тех пор, пока каждое из отведений не выполнит функцию опорного, в результате получают многомерный массив входных векторов от конкретного пользователя.The procedure for generating the input vectors is repeated for each subsequent positive maximum of the reference lead and for each individual lead, each time taken as a reference lead, until each of the leads fulfills the function of the reference lead, resulting in a multidimensional array of input vectors from a specific user.

Выходным массивом НМС является массив, сформированный при обучении НМС, указателей классов мысленных движений, выполняемых пользователем.The output array of the NMS is an array formed during the training of the NMS of indicators of the classes of mental movements performed by the user.

В известном способе согласно алгоритму (см. фигуру 1) при идентификации мысленного движения массив входных векторов подают на НМС для вычисления выходного вектора, по которому определяют класс мысленного движения пользователя (см. фигуру 2). Структурная схема системы, реализующей известный способ классификации ЭЭГ сигналов в интерфейсе мозг - компьютер, приведена на фигуре 3.In the known method according to the algorithm (see figure 1), when identifying the mental movement, an array of input vectors is fed to the NMS to calculate the output vector, which determines the class of the user's mental movement (see figure 2). The block diagram of the system that implements the known method of classifying EEG signals in the brain-computer interface is shown in figure 3.

В описании изобретения авторы пишут [3]: «Задачей, решаемой в заявляемом изобретении, является уменьшение времени идентификации мысленной команды пользователя в системе BCI до 2 секунд при повышении точности идентификации мысленной команды пользователя до 90% за счет использования неизвестных ранее специфических информационных компонентов общего пространственно-временного паттерна и обработки по адаптированному для решения данной задачи алгоритму классификации выделенных специфических фрагментов ЭЭГ сигнала НМС.In the description of the invention, the authors write [3]: “The task solved in the claimed invention is to reduce the identification time of the user's mental command in the BCI system to 2 seconds while increasing the identification accuracy of the user's mental command to 90% due to the use of previously unknown specific information components of the general spatial -temporal pattern and processing according to the classification algorithm of the selected specific fragments of the EEG signal of the NMS adapted for solving this problem.

Указанный технический результат достигается тем, что способ классификации ЭЭГ сигналов в интерфейсе мозг - компьютер заключается в тестировании пользователя, выделении специфических информационных компонентов из общего пространственно-временного паттерна, создании выборки оцифрованных фрагментов ЭЭГ сигнала от множества отведений для обучения классификатора, вычислении весовых коэффициентов и классификации фрагментов ЭЭГ сигнала для идентификации классов мысленной команды пользователя, соответствующих управляющим сигналам».The specified technical result is achieved by the fact that the method for classifying EEG signals in the brain-computer interface consists in testing the user, separating specific information components from the general spatio-temporal pattern, creating a sample of digitized fragments of the EEG signal from multiple leads for training the classifier, calculating weight coefficients and classifying fragments of the EEG signal to identify the classes of the user's mental command corresponding to the control signals ”.

При этом «значения двух соседних положительных локальных максимумов амплитуд ЭЭГ сигналов отличаются не менее чем на 5%».In this case, "the values of two adjacent positive local maxima of the EEG signal amplitudes differ by at least 5%."

Как следует из приведенной цитаты, в известном способе осуществляется ЭЭГ анализ вызванных потенциалов действия только в амплитудно-временной области. Для полностью парализованных пациентов, по мнению авторов предлагаемого изобретения, этого недостаточно и необходимо использовать ЭЭГ анализ в частотно-временной (исследование спектра ЭЭГ) и фазо-временной (исследование аттрактора ЭЭГ) областях.As follows from the above quotation, in the known method, the EEG analysis of evoked action potentials is carried out only in the amplitude-time domain. For completely paralyzed patients, according to the authors of the present invention, this is not enough and it is necessary to use EEG analysis in the time-frequency (study of the EEG spectrum) and phase-time (study of the EEG attractor) areas.

Действительно, сложная сигнально-помеховая обстановка при реализации известного способа не позволит полностью парализованному пациенту осуществлять управление контролируемым роботизированным устройством, например, инвалидной коляской, как утверждают авторы известного способа. Так как пользователя инвалидной коляской невозможно заставить сидеть неподвижно, что является обязательным условием успешной неинвазивной регистрации ЭЭГ [4, 5], то в условиях сложной сигнально-помеховой обстановки, по мнению авторов предлагаемого изобретения, затруднительно выделение «специфических информационных компонентов из общего пространственно-временного паттерна» (см. фигуры 4 и 5), отличающихся «не менее чем на 5%» только в амплитудно-временной области.Indeed, the complex signal-interference environment during the implementation of the known method will not allow a completely paralyzed patient to control a controlled robotic device, for example, a wheelchair, as the authors of the known method claim. Since a wheelchair user cannot be made to sit motionless, which is a prerequisite for successful non-invasive EEG recording [4, 5], in a complex signal-interference environment, according to the authors of the present invention, it is difficult to isolate “specific information components from the general space-time patterns "(see Figures 4 and 5), differing" by at least 5% "only in the amplitude-time domain.

Таким образом, недостатком известного способа классификации ЭЭГ сигналов в интерфейсе мозг - компьютер является низкая достоверность распознавания мысленной команды, а также отсутствие резервирования каналов сбора информации, незащищенного доступа пользования, что не позволяет в полной мере решать поставленные задачи в условиях эксплуатации контролируемого роботизированного устройства (инвалидной коляской).Thus, the disadvantage of the known method for classifying EEG signals in the brain - computer interface is the low reliability of recognition of the mental command, as well as the lack of redundancy of information collection channels, unprotected access to use, which does not allow to fully solve the assigned tasks in the operating conditions of a controlled robotic device (disabled person). stroller).

Действительно, как следует из вышеприведенного описания использования известного способа получения управляющей команды для контролируемого роботизированного устройства, возникает ряд сложных обстоятельств. Классификация мысленных команд в прототипе направлена на определение управляющей команды путем анализа ЭЭГ сигнала, причем, только в амплитудно-временной области представления ЭЭГ сигнала. Для получения не зашумленного информативного ЭЭГ сигнала возникает потребность использования влажных поверхностных электродов или использования инвазивного метода, регистрации ЭЭГ сигнала. Все это, снижая зашумленность ЭЭГ сигнала, не устраняет проблему артефактов и может привести к ухудшению здоровья пользователя, и привести к ряду осложнений, таких, как попадание инфекции. Следует также принимать во внимание эффект поляризации электродов, высокий импеданс кожи, надежность крепления электродов и зарастание инвазивных электродов соединительной тканью. Необходимо отметить отсутствие в известном способе канала резервирования сбора информации, что снижает достоверность получения управляющей команды. Также отсутствие в известной системе средств обеспечения безопасного доступа к контролируемому роботизированному устройству (инвалидной коляске) может привести к несанкционированному доступу и, как следствие, причинению вреда пользователю.Indeed, as follows from the above description of the use of the known method of obtaining a control command for a controlled robotic device, a number of difficult circumstances arise. The classification of mental commands in the prototype is aimed at determining the control command by analyzing the EEG signal, moreover, only in the amplitude-time domain of the EEG signal presentation. To obtain a non-noisy informative EEG signal, it becomes necessary to use wet surface electrodes or to use an invasive method, recording an EEG signal. All this, while reducing the noise level of the EEG signal, does not eliminate the problem of artifacts and can lead to a deterioration in the user's health, and lead to a number of complications, such as infection. Consideration should also be given to the effect of electrode polarization, high skin impedance, reliability of electrode attachment, and connective tissue overgrowth of invasive electrodes. It should be noted that the known method does not contain a channel for reservation of information collection, which reduces the reliability of receiving a control command. Also, the absence in the known system of means of ensuring safe access to the controlled robotic device (wheelchair) can lead to unauthorized access and, as a result, harm to the user.

РАСКРЫТИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯDISCLOSURE OF THE INVENTION

Изобретение направлено на повышение достоверности распознавания и надежности функционирования при формировании управляющей команды для контролируемого роботизированного устройства путем расширения области представления исходной информации за счет анализа характерных особенностей различных по своей природе информационных параметров ЭЭГ сигнала и дублирования канала получения исходной информации при формировании управляющей команды для контролируемого роботизированного устройства.The invention is aimed at increasing the reliability of recognition and reliability of functioning when generating a control command for a controlled robotic device by expanding the field of presentation of initial information by analyzing the characteristic features of information parameters of an EEG signal that are different in nature and duplicating the channel for obtaining initial information when generating a control command for a controlled robotic device ...

Для этого в известном способе, осуществляющем формирование мысленной команды, формирование канала анализа электроэнцефалографических сигналов, в котором осуществляют формирование сигнала ЭЭГ, соответствующего мысленной команде, регистрацию сигнала ЭЭГ, формирование обучающей выборки сигналов ЭЭГ, обучение нейронной сети, нейросетевой анализ зарегистрированного сигнала ЭЭГ, формирование команды и исполнение команды контролируемым робототизированным устройством, дополнительно осуществляется:For this, in the known method, which forms a mental command, the formation of an analysis channel of electroencephalographic signals, in which the formation of an EEG signal corresponding to a mental command, registration of an EEG signal, formation of a training sample of EEG signals, training of a neural network, neural network analysis of a registered EEG signal, formation of a team is carried out and execution of the command by the controlled robotic device, additionally carried out:

- комбинированный анализ ЭЭГ в канале анализа ЭЭГ сигналов, выбор результата комбинированного анализа ЭЭГ сигнала, при комбинированном анализе ЭЭГ осуществляют выявление ЭЭГ признаков мысленной команды в частотно-временной и амплитудно-фазовой областях;- combined analysis of EEG in the channel for analysis of EEG signals, selection of the result of combined analysis of the EEG signal; in the combined analysis of EEG, EEG identification of the signs of a mental command in the time-frequency and amplitude-phase regions is carried out;

- формирование канала анализа голосового сигнала, в котором осуществляется:- formation of a voice signal analysis channel, in which:

- формирование словаря голосовых команд;- formation of a dictionary of voice commands;

- генерация акустических колебаний голосовым аппаратом человека;- generation of acoustic vibrations by the human vocal apparatus;

- обеспечение доступа пользования контролируемым роботизированным устройством при помощи аутентификации голоса пользователя;- providing access to the controlled robotic device using the authentication of the user's voice;

- формирование слова путем:- word formation by:

- преобразования акустического колебания в электрический сигнал с помощью микрофона;- converting acoustic vibrations into an electrical signal using a microphone;

- фильтрации на основании преобразования Гильберта-Хуанга;- filtering based on the Hilbert-Huang transformation;

- идентификации слова путем сравнения со словами из словаря голосовых команд.- word identification by comparison with words from the voice command dictionary.

При этом анализ ЭЭГ в частотно-временной области осуществляется путем определения частотно-временных параметров ЭЭГ, определения ЭЭГ признаков мысленной команды в частотно-временной области, сравнения частотно-временных параметров ЭЭГ с признаками мысленной команды в частотно-временной области, выдаче заключения «Наличие признаков мысленной команды» в случае совпадения при сравнении и выдаче заключения «Признаков мысленной команды не обнаружено» в случае несовпадения при сравнении.In this case, the analysis of the EEG in the time-frequency domain is carried out by determining the time-frequency parameters of the EEG, determining the EEG signs of a mental command in the time-frequency domain, comparing the time-frequency parameters of the EEG with the signs of a mental command in the time-frequency domain, issuing the conclusion “The presence of signs mental command "in case of coincidence when comparing and issuing a conclusion" Signs of a mental command were not found "in case of non-coincidence when comparing.

При этом анализ ЭЭГ в амплитудно-фазовой области осуществляется путем определения амплитудно-фазовых параметров ЭЭГ, определения ЭЭГ признаков мысленной команды в амплитудно-фазовой области, сравнения амплитудно-фазовых параметров ЭЭГ с ЭЭГ признаками мысленной команды в амплитудно-фазовой области, выдаче заключения «Наличие признаков мысленной команды» в случае совпадения результата сравнения и выдаче заключения «Признаков мысленной команды не обнаружено» в случае несовпадения результата сравнения.In this case, the analysis of the EEG in the amplitude-phase region is carried out by determining the amplitude-phase parameters of the EEG, determining the EEG signs of a mental command in the amplitude-phase region, comparing the amplitude-phase parameters of the EEG with the EEG signs of a mental command in the amplitude-phase region, issuing the conclusion “Availability signs of a mental command "in case of a coincidence of the comparison result and the issuance of a conclusion" No signs of a mental command were found "in case of a mismatch of the comparison result.

Система, реализующая способ, содержит последовательно соединенные энцефалограф, аналого-цифровой преобразователь, процессор компьютера, адаптер контролируемого роботизированного устройства и контролируемое роботизированное устройство, при этом электродная система энцефалографа размещена на голове пользователя, дополнительно содержит последовательно соединенные микрофон и звуковую карту компьютера, соединенную со вторым входом процессора компьютера.The system implementing the method contains a serially connected encephalograph, an analog-to-digital converter, a computer processor, an adapter of a controlled robotic device and a controlled robotic device, while the electrode system of the encephalograph is placed on the user's head, additionally contains a serially connected microphone and a computer sound card connected to the second the input of the computer processor.

Суть предлагаемого изобретения заключается в повышении надежности функционирования способа классификации ЭЭГ сигналов в интерфейсе мозг - компьютер путем повышения достоверности распознавания мысленной команды» (МК), дублирования выполнения МК системой голосового управления и оснащения системы бионического управления средствами обеспечения безопасного доступа к использованию контролируемым роботизированным устройством (КРУ), например, инвалидной коляской.The essence of the proposed invention is to increase the reliability of the functioning of the method for classifying EEG signals in the brain-computer interface by increasing the reliability of recognition of a mental command "(MC), duplicating the execution of the MC by a voice control system and equipping the bionic control system with means of ensuring safe access to the use of a controlled robotic device (KRU ) such as a wheelchair.

Введенные действия с их связями проявляют новые свойства, которые позволяют повысить достоверность распознавания МК и расширить функциональные возможности способа обработки ЭЭГ сигнала. Действительно, согласно ЭЭГ сигналу распознавание МК характеризуется информационными параметрами (ИП) ЭЭГ, поэтому выбор метода анализа ЭЭГ обусловлен анализируемыми ИП ЭЭГ. Невозможно использовать для анализа какого-либо ИП ЭЭГ метод, не предназначенный для обработки этого ИП. Методы анализа ЭЭГ основаны на методах обработки информации и предназначены для извлечения соответствующих данных из ИП ЭЭГ. Относительно ИП ЭЭГ можно сказать, что они «зашифрованы» в следующих составляющих ЭЭГ: временной, частотной, фазовой. Несомненно, что методы анализа ЭЭГ сигналов должны содержать алгоритмы преобразования информации в этих областях представления сигнала ЭЭГ.The introduced actions with their connections show new properties that make it possible to increase the reliability of MC recognition and expand the functionality of the method for processing the EEG signal. Indeed, according to the EEG signal, MC recognition is characterized by EEG information parameters (IP), therefore the choice of the EEG analysis method is determined by the analyzed EEG PI. It is impossible to use for the analysis of any EEG PI a method not intended for processing this PI. EEG analysis methods are based on information processing methods and are designed to extract relevant data from the EEG PI. Regarding IP EEG, we can say that they are "encrypted" in the following EEG components: time, frequency, phase. Undoubtedly, methods for analyzing EEG signals should contain algorithms for converting information in these areas of EEG signal presentation.

Предлагаемый авторами подход аналогичен использованию медицинского консилиума: конечное решение принимается на основе частных решений независимых экспертов (алгоритмов). При этом формируется коллективное решение на основе «интеграции» частных решений.The approach proposed by the authors is similar to the use of a medical consultation: the final decision is made on the basis of private decisions of independent experts (algorithms). At the same time, a collective solution is formed based on the "integration" of private solutions.

Процесс определения МК формально можно представить в виде системы целевых функций:The process of determining the MC can formally be represented in the form of a system of objective functions:

Figure 00000001
Figure 00000001

где Р(Н*|Н) - условная вероятность события Н*, вычисленная в предположении, что событие Н произошло, Н0 - гипотеза об отсутствии МК, Н1 - гипотеза о наличии МК,

Figure 00000002
- решение об отсутствии МК,
Figure 00000003
- решение о наличии МК.where Р (Н * | Н) is the conditional probability of the event Н * , calculated under the assumption that the event Н has occurred, Н 0 is the hypothesis of the absence of MC, Н 1 is the hypothesis of the presence of MC,
Figure 00000002
- the decision on the absence of MK,
Figure 00000003
- decision on the availability of MK.

По мнению авторов, использование разных методов анализа ИП ЭЭГ сигналов дает более полное представление о наличии МК пользователя КРУ, удовлетворяет критерию (1) и повышает вероятность (Р) правильного выявления наличия МК у пользователя КРУ.According to the authors, the use of different methods for analyzing IP EEG signals gives a more complete picture of the presence of an MC of a switchgear user, satisfies criterion (1) and increases the probability (P) of correctly detecting the presence of an MC in a switchgear user.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF DRAWINGS

На фигуре 6 приведен алгоритм предлагаемого способа бионического управления роботизированными устройствами.Figure 6 shows an algorithm for the proposed method for bionic control of robotic devices.

На фигуре 7 приведены типичные вейвлет-спектрограммы электроэнцефалограммы здорового человека.Figure 7 shows typical wavelet spectrograms of an electroencephalogram of a healthy person.

На фигуре 8 приведены типичные аттракторы электроэнцефалограммы здорового человека.Figure 8 shows typical attractors of an electroencephalogram of a healthy person.

На фигуре 9 приведен алгоритм комбинированного анализа ЭЭГ сигнала.Figure 9 shows the algorithm for the combined analysis of the EEG signal.

На фигуре 10 приведен алгоритм метода «Частотно-временной анализ ЭЭГ сигнала» предлагаемого способа бионического управления роботизированными устройствами.The figure 10 shows the algorithm of the method "Time-frequency analysis of the EEG signal" of the proposed method of bionic control of robotic devices.

На фигуре 11 приведена схема выбора результата комбинированного анализа ЭЭГFigure 11 shows a diagram of the choice of the result of the combined EEG analysis

На фигуре 12 приведено изображение голосового аппарата человека.Figure 12 shows an image of the human vocal apparatus.

На фигуре 13 приведена схема генерации акустического сигнала.Figure 13 shows a circuit for generating an acoustic signal.

На фигуре 14 приведена структурная схема системы, реализующей предлагаемый способ бионического управления роботизированными устройствами.Figure 14 shows a block diagram of a system that implements the proposed method for bionic control of robotic devices.

На фигуре 15 приведен алгоритм взаимодействия аппаратного и программного обеспечения канала анализа голосового сигнала при распознавании слова.Figure 15 shows an algorithm for the interaction of hardware and software channel analysis of a voice signal in word recognition.

На фигуре 16 приведены функциональные возможности современных голосовых помощников.Figure 16 shows the functionality of modern voice assistants.

На фигуре 17 приведен алгоритм обработки голосового сигнала предлагаемого способа бионического управления роботизированными устройствами.Figure 17 shows an algorithm for processing a voice signal of the proposed method for bionic control of robotic devices.

На фигуре 18 приведен алгоритм обработки голосового сигнала предлагаемого способа бионического управления роботизированными устройствами.Figure 18 shows an algorithm for processing a voice signal of the proposed method for bionic control of robotic devices.

На фигуре 19 приведен алгоритм преобразования Гильберта-Хуанга.Figure 19 shows the Hilbert-Huang transform algorithm.

На фигуре 20 приведено выделение огибающей голосового сигнала.Figure 20 shows the extraction of the envelope of the voice signal.

На фигуре 21 приведен результат фильтрации голосового сигнала с помощью преобразования Гильберта-Хуанга.Figure 21 shows the result of filtering a voice signal using the Hilbert-Huang transform.

На фигуре 22 приведен алгоритм идентификация речевой команды.Figure 22 shows an algorithm for identifying a voice command.

На фигуре 23 приведено представление декомпозиции голосового сигнала.Figure 23 shows a decomposition representation of a voice signal.

На фигуре 24 приведена графическая интерпретация формирования набора эмпирических мод.Figure 24 shows a graphical interpretation of the formation of a set of empirical modes.

На фигуре 25 приведен результат определения расположения речевой команды в голосовом сигнале.Figure 25 shows the result of determining the location of the voice command in the voice signal.

Предлагаемый способ основан на совместном использовании комплексного анализа ЭЭГ сигнала и анализе голосового сигнала, как показано на фигуре 6.The proposed method is based on the combined use of a complex analysis of the EEG signal and the analysis of the voice signal, as shown in figure 6.

По мнению авторов, предлагаемый подход к обработке ИП ЭЭГ на основе использования разных методов анализа ЭЭГ позволяет повысить вероятность (Р) правильного распознавания МК у полностью парализованного пользователя КРУ по сравнению с методом анализа лишь одного из ИП ЭЭГ. Другими словами, повысить чувствительность анализа ЭЭГ за счет извлечения дополнительной информации.According to the authors, the proposed approach to processing EEG IP based on the use of different methods of EEG analysis makes it possible to increase the probability (P) of correct MC recognition in a completely paralyzed switchgear user in comparison with the method of analysis of only one of the EEG IP. In other words, to increase the sensitivity of the EEG analysis by extracting additional information.

Известно [8, 9], что использование частотно-временного анализа (ЧВА) и амплитудно-фазового анализа (АФА) ЭЭГ сигналов позволяет получить больший объем достоверной информации о биопотенциале мозга, так как основные стохастические функции демонстрируют непрерывные изменения. Генерация биопотенциалов мозга дает явно выраженную закономерность именно в рамках частотных и фазовых характеристик (аттракторов) и позволяет не только регистрировать мысленную активность человека, но и диагностировать различные заболевания (см. фигуры 7 и 8).It is known [8, 9] that the use of time-frequency analysis (PTA) and amplitude-phase analysis (AFA) of EEG signals allows obtaining a larger amount of reliable information about the biopotential of the brain, since the main stochastic functions demonstrate continuous changes. The generation of brain biopotentials gives a clearly pronounced pattern precisely within the framework of frequency and phase characteristics (attractors) and allows not only recording a person's mental activity, but also diagnosing various diseases (see Figures 7 and 8).

Рассмотрим введенные действия.Let's consider the introduced actions.

Комбинированный анализ ЭЭГ. Это действие включает следующие методы анализа (см. фигуру 9):Combined EEG analysis. This action includes the following analysis methods (see Figure 9):

- частотно-временной анализ ЭЭГ, осуществляющий преобразование дискретных отчетов выделенного пространственно-временного паттерна в частотно-временные параметры ЭЭГ и их сравнение с шаблонными значениями. При этом осуществляется определение частотно-временных параметров ЭЭГ, определение ЭЭГ признаков МК в частотно-временной области, сравнение частотно-временных параметров ЭЭГ с ЭЭГ признаками МК в частотно-временной области, выдача заключения «Наличие мысленной команды» в случае совпадения при сравнении и выдача заключения «Признаков мысленной команды не обнаружено» в случае несовпадения при сравнении;- time-frequency EEG analysis, which converts discrete reports of the selected space-time pattern into time-frequency EEG parameters and their comparison with template values. In this case, the determination of the time-frequency parameters of the EEG, the determination of the EEG signs of MC in the time-frequency domain, comparison of the frequency-time parameters of the EEG with the EEG signs of MC in the time-frequency domain, issuing the conclusion "Presence of a mental command" in case of coincidence in the comparison and issuing the conclusion "No signs of a mental command were found" in the case of a discrepancy in the comparison;

- амплитудно-фазовый анализ ЭЭГ, осуществляющий преобразование дискретных отчетов выделенного пространственно-временного паттерна в амплитудно-фазовые параметры ЭЭГ и их сравнение с шаблонными значениями. При этом осуществляется определение амплитудно-фазовых параметров ЭЭГ, определение ЭЭГ признаков МК в амплитудно-фазовой области, сравнение амплитудно-фазовых параметров ЭЭГ с ЭЭГ признаками МК в амплитудно-фазовой области, выдача заключения «Наличие мысленной команды» в случае совпадения результата сравнения и выдача заключения «Признаков мысленной команды не обнаружено» в случае несовпадения результата сравнения.- amplitude-phase EEG analysis, which converts discrete reports of the selected spatio-temporal pattern into amplitude-phase EEG parameters and their comparison with template values. In this case, the determination of the amplitude-phase parameters of the EEG is carried out, the determination of the EEG signs of MC in the amplitude-phase area, the comparison of the amplitude-phase parameters of the EEG with the EEG signs of the MC in the amplitude-phase area, the issuance of the conclusion "Presence of a mental command" in the case of the coincidence of the comparison result and the issuance the conclusion "No signs of a mental command were found" in the case of a mismatch in the comparison result.

Выбор результата комбинированного анализа ЭЭГ. В результате данного действия принимается окончательное решение на основании частных решений, полученных в результате анализа ЭЭГ разными методами. Известны различные подходы к интеграции частных решений, например, мажоритарный принцип (или принцип голосования) [10]. Согласно мажоритарному принципу окончательное решение будет соответствовать решению, принятому большинством экспертов (алгоритмов): (F=A#D#C). Решения экспертов (алгоритмов) независимы и состоят из двух суждений (см. фигуру 10):Selection of the result of the combined EEG analysis. As a result of this action, a final decision is made based on particular decisions obtained as a result of EEG analysis by different methods. There are various approaches to the integration of particular solutions, for example, the majority principle (or the principle of voting) [10]. According to the majority principle, the final decision will correspond to the decision made by the majority of experts (algorithms): (F = A # D # C). The decisions of experts (algorithms) are independent and consist of two judgments (see figure 10):

1. Наличие МК;1. Availability of MK;

2. Признаков МК не обнаружено.2. No signs of MC were found.

Поскольку возможных вариантов всего два, а окончательное решение выбирается из четырех методов анализа ЭЭГ по принципу большинства, то функция выбора результата комбинированного анализа ЭЭГ представляется в виде функции голосования «3 из 4» (см. фигуру 11):Since there are only two possible options, and the final decision is selected from four methods of EEG analysis according to the majority principle, the function of choosing the result of the combined EEG analysis is represented as a voting function "3 out of 4" (see figure 11):

Figure 00000004
Figure 00000004

где R}, R2, R3, R4 - результаты работы каждого из методов комбинированного анализа ЭЭГ, принимающие значение «1», если соответствующий метод выявил у пользователя КРУ наличия МК, и значение «0», если соответствующий метод не выявил у пользователя КРУ наличия МК.where R } , R 2 , R 3 , R 4 are the results of the work of each of the methods of combined EEG analysis, which take the value "1" if the corresponding method revealed the presence of MC in the switchgear user, and the value "0" if the corresponding method did not reveal user of the switchgear of the presence of MK.

Предполагается, что для каждого метода анализа ЭЭГ известна вероятность выдачи безошибочного результата или вероятность (Р) правильного выявления наличия МК у полностью парализованного пользователя КРУ, то есть чувствительность метода распознавания МК. Тогда результат на каждом элементе конъюнкции Qi (i=1, 2, …, 4) (см. выражение 2 и фигуры 9 и 11) будет безошибочен, если безошибочны все данные, подаваемые на элемент конъюнкции.It is assumed that for each method of EEG analysis, the probability of an error-free result or the probability (P) of the correct detection of the presence of MC in a completely paralyzed user of the switchgear is known, that is, the sensitivity of the MC recognition method. Then the result at each element of the conjunction Q i (i = 1, 2, ..., 4) (see expression 2 and figures 9 and 11) will be error-free if all data supplied to the conjunction element are error-free.

При этом вероятность выдачи безошибочного результата элементом конъюнкции будет рассчитываться по формуле вероятности одновременного возникновения трех независимых событий:In this case, the probability of issuing an error-free result by the conjunction element will be calculated using the formula for the probability of the simultaneous occurrence of three independent events:

Figure 00000005
Figure 00000005

где P(Q) - вероятность выдачи безошибочного результата элементом конъюнкции, P(RN1) - вероятность выдачи безошибочного результата одним из методов анализа ЭЭГ, подаваемым на первый вход элемента конъюнкции, P(RN2) - вероятность выдачи безошибочного результата одним из методов анализа ЭЭГ, подаваемым на второй вход элемента конъюнкции, P(RN3) - вероятность выдачи безошибочного, результата одним из методов анализа ЭЭГ, подаваемым на третий вход элемента конъюнкции.where P (Q) is the probability of issuing an error-free result by a conjunction element, P (R N1 ) is the probability of issuing an error-free result by one of the EEG analysis methods fed to the first input of a conjunction element, P (R N2 ) is the probability of issuing an error-free result by one of the analysis methods EEG fed to the second input of the conjunction element, P (R N3 ) is the probability of an error-free result being produced by one of the EEG analysis methods fed to the third input of the conjunction element.

Сигналы со всех элементов конъюнкции поступают на элемент дизъюнкции (см. фигуру 11). Вероятность выдачи безошибочного результата элементом дизъюнкции определяется по формуле вероятности появления хотя бы одного из четырех независимых событий:Signals from all conjunction elements go to the disjunction element (see figure 11). The probability of issuing an error-free result by a disjunction element is determined by the formula for the probability of occurrence of at least one of four independent events:

Figure 00000006
Figure 00000006

где P(R) - вероятность выдачи безошибочного результата элементом дизъюнкции (итогового результата), P(Qi) - вероятность выдачи безошибочного результата i-м элементом конъюнкции.where P (R) is the probability of issuing an error-free result by the disjunction element (final result), P (Q i ) is the probability of issuing an error-free result by the i-th element of the conjunction.

Покажем, что вероятность выдачи безошибочного результата при комбинированном анализе ЭЭГ выше вероятности выдачи безошибочного результата любого, отдельно взятого, метода, участвующего в комбинированном анализе ЭЭГ. По формуле (4) рассчитаем вероятность выдачи системой безошибочного результата при комплексном анализе, когда вероятность безошибочного результата по методу амплитудно-временного анализа (ABA) составляет 0,9, ЧВА и АФА составляет как минимум 0,75:Let us show that the probability of an error-free result in a combined EEG analysis is higher than the probability of an error-free result of any, separately taken, method involved in a combined EEG analysis. Using formula (4), we calculate the probability of the system producing an error-free result in complex analysis, when the probability of an error-free result using the amplitude-time analysis (ABA) method is 0.9, and the NDA and AFA is at least 0.75:

Р(R)=1-(1-0,9)(1-0,75)(1-0,75)=1-0,00625=0,994.P (R) = 1- (1-0.9) (1-0.75) (1-0.75) = 1-0.00625 = 0.994.

Полученное значение выдачи безошибочного результата больше значения любого метода, используемого отдельно.The resulting error-free result is greater than any method used alone.

Таким образом, в предлагаемом способе анализа ЭЭГ для распознавания МК использование разных методов анализа ЭЭГ обеспечивает следующее выполнение условий:Thus, in the proposed method of EEG analysis for MK recognition, the use of different methods of EEG analysis provides the following conditions:

Figure 00000007
Figure 00000007

где mахпред, minпpeд - значения максимума и минимума целевой функции предлагаемого способа обработки ЭЭГ для выявления наличия МК, mахизв, minизв - значения максимума и минимума целевой функции известного способа обработки ЭЭГ для выявления наличия МК.where max pre , min pre are the values of the maximum and minimum of the objective function of the proposed method of EEG processing to detect the presence of MC, max iz , min iz are the values of the maximum and minimum of the objective function of the known method of EEG processing to detect the presence of MC.

Технический результат [27] от реализации комбинированного метода анализа ЭЭГ заключается в повышении достоверности распознавания мысленной команды у полностью парализованного пользователя КРУ за счет преобразования материального объекта - ЭЭГ сигнала - и анализа его особенностей в частотно-временной и амплитудно-фазовой областях.The technical result [27] from the implementation of the combined method of EEG analysis is to increase the reliability of recognition of a mental command in a completely paralyzed switchgear user by transforming a material object - an EEG signal - and analyzing its features in the time-frequency and amplitude-phase regions.

Анализ голосового сигнала. Как следует из фигуры 6, помимо реализации комбинированного метода анализа ЭЭГ в канале анализа электроэнцефалографических сигналов, алгоритм предлагаемого способа бионического управления роботизированными устройствами содержит канал анализа голосового сигнала. Введение авторами предлагаемого изобретения канала анализа голосового сигнала обусловлено следующими соображениями: согласно статистике заболеваний опорно-двигательного аппарата [11], в основном страдают люди трудоспособного возраста, которые могут вести активный образ жизни. При этом доля заболеваний опорно-двигательного аппарата постоянно увеличивается на 30% каждые 10 лет. Среди пациентов с нарушением опорно-двигательного аппарата можно выделить примерно 6% людей, у которых имеются проблемы с речевым аппаратом, и 94% людей, у которых отсутствуют нарушения речевого аппарата [11].Analysis of the voice signal. As follows from figure 6, in addition to the implementation of the combined method of EEG analysis in the channel for analyzing electroencephalographic signals, the algorithm of the proposed method for bionic control of robotic devices contains a channel for analyzing the voice signal. The introduction by the authors of the present invention of the channel for the analysis of the voice signal is due to the following considerations: according to the statistics of diseases of the musculoskeletal system [11], mainly people of working age who can lead an active lifestyle suffer. At the same time, the proportion of diseases of the musculoskeletal system is constantly increasing by 30% every 10 years. Among patients with disorders of the musculoskeletal system, approximately 6% of people who have problems with the speech apparatus can be distinguished, and 94% of people who have no disorders of the speech apparatus [11].

Эти статистические данные обуславливают целесообразность применения системы голосового управления (СГУ) в КРУ и служат обоснованием расширения области, применения предлагаемого изобретения для пользователей КРУ с нарушением опорно-двигательного аппарата и отсутствием нарушения речевого аппарата. Получается, что оснащение КРУ СГУ увеличивает возможное количество пользователей КРУ в 94/6=15,6 раз.These statistics determine the feasibility of using a voice control system (SGU) in switchgear and serve as a justification for expanding the scope, application of the proposed invention for users of switchgear with musculoskeletal disorders and lack of speech impairment. It turns out that equipping the switchgear with SGU increases the possible number of switchgear users by 94/6 = 15.6 times.

В настоящее время сегмент распознавания речи составляет 3,5% от доли технологий биометрии на мировом рынке, и это доля имеет тенденцию постоянного роста. Сектор речевых технологий признан одним из самых динамично развивающихся в мире. Согласно отчету MarketsandMarkets, мировой рынок речевых технологий вырастет с 3,7 млрд долларов в 2019 году до 12 млрд к 2022 году [12]. Все ведущие автопроизводители оснащают свои автомобили премиум класса СГУ. Разработаны СГУ с менее чем 4% неточных результатов (например, измерения голосовой биометрии неверно идентифицируют и отвергают голос человека, у которого есть доступ) [13].At present, the speech recognition segment accounts for 3.5% of the share of biometrics technologies in the world market, and this share has a constant growth trend. The speech technology sector is recognized as one of the fastest growing in the world. According to a report by MarketsandMarkets, the global speech technology market will grow from $ 3.7 billion in 2019 to $ 12 billion by 2022 [12]. All leading car manufacturers equip their premium cars with SSU. SSUs have been developed with less than 4% inaccurate results (for example, voice biometrics measurements incorrectly identify and reject the voice of a person who has access) [13].

В канале анализа голосового сигнала (см. фигуру 6) дополнительно осуществляется:In the channel for analyzing the voice signal (see figure 6), the following is additionally carried out:

- генерация акустических колебаний;- generation of acoustic vibrations;

- аутентификация пользователя;- user authentication;

- обеспечение доступа;- providing access;

- формирование слова.- word formation.

Аналогично расчету повышения достоверности распознавания МК в комбинированном методе анализа рассчитаем вероятность достоверности распознавания управляющей команды для КРУ в результате совместного функционирования канала анализа электроэнцефалографических сигналов и канала анализа голосового сигнала. Из теории вероятности [14] известно, что:Similarly to the calculation of the increase in the reliability of MK recognition in the combined analysis method, we will calculate the probability of the recognition reliability of the control command for the switchgear as a result of the joint functioning of the electroencephalographic signal analysis channel and the voice signal analysis channel. From the theory of probability [14] it is known that:

Figure 00000008
Figure 00000008

где Р - вероятность идентификации управляющей команды, Q - вероятность ошибки при идентификации управляющей команды. Таким образом, вероятность успешной идентификации управляющей команды будет определена как:where Р is the probability of identifying the control command, Q is the probability of error in identifying the control command. Thus, the probability of successful identification of the control team will be determined as:

Figure 00000009
Figure 00000009

Поэтому общая вероятность ошибки при идентификации управляющей команды при наличии двух каналов получения информативного сигнала составит:Therefore, the total probability of an error in identifying a control command in the presence of two channels for receiving an informative signal will be:

Figure 00000010
Figure 00000010

где QЭЭГ - вероятность ошибки при идентификации управляющей команды при обработке ЭЭГ сигнала, QГолос - вероятность ошибки при идентификации управляющей команды при обработке голосового сигнала.where Q EEG is the probability of an error in identifying a control command when processing an EEG signal, Q Voice is the probability of an error in identifying a control command when processing a voice signal.

Вероятность идентификации управляющей команды в канале анализа электроэнцефалографических сигналов составляет 99,4% (см. выражение (4)). Вероятность идентификации управляющей команды СГУ 96% [13, 15, 16].The probability of identifying a control command in the channel for analyzing electroencephalographic signals is 99.4% (see expression (4)). The probability of identification of the SSU control team is 96% [13, 15, 16].

По формулам (6-8) определяются значения вероятностей при функционировании предлагаемых способа и системы бионического управления роботизированными устройствами:According to formulas (6-8), the values of the probabilities are determined during the functioning of the proposed method and system of bionic control of robotic devices:

вероятность ошибки при идентификации управляющей команды равна:the probability of an error in identifying the control command is equal to:

Q=(1-0,994)⋅(1-0,96)=0,00024,Q = (1-0.994) ⋅ (1-0.96) = 0.00024,

а вероятность успешной идентификации управляющей команды равна:and the probability of successful identification of the control command is:

Р=1-0,00024=0,99976.P = 1-0.00024 = 0.99976.

Из приведенных расчетов следует, что введение канала анализа голосового сигнала для получения дополнительного информативного сигнала совместно с комбинированным методом анализа в канале анализа электроэнцефалографических сигналов позволяет повысить точность определения управляющей команды для КРУ на 9,99% и достигнуть почти 100% распознавания МК.From the above calculations, it follows that the introduction of a voice signal analysis channel to obtain an additional informative signal together with a combined analysis method in the electroencephalographic signal analysis channel makes it possible to increase the accuracy of determining the control command for switchgear by 9.99% and achieve almost 100% of MC recognition.

Работу предлагаемой системы бионического управления роботизированными устройствами (СБУРУ) рассмотрим с учетом введенных действий. СБУРУ работает следующим образом: генерация акустического колебания осуществляется голосовым аппаратом человека (см. фигуру 12А) [17]. Генерация акустического колебания производится путем (см. фигуру 13) механического воздействия мышц грудной клетки на легкие, в результате чего осуществляется выдох, при этом выдыхаемый воздух вызывает вибрацию голосовых связок, вследствие чего появляется звук. Гортань человека во время вдоха расширяется (см. фигуру 12Б) и выдоха сжимается (см. фигуру 12В), где 1 - надгортанник, 2 - голосовые связки. Звук, встречая на своем пути препятствия, которые, создают для него определенные положения языка, губ и зубов, преобразуется в акустическое колебание, содержащее информацию определенного осмысленного слова [17].We will consider the operation of the proposed system of bionic control of robotic devices (SBURU) taking into account the introduced actions. SBURU works as follows: the generation of acoustic oscillations is carried out by the human vocal apparatus (see figure 12A) [17]. The generation of acoustic oscillations is carried out by (see figure 13) mechanical action of the muscles of the chest on the lungs, as a result of which exhalation is carried out, while the exhaled air causes vibration of the vocal cords, as a result of which sound appears. The larynx of a person expands during inhalation (see figure 12B) and exhalation contracts (see figure 12B), where 1 is the epiglottis, 2 are the vocal cords. Sound, encountering obstacles on its way, which create certain positions of the tongue, lips and teeth for it, is converted into an acoustic vibration containing information of a certain meaningful word [17].

Структурная схема системы, реализующей предлагаемый способ бионического управления роботизированными устройствами, приведена на фигуре 14, а алгоритм взаимодействия аппаратного и программного обеспечения канала анализа голосового сигнала при распознавании слова - на фигуре 15. Как правило, конструкция системы голосового управления объединяет в себе аппаратную и программную часть. К аппаратной части относится микрофон (обязательный в любой СГУ), он будет воспринимать голосовые команды и фильтровать шум [18]. Схемотехника СГУ подробно представлена в [19]. Основным модулем аппаратной части СГУ является компьютер, который принимает и обрабатывает команды, а далее передает сигналы на исполнительное устройство.The block diagram of the system that implements the proposed method of bionic control of robotic devices is shown in figure 14, and the algorithm for the interaction of the hardware and software of the channel for analyzing the voice signal during word recognition is shown in figure 15. As a rule, the design of the voice control system combines hardware and software ... The hardware part includes a microphone (mandatory in any SSU), it will perceive voice commands and filter noise [18]. The circuitry of SSU is presented in detail in [19]. The main module of the SGU hardware is a computer that receives and processes commands, and then transmits signals to the executive device.

К программной части СГУ относятся операционная система и оригинальные программные средства, обеспечивающие реализацию алгоритмов обработки голосовых сигналов. Самые известные операционные системы, это iOS, Android или Windows. Иногда производители СГУ разрабатывают собственную операционную систему на основе уже известных, тем самым, обеспечивая больше возможностей для выполнения нового количества функций. Из оригинальных программных средств, обеспечивающие реализацию алгоритмов обработки голосовых сигналов самыми известными являются:The software part of the SSU includes the operating system and original software that provide the implementation of algorithms for processing voice signals. The most famous operating systems are iOS, Android or Windows. Sometimes DGS manufacturers develop their own operating system based on already known ones, thereby providing more opportunities for performing a new number of functions. Of the original software tools that provide the implementation of algorithms for processing voice signals, the most famous are:

- Alexa от Amazon [20];- Alexa from Amazon [20];

- OK Google [21];- OK Google [21];

- Siri от Apple [22];- Siri from Apple [22];

- Cortana от Microsoft [23];- Cortana from Microsoft [23];

- Алиса от Яндекс [24].- Alice from Yandex [24].

Функциональные возможности современных голосовых помощников приведены в таблице 2 (см. фигуру 16).The functionality of modern voice assistants is shown in Table 2 (see figure 16).

Системы голосового управления с полным правом относятся к бионическим методам управления объектами. Действительно, технология обработки речевых сигналов в системах голосового управления представляет собой совокупность методов и инструментов реализации языковой модели (см. фигуру 17), в рамках которой осуществляется акустический, лингвистический и семантический анализы, обеспечивая достоверное распознавание МК [16]. Анализ фигуры 16 показывает, что основными элементами парадигмы обработки речевого сигнала являются акустическая и языковая модели:Voice control systems rightfully belong to bionic methods of object control. Indeed, the technology of processing speech signals in voice control systems is a set of methods and tools for the implementation of the language model (see figure 17), within which acoustic, linguistic and semantic analyzes are carried out, providing reliable recognition of MC [16]. Analysis of Figure 16 shows that the main elements of the speech signal processing paradigm are the acoustic and language models:

- акустическая модель - это функция, принимающая на вход небольшой участок акустического сигнала (фрейм) и выдающая распределение вероятностей различных фонем на этом фрейме; - an acoustic model is a function that takes a small portion of an acoustic signal (frame) as input and outputs the probability distribution of various phonemes on this frame;

- языковая модель - это вероятностное распределение на множестве словарных последовательностей, которое отражает как семантику, так и морфологию. Такой тип языковых моделей называется N-gram language models [25].- a language model is a probability distribution on a set of vocabulary sequences that reflects both semantics and morphology. This type of language models is called N-gram language models [25].

Речевой интерфейс характеризуется, следующими достоинствами:The speech interface is characterized by the following advantages:

- речь является естественным интерфейсом для любого, даже неподготовленного человека. Речь снижает психологическое расстояние между человеком и компьютером или робототизированным мехинизмом;- speech is a natural interface for anyone, even an unprepared person. Speech reduces the psychological distance between humans and computers or robotic machinery;

- речь сама по себе никак механически не привязана к компьютеру и может быть связана с ним через системы коммуникаций, например, телефон. Речевой человеко-машинный интерфейс сокращает физическое расстояние между человеком и робототизированным мехинизмом;- speech itself is not mechanically tied to a computer and can be connected to it through communication systems, for example, a telephone. The speech human-machine interface shortens the physical distance between humans and robotic machinery;

- можно обращаться с робототизированным мехинизмом в полной темноте, с закрытыми глазами, в условиях занятости рук рычагами управления, с завязанными руками и в другой экстремальной обстановке, что повышает оперативность и мобильность общения, освобождение рук и разгрузку зрительного канала восприятия при получении информации.- it is possible to handle a robotic mechanism in complete darkness, with closed eyes, in conditions of holding hands with control levers, with tied hands and in other extreme conditions, which increases the efficiency and mobility of communication, freeing hands and unloading the visual channel of perception when receiving information.

Алгоритм распознавания слова предлагаемого способа бионического управления роботизированными устройствами приведен на фигуре 18 и реализует действия: преобразование акустических сигналов в электрический сигнал; фильтрация шумов; идентификация слова; распознанного слова.The word recognition algorithm of the proposed method for bionic control of robotic devices is shown in figure 18 and implements the following actions: converting acoustic signals into an electrical signal; filtering noise; word identification; recognized word.

Алгоритм распознавания слова работает следующим образом: акустические колебания с помощью микрофона преобразуются в электрический сигнал. Затем поступивший сигнал фильтруется. В качестве фильтра используется преобразование Гильберта-Хуанга [26]. Алгоритм преобразования Гильберта-Хуанга представлен на фигуре 19.The word recognition algorithm works as follows: acoustic vibrations are converted into an electrical signal using a microphone. Then the incoming signal is filtered. The Hilbert-Huang transform [26] is used as a filter. The Hilbert-Huang transformation algorithm is shown in Figure 19.

Работа алгоритма преобразования Гильберта-Хуанга заключается в выполнении следующих этапов. Определение максимумов {xmax,k} и минимумов {xmin,k} исследуемого сигнала:The work of the Hilbert-Huang transformation algorithm consists in performing the following steps. Determination of the maxima {x max, k } and minima {x min, k } of the signal under study:

- значение k-го отсчета является максимумом, если выполняется условие- the value of the k-th sample is the maximum if the condition

Figure 00000011
Figure 00000011

- значение k-го отсчета является минимумом, если выполняется условие- the value of the k-th sample is the minimum if the condition

Figure 00000012
Figure 00000012

где k - дискретные отсчеты времени.where k are discrete time samples.

Определение верхней h(t) и нижней l(t) огибающих сигнала с помощью кубической сплайн-интерполяции по найденным локальным экстремумам:Determination of the upper h (t) and lower l (t) signal envelopes using cubic spline interpolation from the found local extrema:

Figure 00000013
Figure 00000013

Figure 00000014
Figure 00000014

где αk, βk, γk, δk - коэффициенты для каждого значения k-го отсчета верхней и нижней огибающих сигнала (могут быть вычислены с условием, что полная функция интерполяции была непрерывной до производных второго порядка).where α k , β k , γ k , δ k are the coefficients for each value of the kth sample of the upper and lower signal envelopes (can be calculated under the condition that the full interpolation function was continuous up to the second order derivatives).

Пример выделения огибающей сигнала речевой команды представлен на фигуре 20.An example of envelope extraction of a speech command signal is shown in FIG. 20.

Вычисление среднего значения огибающих сигнала в соответствии выражением:Calculation of the average value of the signal envelopes in accordance with the expression:

Figure 00000015
Figure 00000015

Проверка условия среднее значение двух огибающих должно быть приближенно равно нулю (m(t)=0). Если условие не выполняется, то осуществляется вычисление локального остатка и использование его в качестве сигнала для дальнейшего отсеивания x(t)=c(t):Checking the condition the average value of the two envelopes should be approximately equal to zero (m (t) = 0). If the condition is not met, then the local remainder is calculated and used as a signal for further screening x (t) = c (t):

Figure 00000016
Figure 00000016

где c(t) - локальный остаток. Если условие выполняется, то локальный остаток используется в качестве эмпирической моды (ЭМ) i-ого уровня декомпозиции эмпирической модовой функции IMFi(t)=c(t).where c (t) is the local remainder. If the condition is met, then the local remainder is used as the empirical mode (EM) of the i-th level of the decomposition of the empirical mode function IMF i (t) = c (t).

Вычисление остатка сигнала по формуле:Calculation of the remainder of the signal by the formula:

Figure 00000017
Figure 00000017

где r(t) - остаток сигнала.where r (t) is the remainder of the signal.

Вычисление значения критерия останова. В качестве критерия останова декомпозиции используется значение, нормализованной квадратичной разности, определяемое как:Calculation of the stop criterion value. As a criterion for stopping the decomposition, the value of the normalized quadratic difference is used, defined as:

Figure 00000018
Figure 00000018

где Т - общее число точек в последовательности, IMFi(t) и r(t) являются последней ЭМ и остатком соответственно.where T is the total number of points in the sequence, IMF i (t) and r (t) are the last EM and the remainder, respectively.

Проверка условия останова. На этом этапе осуществляется сравнение значения остатка сигнала с порогом SD≤δ. Экспериментально порог для речевых сигналов установлен δ=0,25. Если условие не выполняется, то остаток используется в качестве сигнала для дальнейшего уровня декомпозиции. Если условие выполняется, то осуществляется вывод набора ЭМ, полученных на всех уровнях декомпозиции.Checking the stop condition. At this stage, the value of the remainder of the signal is compared with the threshold SD≤δ. Experimentally, the threshold for speech signals is set at δ = 0.25. If the condition is not met, then the remainder is used as a signal for a further level of decomposition. If the condition is met, then a set of EMs obtained at all levels of decomposition is output.

В результате декомпозиции, из исходного сигнала x(t) извлекается конечное число ЭМ IMFi(t) и результирующий остаток:As a result of decomposition, a finite number of EM IMF i (t) and the resulting remainder are extracted from the original signal x (t):

Figure 00000019
Figure 00000019

Результат фильтрации голосового сигнала с помощью преобразования Гильберта-Хуанга представлен на фигуре 21.The result of filtering the voice signal using the Hilbert-Huang transform is shown in figure 21.

Алгоритм идентификация речевой команды (см. фигуру 22) включает в себя:The speech command identification algorithm (see figure 22) includes:

- адаптивное разложение речевой команды на ЭМ с помощью метода комплементарной множественной декомпозиции на эмпирические моды (КМДЭМ);- adaptive decomposition of a speech command into EM using the method of complementary multiple decomposition into empirical modes (CMDEM);

- формирование набора информативных сигналов, представляющих собой разности исходного сигнала речевой команды и неинформативных ЭМ. Другими словами, информативные сигналы, состоят только из мод, содержащих информацию об уникальных свойствах речи.- formation of a set of informative signals, which are the differences between the original signal of the speech command and non-informative EM. In other words, informative signals consist only of modes containing information about the unique properties of speech.

- определение мел-частотных кепсетральных коэффициентов (МЧКК) набора информативных сигналов, формирование базы шаблонов и осуществление непосредственного распознавания.- determination of the chalk-frequency capsetral coefficients (MFCC) of a set of informative signals, the formation of a template base and the implementation of direct recognition.

В представленном алгоритме ввод речевого сигнала без пауз х(n) (n - дискретный отсчет времени 0<n≤N, N - количество дискретных отсчетов в сигнале) осуществляется со следующими параметрами: длительность записи - не более 30 мс, частота дискретизации 8000 Гц, разрядность квантования 16 бит.In the presented algorithm, input of a speech signal without pauses х (n) (n is a discrete time count 0 <n≤N, N is the number of discrete counts in the signal) is carried out with the following parameters: recording duration - no more than 30 ms, sampling frequency 8000 Hz, quantization capacity 16 bits.

Настройки КМДЭМ: уровень амплитуды белого шума составляет 0,1 мВ, количество циклов декомпозиции J=50 (J=1, 2, …J). Декомпозиция зашумленного речевого сигнала заключается в получении усредненных значений ЭМ и остатка:CMDEM settings: the level of the white noise amplitude is 0.1 mV, the number of decomposition cycles is J = 50 (J = 1, 2,… J). Decomposition of a noisy speech signal consists in obtaining averaged values of EM and residual:

Figure 00000020
Figure 00000020

Figure 00000021
Figure 00000021

Пример представления декомпозиции голосового сигнала показан на фигуре 23.An example of a voice decomposition representation is shown in Figure 23.

После завершения декомпозиции зашумленный речевой сигнал представляет собой набор ЭМ

Figure 00000022
и остаток rI(n), где i-номер ЭМ, I - количество ЭМ, устанавливается номер моды фрагмента и дальнейшая работа осуществляется с каждой ЭМ в отдельности. Коэффициенты а, b устанавливаются равными единице и в последующем определяют, какие ЭМ будут использоваться в формировании набора информативных сигналов.After the completion of the decomposition, the noisy speech signal is a set of EM
Figure 00000022
and the remainder r I (n), where i is the number of EM, I is the number of EM, the mode number of the fragment is set and further work is carried out with each EM separately. Coefficients a, b are set equal to one and subsequently determine which EM will be used in the formation of a set of informative signals.

Для формирования набора информативных сигналов необходимо провести классификацию информативности всех извлеченных из сигнала ЭМ.To form a set of informative signals, it is necessary to classify the informativity of all EMs extracted from the signal.

При условии, что речевой сигнал имеет конечную энергию, число ЭМ при разложении всегда является конечным. Для абсолютно произвольного сигнала все ЭМ можно разбить на две категории:Provided that the speech signal has a finite energy, the number of EMs during decomposition is always finite. For a completely arbitrary signal, all EMs can be divided into two categories:

- информативные ЭМ с шумовыми и сигнальными ЭМ;- informative EMs with noise and signal EMs;

- неинформативные ЭМ с трендовыми и компенсирующими ЭМ. Информативные ЭМ в разложении всегда отражают внутреннюю структуру и особенности сигнала. К их числу относятся шумовые и сигнальные ЭМ. Появление в разложении первых объясняется наличием в исходном сигнале остаточного шума, а вторые связаны непосредственно с полезным сигналом и входящими в него компонентами.- non-informative EMs with trend and compensating EMs. Informative EM in decomposition always reflects the internal structure and characteristics of the signal. These include noise and signal EMs. The appearance of the former in the expansion is explained by the presence of residual noise in the original signal, while the latter are directly related to the useful signal and its components.

Неинформативные ЭМ являются медленно меняющимися функциями. Среди них выделяют трендовые ЭМ и описывающие истинную динамику среднего значения сигнала и компенсирующие ЭМ возникающие при разложении. Трендовые ЭМ появляются, например, при разложении суммы гармонического сигнала и полиномиального тренда. Компенсирующие (ложные) ЭМ - результат несовершенства самого алгоритма декомпозиции (критериев остановки процесса отсеивания, неточностей при вычислениях, ошибок округления).Non-informative EMs are slowly changing functions. Among them, there are trend EMs that describe the true dynamics of the mean value of the signal and compensating EMs arising during decomposition. Trending EMs appear, for example, when the sum of a harmonic signal and a polynomial trend is decomposed. Compensating (false) EMs are the result of imperfection of the decomposition algorithm itself (criteria for stopping the screening process, inaccuracies in calculations, rounding errors).

Формирование набора информативных сигналов заключается в вычитании из исходного сигнала речевой команды: информативных шумовых и неинформативных мод. Информативными шумовыми обычно являются первые две или три ЭМ, в зависимости от интенсивности присутствующего в сигнале шума. Неинформативными являются последние три или четыре ЭМ, в зависимости, от общего количества мод (число ЭМ примерно равно двоичному логарифму от числа отсчетов в сигнале). Графическая интерпретация формирования набора полезных сигналов показана на фигуре 23. Формирование набора информативных сигналов осуществляется по формуле:The formation of a set of informative signals consists in subtracting the speech command from the original signal: informative noise and non-informative modes. Informative noise is usually the first two or three EMs, depending on the intensity of the noise present in the signal. The last three or four EMs are uninformative, depending on the total number of modes (the number of EMs is approximately equal to the binary logarithm of the number of samples in the signal). A graphic interpretation of the formation of a set of useful signals is shown in figure 23. The formation of a set of informative signals is carried out according to the formula:

Figure 00000023
Figure 00000023

где xab,i(n) - информативный сигнал, х(n) - исходный сигнал речевой команды, i-номер ЭМ, I - количество ЭМ, а, b - коэффициенты, определяющие участие ЭМ в формировании набора информативных сигналов сигнала (см. фигуру 24).where x ab, i (n) is an informative signal, x (n) is the original signal of the speech command, i is the number of the EM, I is the number of EMs, and, b are the coefficients that determine the participation of EMs in the formation of a set of informative signal signals (see. Figure 24).

Целью формирования набора информативных сигналов является возможность выбора одного сигнала, содержащего максимально большее количество информации об уникальных свойствах речи пользователя. Так как каждое слово инвариантно относительно: тональности (изменения частоты), интенсивности звучания, скорости произношения или звучания, тембровой окраски, интонации и различных дефектов речи пользователя (акцент, ударение, неправильное произношение и др.).The purpose of forming a set of informative signals is the ability to select one signal containing the maximum amount of information about the unique properties of the user's speech. Since each word is invariant with respect to: tonality (frequency change), sound intensity, speed of pronunciation or sound, timbre color, intonation and various defects of the user's speech (accent, stress, mispronunciation, etc.).

На этом этапе работы предлагаемого способа производится процедура аутентификация пользователя. На основании заранее записанного кодового слова пользователя, производится проверка на получение доступа пользования контролируемым роботизированным устройством (инвалидной коляской). Аутентификация пользователя обеспечивает функцию программирования КРУ «под себя» и позволяет последующую обработку зарегистрированного ЭЭГ сигнала и речевого сигнала. Таким образом, можно зашифровать от посторонних ушей, что вы включили или выключили во время управления КРУ.At this stage of the proposed method, a user authentication procedure is performed. Based on the pre-recorded user code word, a check is made to obtain access to the use of a controlled robotic device (wheelchair). User authentication provides the function of programming the switchgear "for himself" and allows the subsequent processing of the recorded EEG signal and speech signal. Thus, it is possible to encrypt from prying ears what you turned on or off while controlling the switchgear.

В последующих действиях работы алгоритма распознавания слова будет выбран наиболее приемлемый информативный сигнал, обеспечивающий наименьшую разницу между поступающей в систему речевой командой и шаблоном, полученным в ходе обучения подсистемы голосового управления.In the subsequent actions of the word recognition algorithm, the most acceptable informative signal will be selected, providing the smallest difference between the speech command entering the system and the template obtained during the training of the voice control subsystem.

Сегментация ЭМ на фрагменты осуществляется по следующим формулам:Segmentation of EM into fragments is carried out according to the following formulas:

Figure 00000024
Figure 00000024

где IMFi(n) - сигнал ЭМ, S - количество фрагментов в ЭМ, L - количество дискретных отсчетов в одном фрагменте.where IMF i (n) is the EM signal, S is the number of fragments in the EM, L is the number of discrete samples in one fragment.

Figure 00000025
Figure 00000025

где IMFi,s+1(n) - фрагмент i-ой ЭМ, s=(0, 1, 2, …S-1) - номер фрагмента.where IMF i, s + 1 (n) is the fragment of the i-th EM, s = (0, 1, 2,… S-1) is the number of the fragment.

МЧКК включает в себя два основных понятия: кепстр и мел-шкала.MChKK includes two basic concepts: cepstrum and chalk-scale.

Кепстр это дискретно-косинусное преобразование амплитудного спектра сигнала в логарифмическом масштабе. Кепстр сигнала определяется по формуле:Cepstrum is a discrete-cosine transformation of the amplitude spectrum of a signal on a logarithmic scale. The signal cepstrum is determined by the formula:

Figure 00000026
Figure 00000026

где DCT - дискретно-косинусное преобразование, X - спектральное представление сигнала х(n).where DCT is the discrete cosine transform, X is the spectral representation of the signal x (n).

Понятие кепстра позволяет реализовывать преимущества спектрального представления сигнала. При преобразовании сигнала из временной области в частотную происходит сжатие информации, становится более наглядной, подробной и компактной исходная спектральная информация о сигнале представляется еще более компактно - в виде кепстра («спектра спектра»).The concept of cepstrum allows you to take advantage of the spectral representation of a signal. When converting a signal from the time domain to the frequency domain, information is compressed, the initial spectral information about the signal becomes more visual, detailed and compact, and is presented even more compactly - in the form of a cepstrum (“spectrum spectrum”).

Мел шкала - это шкала частотной восприимчивости изменений высоты звука. Мел - психофизическая единица высоты звука. Высота звука связана главным образом с частотой колебаний. По этой причине люди гораздо лучше воспринимают небольшие изменения звука на низких частотах, чем на высоких, то есть мел-шкала моделирует частотную чувствительность человеческого слуха.The chalk scale is a scale for the frequency response of pitch changes. Chalk is a psychophysical unit of pitch. Pitch is mainly related to vibration frequency. For this reason, people perceive small changes in sound much better at low frequencies than at high frequencies, that is, the chalk scale simulates the frequency sensitivity of human hearing.

Перевод из шкалы герц в шкалу мелов и обратно происходит по следующим формулам:Conversion from the hertz scale to the chalk scale and vice versa takes place according to the following formulas:

Figure 00000027
Figure 00000027

Figure 00000028
Figure 00000028

где m - частота в мелах, ƒ - частота в герцах.where m is the frequency in mela, ƒ is the frequency in hertz.

Получение спектра фрагментов ЭМ осуществляется по формуле:The spectrum of EM fragments is obtained according to the formula:

Figure 00000029
Figure 00000029

ys+1(n)-фрагмент сигнала ЭМ, Ys+1(k)-спектр фрагмента сигнала ЭМ, 0≤k<N-1 - количество комплексных амплитуд синусоидальных сигналов, слагающих исходный сигнал, l=(1, 2, …L) - номер отсчета фрагмента сигнала ЭМ, L - количество отсчетов во фрагменте, j - мнимая единица.y s + 1 (n) -fragment of the EM signal, Y s + 1 (k) -spectrum of the fragment of the EM signal, 0≤k <N-1 is the number of complex amplitudes of sinusoidal signals that compose the original signal, l = (1, 2, … L) is the number of the sample of the EM signal fragment, L is the number of samples in the fragment, j is the imaginary unit.

Значение k, определяет частоты составляющих сигнала:The value of k determines the frequencies of the signal components:

Figure 00000030
Figure 00000030

где Fs - частота дискретизации сигнала.where F s is the signal sampling rate.

Получение периодограммы фрагментов ЭМ осуществляется по формулеThe periodogram of EM fragments is obtained according to the formula

Figure 00000031
Figure 00000031

Полученные периодограммы фрагментов содержат избыточное количество информации о частотах для задачи распознавания. По этой причине для более компактного представления информации периодограммы делятся на частотные диапазоны. К каждому диапазону применяется треугольная оконная функция - мел-фильтр, позволяющая просуммировать количество энергии каждого частотного диапазона периодограммы и определить мел-коэффициенты.The resulting fragment periodograms contain an excessive amount of information about the frequencies for the recognition task. For this reason, for a more compact presentation of information, periodograms are divided into frequency ranges. A triangular window function is applied to each range - a chalk filter, which allows you to sum up the amount of energy in each frequency range of the periodogram and determine the chalk coefficients.

Формирование набора мел-фильтров осуществляется по следующей методике:The formation of a set of chalk filters is carried out according to the following method:

- задается количество мел-фильтров G и нижняя ƒl, верхняя ƒh границы диапазона частот, в котором будет применяться фильтрация;- set the number of chalk filters G and the lower ƒ l , upper ƒ h boundaries of the frequency range in which the filtering will be applied;

- в соответствии с формулой (24) выполняется преобразование границ диапазона из герц в мел (ml, mh);- in accordance with the formula (24), the range boundaries are converted from hertz to chalk (m l , m h );

- на мел-шкале отрезок [ml, mh] разбивается на G+1 непересекающихся под отрезков длиной

Figure 00000032
- on a chalk scale, the segment [m l , m h ] is divided into G + 1 disjoint segments of length
Figure 00000032

- определяются центральные частоты подотрезков по следующее формуле:- the center frequencies of the subsections are determined by the following formula:

Figure 00000033
Figure 00000033

где g=1, 2, …G - номер фильтра;where g = 1, 2,… G is the filter number;

- центральные частоты переводятся в герцы ƒc (g) по формуле (25), они соответствуют центральным частотам треугольных мел-фильтров;- the center frequencies are converted to hertz ƒc (g) according to the formula (25), they correspond to the center frequencies of triangular chalk filters;

- центральные частоты треугольных фильтров переводятся из герц в номера отсчетов периодограммы Ps+1(k):- the center frequencies of the triangular filters are converted from hertz to the numbers of samples of the periodogram P s + 1 (k):

Figure 00000034
Figure 00000034

- для каждого мел-фильтра отсчеты периодограммы Ps+1(k) умножаются на соответствующий фильтр:- for each chalk filter, the samples of the periodogram P s + 1 (k) are multiplied by the corresponding filter:

Figure 00000035
Figure 00000035

где k=(1, 2, …K) - количество отсчетов в одном фрагменте.where k = (1, 2,… K) is the number of samples in one fragment.

После выбора треугольных фильтров фрагментов, проводится логарифмирование энергии по следующей формуле:After choosing the triangular filters of the fragments, the energy is logarithmized according to the following formula:

Figure 00000036
Figure 00000036

Последним этапом является вычисление дискретно-косинусного преобразования логарифма энергии набора фильтров. Так как все полосы пропускания фильтров перекрываются, энергии в наборе фильтров достаточно коррелируют друг с другом, поэтому необходимо провести декорреляцию по следующей формуле:The last step is to compute the discrete cosine transform of the logarithm of the energy of the filter bank. Since all of the filter passbands overlap, the energies in the filter bank are fairly correlated with each other, so decorrelation needs to be done using the following formula:

Figure 00000037
Figure 00000037

где с=1, 2, …С - номер МЧКК, С - желаемое число коэффициентов.where c = 1, 2, ... C is the number of the MCCC, C is the desired number of coefficients.

Обычно для распознавания используют 12-15 МЧКК, так как чем выше индекс коэффициента, тем быстрее изменяется энергия в наборе фильтров.Usually, 12-15 MFCC are used for recognition, since the higher the coefficient index, the faster the energy in the set of filters changes.

В результате первый МЧКК в основном несет информацию об интенсивности речевых сигналов. Так как в подсистемах голосового управления регистрация речевых сигналов может происходить с разными уровнями, то информация первого МЧКК становится избыточной. В разработанном алгоритме в дальнейшем анализе первый МЧКК не используется.As a result, the first MCCC mainly carries information about the intensity of speech signals. Since in the voice control subsystems the registration of speech signals can occur at different levels, the information of the first MFCC becomes redundant. In the developed algorithm, the first MCCC is not used in further analysis.

Операция нормализации используется для придания равнозначности каждому МЧКК во фрагменте. Как известно высокие частоты менее восприимчивы и МЧКК на этих частотах менее важны по сравнению с МЧКК на низких частотах. МЧКК на высоких частотах практически не влияют на результат. Нормализация МЧКК это умножение каждого коэффициента на число, которое увеличивается с номером коэффициента. Таким образом, первые коэффициенты по уровню уменьшаются, а последние коэффициенты увеличиваются по уровню. Для этой операции используется формула:The normalization operation is used to impart equivalence to each MCCC in a fragment. As you know, high frequencies are less susceptible and MFCC at these frequencies are less important than MFCC at low frequencies. MChKK at high frequencies practically does not affect the result. Normalization of the MCCC is the multiplication of each coefficient by a number that increases with the coefficient number. Thus, the first coefficients by level are decreasing, and the last coefficients are increasing by level. For this operation, the formula is used:

Figure 00000038
Figure 00000038

где Lƒ - величина, подбираемая эмпирически и равна 22.where L ƒ is a value chosen empirically and is equal to 22.

Нахождение первого и второго, приращения значений МЧКК позволяет получить некоторую динамическую информацию о статических коэффициентах. Вектор коэффициентов описывает фиксированную спектральную огибающую одного фрагмента, но очевидно, что речевые сигналы несут информацию и о динамике в виде незначительного изменения коэффициентов с течением времени.Finding the first and second increments of the MCCC values allows you to obtain some dynamic information about the static coefficients. The vector of coefficients describes a fixed spectral envelope of one fragment, but it is obvious that speech signals also carry information about the dynamics in the form of insignificant changes in the coefficients over time.

Для расчета приращений МЧКК используются следующие формулы:The following formulas are used to calculate the MCCC increments:

Figure 00000039
Figure 00000039

Figure 00000040
Figure 00000040

где MFCC_Ds+1(c), MFCC_DDs+1(c) - первое и второе приращение МЧКК, MFCCs+1(c) - статические МЧКК, D - типовое значение приращения равное 2.where MFCC_D s + 1 (c), MFCC_DD s + 1 (c) are the first and second increments of MFCC, MFCC s + 1 (c) are static MFCC, D is a typical value of the increment equal to 2.

Формирование базы данных - шаблонов и набора данных МЧКК представляет собой объединение всех видов информативных параметров (MFCCs+1(c), MFCC_Ns+1(c), MFCC_Ds+l(c), MFCC_DDs+1(c)) в один вектор.The formation of a database - templates and a data set of the MFCC is a combination of all types of informative parameters (MFCC s + 1 (c), MFCC_N s + 1 (c), MFCC_D s + l (c), MFCC_DD s + 1 (c)) into one vector.

После формирования первого информативного сигнала, вычитая по одной информативной шумовой и неинформативной моды (i=0) выполняется проверка условия i=2. Если условие выполняется, осуществляется проверка условия а=1. В случае если условие не выполняется, то устанавливается значение равным i=i+1 и осуществляется возврат к формированию набора информативных сигналов через установку номера ЭМ.After the formation of the first informative signal, subtracting one informative noise and one uninformative mode (i = 0), the condition i = 2 is checked. If the condition is met, the condition a = 1 is checked. If the condition is not met, then the value is set equal to i = i + 1 and a return to the formation of a set of informative signals is carried out by setting the EM number.

После формирования всех информативных сигналов при значениях коэффициентов равных а=1, b=1 выполняется проверка условий а=1, b=1 и осуществляется установка новых значений коэффициентов. Установка значений равных а=1, b=0 соответствует формированию информативных сигналов вычитанием только шумовых ЭМ. Установка значений равных а=0, b=1 соответствует формированию информативных сигналов вычитанием только неинформативных ЭМ.After the formation of all informative signals with the values of the coefficients equal to a = 1, b = 1, the conditions a = 1, b = 1 are checked and the new values of the coefficients are set. Setting the values equal to a = 1, b = 0 corresponds to the formation of informative signals by subtracting only noise EMs. Setting the values equal to a = 0, b = 1 corresponds to the formation of informative signals by subtracting only uninformative EM.

Распознавание представляет процесс сравнения поступившей в систему речевой команды с шаблоном из базы данных, полученным в ходе обучения подсистемы голосового управления. Одна речевая команда может быть произнесена по-разному, так как различные части слова, произносятся с разной скоростью. Для определения расхождения между поступающей в систему речевой командой и шаблоном, представленными как вектора МЧКК, должно быть выполнено выравнивание по времени. С этой целью для распознавания применяется метод динамического трансформирования времени, который является методикой эластичного сравнения фрагментов речевой команды и шаблона в регулярных интервалах.Recognition represents the process of comparing the speech command received by the system with a template from the database obtained during the training of the voice control subsystem. One speech command can be pronounced in different ways, since different parts of a word are pronounced at different speeds. Time alignment should be performed to determine the discrepancy between the speech command entering the system and the template, represented as MFCC vectors. For this purpose, the method of dynamic time transformation is used for recognition, which is a technique for elastic comparison of fragments of a speech command and a pattern at regular intervals.

Процесс сравнения векторов МЧКК поступающей речевой командой и с шаблоном начинается с расчета локальных отклонений между значениями двух векторов:The process of comparing the MCCC vectors by the incoming speech command and with the template begins with calculating the local deviations between the values of the two vectors:

- определение коэффициента корреляции по формуле:- determination of the correlation coefficient by the formula:

Figure 00000041
Figure 00000041

где r(xs+1, ys+1) - элементы матрицы отклонения, xs+1=MFCCcomp.(c) вектор МЧКК фрагмента поступающей речевой (команды, ys+1=MFCCmod.(c) - МЧКК фрагменты шаблона, s=(0, 1, 2, …S-1) - номер фрагмента.where r (x s + 1 , y s + 1 ) are the elements of the deviation matrix, x s + 1 = MFCC comp. (c) vector MFCC of the incoming speech fragment ( commands, y s + 1 = MFCC mod. (c) - MFCC template fragments, s = (0, 1, 2, ... S-1) - number of the fragment.

- вычисление абсолютного отклонения (Евклидово расстояние) по формуле:- calculation of the absolute deviation (Euclidean distance) by the formula:

Figure 00000042
Figure 00000042

где d(xs+1, ys+1) - элементы матрицы отклонений.where d (x s + 1 , y s + 1 ) are the elements of the deviation matrix.

Использование двух способов вычисления отклонения, для определения оценки расхождения, повысит качество распознавания.The use of two methods of calculating the deviation, to determine the estimate of the discrepancy, will improve the quality of recognition.

Результатом сравнения будет, вектор, для которого было найдено минимальное расхождение между поступившей речевой командой и шаблоном. Далее вычисляется минимальная глобальная оценка расхождения для маршрута как сумма локальных расстояний между фрагментами речевой команды и шаблона:The result of the comparison will be the vector for which the minimum discrepancy between the incoming speech command and the pattern was found. Next, the minimum global estimate of the divergence for the route is calculated as the sum of the local distances between the fragments of the speech command and the pattern:

Figure 00000043
Figure 00000043

где G(i,j) - глобальная оценка для точки (i,j), d(i,j) - локальной оценка.where G (i, j) is a global estimate for the point (i, j), d (i, j) is a local estimate.

На фигуре 25 представлен результат определения расположения речевой команды в голосовом сигнале (выделен более жирно).Figure 25 shows the result of determining the location of the voice command in the voice signal (highlighted in bold).

После выполнения распознавания всех информативных признаков сигнала, осуществляется формирование командного слова, путем вычитания ЭМ из каждой речевой команды.After performing the recognition of all informative signal signs, the formation of the command word is carried out by subtracting the EM from each speech command.

Каждому командному слову, поступающему с блока нормализации МЧКК, соответствует выходной вектор β (см. фигуру 2), на основании которого формируется (или определяется) управляющая команда ci для контролируемого устройства.Each command word coming from the MCCC normalization unit corresponds to the output vector β (see figure 2), on the basis of which the control command c i is formed (or determined) for the controlled device.

Приведенное описание работы предлагаемой СБУРУ, по мнению авторов предлагаемого изобретения, показало, что введение дополнительных блоков в канале. анализа электроэнцефалографических сигналов и канале анализа голосовых сигналов обусловило появление новых свойств и повысило:The above description of the work of the proposed SBURU, in the opinion of the authors of the present invention, showed that the introduction of additional blocks in the channel. analysis of electroencephalographic signals and the analysis channel of voice signals led to the emergence of new properties and increased:

- надежность функционирования системы при формировании управляющей команды;- the reliability of the system when forming the control team;

- независимость и бесперебойность обеспечения связи между пользователем и контролируемым устройством (инвалидной коляской);- independence and continuity of communication between the user and the controlled device (wheelchair);

- безопасность доступа к использованию контролируемым устройством (инвалидной коляской);- safety of access to use by a controlled device (wheelchair);

сохранив при этом достоинства известного способа классификации электроэнцефалографических сигналов в интерфейсе мозг-компьютер.while retaining the advantages of the known method for classifying electroencephalographic signals in the brain-computer interface.

Технический результат [27] предлагаемого изобретения заключается в:The technical result [27] of the proposed invention consists in:

- разработке доступных для массового использования новых методов и средств бионического управления контролируемыми роботизированными устройствами в условиях ограниченных физических возможностей оператора, а также для реабилитации инвалидов, утративших двигательную активность;- development of new methods and means of bionic control of controlled robotic devices available for mass use in conditions of limited physical capabilities of the operator, as well as for the rehabilitation of disabled people who have lost motor activity;

- обработке электроэнцефалографических и голосовых сигналов, обеспечивающей повышенную достоверность распознавания управляющей команды;- processing of electroencephalographic and voice signals, providing increased reliability of recognition of the control command;

- повышение доступности контролируемого роботизированного устройства (инвалидная коляска) для всех групп парализованных пациентов, что соответствует условиям реализации национального проекта «Здравоохранение» в части, касающейся реабилитации инвалидов в рамках Федерального проекта «Развитие сети национальных медицинских исследовательских центров и внедрение инновационных медицинских технологий» [28].- increasing the accessibility of a controlled robotic device (wheelchair) for all groups of paralyzed patients, which corresponds to the conditions for the implementation of the national project "Health" in terms of rehabilitation of disabled people within the framework of the Federal project "Development of a network of national medical research centers and the introduction of innovative medical technologies" [28 ].

Источники информацииSources of information

1. Пат. 2364385 Российская Федерация, МПК А61Н 3/00. Носимое вспомогательное устройство, содействующее двигательной активности, и управляющая программа / Санкаи Иосиюки, заявитель и патентообладатель Юниверсити ОФ Цукуба. - №2007132169/14; заявл. 22.11.2005; опубл. 20.08.2009 Бюл. №23. - 60 с.1. Pat. 2364385 Russian Federation, IPC A61N 3/00. Wearable locomotion assistive device and control program / Sankai Yoshiyuki, Applicant and Patentee University PF Tsukuba. - No. 2007132169/14; declared November 22, 2005; publ. 20.08.2009 Bul. No. 23. - 60 p.

2. Пат. 2627818 Российская Федерация, МПК А61В 5/0488, A61F 2/54. Способ бионического управления техническими устройствами / Щукин С.И., Кобелев А.В., Сергеев И.К., Нарайкин О.С., заявители и патентообладатели Щукин С.И., Кобелев А.В., Сергеев И.К., Нарайкин О.С. - №2016109214; заявл. 15.03.2016; опубл. 11.08.2017 Бюл. №23. - 12 с.2. Pat. 2627818 Russian Federation, IPC А61В 5/0488, A61F 2/54. Method of bionic control of technical devices / Shchukin S.I., Kobelev A.V., Sergeev I.K., Naraikin O.S., applicants and patentees Shchukin S.I., Kobelev A.V., Sergeev I.K. , Naraikin O.S. - No. 2016109214; declared 03/15/2016; publ. 11.08.2017 Bul. No. 23. - 12 p.

3. Пат. 2415642 Российская Федерация, МПК А61В 5/0476 A61F2/72. Способ классификации электроэнцефалографических сигналов в интерфейсе мозг-компьютер / Владимирский Б.М. и др., заявитель и патентообладатель Министерство образования и науки Российской Федерации, Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет». - №2009133005/14; заявл. 03.09.2009; опубл. 10.04.2011 Бюл. №10. - 35 с.3. Pat. 2415642 Russian Federation, IPC А61В 5/0476 A61F2 / 72. Method of classification of electroencephalographic signals in the brain-computer interface / Vladimirsky B.M. and others, applicant and patentee of the Ministry of Education and Science of the Russian Federation, Federal State Autonomous Educational Institution of Higher Professional Education "Southern Federal University". - No. 2009133005/14; declared 09/03/2009; publ. 04/10/2011 Bul. No. 10. - 35 p.

4. Звездочкина Н.В. Исследование электрической активности головного мозга / Казань: Изд-во Казан, ун-т, 2014. - 59 с.4. Zvezdochkina N.V. Study of the electrical activity of the brain / Kazan: Kazan Publishing House, un-t, 2014. - 59 p.

5. Чернышева Е.Г., Чернышев Б.В. Практические занятия по прикладной психофизиологии / Москва: Изд-во ГУ-ВШЭ, 2010. - 54 с.5. Chernysheva E.G., Chernyshev B.V. Practical classes in applied psychophysiology / Moscow: Publishing house of the State University - Higher School of Economics, 2010. - 54 p.

6. GUFO.ME: [Электронный ресурс]. - Режим доступа: https://gufo.me/dict/bse/шум, свободный - (28.07.2020).6. GUFO.ME: [Electronic resource]. - Access mode: https://gufo.me/dict/bse/noise, free - (28.07.2020).

7. Толковый переводоведческий словарь: [Электронный ресурс]. - Режим доступа: https://znachenie-slova.ru/артефакт, свободный - (28.07.2020).7. Explanatory dictionary of translation: [Electronic resource]. - Access mode: https://znachenie-slova.ru/artefact, free - (28.07.2020).

8. Вохмина Ю.В., Еськов В.В., Горбунов Д.В., Шадрин Г.А. Хаотическая динамика параметров электроэнцефалограмм // Вестник новых медицинских технологий. - 2015. - Т. 22 - №2 - С.38 – 43.8. Vokhmina Yu.V., Eskov V.V., Gorbunov D.V., Shadrin G.A. Chaotic dynamics of parameters of electroencephalograms // Bulletin of new medical technologies. - 2015. - T. 22 - No. 2 - P.38 - 43.

9. Сушкова, О.С, Королев, М.С., Габова, А.В., Иллариошкин, С.Н., Карабанов, А.В., Обухов К.Ю., Обухов Ю.В. Совместный анализ сигналов электроэнцефалограмм, электромиограмм и механического тремора при болезни Паркинсона в ранней стадии // «Журнал радиоэлектроники». - 2014. - №5. - URL: http://jre.cplire.ru/jre/may14/index.html9. Sushkova, O.S., Korolev, M.S., Gabova, A.V., Illarioshkin, S.N., Karabanov, A.V., Obukhov K.Yu., Obukhov Yu.V. Joint analysis of signals from electroencephalograms, electromyograms and mechanical tremor in early Parkinson's disease // Journal of Radioelectronics. - 2014. - No. 5. - URL: http://jre.cplire.ru/jre/may14/index.html

10. Геллерт, Манфред. Все о командообразовании. Руководство для тренеров / пер. с нем. - Москва. Вершина. - 2006.10. Gellert, Manfred. All about team building. A guide for trainers / per. with him. - Moscow. Vertex. - 2006.

11. Официальный сайт Министерства здравоохранения РФ: [Электронный ресурс]. - Режим доступа: https://www.rosminzdrav.ru/ministry/61/22/stranitsa-979/statisticheskie-i-infomatsionnye-materialy/statisticheskie-materialy, свободный - (28.07.2020).11. Official site of the Ministry of Health of the Russian Federation: [Electronic resource]. - Access mode: https://www.rosminzdrav.ru/ministry/61/22/stranitsa-979/statisticheskie-i-infomatsionnye-materialy/statisticheskie-materialy, free - (28.07.2020).

12. Speech Technology and CRM magazines: [Электронный ресурс]. - Режим доступа: https://www.speechtechmag.com/Articles/Editorial/FYI/Speech-Market-to-Reach-$12-Billion-by-2022-112674.aspx, свободный - (28.07.2020).12. Speech Technology and CRM magazines: [Electronic resource]. - Access mode: https://www.speechtechmag.com/Articles/Editorial/FYI/Speech-Market-to-Reach-$12-Billion-by-2022-112674.aspx, free - (28.07.2020).

13. Группа ЦРТ. Распознавание голоса, синтез речи, запись и анализ, идентификация лица и голоса [Электронный ресурс]. - Режим доступа: https://www.speechpro.ru/, свободный - (06.08.2020).13. MDG group. Voice recognition, speech synthesis, recording and analysis, face and voice identification [Electronic resource]. - Access mode: https://www.speechpro.ru/, free - (06.08.2020).

14. Вентцель, Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения. - 2-е изд., стер. - М.: Высшая школа, 2000. - 480 с.14. Wentzel, E.S., Ovcharov L.A. Probability theory and its engineering applications. - 2nd ed., Erased. - M .: Higher school, 2000 .-- 480 p.

15. Перспективы развития систем распознавания речи (выдержка из исследования): [Электронный ресурс]. - Режим доступа: https://habr.com/ru/post/232613/, свободный - (06.08.2020).15. Prospects for the development of speech recognition systems (excerpt from the study): [Electronic resource]. - Access mode: https://habr.com/ru/post/232613/, free - (06/08/2020).

16. Лобанов Б.М., Цирульник Л.И. «Компьютерный синтез и клонирование речи». - Минск: «Белорусская Наука». - 2008. - 316 с.16. Lobanov B.M., Tsirulnik L.I. "Computer synthesis and speech cloning". - Minsk: "Belarusian Science". - 2008 .-- 316 s.

17. Колесникова, Л.Л. Анатомия, физиология и биомеханика зубочелюстной системы / Под редакцией Л.Л. Колесникова и др. - М.: ГЭОТАР-Медиа, 2009. - 304 с.17. Kolesnikova, L.L. Anatomy, physiology and biomechanics of the dentition / Edited by L.L. Kolesnikova and others - M .: GEOTAR-Media, 2009 .-- 304 p.

18. IT Консалтинг: [Электронный ресурс]. - Режим доступа: http://www.terralab.ru/299680/?rl=rss&r2=remote, свободный - (06.08.2020).18. IT Consulting: [Electronic resource]. - Access mode: http://www.terralab.ru/299680/?rl=rss&r2=remote, free - (06/08/2020).

19. Простые интересные радиосхемы сделанные своими руками: [Электронный ресурс]. - Режим доступа: httys://radioskot.ru/publ/unch/skhema_dlja_golosovogo_upravlenija/6-1-0-914, свободный - (06.08.2020).19. Simple interesting DIY radio circuits: [Electronic resource]. - Access mode: httys: //radioskot.ru/publ/unch/skhema_dlja_golosovogo_upravlenija/6-1-0-914, free - (06.08.

20. Amazon Echo: [Электронный ресурс]. - Режим доступа: https://voiceapp.ru/articles/amazon-echo-review, свободный - (06.08.2020).20. Amazon Echo: [Electronic resource]. - Access mode: https://voiceapp.ru/articles/amazon-echo-review, free - (06/08/2020).

21. Google Ассистент: [Электронный ресурс]. - Режим доступа: https://voiceapp.ru/articles/google-assistant-download, свободный - (06.08.2020).21. Google Assistant: [Electronic resource]. - Access mode: https://voiceapp.ru/articles/google-assistant-download, free - (06.08.2020).

22. Голосовой помощник Siri: [Электронный ресурс]. - Режим доступа: https://voiceapp.ru/articles/siri, свободный - (06.08.2020).22. Siri voice assistant: [Electronic resource]. - Access mode: https://voiceapp.ru/articles/siri, free - (06/08/2020).

23. Microsoft Cortana: [Электронный ресурс]. - Режим доступа: https://ai-golos.ru/microsoft/microsoft-cortana-est-li-polza-v-nyneshnih-realiyah/свободный - (06.08.2020).23. Microsoft Cortana: [Electronic resource]. - Access mode: https://ai-golos.ru/microsoft/microsoft-cortana-est-li-polza-v-nyneshnih-realiyah/free - (06.08.

24. Алиса - голосовой помощник от Яндекс: [Электронный ресурс]. - Режим доступа: https://voiceapp.ru/articles/alisa, свободный - (06.08.2020).24. Alice - a voice assistant from Yandex: [Electronic resource]. - Access mode: https://voiceapp.ru/articles/alisa, free - (06/08/2020).

25. Волкова И.А. Введение в компьютерную лингвистику. Практические аспекты создания лингвистических процессоров. Учебное пособие для студентов факультета ВМК МГУ. - Издательский отдел факультета ВМК МГУ им. М.В.Ломоносова Москва, 2006. - 44 с.25. Volkova I.A. Introduction to Computational Linguistics. Practical aspects of creating linguistic processors. Textbook for students of the Faculty of CMC MSU. - Publishing Department of the Faculty of Computational Mathematics and Cybernetics, Moscow State University M.V. Lomonosov Moscow, 2006 .-- 44 p.

26. The Hilbert-Huang transform an4 its applications / editors, Norden E. Huang, Samuel S.P. Shen. - World Scientific Publishing Co. Pte. Ltd. 5 TohTuck.Link, Singapore 596224.26. The Hilbert-Huang transform an4 its applications / editors, Norden E. Huang, Samuel S.P. Shen. - World Scientific Publishing Co. Pte. Ltd. 5 TohTuck.Link, Singapore 596224.

27. Об утверждении Административного регламента предоставления Федеральной службой по интеллектуальной собственности государственной услуги по государственной регистрации изобретения и выдаче патента на изобретение, его дубликата: Приказ Минэкономразвития России от 25.05.2016 №315 (ред. от 07.06.2017) (Зарегистрировано в Минюсте России 14.07.2016 №42843).27. On approval of the Administrative Regulations for the provision by the Federal Service for Intellectual Property of the state service for the state registration of an invention and the issuance of a patent for an invention, its duplicate: Order of the Ministry of Economic Development of Russia dated 05.25.2016 No. 315 (revised on 07.06.2017) (Registered with the Ministry of Justice of Russia on 14.07 .2016 # 42843).

28. Национальный проект «Здравоохранение»: [Электронный ресурс]. - Режим доступа: https://strategy24.ru/rf/health/projects/natsionalnyy-proekt-zdravookhranenie, свободный - (06.08.2020).28. National project "Health": [Electronic resource]. - Access mode: https://strategy24.ru/rf/health/projects/natsionalnyy-proekt-zdravookhranenie, free - (06.08.

Claims (4)

1. Способ бионического управления роботизированными устройствами, осуществляющий формирование мысленной команды, формирование канала анализа электроэнцефалографических сигналов, в котором осуществляют формирование сигнала ЭЭГ, соответствующего мысленной команде, регистрацию сигнала ЭЭГ, формирование обучающей выборки сигналов ЭЭГ, обучение нейронной сети, нейросетевой анализ зарегистрированного сигнала ЭЭГ, формирование управляющей команды для контролируемого роботизированного устройства и исполнение команды контролируемым роботизированным устройством, отличающийся тем, что дополнительно осуществляется: комбинированный анализ ЭЭГ в канале анализа электроэнцефалографических сигналов, причем при комбинированном анализе ЭЭГ осуществляют выявление ЭЭГ признаков мысленной команды в частотно-временной и амплитудно-фазовой областях; выбор результата комбинированного анализа ЭЭГ, причем при выборе результата комбинированного анализа ЭЭГ принимается окончательное решение на основании частных решений, полученных в результате анализа ЭЭГ разными методами; формирование канала анализа голосового сигнала, в котором осуществляется формирование словаря голосовых команд, генерация акустических колебаний голосовым аппаратом человека, обеспечение доступа пользования контролируемым роботизированным устройством при помощи аутентификации голоса пользователя, формирование слова путем преобразования акустического колебания в электрический сигнал с помощью микрофона, фильтрации на основании преобразования Гильберта-Хуанга и идентификации слова путем сравнения со словами из словаря голосовых команд.1. The method of bionic control of robotic devices, carrying out the formation of a mental command, the formation of a channel for the analysis of electroencephalographic signals, in which the formation of an EEG signal corresponding to a mental command, registration of an EEG signal, formation of a training sample of EEG signals, training of a neural network, neural network analysis of a registered EEG signal is carried out, formation of a control command for a controlled robotic device and execution of a command by a controlled robotic device, characterized in that it is additionally carried out: combined analysis of the EEG in the analysis channel of electroencephalographic signals, and in the combined analysis of the EEG, the EEG signs of a mental command are identified in the time-frequency and amplitude-phase regions ; selection of the result of the combined EEG analysis, and when choosing the result of the combined EEG analysis, a final decision is made based on particular decisions obtained as a result of EEG analysis by different methods; formation of a voice signal analysis channel, in which a vocabulary of voice commands is formed, acoustic oscillations are generated by the human vocal apparatus, access to a controlled robotic device is provided by means of user voice authentication, a word is formed by converting acoustic oscillations into an electrical signal using a microphone, filtering based on transformation Hilbert-Huang and word identification by comparison with words from the voice command dictionary. 2. Способ по п.1, отличающийся тем, что анализ ЭЭГ в частотно-временной области осуществляется путем определения частотно-временных параметров ЭЭГ, определения ЭЭГ признаков мысленной команды в частотно-временной области, сравнения частотно-временных параметров ЭЭГ с признаками мысленной команды в частотно-временной области, выдачи заключения «Наличие признаков мысленной команды» в случае совпадения при сравнении и выдачи заключения «Признаков мысленной команды не обнаружено» в случае несовпадения при сравнении.2. The method according to claim 1, characterized in that the analysis of the EEG in the time-frequency domain is carried out by determining the time-frequency parameters of the EEG, determining the EEG signs of a mental command in the time-frequency domain, comparing the time-frequency parameters of the EEG with the signs of a mental command in time-frequency domain, issuing the conclusion "The presence of signs of a mental command" in case of coincidence when comparing and issuing the conclusion "No signs of a mental command were found" in case of mismatch during comparison. 3. Способ по п.1, отличающийся тем, что анализ ЭЭГ в амплитудно-фазовой области осуществляется путем определения амплитудно-фазовых параметров ЭЭГ, определения ЭЭГ признаков мысленной команды в амплитудно-фазовой области, сравнения амплитудно-фазовых параметров ЭЭГ с ЭЭГ признаками мысленной команды амплитудно-фазовой области, выдачи заключения «Наличие признаков мысленной команды» в случае совпадения результата сравнения и выдачи заключения «Признаков мысленной команды не обнаружено» в случае несовпадения результата сравнения.3. The method according to claim 1, characterized in that the analysis of the EEG in the amplitude-phase region is carried out by determining the amplitude-phase parameters of the EEG, determining the EEG signs of a mental command in the amplitude-phase region, comparing the amplitude-phase parameters of the EEG with the EEG signs of a mental command the amplitude-phase area, issuing the conclusion "The presence of signs of a mental command" in the case of a coincidence of the comparison result and issuing the conclusion "No signs of a mental command were found" in the case of a mismatch of the comparison result. 4. Способ по п.1, отличающийся тем, что реализуется посредством системы, которая содержит последовательно соединенные энцефалограф, аналого-цифровой преобразователь, процессор компьютера, адаптер контролируемого роботизированного устройства и контролируемое роботизированное устройство, при этом электродная система энцефалографа размещается на голове пользователя, причем система дополнительно содержит последовательно соединенные микрофон и звуковую карту компьютера, соединенную со вторым входом процессора компьютера.4. The method according to claim 1, characterized in that it is implemented by means of a system that contains a serially connected encephalograph, an analog-to-digital converter, a computer processor, an adapter of a controlled robotic device and a controlled robotic device, wherein the electrode system of the encephalograph is placed on the user's head, and the system additionally contains a serially connected microphone and a computer sound card connected to the second input of the computer processor.
RU2020127511A 2020-12-14 2020-12-14 Method and system for bionic control of robotic devices RU2759310C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2020127511A RU2759310C1 (en) 2020-12-14 2020-12-14 Method and system for bionic control of robotic devices

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2020127511A RU2759310C1 (en) 2020-12-14 2020-12-14 Method and system for bionic control of robotic devices

Publications (1)

Publication Number Publication Date
RU2759310C1 true RU2759310C1 (en) 2021-11-11

Family

ID=78607278

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020127511A RU2759310C1 (en) 2020-12-14 2020-12-14 Method and system for bionic control of robotic devices

Country Status (1)

Country Link
RU (1) RU2759310C1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11203022A (en) * 1998-01-16 1999-07-30 Technos Japan:Kk Method and device for applying biological signal as device control signal
RU2415642C1 (en) * 2009-09-03 2011-04-10 Российская Федерация, в лице которой выступает Министерство образования и науки Российской Федерации Method of classification of electroencephalographic signals in interface brain-computer
EP2486897A2 (en) * 2001-10-29 2012-08-15 Duke University Closed loop brain machine interface
US20180178008A1 (en) * 2015-06-02 2018-06-28 Battelle Memorial Institute Systems for neural bridging of the nervous system
RU2661756C2 (en) * 2016-08-30 2018-07-19 Федеральное государственное автономное образовательное учреждение высшего образования "Балтийский федеральный университет имени Иммануила Канта" Brain computer interface device for remote control of exoskeleton

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11203022A (en) * 1998-01-16 1999-07-30 Technos Japan:Kk Method and device for applying biological signal as device control signal
EP2486897A2 (en) * 2001-10-29 2012-08-15 Duke University Closed loop brain machine interface
EP2486897A3 (en) * 2001-10-29 2012-09-12 Duke University Closed loop brain machine interface
RU2415642C1 (en) * 2009-09-03 2011-04-10 Российская Федерация, в лице которой выступает Министерство образования и науки Российской Федерации Method of classification of electroencephalographic signals in interface brain-computer
US20180178008A1 (en) * 2015-06-02 2018-06-28 Battelle Memorial Institute Systems for neural bridging of the nervous system
RU2661756C2 (en) * 2016-08-30 2018-07-19 Федеральное государственное автономное образовательное учреждение высшего образования "Балтийский федеральный университет имени Иммануила Канта" Brain computer interface device for remote control of exoskeleton

Similar Documents

Publication Publication Date Title
Schultz et al. Biosignal-based spoken communication: A survey
Meltzner et al. Silent speech recognition as an alternative communication device for persons with laryngectomy
Jorgensen et al. Speech interfaces based upon surface electromyography
CN117130490B (en) A brain-computer interface control system and its control method and implementation method
Dash et al. Decoding speech from single trial MEG signals using convolutional neural networks and transfer learning
Vojtech et al. Surface electromyography–based recognition, synthesis, and perception of prosodic subvocal speech
Chen et al. A common spatial pattern and wavelet packet decomposition combined method for EEG-based emotion recognition
Tran et al. Stethoscope-sensed speech and breath-sounds for person identification with sparse training data
Patil et al. The physiological microphone (PMIC): A competitive alternative for speaker assessment in stress detection and speaker verification
Soon et al. Speech recognition using facial sEMG
Rong A novel hierarchical framework for measuring the complexity and irregularity of multimodal speech signals and its application in the assessment of speech impairment in amyotrophic lateral sclerosis
Tan et al. Extracting spatial muscle activation patterns in facial and neck muscles for silent speech recognition using high-density sEMG
Zhu et al. Automatic speech recognition in different languages using high-density surface electromyography sensors
Pereira et al. Physiotherapy Exercises Evaluation using a Combined Approach based on sEMG and Wearable Inertial Sensors.
Meltzner et al. Speech recognition for vocalized and subvocal modes of production using surface EMG signals from the neck and face.
Wand Advancing electromyographic continuous speech recognition: Signal preprocessing and modeling
US11969256B2 (en) Systems and methods for the acute evaluation of traumatic brain injuries
RU2759310C1 (en) Method and system for bionic control of robotic devices
Sharan et al. Emotion recognition from speech signals by Mel-spectrogram and a CNN-RNN
Shafiq et al. A fusion of EMG and IMU for an augmentative speech detection and recognition system
Talaat et al. Schlieren imaging and video classification of alphabet pronunciations: exploiting phonetic flows for speech recognition and speech therapy
Schultz ICCHP keynote: Recognizing silent and weak speech based on electromyography
Al-Anbary et al. A Survey of Eeg Signals Prepossessing and Classification for Imagined Speech Application
Barrett Measurement of feedback in voice control and application in predicting and reducing stuttering using machine learning
Sharma et al. Human-Computer Interaction with Special Emphasis on Converting Brain Signals to Speech