[go: up one dir, main page]

RU2527212C1 - Модифицированный интеллектуальный контроллер - Google Patents

Модифицированный интеллектуальный контроллер Download PDF

Info

Publication number
RU2527212C1
RU2527212C1 RU2013111106/08A RU2013111106A RU2527212C1 RU 2527212 C1 RU2527212 C1 RU 2527212C1 RU 2013111106/08 A RU2013111106/08 A RU 2013111106/08A RU 2013111106 A RU2013111106 A RU 2013111106A RU 2527212 C1 RU2527212 C1 RU 2527212C1
Authority
RU
Russia
Prior art keywords
block
kalman filter
action
input
output
Prior art date
Application number
RU2013111106/08A
Other languages
English (en)
Inventor
Владимир Игнатьевич Ключко
Евгений Александрович Шумков
Игорь Константинович Чистик
Original Assignee
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Кубанский государственный технологический университет" (ФГБОУ ВПО "КубГТУ")
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Кубанский государственный технологический университет" (ФГБОУ ВПО "КубГТУ") filed Critical Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Кубанский государственный технологический университет" (ФГБОУ ВПО "КубГТУ")
Priority to RU2013111106/08A priority Critical patent/RU2527212C1/ru
Application granted granted Critical
Publication of RU2527212C1 publication Critical patent/RU2527212C1/ru

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

Изобретение относится к классу интеллектуальных контроллеров, использующих принцип обучения с подкреплением, фильтр Калмана, и может использоваться для создания систем управления объектами, работающими в недетерминированной среде. Технический результат заключается в повышении скоростных и адаптационных параметров работы за счет введения в устройство блока корректировки фильтра Калмана. Технический результат достигается благодаря модифицированному интеллектуальному контроллеру, который содержит объект управления, решатель, блок расчета подкрепления, блок корректировки фильтра Калмана, блок действий, блок выбора действий, блок отбора действий, фильтр Калмана, память фильтра Калмана и блок занесения действий. 1 ил.

Description

Изобретение относится к классу интеллектуальных контроллеров, использующих принцип обучения с подкреплением, фильтр Калмана, и может использоваться для создания систем управления объектами, работающими в недетерминированной среде.
Известен патент США, МПК G06F 15/18 6532454 «Stable adaptive control using critic designs», который реализует обучение с подкреплением с использованием нейронных сетей. Устройство по данному патенту состоит из решателя, моделирующей нейронной сети, блока критики, а также блока вычисления ошибки прогнозирования и связей между блоками.
Принцип работы устройства по патенту США, МПК G06F 15/18 6532454 следующий - решатель (в его качестве выступает нейронная сеть) получает значение подкрепления, вычисляет действие на данной итерации и передает его на моделирующую нейронную сеть, которая вычисляет прогнозное значение рабочего параметра системы. После выполнения действия система получает реальное значение рабочего параметра, критик вычисляет новое значение подкрепления и корректируется работа моделирующей нейронной сети.
Недостатками устройств по патенту МПК G06F 15/18 6532454 является то, что в них не запоминается история работы системы и критик работает по первоначально настроенным параметрам.
Известен также модифицированный интеллектуальный контроллер на базе фильтра Калмана с использованием принципа обучения с подкреплением - патент МПК G06F 15/18 2458390. Данное устройство состоит из объекта управления, решателя, блока расчета подкрепления, блока действий, блока выбора действий, фильтра Калмана и памяти фильтра Калмана. Выходы объекта управления связаны с решателем, блоком расчета подкрепления и блоком действий, выходы блока действий связаны с решателем, фильтром Калмана и блоком выбора действий, блок расчета подкрепления связан с блоком действий и фильтром Калмана, фильтр Калмана соединен с памятью фильтра Калмана и блоком выбора действий;
память фильтра Калмана соединена с фильтром Калмана, а выходы блока выбора действий соединены с объектом управления, памятью фильтра Калмана и блоком действий.
Принцип работы устройства по патенту МПК G06F 15/18 2458390 следующий - решатель вычисляет наблюдаемый параметр системы, блок действий выбирает возможные действия в данной ситуации, фильтр Калмана последовательно рассчитывает прогноз подкрепления при совершении отобранных действий, блок выбора действий выбирает конкретное действие, основываясь на расчетах фильтра Калмана, и подает его на объект управления. Выбранное действие и получившееся подкрепление заносятся в блок действий.
Недостатками устройств по патенту МПК G06F 15/18 2458390 являются - невозможность изменения формул фильтра Калмана в режиме реального времени при изменении поведения окружающей среды.
Задача - разработка модифицированного интеллектуального контроллера с высокими скоростными и адаптационными характеристиками быстродействия.
Техническим результатом предлагаемого устройства является повышение скоростных и адаптационных параметров работы.
Технический результат достигается тем, что в модифицированном интеллектуальном контроллере, содержащем объект управления, решатель, блок расчета подкрепления, блок действий, фильтр Калмана, память фильтра Калмана, блок выбора действий, первый выход объекта управления связан с входом решателя, выход решателя связан с первым входом фильтра Калмана, второй выход блока расчета подкрепления связан с вторым входом фильтра Калмана, первый выход фильтра Калмана связан с вторым входом блока выбора действий, второй выход фильтра Калмана связан с первым входом памяти фильтра Калмана, первый выход блока выбора действий связан с входом объекта управления, второй выход блока выбора действий связан с вторым входом памяти фильтра Калмана, первый выход памяти фильтра Калмана связан с четвертым входом фильтра Калмана, при этом в него введены блок отбора действий, блок корректировки фильтра Калмана и блок занесения действий, при этом первый выход объекта управления также связан с первым входом блока отбора действий, второй выход объекта управления связан с входом блока расчета подкрепления, первый выход блока отбора действий связан с первым входом блока действий, второй выход блока отбора действий связан с первым входом блока выбора действий и третьим входом фильтра Калмана, выход блока действий связан со вторым входом блока отбора действий, первый выход блока расчета подкрепления связан с первым входом блока занесения действий, второй выход блока расчета подкрепления также связан с первым входом блока корректировки фильтра Калмана, выход блока корректировки фильтра Калмана связан с пятым входом фильтра Калмана, третий выход фильтра Калмана связан со вторым входом блока корректировки фильтра Калмана, первый выход блока выбора действий также связан со вторым входом блока занесения действий, выход блока занесения действий связан со вторым входом блока действий.
Повышение адаптационных параметров работы устройства достигается за счет того, что в устройство введен блок корректировки фильтра Калмана. Выделение из блока действий блока отбора действий и блока занесения действий повышает скоростные характеристики работы устройства.
Таким образом, совокупность существующих признаков, изложенных в формуле изобретения, позволяет достичь желаемый технический результат.
На фиг.1 изображена схема модифицированного интеллектуального контроллера с фильтром Калмана.
Система состоит из нескольких структурных компонент: объекта управления 1, блока отбора действий 2, решателя 3, блока расчета подкрепления 4, блока занесения действий 5, блока действий 6, блока корректировки фильтра Калмана 7, фильтра Калмана 8, памяти фильтра Калмана 9 и блока выбора действий 10.
Также в системе присутствуют следующие связи: объект управления соединен с решателем по связи 11, с блоком отбора действий по связи 12 и с блоком расчета подкрепления по 13, от блока отбора действий идет связь 14 на фильтр Калмана и 15 на блок выбора действий и связь 16 на блок действий. От блока действий идет связь 17 на блок отбора действий. От блока расчета подкрепления идут связи 18 на блок занесения действий, 19 на блок корректировки фильтра Калмана и 20 на фильтр Калмана. От фильтра Калмана идет связь на блок корректировки фильтра Калмана 21 и от блока корректировки фильтра Калмана идет связь 22 на фильтр Калмана. Решатель и фильтр Калмана соединены по 23. От фильтра Калмана идет связь 14 на блок выбора действий. От памяти фильтра Калмана идет связь 25 на фильтр Калмана и от фильтра Калмана идет связь 26 на память фильтра Калмана. Блок выбора действий соединен с памятью фильтра Калмана по связи 27. От блока выбора действий идут связи 28 на объект управления и 29 на блок занесения действий. Блок занесения действий соединен связью 30 с блоком действий.
Блок отбора действий 2 предназначен для отбора всех возможных действий в данной ситуации с учетом минимального накопленного подкрепления для возможного действия
Решатель 3 - это устройство, которое реализует математическую формулу (или несколько формул), описывающую те переменные объекта управления, которые можно непосредственно вычислить.
Блок расчета подкрепления 4 реализует математическую формулу, рассчитывающую реальное значение подкрепления, после того как сигнал действия (управления) отработан объектом управления 1.
Блок занесения действий 5 предназначен для внесения корректировок в блок действий. Данный блок обновляет значение накопленного подкрепления в ячейке выбранного действия на предыдущей итерации после отработки действия объектом управления.
Блок действий 6 хранит таблицу возможных действий в конкретных ситуациях и накопленное подкрепление для пар ситуация - действие.
Блок корректировки фильтра Калмана 7 предназначен для изменения структуры формул фильтра Калмана в случае, если окружающая среда сильно изменилась и текущие настройки фильтра Калмана не позволяют предсказывать подкрепление с достаточной точностью.
Фильтр Калмана 8 предназначен для вычисления ненаблюдаемой величины. Фильтр Калмана выполняется в стандартном исполнении, например, по патенту США МПК G06F 15/20 №5115391.
Память фильтра Калмана 9 предназначена для временного хранения параметров блока фильтра Калмана 8. Блок хранит столько наборов параметров фильтра Калмана, сколько выбрано возможных действий в блоке действий 6.
Блок выбора действий 10 предназначен для выбора действия из возможных в данной ситуации на базе "жадного правила".
Принцип работы интеллектуального контроллера следующий. Объект управления 1 выполняет действие и формирует на выходе сигнал состояния (в общем случае - вектор). Далее сигнал состояния поступает по связи 11 на решатель 3 и по связи 12 блок отбора действий 2. Блок отбора действий 2, получая сигнал состояния объекта, управления посылает запрос по связи 16 в блок действий 6 о возможных действиях в данной ситуации, указывая минимальное накопленное подкрепление, с которым можно выбирать действие (минимально накопленное подкрепление указывается разработчиком). Блок действий 6 в ответ формирует список возможных действий в данной ситуации и последовательно по связи 17 посылает их на блок отбора действий 2, который в свою очередь отправляет их на фильтр Калмана 8 по 14. Решатель 3, получив сигнал от объекта управления, рассчитывает наблюдаемый сигнал 23, который идет на фильтр Калмана 8.
Фильтр Калмана 8, получая возможное действие от блока отбора действий 2 и наблюдаемый сигнал 23 от решателя 3, рассчитывает возможное подкрепление для каждого возможного действия. При этом фильтр Калмана получая новое значение возможного действия, записывает в память фильтра Калмана 9 свои параметры по связи 26 и восстанавливает предыдущие по 25 (на начало текущего цикла управления). После расчета подкрепления для каждого возможного действия, фильтр Калмана 8 передает значение подкрепления по 24 на блок выбора действий 10, который также получает возможные действия по 15 от блока отбора действий 2. Блок выбора действий 10, на базе «жадного правила», которое можно записать как: с вероятностью (1 - s) выбирается то действие, которому соответствует максимальное значение подкрепления R i P R ( t + 1 )
Figure 00000001
, при этом 0<ε<<1 (Sutton R., Barto A. Reinforcement Learning: An Introduction. - Cambridge: MIT Press, 1998). Выбранное действие передается по 29 на блок занесения действий 5 и по 28 объект управления 1. Блок занесения действий запоминает текущее выбранное действие, а также получает рассчитанное реальное подкрепление после отработки объектом управления предыдущего действия по 18 и заносит данное подкрепление по связи 30 в ячейку к предыдущей паре ситуация - действие в блоке действий 6. Выбранное действие также посылается в память фильтра Калмана 9 и восстанавливает параметры фильтра Калмана 8 для выбранного действия. Блок корректировки фильтра Калмана 7 включается в работу в том случае, если фильтр Калмана 8 за заданное разработчиком количество итераций ошибается в прогнозе подкрепления больше, чем на определенную величину (задается разработчиком). При этом реальное подкрепление идет по сигналу 19 от блока расчета подкрепления 4, а прогнозное значение подкрепления идет от фильтра Калмана 8 по 21. Корректировка формул фильтра Калмана 8 идет по связи 22. Корректировка параметров фильтра Калмана 8 происходит по заложенному разработчиком алгоритму.

Claims (1)

  1. Модифицированный интеллектуальный контроллер, содержащий объект управления, решатель, блок расчета подкрепления, блок действий, фильтр Калмана, память фильтра Калмана, блок выбора действий, первый выход объекта управления связан с входом решателя, выход решателя связан с первым входом фильтра Калмана, второй выход блока расчета подкрепления связан с вторым входом фильтра Калмана, первый выход фильтра Калмана связан с вторым входом блока выбора действий, второй выход фильтра Калмана связан с первым входом памяти фильтра Калмана, первый выход блока выбора действий связан с входом объекта управления, второй выход блока выбора действий связан с вторым входом памяти фильтра Калмана, первый выход памяти фильтра Калмана связан с четвертым входом фильтра Калмана, отличающийся тем, что в него введены блок отбора действий, блок корректировки фильтра Калмана и блок занесения действий, при этом первый выход объекта управления также связан с первым входом блока отбора действий, второй выход объекта управления связан с входом блока расчета подкрепления, первый выход блока отбора действий связан с первым входом блока действий, второй выход блока отбора действий связан с первым входом блока выбора действий и третьим входом фильтра Калмана, выход блока действий связан со вторым входом блока отбора действий, первый выход блока расчета подкрепления связан с первым входом блока занесения действий, второй выход блока расчета подкрепления также связан с первым входом блока корректировки фильтра Калмана, выход блока корректировки фильтра Калмана связан с пятым входом фильтра Калмана, третий выход фильтра Калмана связан со вторым входом блока корректировки фильтра Калмана, первый выход блока выбора действий также связан со вторым входом блока занесения действий, выход блока занесения действий связан со вторым входом блока действий.
RU2013111106/08A 2013-03-12 2013-03-12 Модифицированный интеллектуальный контроллер RU2527212C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2013111106/08A RU2527212C1 (ru) 2013-03-12 2013-03-12 Модифицированный интеллектуальный контроллер

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013111106/08A RU2527212C1 (ru) 2013-03-12 2013-03-12 Модифицированный интеллектуальный контроллер

Publications (1)

Publication Number Publication Date
RU2527212C1 true RU2527212C1 (ru) 2014-08-27

Family

ID=51456408

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013111106/08A RU2527212C1 (ru) 2013-03-12 2013-03-12 Модифицированный интеллектуальный контроллер

Country Status (1)

Country Link
RU (1) RU2527212C1 (ru)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532454B1 (en) * 1998-09-24 2003-03-11 Paul J. Werbos Stable adaptive control using critic designs
US6676307B1 (en) * 2000-06-14 2004-01-13 Ciena Corporation Method and system for controlling splice attenuation
US6882992B1 (en) * 1999-09-02 2005-04-19 Paul J. Werbos Neural networks for intelligent control
US7323036B2 (en) * 2004-08-27 2008-01-29 Alstom Technology Ltd Maximizing regulatory credits in controlling air pollution
US7810133B2 (en) * 2002-08-23 2010-10-05 Exit-Cube, Inc. Encrypting operating system
RU2458390C1 (ru) * 2011-04-05 2012-08-10 Государственное образовательное учреждение высшего профессионального образования "Кубанский государственный технологический университет" (ГОУ ВПО "КубГТУ") Модифицированный интеллектуальный контроллер

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532454B1 (en) * 1998-09-24 2003-03-11 Paul J. Werbos Stable adaptive control using critic designs
US6882992B1 (en) * 1999-09-02 2005-04-19 Paul J. Werbos Neural networks for intelligent control
US6676307B1 (en) * 2000-06-14 2004-01-13 Ciena Corporation Method and system for controlling splice attenuation
US7810133B2 (en) * 2002-08-23 2010-10-05 Exit-Cube, Inc. Encrypting operating system
US7323036B2 (en) * 2004-08-27 2008-01-29 Alstom Technology Ltd Maximizing regulatory credits in controlling air pollution
RU2458390C1 (ru) * 2011-04-05 2012-08-10 Государственное образовательное учреждение высшего профессионального образования "Кубанский государственный технологический университет" (ГОУ ВПО "КубГТУ") Модифицированный интеллектуальный контроллер

Similar Documents

Publication Publication Date Title
Tsoukalas et al. Multiobjective optimisation on a budget: Exploring surrogate modelling for robust multi-reservoir rules generation under hydrological uncertainty
CN110244619B (zh) 一种摇杆校准方法、装置以及遥控装置
WO2017213857A1 (en) System for iteratively training an artificial intelligence using cloud-based metrics
JP6601577B2 (ja) 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム
CN108621159A (zh) 一种基于深度学习的机器人动力学建模方法
CN102713859B (zh) 用于使电厂的热效率最大化的系统及方法
EP3200038A1 (en) Model evaluation device, model evaluation method, and program recording medium
US10048658B2 (en) Information processing device, predictive control method, and recording medium
CN106662847A (zh) 用于借助于仿真模块的计算机辅助的设施控制优化的方法
CN110481536A (zh) 一种应用于混合动力汽车的控制方法及设备
CN106796533A (zh) 自适应地选择执行模式的系统和方法
CN110247396A (zh) 基于自适应抗差无迹卡尔曼滤波的配电网状态估计方法及系统
CN103268069A (zh) 基于Hammerstein模型的自适应预测控制方法
CN103984986A (zh) 实时校正的自学习arma模型风电功率超短期预测方法
CN103761420A (zh) 一种火电设备性能逐步回归评测方法
Vrabie et al. Continuous-time ADP for linear systems with partially unknown dynamics
CN112131716B (zh) 一种用于电力电子化电力系统的随机电磁暂态分析方法及系统
JP2015148934A (ja) 発電量予測装置および発電量予測方法
RU2527212C1 (ru) Модифицированный интеллектуальный контроллер
RU2458390C1 (ru) Модифицированный интеллектуальный контроллер
CN115616985A (zh) 一种基于数据的系统自触发状态闭环控制方法
CN110851911A (zh) 终端状态计算模型训练方法、控制序列搜索方法及装置
CN113404742B (zh) 一种基于测试数据的电液伺服机构健康评估方法及系统
CN111930602B (zh) 性能指标预测方法及装置
CN105447598A (zh) 一种基于误差修正模型的电力系统中负荷预测装置及方法

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20150313