СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ 
Рассмотрена проблема стабилизации состояния равновесия в нелинейной системе в присутствии шумов, для чего недостаточно решить локальную задачу стабилизации, а необходимо также обеспечить непрерывный мониторинг возможного события перехода в критическое состояние, ведущее к отказу системы. Для организации такого мониторинга мы используем принцип больших уклонений в применении к динамическим системам с малыми возмущениями. Для целей мониторинга имеет значение оптимальный путь, который назван нами А-профилем критического состояния. А-профиль используется для построения ситуационного прогноза в задаче управления рисками многоагентной системы. Кроме нелинейного механизма внутренней стабилизации уровня h для каждого из агентов существуют силы взаимодействия среднего поля между агентами. Слабый предел в этой модели с числом агентов, стремящимся к бесконечности, описывается уравнением Фокера-Планка-Колмогорова, но использование приближения с точностью до O(h2) приводит к конечномерной схеме Вентцеля-Фрейдлина. Согласно этой схеме мы получаем в явном виде A-профиль как решение вырожденного уравнения Абеля второго рода. В то же время аппроксимация по h позволяет разработать метод последовательных приближений для построения A-профиля. В настоящей работе А-профиль синтезируется в результате решения задачи оптимального управления с обратной связью, где используется метод уравнения Риккати, зависящего от состояния, и метод аппроксимирующей последовательности уравнений Риккати. Каждый из этих методов имеет свои преимущества и недостатки. В статье эти методы применяются и сравниваются в рамках задачи управления рисками.
Обсуждаются вопросы целесообразности использования средств адаптации в робастных системах управления. Констатируется, что чисто робастные системы без использования средств адаптации в принципе не могут обеспечивать высокую эффективность и универсальность при решении практических задач.
Постановка задачи синтеза управления в условиях неопределенности без элементов адаптации, образно говоря, подобна "поиску черной кошки в темной комнате, особенно, если ее там нет" (Конфуций).
Наиболее адекватным с точки зрения соответствия фундаментальным принципам теории автоматического управления является подход, основанный на увеличении коэффициента усиления разомкнутого контура. Тем не менее, и здесь возникает своя проблема — увеличение коэффициента усиления нарушает устойчивость замкнутой системы. Все известные исследования сконцентрированы вокруг решения этой проблемы.
Исследуются предельные робастные системы с большим коэффициентом усиления, синтезированные на основе метода функции Ляпунова. В целях экономии энергии управления предлагается не использовать экстремальное значение коэффициента усиления, соответствующего доминирующей неопределенности, а осуществить его самонастройку в реальном времени по мере изменения характеристик неопределенного объекта и внешней среды. Разработан интегральный алгоритм самонастройки коэффициента усиления и соответствующая схемотехническая и Simulink-схема реализации. Достоверность теоретических рассуждений проверена путем имитационного моделирования предельной робастной системы с самонастройкой и параметрически неопределенным объектом — пикового гироскопа (параметрического маятника). Компьютерные исследования позволили сделать ряд положительных выводов, имеющих важное прикладное значение.
Принцип обучения с подкреплением основан на взаимодействии агента с окружением в целях максимизации своей награды. Обучение с подкреплением показывает очень хорошие результаты в решении различных задач управления. Тем не менее, попытки обучить интеллектуального агента эффективно решать несколько задач страдают от проблемы так называемого "катастрофического забывания". Полученные агентом знания об одной задаче вытесняются информацией в ходе выработки правильной стратегии для другой. Одним из методов предотвращения катастрофического забывания при многозадачном обучении является обучение агента на сохраненных в буфере опыта ранее встреченных состояниях. Разработанный нами метод позволяет обучить агента тому, как эффективно вести себя в нескольких средах одновременно на основе обмена опытом с агентами-учителями, используя буфер опыта. Обмен опытом основан на распространенном в глубоком обучении подходе, называемом дистилляцией знаний. Дистилляция знаний позволила свести задачу с подкреплением к задаче обучения с учителем. В ходе исследований были протестированы и выбраны максимально успешные сочетания различных функций потерь и способов преобразования выходных слоев нейросетей. Метод дистилляции знаний требует хранения огромного буфера состояний. Предложены несколько методик оптимизации хранения буфера: использование части буфера и сжатие состояний во внутреннее представление нейросети с помощью автокодировщика. В качестве тестового окружения для экспериментов использовались игры Atari.
РОБОТЫ, МЕХАТРОНИКА И РОБОТОТЕХНИЧЕСКИЕ СИСТЕМЫ 
Проводится краткий анализ ключевых проблем развития мехатронно-модульных роботов с адаптивной кинематической структурой, оперативная реконфигурация которой осуществляется в автоматическом режиме в зависимости от особенностей выполняемой прикладной задачи и условий ее решения. Показано, что среди множества проблем развития мехатронно-модульных роботов такого типа одна из наиболее острых проблем связана с обеспечением функций внешнего очувствления. Сформирован оригинальный подход к созданию перспективных образцов нового поколения реконфигурируемых робототехнических систем с расширенным набором сенсорных, моторно-двигательных и других свойств на основе комплексной интеграции мехатронно-модульных структур с ограниченным набором функциональных возможностей. Утверждается, что практическая реализация предложенного подхода допускает различные способы практического воплощения и, по существу, сводится к формированию многоагентной системы, объединяющей в единой компоновке взаимодействующие мехатронно-модульные структуры, движения которых должны быть синхронизированы. В качестве примера рассмотрены два принципиально различных варианта оснащения реконфигурируемого робота в компоновке колеса мехатронно-модульной шагающей "платформой", несущей средства технического зрения и способной перемещаться вдоль базовой кинематической структуры в противоход к ее движению. Разрабатываются алгоритмы автоматического формирования, реконфигурации и управления движением для мехатронно-модульных роботов в компоновке колеса с сенсорной шагающей платформой. Обсуждаются пути построения средств планирования поведения и координации взаимодействий автономных реконфигурируемых роботов с использованием механизмов доски объявлений. Приводятся результаты экспериментальных исследований и компьютерного моделирования, подтверждающие работоспособность и эффективность представленных алгоритмов.
ДИНАМИКА, БАЛЛИСТИКА И УПРАВЛЕНИЕ ДВИЖЕНИЕМ ЛЕТАТЕЛЬНЫХ АППАРАТОВ 
В интересах повышения качества планирования группового полета летательных аппаратов сформулирована постановка задачи разработки алгоритмов оперативного определения допустимой длительности наблюдения наземных объектов и требуемого числа летательных аппаратов при обслуживании потока заявок с учетом влияния их живучести. Предложен алгоритм определения длительности наблюдения при обслуживании очередной заявки, описанный в виде процедуры нечеткой логики. Для реализации алгоритма определения длительности наблюдения разработана специализированная экспертная система. На вход экспертной системы поступают величины, описывающие влияние учитываемых факторов в оценке приоритета обслуживания очередного объекта. На выходе экспертной системы формируется альтернатива — продолжить поиск объекта, либо прекратить. Предложен новый подход к решению задачи целераспределения объектов между летательными аппаратами при групповом полете на основе совместного использования двух динамических приоритетов для выбора объектов наблюдения и для назначения обслуживающих летательных аппаратов. Предложен оригинальный подход к решению задачи рационального назначения числа летательных аппаратов в одном вылете с помощью аппарата теории массового обслуживания с учетом случайного характера динамической обстановки. Для оценки требуемого числа летательных аппаратов при обслуживании потока заявок процесс противодействия описан с помощью двух нелинейных дифференциальных уравнений (типа Риккати). Получена общая формула определения числа летательных аппаратов в одном вылете, состоящая из трех слагаемых, — числа летательных аппаратов для выполнения предполетного задания, для обслуживания заявок, поступивших в полете, и для пополнения резерва с учетом потерь живучести летательных аппаратов, что в целом обеспечивает успешное обслуживание процесса наблюдений. Сформирована математическая модель потери живучести летательных аппаратов в виде уравнения Бернулли. Проведено компьютерное моделирование потерь живучести летательных аппаратов в одном вылете для трех случаев: при слабом действии помех, при равенстве противодействующих сил, при сильном противодействии.
Описаны принципы работы волнового твердотельного гироскопа на примере конструкции металлического резонатора цилиндрической формы, в котором создание колебаний и съем сигнала осуществляются с помощью пьезоэлементов, расположенных на основании резонатора. Рассмотрен режим позиционного возбуждения первичных колебаний и формирование сигнала обратной связи для обеспечения работы резонатора в режиме датчика угловой скорости.
Приведена блок-схема последовательности преобразования сигнала, снимаемого с пьезоэлементов осей узлов и пучностей, для организации обратных связей. Рассмотрены подходы к построению контуров управления амплитудой и фазой колебаний для создания первичных колебаний и компенсации амплитуды колебаний оси узла. Наличие этих контуров позволяет обеспечить работу волнового твердотельного гироскопа в режиме датчика угловых скоростей. Для всех участков преобразования сигнала составлено математическое описание вычислительных процессов исходя из условия реализации вычислительных процедур цифровым вычислителем. Составлены математические зависимости, необходимые для коррекции выходного сигнала — обеспечения его линейности и стабильности в интервале температур эксплуатации и диапазоне измеряемых угловых скоростей. Приведены результаты испытаний, подтверждающие работоспособность волнового твердотельного гироскопа в режиме датчика угловой скорости.
Рассмотрен подход к построению модели резонатора на основе метода конечных элементов. Показан подход к верификации конечно-элементной модели путем сопоставления результатов экспериментального исследования характеристик резонатора с результатами моделирования.
ISSN 2619-1253 (Online)