Back to Search View Original Cite This Article

Abstract

<jats:p>У статті представлено метод ухилення безпілотного літального апарата (БпЛА) від перешкод на основі алгоритму Proximal Policy Optimization, що адаптивно враховує як статичні, так і динамічні перешкоди. Алгоритм навчання з підкріпленням автоматично виробляє стратегію ухилення БпЛА, не потребуючи явних правил для кожного типу перешкод. Розроблений метод дозволяє БпЛА у режимі реального часу коригувати свій маршрут у непередбачуваних ситуаціях, демонструючи здатність до самостійного навчання на основі накопиченого досвіду взаємодії із середовищем. Запропоновано нейромережеву модель ухилення БпЛА від перешкод, яка поєднує переваги актор-критик архітектури зі спеціалізованим набором вхідних ознак, оптимізованих для їх навігації у міській забудові. Модель безпосередньо навчається оптимальної поведінки на основі імітаційного досвіду. Вона здатна узагальнювати поведінку ухилення БпЛА для різних конфігурацій перешкод (з різною кількістю та динамікою), чого складно досягти традиційними методами. Крім того архітектура моделі підібрана та налаштована таким чином, щоб забезпечити високу збіжність навчання та якість політики. Створено нейромережевий контролер, який є новим для сфери автономного керування БпЛА та поєднує швидкодію (миттєвий вибір дії на основі виходу мережі) із здатністю враховувати складні нелінійні залежності у поведінці системи “БпЛА–перешкода–ціль”.</jats:p>

Show More

Keywords

БпЛА ухилення перешкод на основі

Related Articles