Электронный каталог НБ БНТУ

rus
Научная библиотека БНТУ
Режим работы: Пн-Пт.
- читальные залы с 9:00 до 20:00
- абонементы с 9:00 до 19:00
Сб. с 9:00 до 16:45. Вс. - выходной.
Адреса: г. Минск, ул. Я. Коласа, 16 (читальные залы)
пр. Независимости, 65 (абонементы и читальные залы)

ОНЛАЙН-ЗАКАЗ книг из каталога

ФИЛИАЛЫ

КНИГООБЕСПЕЧЕННОСТЬ

Поиск :

  • Новые поступления
  • Простой поиск
  • Расширенный поиск

  • Авторы
  • Издательства
  • Серии
  • Тезаурус (Рубрики)

  • Учебная литература:
    • По дисциплинам
    • По специальностям
    • По специализациям
    • По кафедрам
    • Список дисциплин

  • Информация о фонде
  • Помощь

Личный кабинет :


Электронный каталог: Rulko, E.V. - Actor complexification in TD3 and curriculum learning with structural composition for drone count...

Rulko, E.V. - Actor complexification in TD3 and curriculum learning with structural composition for drone count...

Actor complexification in TD3 and curriculum learning with structural composition for drone count...
Статья
Автор:
Rulko, E.V.
Системный анализ и прикладная информатика: Actor complexification in TD3 and curriculum learning with structural composition for drone count...
Усложнение акторов в TD3 и обучение по куррикулумому со структурной композицией на примере задачи отражения атак беспилотных летательных аппаратов
б.г.
ISBN отсутствует

полный текст

На полку На полку


Статья

Rulko, E.V.
Actor complexification in TD3 and curriculum learning with structural composition for drone countering = Усложнение акторов в TD3 и обучение по куррикулумому со структурной композицией на примере задачи отражения атак беспилотных летательных аппаратов / E. V. Rulko. – DOI 10.21122/2309-4923-2025-4-41-48 // Системный анализ и прикладная информатика. – 2025. – № 4. – P. 41-48. – Режим доступа : https://rep.bntu.by/handle/data/161985. – На англ. яз.

The work suggests complexifying actors within the framework of TD3 which involves the usage of different state vectors for actors and critics in order to assure convergence of the algorithm. It also describes a process of aggregating models, separately trained on datasets or in simulation on tasks with increasing difficulty, stitching everything together step by step into a single end-to-end system. It allows utilizing existing algorithms, such as YOLO, in reinforcement learning systems, performing sensor fusion and gradually adding functionality without losing convergence. Assistance providing allows training systems in simulation from hardcoded algorithms that use simplified states. These techniques are demonstrated on a particular task of building an anti-drone system for armored vehicles.
В работе предложены усложняющиеся акторы в рамках алгоритма двойного отсроченного глубокого детерминированного градиента политики (TD3), что предполагает использование различных векторов состояний для акторов и критиков с целью обеспечения сходимости алгоритма. Работа также описывает процесс агрегирования моделей, раздельно натренированных на датасетах или в симуляции на задачах с увеличивающейся сложностью, соединяя их вместе шаг за шагом в единую систему. Это позволяет использовать существующие алгоритмы, такие как YOLO, в системах обучения с подкреплением, осуществляя процесс объединения данных датчиков и постепенно увеличивая функциональность без потери сходимости. Предоставление ассистирования позволяет тренировать в симуляции системы машинного обучения на основе жестко запрограммированных алгоритмов, использующих упрощенные вектора состояний. Данные техники продемонстрированы на задаче построения системы защиты бронемашин от БПЛА.

004.85.032.26

общий = БД Техника
общий = ГЛУБОКОЕ ОБУЧЕНИЕ
общий = ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ
общий = АЛГОРИТМЫ (мат., информатика)
общий = МАШИННОЕ ОБУЧЕНИЕ

Привязано к:

Отобрать для печати: страницу | инверсия | сброс | печать(0)
Системный анализ и прикладная информатика
Доступно
 1 из 2
Выпуск

Системный анализ и прикладная информатика № 4
2025 г.
ISBN отсутствует
ОПИ


На полку На полку


© Все права защищены ООО "Компания Либэр" , 2009 - 2026  v.20.121