Поиск :
Личный кабинет :
Электронный каталог: Грессер, Лаура - Глубокое обучение с подкреплением
Грессер, Лаура - Глубокое обучение с подкреплением
Книга
Автор: Грессер, Лаура
Глубокое обучение с подкреплением : теория и практика на языке Python
Серия: Библиотека программиста
Издательство: Питер, 2022 г.
ISBN 9785446116997
Автор: Грессер, Лаура
Глубокое обучение с подкреплением : теория и практика на языке Python
Серия: Библиотека программиста
Издательство: Питер, 2022 г.
ISBN 9785446116997
Книга
004 Г80
Грессер, Лаура.
Глубокое обучение с подкреплением: теория и практика на языке Python: пер. с англ. / Лаура Грессер, Ван Лун Кенг. – Санкт-Петербург [и др.]: Питер, 2022. – 415 с.: ил., табл., схемы. – (Библиотека программиста) . - Содерж.: Алгоритмы, основанные на стратегиях и полезностях ; REINFORCE ; SARSA ; Глубокие Q-сети ; Улучшение DQN ; Комбинированные методы ; Метод актора-критика с преимуществом (А2С) ; Оптимизация ближайшей стратегии ; Методы параллелизации ; Сравнительный анализ алгоритмов ; Практика ; Начало работы с глубоким RL ; SLM Lab ; Архитектура сетей ; Аппаратное обеспечение ; Проектирование сред ; Состояния ; Действия ; Вознаграждения ; Функция переходов. – На рус. яз. - ISBN 9785446116997: 78.00.
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники. Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
ГРНТИ 28.23.25
ГРНТИ 50.05.03
ГРНТИ 50.05.09
004.85.032.26
004.438Python
общий = ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
общий = ГЛУБОКОЕ ОБУЧЕНИЕ
общий = НЕЙРОННЫЕ СЕТИ
общий = АЛГОРИТМЫ (мат., информатика)
общий = ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ
общий = ПРИНЯТИЕ РЕШЕНИЙ
общий = МАРКОВСКИЕ ПРОЦЕССЫ
общий = ЯЗЫКИ ПРОГРАММИРОВАНИЯ
общий = PYTHON (язык программирования)
дисциплины = Компонент учреждения высшего образования : Модуль "Вычислительные методы и программирование" (магистратура) : Неклассические логики
004 Г80
Грессер, Лаура.
Глубокое обучение с подкреплением: теория и практика на языке Python: пер. с англ. / Лаура Грессер, Ван Лун Кенг. – Санкт-Петербург [и др.]: Питер, 2022. – 415 с.: ил., табл., схемы. – (Библиотека программиста) . - Содерж.: Алгоритмы, основанные на стратегиях и полезностях ; REINFORCE ; SARSA ; Глубокие Q-сети ; Улучшение DQN ; Комбинированные методы ; Метод актора-критика с преимуществом (А2С) ; Оптимизация ближайшей стратегии ; Методы параллелизации ; Сравнительный анализ алгоритмов ; Практика ; Начало работы с глубоким RL ; SLM Lab ; Архитектура сетей ; Аппаратное обеспечение ; Проектирование сред ; Состояния ; Действия ; Вознаграждения ; Функция переходов. – На рус. яз. - ISBN 9785446116997: 78.00.
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники. Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
ГРНТИ 28.23.25
ГРНТИ 50.05.03
ГРНТИ 50.05.09
004.85.032.26
004.438Python
общий = ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
общий = ГЛУБОКОЕ ОБУЧЕНИЕ
общий = НЕЙРОННЫЕ СЕТИ
общий = АЛГОРИТМЫ (мат., информатика)
общий = ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ
общий = ПРИНЯТИЕ РЕШЕНИЙ
общий = МАРКОВСКИЕ ПРОЦЕССЫ
общий = ЯЗЫКИ ПРОГРАММИРОВАНИЯ
общий = PYTHON (язык программирования)
дисциплины = Компонент учреждения высшего образования : Модуль "Вычислительные методы и программирование" (магистратура) : Неклассические логики
Филиал | Всего | Доступно для брони | Доступно для выдачи | Бронирование |
---|---|---|---|---|
ОХОФ | 1 | 1 | 1 | Заказать |