Поиск :
Личный кабинет :
Электронный каталог: Грессер, Лаура - Глубокое обучение с подкреплением
Грессер, Лаура - Глубокое обучение с подкреплением

Доступно
1 из 1
1 из 1
Книга
Автор: Грессер, Лаура
Глубокое обучение с подкреплением : теория и практика на языке Python
Серия: Библиотека программиста
Издательство: Питер, 2022 г.
ISBN 9785446116997
Автор: Грессер, Лаура
Глубокое обучение с подкреплением : теория и практика на языке Python
Серия: Библиотека программиста
Издательство: Питер, 2022 г.
ISBN 9785446116997
Книга
004 Г80
Грессер, Лаура.
Глубокое обучение с подкреплением : теория и практика на языке Python : пер. с англ. / Лаура Грессер, Ван Лун Кенг. – Санкт-Петербург [и др.] : Питер, 2022. – 415 с. : ил., табл., схемы. – (Библиотека программиста). – Содерж.: Алгоритмы, основанные на стратегиях и полезностях ; REINFORCE ; SARSA ; Глубокие Q-сети ; Улучшение DQN ; Комбинированные методы ; Метод актора-критика с преимуществом (А2С) ; Оптимизация ближайшей стратегии ; Методы параллелизации ; Сравнительный анализ алгоритмов ; Практика ; Начало работы с глубоким RL ; SLM Lab ; Архитектура сетей ; Аппаратное обеспечение ; Проектирование сред ; Состояния ; Действия ; Вознаграждения ; Функция переходов. – ISBN 9785446116997 : 78.00.
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники. Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
ГРНТИ 28.23.25
ГРНТИ 50.05.03
ГРНТИ 50.05.09
004.85.032.26
004.438Python
общий = ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
общий = ГЛУБОКОЕ ОБУЧЕНИЕ
общий = НЕЙРОННЫЕ СЕТИ
общий = АЛГОРИТМЫ (мат., информатика)
общий = ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ
общий = ПРИНЯТИЕ РЕШЕНИЙ
общий = МАРКОВСКИЕ ПРОЦЕССЫ
общий = ЯЗЫКИ ПРОГРАММИРОВАНИЯ
общий = PYTHON (язык программирования)
дисциплины = Компонент учреждения высшего образования : Модуль "Вычислительные методы и программирование" (магистратура) : Неклассические логики
004 Г80
Грессер, Лаура.
Глубокое обучение с подкреплением : теория и практика на языке Python : пер. с англ. / Лаура Грессер, Ван Лун Кенг. – Санкт-Петербург [и др.] : Питер, 2022. – 415 с. : ил., табл., схемы. – (Библиотека программиста). – Содерж.: Алгоритмы, основанные на стратегиях и полезностях ; REINFORCE ; SARSA ; Глубокие Q-сети ; Улучшение DQN ; Комбинированные методы ; Метод актора-критика с преимуществом (А2С) ; Оптимизация ближайшей стратегии ; Методы параллелизации ; Сравнительный анализ алгоритмов ; Практика ; Начало работы с глубоким RL ; SLM Lab ; Архитектура сетей ; Аппаратное обеспечение ; Проектирование сред ; Состояния ; Действия ; Вознаграждения ; Функция переходов. – ISBN 9785446116997 : 78.00.
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники. Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
ГРНТИ 28.23.25
ГРНТИ 50.05.03
ГРНТИ 50.05.09
004.85.032.26
004.438Python
общий = ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
общий = ГЛУБОКОЕ ОБУЧЕНИЕ
общий = НЕЙРОННЫЕ СЕТИ
общий = АЛГОРИТМЫ (мат., информатика)
общий = ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ
общий = ПРИНЯТИЕ РЕШЕНИЙ
общий = МАРКОВСКИЕ ПРОЦЕССЫ
общий = ЯЗЫКИ ПРОГРАММИРОВАНИЯ
общий = PYTHON (язык программирования)
дисциплины = Компонент учреждения высшего образования : Модуль "Вычислительные методы и программирование" (магистратура) : Неклассические логики
| Филиал | Всего | Доступно для брони | Доступно для выдачи | Бронирование |
|---|---|---|---|---|
| ОХОФ | 1 | 1 | 1 | Заказать |
Заказать
На полку