-
Notifications
You must be signed in to change notification settings - Fork 2
Home
Alex Alex edited this page Feb 4, 2021
·
6 revisions
A Reinforcement Learning Approach for Inventory Optimization in non-stationary Retail environment case
Что мы хотим: Проверить, как хорошо поведут себя современные методы Deep Reinforcement Learning для решения задачи Inventory Optimization
Что для этого необходимо сделать:
-
Реализовать среду:
- Восстанавливать спрос из реальных данных продаж
- Реализовать подсчет вознаграждения агента
- Реализовать механизм заказа (то, что есть минимальный размер/кратность/другие ограничения)
- Реализовать механизм добавления случайности в логистике (по умолчанию считаем, что нам известен SLA на всех плечах логистической сети, но мы намеренно добавляем variance как в leet time - срок доставки, так и в quantity - количестве, которое фактически доезжает)
-
Реализовать агента:
- Подобрать наиболее подходящую архитектуру
Интерфейс взаимодействия агента и среды:
- Используется framework openAI Gym
- В шаге среда отдает:
- TBD
- В шаге агент отдает:
- TBD
Что делалось до нас/что можно посмотреть:
- Designing of an intelligent self-adaptive model for supply chain ordering management system – моделирование 4-эшелонной сети + Q-learning; Тут все очень тупо, 7 доступных action, 8 возможных состояний, все крайне примитивно.