Skip to content
Alex Alex edited this page Feb 4, 2021 · 6 revisions

Оптимизация запасов в ритейл сети с помощью алгоритмов обучения с подкреплением

A Reinforcement Learning Approach for Inventory Optimization in non-stationary Retail environment case

Что мы хотим: Проверить, как хорошо поведут себя современные методы Deep Reinforcement Learning для решения задачи Inventory Optimization

Что для этого необходимо сделать:

  • Реализовать среду:

    • Восстанавливать спрос из реальных данных продаж
    • Реализовать подсчет вознаграждения агента
    • Реализовать механизм заказа (то, что есть минимальный размер/кратность/другие ограничения)
    • Реализовать механизм добавления случайности в логистике (по умолчанию считаем, что нам известен SLA на всех плечах логистической сети, но мы намеренно добавляем variance как в leet time - срок доставки, так и в quantity - количестве, которое фактически доезжает)
  • Реализовать агента:

    • Подобрать наиболее подходящую архитектуру

Интерфейс взаимодействия агента и среды:

  1. Используется framework openAI Gym
  2. В шаге среда отдает:
  • TBD
  1. В шаге агент отдает:
  • TBD

Что делалось до нас/что можно посмотреть:

Clone this wiki locally