У нас вы можете посмотреть бесплатно Как обучение с подкреплением может улучшить удержание клиентов и максимизировать долгосрочную цен... или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В этом тематическом исследовании показано, как обучение с подкреплением может быть использовано для оптимизации мероприятий по удержанию клиентов путем обучения оптимальному действию для каждого состояния клиента, а не просто прогнозирования оттока. Имитированная среда представляет клиентов с использованием категорий «стаж», «вовлеченность» и «риск оттока», и позволяет агенту выбирать между такими действиями, как ничего не делать, отправка электронного письма, предложение скидки, предоставление вознаграждения за лояльность или личное взаимодействие. Каждое действие имеет свою стоимость, и каждое состояние клиента имеет разную вероятность удержания, поэтому агент должен сбалансировать выгоду от удержания с затратами на вмешательство. Затем агент Q-обучения обучается на протяжении 5000 смоделированных эпизодов, сохраняя оценочные значения действий в Q-таблице и обновляя их на основе наблюдаемых вознаграждений и будущих ожидаемых результатов. Структура вознаграждения отражает, был ли клиент удержан, и вычитает стоимость выбранного вмешательства, что позволяет сосредоточиться на максимизации долгосрочной чистой ценности клиента. Для сглаживания зашумленных результатов на уровне эпизодов и визуализации прогресса обучения во времени рассчитываются скользящие средние значения вознаграждения, удержания, вероятности удержания и стоимости действия. Поскольку скользящее вознаграждение и скользящее удержание работают в совершенно разных масштабах, анализ также показывает, как их объединить в Plotly, используя либо двойную ось Y, либо преобразуя удержание в проценты. После обучения полученная стратегия извлекается в таблицу, которая показывает рекомендуемые агентом действия для каждой комбинации стажа, вовлеченности и риска оттока. Дополнительные визуализации суммируют рекомендуемые действия для различных сегментов клиентов и сравнивают среднее вознаграждение, коэффициент удержания и стоимость вмешательства для каждого типа действий. В целом, пример показывает, что обучение с подкреплением выходит за рамки прогнозирования оттока и переходит к оптимизации принятия решений, обучаясь тому, какая стратегия удержания обеспечивает наибольшую ожидаемую бизнес-ценность для разных типов клиентов.