• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

PPO в Reinforcement Learning: почему агент всегда покупает (разбор трейдинг-среды) скачать в хорошем качестве

PPO в Reinforcement Learning: почему агент всегда покупает (разбор трейдинг-среды) 2 месяца назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
PPO в Reinforcement Learning: почему агент всегда покупает (разбор трейдинг-среды)
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: PPO в Reinforcement Learning: почему агент всегда покупает (разбор трейдинг-среды) в качестве 4k

У нас вы можете посмотреть бесплатно PPO в Reinforcement Learning: почему агент всегда покупает (разбор трейдинг-среды) или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон PPO в Reinforcement Learning: почему агент всегда покупает (разбор трейдинг-среды) в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



PPO в Reinforcement Learning: почему агент всегда покупает (разбор трейдинг-среды)

В этом видео мы подключаем PPO (Proximal Policy Optimization) к простой трейдинг-среде Gymnasium и подробно разбираем результаты обучения агента. Без иллюзий и «волшебных кнопок»: ты увидишь, почему PPO выбирает стратегию “покупай всегда”, что означают метрики обучения (entropy, explained_variance, loss) и почему алгоритм работает правильно — даже если стратегия выглядит опасной. Это видео — про реальный Reinforcement Learning, а не про маркетинг. 🔍 В видео разбираем как PPO обучается в трейдинг-среде что означают логи обучения stable-baselines3 почему explained_variance = 1 — тревожный сигнал почему агент перестаёт продавать как reward формирует поведение агента где проходит граница между RL и реальным трейдингом PPO не учится торговать. Он учится максимизировать reward, который ты сам ему задал. И если reward плохой — алгоритм будет идеально плохим. Код из видео: https://boosty.to/avklimov/posts/e445... ✅️ Кешбэк до 45% на Bybit: https://partner.bybit.com/b/KLIMOVGROUP ✅️ Кешбэк до 45% для уже зарегистрированных аккаунтов Bybit. В поле Реферальный код нужно указать: 52082 https://www.bybit.com/ru-RU/aff-bind?... Телеграм канал: https://t.me/klimovgroup Личка: https://t.me/AVKlimov #reinforcementlearning #ppo #gymnasium #rlтрейдинг #алготрейдинг #python #machinelearning #stablebaselines3 #rl #aiтрейдинг 00:00 — Введение и цель видео 00:04 — Что мы сделали в прошлом видео (RL + Gymnasium) 00:10 — Сегодняшний шаг: подключаем PPO 00:17 — Важное предупреждение о рисках трейдинга 00:27 — Учебный формат и дисклеймер 00:34 — Кэшбэк 45% на Bybit (партнёрская ссылка) 00:39 — Зачем подключаем PPO к трейдинг-среде 00:45 — PPO не сделает вас прибыльным трейдером 00:51 — Главная цель: понять, как RL учится 00:57 — Что такое PPO простыми словами 01:03 — Почему PPO подходит для трейдинга 01:14 — Почему трейдинг — шумная среда без оптимума 01:19 — Ключевой принцип: среду не меняем 01:24 — Почему сначала меняют модель, а не reward 01:30 — Обзор кода и структура проекта 01:34 — Импорт модулей и stable-baselines3 01:40 — Установка зависимостей 01:48 — Создание PPO-модели 01:55 — MLP Policy и параметры обучения 02:01 — Запуск обучения PPO 02:07 — Почему агент видит только reward 02:14 — Тестируем обученного агента 02:20 — Чем обученный агент отличается от случайного 02:24 — Два типичных поведения PPO в трейдинге 02:29 — PPO оптимизирует reward, а не торговлю 02:54 — Запуск кода и процесс обучения 03:00 — Разбор логов PPO (fps, timesteps, iterations) 03:14 — Почему обучение прошло успешно 03:27 — PPO не учится торговать — ключевой момент 03:34 — Анализ реального поведения агента 03:40 — Почему агент всегда выбирает BUY 03:46 — Разбор шагов и награды 03:53 — Агент терпит просадки и не выходит 04:07 — Стратегия «пересиживания» 04:18 — Финальный PnL и предел reward-схемы 04:23 — Главный вывод: стратегия «Buy & Hold» 04:29 — Почему SELL ухудшает reward 04:35 — Отсутствие штрафов за риск и просадки 04:40 — RL против трейдинга: в чём конфликт 04:45 — Почему это не ошибка PPO 04:52 — Ошибка в дизайне reward 04:58 — Что будем менять дальше 05:04 — Reward только при продаже 05:10 — Анонс следующего видео 05:15 — Лайк, подписка и курс по алготрейдингу 05:26 — Завершение

Comments
  • Open Source: ВЕЛИЧАЙШАЯ ЛОЖЬ интернета 3 месяца назад
    Open Source: ВЕЛИЧАЙШАЯ ЛОЖЬ интернета
    Опубликовано: 3 месяца назад
  • АЛКОГОЛЬ: ВРЕД И ПОЛЬЗА. Семихатов, Сурдин, Вялов 2 месяца назад
    АЛКОГОЛЬ: ВРЕД И ПОЛЬЗА. Семихатов, Сурдин, Вялов
    Опубликовано: 2 месяца назад
  • Как ИИ изменит наш мир в ближайшие 10 лет? Маргулан Сейсембаев 2 дня назад
    Как ИИ изменит наш мир в ближайшие 10 лет? Маргулан Сейсембаев
    Опубликовано: 2 дня назад
  • Полный гайд по Claude: как выжать максимум из этой нейросети 1 месяц назад
    Полный гайд по Claude: как выжать максимум из этой нейросети
    Опубликовано: 1 месяц назад
  • Токенизация: почему LLM видит мир не так, как ты 5 дней назад
    Токенизация: почему LLM видит мир не так, как ты
    Опубликовано: 5 дней назад
  • Я полностью перешел на Linux и больше НИКОГДА не установлю Windows 18 часов назад
    Я полностью перешел на Linux и больше НИКОГДА не установлю Windows
    Опубликовано: 18 часов назад
  • Мир входит в большую перестройку? Экономист Олег Вьюгин о борьбе за влияние и уничтожении доллара 2 месяца назад
    Мир входит в большую перестройку? Экономист Олег Вьюгин о борьбе за влияние и уничтожении доллара
    Опубликовано: 2 месяца назад
  • Отряд «Дельта»: самый секретный спецназ США 2 месяца назад
    Отряд «Дельта»: самый секретный спецназ США
    Опубликовано: 2 месяца назад
  • Защищает ли кофе от деменции? Разбираю 43‑летнее исследование без страшилок. 23 часа назад
    Защищает ли кофе от деменции? Разбираю 43‑летнее исследование без страшилок.
    Опубликовано: 23 часа назад
  • 17 Ходов ПЕШКАМИ Подряд!В Психбольнице ему ЗАПРЕТИЛИ Шахматы. Бессмертная Партия Пешек 1 год назад
    17 Ходов ПЕШКАМИ Подряд!В Психбольнице ему ЗАПРЕТИЛИ Шахматы. Бессмертная Партия Пешек
    Опубликовано: 1 год назад
  • Минфин отказался держать рубль. Дальше девальвация и инфляция. Иран не поможет | Владислав ЖУКОВСКИЙ 2 дня назад
    Минфин отказался держать рубль. Дальше девальвация и инфляция. Иран не поможет | Владислав ЖУКОВСКИЙ
    Опубликовано: 2 дня назад
  • Зачем нужна математика на самом деле? 5 месяцев назад
    Зачем нужна математика на самом деле?
    Опубликовано: 5 месяцев назад
  • Как Ubuntu Предала Linux - Вся Правда о Взлёте и Падении Canonical 4 месяца назад
    Как Ubuntu Предала Linux - Вся Правда о Взлёте и Падении Canonical
    Опубликовано: 4 месяца назад
  • Я внедрился в СКАМ ЦЕНТР! 2 месяца назад
    Я внедрился в СКАМ ЦЕНТР!
    Опубликовано: 2 месяца назад
  • GLM-5 УНИЧТОЖИЛА DeepSeek! Бесплатная нейросеть БЕЗ ограничений. Полный тест 2026 3 недели назад
    GLM-5 УНИЧТОЖИЛА DeepSeek! Бесплатная нейросеть БЕЗ ограничений. Полный тест 2026
    Опубликовано: 3 недели назад
  • Обман века: Ракеты, которых нет 2 месяца назад
    Обман века: Ракеты, которых нет
    Опубликовано: 2 месяца назад
  • ⚡️ГАЛЛЯМОВ: Срочно! ПЕРВАЯ РЕАКЦИЯ Ирана на атаку Азербайджана. БРЕД и УГРОЗЫ: Путин теряет КОНТРОЛЬ 1 день назад
    ⚡️ГАЛЛЯМОВ: Срочно! ПЕРВАЯ РЕАКЦИЯ Ирана на атаку Азербайджана. БРЕД и УГРОЗЫ: Путин теряет КОНТРОЛЬ
    Опубликовано: 1 день назад
  • Palantir: Система, Которая ВИДИТ Тебя Насквозь! 2 месяца назад
    Palantir: Система, Которая ВИДИТ Тебя Насквозь!
    Опубликовано: 2 месяца назад
  • Я разобрал всю ИИ-экосистему Google — 7 ключевых инструментов 3 недели назад
    Я разобрал всю ИИ-экосистему Google — 7 ключевых инструментов
    Опубликовано: 3 недели назад
  • Ричард Фейнман: Почему невозможно вернуться на Землю с Марса 1 день назад
    Ричард Фейнман: Почему невозможно вернуться на Землю с Марса
    Опубликовано: 1 день назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5