У нас вы можете посмотреть бесплатно Самосознательное управляемое эффективное рассуждение в больших языковых моделях или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В модели Large Inference Model (LRM) предлагается новая стратегия декодирования под названием *SAGE (Self-Aware Guided Efficient Reasoning)* для решения проблемы чрезмерного обдумывания, которое приводит к неоправданно длительному мыслительному процессу. Авторы обнаружили, что модель уже распознает момент прекращения обдумывания на основе собственной надежности и использует это для поиска более короткой и точной цепочки рассуждений. SAGE-RL сочетает эту стратегию с обучением с подкреплением, чтобы побудить модели к изучению ключевых моделей мышления в сложных математических или программных задачах. В результате эксперимента этот метод достиг более высокой точности при использовании значительно меньшего количества токенов, чем традиционные алгоритмы GRPO или GSPO. В результате эта технология максимизирует эффективность рассуждений, одновременно улучшая производительность и использование ресурсов в реальных сервисах. https://arxiv.org/pdf/2602.08354