У нас вы можете посмотреть бесплатно ШАГ 3-VL-10B: Перехитрить гигантов или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Представленные исходные коды знакомят с STEP3-VL-10B, компактной базовой моделью с открытым исходным кодом, созданной StepFun для обеспечения высокоуровневого мультимодального интеллекта с минимальными вычислительными требованиями. Используя унифицированную стратегию предварительного обучения на 1,2 триллионах токенов и обширное обучение с подкреплением, модель устанавливает мощную синергию между визуальным восприятием и лингвистическим мышлением. Она включает в себя уникальный режим параллельного скоординированного рассуждения (PaCoRe), который масштабирует вычислительные ресурсы во время тестирования, синтезируя множество визуальных гипотез для решения сложных задач. Несмотря на скромный размер параметров в 10 миллиардов, модель часто превосходит по производительности системы, в десять-двадцать раз превосходящие её по размеру, а также ведущие проприетарные флагманские модели, на таких бенчмарках, как MMMU и AIME2025. Технический отчет и документация по модели дают прозрачное представление о её инновационной архитектуре, которая сочетает в себе оптимизированный для языка кодировщик с декодером Qwen3-8B. В конечном итоге, эти источники демонстрируют, что сложные рассуждения и восприятие достижимы при минимальном объеме данных благодаря тщательной обработке информации и передовым алгоритмам обучения. https://huggingface.co/stepfun-ai/Ste... https://stepfun-ai.github.io/Step3-VL... #ai #research #largelanguagemodels #vision Отказ от ответственности: это видео создано с помощью Google NotebookLM.