У нас вы можете посмотреть бесплатно Объяснение концепции Vision Transformers | The ViT Paper или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В этом видео мы возвращаемся к важной статье Google, в которой были представлены Vision Transformers (ViT). До появления Vision Transformers сверточные нейронные сети (CNN) доминировали в области компьютерного зрения. С момента изобретения трансформаторов в статье «Внимание — всё, что вам нужно» предпринимались различные попытки использовать трансформаторы в компьютерном зрении. Мы объясняем сложность этого и то, как архитектура ViT справляется с этой задачей. Мы также рассматриваем снижение индуктивного смещения в Vision Transformers по сравнению со свёрточными нейронными сетями. Изображение стоит 16x16 слов: Трансформеры для масштабного распознавания изображений - https://arxiv.org/abs/2010.11929 Запись в блоге - https://aipapersacademy.com/vision-tr... ---------------------------------------------------------------------------------------------- ✉️ Подпишитесь на рассылку - https://aipapersacademy.com/newsletter/ 👍 Поставьте лайк и подпишитесь, если вам понравился этот контент. Стать спонсором - / aipapersacademy Мы используем VideoScribe для редактирования наших видео - https://tidd.ly/44TZEiX ---------------------------------------------------------------------------------------------- Главы: 0:00 Введение 0:55 Как использовать Трансформеры в исходном виде? 2:13 Как работает ViT? 3:30 Индуктивное смещение