У нас вы можете посмотреть бесплатно Vision Transformer (ViT) 用于图片分类 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Vision Transformer (ViT) 是很新的模型,2020年10月挂在 arXiv 上,2021年正式发表。在所有的公开数据集上,ViT 的表现都超越了最好的 ResNet。前提是要在足够大的数据集上预训练 ViT。在越大的数据集上做预训练,ViT 的优势越明显。 课件: https://github.com/wangshusen/DeepLea... 参考文献: Dosovitskiy et al. An image is worth 16×16 words: transformers for image recognition at scale. In ICLR, 2021.