У нас вы можете посмотреть бесплатно Automated Image Captioning with LLMs - Recognize Anything, BLIP-2, and Kosmos-2 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
#machinelearning #IMAGECAPTIONING #ai Today I'm taking a look at some multi-modal large language models that can be used for automated image captioning. Rich captions can be used for training Stable Diffusion Dreambooth or LoRAs. [00:00] Silly intro [00:30] Actual intro, rambling about Stable Diffusion [01:45] Captioning with the Kohya_SS scripts [02:42] The Recognize Anything model and using a Colab script to generate captions [06:30] BLIP-2 and a Colab script to generate captions [10:00] Captioning with KOSMOS-2 Recognize Anything https://github.com/xinyu1205/recogniz... Kosmos-2 https://huggingface.co/microsoft/kosm... BLIP-2 OPT-2.7B 8-bit Quantized Model by Mediocreatmybest https://huggingface.co/Mediocreatmybe... Resources/Links/Notebook Code to Copy-Paste: http://nanonomad.com/2023/11/19/autom...