• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

LLM UNDERSTANDING: 39. Aishwarya AGRAWAL "Multimodal Vision-Language Learning" скачать в хорошем качестве

LLM UNDERSTANDING: 39. Aishwarya AGRAWAL "Multimodal Vision-Language Learning" 1 год назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
LLM UNDERSTANDING: 39. Aishwarya AGRAWAL
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: LLM UNDERSTANDING: 39. Aishwarya AGRAWAL "Multimodal Vision-Language Learning" в качестве 4k

У нас вы можете посмотреть бесплатно LLM UNDERSTANDING: 39. Aishwarya AGRAWAL "Multimodal Vision-Language Learning" или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон LLM UNDERSTANDING: 39. Aishwarya AGRAWAL "Multimodal Vision-Language Learning" в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



LLM UNDERSTANDING: 39. Aishwarya AGRAWAL "Multimodal Vision-Language Learning"

MULTIMODAL VISION-LANGUAGE LEARNING Aishwarya Agrawal Computer Science. University of Montreal, Mila ISC Summer School on Large Language Models: Science and Stakes June 3-14, 2024 Fri, June 14, 1:30pm-3pm EDT ABSTRACT: Over the last decade, multimodal vision-language (VL) research has seen impressive progress. We can now automatically caption images in natural language, answer natural language questions about images, retrieve images using complex natural language queries and even generate images given natural language descriptions.Despite such tremendous progress, current VL research faces several challenges that limit the applicability of state-of-art VL systems. Even large VL systems based on multimodal large language models (LLMs) such as GPT-4V struggle with counting objects in images, identifying fine-grained differences between similar images, and lack sufficient visual grounding (i.e., make-up visual facts). In this talk, first I will present our work on building a parameter efficient multimodal LLM. Then, I will present our more recent work studying and tackling the following outstanding challenges in VL research: visio-linguistic compositional reasoning, robust automatic evaluation, and geo-diverse cultural understanding. AISHWARYA AGRAWAL is an Assistant Professor in the Department of Computer Science and Operations Research at University of Montreal. She is also a Canada CIFAR AI Chair and a core academic member of Mila — Quebec AI Institute. She also spends one day a week at Google DeepMind as a Research Scientist. Aishwarya’s research interests lie at the intersection of computer vision, deep learning and natural language processing, with the goal of developing artificial intelligence (AI) systems that can “see” (i.e. understand the contents of an image: who, what, where, doing what?) and “talk” (i.e. communicate the understanding to humans in free-form natural language). Manas, O., Rodriguez, P., Ahmadi, S., Nematzadeh A., Goyal, Y., Agrawal A. MAPL: Parameter-Efficient Adaptation of Unimodal Pre-Trained Models for Vision-Language Few-Shot Prompting. In the European Chapter of the Association for Computational Linguistics (EACL), 2023 Zhang, L., Awal, R., Agrawal, A. Contrasting intra-modal and ranking cross-modal hard negatives to enhance visio-linguistic compositional understanding. In the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024 Manas, O., Krojer, B., Agrawal, A. Improving Automatic VQA Evaluation Using Large Language Models. In the 38th Annual AAAI Conference on Artificial Intelligence, 2024. Ahmadi, S., Agrawal, A. An Examination of the Robustness of Reference-Free Image Captioning Evaluation Metrics. In the Findings of the Association for Computational Linguistics: EACL 2024

Comments
  • '‘Understanding Understanding and Why LLMs Don’t 4 месяца назад
    '‘Understanding Understanding and Why LLMs Don’t"
    Опубликовано: 4 месяца назад
  • LLM UNDERSTANDING: 38. Ellie PAVLICK 1 год назад
    LLM UNDERSTANDING: 38. Ellie PAVLICK "Symbols and Grounding in LLMs"
    Опубликовано: 1 год назад
  • Research Colloquium 03/05/26 - Byron Crowe, MD, MSc. 1 час назад
    Research Colloquium 03/05/26 - Byron Crowe, MD, MSc.
    Опубликовано: 1 час назад
  • LLM Understanding: 25. Samy BENGIO 1 год назад
    LLM Understanding: 25. Samy BENGIO "Learning to reason is hard"
    Опубликовано: 1 год назад
  • LLM UNDERSTANDING: 26 Christian LEBIÈRE 1 год назад
    LLM UNDERSTANDING: 26 Christian LEBIÈRE "From Large Language Models to Cognitive Architectures"
    Опубликовано: 1 год назад
  • Как работают AI Агенты и языковые модели типа ChatGPT? 4 дня назад
    Как работают AI Агенты и языковые модели типа ChatGPT?
    Опубликовано: 4 дня назад
  • Dune: Part Three | Official Teaser Trailer 7 часов назад
    Dune: Part Three | Official Teaser Trailer
    Опубликовано: 7 часов назад
  • Лучший документальный фильм про создание ИИ 2 месяца назад
    Лучший документальный фильм про создание ИИ
    Опубликовано: 2 месяца назад
  • Как Гений Математик разгадал тайну вселенной 5 месяцев назад
    Как Гений Математик разгадал тайну вселенной
    Опубликовано: 5 месяцев назад
  • Учащимся об информатике и компьютерах, 1988 5 лет назад
    Учащимся об информатике и компьютерах, 1988
    Опубликовано: 5 лет назад
  • Жириновский: остатки Ирана и Турции войдут в состав России! Воскресный вечер с Соловьевым. 13.05.18 7 лет назад
    Жириновский: остатки Ирана и Турции войдут в состав России! Воскресный вечер с Соловьевым. 13.05.18
    Опубликовано: 7 лет назад
  • Frontotemporal Dementia and Managing Challenging Behaviour Трансляция закончилась 4 года назад
    Frontotemporal Dementia and Managing Challenging Behaviour
    Опубликовано: Трансляция закончилась 4 года назад
  • Парадокс Шредингера РЕШЕН: простое объяснение квантовой механики 2 недели назад
    Парадокс Шредингера РЕШЕН: простое объяснение квантовой механики
    Опубликовано: 2 недели назад
  • LLM UNDERSTANDING: 29. Gary LUPYAN 1 год назад
    LLM UNDERSTANDING: 29. Gary LUPYAN "What counts as understanding?"
    Опубликовано: 1 год назад
  • Как Ubuntu Предала Linux - Вся Правда о Взлёте и Падении Canonical 4 месяца назад
    Как Ubuntu Предала Linux - Вся Правда о Взлёте и Падении Canonical
    Опубликовано: 4 месяца назад
  • Самая Сложная Задача В Истории Самой Сложной Олимпиады 1 год назад
    Самая Сложная Задача В Истории Самой Сложной Олимпиады
    Опубликовано: 1 год назад
  • Теория струн (ScienceClic) 4 года назад
    Теория струн (ScienceClic)
    Опубликовано: 4 года назад
  • Пространство существует. И это проблема 5 дней назад
    Пространство существует. И это проблема
    Опубликовано: 5 дней назад
  • Фильм Алексея Семихатова «ГРАВИТАЦИЯ» 2 недели назад
    Фильм Алексея Семихатова «ГРАВИТАЦИЯ»
    Опубликовано: 2 недели назад
  • LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры 1 год назад
    LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры
    Опубликовано: 1 год назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5