• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748 скачать в хорошем качестве

Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748 2 месяца назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748 в качестве 4k

У нас вы можете посмотреть бесплатно Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748 в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748

Today, we’re joined by Oliver Wang, principal scientist at Google DeepMind and tech lead for Gemini 2.5 Flash Image—better known by its code name, “Nano Banana.” We dive into the development and capabilities of this newly released frontier vision-language model, beginning with the broader shift from specialized image generators to general-purpose multimodal agents that can use both visual and textual data for a variety of tasks. Oliver explains how Nano Banana can generate and iteratively edit images while maintaining consistency, and how its integration with Gemini’s world knowledge expands creative and practical use cases. We discuss the tension between aesthetics and accuracy, the relative maturity of image models compared to text-based LLMs, and scaling as a driver of progress. Oliver also shares surprising emergent behaviors, the challenges of evaluating vision-language models, and the risks of training on AI-generated data. Finally, we look ahead to interactive world models and VLMs that may one day “think” and “reason” in images. For the full list of resources for this episode, visit the show notes page: https://twimlai.com/go/748. 🔔 Subscribe to our channel for more great content just like this: https://youtube.com/twimlai?sub_confi... 🗣️ CONNECT WITH US! =============================== Subscribe to the TWIML AI Podcast: https://twimlai.com/podcast/twimlai/ Follow us on Twitter:   / twimlai   Follow us on LinkedIn:   / twimlai   Join our Slack Community: https://twimlai.com/community/ Subscribe to our newsletter: https://twimlai.com/newsletter/ Want to get in touch? Send us a message: https://twimlai.com/contact/ 📖 CHAPTERS =============================== 00:00 - Introduction 4:39 - Nano banana 5:35 - Nano banana vs Imagen and trajectory of image generation models 7:01 - Integration of Nano banana in Gemini 9:52 - Nano banana— a general purpose model 13:42 - Model consistency and editing capabilities 15:41 - Data quality and model architecture 18:13 - Use cases 24:10 - One-shot models vs. node-based interfaces 28:33 - Fine-tuning 30:32 - Exciting trends in image generation and VLMs 32:40 - Overcoming the challenges of model quality 34:36 - Model evaluation challenges 36:32 - Nano banana pros and cons 38:58 - Prompt rewriting 40:36 - Papers 41:52 - Accessibility of the research 46:45 - Verifiable domains 49:49 - Tension between accuracy and aesthetics 52:50 - Narrow data distribution in image generation 55:15 - AI-generated images for training data 57:56 - Model scale versus data curation 58:55 - Maturity of text versus image domains 🔗 LINKS & RESOURCES =============================== Nano Banana: Image editing in Google Gemini just got a major upgrade - https://blog.google/products/gemini/u... Google Gemini’s AI image model gets a ‘bananas’ upgrade - https://techcrunch.com/2025/08/26/goo... Gemini Flash - https://deepmind.google/models/gemini... Genie 3: A New Frontier for World Models - 743 - https://twimlai.com/podcast/twimlai/g... Google I/O 2025 Special Edition - 733 - https://twimlai.com/podcast/twimlai/g... 📸 Camera: https://amzn.to/3TQ3zsg 🎙️Microphone: https://amzn.to/3t5zXeV 🚦Lights: https://amzn.to/3TQlX49 🎛️ Audio Interface: https://amzn.to/3TVFAIq 🎚️ Stream Deck: https://amzn.to/3zzm7F5

Comments
  • Rethinking Pre-Training for Agentic AI [Aakanksha Chowdhery] - 759 1 час назад
    Rethinking Pre-Training for Agentic AI [Aakanksha Chowdhery] - 759
    Опубликовано: 1 час назад
  • Genie 3: A New Frontier for World Models [Jack Parker-Holder and Shlomi Fruchter] - 743 3 месяца назад
    Genie 3: A New Frontier for World Models [Jack Parker-Holder and Shlomi Fruchter] - 743
    Опубликовано: 3 месяца назад
  • Повторение и внимание для долгосрочных трансформеров [Джейкоб Бакман] - 750 2 месяца назад
    Повторение и внимание для долгосрочных трансформеров [Джейкоб Бакман] - 750
    Опубликовано: 2 месяца назад
  • The Decentralized Future of Private AI [Illia Polosukhin] - 749 2 месяца назад
    The Decentralized Future of Private AI [Illia Polosukhin] - 749
    Опубликовано: 2 месяца назад
  • Multimodal AI Models on Apple Silicon with MLX [Prince Canuma] - 744 3 месяца назад
    Multimodal AI Models on Apple Silicon with MLX [Prince Canuma] - 744
    Опубликовано: 3 месяца назад
  • LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры 1 год назад
    LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры
    Опубликовано: 1 год назад
  • Но что такое нейронная сеть? | Глава 1. Глубокое обучение 8 лет назад
    Но что такое нейронная сеть? | Глава 1. Глубокое обучение
    Опубликовано: 8 лет назад
  • ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов 1 месяц назад
    ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов
    Опубликовано: 1 месяц назад
  • Разработка с помощью Gemini 3, AI Studio, Antigravity и Nano Banana | Подкаст Agent Factory 2 недели назад
    Разработка с помощью Gemini 3, AI Studio, Antigravity и Nano Banana | Подкаст Agent Factory
    Опубликовано: 2 недели назад
  • Как LLM могут хранить факты | Глава 7, Глубокое обучение 1 год назад
    Как LLM могут хранить факты | Глава 7, Глубокое обучение
    Опубликовано: 1 год назад
  • Антигравитация и Nano Banana Pro с Ремиком | Подкаст Agent Factory 5 дней назад
    Антигравитация и Nano Banana Pro с Ремиком | Подкаст Agent Factory
    Опубликовано: 5 дней назад
  • Gemini 3 и NanoBanana Pro в деле: как использовать новый апдейт ИИ от Google 3 дня назад
    Gemini 3 и NanoBanana Pro в деле: как использовать новый апдейт ИИ от Google
    Опубликовано: 3 дня назад
  • БИБЛИЯ: а что там было на самом деле? Разговор без 4 дня назад
    БИБЛИЯ: а что там было на самом деле? Разговор без "священной цензуры". Андрей ДЕСНИЦКИЙ.
    Опубликовано: 4 дня назад
  • LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили! 8 дней назад
    LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!
    Опубликовано: 8 дней назад
  • Context Engineering for Productive AI Agents [Filip Kozera] - 741 4 месяца назад
    Context Engineering for Productive AI Agents [Filip Kozera] - 741
    Опубликовано: 4 месяца назад
  • Создайте ВСЁ, ЧТО УГОДНО, с Gemini 3 | Подкаст Agent Factory 3 недели назад
    Создайте ВСЁ, ЧТО УГОДНО, с Gemini 3 | Подкаст Agent Factory
    Опубликовано: 3 недели назад
  • Новый скандал в оппозиции: всё сложнее, чем кажется. Разбираемся в причинах конфликта 2 дня назад
    Новый скандал в оппозиции: всё сложнее, чем кажется. Разбираемся в причинах конфликта
    Опубликовано: 2 дня назад
  • 20+ Нейросетей GOOGLE Которые Не Должны Быть Бесплатными 5 дней назад
    20+ Нейросетей GOOGLE Которые Не Должны Быть Бесплатными
    Опубликовано: 5 дней назад
  • Изучаем фотографов в нейросети: доходы, жанры, города и мотивация. Трансляция закончилась 3 дня назад
    Изучаем фотографов в нейросети: доходы, жанры, города и мотивация.
    Опубликовано: Трансляция закончилась 3 дня назад
  • Scaling Agentic Inference Across Heterogeneous Compute [Zain Asgar] - 757 2 недели назад
    Scaling Agentic Inference Across Heterogeneous Compute [Zain Asgar] - 757
    Опубликовано: 2 недели назад

Контактный email для правообладателей: [email protected] © 2017 - 2025

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5