У нас вы можете посмотреть бесплатно Создавайте комплексные мультимодальные ИИ-агенты для анализа документов и видео с помощью NVIDIA ... или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В этом видео представлен унифицированный подход к многомодальному и документному интеллекту с использованием моделей NVIDIA Nemotron. Реализуйте готовые к работе агентами рабочие процессы, объединив две специализированные модели Nemotron: 1️⃣ Nemotron Nano 2 VL для рассуждений: Эта 12-битная модель предоставляет агентам многомодальный интеллект, необходимый для выполнения сложных межстраничных рассуждений на диаграммах и таблицах, основывая ответы непосредственно на данных. Она также использует новую функцию эффективной выборки видео (EVS), которая генерирует в 4 раза меньше токенов, сохраняя при этом точность, что позволяет обрабатывать более длинные/большие видеофайлы. 2️⃣ Nemotron Parse 1.1 для структурирования данных: Эта модель VLM эффективно обрабатывает неструктурированный контент, преобразуя сложные PDF-файлы и отчеты в чистый, машиночитаемый вывод (JSON, Markdown). Она точно обрабатывает сложные таблицы и сохраняет порядок чтения документа, предоставляя точные ограничивающие рамки для каждого элемента. Используйте структурную точность Nemotron Parse и возможности логического мышления Nemotron Nano 2 VL для создания надежных, готовых к развертыванию агентов искусственного интеллекта. 📝 Технический блог: https://nvda.ws/3L4SunT 🤗 Модель: https://nvda.ws/3L8uWyw Получите доступ к дополнительным ресурсам для разработчиков NVIDIA Nemotron и присоединитесь к нашему сообществу разработчиков: ⬇️ Ресурсы для разработчиков → https://nvda.ws/425fFUJ 📚 Изучите модели и наборы данных → https://nvda.ws/4n9Ad6N 👥 Присоединяйтесь к сообществу → https://nvda.ws/46Rxucr 💻 Посетите канал Nemotron в Discord → https://nvda.ws/421EzEC ▶️ Смотрите обучающие видео и прямые трансляции → https://nvda.ws/4n5WrXo 0:00 | Введение в агентов ИИ следующего поколения 0:15 | Представляем NVIDIA Nemotron Nano 2 VL (12-битная модель) 0:45 | Основные характеристики архитектуры и производительности (Hybrid Transformer Mamba) 0:54 | Настройка API-клиента Nemotron Nano 2 VL 1:17 | Многомодальный ввод и управление рассуждениями (/think) 2:23 | Демонстрация: Рассуждение по нескольким изображениям в документе (PDF-файл квартальной отчетности) 2:46 | Результат: Рассуждение по нескольким страницам для роста бизнеса 3:00 | Nemotron Nano 2 VL: Понимание видео и создание субтитров 3:20 | Демонстрация: Описание видео сцены Omniverse 3:41 | Эффективная выборка видео (EVS) для длинного контекста 4:18 | Проблема неструктурированных документов 4:41 | Представляем NVIDIA Nemotron Parse V1.1 для анализа документов 5:10 | Nemotron Parse V1.1: Специализированные функции VLM для обработки документов (контекст 9K) 5:30 | Вспомогательные функции для анализа PDF 6:27 | Демонстрация: Извлечение структурированных данных из PDF-файлов NVIDIA 6:47 | Вывод: Блоки JSONL с ограничивающими рамками 7:05 | Перестройка страниц в чистый Markdown/HTML 7:39 | Nemotron Parse против Nano 2 VL: Ключевые отличия и синергия 7:54 | Заключение и призыв к действию #AIagents #MultimodalAI #VLM #Nemotron