• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Тестирование моделей встраивания #6 — Как статистически оценить модели встраивания с помощью Pyth... скачать в хорошем качестве

Тестирование моделей встраивания #6 — Как статистически оценить модели встраивания с помощью Pyth... 1 месяц назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Тестирование моделей встраивания #6 — Как статистически оценить модели встраивания с помощью Pyth...
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Тестирование моделей встраивания #6 — Как статистически оценить модели встраивания с помощью Pyth... в качестве 4k

У нас вы можете посмотреть бесплатно Тестирование моделей встраивания #6 — Как статистически оценить модели встраивания с помощью Pyth... или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Тестирование моделей встраивания #6 — Как статистически оценить модели встраивания с помощью Pyth... в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Тестирование моделей встраивания #6 — Как статистически оценить модели встраивания с помощью Pyth...

В этом видео мы подробно рассмотрим, как правильно проводить бенчмаркинг и оценку моделей встраивания для ваших приложений RAG (Retrieval-Augmented Generation) или поисковых приложений. Мы не будем ограничиваться простым анализом одного результата, а рассмотрим, почему статистическое тестирование так важно. Вы узнаете, как модель, которая выглядит лучше, может быть просто «везением», и как использовать статистические тесты, чтобы определить, действительно ли разница в производительности реальна и статистически значима. Сначала я подробно расскажу вам о трёх важнейших метриках, используемых при оценке поиска: среднем обратном ранге (MRR), полноте (Recall@K) и нормализованном дисконтированном кумулятивном приросте (NDCG@K). Я объясню математические и интуитивные принципы, лежащие в основе каждой из них, показав, как рассчитать их с нуля в Python. Затем я познакомлю вас с ranx — мощной библиотекой Python, которая автоматизирует весь этот процесс. Мы проведём рефакторинг нашего кода, написанного вручную, для использования ranx для создания «Qrel» (оценок релевантности запроса) и «run» (оценок модели). Вы увидите, как запустить полноценный бенчмарк, включая статистические тесты, такие как тест рандомизации Фишера и парный t-критерий, всего одной строкой кода. Наконец, мы проанализируем отчёт ranx, который предоставит нам подробную таблицу метрик и сравнение выигрышей, ничьих и проигрышей. Это поможет нам окончательно определить, какая модель встраивания лучше всего подходит для нашего конкретного набора данных, основываясь на статистически значимых данных. Репозиторий GitHub: https://github.com/ImadSaddik/Benchma... Документация Ranx: https://amenra.github.io/ranx/ Временные метки: (00:00) Введение (00:22) Два способа сравнения: вручную и с помощью библиотеки Ranx (01:21) Таблица результатов ручного бенчмарка (02:05) Зачем нужны статистические тесты (04:31) Объяснение метрик оценки (05:14) Метрика 1: Средний обратный ранг (MRR) (08:31) Метрика 2: Полнота при K (10:12) Метрика 3: Нормализованный дисконтированный кумулятивный прирост (NDCG при K) (12:45) Введение в статистические тесты (16:05) Нулевая гипотеза и p-значение Объяснение (17:46) Статистические тесты, доступные в RANX (19:27) Пример: Парный t-критерий (20:35) Пример: Рандомизация (критерий Фишера) (25:03) Разбор кода: Руководство (38:56) Разбор кода: Тест производительности RANX (53:53) Заключение

Comments
  • Тестирование моделей встраивания #7 — Расширение набора данных и добавление новых языков 1 месяц назад
    Тестирование моделей встраивания #7 — Расширение набора данных и добавление новых языков
    Опубликовано: 1 месяц назад
  • Fine-Tuning Text Embeddings For Domain-specific Search (w/ Python) 11 месяцев назад
    Fine-Tuning Text Embeddings For Domain-specific Search (w/ Python)
    Опубликовано: 11 месяцев назад
  • Chapter 11: Robot Software Architecture 32 минуты назад
    Chapter 11: Robot Software Architecture
    Опубликовано: 32 минуты назад
  • ElasticSearch
    ElasticSearch
    Опубликовано:
  • Модели встраивания эталонных приложений №1 — Введение и таблица лидеров MTEB 3 месяца назад
    Модели встраивания эталонных приложений №1 — Введение и таблица лидеров MTEB
    Опубликовано: 3 месяца назад
  • Keep and Mulligan Guide for Mono U Faeries – Mathematical Approach 4 дня назад
    Keep and Mulligan Guide for Mono U Faeries – Mathematical Approach
    Опубликовано: 4 дня назад
  • Как устроена компьютерная графика? OpenGL / C++ 1 день назад
    Как устроена компьютерная графика? OpenGL / C++
    Опубликовано: 1 день назад
  • Тестирование моделей встраивания №5 — встраивание фрагментов текста и вопросов 1 месяц назад
    Тестирование моделей встраивания №5 — встраивание фрагментов текста и вопросов
    Опубликовано: 1 месяц назад
  • Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности 1 месяц назад
    Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности
    Опубликовано: 1 месяц назад
  • Управление поведением LLM без тонкой настройки 2 недели назад
    Управление поведением LLM без тонкой настройки
    Опубликовано: 2 недели назад
  • Краткое объяснение больших языковых моделей 1 год назад
    Краткое объяснение больших языковых моделей
    Опубликовано: 1 год назад
  • Каково это — изобретать математику? 10 лет назад
    Каково это — изобретать математику?
    Опубликовано: 10 лет назад
  • Лучший Гайд по Kafka для Начинающих За 1 Час 1 год назад
    Лучший Гайд по Kafka для Начинающих За 1 Час
    Опубликовано: 1 год назад
  • NotebookLM: большой разбор инструмента (12 сценариев применения) 3 дня назад
    NotebookLM: большой разбор инструмента (12 сценариев применения)
    Опубликовано: 3 дня назад
  • КАК УСТРОЕН TCP/IP? 1 год назад
    КАК УСТРОЕН TCP/IP?
    Опубликовано: 1 год назад
  • GOOGLE Теперь Умеет ВСЁ (Бесплатно): Все Инструменты В Одном Месте 18 часов назад
    GOOGLE Теперь Умеет ВСЁ (Бесплатно): Все Инструменты В Одном Месте
    Опубликовано: 18 часов назад
  • Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение 1 год назад
    Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение
    Опубликовано: 1 год назад
  • Как создаются степени магистра права? 1 месяц назад
    Как создаются степени магистра права?
    Опубликовано: 1 месяц назад
  • LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры 1 год назад
    LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры
    Опубликовано: 1 год назад
  • Появляется новый тип искусственного интеллекта, и он лучше, чем LLMS? 3 дня назад
    Появляется новый тип искусственного интеллекта, и он лучше, чем LLMS?
    Опубликовано: 3 дня назад

Контактный email для правообладателей: [email protected] © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5