• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

(Урок 3) Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain) скачать в хорошем качестве

(Урок 3) Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain) 1 день назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
(Урок 3) Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain)
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: (Урок 3) Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain) в качестве 4k

У нас вы можете посмотреть бесплатно (Урок 3) Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain) или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон (Урок 3) Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain) в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



(Урок 3) Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain)

В этом уроке мы прокачиваем RAG pipeline на LangChain и разбираем этап индексации — то, на чем держится качество поиска и ответов LLM. Покажу, как перестать грузить “одну страницу”, научиться забирать все страницы сайта через sitemap, а также как сделать рекурсивный обход ссылок внутри домена. Дальше улучшаем splitting (учёт структуры HTML и токенов), подбираем более подходящую эмбеддинг-модель под русский язык и ускоряем работу Chroma — чтобы индекс не пересобирался при каждом запуске. Antarctic Wallet – оплата USDT по QR-коду (Используется в курсе как реальный кейс для построения RAG-системы поддержки): https://t.me/antarctic_wallet_bot/app... Код, конспект урока и дополнительные материалы выложил в tg: https://t.me/semolina_code_python/152    • (Урок 1) RAG для новичков: как LLM работае...      • (Урок 2) RAG для новичков: RAG pipeline на...   Что будет в уроке: – Какие узлы есть в RAG pipeline и где чаще всего теряется качество – Загрузка данных: Web loader → SitemapLoader → RecursiveURLLoader – Почему “мусорный текст” убивает релевантность и что с этим делать – Сплиттинг: структурный (HTML) vs токеновый – Эмбеддинги: как выбирать модель под язык/размерность, зачем префиксы Search Query / Search Document – Векторное хранилище: Chroma, проверка наличия индекса, ускорение запуска, база для инкрементальных обновлений Следующий урок: Поиск и генерация — ретривер, постпроцессинг, системный промпт и улучшение финальной LangChain-цепочки. Если хочешь “идеальный RAG”, обязательно прочитай методичку/таблицы улучшений и прогоняй спорные пункты через ChatGPT — это ускоряет понимание и даёт лучшие решения под твой кейс. Если было полезно — поставь лайк и подпишись: дальше будет поиск+генерация, дебаг через LangSmith и потом настоящий агент поверх RAG. Таймкоды: 00:00 — Введение: что улучшаем в RAG pipeline 00:23 — Из каких узлов состоит наш RAG (карта пайплайна) 01:00 — План урока: индексация vs поиск/генерация 02:22 — Как работаем с каждым узлом: что делает → как улучшить → код 04:30 — Загрузка документов: почему это “ядро базы” 05:07 — Обзор лоадеров LangChain (file/web/Notion/GitHub/Jira и т.д.) 06:33 — Проблемы текущего кода (1 страница, нет sitemap, много мусора, нет обновления) 08:35 — Что такое sitemap и почему это must-have 11:53 — SitemapLoader: загружаем все страницы через sitemap.xml 12:43 — Ошибка в ноутбуке и запуск кода из файла 14:03 — RecursiveURLLoader: рекурсивный обход сайта (глубина) 17:49 — Результаты по глубине (1/2/3) и странности в цифрах 20:43 — Splitting: зачем, какие стратегии бывают 22:13 — Недостатки символьного сплиттинга 23:37 — Вариант 1: структурный HTML splitter 24:19 — Вариант 2: token-based splitter (пример с 256 токенов) 25:02 — Эмбеддинги: что это и почему критично 25:53 — Типы эмбеддинг-моделей (API/локальные/мультиязычные/domain) 28:02 — Переход на RuBERT/“росберто”: зачем и что меняем 28:30 — PrefixEmbeddings: префиксы для query/document 30:24 — Предупреждение про pooler layer: почему это ок для embeddings 31:07 — Vector Store: какие бывают хранилища и когда Chroma норм 32:34 — Проблемы: пересборка индекса, нет инкремента, нет метаданных 33:57 — Фикс: проверка индекса → ускоряем запуск 34:46 — Сколько чанков получилось и сколько времени строится индекс 35:18 — Повторный запуск: вместо минут — миллисекунды 36:00 — Итоги индексации и что будет в следующем уроке rag, rag pipeline, langchain rag, langchain, rag на langchain, embeddings, эмбеддинги, vector store, векторное хранилище, chroma, chromadb, sitemaploader, recursiveurlloader, document loaders, text splitter, token text splitter, recursive character text splitter, html splitter, retrieval augmented generation, llm, локальный llm, ollama, huggingface, rubert, sentence embeddings, семантический поиск, rag для новичков, ai, gpt, python, ai agents, langchain community #RAG #LangChain #LLM #Python #Embeddings #ChromaDB #SemanticSearch

Comments
  • (Урок 4) Как улучшить RAG pipeline: retriever, post-processing, промпт, llm, финальная цепочка 14 часов назад
    (Урок 4) Как улучшить RAG pipeline: retriever, post-processing, промпт, llm, финальная цепочка
    Опубликовано: 14 часов назад
  • Серебро по $71 — это ГЛУБОКИЙ НАРКОЗ, который уничтожит ваш КАПИТАЛ | Уоррен Баффет 1 день назад
    Серебро по $71 — это ГЛУБОКИЙ НАРКОЗ, который уничтожит ваш КАПИТАЛ | Уоррен Баффет
    Опубликовано: 1 день назад
  • Google MedASR: локальный ИИ для точного медицинского диктования 2 часа назад
    Google MedASR: локальный ИИ для точного медицинского диктования
    Опубликовано: 2 часа назад
  • Создаем AI-агентов на LangChain/LangGraph от идеи до MVP за 20 минут! 5 месяцев назад
    Создаем AI-агентов на LangChain/LangGraph от идеи до MVP за 20 минут!
    Опубликовано: 5 месяцев назад
  • Лучший Гайд по NoSQL для Начинающих | Redis, Mongo, Cassandra 1 год назад
    Лучший Гайд по NoSQL для Начинающих | Redis, Mongo, Cassandra
    Опубликовано: 1 год назад
  • Как устроен PHP 🐘: фундаментальное знание для инженеров 1 месяц назад
    Как устроен PHP 🐘: фундаментальное знание для инженеров
    Опубликовано: 1 месяц назад
  • Будущее ИИ, о чём молчит Кремниевая долина — интервью с Демисом Хассабисом, CEO DeepMind 4 дня назад
    Будущее ИИ, о чём молчит Кремниевая долина — интервью с Демисом Хассабисом, CEO DeepMind
    Опубликовано: 4 дня назад
  • (Урок 2) RAG для новичков: RAG pipeline на LangChain – от сайта до ответов (Chroma + Ollama) 4 дня назад
    (Урок 2) RAG для новичков: RAG pipeline на LangChain – от сайта до ответов (Chroma + Ollama)
    Опубликовано: 4 дня назад
  • Sony a7 V. Первое впечатление. 1 день назад
    Sony a7 V. Первое впечатление.
    Опубликовано: 1 день назад
  • Сделал САЙТЫ с помощью ChatGPT за 60, 6000 и 60 000 секунд 3 месяца назад
    Сделал САЙТЫ с помощью ChatGPT за 60, 6000 и 60 000 секунд
    Опубликовано: 3 месяца назад
  • Как загрузить сайт в интернет | Полный Гайд 2026 3 недели назад
    Как загрузить сайт в интернет | Полный Гайд 2026
    Опубликовано: 3 недели назад
  • Я был первым иностранцем с камерой в КНДР — и вот что изменилось 1 день назад
    Я был первым иностранцем с камерой в КНДР — и вот что изменилось
    Опубликовано: 1 день назад
  • База по оптимизации PostgreSQL: схема, индексы, чтение EXPLAIN, методы доступа и соединения, тюнинг 1 год назад
    База по оптимизации PostgreSQL: схема, индексы, чтение EXPLAIN, методы доступа и соединения, тюнинг
    Опубликовано: 1 год назад
  • (Урок 1) RAG для новичков: как LLM работает с документами и приватными данными 8 дней назад
    (Урок 1) RAG для новичков: как LLM работает с документами и приватными данными
    Опубликовано: 8 дней назад
  • Что такое RAG в LLM и причём тут векторные базы данных 7 месяцев назад
    Что такое RAG в LLM и причём тут векторные базы данных
    Опубликовано: 7 месяцев назад
  • Как устроена База Данных? Кластеры, индексы, схемы, ограничения 1 год назад
    Как устроена База Данных? Кластеры, индексы, схемы, ограничения
    Опубликовано: 1 год назад
  • Почему МАЛЕНЬКИЙ атом создает такой ОГРОМНЫЙ взрыв? 3 недели назад
    Почему МАЛЕНЬКИЙ атом создает такой ОГРОМНЫЙ взрыв?
    Опубликовано: 3 недели назад
  • Лучший способ настройки Windows 11 полезно и для мощных ПК +FPS -ЛАГИ 3 недели назад
    Лучший способ настройки Windows 11 полезно и для мощных ПК +FPS -ЛАГИ
    Опубликовано: 3 недели назад
  • РУССКАЯ СКАЗКА про Виртуальный Мир Матрицы? Мудрая, но никому не известная сказка про древнюю Русь! 1 день назад
    РУССКАЯ СКАЗКА про Виртуальный Мир Матрицы? Мудрая, но никому не известная сказка про древнюю Русь!
    Опубликовано: 1 день назад
  • Как достичь Ближайших Звёзд — Документальный фильм (2025) 1 день назад
    Как достичь Ближайших Звёзд — Документальный фильм (2025)
    Опубликовано: 1 день назад

Контактный email для правообладателей: [email protected] © 2017 - 2025

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5