У нас вы можете посмотреть бесплатно Databricks GenAI Engineer: LSH vs HNSW — Qué Algoritmo Usar en Vector Search para RAG или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Cuando construyes un sistema RAG (Retrieval Augmented Generation), uno de los errores más comunes ocurre en la base misma del sistema: cómo estás indexando los embeddings dentro de tu vector database. Muchos equipos generan embeddings y los almacenan sin pensar demasiado en qué algoritmo de búsqueda vectorial están utilizando. El problema es que la forma en que indexas esos vectores define directamente la calidad de la búsqueda semántica. Si tu sistema RAG: devuelve documentos poco relevantes, encuentra resultados correctos demasiado tarde, o necesita recorrer demasiados vectores para responder, es muy probable que el problema esté en la estrategia de indexación del vector search. En este video vamos a analizar cómo diseñar correctamente tu estrategia de embeddings y búsqueda vectorial para mejorar la precisión semántica de tus aplicaciones GenAI. En particular veremos: • Qué papel juegan los embeddings en sistemas RAG • Cómo funciona la búsqueda semántica en bases de datos vectoriales • Diferencias entre Locality Sensitive Hashing (LSH) y Hierarchical Navigable Small World (HNSW) • En qué casos cada algoritmo puede ofrecer mejores resultados • Cómo evaluar la calidad de los embeddings con métricas de similaridad como cosine similarity • Cómo comparar resultados de recuperación contra datasets de prueba representativos También discutiremos un principio importante en arquitecturas GenAI: La calidad de tu sistema RAG depende tanto del modelo LLM como de la calidad del retrieval. Si los embeddings no están bien indexados o el algoritmo de búsqueda no está optimizado, incluso los mejores modelos generativos responderán con contexto incorrecto o irrelevante. Este conocimiento es fundamental si estás construyendo: • Motores de búsqueda semántica en documentos • Chatbots empresariales con RAG • Sistemas GenAI sobre grandes repositorios de conocimiento • Aplicaciones con vector databases en Databricks • Plataformas de IA para automatizar acceso a información Si trabajas en Data Engineering, AI Engineering o GenAI, este video te ayudará a entender cómo optimizar embeddings, vector search y retrieval para mejorar la calidad de tus aplicaciones. Nos vemos dentro. #GenAI #ArtificialIntelligence #RAG #Embeddings #VectorSearch #SemanticSearch #LLM #Databricks #AIEngineering #DataEngineering #MachineLearning #AIArchitecture #FutureOfWork #NextGenWork #AIProfessionals #TechCareers #AIEducation #MLOps #BigData #KnowledgeAI