У нас вы можете посмотреть бесплатно Polars y la Optimización en el Procesamiento de Datos con Rust | Meetup Rust или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Esta charla se presenta Polars, una librería de procesamiento de datos en Python cuyo motor de ejecución está escrito en Rust, destacando sus ventajas de rendimiento sobre herramientas tradicionales como Pandas. La presentación se divide en dos secciones principales: una demostración práctica de Polars en Python por Flavio, y una exploración de su implementación en Rust. Puntos Clave de la Presentación Ventajas de Polars (Motor en Rust): Control de Memoria y Velocidad: Gracias a Rust, Polars evita el Global Interpreter Lock (GIL) de CPython y la necesidad de un Garbage Collector, permitiendo un control manual y preciso de la memoria, lo que se traduce en mayor velocidad. Paralelismo "Vergonzoso": Polars está diseñado para ser masivamente paralelo, utilizando de manera eficiente todos los núcleos del CPU disponibles, lo que optimiza el uso de hardware moderno y permite escalar verticalmente el procesamiento de dataframes. Seguridad y Robustez: El diseño en Rust elimina errores de bajo nivel relacionados con la memoria, haciendo que los pipelines de datos sean más robustos y confiables al procesar terabytes de información. Arquitectura y Optimización: Apache Arrow: Polars utiliza Apache Arrow como estándar en memoria para datos columnares, lo que actúa como un "chasis" o sistema de transmisión. Esto facilita operaciones de "copia cero" (pasando punteros de memoria en lugar de copiar datos) y habilita la vectorización de operaciones (SIMD), acelerando la ejecución. Lazy Execution (Ejecución Perezosa): Esta es la característica más poderosa de Polars. En lugar de ejecutar cada comando inmediatamente (API ansiosa), construye un grafo de ejecución lógico optimizado (DAG) antes de tocar los datos. Optimización de Consultas: El optimizador realiza ajustes como el Predicate Pushdown (mover los filtros lo más cerca posible a la fuente de datos) y la Column Pruning (podar columnas, leyendo solo las necesarias), reduciendo drásticamente el uso de memoria y el tiempo de procesamiento. Demostración Práctica: Se demostró cómo la API ansiosa falló al cargar un gran volumen de archivos Parket debido a la limitación de memoria, mientras que la API perezosa ejecutó el mismo procesamiento en segundos gracias a la optimización del plan de consulta. Implementación de Polars en Rust Manejo de Datos y Sentencia SQL: Gus mostró cómo crear y manipular dataframes directamente en Rust, destacando que Polars está diseñado con un Domain Specific Language (DSL) que imita la sintaxis SQL (ej. select, filter, group_by). Manipulación y Transformación: Se ejemplificó la lectura de archivos CSV, la selección y proyección de columnas, la agregación (cálculo de medias, máximos) y la creación de nuevas columnas (Feature Engineering), todo bajo el paradigma de ejecución perezosa de Polars.