Snowflake ha dado un paso importante hacia un ecosistema de datos más abierto y flexible al anunciar la integración de sus principales capacidades —alto rendimiento, intercambio seguro de datos y protección avanzada— con tablas Apache Iceberg™, uno de los formatos de tabla de datos abiertos que más crecimiento está experimentando en la actualidad.
Esta integración permite a las organizaciones aprovechar sus datos de forma más ágil y eficiente, sin necesidad de moverlos ni de comprometer la seguridad o el rendimiento. Además, facilita una interoperabilidad abierta, lo que permite activar y analizar datos desde entornos gestionados y abiertos sin complicaciones.
Gracias a este avance, los clientes de Snowflake pueden acelerar la adopción de arquitecturas open lakehouse, accediendo y compartiendo datos de forma fluida para desarrollar e implementar soluciones avanzadas, incluyendo aplicaciones basadas en inteligencia artificial.
Hasta ahora, muchas empresas se veían obligadas a elegir entre plataformas integradas de gestión de datos o soluciones basadas en formatos abiertos como Parquet, lo que implicaba ciertos compromisos. Con el soporte completo de Snowflake para Apache Iceberg, esta disyuntiva desaparece: los usuarios pueden almacenar, gestionar y analizar sus datos en un formato abierto e interoperable, disfrutando al mismo tiempo de todas las ventajas de una plataforma confiable, conectada y fácil de utilizar.
«El futuro de los datos es abierto, pero también debe ser fácil», dice Christian Kleinerman, EVP of Product, Snowflake. «Los clientes no deberían tener que elegir entre formatos abiertos y un rendimiento superior, o continuidad del negocio. Con las últimas innovaciones de Snowflake en tablas Iceberg, los clientes pueden trabajar con sus datos abiertos exactamente como lo harían con los datos almacenados en la plataforma Snowflake, todo ello eliminando la complejidad y preservando el rendimiento y la seguridad empresarial de Snowflake.»
El soporte mejorado de Snowflake para tablas Iceberg se puede utilizar para acelerar:
● Analítica de Lakehouse: Los clientes ahora pueden disfrutar del mismo motor de cómputo del formato nativo de tabla de Snowflake en las tablas Iceberg, y aplicar el servicio Search Optimization (próximamente en disponibilidad general) o el servicio de Query Acceleration (próximamente en disponibilidad general) 3 4 a las tablas Iceberg para optimizar el rendimiento de las consultas. Con las tablas Iceberg gestionadas de Snowflake, los clientes obtienen la flexibilidad de los formatos de almacenamiento abiertos, conservando a la vez la excelente relación precio-rendimiento que distingue al AI Data Cloud de Snowflake, líder en el sector 5. Snowflake está colaborando activamente con la comunidad de Apache Iceberg para lanzar soporte para los tipos de datos VARIANT.
● Seguridad y gobernanza integrales, con continuidad del negocio y recuperación ante desastres incorporadas: Snowflake ofrece seguridad sin fisura a las tablas Iceberg, proporcionando controles potentes e intuitivos para mantener los entornos open lakehouse seguros y fáciles de gestionar, al mismo tiempo que permite el cumplimiento del compliance por parte de los clientes. Los clientes obtienen lo mejor de ambos mundos: la flexibilidad de los datos abiertos con la seguridad integrada. Snowflake también está extendiendo su replicación y sincronización de datos confiables a las tablas Iceberg (en versión preliminar privada), asegurando que, en caso de fallo del sistema, ciberataque u otros desastres, las empresas puedan restaurar rápidamente sus datos sin interrupciones importantes, todo ello mientras se da soporte a las arquitecturas open lakehouse.
● Intercambio de Datos: Al llevar la tecnología de intercambio seguro de datos de Snowflake a las tablas Iceberg, los clientes pueden acceder, compartir, distribuir y monetizar sus datos de forma fluida, tal como lo hacen con los formatos de tabla nativos de Snowflake.
Impulsando el futuro del código abierto y la innovación de datos
Snowflake está profundamente comprometido con la promoción de estándares abiertos y proyectos open source impulsados por la comunidad que mejoran la interoperabilidad y la transparencia de los datos. De hecho, el 35% de las adquisiciones de Snowflake en los últimos cuatro años han sido empresas con tecnologías que refuerzan los ecosistemas de datos abiertos, lo que subraya la inversión de la empresa en apertura.
Entre los proyectos de código abierto notables a los que Snowflake contribuye se incluyen:
● Apache IcebergTM: las contribuciones de Snowflake a Iceberg permiten una gestión eficiente y gobernada de data lakes con evolución de esquemas, particionamiento y gestión de transacciones.
● Apache NiFi: desarrollado sobre NiFi, Datavolo (adquirirda por Snowflake en 2024) simplifica la ingesta, transformación y gestión de pipelines en tiempo real.
● Apache PolarisTM (En Incubación): Diseñado para superar los desafíos de la dependencia de un proveedor, Apache PolarisTM garantiza la seguridad empresarial y la interoperabilidad de Iceberg entre los principales proveedores de la nube.
● Modin: Snowflake acelera las cargas de trabajo de pandas (biblioteca de Python) con Modin (adquirida por Snowflake en 2023), permitiendo una escalabilidad fluida sin cambios en el código.
● Streamlit: La integración de Snowflake con Streamlit (adquiridad por Snowflake en 2022) permite a los usuarios crear y compartir aplicaciones web interactivas, paneles de datos y visualizaciones con facilidad.
● TruEra: TruEra (adquirida por Snowflake en 2024) impulsa la explicabilidad de la IA y la monitorización del rendimiento de los modelos para la detección de sesgos, el cumplimiento normativo y la obtención de información sobre el rendimiento.