Databricks convierte el lakehouse en CDP y sacude el mercado MarTech

Databricks acaba de mover una pieza que puede alterar el equilibrio del marketing tecnológico. Con CustomerLake, la compañía ha presentado un CDP agéntico integrado de forma nativa en su lakehouse, con capacidades de Customer 360, resolución de identidad, creación de audiencias, automatización de campañas, activación y personalización. La novedad no está solo en añadir otra herramienta para marketing, sino en colocar esa capa dentro de la infraestructura de datos donde ya viven los modelos, la gobernanza y buena parte del contexto empresarial.

Durante años, el CDP ha ocupado un lugar intermedio en la arquitectura MarTech. Recibía datos desde CRM, ecommerce, analítica, soporte, publicidad y otras fuentes; los unificaba; generaba perfiles; y después activaba audiencias hacia herramientas externas. Ese modelo resolvió muchos problemas, pero también creó otros: duplicación de datos, pipelines, sincronizaciones, costes adicionales, latencias, reglas de gobierno separadas y una dependencia constante de integraciones.

CustomerLake plantea una tesis más agresiva: si el dato ya está en el lakehouse, el CDP no tiene por qué vivir fuera. Y si los agentes de Inteligencia Artificial necesitan operar sobre datos gobernados, actualizados y conectados con modelos, métricas y reglas de negocio, mover el contexto a otra capa empieza a parecer un rodeo.

De CDP tradicional a CDP embebido

Databricks define CustomerLake como un Agentic Customer Data Platform integrado en su plataforma. Según la compañía, el producto incorpora Profile Agents para convertir datos brutos en perfiles Customer 360 listos para negocio, y Campaign Agents para construir audiencias, recomendar siguientes acciones, activar canales y ajustar campañas de forma continua en función de objetivos empresariales.

La idea encaja con una evolución que el sector llevaba años preparando. Primero llegaron los CDP clásicos, que intentaban concentrar el perfil de cliente en una plataforma independiente. Después llegaron los CDP componibles y el enfoque «zero-copy», impulsado por la idea de trabajar directamente sobre el data warehouse o lakehouse sin replicar todo en otro sistema. CustomerLake lleva esa lógica un paso más lejos: no solo se conecta al almacén de datos, sino que nace dentro de él.

ModeloDónde vive el datoVentaja principalProblema habitual
CDP tradicionalEn una plataforma CDP separadaUnifica perfiles y audiencias para marketingDuplica datos y añade otra capa de gobierno
CDP componibleSobre el warehouse o lakehouse del clienteReduce copias y usa el dato donde estáSigue dependiendo de herramientas externas y reverse ETL
CustomerLake / CDP embebidoDentro de Databricks LakehouseUne dato, agentes, modelos y gobernanza en una misma baseRefuerza la dependencia de la plataforma de datos
Activación MarTech clásicaEn herramientas de marketing y engagementEspecialización por canal y experiencia de usuarioFragmentación y sincronizaciones continuas

El punto más delicado está en la gobernanza. CustomerLake se apoya en Unity Catalog, la capa de gobierno de Databricks para datos e Inteligencia Artificial. Esto permite que los agentes de marketing trabajen bajo permisos, controles y semántica empresarial ya definidos en la plataforma. Para muchas organizaciones, esa simplificación puede ser más valiosa que una función nueva de segmentación: menos reglas duplicadas, menos datos sensibles circulando por herramientas externas y menos puntos donde se puede romper la trazabilidad.

La infraestructura entra en territorio MarTech

El movimiento tiene una lectura empresarial clara. Databricks ya no actúa solo como proveedor de infraestructura de datos, sino como competidor directo en una capa de aplicación que históricamente pertenecía al MarTech. Scott Brinker, una de las voces más seguidas del sector, lo resumia como el momento en que la infraestructura avanza sobre la capa de aplicaciones. En su análisis, CustomerLake puede construir perfiles Customer 360, refinar segmentos, resolver identidades y activar personalización en tiempo real, pero su mayor fuerza está en ser nativo de Databricks y operar bajo Unity Catalog.

Esto complica el tablero para los CDP independientes. No significa que el CDP vaya a desaparecer. De hecho, Databricks puede revitalizar la categoría al llevarla al centro de la arquitectura de datos. Pero sí obliga a los proveedores MarTech a explicar qué valor aportan cuando la plataforma de datos ya ofrece perfiles, agentes, audiencias, activación y gobernanza.

Muchas compañías seguirán necesitando herramientas especializadas para email, publicidad, comercio, atención al cliente, journeys, experimentación, CRM o fidelización. El mercado no se va a convertir de golpe en una plataforma única. Pero el centro de gravedad puede cambiar. Si el dato gobernado vive en el lakehouse y los agentes trabajan allí, las aplicaciones externas pasan a ser canales, interfaces o capas de experiencia, no necesariamente el lugar donde se define la inteligencia del cliente.

Qué son las «Infinity Campaigns»

Databricks usa el concepto de Infinity Campaigns para describir campañas continuas y agénticas que no se limitan a una audiencia estática, una regla y una fecha de envío. La promesa es que los agentes analicen señales del cliente, recomienden la siguiente mejor acción, activen experiencias en canales externos y ajusten decisiones en función de los resultados.

La idea responde a un cambio real: los compradores también están empezando a usar agentes. Si un cliente delega parte de su búsqueda, comparación o decisión en sistemas automatizados, el marketing basado en campañas lentas, segmentos amplios y reglas manuales pierde eficacia. El reto pasa a ser operar con contexto vivo: quién es el cliente, qué está intentando hacer ahora, qué objetivos tiene la empresa, qué se ha intentado antes y qué restricciones existen.

Ese contexto no sale solo del perfil de cliente. También incluye reglas de negocio, inventario, márgenes, disponibilidad, soporte, histórico de decisiones, señales en tiempo real y datos de producto. Por eso Databricks habla de pasar del «golden record» al «golden context»: no basta con saber quién es una persona, hay que entender qué está pasando alrededor de ella y qué puede hacer la empresa en ese momento.

Snowflake, BigQuery y Fabric ya tienen precedente

La pregunta inevitable es qué harán el resto de grandes plataformas de datos. Snowflake, Google BigQuery y Microsoft Fabric ya compiten por ser la base de datos, analítica e Inteligencia Artificial de las empresas. Si Databricks demuestra que puede absorber parte de la función CDP, el resto tendrá presión para responder con soluciones propias, alianzas más profundas o capas nativas de activación.

Snowflake ya tiene un ecosistema fuerte alrededor de data sharing, clean rooms, aplicaciones y marketing analytics. Google puede conectar BigQuery con su negocio publicitario, modelos Gemini y herramientas cloud. Microsoft Fabric tiene una ventaja natural en empresas muy apoyadas en Dynamics, Power Platform, Azure y Microsoft 365. La dirección parece clara: la plataforma de datos quiere dejar de ser solo repositorio y convertirse en sistema operativo para agentes empresariales.

Para los equipos de marketing, el cambio exige una revisión seria de arquitectura. Ya no basta con preguntar qué CDP tiene mejor interfaz o más conectores. Hay que preguntarse dónde vive el dato maestro, quién gobierna los permisos, cómo se resuelven identidades, cuánto cuesta mover datos, qué latencia tiene la activación y si los agentes pueden actuar con contexto fiable.

CustomerLake no elimina la complejidad del marketing. La desplaza hacia otra capa. Reduce fricción en datos y gobierno, pero exige madurez en Databricks, modelos bien diseñados, calidad de datos, reglas claras y colaboración real entre marketing, data, tecnología y negocio.

El lanzamiento deja una idea difícil de ignorar: la infraestructura ya no quiere limitarse a sostener el MarTech. Quiere participar en la decisión, la activación y la personalización. Para muchas marcas, eso puede significar menos capas y más control. Para los proveedores MarTech puros, supone una advertencia: su próximo competidor quizá no sea otro CDP, sino la plataforma de datos sobre la que ellos mismos se apoyan.

Preguntas frecuentes

¿Qué es Databricks CustomerLake?
CustomerLake es un CDP agéntico integrado en Databricks. Combina Customer 360, resolución de identidad, segmentación, automatización, activación y personalización sobre el lakehouse gobernado por Unity Catalog.

¿Sustituye a los CDP tradicionales?
No necesariamente, pero sí compite con parte de sus funciones. Puede reducir la necesidad de un CDP separado en empresas que ya centralizan datos, modelos y gobernanza en Databricks.

¿Qué diferencia hay entre un CDP componible y CustomerLake?
Un CDP componible trabaja sobre datos del warehouse o lakehouse, pero suele seguir siendo una herramienta externa. CustomerLake está embebido dentro de Databricks, con agentes y gobierno integrados en la misma plataforma.

¿Qué impacto puede tener en Snowflake, BigQuery o Microsoft Fabric?
CustomerLake crea un precedente. Otros proveedores de datos pueden verse empujados a lanzar capacidades CDP, activar alianzas más profundas o entrar en capas de aplicación que antes pertenecían al MarTech.

vía: newsletter.chiefmartec y databricks

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

Las últimas novedades de tecnología y cloud

Suscríbete gratis al boletín de Revista Cloud. Cada semana la actualidad en tu buzón.

Suscripción boletín
×