Noticias

“Kafka y Flink son el sistema nervioso central de los datos para la empresa inteligente”

Aprovechando nuestra asistencia a la nueva edición de Current 2026 que ha tenido lugar esta misma semana en Londres, tuvimos la oportunidad de entrevistar a Shaun Clowes, Chief Product Officer de Confluent. El directivo participó en la keynote del primer día llevando a cabo los lanzamientos más importantes de la compañía. Con el fin de aclarar en qué consisten las novedades, tuvimos una charla muy interesante en la que nos subrayó que “las empresas que no dominen sus datos en tiempo real, quedarán fuera de la revolución de la IA”. No pierdas detalle de la misma.

Según un informe de McKinsey, muchas organizaciones ven las limitaciones de los datos como la principal barrera para escalar la IA agéntica. ¿Cómo está abordando Confluent ese cuello de botella?

Si pensamos detenidamente en qué es realmente la IA, podemos decir que se trata de captar lo que ocurre en el mundo, entender la situación y actuar para resolver, mejorar o evolucionar el proceso de los negocios. Mucha gente cree que el problema está en la inteligencia, en el modelo, en la «parte inteligente», pero en realidad, incluso antes de la IA, el problema siempre ha sido acceder a los datos clave, desde los lugares correctos, para entender qué está pasando, qué opciones hay disponibles y qué acción se debe tomar.

Muchos proyectos de IA se quedan en fase piloto o en demos, porque es relativamente sencillo demostrar que un agente muy inteligente, con todos los datos, puede tomar buenas decisiones. Pero si no puedes hacer llegar los datos al agente en el momento y lugar adecuados, no puedes conseguir lo esencial.

Siempre hemos visto que el problema suele producirse en el dato: su calidad, que sea actual, y su análisis avanzado. Lo que tratamos de hacer es que todos los datos de una empresa estén disponibles para su uso de forma instantánea en cualquier situación, desde el momento en que son generados.

La gente piensa en Kafka como algo técnico, como un software, pero siempre se creó con la intención de que los datos estuvieran disponibles para toda la organización en el instante en que se producen. Kafka lleva catorce años con esa misma misión: la portabilidad y universalidad del dato para hacer que esté en todas partes desde el momento de su creación. Lo que hemos estado haciendo es trabajar para que resulte verdaderamente relevante en el mundo actual. Esta tecnología y el momento que vivimos lo hacen especialmente relevante para poder acceder a los datos en tiempo real y que la IA pueda cumplir con su finalidad.

De los lanzamientos anunciados por Confluent en Current 2026, ¿cuál considera que tendrá mayor impacto en las organizaciones?

Empezaré por Confluent Intelligence. Lo que hace es permitir que cualquier agente conozca los datos en streaming mediante MCP. De manera literal, conectas tu agente a Confluent Intelligence y al instante tienes acceso a todos los datos de los flujos que le hayas habilitado. Si tienes un flujo de datos de pago de clientes, de detalles de clientes, de inventario, de envíos, de lo que sea que ocurre en tu negocio, el agente puede conocerlos al instante sin tener que hacer nada. Cuando conectas el servidor MCP y haces una pregunta del tipo «cuéntame los últimos envíos de este cliente», el sistema sabrá cómo obtener esa información con datos actualizados al milisegundo.

“Kafka y Flink son el sistema nervioso central de los datos para la empresa inteligente” 1

Una vez que tienes esa capacidad —la conexión instantánea de datos en tiempo real hacia los agentes—, la siguiente pregunta es: ¿cómo consigo datos de buena calidad para los agentes? Aquí es donde entra Flink: toma datos en bruto de todos tus sistemas y te permite combinarlos, enriquecerlos y agregarlos, algo que muchas organizaciones hacen en su datalake, pero Flink lo hace sobre los datos en tiempo real. Así pueden llegar los datos de mayor valor a los agentes de IA en cuestión de milisegundos.

Todo lo que ocurre en tu negocio se convierte en un sistema nervioso central que te permite aprovechar esos datos e incorporarlos directamente al flujo de trabajo de los agentes. Y si añades Tableflow, esos mismos datos en tiempo real —que Flink ha unido, enriquecido y consolidado sobre clientes, fábricas o cualquier área de tu negocio— llegan automáticamente tanto a tus agentes de IA a través de Confluent Intelligence, como a tu data warehouse o data lake a través de Tableflow, sin necesidad de intervención manual.

En general la gente acaba escribiendo mucho código para hacer todo esto; construye nuevos sistemas y procesos para intentar que sus datos sean útiles. Lo que hacemos en Confluent es evitar que tengas que pensar en sistemas o en código, y solo lo tengas que hacer en datos: qué son mis datos, dónde están, cómo los presento de todas las formas posibles. Una única fuente de datos, en tiempo real, de alta calidad, en todas partes donde se necesite, sin escribir toneladas de código ni añadir mayor complejidad.

Confluent está incorporando a Flink soporte para Anthropic, Open AI, Fireworks AI y otros modelos. ¿Cuál es la filosofía sobre la elección de modelos? ¿neutralidad total o preferencia por ciertas integraciones?

Es evidente que las personas quieren usar muchos modelos diferentes, buscando el mejor para cada propósito. Las necesidades van desde abordar problemas sencillos —como valorar el sentimiento de un comentario de cliente— hasta investigar un problema abstracto y generar una solución completa. Creemos que es irreal pensar que usaremos los grandes modelos frontera para cada propósito, porque el número de casos de uso es amplísimo.

“Kafka y Flink son el sistema nervioso central de los datos para la empresa inteligente” 2

Por ejemplo, Flink ya destaca en detección de anomalías: examinar flujos de datos y determinar si un pago, una transferencia o una lectura de sensor es anómala. Existe una guía de trabajo al respecto —modelos estadísticos, modelos de ciencia de datos— que la academia lleva décadas estudiando, y Flink es muy bueno en eso. No tendría ningún sentido usar un LLM para eso: sería más rápido, más eficiente, mucho menos costoso y a menudo más preciso usar simplemente la herramienta adecuada para ese trabajo.

Por eso, con el soporte de modelos en Flink queremos que las organizaciones puedan traer el mejor modelo para cada caso de uso: invocar modelos de Anthropic, de Gemini, de OpenAI, o incluso alojar tus propios modelos, incluyendo modelos de lenguaje pequeños. Hay muchos casos de uso distintos para cada tipo de problema, y nuestro trabajo es permitirte reunir todas estas tecnologías alrededor de tus datos, no decirte que solo hay una respuesta o una solución.

La identidad de los agentes se está convirtiendo en uno de los mayores desafíos de seguridad en la IA empresarial. ¿Qué ofrece Confluent hoy para gobernar y autenticar agentes que operan sobre flujos de datos?

Estoy de acuerdo en que la identidad del agente es un problema que preocupa en gran medida a las organizaciones. La identidad del agente y el acceso acotado del agente —es decir, qué es un agente, a qué tiene acceso y durante qué periodo de tiempo— es un problema fascinante, porque un agente es efectivamente un proxy de un ser humano. De la misma forma en que te preguntas cómo puedes estar seguro de que una persona es quien dice ser y de que debe tener acceso a determinados datos, los mismos problemas existen en el mundo agéntico, pero a mayor escala porque habrá muchos más agentes.

IBM tiene un amplio portfolio de soluciones específicamente diseñadas para resolver la identidad del agente: una forma de autenticar agentes, donde los agentes pueden tener sus propias credenciales y acceso acotado a los sistemas. Te puedo confirmar que IBM está trabajando y avanzando en sus soluciones. Obviamente necesitamos integrarnos con la identidad del agente y con la autenticación del agente.

Ahora que Confluent forma parte de IBM, ¿qué integraciones específicas con el portfolio de productos —Watsonx, Cloud o infraestructura mainframe— aportarán mayor valor a los clientes empresariales?

Aunque no sea la respuesta más precisa, te diría que todas. Una forma de entender lo que hace Confluent es comprobar que llevamos diez años evolucionando Kafka y Flink, y la ventaja de estas soluciones entre las que habría que añadir Iceberg y Delta —las tecnologías sobre las que estamos construidos— es que son estándares abiertos para manejar datos, procesarlos y reaccionar a los datos en movimiento.

Eso significa que IBM ya tiene un gran soporte dentro del portfolio de Web Methods, del portfolio de automatización de aplicaciones y BPM, y del portfolio de Watsonx. Si te lo mostrara mañana, verías que ya funciona: tus tecnologías de automatización pueden conectarse directamente con Kafka y Flink, la infraestructura de Watsonx puede consultar los datos que salen de Confluent, y Watsonx Orchestrate puede orquestar también agentes de IA usando datos de Confluent.

Lo que quiero transmitir es que ya está muy bien integrado, porque Kafka y Flink son como un sistema nervioso central para los datos. Para los clientes, eso significa que pueden resolver problemas de negocio de forma fluida: desde el portfolio de automatización con las capacidades BPM de IBM, integrando todos sus sistemas de negocio, diseñando y midiendo procesos, hasta alimentar todo eso a través de Kafka y Flink para que el resto de los sistemas puedan reaccionar y operar sobre esa información, y luego verterlo todo en Watson y Watsonx Orchestrate.

Ya es posible construir agentes que automatizan procesos de negocio en el dominio operativo, como parte de un portfolio más amplio. Para los clientes, eso significa que pueden resolver el problema completo —los operacionales y los analíticos— con un solo sistema, incluso en entornos híbridos: desde on-premise con z/OS autogestionado hasta la nube. Un sistema nervioso central para resolver los problemas de negocio.

Confluent maneja una gran cantidad de datos sensibles en su plataforma. ¿La criptografía post-cuántica está ya en vuestra hoja de ruta sobre seguridad?

Absolutamente. Ya soportamos distintos tipos de cifrado a lo largo de toda la plataforma, incluyendo cifrado de extremo a extremo desde el momento en que se produce el dato hasta que se consume. Podemos hacer cifrado de extremo a extremo, cifrado en reposo y cifrado en tránsito, e implementamos valores de protección resistentes a la era quantum en toda la suite. Los clientes pueden elegir qué valores utilizar, pero el mensaje final es que soportamos cifrados resistentes al quantum para que puedan cifrar sus datos preparándose para el mundo post-cuántico.

Por último, ¿cómo ves la evolución de los datos en tiempo real y la IA durante los próximos años?

Durante muchos años las empresas han estado luchando por intentar entender lo que ocurre en sus negocios en una modalidad por lotes para luego tomar decisiones, actuar y volver a hacer más lotes. Ha habido una evolución: primero los negocios operaban en ciclos mensuales, luego semanales, después diarios, y ahora ves a empresas intentando que sus lotes sean por horas, y eventualmente pensando que quizás deberían ser por minutos. Es evidente que el hecho de poder aprovechar tus datos más rápido, tener una visión consistente de lo que ocurre, te otorga una ventaja competitiva y te hace ser mejor. En términos generales, el mundo va constantemente más rápido, no más lento.

“Kafka y Flink son el sistema nervioso central de los datos para la empresa inteligente” 3

La IA ha llegado para explotar ese problema de forma absoluta, porque antes el mundo se movía a la velocidad del pensamiento humano: las personas tenían que leer un informe concreto y tomarse su tiempo para tomar decisiones y actuar. El ciclo —desde que algo ocurría hasta que se entendía y se llegaba a la acción— iba a la velocidad de un ser humano, y cada organización tiene relativamente pocos humanos. Pero con los agentes hay un número ilimitado de ellos, nunca duermen y van tan rápido como los modelos y los datos les permiten ir. Hay una explosión absoluta en el número de problemas que se pueden resolver, y también un recorte dramático del tiempo que se esperaría.

Los datos solo deben ser más recientes para que los agentes sean más efectivos. Si todo sigue en micro-lotes o lotes, los agentes no pueden ir más rápido que los datos. Lo que vemos es una explosión en la demanda de uso de datos en tiempo real y en el número de consumidores de datos que los demandan. Si piensas en los agentes como consumidores, el número de casos de uso y usuarios de esos datos en una organización está absolutamente explotando.

Vemos una enorme oportunidad para que las organizaciones vayan más rápido de lo que nunca han ido, pero solo si descubren cómo aprovechar sus datos, podrán tomar el control real sobre ellos. Las compañías que empiecen a resolver estos problemas, las que desbloqueen sus datos de forma significativa, serán las que podrán capturar el futuro de la IA. Las que estén atascadas con sus datos almacenados en distintos sistemas, con datos viejos o datos rotos en algún data warehouse, perderán capacidades y dejarán de ser competitivas. Será muy interesante ver de forma tangible cuánto más rápido crecen las que consigan poner remedio a sus desafíos, frente a las que permanezcan atrapadas en el mundo ETL/ELT (Extract, Transform, Load)/ (Extract, Load, Transform) por lotes.

Powered by WPeMatico

Gustavo Genez

Informático de corazón y apasionado por la tecnología. La misión de este blog es llegar a los usuarios y profesionales con información y trucos acerca de la Seguridad Informática.