Noticias

Las batallas por el modelo de la Inteligencia Artificial

Por Fernando Fuentes, Head of Arsys Cloud Solutions Sales Enablement
Por Fernando Fuentes, Head of Arsys Cloud Solutions Sales Enablement

En las tres décadas que llevo trabajando en el sector he sido testigo de colosales enfrentamientos tecnológicos. La de los portales, entre Yahoo! y Lycos; la de los navegadores, entre Netscape y Explorer; la de las videoconsolas, con Sega y PlayStation de protagonistas; o incluso la que se produce todavía por esa diferente manera de entender la informática que plantean el PC y el Mac. En este sector nos gusta especialmente enfrentar las distintas maneras que tienen las empresas de llevar sus innovaciones al mercado.

En los dos últimos años, la Inteligencia Artificial Generativa se ha convertido en el epicentro de muchos de estos enfrentamientos. Con la llegada de DeepSeek, a finales de enero, todo se llevó al terreno geopolítico. Sin embargo, más allá de los nombres propios asociados a la IA, seguramente la mayor confrontación alrededor de esta tecnología subyace y se concreta en los diferentes modelos de lenguaje que consiguen que las máquinas comprendan lo que les pedimos y nos generen esas respuestas inteligentes que tanto nos convencen.

Generalmente, nos referimos a estos modelos como LLM (modelos de lenguaje de gran tamaño). Para generar esa inteligencia generalista que nos lleva maravillando tantos meses, los LLM procesan centenares de miles de millones de parámetros. Esto requiere un entrenamiento intensivo que demanda unas capacidades de cómputo más allá de lo imaginable, en cuanto a procesadores y GPU y, consecuentemente, cifras mastodónticas de inversión en colosales centros de datos.

Por contraposición a los exigentes devoradores de datos que son los LLM, también hay una corriente más pragmática. Son los denominados Small Language Models (SLM), modelos no tan conocidos y más contenidos en tamaño y requerimientos. Trabajan con “solo” unos 13.000-15.000 millones de parámetros y dan lugar a una inteligencia más especializada, pero también más que suficiente para muchos casos de uso empresariales. Tienen un rendimiento más limitado, pero también requieren una capacidad de cómputo más fácilmente asumible. Y no pasará mucho tiempo antes de que los SLM salten de los centros de datos a los dispositivos edge computing y terminales móviles.

Un debate recurrente

La IA generativa también ha puesto sobre la mesa un debate ya recurrente en el sector tecnológico: el código abierto versus la tecnología propietaria. Frente a los populares y propietarios ChatGPT o Gemini, DeepSeek es un LLM que ha abanderado la causa del open source cuando hablamos de IA. Pero no podemos olvidar que DeepSeek no es, ni mucho menos, el único LLM de código abierto. En esta categoría encontramos modelos como Llama, NVLM, Grok, Mistral… LLM respaldados por empresas tan conocidas como Meta o NVIDIA y que se pueden utilizar en soluciones de IA as a Service para tener un servicio de IA gestionado y listo para consumir. No sólo incluyen el modelo LLM, también la infraestructura necesaria y la posibilidad de incorporar de manera privada y segura datos propios para enriquecer un entrenamiento personalizado (Retrieval-Augmented Generation). Todo ello, sin tener que gestionar un costoso centro de datos propio volcado en la IA y pudiendo garantizar el cumplimiento normativo fuera de toda duda.

Más allá de la efervescencia que genera siempre la entrada de un nuevo player en el mercado, nunca es recomendable distraerse en dialécticas tecnológicas como las que nos ha planteado DeepSeek en las últimas semanas. El futuro de la IA va más allá de una empresa concreta, independientemente de cómo se llame.

La evolución de los modelos fundacionales será el principal dinamizador de esta disruptiva tecnología, que se verá impulsada simultáneamente por una mayor eficiencia de sus algoritmos y una creciente capacidad de computación. Esta convergencia exponencial de hardware y software lleva produciéndose desde que se arrancó el computador ENIAC y no va a frenar ahora. Será un elemento clave para una completa democratización de la IA que cada vez está más cerca.

Powered by WPeMatico

Gustavo Genez

Informático de corazón y apasionado por la tecnología. La misión de este blog es llegar a los usuarios y profesionales con información y trucos acerca de la Seguridad Informática.