MiroFish: cuando los LLM empiezan a simular el mundo
Durante años hemos hablado de modelos predictivos, de machine learning aplicado a forecasting, de simulaciones multi-agente y de modelos basados en grafos. Cada una de estas disciplinas ha evolucionado más o menos en paralelo: economistas usando simulaciones sociales, investigadores de IA trabajando en LLMs y gente del mundo de sistemas diseñando motores de simulación distribuidos.
MiroFish es interesante porque intenta juntar todas esas piezas en un mismo sistema.
No es un modelo nuevo, ni un breakthrough científico, ni una nueva arquitectura de IA. En realidad es algo más curioso: una especie de motor de simulación social impulsado por LLMs que intenta generar escenarios plausibles sobre sistemas complejos. No predice el futuro en sentido estricto, pero intenta aproximarse a algo parecido a un laboratorio de futuros posibles.
Y eso, en términos conceptuales, es bastante potente.
De RAG a GraphRAG a mundos simulados
La idea detrás de MiroFish parte de algo relativamente conocido en el ecosistema de LLMs: el paso de RAG a GraphRAG.
El problema clásico del RAG es que funciona bien cuando necesitas recuperar documentos relevantes, pero empieza a romperse cuando el conocimiento está estructurado en relaciones complejas. Las relaciones entre actores, eventos, intereses o sistemas no son simplemente texto recuperable: son grafos.
GraphRAG introduce precisamente esa capa intermedia: construir un grafo de conocimiento a partir de información no estructurada y usarlo como base de razonamiento para el modelo.
MiroFish da un paso más. Una vez tienes ese grafo, lo interpreta como un ecosistema de agentes.
Cada nodo del grafo —persona, organización, entidad política, sistema económico— puede convertirse en un agente con:
- memoria
- objetivos
- contexto
- capacidad de interacción con otros agentes
Y en ese punto el sistema deja de ser un buscador semántico y empieza a parecerse a algo distinto: una simulación multi-agente gobernada por LLMs.
El mundo como enjambre
El nombre del proyecto no es casual. La metáfora central es la de un banco de peces (fish swarm): miles de entidades simples que interactúan localmente pero generan comportamiento emergente.
En MiroFish los agentes no ejecutan reglas rígidas como en una simulación clásica. En lugar de eso, cada interacción se resuelve mediante inferencia de un modelo de lenguaje que evalúa:
- el estado del sistema
- la memoria del agente
- sus objetivos
- las interacciones previas
Esto introduce algo muy interesante: comportamiento no determinista y emergente.
Si ejecutas la misma simulación dos veces, el resultado puede ser diferente. Exactamente igual que en sistemas sociales reales.
Arquitectura (a grandes rasgos)
El pipeline típico de MiroFish suele tener cuatro fases bastante claras.
Primero se ingiere el seed data. Puede ser prácticamente cualquier cosa: noticias, documentos, datasets sociales o incluso narrativas ficticias.
Después se ejecuta un proceso de extracción de entidades y relaciones que genera el grafo inicial del sistema.
Ese grafo se transforma en un conjunto de agentes que se ejecutan dentro de un entorno de simulación. Cada agente tiene memoria persistente y capacidad de interactuar con otros agentes mediante prompts estructurados.
Finalmente un report agent analiza la evolución del sistema y genera un informe de escenarios posibles.
Si lo miras con perspectiva, el sistema se parece más a un motor de simulación distribuida que a una simple aplicación de LLM.
Qué tipo de cosas intenta simular
Las demos que han circulado sobre MiroFish son bastante reveladoras.
Uno de los experimentos más comentados consistía en alimentar el sistema con los primeros capítulos de una novela clásica china (Dream of the Red Chamber). El sistema generó un grafo con cientos de personajes y miles de relaciones, simuló la evolución de las dinámicas sociales entre ellos y produjo un final narrativo bastante coherente con el desenlace tradicional de la obra.
No era simplemente generación de texto: era una simulación narrativa basada en interacción de personajes.
En otros experimentos se han intentado simular sistemas más cercanos al mundo real:
- reacción social ante eventos políticos
- propagación de narrativas en redes
- escenarios económicos
- evolución de conflictos geopolíticos
Aquí es donde el proyecto se vuelve viral, porque inevitablemente aparece la palabra mágica: predicción. Pero conviene matizar eso bastante.
No es un oráculo
Uno de los errores más comunes cuando aparece algo como MiroFish es pensar que estamos ante un sistema capaz de predecir el futuro. No es así.
Lo que hace realmente es algo más cercano a ejecutar un Monte Carlo social narrativo. El sistema genera múltiples trayectorias plausibles para un sistema complejo en función de las reglas implícitas que el modelo de lenguaje ha aprendido sobre el mundo.
Esto tiene valor exploratorio, pero no valor predictivo fuerte. Dicho de otra forma: MiroFish puede ayudarte a explorar qué podría pasar, pero no a saber qué pasará. Y eso no es un detalle menor.
El problema fundamental
El talón de Aquiles de este tipo de sistemas es el mismo que en cualquier simulación social: la calidad del modelo depende totalmente de la calidad de los supuestos.
Si los datos de entrada son incompletos, sesgados o simplemente incorrectos, la simulación se convierte en una narrativa sofisticada pero no necesariamente realista.
Además, hay otro problema más profundo: los LLMs no modelan causalidad de forma explícita. Modelan correlaciones aprendidas del texto.
Eso significa que muchas decisiones de los agentes en la simulación están basadas en heurísticas lingüísticas sobre cómo suele comportarse el mundo, no en modelos causales formales.
En muchos casos eso funciona sorprendentemente bien. En otros casos produce resultados completamente delirantes.
Lo realmente interesante
Más allá del hype, lo realmente fascinante de proyectos como MiroFish es que apuntan a una dirección muy concreta de la IA aplicada: los simuladores cognitivos.
Durante décadas hemos intentado construir modelos que predijeran sistemas complejos mediante ecuaciones o modelos estadísticos. Ahora estamos empezando a construir mundos simulados poblados por agentes que razonan con lenguaje natural. Puede que todavía estemos en una fase muy primitiva de esta idea, pero el potencial es enorme. Porque si algo sabemos de los sistemas complejos —mercados, sociedades, conflictos— es que rara vez pueden reducirse a unas pocas variables matemáticas. A veces la única forma razonable de entenderlos es dejar que miles de entidades interactúen y observar qué emerge. Y eso es exactamente lo que intenta hacer MiroFish.
No es una bola de cristal. Pero sí podría ser un primer prototipo de algo mucho más interesante: simuladores del mundo impulsados por inteligencia artificial.
Powered by WPeMatico





