Cómo «Weaponizar» la generación de información que las apps y los servicios digitales ven en tus fotos

19 de diciembre de 2024 Gustavo Genez

Hace años, allá por el año 2015, se me ocurrió la «idea loca» de ver si podía «heredar» las apps huérfanas en los markets de apps móviles. En concreto las de Android. La investigación utilizando nuestro querido Tacyt la hicimos y conseguimos «heredar» muchas apps, algunas con millones de instalaciones. Ese trabajo de investigación lo compartimos con mucha gente para ver qué se podía hacer para mejorar esta situación, pero siempre de forma privada.

Figura 1: Cómo «Weaponizar» la generación de información

que las apps y los servicios digitales ven en tus fotos

La idea era tan sencilla como ver qué apps tenían un correo electrónico de un developer que hubiera sido abandonado. Es decir, que pudiéramos re-crear, y pedir la recuperación de la contraseña para obtener el acceso al Developer Portal de Android y manipular las apps publicadas. Y funcionó.

Gremlin Apps & Gremlin Botnets

La gracia de eso era algo que llevaba tiempo en mi cabeza, que no era más que lo que llamamos Gremlin Apps, o Gremlin Botnets. Algo tan sencillo como que una app se volviera malicioso solo para un dispositivo móvil concreto y, aprovechando los permisos que tuviera esa app, traerse datos, agenda de contactos, vigilar la ubicación, o robar las fotografías del carrete al que tuviera acceso la app. Todo esto lo publicamos, al final, en la charla de RootedCON 2020 bajo el título de «Gremlin Botnets: El club de los poetas muertos«, que os dejo por aquí por si queréis verla.

Figura 2: Gremlin Botnets «El club de los poetas muertos»

En esta investigación utilizamos el concepto de «Permisos Oportunistas» para acceder a datos privados. Por ejemplo, que una app para publicar fotos en redes sociales pida acceso al carrete de fotos es normal. Así que las Gremlin Apps esperaban a ver cuando la app accedía al carrete de fotos, y nos traíamos todas. Listo.

Figura 3: Malware en Android: Discovering, Reversing & Forensics

Por supuesto, Android y Apple comenzaron a limitar a las apps los accesos a las fotos, por medio de la granularidad de permisos que comenzaron a poner en Septiembre de 2020 en los iOS14 de iPhone. Pero no bien del todo. Les llevó varias versiones afinarlo y, recuerdo que en 2021, aún con el Acceso Guiado de iPhone se podía hacer cosas muy crappy como acceder a todas esas fotografías.

Figura 4: Reduce los permisos de acceso a fotos a todas las apps

Lo más importante es que tus fotografías dicen mucho de ti. Tiene muchos datos. A quién conoces, quién eres, qué sitios visitas, qué haces, cómo te vistes, cómo te diviertes, mucha información, que una persona que tenga acceso a todas esas fotos podría convertir en un auténtico expediente informativo sobre ti.

Figura 5: Libro de Hacking iOS:iPhone & iPad (2ª Edición) en 0xWord de
Chema Alonso, Ioseba Palop, Pablo González y Alejandro Ramos entre otros.

Este sería un trabajo ingente para las personas…. pero no para la Inteligencia Artificial. Desde la llegada de los MM-LLMs, ya todo esto está superado y puedes analizar masivamente las fotografías a las que tengas acceso para crear datos, bases de datos, etiquetas, meta-información, y meter en los sistemas Next Best Action, o Next Best Add.

«weaponizar» la información de las fotografías con IA

Y todo con una fotografía. Por eso, están apareciendo los sistemas que, como Movistar Cloud, te ofrecen almacenamiento en la nube para tus fotografías con garantía de privacidad y de que nadie va a analizarlas para sacar información.

Figura 6: They See your photos

Uno de esos servicios ha publicado una web para concienciar de lo que una app que analice tus fotografías puede saber. El servicio «They See Your Photos«, que me pasó un amigo es bastante sencillo y no es lo importante de este artículo, porque como vamos a ver con los MM-LLMs es posible sacar mucha más información que con el Cognitive Service de Google Vision API que utiliza, pero es un buen ejemplo para ver que tus fotografías dan mucha información.

Figura 7: Logos, lugares, metadatos, fechas, descripción

Entre ellas, cosas que no te imaginas, como la clase social, si hay extintores, los metadatos, donde aparecen dispositivos, fechas, o cualquier otra información que una persona podría analizar de esa fotografía, pero de manera automatizada y masiva sin interacción humana y creando datos sobre ti en sus bases de datos.

Figura 8: Metadatos, raza, edad, etc…

En las fotos anteriores podéis ver cómo analizan las fotografías para sacar datos. Y ahora esos datos se convierten en base de datos, en algo que te acompaña, que hace que te vendan cosas, que te ofrezcan cosas, que te configuren cosas, o que te pasen cosas que te gusten menos. Datos masivos extraídos de imágenes.

MM-LLMs: ChatGPT4

Pero os decía que ese servicio, aun siendo un ejemplo fantástico para que cualquiera tome consciencia de esto, se ve más que superado por los Multi-Modal Large Language Models como ChatGPT, donde con subir una única fotografía puedes obtener muchísimas información.

Figura 9: Pidiéndole a ChatGPT que me de cualquier detalle

Usamos un prompt para pedirle que nos dé cualquier detalle y cualquier información que sea capaz de inferir con más de un 50% de probabilidad, a ver cómo se comporta. Y aquí tenéis el análisis, para que veáis si os habíais fijado en todo.

Figura 10: Inferencia general de la fotografía

Un OCR no hubiera sacado el dato de que probablemente sea Chief Digital Officer lo que pone. También crea meta-información sobre el lugar, y el contenido. Ahora vamos a ver qué dice de mí.

Figura 11: Analizándome en la fotografía subida.

Hace una descripción de lo infiere y de mi «estilo«. Tecnológico, innovación, camiseta de playa, estilo desenfadado, innovación, disruptivo, y más datos de mi lenguaje corporal, como que soy expresivo, abierto, que uso presentación, y que tengo detalles personales. Pero aún hay más.

Figura 12: Posibles inferencias adicionales

El MM-LLMs se atreve a hacer una inferencia de mi profesión, y de qué tipo de persona puedo ser, lo que llevará a crear una base de datos rica solo con una fotografía. Pero si le pedimos que, con esa información, intente averiguar quién podría ser, nos dice lo siguiente.

Figura 13: Podría ser «Chema Alonso»

No es magia. Una persona normal podría hacer esa inferencia también. Lo importante es la «weaponización» del análisis y la creación de bases de datos masivas de forma automática a partir de imágenes interpretadas por MM-LLMs que, tiene un valor enorme para el negocio, pero al mismo tiempo un peligro enorme para la privacidad de las personas.

Figura 14: Open Source INTelligence (OSINT): Investigar personas e Identidades en Internet 2ª Edición de 0xWord, escrito por Vicente Aguilera y Carlos Seisdedos

Controlar quién tiene acceso a tus fotografías, audios, vídeos, es importante para gestionar tu privacidad, así cómo que tenemos que pensarnos un poco qué etiquetas queremos que los modelos de IA pongan a las personas….¿no crees? Al final, de manera muy sencilla se pueden construir bases de datos OSINT basadas en búsquedas de datos generados por estos servicios de IA para investigar personas…

¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)

Comparte esto:

Gustavo Genez

También te puede gustar

Analizando a fondo la vulnerabilidad Outlook NTLM leak (CVE-2023-23397)

WhatsApp: View-Once en fotos y vídeos con el «No Bug» de la visualización eterna para que que se graben con buena calidad.

Las filtraciones: Las protagonistas de la Keynote de Apple