Cómo usar la Inteligencia Artificial para el Análisis Forense y la Ciberinvestigación de Audios (1)
Figura 2: Libro de Machine Learning aplicado a Ciberseguridad de Carmen Torrano, Fran Ramírez, Paloma Recuero, José Torres y Santiago Hernández |
La separación de pistas de audio permite a los investigadores forenses analizar las grabaciones de manera detallada, aislando sonidos específicos como voces en una multitud, ruidos de fondo en una escena del crimen, ruidos de coches, trenes o aislando interferencias electrónicas en comunicaciones para obtener una mayor nitidez. Estas capacidades logran mejorar significativamente la calidad de las pruebas sonoras (para por ejemplo descifrar conversaciones), llevando a los investigadores a presentar análisis más precisos en contextos legales y de investigación, que al final ayudarán a resolver el caso con nuevas pruebas aún más concluyentes.
¿Cómo funciona?
La separación de fuentes de audio utilizando IA tiene es un proceso bastante avanzado, ya se utilizan una gran variedad de arquitecturas de IA en general y también de IA Generativa.
Algunas de estas arquitecturas son:
- Redes Neuronales Convolucionales (CNN): esta es posiblemente la más utilizada, ya que son la base para procesar espectrogramas de audio (la fuente de datos no olvidemos que son al final imágenes, en concreto espectrogramas). Estas redes pueden identificar patrones complejos y distinguir entre diferentes tipos de sonidos en una mezcla.
- Redes Recurrentes (RNN) y LSTM: Son perfectas para el procesamiento de secuencias temporales, estas redes capturan la dinámica temporal del audio, mejorando la precisión de la separación en pistas que suelen varían con el tiempo.
- Transformers: esta arquitectura es la más utilizada hoy en día en una gran variedad de proyectos de IA, y también se aplican en la segmentación de audio para gran diversidad de funciones.
- IA Generativa: Herramientas como las GAN (Generative Adversarial Networks) se pueden utilizar para generar muestras de audio sintéticas para luego mejorar los modelos que se dedican a la separación, aumentando la diversidad y calidad de los datos de entrenamiento.
Revolucionando la ciber investigación y el análisis forense de audios
En el análisis forense digital, la separación de audio es una herramienta que nos ofrece un cambio radical en la obtención de resultados espectaculares en un ámbito de investigación. Como ya he comentado antes, permite a los investigadores descomponer grabaciones complejas en componentes más manejables, facilitando la identificación de eventos, identificación de ruidos o voces clave en situaciones con ruido ambiental alto.
Figura 4: Libro “Técnicas de Análisis Forense Informático para Peritos Judiciales Profesionales“ de Pilar Vila en 0xWord. |
El proceso empieza con la conversión de la grabación en un espectrograma (como hemos comentado antes, analizar audio implica analizar imagen), que es una representación visual que captura la intensidad de las frecuencias del sonido a lo largo del tiempo.
- Reconocimiento de Voces: Identificar y verificar la presencia de individuos en una grabación.
- Análisis de Ruidos de Fondo: Determinar la ubicación o el contexto de una grabación mediante la identificación de sonidos ambientales.
- Detección de ruidos específicos: por ejemplo, el ruido de cristales, vehículos, disparos, etcétera.
- Detección de Anomalías: Identificar alteraciones o manipulaciones en grabaciones, que pueden ser indicativas de interferencia o falsificación.
Además de las aplicaciones que he mencionado antes, la separación de audio mediante IA está revolucionando el ámbito de la seguridad al permitir la implementación de sistemas de alerta temprana en entornos críticos.
Algunas herramientas disponibles
1.- Profesionales
- LALAL.AI: Una herramienta en línea que utiliza IA para separar pistas vocales e instrumentales en cualquier archivo de audio. Fácil de usar y precisa, adecuada para investigadores que necesitan resultados rápidos sin configuraciones complejas.
- Auphonic: Ofrece servicios de mejora de audio que incluyen normalización y eliminación de ruido. Es ideal para limpiar grabaciones (fase de procesamientod el audio) y mejorar la calidad antes del análisis forense con IA.
- Moises.ai: Esta plataforma permite a los usuarios separar y manipular pistas de audio utilizando IA avanzada, proporcionando herramientas útiles para analizar y extraer información de grabaciones complejas.
- eMastered: Aunque está más enfocada en la masterización de música, su tecnología puede aplicarse para mejorar y clarificar grabaciones antes de un análisis detallado en investigaciones forenses (al igual que Auphonic).
2.-Open Source
- pyAudioAnalysis: Una biblioteca de Python para la clasificación de audio, segmentación y extracción de características. Es útil para pre-procesamiento y análisis detallado de las características del audio.
- Open-Unmix: Ofrece modelos de separación de audio basados en deep learning que pueden adaptarse para separar diferentes componentes de audio, no solo música.
- Spleeter: Desarrollada por Deezer, esta herramienta permite separar audio en múltiples componentes usando modelos preentrenados. Es especialmente útil en el análisis forense para aislar voces u otros elementos de fondo.
- Demucs: Utiliza un enfoque de deep learning para separar audio en diferentes componentes con alta calidad. Demucs es ideal para investigaciones que requieren una separación precisa de múltiples fuentes sonoras.
- Wave-U-Net: Implementa un modelo de red neuronal que separa las fuentes de audio directamente en el dominio de la onda, ofreciendo una alternativa única para el análisis forense.
Y ahora, vamos a probar cómo hacer este análisis forense con fuentes de audio, pero… serán en la siguiente parte de este artículo que os publicaremos mañana. Id probando mientras vosotr@s.
Happy Hacking Hackers!!!
Contactar con Fran Ramírez en MyPublicInbox |
Powered by WPeMatico