Por Jeremy Gob, Deutsches Forschungszentrum für Künstliche Intellenz GmbH, DFKI

Crédito: Satja Santangtong en Pexels
En la era digital, la recuperación de datos eliminados es un desafío clave en el forense digital. Con el aumento constante de los volúmenes de datos y los métodos de almacenamiento, los métodos convencionales están alcanzando sus límites. Aquí es donde entra el proyecto de investigación Turve-DL: una solución basada en IA que puede recuperar archivos que son difíciles de reconstruir mediante el uso de algoritmos de aprendizaje para mejorar de manera sostenible la eficiencia y la precisión de la reconstrucción de datos digitales.
Tradicionalmente, los examinadores forenses utilizan procesos estandarizados, a menudo manuales para recuperar datos eliminados. Si bien estos métodos se basan en firmas de archivos fijos o metadatos del sistema de archivos, Talle-DL rompe el nuevo terreno. Utilizando tecnologías avanzadas de aprendizaje profundo, en particular el transformador de cañonización V2 y Resnet, el software no solo puede recuperar archivos completos sino también reconstruir datos altamente fragmentados. Esto permite una recuperación precisa incluso en los casos en que las técnicas tradicionales resultan insuficientes.
THEVE-DL está dirigido a especialistas en forense digital que necesitan reconstruir datos eliminados o fragmentados. Un ejemplo es la recuperación de datos de caché eliminados automáticamente de sitios web que son relevantes para una investigación. La evidencia digital manipulada o destruida deliberadamente también se puede reconstruir utilizando IA.
Estudio de caso: la desaparición de la Mona Lisa
El video adjunto utiliza una historia de crimen ficticia para mostrar cómo Turve-DL puede reconstruir los datos de imagen eliminados. En el escenario ficticio, la Mona Lisa es robada y se eliminan todos los rastros digitales del crimen. El video ilustra cómo Turve-DL reconstruye el registro original de la pintura robada a partir de datos de memoria fragmentados del ladrón, lo que permite el análisis forense.
https://www.youtube.com/watch?v=fmibuwmizxe
Este ejemplo está destinado a ilustrar los beneficios prácticos de los métodos de IA desarrollados: el sistema puede identificar, clasificar, agrupar y organizar correctamente los fragmentos de imagen eliminados, un proceso que también puede ser crucial para evidencia digital real. Todo el video se puede encontrar en el archivo adjunto a esta noticia.
Hitos tecnológicos
Desde el inicio del proyecto en noviembre de 2022 se han logrado un progreso significativo. El flujo de trabajo AI se ha optimizado continuamente para abordar las complejas demandas de los forenses digitales y la reconstrucción de datos de manera competente:
- Modelo de clasificación: nuevos modelos de clasificación para identificar los tipos de archivos en datos sin procesar, que mejoran el proceso de recuperación.
- Modelo de verificación: un modelo de verificación especializado para reconstruir de manera confiable fragmentos de imagen.
- Técnicas de agrupación: técnicas de agrupación basadas en el aprendizaje profundo que identifican eficientemente grupos de fragmentos de archivos que pertenecen juntos.
- Modelo de reordenamiento: un modelo de reordenamiento de fragmentos avanzados que ya ensambla correctamente el 95% de los fragmentos de imagen reconstruidos.
El uso del transformador de lanza V2 y RESNET ha aumentado significativamente la eficiencia del sistema. En particular, la agrupación de apoyo con el aprendizaje contrastante (SCCL) ha aumentado la precisión de la agrupación a alrededor del 85%.
Desafíos y soluciones innovadoras
Uno de los mayores desafíos durante el proyecto fue el número y la naturaleza indeterminados de los fragmentos a ser reconstruidos. Talle-DL resolvió este problema procesando esta incertidumbre temprano en la tubería a través de la agrupación iterativa.
Otro problema fue el reordenamiento escalable y eficiente de los fragmentos. Para abordar estos problemas, se integró una combinación de procesamiento de señal digital y aproximación de bajo rango (LORA) para utilizar los recursos informáticos de manera más eficiente.
Potencial más allá de los forenses
Además de las investigaciones policiales, Turve-DL muestra un potencial prometedor para otros campos de aplicación:
- Recuperación de datos en la industria, por ejemplo, para restaurar los datos de investigación perdidos.
- Restauración y archivo digital, por ejemplo, en la preservación de documentos históricos.
- Seguridad cibernética, para analizar la manipulación o la eliminación de datos dirigidos.
Con el proyecto Turve-DL que llegará a su fin en octubre de 2025, el equipo de investigación atrae un equilibrio positivo. Las tecnologías desarrolladas muestran que la reconstrucción de datos basada en IA puede revolucionar los forenses digitales. A través de métodos innovadores, es posible recuperar datos eliminados o fragmentados con precisión sin precedentes.
Proporcionado por Deutsches Forschungszentrum für Künstliche Intellenz GmbH, DFKI
Citación: Cómo está ‘salvando la Mona Lisa’: un cambio de paradigma en forense digital (2025, 28 de marzo) recuperado el 28 de marzo de 2025 de https://techxplore.com/news/2025-03-ai-mona-lisa-paradigm-shift.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.