In recent years, rapid technological advancements and the increasing availability of computational power have made the generation and sharing of multimedia data easier than ever. Using a simple smartphone, a user can now create images, videos, and audio record ings and share them online in just a few seconds. This ongoing revolution has undoubtedly simplified and democratized the process of data creation and dissemination, allowing indi viduals to express themselves creatively and share their experiences with a global audience at an unprecedented speed and scale. However, it has also made it easier to produce counterfeit data or manipulate existing content, even for illegal purposes. In this context, audio recordings are one of the most tampered and manipulated forms of multimedia content. In order to prevent the rise of unpleasant situations related to the malicious use of manipulated data, there is a need for the development of methods able to perform forensics analyses on audio recordings, enabling the identification of factors such as their source or authenticity. One aspect worth investigating is the association of an audio recording with its recording device, allowing for confirmation of the ownership of the audio recording or its use as evidence in legal proceedings. In this thesis, we address the recording device identification task and propose different approaches to tackle it from both a forensic and anti-forensics point of view. We consider a Convolutional Neural Network (CNN) classifier fed with log spectrograms proposed for the task at hand and assess its performance on a custom dataset comprised of speech and non-speech recordings from 20 different modern devices. The promising results demonstrate the method’s adaptability across the different scenarios presented and provide inspiration for numerous future developments of this work.

Negli ultimi anni, i rapidi progressi tecnologici e la crescente disponibilità di potenza computazionale hanno reso la generazione e la condivisione di dati multimediali più facili che mai. Con un semplice smartphone, ognuno può ora creare immagini, video e registrazioni audio e condividerle online in pochi secondi. Questa rivoluzione ha senza dubbio semplificato e democratizzato il processo di creazione e diffusione dei dati, consentendo alle persone di esprimersi creativamente e condividere le loro esperienze con un pubblico globale a una velocità e scala senza precedenti. Tuttavia, questa rivoluzione ha anche reso più facile la produzione di dati falsi e la manipolazione di contenuti esistenti, anche a fini illegali. In questo contesto, le registrazioni audio sono una delle forme di contenuto multimediale più manomesse e manipolate. Per prevenire l’insorgere di situazioni spiacevoli legate all’uso malintenzionato di dati manipolati, è necessario lo sviluppo di metodi in grado di eseguire indagini forensi su registrazioni audio, consentendo l’identificazione di fattori come la loro fonte o autenticità. Un problema rilevante in questo ambito è l’associazione di una registrazione audio al suo dispositivo di registrazione, sia per confermare la proprietà della registrazione audio che per il suo eventuale utilizzo come prova in procedimenti legali. In questa tesi, affrontiamo il problema di identificazione del modello del dispositivo di registrazione e proponiamo diversi approcci per affrontarlo sia dal punto di vista forense che antiforense. Consideriamo un classificatore proposto per il problema in questione basato su una rete neurale convoluzionale che prende in input spettrogrammi logaritmici ed analizziamo le sue prestazioni su un dataset composto da registrazioni vocali e non vocali provenienti da 20 diversi modelli di smartphones moderni. I risultati promettenti ottenuti dimostrano l’adattabilità del metodo ai diversi scenari presentati e forniscono ispirazione per numerosi sviluppi futuri di questo lavoro.

Recording device model identification: an experimental analysis of forensic and anti-forensic techniques

Eutizi, Claudio
2023/2024

Abstract

In recent years, rapid technological advancements and the increasing availability of computational power have made the generation and sharing of multimedia data easier than ever. Using a simple smartphone, a user can now create images, videos, and audio record ings and share them online in just a few seconds. This ongoing revolution has undoubtedly simplified and democratized the process of data creation and dissemination, allowing indi viduals to express themselves creatively and share their experiences with a global audience at an unprecedented speed and scale. However, it has also made it easier to produce counterfeit data or manipulate existing content, even for illegal purposes. In this context, audio recordings are one of the most tampered and manipulated forms of multimedia content. In order to prevent the rise of unpleasant situations related to the malicious use of manipulated data, there is a need for the development of methods able to perform forensics analyses on audio recordings, enabling the identification of factors such as their source or authenticity. One aspect worth investigating is the association of an audio recording with its recording device, allowing for confirmation of the ownership of the audio recording or its use as evidence in legal proceedings. In this thesis, we address the recording device identification task and propose different approaches to tackle it from both a forensic and anti-forensics point of view. We consider a Convolutional Neural Network (CNN) classifier fed with log spectrograms proposed for the task at hand and assess its performance on a custom dataset comprised of speech and non-speech recordings from 20 different modern devices. The promising results demonstrate the method’s adaptability across the different scenarios presented and provide inspiration for numerous future developments of this work.
LEONZIO, DANIELE UGO
SALVI, DAVIDE
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-apr-2024
2023/2024
Negli ultimi anni, i rapidi progressi tecnologici e la crescente disponibilità di potenza computazionale hanno reso la generazione e la condivisione di dati multimediali più facili che mai. Con un semplice smartphone, ognuno può ora creare immagini, video e registrazioni audio e condividerle online in pochi secondi. Questa rivoluzione ha senza dubbio semplificato e democratizzato il processo di creazione e diffusione dei dati, consentendo alle persone di esprimersi creativamente e condividere le loro esperienze con un pubblico globale a una velocità e scala senza precedenti. Tuttavia, questa rivoluzione ha anche reso più facile la produzione di dati falsi e la manipolazione di contenuti esistenti, anche a fini illegali. In questo contesto, le registrazioni audio sono una delle forme di contenuto multimediale più manomesse e manipolate. Per prevenire l’insorgere di situazioni spiacevoli legate all’uso malintenzionato di dati manipolati, è necessario lo sviluppo di metodi in grado di eseguire indagini forensi su registrazioni audio, consentendo l’identificazione di fattori come la loro fonte o autenticità. Un problema rilevante in questo ambito è l’associazione di una registrazione audio al suo dispositivo di registrazione, sia per confermare la proprietà della registrazione audio che per il suo eventuale utilizzo come prova in procedimenti legali. In questa tesi, affrontiamo il problema di identificazione del modello del dispositivo di registrazione e proponiamo diversi approcci per affrontarlo sia dal punto di vista forense che antiforense. Consideriamo un classificatore proposto per il problema in questione basato su una rete neurale convoluzionale che prende in input spettrogrammi logaritmici ed analizziamo le sue prestazioni su un dataset composto da registrazioni vocali e non vocali provenienti da 20 diversi modelli di smartphones moderni. I risultati promettenti ottenuti dimostrano l’adattabilità del metodo ai diversi scenari presentati e forniscono ispirazione per numerosi sviluppi futuri di questo lavoro.
File allegati
File Dimensione Formato  
2024_03_Eutizi_Executive Summary_02.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: testo executive summary
Dimensione 796.57 kB
Formato Adobe PDF
796.57 kB Adobe PDF   Visualizza/Apri
2024_03_Eutizi_Tesi_01.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: testo tesi
Dimensione 5.2 MB
Formato Adobe PDF
5.2 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/219728