In the last few years, with the rapid proliferation of inexpensive hardware devices that enable the acquisition of audio-visual data, many types of multimedia digital objects (audio, images and videos) can be readily created, stored, transmitted, modified and tampered with. In case of legal trials, proving the authenticity of multimedia evidences, such as pictures or audio recordings, may be vital. In order to solve some of these problems, many multimedia forensic detectors have been studied. Typically they rely on the detection of footprints left by tampering operations. However, a simple yet effective method to remove these footprints and fool many detectors consists in re-capturing the multimedia object (e.g., taking a picture of a still image projected on a screen). For this reason, being able to detect re-capturing is an important task for a forensic analyst. As it regards re-capture detection, some algorithms have been proposed for still images and videos. However not much has been done for audio. The goal of this work is then to propose a method to identify audio recaptured tracks, often known as bootlegs. This detector is based on tools developed and studied in the Multimedia Information Retrieval field, based on the analysis of audio features. More specifically, we use classic features together with others derived from the analysis of bootleg tracks, and we perform a comparison between different feature selection methods to choose the one that best fits our needs. In this way we are able to train a classifier using the most significant features. We validate our system by means of a set of experiments performed on a dataset that we built to accommodate different bootleg definitions. The results achieved are promising, showing a high bootleg detection accuracy.

Negli ultimi anni, con la rapida proliferazione di dispositivi hardware a basso costo che consentono l’acquisizione di dati audiovisivi, molti tipi di contenuti digitali multimediali (audio, immagini e video) possono essere facilmente creati, memorizzati, trasmessi, modificati e alterati. In caso di studi legali, dimostrare l’autenticità di prove multimediali, come immagini o registrazioni audio, può essere di vitale importanza. Per risolvere alcuni di questi problemi, sono stati studiati alcuni detector multimediali forensi. Si basano tipicamente sul rilevamento di impronte lasciate dalle operazioni di manomissione. Tuttavia, un metodo semplice ma efficace per rimuovere queste impronte e quindi ingannare molti detector, consiste nel ricatturare nuovamente l’oggetto multimediale (ad esempio, scattare una foto di un fermo immagine proiettata su uno schermo). Per questo motivo, essere in grado di rilevare questa ricattura è un compito importante per un analista forense. A tale scopo, sono stati proposti alcuni algoritmi per immagini e per video. Tuttavia, sono stati effettuati pochi studi per l’audio. L’obiettivo di questo lavoro è quindi quello di proporre un metodo in grado di identificare tracce audio registrate nuovamente, spesso conosciute come bootleg. Questo detector utilizza strumenti già sviluppati e studiati nel campo della Multimedia Information Retrieval, basandosi sull’analisi dei descrittori audio. Più in particolare, introduciamo a quelli classici alcuni descrittori basati sull’analisi dei singoli bootleg, effettuando poi un confronto tra diversi metodi che selezionano i descrittori ritenuti significativi, in modo da scegliere quello che meglio si adatta alle nostre esigenze. Siamo così in grado di allenare un classificatore, utilizzando le caratteristiche più significative. Abbiamo validato poi il nostro sistema attraverso una serie di esperimenti, eseguiti su un set di dati che abbiamo costruito appositamente per includere definizioni diverse di bootleg. I risultati ottenuti sono promettenti, con un’alta precisione di rilevamento dei bootleg.

Feature based classification for audio bootleg detection

ALBONICO, LUCA;PAGANINI, ANDREA
2011/2012

Abstract

In the last few years, with the rapid proliferation of inexpensive hardware devices that enable the acquisition of audio-visual data, many types of multimedia digital objects (audio, images and videos) can be readily created, stored, transmitted, modified and tampered with. In case of legal trials, proving the authenticity of multimedia evidences, such as pictures or audio recordings, may be vital. In order to solve some of these problems, many multimedia forensic detectors have been studied. Typically they rely on the detection of footprints left by tampering operations. However, a simple yet effective method to remove these footprints and fool many detectors consists in re-capturing the multimedia object (e.g., taking a picture of a still image projected on a screen). For this reason, being able to detect re-capturing is an important task for a forensic analyst. As it regards re-capture detection, some algorithms have been proposed for still images and videos. However not much has been done for audio. The goal of this work is then to propose a method to identify audio recaptured tracks, often known as bootlegs. This detector is based on tools developed and studied in the Multimedia Information Retrieval field, based on the analysis of audio features. More specifically, we use classic features together with others derived from the analysis of bootleg tracks, and we perform a comparison between different feature selection methods to choose the one that best fits our needs. In this way we are able to train a classifier using the most significant features. We validate our system by means of a set of experiments performed on a dataset that we built to accommodate different bootleg definitions. The results achieved are promising, showing a high bootleg detection accuracy.
BESTAGINI, PAOLO
ING V - Scuola di Ingegneria dell'Informazione
22-apr-2013
2011/2012
Negli ultimi anni, con la rapida proliferazione di dispositivi hardware a basso costo che consentono l’acquisizione di dati audiovisivi, molti tipi di contenuti digitali multimediali (audio, immagini e video) possono essere facilmente creati, memorizzati, trasmessi, modificati e alterati. In caso di studi legali, dimostrare l’autenticità di prove multimediali, come immagini o registrazioni audio, può essere di vitale importanza. Per risolvere alcuni di questi problemi, sono stati studiati alcuni detector multimediali forensi. Si basano tipicamente sul rilevamento di impronte lasciate dalle operazioni di manomissione. Tuttavia, un metodo semplice ma efficace per rimuovere queste impronte e quindi ingannare molti detector, consiste nel ricatturare nuovamente l’oggetto multimediale (ad esempio, scattare una foto di un fermo immagine proiettata su uno schermo). Per questo motivo, essere in grado di rilevare questa ricattura è un compito importante per un analista forense. A tale scopo, sono stati proposti alcuni algoritmi per immagini e per video. Tuttavia, sono stati effettuati pochi studi per l’audio. L’obiettivo di questo lavoro è quindi quello di proporre un metodo in grado di identificare tracce audio registrate nuovamente, spesso conosciute come bootleg. Questo detector utilizza strumenti già sviluppati e studiati nel campo della Multimedia Information Retrieval, basandosi sull’analisi dei descrittori audio. Più in particolare, introduciamo a quelli classici alcuni descrittori basati sull’analisi dei singoli bootleg, effettuando poi un confronto tra diversi metodi che selezionano i descrittori ritenuti significativi, in modo da scegliere quello che meglio si adatta alle nostre esigenze. Siamo così in grado di allenare un classificatore, utilizzando le caratteristiche più significative. Abbiamo validato poi il nostro sistema attraverso una serie di esperimenti, eseguiti su un set di dati che abbiamo costruito appositamente per includere definizioni diverse di bootleg. I risultati ottenuti sono promettenti, con un’alta precisione di rilevamento dei bootleg.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2013_04_Albonico_Paganini.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 8.87 MB
Formato Adobe PDF
8.87 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/75403