This thesis presents DIKE (Description of Interrogations by Knowledge Extraction) a tool that aims at analyzing examinations in a court of law by extracting relevant information. This work aim at the design and implementation of a conceptual model able to describe relevant information, and useful to understand how forensic examinations develop. DIKE is based on an original multi dimensional conceptual model, which represents several aspects of examinations according to psychological, juridical, and linguistic theories. For implementing such a model, we created a new audio/textual annotated corpus, using real examination recordings and transcriptions coming from Italian trials, and annotated with sentence- and utterance-level labels. Such a corpus permits to automatically annotate new examinations by means of original multi level, HMMbased model. Audio and transcriptions are automatically aligned by means of an original algorithm, conceived for low quality and noisy audio recordings. The multi-level HMM-based model leverages and combines speech and textual features, classifying the examination according to several dimensions. DIKE permits to highlight dialogue sequences where the speakers experienced crises, as a consequence of deliberately provoked or unwanted stressful events. DIKE, as a didactical tool, permits to improve examination techniques, by generating in a novel way a rich description of examinations, used to define a profile for the examination and a profile for each of those partaking in the examination dialogue. Summing up, the main contributions of this thesis are: the definition of a new multi-dimensional conceptual model representing examinations under different points of view; a new audio/textual, annotated corpus composed by real forensics examinations; an alignment algorithm tailored to noisy environments; a specific multi-level, HMM-based model; and a new didactical tool for calculating, visualizing, and analyzing speaker’s and dialogue’s profiles.

Il lavoro svolto ha visto la realizzazione di DIKE (Description of Interrogations by Knowledge Extraction) un tool progettato per analizzare interrogatori di carattere forense, attraverso l’analisi di informazioni altamente rilevanti. Questo lavoro ha come obiettivo la progettazione e l’implementazione di un modello concettuale originale in grado di descrivere l’andamento nel tempo di un interrogatorio forense. DIKE propone un modello concettuale multi livello, progettato per analizzare molteplici caratteristiche di un interrogatorio sfruttando congiuntamente teorie, tecniche e approcci di tre contesti complementari: psicologico, giuridico e linguistico. Per l’implemnetazione del modello concettuale, si è resa necessaria la creazione un nuovo corpus dati fatto da veri interrogatori del contesto giuridico italiano (registrazioni audio e trascrizioni). La struttura dell’intero corpus prevede una suddivisione in frasi etichettate secondo le caratteristiche del modello concettuale. I file audio e le trascizioni sono state allineate attraverso lo sviluppo di algoritmi complessi necessari per gestire contenuti multimediali con bassa qualità di registrazione. Il modello stocastico probabilistico implementato combina caratteristiche audio e testo al fine di ottenere una classificazione automatica degli interrogatori in funzione della sua architettura. DIKE consente di individuare sequenze particolari di informazioni che hanno caratterizzato l’andamento nel tempo dell’interrogatorio, mettendo in evidenza momenti di crisi e/o discontinuità spontanei o provocati attraverso tencniche di interrogatorio particolari. DIKE è un tool didattico utile per migliorare le tecniche di interrogatorio, che consente di generare un ricco set di dati utile per la descrizione dell’interrogatorio e per la definizione dei profili dinamici di comportamento riguardanti sia l’interrogatorio che e i suoi partecipanti. Riassumendo, i contributi principali di questa tesi sono: la definzione di un nuovo modello concettuale originale formato da 11 dimensioni; un nuovo corpus dati fatto da vere registrazioni provenienti dal contesto giuridico italiano; un set di algoritmi sviluppati per l’allineamento audio-testo di contenuti multimediali registrati con bassa qualità; un’istanza del modello concettuale attraverso un approccio stocastico probabilistico basato su HMMs; un tool didattico per il calcolo, la visualizzazione e l’analisi dei profili dell’interragorio e dei suoi partecipanti.

Evaluating forensic examinations in a court of law : the DIKE model

TRIVILINI, ALESSANDRO

Abstract

This thesis presents DIKE (Description of Interrogations by Knowledge Extraction) a tool that aims at analyzing examinations in a court of law by extracting relevant information. This work aim at the design and implementation of a conceptual model able to describe relevant information, and useful to understand how forensic examinations develop. DIKE is based on an original multi dimensional conceptual model, which represents several aspects of examinations according to psychological, juridical, and linguistic theories. For implementing such a model, we created a new audio/textual annotated corpus, using real examination recordings and transcriptions coming from Italian trials, and annotated with sentence- and utterance-level labels. Such a corpus permits to automatically annotate new examinations by means of original multi level, HMMbased model. Audio and transcriptions are automatically aligned by means of an original algorithm, conceived for low quality and noisy audio recordings. The multi-level HMM-based model leverages and combines speech and textual features, classifying the examination according to several dimensions. DIKE permits to highlight dialogue sequences where the speakers experienced crises, as a consequence of deliberately provoked or unwanted stressful events. DIKE, as a didactical tool, permits to improve examination techniques, by generating in a novel way a rich description of examinations, used to define a profile for the examination and a profile for each of those partaking in the examination dialogue. Summing up, the main contributions of this thesis are: the definition of a new multi-dimensional conceptual model representing examinations under different points of view; a new audio/textual, annotated corpus composed by real forensics examinations; an alignment algorithm tailored to noisy environments; a specific multi-level, HMM-based model; and a new didactical tool for calculating, visualizing, and analyzing speaker’s and dialogue’s profiles.
BONARINI, ANDREA
PERNICI, BARBARA
14-dic-2015
Il lavoro svolto ha visto la realizzazione di DIKE (Description of Interrogations by Knowledge Extraction) un tool progettato per analizzare interrogatori di carattere forense, attraverso l’analisi di informazioni altamente rilevanti. Questo lavoro ha come obiettivo la progettazione e l’implementazione di un modello concettuale originale in grado di descrivere l’andamento nel tempo di un interrogatorio forense. DIKE propone un modello concettuale multi livello, progettato per analizzare molteplici caratteristiche di un interrogatorio sfruttando congiuntamente teorie, tecniche e approcci di tre contesti complementari: psicologico, giuridico e linguistico. Per l’implemnetazione del modello concettuale, si è resa necessaria la creazione un nuovo corpus dati fatto da veri interrogatori del contesto giuridico italiano (registrazioni audio e trascrizioni). La struttura dell’intero corpus prevede una suddivisione in frasi etichettate secondo le caratteristiche del modello concettuale. I file audio e le trascizioni sono state allineate attraverso lo sviluppo di algoritmi complessi necessari per gestire contenuti multimediali con bassa qualità di registrazione. Il modello stocastico probabilistico implementato combina caratteristiche audio e testo al fine di ottenere una classificazione automatica degli interrogatori in funzione della sua architettura. DIKE consente di individuare sequenze particolari di informazioni che hanno caratterizzato l’andamento nel tempo dell’interrogatorio, mettendo in evidenza momenti di crisi e/o discontinuità spontanei o provocati attraverso tencniche di interrogatorio particolari. DIKE è un tool didattico utile per migliorare le tecniche di interrogatorio, che consente di generare un ricco set di dati utile per la descrizione dell’interrogatorio e per la definizione dei profili dinamici di comportamento riguardanti sia l’interrogatorio che e i suoi partecipanti. Riassumendo, i contributi principali di questa tesi sono: la definzione di un nuovo modello concettuale originale formato da 11 dimensioni; un nuovo corpus dati fatto da vere registrazioni provenienti dal contesto giuridico italiano; un set di algoritmi sviluppati per l’allineamento audio-testo di contenuti multimediali registrati con bassa qualità; un’istanza del modello concettuale attraverso un approccio stocastico probabilistico basato su HMMs; un tool didattico per il calcolo, la visualizzazione e l’analisi dei profili dell’interragorio e dei suoi partecipanti.
Tesi di dottorato
File allegati
File Dimensione Formato  
2015_11_PhD_Trivilini.pdf

non accessibile

Descrizione: Teszto della tesi
Dimensione 16.65 MB
Formato Adobe PDF
16.65 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/115783