Injuries in the workplace today represent a problem that cannot be easily solved. Accident data are present in different forms and between these there are textual data. With this thesis we want to support the analysis of these data, carried out initially with data mining and text mining techniques, providing a system that allows to integrate the context within the analysis of the data, starting from the definition of a domain ontology. In particular, my case study focuses on descriptions in Italian of accidents in metallurgical companies described in the INAIL dataset. This work presents first a research and an analysis of possible ontologies existing in the Semantic Web and reusable for my specific case study, then proposing possible alternatives that can lead to the creation of a domain ontology from scratch. Once analyzed the possible alternatives to create an ontology, it was decided to create a software that would allow to interrogate and compare a relational database, a dump of a lexical database (MultiWordnet) in machine-understandable format (RDF) and the domain ontology created; using the above-mentioned elements to then extend the ontology itself by enriching it with terms present in the other two sources. The main outputs of this work are represented by the ontology created through an ontology editor (Protégé), a file in machine-understandable format (RDF) that represents the dump of a lexical database (MultiWordnet) and a Web application. In addition to the search phase and subsequent implementation of the Web application, the results obtained through the application are displayed in a CSV file, saving the history of queries made to the database, the RDF file and the ontology.

Gli infortuni sul luogo di lavoro rappresentano oggi giorno un problema a cui non si riesce a porre un rimedio. I dati relativi agli infortuni sono presenti in diverse forme e tra queste ci sono i dati testuali. Con questa tesi vogliamo supportare l'analisi di questi dati, effettuata inizialmente con tecniche di data mining e text mining, fornendo un sistema che consenta di integrare il contesto all'interno dell'analisi dei dati, partendo dalla definizione di un'ontologia di dominio. In particolare, il mio caso di studio si concentra su descrizioni in lingua italiana di infortuni avvenuti in aziende metallurgiche presenti nel dataset di INAIL. L'elaborato finale mostra in primo luogo una ricerca e un'analisi di possibili ontologie esistenti nel Semantic Web e riutilizzabili per il mio caso di studio specifico, proponendo poi possibili alternative in grado di condurre alla creazione di un'ontologia di dominio da zero. Una volta analizzate le possibili alternative per creare un'ontologia, si è deciso di creare un software che permettesse di interrogare e confrontare un database relazionale, un dump di un database lessicale (MultiWordnet) in formato machine-understandable (RDF) e l'ontologia di dominio creata; utilizzando i suddetti elementi per poi estendere l'ontologia stessa arricchendola di termini presenti nelle altre due sorgenti. Gli outputs principali di questo lavoro sono rappresentati dall'ontologia creata tramite un editor di ontologie (Protégé), un file in formato machine-understandable (RDF) che rappresenta il dump di un database lessicale (MultiWordnet) e un'applicazione Web. Oltre alla fase di ricerca e di successiva implementazione dell'applicazione Web, vengono visualizzati in un file CSV i risultati ottenuti tramite l'applicazione, salvando lo storico delle interrogazioni effettuate al database, al file RDF e all'ontologia.

SENECA : sistema per analisi preliminari finalizzato alla creazione ed estensione di un'ontologia applicata alla sicurezza sul lavoro

GUERCI, ANDREA
2020/2021

Abstract

Injuries in the workplace today represent a problem that cannot be easily solved. Accident data are present in different forms and between these there are textual data. With this thesis we want to support the analysis of these data, carried out initially with data mining and text mining techniques, providing a system that allows to integrate the context within the analysis of the data, starting from the definition of a domain ontology. In particular, my case study focuses on descriptions in Italian of accidents in metallurgical companies described in the INAIL dataset. This work presents first a research and an analysis of possible ontologies existing in the Semantic Web and reusable for my specific case study, then proposing possible alternatives that can lead to the creation of a domain ontology from scratch. Once analyzed the possible alternatives to create an ontology, it was decided to create a software that would allow to interrogate and compare a relational database, a dump of a lexical database (MultiWordnet) in machine-understandable format (RDF) and the domain ontology created; using the above-mentioned elements to then extend the ontology itself by enriching it with terms present in the other two sources. The main outputs of this work are represented by the ontology created through an ontology editor (Protégé), a file in machine-understandable format (RDF) that represents the dump of a lexical database (MultiWordnet) and a Web application. In addition to the search phase and subsequent implementation of the Web application, the results obtained through the application are displayed in a CSV file, saving the history of queries made to the database, the RDF file and the ontology.
LENZI, EMILIA
ING - Scuola di Ingegneria Industriale e dell'Informazione
21-dic-2021
2020/2021
Gli infortuni sul luogo di lavoro rappresentano oggi giorno un problema a cui non si riesce a porre un rimedio. I dati relativi agli infortuni sono presenti in diverse forme e tra queste ci sono i dati testuali. Con questa tesi vogliamo supportare l'analisi di questi dati, effettuata inizialmente con tecniche di data mining e text mining, fornendo un sistema che consenta di integrare il contesto all'interno dell'analisi dei dati, partendo dalla definizione di un'ontologia di dominio. In particolare, il mio caso di studio si concentra su descrizioni in lingua italiana di infortuni avvenuti in aziende metallurgiche presenti nel dataset di INAIL. L'elaborato finale mostra in primo luogo una ricerca e un'analisi di possibili ontologie esistenti nel Semantic Web e riutilizzabili per il mio caso di studio specifico, proponendo poi possibili alternative in grado di condurre alla creazione di un'ontologia di dominio da zero. Una volta analizzate le possibili alternative per creare un'ontologia, si è deciso di creare un software che permettesse di interrogare e confrontare un database relazionale, un dump di un database lessicale (MultiWordnet) in formato machine-understandable (RDF) e l'ontologia di dominio creata; utilizzando i suddetti elementi per poi estendere l'ontologia stessa arricchendola di termini presenti nelle altre due sorgenti. Gli outputs principali di questo lavoro sono rappresentati dall'ontologia creata tramite un editor di ontologie (Protégé), un file in formato machine-understandable (RDF) che rappresenta il dump di un database lessicale (MultiWordnet) e un'applicazione Web. Oltre alla fase di ricerca e di successiva implementazione dell'applicazione Web, vengono visualizzati in un file CSV i risultati ottenuti tramite l'applicazione, salvando lo storico delle interrogazioni effettuate al database, al file RDF e all'ontologia.
File allegati
File Dimensione Formato  
TesiFINALE_merged.pdf

non accessibile

Dimensione 11.07 MB
Formato Adobe PDF
11.07 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/183384