In computer science, an ontology is a formal representation of knowledge as a set of concepts linked by relations. Ontologies are useful in biomedical domain because they try to give a semantic meaning to stored digital data (for example to allow information sharing between different databases). One of the main issues for ontology researchers is the creation of a robust ontology because it is a difficult and time consuming task. The aim of this work has been to design, model and implement a Deterministic Triplet Extraction Tool and a Graphical User Interface to allow users to interact with it. It exploits Natural Language Processing techniques to create ontology from an input text. The Deterministic Triplet Extraction Tool has been developed as a Java tool; it shows good performance in some preliminary tests and very low execution time, less than 5 seconds for a page of around 60 sentences. There are some open issues about the Deterministic Triplet Extraction Tool, as its reliance on other not-deterministic Natural Language Processing tools or its performance on some particular sentences. However the Deterministic Triplet Extraction Tool can be considered an essential step to Next Generation Medical Ontologies.

In ambito informatico, un’ontologia è una rappresentazione formale di conoscenza attraverso un elenco di “statement” o triplette. Le ontologie in ambito biomedico sono fondamentali per favorire la condivisione delle conoscenza tra gruppi di ricerca differenti. Una delle più grandi problematiche nel mondo delle ontologie è la loro creazione: creare un’ontologia è un compito difficile e estremamente lungo. Lo scopo del lavoro è stato quello di sviluppare un applicativo software per creare automaticamente ontologie in ambito biomedico a partire da un testo - di ambito biomedico - in linguaggio naturale inglese: questo strumento è stato chiamato “Deterministic Triplet Extraction Tool” (DeTET). DeTET è stato implementando usando il linguaggio di programmazione Java; DeTET ha ottenuto risultati interessanti in alcuni test preliminari condotti. Tuttavia, rimangono alcune problematiche aperte, come le performance ottenute con alcune tipologie di frasi. DeTET può però essere considerato un passo in avanti nella soluzione di alcuni problemi legati alla creazione di nuove ontologie biomediche.

Towards a triplet extraction tool for next generation biomedical ontologies

CONDORELLI, ANDREA
2013/2014

Abstract

In computer science, an ontology is a formal representation of knowledge as a set of concepts linked by relations. Ontologies are useful in biomedical domain because they try to give a semantic meaning to stored digital data (for example to allow information sharing between different databases). One of the main issues for ontology researchers is the creation of a robust ontology because it is a difficult and time consuming task. The aim of this work has been to design, model and implement a Deterministic Triplet Extraction Tool and a Graphical User Interface to allow users to interact with it. It exploits Natural Language Processing techniques to create ontology from an input text. The Deterministic Triplet Extraction Tool has been developed as a Java tool; it shows good performance in some preliminary tests and very low execution time, less than 5 seconds for a page of around 60 sentences. There are some open issues about the Deterministic Triplet Extraction Tool, as its reliance on other not-deterministic Natural Language Processing tools or its performance on some particular sentences. However the Deterministic Triplet Extraction Tool can be considered an essential step to Next Generation Medical Ontologies.
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2014
2013/2014
In ambito informatico, un’ontologia è una rappresentazione formale di conoscenza attraverso un elenco di “statement” o triplette. Le ontologie in ambito biomedico sono fondamentali per favorire la condivisione delle conoscenza tra gruppi di ricerca differenti. Una delle più grandi problematiche nel mondo delle ontologie è la loro creazione: creare un’ontologia è un compito difficile e estremamente lungo. Lo scopo del lavoro è stato quello di sviluppare un applicativo software per creare automaticamente ontologie in ambito biomedico a partire da un testo - di ambito biomedico - in linguaggio naturale inglese: questo strumento è stato chiamato “Deterministic Triplet Extraction Tool” (DeTET). DeTET è stato implementando usando il linguaggio di programmazione Java; DeTET ha ottenuto risultati interessanti in alcuni test preliminari condotti. Tuttavia, rimangono alcune problematiche aperte, come le performance ottenute con alcune tipologie di frasi. DeTET può però essere considerato un passo in avanti nella soluzione di alcuni problemi legati alla creazione di nuove ontologie biomediche.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Elaborato Condorelli Andrea.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 3.04 MB
Formato Adobe PDF
3.04 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/92686