Learning Bayesian network structure has been an active topic since they were introduced, especially when considering their causal interpretation. There have been several attempts at guiding the learning process by providing additional knowledge, usually supplied by experts. In the recent years, ontologies have gained popularity in terms of publishing domain knowledge in a formal, systematic and, above all, machine understandable way. It was to be expected for approaches to be developed that combine these two models for representing knowledge, made even more obvious when considering their underlying similarity. In this work we will consider using the knowledge present in publicly available ontologies, focusing on causal knowledge, and using it to assist the construction of causal Bayesian networks. We will consider the needed assumptions to make the process sound and propose a structure learning algorithm. After an in-depth analysis of the algorithm we will consider its performance on a real-world dataset and compare it to existing approaches. We have taken an example from the field of molecular biology because of the amount of datasets available, the high quality publicly available ontologies as the Gene Ontology, and the interest in using Bayesian networks for modeling gene interaction networks. It will be shown that the devised approach is valid one and has many potential directions for future extension.

L’apprendimento della struttura di reti Bayesiane è stato un argomento attivo da quando esse sono state introdotte, soprattutto se si considera la loro interpretazione causale. Ci sono stati diversi tentativi di dirigere il processo di apprendimento fornendo ulteriori conoscenze, di solito fornite da esperti. Negli ultimi anni, le ontologie hanno guadagnato popolarità in termini di pubblicazione di conoscenza del dominio in modo formale, sistematico e, soprattutto, utilizzabile da programmi informatici. Era da aspettarsi che vari approcci che combinano questi due modelli per la rappresentazione della conoscenza sarebbero stati sviluppati, e il tutto appare ancora più evidente se si considera la loro somiglianza di fondo. In questo lavoro considereremo l’utilizzo della conoscenza presente in ontologie disponibili pubblicamente, concentrandoci particolarmente alla conoscenza causale, e usandola per assistere la costruzione di reti Bayesiane causali. Saranno prese in considerazione le ipotesi necessarie per rendere il processo coerente e in seguito proporremo un algoritmo per l’apprendimento di tali strutture. Dopo l'analisi approfondita dell'algoritmo vedremo le sue prestazioni su un set di dati preso dal mondo reale e confrontarlo con approcci esistenti. Abbiamo preso un esempio dal settore della bioinformatica a causa della quantità di set di dati a disposizione, la disponibilità di ontologie pubblice di alta qualità come la Gene Ontology, e l'interesse elevato per l'utilizzo di reti Bayesiane per la modellazione di reti di interazioni geniche. Sarà mostrato che l'approccio messo a punto è valido e offre varie direzioni da considerare per una futura estensione.

Ontology assisted approach for learning causal Bayesian network structure

CUTIC, DENIS
2012/2013

Abstract

Learning Bayesian network structure has been an active topic since they were introduced, especially when considering their causal interpretation. There have been several attempts at guiding the learning process by providing additional knowledge, usually supplied by experts. In the recent years, ontologies have gained popularity in terms of publishing domain knowledge in a formal, systematic and, above all, machine understandable way. It was to be expected for approaches to be developed that combine these two models for representing knowledge, made even more obvious when considering their underlying similarity. In this work we will consider using the knowledge present in publicly available ontologies, focusing on causal knowledge, and using it to assist the construction of causal Bayesian networks. We will consider the needed assumptions to make the process sound and propose a structure learning algorithm. After an in-depth analysis of the algorithm we will consider its performance on a real-world dataset and compare it to existing approaches. We have taken an example from the field of molecular biology because of the amount of datasets available, the high quality publicly available ontologies as the Gene Ontology, and the interest in using Bayesian networks for modeling gene interaction networks. It will be shown that the devised approach is valid one and has many potential directions for future extension.
ING - Scuola di Ingegneria Industriale e dell'Informazione
23-lug-2013
2012/2013
L’apprendimento della struttura di reti Bayesiane è stato un argomento attivo da quando esse sono state introdotte, soprattutto se si considera la loro interpretazione causale. Ci sono stati diversi tentativi di dirigere il processo di apprendimento fornendo ulteriori conoscenze, di solito fornite da esperti. Negli ultimi anni, le ontologie hanno guadagnato popolarità in termini di pubblicazione di conoscenza del dominio in modo formale, sistematico e, soprattutto, utilizzabile da programmi informatici. Era da aspettarsi che vari approcci che combinano questi due modelli per la rappresentazione della conoscenza sarebbero stati sviluppati, e il tutto appare ancora più evidente se si considera la loro somiglianza di fondo. In questo lavoro considereremo l’utilizzo della conoscenza presente in ontologie disponibili pubblicamente, concentrandoci particolarmente alla conoscenza causale, e usandola per assistere la costruzione di reti Bayesiane causali. Saranno prese in considerazione le ipotesi necessarie per rendere il processo coerente e in seguito proporremo un algoritmo per l’apprendimento di tali strutture. Dopo l'analisi approfondita dell'algoritmo vedremo le sue prestazioni su un set di dati preso dal mondo reale e confrontarlo con approcci esistenti. Abbiamo preso un esempio dal settore della bioinformatica a causa della quantità di set di dati a disposizione, la disponibilità di ontologie pubblice di alta qualità come la Gene Ontology, e l'interesse elevato per l'utilizzo di reti Bayesiane per la modellazione di reti di interazioni geniche. Sarà mostrato che l'approccio messo a punto è valido e offre varie direzioni da considerare per una futura estensione.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2013_07_Cutic.pdf

accessibile in internet per tutti

Descrizione: Thesis
Dimensione 2.06 MB
Formato Adobe PDF
2.06 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/80872