Servizi e applicazioni web data intensive basati su grandi basi di conoscenza in evoluzione : il caso bioinformatico

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

The aim of this work is the design and the implementation of data intensive web services and web applications which use evolving knowledge bases. These systems must be efficient in terms both of space occupied for data storage and response time, and they must be able to manage the knowledge base evolution mantaining a high level of availability. These issues have been studied in bioinformatics, where the critical aspects are amplified by the large number of data used and the high frequency of updates. A system to execute bioinformatic enrichment analysis was designed and implemented; this system is based on the Genomic and Proteomic Knowledge Base, a big biomolecular and biomedical knowledge base developed at Politecnico di Milano. The results achieved in the bioinformatic case could be applied to the majority of Information Systems, because the bioinformatic case has very critical requirements.

Lo scopo di questa Tesi è la progettazione e realizzazione prototipale di servizi e applicazioni web di tipo data intensive, basati su basi di conoscenza che variano nel tempo, che siano efficienti in termini sia di spazio necessario per la memorizzazione dei dati sia di tempi di risposta agli utenti e che permettano di gestire l’evoluzione della base di conoscenza mantenendo la propria operatività. Le problematiche sopra esposte vengono studiate nel caso bioinformatico, dove le architetture web descritte sono frequenti e rilevanti, e dove gli aspetti critici citati sono amplificati dalla presenza di dati molto numerosi che variano con una frequenza spesso molto elevata. In particolare viene progettato e realizzato un sistema di analisi di arricchimento di annotazioni biomolecolari basato su servizi web e sulla Genomic and Proteomic Knowledge Base, una grande base di conoscenza biomolecolare e biomedica che integra dati provenienti dalle maggiori banche dati mondiali del settore, realizzata al Politecnico di Milano. I risultati raggiunti nel caso bioinformatico, che presenta criticità nei requisiti superiori rispetto a quanto avviene in altri domini, potranno essere direttamente applicati anche a sistemi informativi appartenenti ad altri ambiti.

Servizi e applicazioni web data intensive basati su grandi basi di conoscenza in evoluzione : il caso bioinformatico

DE ZORZI, MARCO

2009/2010

Abstract

The aim of this work is the design and the implementation of data intensive web services and web applications which use evolving knowledge bases. These systems must be efficient in terms both of space occupied for data storage and response time, and they must be able to manage the knowledge base evolution mantaining a high level of availability. These issues have been studied in bioinformatics, where the critical aspects are amplified by the large number of data used and the high frequency of updates. A system to execute bioinformatic enrichment analysis was designed and implemented; this system is based on the Genomic and Proteomic Knowledge Base, a big biomolecular and biomedical knowledge base developed at Politecnico di Milano. The results achieved in the bioinformatic case could be applied to the majority of Information Systems, because the bioinformatic case has very critical requirements.

Scheda breve

Scheda completa

	Relatore
	
				MASSEROLI, MARCO
			
	Scuola / Dip.
	
				ING V - Facolta' di Ingegneria dell'Informazione
			
	Data
	
				20-dic-2010
			
	Anno accademico
	
				2009/2010
			
	Abstract in italiano
	
				Lo scopo di questa Tesi è la progettazione e realizzazione prototipale di servizi e
applicazioni web di tipo data intensive, basati su basi di conoscenza che variano nel
tempo, che siano efficienti in termini sia di spazio necessario per la memorizzazione dei
dati sia di tempi di risposta agli utenti e che permettano di gestire l’evoluzione della
base di conoscenza mantenendo la propria operatività.
Le problematiche sopra esposte vengono studiate nel caso bioinformatico, dove le
architetture web descritte sono frequenti e rilevanti, e dove gli aspetti critici citati sono amplificati dalla presenza di dati molto numerosi che variano con una frequenza spesso
molto elevata. In particolare viene progettato e realizzato un sistema di analisi di
arricchimento di annotazioni biomolecolari basato su servizi web e sulla Genomic and
Proteomic Knowledge Base, una grande base di conoscenza biomolecolare e biomedica
che integra dati provenienti dalle maggiori banche dati mondiali del settore, realizzata
al Politecnico di Milano.
I risultati raggiunti nel caso bioinformatico, che presenta criticità nei requisiti superiori rispetto a quanto avviene in altri domini, potranno essere direttamente applicati anche a sistemi informativi appartenenti ad altri ambiti.
			
	Tipo di documento
	
				Tesi di laurea Magistrale
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
2010_12_De_Zorzi.pdf accessibile in internet per tutti Descrizione: Testo della Tesi Dimensione 5.42 MB Formato Adobe PDF Visualizza/Apri	5.42 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/12022