The aim of this work is the design and the implementation of data intensive web services and web applications which use evolving knowledge bases. These systems must be efficient in terms both of space occupied for data storage and response time, and they must be able to manage the knowledge base evolution mantaining a high level of availability. These issues have been studied in bioinformatics, where the critical aspects are amplified by the large number of data used and the high frequency of updates. A system to execute bioinformatic enrichment analysis was designed and implemented; this system is based on the Genomic and Proteomic Knowledge Base, a big biomolecular and biomedical knowledge base developed at Politecnico di Milano. The results achieved in the bioinformatic case could be applied to the majority of Information Systems, because the bioinformatic case has very critical requirements.

Lo scopo di questa Tesi è la progettazione e realizzazione prototipale di servizi e applicazioni web di tipo data intensive, basati su basi di conoscenza che variano nel tempo, che siano efficienti in termini sia di spazio necessario per la memorizzazione dei dati sia di tempi di risposta agli utenti e che permettano di gestire l’evoluzione della base di conoscenza mantenendo la propria operatività. Le problematiche sopra esposte vengono studiate nel caso bioinformatico, dove le architetture web descritte sono frequenti e rilevanti, e dove gli aspetti critici citati sono amplificati dalla presenza di dati molto numerosi che variano con una frequenza spesso molto elevata. In particolare viene progettato e realizzato un sistema di analisi di arricchimento di annotazioni biomolecolari basato su servizi web e sulla Genomic and Proteomic Knowledge Base, una grande base di conoscenza biomolecolare e biomedica che integra dati provenienti dalle maggiori banche dati mondiali del settore, realizzata al Politecnico di Milano. I risultati raggiunti nel caso bioinformatico, che presenta criticità nei requisiti superiori rispetto a quanto avviene in altri domini, potranno essere direttamente applicati anche a sistemi informativi appartenenti ad altri ambiti.

Servizi e applicazioni web data intensive basati su grandi basi di conoscenza in evoluzione : il caso bioinformatico

DE ZORZI, MARCO
2009/2010

Abstract

The aim of this work is the design and the implementation of data intensive web services and web applications which use evolving knowledge bases. These systems must be efficient in terms both of space occupied for data storage and response time, and they must be able to manage the knowledge base evolution mantaining a high level of availability. These issues have been studied in bioinformatics, where the critical aspects are amplified by the large number of data used and the high frequency of updates. A system to execute bioinformatic enrichment analysis was designed and implemented; this system is based on the Genomic and Proteomic Knowledge Base, a big biomolecular and biomedical knowledge base developed at Politecnico di Milano. The results achieved in the bioinformatic case could be applied to the majority of Information Systems, because the bioinformatic case has very critical requirements.
ING V - Facolta' di Ingegneria dell'Informazione
20-dic-2010
2009/2010
Lo scopo di questa Tesi è la progettazione e realizzazione prototipale di servizi e applicazioni web di tipo data intensive, basati su basi di conoscenza che variano nel tempo, che siano efficienti in termini sia di spazio necessario per la memorizzazione dei dati sia di tempi di risposta agli utenti e che permettano di gestire l’evoluzione della base di conoscenza mantenendo la propria operatività. Le problematiche sopra esposte vengono studiate nel caso bioinformatico, dove le architetture web descritte sono frequenti e rilevanti, e dove gli aspetti critici citati sono amplificati dalla presenza di dati molto numerosi che variano con una frequenza spesso molto elevata. In particolare viene progettato e realizzato un sistema di analisi di arricchimento di annotazioni biomolecolari basato su servizi web e sulla Genomic and Proteomic Knowledge Base, una grande base di conoscenza biomolecolare e biomedica che integra dati provenienti dalle maggiori banche dati mondiali del settore, realizzata al Politecnico di Milano. I risultati raggiunti nel caso bioinformatico, che presenta criticità nei requisiti superiori rispetto a quanto avviene in altri domini, potranno essere direttamente applicati anche a sistemi informativi appartenenti ad altri ambiti.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2010_12_De_Zorzi.pdf

accessibile in internet per tutti

Descrizione: Testo della Tesi
Dimensione 5.42 MB
Formato Adobe PDF
5.42 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/12022