The aim of this work is the design and the implementation of data intensive web services and web applications which use evolving knowledge bases. These systems must be efficient in terms both of space occupied for data storage and response time, and they must be able to manage the knowledge base evolution mantaining a high level of availability. These issues have been studied in bioinformatics, where the critical aspects are amplified by the large number of data used and the high frequency of updates. A system to execute bioinformatic enrichment analysis was designed and implemented; this system is based on the Genomic and Proteomic Knowledge Base, a big biomolecular and biomedical knowledge base developed at Politecnico di Milano. The results achieved in the bioinformatic case could be applied to the majority of Information Systems, because the bioinformatic case has very critical requirements.
Lo scopo di questa Tesi è la progettazione e realizzazione prototipale di servizi e applicazioni web di tipo data intensive, basati su basi di conoscenza che variano nel tempo, che siano efficienti in termini sia di spazio necessario per la memorizzazione dei dati sia di tempi di risposta agli utenti e che permettano di gestire l’evoluzione della base di conoscenza mantenendo la propria operatività. Le problematiche sopra esposte vengono studiate nel caso bioinformatico, dove le architetture web descritte sono frequenti e rilevanti, e dove gli aspetti critici citati sono amplificati dalla presenza di dati molto numerosi che variano con una frequenza spesso molto elevata. In particolare viene progettato e realizzato un sistema di analisi di arricchimento di annotazioni biomolecolari basato su servizi web e sulla Genomic and Proteomic Knowledge Base, una grande base di conoscenza biomolecolare e biomedica che integra dati provenienti dalle maggiori banche dati mondiali del settore, realizzata al Politecnico di Milano. I risultati raggiunti nel caso bioinformatico, che presenta criticità nei requisiti superiori rispetto a quanto avviene in altri domini, potranno essere direttamente applicati anche a sistemi informativi appartenenti ad altri ambiti.
Servizi e applicazioni web data intensive basati su grandi basi di conoscenza in evoluzione : il caso bioinformatico
DE ZORZI, MARCO
2009/2010
Abstract
The aim of this work is the design and the implementation of data intensive web services and web applications which use evolving knowledge bases. These systems must be efficient in terms both of space occupied for data storage and response time, and they must be able to manage the knowledge base evolution mantaining a high level of availability. These issues have been studied in bioinformatics, where the critical aspects are amplified by the large number of data used and the high frequency of updates. A system to execute bioinformatic enrichment analysis was designed and implemented; this system is based on the Genomic and Proteomic Knowledge Base, a big biomolecular and biomedical knowledge base developed at Politecnico di Milano. The results achieved in the bioinformatic case could be applied to the majority of Information Systems, because the bioinformatic case has very critical requirements.File | Dimensione | Formato | |
---|---|---|---|
2010_12_De_Zorzi.pdf
accessibile in internet per tutti
Descrizione: Testo della Tesi
Dimensione
5.42 MB
Formato
Adobe PDF
|
5.42 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/12022