NGS technologies have led to an increase in the amount of genomic data generated, enabling new types of studies that use genetic material from various members of the same species, family, or environment. To provide a more efficient analysis process, new operations require new computing paradigms. Being usable for expressing both intra-individual and inter-individual heterogeneity, graph-based representations of genetic data have recently been suggested as a more efficient alternative to strings. This paradigm shift has the potential to enable the appropriate scalability of pangenomics, that is the study of numerous genomes together. Because of the novelty of this approach, standardized and established pipelines for the analysis of genomic graphs still struggle to emerge, and the result is a highly fragmented scenario of tools and research efforts. The purpose of the project described in this thesis is to provide a platform for the construction, analysis and visualization of genome graphs. The proposed solution consists of a web application that integrates several tools to enable the execution of a genome analysis pipeline on graphs in a fast, easy, and intuitive way.

Le NGS hanno portato a un aumento della quantità di dati genomici, permettendo nuovi tipi di studio che utilizzano materiale genetico da vari membri della stessa specie, famiglia o ambiente. Per fornire un processo di analisi più efficiente, nuove operazioni richiedono nuovi paradigmi informatici. Essendo utilizzabili per esprimere eterogeneità sia intra- che inter-individuale, le rappresentazioni basate su grafi dei dati genetici sono state recentemente suggerite come un’alternativa più efficace alle stringhe.Questo cambio di paradigma sembra in grado di consentire la scalabilità per la pangenomica, lo studio di numerosi genomi insieme. A causa della novità di questo approccio, pipeline standardizzate e consolidate per l’analisi dei grafi genomici faticano ancora ad emergere e il risultato è una realtà di lavoro e ricerca estremamente frammentata. Lo scopo del progetto descritto in questa tesi è stato quello di offrire una piattaforma per la costruzione, l’analisi e la visualizzazione di grafi genomici. La soluzione proposta è costituita da un’applicazione web che integra diversi strumenti al fine di consentire l’esecuzione di una pipeline di analisi del genoma su grafi.

Design and implementation of a user-friendly platform for graph based genome analysis

BRUNO, GUGLIELMO
2021/2022

Abstract

NGS technologies have led to an increase in the amount of genomic data generated, enabling new types of studies that use genetic material from various members of the same species, family, or environment. To provide a more efficient analysis process, new operations require new computing paradigms. Being usable for expressing both intra-individual and inter-individual heterogeneity, graph-based representations of genetic data have recently been suggested as a more efficient alternative to strings. This paradigm shift has the potential to enable the appropriate scalability of pangenomics, that is the study of numerous genomes together. Because of the novelty of this approach, standardized and established pipelines for the analysis of genomic graphs still struggle to emerge, and the result is a highly fragmented scenario of tools and research efforts. The purpose of the project described in this thesis is to provide a platform for the construction, analysis and visualization of genome graphs. The proposed solution consists of a web application that integrates several tools to enable the execution of a genome analysis pipeline on graphs in a fast, easy, and intuitive way.
DI DONATO, GUIDO WALTER
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2022
2021/2022
Le NGS hanno portato a un aumento della quantità di dati genomici, permettendo nuovi tipi di studio che utilizzano materiale genetico da vari membri della stessa specie, famiglia o ambiente. Per fornire un processo di analisi più efficiente, nuove operazioni richiedono nuovi paradigmi informatici. Essendo utilizzabili per esprimere eterogeneità sia intra- che inter-individuale, le rappresentazioni basate su grafi dei dati genetici sono state recentemente suggerite come un’alternativa più efficace alle stringhe.Questo cambio di paradigma sembra in grado di consentire la scalabilità per la pangenomica, lo studio di numerosi genomi insieme. A causa della novità di questo approccio, pipeline standardizzate e consolidate per l’analisi dei grafi genomici faticano ancora ad emergere e il risultato è una realtà di lavoro e ricerca estremamente frammentata. Lo scopo del progetto descritto in questa tesi è stato quello di offrire una piattaforma per la costruzione, l’analisi e la visualizzazione di grafi genomici. La soluzione proposta è costituita da un’applicazione web che integra diversi strumenti al fine di consentire l’esecuzione di una pipeline di analisi del genoma su grafi.
File allegati
File Dimensione Formato  
2022_12_Bruno_ExecSum.pdf

non accessibile

Descrizione: executive summary
Dimensione 918.29 kB
Formato Adobe PDF
918.29 kB Adobe PDF   Visualizza/Apri
2022_12_Bruno_Thesis.pdf

non accessibile

Descrizione: thesis
Dimensione 6.35 MB
Formato Adobe PDF
6.35 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/198851