Outstanding advancements in imaging technology have made cryogenic electron microscopy a powerful technique for the nanocharacterization of biological macromolecular complexes, reaching atomic levels of resolution and being applicable to a wider set of samples than the other competing technologies. The real breakthrough in the development of cryo-EM has happened less than a decade ago, with the introduction of direct detection devices. These cameras allow unprecedented speed and resolution, and Lawrence Berkeley National Lab is developing a new detector, the 4D cam- era, that can operate at 87000 frames per second, revealing exclusive temporal dynamics of the investigated processes. The current bottlenecks of the 4D camera, however, are the management of the large amount of data generated (around 50 GB/s) and the intrinsic noise level characterizing the signal acquired at that speed. Yet, the high frame rate enables the recognition of single electrons when they strike the detector, as opposed to traditional electron microscopy, where the charge is cumulated for every frame. Electron counting has remarkable advantages since it completely rejects electrical background noise as well as the variability in the electron charge deposition phenomena and it dramatically compresses images by saving them as lists of events coordinates. With this work, the counting efficiency of the algorithm is enhanced, through the introduction of a denoising step before thresholding out the background noise, rising the precision by 7.11% with respect to the reference implementation. Furthermore, the localization of the events is refined to allow super-resolution, and a classification step is added to reduce the is- sue of collision losses, caused by overlapping electrons. In the end, a 10000x compression ratio is achieved thanks to electron counting. A GPU acceleration of the final algorithm is also proposed, achieving, in the best case, a speed up of 284x. The timing performances of the developed tool, in fact, are crucial for its real time execution on the microscope output. Ultimately, this work aims at enabling a more efficient data management between the microscopy center and the supercomputing facility, both involved in the data processing pipeline, by moving part of the computation towards the instrumentation and transferring only a compressed version of the datasets. The intelligent redistribution of workloads, in fact, removes the bottleneck in data transfer and grants the use of the microscope at its maximum frame rate.
Innovazioni radicali nel campo delle tecnologie per imaging hanno reso la microscopia elettronica criogenica (cryo-EM) una delle tecniche principali per la nanocaratterizzazione di complessi biologici macromolecolari, in grado di raggiungere un livello atomico di risoluzione e di essere applicata ad un insieme di campioni più ampio rispetto alle tecniche concorrenti. Il vero punto di svolta nello sviluppo della crio-EM é arrivato meno di dieci anni fa, con l’introduzione dei dispositivi di detezione diretti. Questi sistemi di detezione permettono di operare a velocità e risoluzioni senza precedenti. Il Lawrence Berkeley National Laboratory sta sviluppando un nuovo detettore, la “4D camera”, che può arrivare ad acquisire 87000 fotogrammi al secondo, rivelano così dinamiche temporali esclusive dei processi sotto osservazione. Nonostante ciò, le problematiche attuali della 4D camera sono la gestione della grande quantità di dati prodotta (circa 50 GB/s) e il livello di rumore intrinseco nei segnali acquisiti a questa frequenza. Allo stesso tempo, però, l’alta frequenza di acquisizione dei fotogrammi permette il riconoscimento dei singoli elettroni quando colpiscono il detettore, al contrario della microscopia elettronica tradizionale in cui la carica degli elettroni viene accumulata per ogni frame. La tecnica di electron counting ha vantaggi notevoli, dal momento che rimuove completamente sia il rumore elettronico di sfondo che la variabrilitá nella deposizione di carica degli elettroni e comprime radicalmente le immagini salvando solo liste di eventi elettronici. Con questo lavoro l’efficienza del conteggio elettronico é stata intensificata attraverso l’introduzione di un passaggio di riduzione del rumore nelle immagini, prima di applicare una soglia per scartare il rumore di sottofondo, aumentando così la precisione del 7.11% rispetto all’implementazione di riferimento. Inoltre, il processo di localizzazione degli eventi é stato ridefinito per ottenere super-risoluzione e una fase di classificazione é stata aggiunta per ridurre l’incidenza delle perdite dovute a collisioni, causate da elettroni che si sovrappongono sul sensore. Complessivamente é stato ottenuto un fattore di compressione pari a 10000x grazie alla tecnica di electron counting. É stata proposta anche un’accelerazione basata su GPU dell’algoritmo finale, che ottiene, nel miglior caso, un fattore di accelerazione pari a 284x. Le performances di questo strumento in termini di tempistiche, infatti, sono cruciali per la sua esecuzione in tempo reale sui risultati del microscopio. In conclusione, questo lavoro si pone come obiettivo di permettere una gestione dei dati più efficiente tra il centro di microscopia (NCEM) e la struttura di supercomputing, entrambe coinvolte nel processo di analisi dei dati. Ciò é possibile spostando parte della computazione verso la strumentazione e trasferendo solo una versione compressa del dataset. Una ridistribuzione intelligente del carico di lavoro, infatti, rimuove l’ostacolo nel trasferimento dei dati e garantisce l’uso del microscopio alla frequenza di acquisizione dei fotogrammi più alta permessa dall’attuale tecnologia.
ECCO : an electron counting implementation for image compression and optimization of Cryo-EM data management
COLETTI, CHIARA
2018/2019
Abstract
Outstanding advancements in imaging technology have made cryogenic electron microscopy a powerful technique for the nanocharacterization of biological macromolecular complexes, reaching atomic levels of resolution and being applicable to a wider set of samples than the other competing technologies. The real breakthrough in the development of cryo-EM has happened less than a decade ago, with the introduction of direct detection devices. These cameras allow unprecedented speed and resolution, and Lawrence Berkeley National Lab is developing a new detector, the 4D cam- era, that can operate at 87000 frames per second, revealing exclusive temporal dynamics of the investigated processes. The current bottlenecks of the 4D camera, however, are the management of the large amount of data generated (around 50 GB/s) and the intrinsic noise level characterizing the signal acquired at that speed. Yet, the high frame rate enables the recognition of single electrons when they strike the detector, as opposed to traditional electron microscopy, where the charge is cumulated for every frame. Electron counting has remarkable advantages since it completely rejects electrical background noise as well as the variability in the electron charge deposition phenomena and it dramatically compresses images by saving them as lists of events coordinates. With this work, the counting efficiency of the algorithm is enhanced, through the introduction of a denoising step before thresholding out the background noise, rising the precision by 7.11% with respect to the reference implementation. Furthermore, the localization of the events is refined to allow super-resolution, and a classification step is added to reduce the is- sue of collision losses, caused by overlapping electrons. In the end, a 10000x compression ratio is achieved thanks to electron counting. A GPU acceleration of the final algorithm is also proposed, achieving, in the best case, a speed up of 284x. The timing performances of the developed tool, in fact, are crucial for its real time execution on the microscope output. Ultimately, this work aims at enabling a more efficient data management between the microscopy center and the supercomputing facility, both involved in the data processing pipeline, by moving part of the computation towards the instrumentation and transferring only a compressed version of the datasets. The intelligent redistribution of workloads, in fact, removes the bottleneck in data transfer and grants the use of the microscope at its maximum frame rate.File | Dimensione | Formato | |
---|---|---|---|
2019_12_Coletti.pdf
Open Access dal 03/12/2022
Descrizione: testo della tesi
Dimensione
7.25 MB
Formato
Adobe PDF
|
7.25 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/151060