Loading AI tools
Da Wikipedia, l'enciclopedia libera
Gli algoritmi di ricostruzione tomografica sono un insieme di metodi matematici utilizzati per ottenere un'immagine della sezione o una ricostruzione tridimensionale di un soggetto a cui è stata effettuata una tomografia[1].
Questi algoritmi rielaborano i dati di proiezione contenuti nel sinogramma del soggetto sottoposto a scansione, che è anche il risultato della trasformata di Radon del soggetto stesso. Tali dati sono costituiti da una serie di proiezioni effettuate da diverse angolazioni attorno al soggetto da analizzare e vengono acquisiti misurando l'attenuazione dei raggi X (nel caso della TAC) mentre questi attraversano il soggetto in diverse direzioni. L'obiettivo di questi algoritmi è quindi quello di determinare l'attenuazione dei raggi X in ogni punto dello spazio di ricostruzione sotto analisi[2] al fine di estrarne un'immagine.
Gli algoritmi (o metodi) di ricostruzione tomografica possono essere divisi principalmente in due categorie:
Gli approcci analitici sono basati su considerazioni matematiche effettuate sul principio di funzionamento della tomografia, ovvero l’operazione di proiezione. Nel caso bidimensionale, l'obiettivo è estrarre una fetta (o slice) del soggetto sotto analisi corrispondente al piano su cui si trovano i raggi, sottesi tra la sorgente e il rivelatore (o detector). Per farlo, il soggetto è posto solitamente sull’asse di rotazione di sorgente e detector e questi catturano diverse proiezioni del soggetto da diverse angolazioni intorno ad esso[1].
Alla fine di questa procedura, i dati raccolti possono essere riorganizzati sovrapponendo ciascuna proiezione all'altra per creare il sinogramma, che si presenta come un'immagine in cui le righe corrispondono alle proiezioni ottenute a diversi angoli e le colonne corrispondono ai sensori che compongono il detector. Il nome sinogramma deriva dal fatto che il suo contenuto ricorda l'unione di diverse onde sinusoidali: supponendo che il soggetto della scansione sia un punto (quindi una funzione delta di Dirac in 2D), il risultato nel sinogramma sarebbe una singola onda sinusoidale, con un'ampiezza crescente all’allontanarsi dall'asse di rotazione. Il sinogramma può essere quindi considerato una combinazione di molteplici onde sinusoidali poiché il soggetto della scansione, se discretizzato, può essere visto come una combinazione di funzioni delta di Dirac, e dal momento che il sinogramma è anche il risultato della trasformata di Radon di un oggetto e dal momento che tale trasformazione è lineare, la combinazione di sinusoidi che compone il sinogramma è lineare[4][5].
Una singola proiezione contenuta nel sinogramma può essere formalizzata come:
Dove è l’oggetto sotto scansione, mentre rappresenta la direzione di un raggio del fascio di scansione all’angolo che incide sul pixel t del detector, e può essere formalizzato come[5]:
L’intero sinogramma può essere invece ottenuto applicando la trasformata di Radon[5]:
È possibile applicare al sinogramma la trasformata di Radon inversa per riottenere la funzione e quindi la ricostruzione, tuttavia bisogna tenere presente che ciò funzionerebbe perfettamente solo se la trasformata di Radon, o la scansione CT, fossero effettuate in maniera continua e non discreta, con un numero infinito di angoli e punti del rivelatore [4][5][3].
Un altro elemento matematico è costituito dal teorema della fetta di Fourier, che collega tra loro la trasformata di Radon e la trasformata di Fourier bidimensionale. Dato una funzione bidimensionale , il teorema della fetta di Fourier afferma che:
sono operazioni equivalenti, che portano allo stesso risultato[4][3][6].
Questo teorema evidenzia la relazione che esiste tra la trasformata di Fourier bidimensionale e la trasformata di Radon: conoscendo le proiezioni per tutti gli angoli intorno a un oggetto, è possibile infatti ottenere la sua trasformata di Fourier bidimensionale semplicemente effettuando la trasformata di Fourier unidimensionale di tutte le proiezioni e poi organizzandole in uno spazio bidimensionale come linee che passano attraverso l'origine inclinate dell’angolo . A questo punto, la funzione può essere recuperata applicando la trasformata di Fourier bidimensionale inversa[4][3][6].
Dal momento che i dati di proiezione a diversi angoli sono ciò che produce una tomografia, questo algoritmo può essere usato per ottenere una ricostruzione. Tuttavia, sussistono dei problemi con l'utilizzo di questo approccio. Innanzitutto, la quantità di misurazioni ottenute da una tomografia è finita, il che porta ad ottenere un dominio di Fourier della ricostruzione che è campionato in maniera non uniforme: i campioni della trasformata di Fourier prodotti da questo approccio si trovano infatti distribuiti lungo cerchi concentrici invece che seguire una griglia, una caratteristica richiesta per algoritmi come la trasformata di Fourier veloce per ottenere l'antitrasformata di Fourier. Il secondo problema risiede nel fatto che la distribuzione campionaria del dominio di Fourier è molto più densa vicino all'origine rispetto alle regioni esterne: ciò significa che le frequenze più basse sono sovra rappresentate rispetto alle frequenze più alte e quando verrà applicata la trasformata di Fourier inversa l’immagine finale sarà sfocata[6].
L'algoritmo di retroproiezione (o algoritmo di back-projection) è un metodo di ricostruzione analitico equivalente all'operazione inversa di proiezione (o antitrasformata di Radon), che nella tomografia computerizzata avviene quando i raggi X proiettano il soggetto sotto scansione sui diversi pixel del detector[7].
In questo algoritmo, ciascun punto dell'immagine di uscita riceve un valore proporzionale alla proiezione sul detector del corrispondente punto del dominio dell'oggetto scansionato, per tutti i diversi angoli di proiezione. Per ottenere questo risultato, ciascuna proiezione viene propagata sull'immagine d'uscita lungo una direzione in accordo con il proprio angolo di acquisizione, così che diversi valori provenienti da diversi angoli di acquisizione si sommino nei punti dell'immagine producendo il risultato desiderato[8]. Questa operazione può essere espressa dalla seguente equazione:
dove rappresenta l'immagine di uscita, una proiezione a un certo angolo e ciascun punto rispetta l'equazione [9][10].
Sebbene l'algoritmo di retroproiezione richieda una capacità di calcolo limitata per produrre un risultato, il suo svantaggio risiede nella produzione di immagini affette da sfocatura. Se si prova ad applicare l'algoritmo ad uno stesso soggetto di partenza ma si effettuano ricostruzioni con un numero crescente di proiezioni, si potrà notare come l'immagine di uscita con più proiezioni risulti più delineata rispetto a quelle con meno proiezioni, tuttavia ancora sfocata rispetto al soggetto scansionato. La ragione di questo effetto è dovuta ad una sovra rappresentazione delle basse frequenze rispetto alle alte frequenze nei dati di proiezione, e può essere risolto filtrando i dati come avviene nell'algoritmo di retroproiezione filtrata[11].
L’algoritmo di retroproiezione filtrata (o di filtered back-projection) è un metodo analitico ed un’evoluzione dell’algoritmo di retroproiezione che mitiga gli effetti di sfocatura[3].
Operativamente, è diviso in due parti: fase di filtraggio e fase di retroproiezione. La prima è una fase di pre-elaborazione dei dati, che serve a preparare i dati prima che vengano rielaborati dalla seconda, ed è equivalente all’algoritmo di retroproiezione. La prima fase infatti consiste nel filtrare tutte le proiezioni presenti nel sinogramma al fine di attenuare le basse frequenze. In questo modo, quando i dati saranno ricostruiti nella seconda fase, l’immagine finale non apparirà sfocata[11].
Per effettuare questa operazione possono essere impiegati diversi tipi di filtri passa alto, ma spesso è utilizzato il filtro di Ram-Lak che è in grado di attenuare le basse frequenze, amplificare le alte e tagliare tutte le frequenze oltre una certa soglia definita come frequenza di taglio (o di cut-off). Il filtro viene applicato nel dominio delle frequenze. Per prima cosa, viene applicata la trasformata di Fourier alle proiezioni, poi il risultato di questa operazione viene moltiplicato per il filtro effettuando quindi il filtraggio. Infine, il risultato viene riportato nel dominio iniziale tramite l’antitrasformata di Fourier[3][11].
Una volta effettuato il filtraggio, i dati vengono retroproiettati seguendo i passi dell’algoritmo di retroproiezione. Questo metodo può essere formalizzato con le seguenti equazioni:
dove sono le proiezioni filtrate nel dominio delle frequenze ottenute dalla moltiplicazione del loro spettro con lo spettro del filtro ed ogni punto dell'immagine di uscita soddisfa l'equazione .
Provando ad applicare questo algoritmo ad uno stesso soggetto, ma effettuando ricostruzioni con un numero crescente di proiezioni e comparando i risultati dell'esperimento con quelli ottenuti utilizzando l’algoritmo di retroproiezione, si potrà notare come, a parità di numero di proiezioni utilizzate, il risultato dell’algoritmo di retroproiezione filtrata appare più definito e meno sfocato. Ciò è dovuto al fatto che le basse frequenze non sono più sovra-rappresentate rispetto alle alte poiché soppresse dal filtro[11].
Gli approcci algebrici si basano su un sistema di equazioni in forma matriciale che rappresenta l'operazione di proiezione[12]. Questo sistema può essere scritto come:
dove è un vettore monodimensionale contenente tutti gli pixel del volume da ricostruire, è un vettore monodimensionale contenente tutti gli elementi del sinogramma (ciascun elemento rappresenta quindi il valore della misurazione effettuata da un pixel del detector in una determinata direzione di proiezione) e è una matrice bidimensionale di dimensione chiamata matrice di proiezione[3][12][13].
Il ruolo della matrice di proiezione è quello di mettere in relazione le misurazioni o proiezioni effettuate con il volume da ricostruire. Il contenuto della matrice può quindi essere interpretato come la quantità con cui ciascun pixel del volume scansionato contribuisce a ciascuna singola misurazione contenuta in ogni proiezione[13].
Quando l'operazione espressa dall'equazione riportata viene eseguita è come se, considerando un singolo valore del vettore risultante , l'operazione che si sta svolgendo sia:
che è una combinazione lineare di tutti i pixel del volume del soggetto, ciascuno pesato da un valore che esprime quanto contribuisce alla misurazione. Poiché una singola riga della matrice corrisponde fisicamente a un raggio che attraversa il volume sotto analisi e quindi non tutti i pixel del volume entreranno in contatto con esso, la matrice di proiezione risulta essere estremamente sparsa[13].
Questa formulazione matriciale è un modo per esprimere in forma di combinazione lineare ciò che accade quando un oggetto è sottoposto a tomografia ed è una formulazione equivalente a quella di una trasformata di Radon discreta: in entrambi i casi il risultato sarà il sinogramma del volume del soggetto sotto analisi. La forma inversa di questa formulazione algebrica è alla base degli approcci algebrici per ottenere una ricostruzione. Considerando tale formulazione inversa:
e fissando come riferimento un singolo valore del vettore risultante , l'operazione che si sta svolgendo è la seguente:
che esprime come il valore associato a un certo pixel del volume sia una combinazione lineare di tutte le misurazioni correlate a quel pixel. Se la moltiplicazione della matrice con il vettore viene eseguita, viene svolta un'operazione equivalente a quella dell'algoritmo di retroproiezione, ottenendo una ricostruzione[3][12][13].
I valori contenuti all'interno della matrice di proiezione dipendono dal setup di acquisizione e dalla sua geometria e, per la definizione di tali valori, è possibile ricorrere a diversi kernel di proiezione[14]. Nel caso del kernel a linea, i pesi vengono definiti considerando la distanza percorsa da ogni raggio attraverso ciascun pixel del volume. Nel caso del kernel di Joseph, per ogni riga o colonna del volume del soggetto si considerano i due pixel più vicini dove il raggio interseca tale riga o colonna e i pesi vengono trovati mediante interpolazione lineare tra i pixel considerati. Un altro possibile kernel è il kernel a striscia, in cui i raggi non sono considerati come linee ma come strisce con una larghezza pari alla larghezza dei sensori del rivelatore e i pesi vengono trovati misurando l'area di ciascun pixel coperta dalla striscia[13][14].
Ciascun kernel di proiezione presenta un compromesso tra precisione ed efficienza. Il kernel a striscia è quello che permette una rappresentazione più vicina e quindi più precisa a ciò che accade nella realtà, ma è anche il più complesso in termini di calcolo dei pesi. Per questo motivo, il kernel a linea viene di solito preferito[13].
La tecnica di ricostruzione iterativa simultanea (simultaneous iterative reconstruction technique o SIRT) è un approccio di ricostruzione algebrico e iterativo[15][16] che, ad ogni passo, aggiorna la ricostruzione finale utilizzando contemporaneamente tutti i dati di proiezione. L'equazione che viene risolta ad ogni passo del ciclo di iterazione si può esprimere come[17]:
Ad ogni iterazione, il sinogramma della soluzione corrente viene generato e sottratto dal sinogramma di input dell'algoritmo: questo è espresso dalla porzione di espressione , dove la proiezione diretta della soluzione corrente viene sottratta dai dati di proiezione disponibili . In seguito, la differenza appena calcolata viene pesata tramite la matrice diagonale , la quale contiene sulla diagonale principale un valore uguale all'inverso della somma di tutte le righe della matrice di proiezione . Questa operazione assicura che i valori della differenza calcolata in precedenza siano ponderati da un valore che rappresenta l'inverso della lunghezza percorsa da ciascun raggio all'interno del volume, al fine di garantire la convergenza dell'algoritmo. Questa quantità viene poi retroproiettata mediante la pre-moltiplicazione con la matrice per riportare l'elemento calcolato nel dominio della ricostruzione e il risultato viene nuovamente pesato dalla matrice , la quale contiene sulla diagonale un valore uguale all'inverso della somma di tutte le colonne della matrice di proiezione . Infine il termine di aggiornamento appena calcolato viene aggiunto alla soluzione corrente, generando una nuova soluzione aggiornata[17].
La soluzione iniziale utilizzata per inizializzare questo algoritmo è solitamente un'immagine nera, con valori pari a zero[17][18].
Una ulteriore formulazione di questo algoritmo è la seguente:
In questa equazione, rappresenta la ricostruzione al passo , rappresenta il valore contenuto nella colonna e nella riga della matrice di proiezione , sono i valori dei dati di proiezione e sono i valori contenuti nella ricostruzione[18].
La tecnica di ricostruzione algebrica (algebraic reconstruction technique o ART) è una tecnica di ricostruzione algebrica e iterativa il cui concetto è stato proposto inizialmente da Stefan Kaczmarz[19] e successivamente adattato da Richard Gordon, Robert Bender e Gabor Herman[20] per la ricostruzione di immagini[21].
Questo algoritmo è in grado di calcolare una soluzione approssimata del sistema di equazioni lineari eseguendo iterativamente la formula:
dove è la riga della matrice , è il componente numero del vettore e è un parametro compreso tra e utilizzato per controllare la convergenza del sistema, dando la possibilità di controllare il bilanciamento tra qualità dell'output e tempo di calcolo[20].
La tecnica di ricostruzione algebrica simultanea (simultaneous algebraic reconstruction technique o SART) è un approccio di ricostruzione algebrico ed iterativo, evoluzione della tecnica di ricostruzione algebrica (ART), sviluppato da Anders Andersen e Avinash Kak nel 1984[22].
Questo algoritmo è strettamente legato anche all'algoritmo SIRT. La differenza principale tra SIRT e ART consiste nel fatto che in SIRT il passo di iterazione contiene sia la proiezione diretta sia la retroproiezione su tutti i valori del rivelatore, mentre nell'approccio ART si utilizza solo un singolo valore del rivelatore per effettuare l'aggiornamento. Ciò implica che l'approccio di ART genera ricostruzioni molto più rapide, tuttavia la convergenza di questo metodo non è garantita e ciò può rappresentare un problema in caso di misure rumorose[23].
L'algoritmo SART può essere considerato come un compromesso tra questi due metodi: in questo approccio, ad ogni iterazione vengono aggiornati solo i valori corrispondenti ai punti del dominio della ricostruzione la cui proiezione appartiene a una determinata direzione di proiezione, combinando così la velocità del metodo ART con la stabilità di convergenza di SIRT[22][23].
Nell'algoritmo SART, l'ordine in cui le direzioni di proiezione vengono considerate può essere qualunque, tuttavia è importante considerare che, se vengono scelte due direzioni di proiezione vicine in due iterazioni consecutive, questo comporterà poca aggiunta di informazione alla ricostruzione che viene costruita iterativamente. Per questo motivo, è sconsigliabile considerare le proiezioni in ordine sequenziale, ma sarebbero meglio usarle in ordine casuale[23].
Il passo di aggiornamento di SART può essere formalizzato come segue e, se confrontato con la formula esplicita di SIRT, si può notare come siano molto simili e che la formula di SART ha maggiori vincoli legati al valore del rivelatore da utilizzare.
In questa equazione rappresenta la ricostruzione al passo , rappresenta il valore contenuto nella colonna e nella riga della matrice di proiezione , sono i valori dei dati di proiezione e sono i valori contenuti nella ricostruzione[22][23].
Numerose varianti di SART sono state proposte negli anni nella letteratura scientifica, tra le quali: SARTF, FA-SART[24], OS-SART, VW-OS-SART[25].
Il metodo del gradiente coniugato ai minimi quadrati (conjugate gradient least squared o CGLS) è un algoritmo algebrico utilizzato per risolvere un generico sistema di equazioni del tipo e può essere dunque utilizzato per la ricostruzione tomografica, dato che risolve anche il sistema di equazioni che descrivono la relazione tra i dati di proiezione e l'immagine da ricostruire[26].
Durante il processo di ricostruzione, CGLS cerca di minimizzare la differenza quadratica tra i dati di proiezione misurati e quelli stimati iterativamente. Ad ogni iterazione, l'algoritmo calcola una direzione di ricerca coniugata che minimizza l'errore residuo. Successivamente, questa direzione di ricerca viene utilizzata per aggiornare l'immagine stimata e CGLS continua a iterare fino a quando l'immagine converge verso una soluzione approssimata. Questo algoritmo è noto per la sua velocità e capacità di gestire grandi quantità di dati, ma può essere sensibile al rumore nei dati di proiezione[26][27].
CGLS è un algoritmo derivato dal più generale metodo del gradiente coniugato, ma altre varianti sono state proposte per risolvere il problema tomografico come ad esempio MCGT che applica il metodo del gradiente coniugato a un sistema di Tikhonov[28].
I metodi di apprendimento profondo sono ampiamente utilizzati per la ricostruzione di immagini e sono stati applicati in diversi ambiti, tra cui la riduzione del rumore nelle tomografie a bassa dose di radiazioni, la ricostruzione con numero sparso di viste, la tomografia ad angolo limitato e la riduzione degli artefatti dovuti alla presenza di metalli. Una panoramica eccellente può essere trovata nell'edizione speciale della rivista IEEE Transactions on Medical Imaging[29]. Ad esempio, una delle maggiori tipologie di algoritmi di ricostruzione tramite deep learning applica reti neurali di post-processing per migliorare una ricostruzione già esistente, ottenuta in precedenza tramite metodi di ricostruzione convenzionali. Un esempio di applicazione è la riduzione degli artefatti utilizzando la rete U-Net nella tomografia ad angolo limitato[30].
In un'immagine ricostruita mediante un metodo completamente basato sui dati usando come input il sinogramma, possono tuttavia verificarsi degli errori. Pertanto, l'integrazione di operatori noti nella progettazione dell'architettura delle reti neurali potrebbe risultare vantaggiosa, come descritto nel concetto di apprendimento di precisione[31]. Ad esempio, la ricostruzione diretta di immagini dai dati di proiezione può essere appresa dalla struttura dell'algoritmo di retroproiezione filtrata[32]. Un altro esempio è la costruzione di reti neurali mediante l'iterazione di algoritmi di ricostruzione[33]. Oltre all'apprendimento di precisione, un approccio alternativo per migliorare la qualità delle ricostruzioni ottenute tramite deep learning è utilizzare metodi di ricostruzione convenzionali applicati a una precedente ricostruzione basata su deep learning[34].
Per la ricostruzione tomografica sono disponibili toolbox open source come PYRO-NN[35], TomoPy[36], CONRAD[37], ODL[38], ASTRA toolbox[39][40] e TIGRE[41].
TomoPy è una toolbox open source in Python progettata presso l'Argonne National Laboratory appositamente per l'elaborazione di dati tomografici e le operazioni di ricostruzione di immagini. TomoPy include diversi algoritmi di ricostruzione, che possono essere eseguiti su workstation multicore e strutture di calcolo di grandi dimensioni[42].
CONRAD è una toolbox open source specializzata nella tomografia a fascio conico. Offre una vasta gamma di funzionalità per l'acquisizione e l'elaborazione di immagini a raggi X, compresa la ricostruzione tomografica[37].
ODL (Operator Discretization Library) è una toolbox open source per l'apprendimento automatico, la ricostruzione tomografica e altre applicazioni di elaborazione delle immagini. Supporta diverse geometrie di acquisizione, algoritmi di ricostruzione e metodi di regolarizzazione[38].
TIGRE è una toolbox MATLAB sviluppata congiuntamente dall'Università di Bath e dal CERN per la ricostruzione di immagini CBCT. Offre una vasta gamma di algoritmi di ricostruzione e sfrutta l'accelerazione GPU per ridurre i tempi di calcolo[41].
ASTRA toolbox è una toolbox MATLAB e Python di primitive GPU ad alte prestazioni per la tomografia 2D e 3D, sviluppato dal 2009 al 2014 dal laboratorio di visione iMinds-Vision Lab dell'Università di Anversa e successivamente sviluppato congiuntamente da imec-VisionLab (ex iMinds-VisionLab) e CWI di Amsterdam. Questa toolbox supporta la tomografia parallela, a ventaglio e a fascio conico oltre a permettere un posizionamento altamente flessibile della sorgente e del rivelatore. Nel 2016, ASTRA è stato integrato nel framework TomoPy[43]. Questa integrazione ha permesso agli utenti di ASTRA di sfruttare le funzionalità di TomoPy per il filtraggio dei dati e la correzione degli artefatti, mentre ha permesso agli utenti di TomoPy di usufruire di un maggior numero di algoritmi di ricostruzione. Gli algoritmi di ricostruzione disponibili tramite l'integrazione tra TomoPy e ASTRA comprendono FBP, Gridrec, ART, SIRT, SART, BART, CGLS, PML, MLEM e OSEM[44].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.