Loading AI tools
algoritmo di deep learning basato sull'inversione del processo di diffusione del rumore Da Wikipedia, l'enciclopedia libera
Nell'apprendimento automatico, i modelli di diffusione, noti anche come modelli probabilistici di diffusione, sono una classe di modelli di variabili latenti. Essenzialmente sono catene di Markov allenate tramite inferenza variazionale.[1] L'obiettivo dei modelli di diffusione è imparare la struttura latente di un insieme di dati modellando il modo in cui i dati puntuali si diffondono attraverso lo spazio latente. Nella visione artificiale, questo si traduce nell'allenare una rete neurale a eliminare il rumore da immagini offuscate utilizzando rumore gaussiano imparando a invertire il processo di diffusione.[2][3]
I modelli di diffusione sono stati introdotti nel 2015 sulla base di concetti dell'ambito della termodinamica del non equilibrio.[4]
I Modelli di diffusione possono essere impiegati per molteplici scopi, che includono l'eliminazione del rumore nelle immagini, la pittura, la super-risoluzione e la generazione automatica di immagini. Ad esempio, un modello di generazione di immagini può partire da una immagine con rumore casuale e, dopo essere stato allenato invertendo il processo di diffusione su immagini naturali, esso diventa capace di generare nuove immagini naturali. Tra le più note applicazioni di tali modelli di trasformazione da testo a immagini rientra Dall-e di OpenAI. Esso utilizza modelli di diffusione sia per il modello a priori (che produce un'immagine data una didascalia) sia per il decoder che genera l'immagine finale.[5]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.