La super-risoluzione secondo Google: incrementa la risoluzione delle immagini come nessun altro. Guardate!

Usando una coppia di tecniche di intelligenza artificiale il team di Google è riuscito a realizzare un metodo capace di incrementare fino a 8 volte la risoluzione di un immagine con risultati mai visti prima
di Andrea Bai pubblicata il 31 Agosto 2021, alle 14:01 nel canale Scienza e tecnologiaFilm e serie TV a tema poliziesco vedono spesso situazioni in cui, durante le indagini, il team scientifico riesce ad estrarre informazioni nascoste da fotografie a bassa risoluzione che vengono "magicamente" ingrandite senza perdita di dettaglio, anzi l'opposto. Ora, tutti gli appassionati di tecnologia ben sanno che ciò non è semplicemente fattibile: non è mai possibile aggiungere informazione dove non c'è, si può solo cercare di rendere più visibile l'informazione già presente.
Attualmente i programmi di elaborazione di foto e immagini dispongono di svariati metodi ed algoritmi di upscaling, in grado cioè di aumentare la risoluzione dell'immagine senza che la qualità ne risulti particolarmente compromessa. Ma l'asticella potrebbe essere spostata ancora più in alto grazie al nuovo metodo di Google che promette risultati incredibili con nuovi sbocchi nel campo della super-risoluzione, le cui applicazioni sono varie e spaziano dalla restaurazione e ripristino di vecchie fotografie fino al miglioramento dei sistemi di diagnostica per immagini.

Si tratta di una coppia di tecnologie AI che può acquisire un'immagine a bassa risoluzione e ne aumenta consecutivamente la risoluzione tramite una tecnica di distruzione e ricostruzione selettiva. Il primo componente di questa coppia tecnologia si chiama Super-Resolution via Repeated Refinements (SR3), un particolare modello che dato come input un'immagine a bassa risoluzione, ricostruisce un'immagine ad alta risoluzione corrispondente dal rumore puro.
Questo modello va di fatto ad operare una "corruzione" dei dati di addestramento aggiungendo progressivamente rumore gaussiano, cancellando lentamente i dettagli fino a quando l'immagine non diventa composta da rumore puro. Da qui si parte ad addestrare una rete neurale per invertire il processo di corruzione. Questo processo inverso va a sintetizzare i dati dal rumore puro, eliminandolo gradualmente fino a quando non viene prodotto un campione privo di rumore.

Il secondo componente è Cascaded Diffusion Models (CDM) che applica in maniera intelligente il rumore gaussiano e la sfocatura all'immagine di output prima di ripetere nuovamente il processo. Questa tecnica, che Google chiama "conditioning augmentation" riesce a migliorare la qualità dell'immagine ad un livello superiore rispetto agli attuali metodi di upscaling basati su AI e accreditati dei migliori risultati, tra cui BigGAN-Deep e VQ-VAE-2.
Secondo quanto riferisce Google questa nuova tecnologia è in grado di offrire ottimi risultati per immagini di volti e di elementi naturali quando il ridimensionamento è di quattro o otto volte superiore all'immagine originale. Ma l'aspetto interessante è che i modelli a super-risoluzione possono essere concatenati per incrementare ulteriormente le capacità di upscaling: un modello per il passaggio da 64x64 a 256x256 e uno per il passaggio da 256x256 a 1024x1024.
28 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoL'importante è che qualche genio non si aspetti di poter estrarre un volto o un numero di targa da una foto sgranata......
Guardate la foto del tram: nell'immagine 32x32 a malapena si vede il blu del logo, in quella 256x256 manca poco che si legga il nome dell'azienda in giallo.... ma da dove è spuntato il giallo?
O si tratta delle immagini utilizzate per addestrare la rete neurale, oppure mi sfugge qualcosa.....
Mi ricorda un po' l'algoritmo a compressione infinita, dove per quanto compresso, riusciva sempre a comprimere in piu' un bit. Il trucco era che nascondeva il bit nel filename... ;-)
Mi ricorda un po' l'algoritmo a compressione infinita, dove per quanto compresso, riusciva sempre a comprimere in piu' un bit. Il trucco era che nascondeva il bit nel filename... ;-)
In sostanza fà quello che vedi nella gif del tram, in sostanza lui fà un upscaling progressivio man mano aggiungendo cose che secondo lui mancano e che dovrebbero esserci, ovviamente senza IA addestrata non sarebbe possibile.
https://cascaded-diffusion.github.i...d_diffusion.pdf
voglio vedere cosa esce da questa
Link ad immagine (click per visualizzarla)
I denti ci sono, ma sono sgranati. Con una rete neurale particolarmente addestrata è possibile avere un'immagine simile sgranata e poi andare all'indietro tornando all'immagine con più risoluzione. Ovviamente il risultato non potrà mai essere perfetto, dato che ci sono più combinazioni possibili a partire da un'immagine con bassa risoluzione, ma in moltissimi casi va bene così.
Se riusciranno in questo, avete presente solo nei rendering che rivoluzione di sarebbe! Anche solo renderizzare in HD e fare un upscaling in 4K sarebbero milioni di ore di rendering salvate.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".