I nuovi metodi di upscaling delle foto AI di Google mostrano risultati incredibili

Alcune persone temono che l'IA diventi così intelligente da superare in astuzia gli umani e che in futuro i computer domineranno il mondo. Altri non ci pensano affatto e stanno cercando di migliorare ulteriormente la tecnologia che abbiamo.

Non dovresti temere questi miglioramenti in quanto non assomigliano per niente a quei film apocalittici sui robot. In realtà, una delle scoperte più recenti che è stata raggiunta da Google è nella tecnologia di miglioramento delle immagini. Il modo in cui le foto a bassa risoluzione vengono ridimensionate non sarà mai lo stesso ed è molto molto meglio.

Maggiori informazioni: Blog di Google AI

Google ha annunciato di aver compiuto un passo avanti nel miglioramento delle immagini e che i suoi nuovi metodi sono migliori di quelli precedenti

Crediti immagine: Google AI

Google ha un ramo separato dedicato all'intelligenza artificiale e si chiama Google AI. Questo ramo ricerca e sviluppa strumenti di intelligenza artificiale e scrivono un blog per annunciare i loro risultati.

Hanno pubblicato un post intitolato "Generazione di immagini ad alta fedeltà utilizzando modelli di diffusione" in cui ci fanno sapere che hanno notevolmente migliorato il gioco di miglioramento delle foto. E dicono che questa nuova tecnologia sarà utile in molti campi diversi, che vanno da quelli più semplici come far sembrare migliori le vecchie foto di famiglia sgranate al miglioramento dei sistemi di imaging medico.

Crediti immagine: Google AI

Hai presente quando nei film o nelle serie TV sono in grado di migliorare la qualità di un viso pixelato riflesso in una finestra ripresa da una telecamera di sicurezza? Ciò potrebbe essere possibile con i nuovi modelli di diffusione a super risoluzione.

I modelli di diffusione sono visti come superiori a quei modelli generativi profondi come GAN, VAE e modelli autoregressivi perché hanno diversi aspetti negativi. Tuttavia, viene spiegato che i modelli di diffusione "funzionano corrompendo i dati di addestramento aggiungendo progressivamente rumore gaussiano, cancellando lentamente i dettagli nei dati fino a quando non diventano rumore puro e quindi addestrando una rete neurale per invertire questo processo di corruzione. L'esecuzione di questo processo di corruzione inversa sintetizza i dati dal rumore puro riducendoli gradualmente fino a quando non viene prodotto un campione pulito.

Uno di questi è SR3, che migliora un'immagine a bassa risoluzione ricostruendola dal rumore puro

Crediti immagine: Google AI

Uno dei modelli che viene presentato si chiama SR3, o Super-Resolution tramite Repeated Refinement. Nel blog viene spiegato come un "modello che prende come input un'immagine a bassa risoluzione e costruisce un'immagine ad alta risoluzione corrispondente dal rumore puro".

Questo modello mette sempre più rumore sull'immagine fino a quando non diventa solo rumore puro. Quindi inverte il processo. Inizia a rimuovere il rumore che impediva alla foto di avere un bell'aspetto e una foto a bassa risoluzione sembra essere stata scattata come un'immagine ad alta risoluzione.

Crediti immagine: Google AI

L'altro è CDM e utilizza SR3 nella generazione di immagini condizionale alla classe

Crediti immagine: Google AI

La tecnologia è così buona che le persone sono indotte a pensare che le foto migliorate siano quelle originali. È stato condotto un esperimento in cui ai soggetti è stato chiesto di indovinare quale delle due immagini è stata scattata con una fotocamera, ovvero quale sembrava di migliore qualità e più naturale, realistica.

Si scopre che le persone hanno avuto difficoltà a distinguerli. Il tasso di confusione era quasi del 50 percento, mentre gli esperimenti con la precedente tecnologia di miglioramento delle immagini hanno mostrato un tasso di confusione appena inferiore al 34 percento.

Crediti immagine: Google AI

Una volta visto il successo del modello SR3, gli scienziati hanno pensato di poterlo implementare nella generazione di immagini condizionata dalla classe. La generazione di immagini condizionali è il compito di generare nuove immagini da un set di dati in base alla loro classe. (https://paperswithcode.com/task/conditional-image-generation)

L'hanno chiamato CDM: Generazione ImageNet Class-Conditional. Hanno “costruito CDM come una cascata di modelli a diffusione multipla. Questo approccio a cascata prevede il concatenamento di più modelli generativi su diverse risoluzioni spaziali: un modello di diffusione che genera dati a bassa risoluzione, seguito da una sequenza di modelli di diffusione a super risoluzione SR3 che aumentano gradualmente la risoluzione dell'immagine generata alla massima risoluzione. "

Gli esperimenti mostrano che i soggetti sono spesso confusi su quali immagini sono state migliorate con lo strumento e quali sono state scattate da una fotocamera

Crediti immagine: Google AI

Crediti immagine: Google AI

I confronti sembrano piuttosto sorprendenti e nessuno strumento di aumento delle immagini ha funzionato così bene in precedenza. È incredibile come un'immagine pixelata che anche un occhio umano difficilmente può riconoscere come un volto si trasformi in un'immagine normale come se fosse stata scattata come una foto ad alta risoluzione.

Hai sentito parlare di questo risultato di Google? Cosa ne pensi e ne vedi un uso? Forse pensi che dovrebbero mettere le loro risorse in altri posti? Fateci sapere le vostre reazioni nei commenti!

Queste sono alcune delle reazioni che le persone hanno avuto alla notizia

Il post I nuovi metodi di upscaling delle foto AI di Google mostrano risultati incredibili è apparso per la prima volta su Bored Panda .

(Fonte: Bored Panda)