Root NationVijestiIT vijestiKao u filmovima: Googleova nova umjetna inteligencija za obradu fotografija čini njihovo skaliranje i poboljšanje stvarnošću

Kao u filmovima: Googleova nova umjetna inteligencija za obradu fotografija čini njihovo skaliranje i poboljšanje stvarnošću

-

Vjerojatno ste gledali fantastične filmove ili TV emisije u kojima glavni lik traži da se poveća slika i poboljša rezultat - da se pokaže lice, ili registarska tablica, ili bilo koji drugi ključni detalj. Najnoviji Googleovi sustavi umjetne inteligencije (AI), temeljeni na tzv difuzijski modeli, mogu izvesti ovaj trik.

To je zahtjevan proces za svladavanje jer je to u biti dodavanje detalja slici koju kamera izvorno nije snimila, korištenjem super-pametnih pogađanja na temelju drugih, sličnih slika.

Google

U Googleu se ova tehnika naziva prirodnom sintezom slike, au ovom scenariju ultravisoka rezolucija slike. Počinjete s malom, pikseliziranom fotografijom i završavate s nečim oštrim, jasnim i prirodnim. Možda nije baš original, ali je dovoljno blizu da izgleda stvarno ljudskom oku.

Google je predstavio dva nova AI alata za ovaj posao. Prvi se zove SR3 ili Super-Resolution via Repeated Refinement, a radi tako da slici dodaje šum i zatim ga uklanja. Kroz niz proračuna vjerojatnosti koji se temelje na velikoj bazi podataka slika i malo magije strojnog učenja, SR3 može zamisliti kako izgleda verzija slike u pikselima niske rezolucije u super visokoj rezoluciji.

Drugi alat je CDM ili Cascaded Diffusion Models. Google ih opisuje kao "cjevovode" duž kojih se difuzijski modeli – uključujući SR3 – mogu usmjeravati za povećanje kvalitete slike. Potrebno je poboljšati modele i pretvoriti ih u veće slike.

Google

Korištenjem različitih modela poboljšanja u različitim rezolucijama, CDM pristup može nadmašiti alternativne metode povećanja slike, prema Googleu. Novi AI mehanizam testiran je na ImageNetu, ogromnoj bazi podataka slika za obuku koja se obično koristi za istraživanje vizualnog prepoznavanja objekata.

Krajnji rezultati SR3 i CDM su impresivni. U standardnom testu s 50 ljudskih dobrovoljaca, slike ljudskih lica koje je generirao SR3 pogrešno su smatrane pravim fotografijama u oko 50% slučajeva – a s obzirom na to da bi idealan algoritam trebao postići 50%, to je impresivno. Vrijedno je ponoviti da ove poboljšane slike nisu točna podudaranja s originalima, one su pažljivo izračunate simulacije temeljene na matematici vjerojatnosti.

Google

Google obećava mnogo više od svojih novih AI motora i povezanih tehnologija – ne samo u smislu povećanja slika lica i drugih prirodnih objekata, već iu drugim područjima probabilističkog modeliranja.

Pročitajte također:

Prijavite se
Obavijesti o
gost

0 Komentari
Ugrađene recenzije
Pogledaj sve komentare