Valósághű képekké alakítja a szavakat az Nvidia legújabb találmánya

Egyre csodálatosabb, mellette picit ijesztőbb is, hová fejlődik a cég által fejlesztett mesterséges intelligencia.

Szépen lassan eljutunk arra a pontra, amikor már az ember a saját szemének sem hisz, mikor épp meglátja, mi mindenre képes már többek között az Nvidia deep-learning technológiája is. A cég ugyanis nemcsak a videokártya-iparban szeretne az élen járni, mellette kitűzőtt céljuk még, hogy az emberek minél nagyszerűbb dolgokat tudjanak készíteni, akár egyszerűen is.

Pontosan erre képes a GuaGAN, amelynek első változata még néhány évvel ezelőtt jelent meg, és vele alap ikonokból, formákból tudtunk néhány kattintással képeket készíteni. Most viszont elkészült a GuaGan2, ezzel pedig kis túlzással semmire sincs szükség ahhoz, hogy akár igen részletes tájképeket is tudj csinálni.

A model ugyanis úgy működik, hogy a szöveget alapítja át akár komplexnek tűnő képekre. A cég elmondása szerint körülbelül 10 millió, valódi fotóval tesztelték a rendszert, úgyhogy úgy néz ki, tudja az algoritmus, hogy mit csinál. Az alábbi videón meg is tekintheted néhány példán keresztül, hogyan működik:

A rendszer gyakorlatilag a GuaGAN továbbjelesztett változata: gyorsan összedobott rajzokból, formákból készül egy kép, azt pedig egy beírt szöveggel még jobban tudjuk módosítani. Röviden: rajzzal és szavakkal tudunk képeket csinálni. Ha te is ki szeretnéd próbálni a GuaGAN2-t, úgy az Nvidia oldalán, egy interaktív demón keresztül megteheted, ahol még egy tutorial is segít eligazodni.

OSZD MEG VELÜNK A VÉLEMÉNYED HOZZÁSZÓLÁSBAN! KÖVESS MINKET FACEBOOKON IS!