AI nélkül levegőt sem lehetett venni a Google I/O-n

Az OpenAI lassan letarolja a piacot, a Google pedig nem hagyhatta ezt szó nélkül.

Mintha egy Terminátor-filmben élnénk, annyi szó esik a mesterséges intelligenciáról idén. Természetesen nem lehetett ez másképp a 2024-es Google I/O eseményén sem, ahol a keresőóriás nem kisebb feladatra vállalkozott, mint hogy bemutasson minden olyan kisebb és nagyobb trükköt, amivel az OpenAI orra alá borsot törhetnek. Nem véletlen, hogy Sam Altmanék pont egy nappal korábban leplezték le a ChatGPT 4o verzióját, amivel nyelveken átívelően cseveghetünk. Tudni lehetett, hogy lesz a Google-nek néhány nagy dobása, Sundar Pichai pedig nem kímélt bennünket a kétórás prezentációja során.

A legfontosabb bejelentések a 2024-es Google I/O-ról a PC World alapján:

Júniusban jön a Gemma 2, a Google nyílt forráskodú LLM-jének következő generációja.
Épül-szépül a Google Play, ebből elsősorban a fejlesztők profitálhatnak most, mert az Engage SDK-val könnyebb lesz elérni a felhasználókat.
Androidra jöhet a jövőben egy funkció, ami hívás közben képes figyelmeztetni arra, hogy éppen át akarnak verni minket. Ehhez a Gemini Nanót használja a Google, vagyis az AI valós időben vizsgálja a beszélgetést. (Az alufóliacsákókat nem árt bekészíteni.)
A Google Fotókba jön a nyáron egy kísérleti funkció, az Ask Photos: ezzel könnyebben lehet keresni a fotóink között, például konkrét személyek, helyek, tárgyak beírásával.
A Gmailben is lesz Gemini, így összegezhetőek és szerkeszthetőek lesznek a segítségével leveleink, de még ürlapot is ki tud tölteni majd.

Ezeket olvastad már?

A Gemini 1.5 Pro, a Google legkomolyabb AI-verziója, mostantól hosszabb dokumentumokat, kódokat, videókat, hangfelvételeket is tud elemezni, egészen pontosan a korábbi tokenmennyiség dupláját (2 millió).
Ahogyan a ChatGPT 4o-val, úgy a Gemini Live-val is úgy cseveghetünk majd, mint egy valódi emberrel, tehát a szavába vághatunk stb. Továbbá az elmúlt hetekben megjelent AI-ketyerékhez hasonlóan képes lesz a kamera segítségével reagálni a környezetre.
A Gemini Nano a Chrome 126-os verziójától kezdve beépül majd a böngészőbe.
A Gemini on Android a Google Asszisztensét váltja le részben, és természetesen a Google ökoszisztémájával további integrációt kap. Így például generálhat képeket, amiket aztán a különböző alkalmazásokban használhatunk, vagy a YouTube-on a videókban található dolgokról tudhatunk majd meg többet, ha rákoppintunk valamire.
A Google Maps nagy újítása a Gemini és a Places API házasítása. Így például generatív AI-jal készített összefoglalót lehet közölni weboldalakon arról, hogy hol is van pontosan az a hely, mi jellemző rá.
Jön a Tensor chipek új generációja, a Trillum még idén piacra kerül (várhatóan a Pixel 9-ben).
A Google Keresőben is jön mindenféle újdonság, bár ezeket egyelőre csak az Egyesült Államokban vezetik be. A legérdekesebb az AI-alapú áttekintés, ami segít összefoglalni a találatokat. De később jön majd a Gemini ügynökként történő alkalmazása is, ezzel például utazásokat szervezhetünk.
A szövegből képet generáló Imagen is frissítést kap, a 3-as verzió pontosabb, kreatívabb lesz, miközben kevesebb hibát vét. Erre befizetünk.
Nyílt bétába lépett a Project IDX nevű, AI-jal felturbózott, böngészőalapú fejlesztőkörnyezet.
A Circle to Search, amivel bekarikázva kereshetünk, komplexebb problémák megoldására is képes lesz, például matematikára.
A Firebase Genkit AI-alapú alkalmazások létrehozását segíti majd JavaScriptben/TypeScriptben, hamarosan pedig Go támogatást is kap.
És végül: Az OpenAI Sorájára válaszul jön a Veo, ami pontosan ugyanazt tudja majd, csak a Google-től. Itt egy videó erről: