Az új Google Kereső mellett fejlődik a Gemini Flash, valamint megjelenik egy Gemini Omni nevű modell is, amivel bármiből videót készíthetünk.
A Google az idei I/O fejlesztői konferenciájának nyitónapján, tegnap mutatta be a legújabb mesterséges intelligencia modelljeit. Ezek között a legérdekesebb a Gemini 3.5 család, valamint az új Gemini Omni rendszer. A vállalat szerint ezek az AI-megoldások jelentős előrelépést hoznak a multimodális tartalomkészítés és az intelligens asszisztensi funkciók terén, de vegyük át röviden, hogy mit is jelentett be a cég.
A Gemini 3.5 első elérhető modellje a Gemini 3.5 Flash, amely már most használható a Gemini alkalmazásban, valamint a Google Kereső AI módjában. A fejlesztők szerint ez „olyan intelligenciát hoz ez a model több szinten is, mint a legnagyobb riválisok, miközben a Flash sorozat sebességére képes.” A Gemini 3.5 Flash különösen erős a programozási és úgynevezett agentikus feladatokban, vagyis azokban a műveletekben, ahol az AI önállóbb döntéshozatalra képes.
A vállalat emellett bemutatta a jóval látványosabb, izgalmasabb Gemini Omni rendszert is, amely bármilyen típusú bemenetből – például szövegből, képből, hangból vagy videóból – képes videót generálni. Az első modell, a Gemini Omni Flash egyelőre még nem kínálja mindezt, csupán videók utólagos szerkesztésére ad lehetőséget beszélgetésalapú vezérléssel, miközben a rendszer megőrzi az eredeti jelenet folytonosságát. A végeredmény viszont már most is mutatós, mégha a régebb óta ezen a piacon lévő modelleket nem is söpri le a pályáról azonnal.
A Google szerint az Omni fejlettebb fizikai szimulációs képességekkel rendelkezik, így reálisabban kezeli például a gravitációt, a mozgást vagy a folyadékdinamikát. A felhasználók saját hangjukat és digitális avatárjukat is használhatják a videók készítéséhez. Az AI által generált tartalmak minden esetben SynthID digitális vízjellel lesznek ellátva, ez garantálja, hogy ne keverjék össze a nézők a valódi felvételeket a mesterséges intelligenciával gyártott vagy módosított videókkal.
A Gemini Omni Flash már elérhető a Google AI Plus, Pro és Ultra előfizetői számára a Gemini appban és a Google Flow részeként, valamint fokozatosan megjelenik a YouTube Shorts és a YouTube Create platformokon is a tartalomgyártók részére.
Borítókép: depositphotos.com / IgorVetushko