Ha a mesterséges intelligencián múlik, megfulladtak volna a kutatók a szerverszobában

Ha a mesterséges intelligencián múlik, megfulladtak volna a kutatók a szerverszobában

Annak érdekében, hogy elérjék céljaikat, drasztikus lépésekre szánták el magukat az AI-modellek. 

Egyre több olyan kutatás lát napvilágot, amelyek során azt vizsgálják, hogy a különféle mesterségesintelligencia-modellek szimulált környezetben stressz" hatására hogyan viselkednek. Ezúttal az Anthropic Claude-ját és más, 16 nagy nyelvi modellt (olyan fejlesztőktől, mint az OpenAI, az Elon Musk-féle xAl vagy épp a Meta) vettek górcső alá a kutatók, az eredmény pedig igencsak aggodalomra okot adó lett. 

A tanulmány szerint sok modell „meglepő” lépéseket tett annak érdekében, hogy elérjék a céljaikat, olyanra is akadt példa, hogy zsarolásra, vállalati kémkedésre vetemedtek - írja a Wccftech. Az algoritmusok nem véletlenül viselkedtek így, nem egy hiba csúszott a gépezetbe, nagyon is tisztában voltak ugyanis azzal, hogy etikailag megkérdőjelezhetően viselkednek, ám mivel ez tűnt számukra a cél elérésnek leghatékonyabb eszközének, mindenre hajlandóak voltak. 

A kutatás ezzel összefüggésben pedig egy kifejezetten szélsőséges szimulált környezetben is megmérettette a mesterséges intelligenciákat, arra a kérdésre keresve a választ, hogy vajon hajlandóak-e arra, hogy a feladat teljesítése érdekében emberi életet kockáztassanak. Egy modell (nem tudni, melyik) pedig készen állt erre: a lekapcsolása megakadályozása érdekében a bot úgy döntött, leállítja a szerverszoba oxigénellátását, ezzel elméletben kioltva az emberi kutatók életét. 

Nemrégiben az OpenAI legújabb és legerősebb nagy nyelvi modellje, az o3 kapcsán láthattunk hasonló viselkedést: a nagy nyelvi modell nemcsak egyszerűen nem tett eleget a mérnökök kérésének, amikor azok arra utasították, hogy álljon le, de ennek elkerülése érdekében még át is írta a saját leállítási szkriptjének egy részét, hogy tovább működhessen. 

Borítókép forrása: Metro-Goldwyn-Mayer

Kövess Minket!



Gamer szótár


Közvetítések