Titokzatos mesterséges intelligencia kísért az interneten

Az OpenAI új GPT-je bukkanhatott fel névtelenül a vadonban, de az a különös helyzet, hogy okos ugyan, de a várt új generációtól elmarad a tudása. A cég hallgat.

Egy titokzatos csevegőroboton kezdett pörögni a szakértő közönség múlt héten, miután egy „gpt2-chatbot” nevű program jelent meg az LMSYS robotarénájában. A robotaréna egy online felület, ahol a nagy nyelvi modellek összemérhetik az erejüket. A felhasználók itt egy kérdésre két választ kapnak, amelyek közül kiválaszthatják, hogy melyiket találják jobbnak, vagy akár két győztest és két vesztest is hirdethetnek. A válaszadás után derül ki, hogy melyik választ mely modell adta, és a felhasználók döntései alapján a rendszer egy ranglistát állít fel.

A ranglistát a cikk írásakor az OpenAI GPT-4-Turbója vezette, de dobogós helyen volt az Anthropic által készített Claude 3 Opus és a Google-féle Gemini 1.5 Pro. Az LMSYS, amely az arénát üzemelteti, a Berkeley Egyetemen működő, nyílt forrású, nyelvi modelleket fejlesztő szervezet. A titokzatos gpt2 név minden bizonnyal biccentés az OpenAI 2019 februárjában bemutatott GPT-2 modelljének, amely a kortárs GPT-modellek korai előfutára volt.

Az izgalom rögtön fellángolt, hogy a rejtélyes csevegő talán az OpenAI várva várt új modellje, a GPT-5 nyilvános tesztje, esetleg egy átmeneti GPT-4.5 lehet. Sam Altman, az OpenAI vezérigazgatója korábban kifejtette, hogy a mai irtó erős GPT-4-re nemsokára úgy fogunk emlékezni, hogy gyenge volt. Az Ars Technica kérdésére azonban csak annyit válaszolt, hogy a GPT-2 mindig is a szíve csücske volt, és az OpenAI nem kívánta kommentálni a történetet.

A hirtelen feltámadt érdeklődés nyomán a csevegő robotot túl sokan kezdték tesztelni, ezért ahogy jött, el is tűnt. Később újra felbukkant „egy-jó-gpt2-vagyok” és „én-szintén-egy-jó-gpt2-vagyok” neveken, amit Altman is megosztott az X-en. Ezek a chatbotok az LMSYS Chatbot Arena (battle) oldalról hívhatók elő különleges parancsokkal, ami arra utalhat, hogy vagy egy konkurencia kontrázott, vagy az OpenAI tesztel egy másik terméket.

A megfigyelők szerint bár a történtek körül mindenfelé felfedezhetők az OpenAI nyomai, szinte biztos, hogy nem a GPT-5 tesztjét látjuk. Matt Shumer, a HyperWrite vezérigazgatója szerint a gpt2 csevegőrobot jó, nagyon jó, de ha ez a gpt-4.5, az nagy csalódás. Ethan Mollick, a Pennsylvania Egyetem munkatársa szerint az új robot képességei egy a GPT-4 szintjének megfelelőek, ugyanakkor sokkal ügyesebb nehéz matematikai kérdések megoldásában és ASCII-artok rajzolásában.

Az LMSYS aréna szabályzata megengedi a készülő nyelvi modellek anonim tesztelését, ezeket a ranglistán sem szerepeltetik. A szakértők szerint az eset ebben a formában leginkább az aréna népszerűsítésére volt jó, de arra, hogy a mesterséges intelligencia területe megbízhatónak vagy átláthatónak tűnjön, semmiképp.

A Bloomberg értesülései szerint az OpenAI egy olyan új funkción dolgozik, amellyel a ChatGPT képes lesz böngészni az interneten, és így keresőként is működhet majd a jövőben. Ez a fejlesztés lehetővé teszi, hogy a felhasználók kérdéseikre weben talált válaszokat kapjanak forrásmegjelöléssel, és akár képeket is csatolhatnak a válaszokhoz. A keresőként való működés a mesterséges intelligenciák egyik legígéretesebb felhasználási területének tűnik, és az OpenAI ezzel akár a Google-el is felveheti a versenyt. A search.chatgpt.com weboldal már létezik, bár egyelőre csak egy "nem található" felirat fogadja a látogatókat.