Az OpenAI bemutatja a forradalmi GPT-4o AI modellt

Az OpenAI bejelentette az új GPT-4o AI modelljét, amely képes valós idejű, hangalapú és szöveges interakciókra, valamint képi elemzésre is, és hamarosan mindenki számára ingyenesen hozzáférhetővé válik.

Az OpenAI, a népszerű ChatGPT mögött álló cég, leleplezte legújabb fejlesztését, a GPT-4o AI modellt, amely új szintre emeli a gépi interakciókat. A modell nemcsak hogy valós idejű válaszokat ad, de lehetőséget biztosít a felhasználóknak arra is, hogy megszakítsák a ChatGPT-t beszéd közben, így még természetesebbé téve a beszélgetést.

A GPT-4o AI modell bemutató videójában a ChatGPT angol és spanyol között fordít valós időben. A videóban látható, hogy a technológia már nem csak a szöveges, hanem a hangalapú interakciókban is képes teljesíteni. A bemutatóban két AI közötti beszélgetés is megfigyelhető, amely során a mesterséges intelligenciák éneklésbe is kezdenek.

Sam Altman, az OpenAI vezérigazgatója blogbejegyzésében hangsúlyozta az új modell jelentőségét, és összehasonlította azt a filmekből ismert mesterséges intelligenciával. Mira Murati, az OpenAI technológiai vezetője hozzátette, hogy a GPT-4o modell költséghatékonyabb lesz, mint a vállalat korábbi modelljei, és emiatt ingyenesen kínálják majd a felhasználóknak. A fizetős felhasználók azonban nagyobb kapacitáskorlátokkal rendelkeznek majd.

Az új GPT-4o modell, amely a vállalat előző, alig több mint egy éve bevezetett GPT-4 modelljének frissítése, a közelgő hetekben válik elérhetővé a ChatGPT szolgáltatásban, így a felhasználók hamarosan ki is próbálhatják a fejlett AI képességeit. A GPT-4o gyakorlatilag egy digitális személyi asszisztenst kínál, amely képes szöveges és képi interakcióra is, tehát a felhasználók által feltöltött képernyőképeket, fényképeket, dokumentumokat vagy grafikonokat is meg tudja tekinteni, és azokról beszélgetést folytatni.

Az új frissítés, a GPT-4 Omni, emberi hangon képes beszélni és nevetni, valamint érzelmi intonációkat is fel tud venni, így a felhasználók szóban is beszélgethetnek vele. A modell képes az érzelmek és a hang azonosítására a felhasználók beszédében, ami még inkább emberközelivé teszi az interakciót.

A GPT-4o egy olyan modell, amely képes szöveg, kép és hang egyidejű feldolgozására, így minden sokkal gyorsabban működik. Például egy matekfeladat megoldását befotózva szóban le tudja vezetni, hogy kell megoldani.

Az OpenAI kiadja a GPT-4o-t asztali alkalmazásként a macOS rendszerhez, amely már elérhető a fizetős felhasználók számára, és a jövőben az ingyenes felhasználók számára is elérhető lesz. Az asztali alkalmazás lehetővé teszi, hogy közvetlenül a számítógépéről indítson beszélgetést a ChatGPT-vel, és a képernyőmegosztást is támogatja. A ChatGPT webhelyét is frissítették a könnyebb átláthatóságért.

Az OpenAI munkatársai, Mark Chen és Barret Zoph többféle élethelyzetben is bemutatták a fejlesztést, például lefekvés előtti meséket mesélve, matematikai problémák megoldásában segítve. Bár voltak olyan esetek, amikor a modell nem értette meg a felhasználókat, összességében az Omni óriási előrelépésnek tűnik. Egy OpenAI munkatárs szerint a legújabb chatbot több mutatóban is felülmúlta a versenytársait, beleértve a piacvezető GPT-4 Turbót és a Claude 3 Opust is.

: Forrás: HVG Tech