Youtube-alkotók szerzői jogait sérthette az OpenAI

Több mint egymillió órányi Youtube videó szövegének átiratán tanította a híres ChatGPT alapját képező mesterséges intelligenciát az OpenAI, és a konkurens Google is hasonló módszert alkalmazott, ami szerzői jogi aggályokat vet fel.

Az OpenAI technikai vezetője, Greg Brockman irányítása alatt az OpenAI és a Google is felhasználta a Youtube videókat és podcastokat a mesterséges intelligencia fejlesztése során, ami valószínűleg sérti a videókat publikáló alkotók jogait. A Youtube, amely 2005 óta működik és 2006 óta a Google leányvállalata, szabályzatában tiltja a videók platformtól független felhasználását. A Google alkalmazottai tudtak az OpenAI általi felhasználásról, de mivel maguk is hasonlóan jártak el, nem firtatták a kérdést. Ezzel szemben a Google szóvivője, Matt Bryant azt állította, hogy nem voltak tudatában az engedély nélküli letöltéseknek, és a cég mindig megteszi a szükséges lépéseket ilyen esetekben. A New York Times perbe fogta az OpenAI-t, mivel úgy vélik, hogy a cég engedély nélkül használta fel cikkeiket, és ezáltal veszélyezteti az újság piacát és létezését. A lap nem kártérítést, hanem a GPT-4 törlését követeli.

A mesterséges intelligencia fejlesztésében a minél nagyobb adathalmazok megszerzése vált a fő célként, miután 2020-ban Jared Kaplan, a Johns Hopkins Egyetem elméleti fizikusa publikált egy tanulmányt, amely szerint a nyelvi modellek minél több adaton tanulnak, annál jobban teljesítenek. A GPT-3 betanításához már százmilliárd szavas adatbázist használtak, és a GPT-4 még ennél is erősebb lehet, bár az OpenAI nem közölt pontos adatokat. A mesterséges intelligenciák fejlesztése során a szakemberek által írt, szerkesztett és ellenőrzött könyvek mellett egyre több publikus tartalomra is szükség van, mivel a hatalmas adatigény kielégítése egyre nehezebbé válik.

A Google a felhasználási feltételek lazításával reagált a problémára, lehetővé téve a Google Docs és Google Maps tartalmak felhasználását. A Meta vezetése pedig a Simon&Schuster könyvkiadó felvásárlását fontolgatta, hogy szabadon használhassák a kiadó katalógusát. A szerzői jogok megsértésével kapcsolatos jogi kérdések azonban továbbra is vitatottak, és a Meta jogászai a Google és az Authors Guild közötti 2015-ös perre hivatkoztak, amelyben a Google Books szolgáltatást perelték meg. Az OpenAI szerint a Youtube videók felhasználása is a szabad felhasználás kategóriájába eshet.

Az OpenAI válasza a szintetikus adatok előállításában rejlik, amelyeket a mesterséges intelligencia maga termel. Sam Altman, az OpenAI vezérigazgatója szerint a szintetikus adatok eseményhorizontjáig kell eljutni, onnantól a modell már képes lesz jó minőségű szintetikus adatokat előállítani. Az Anthropic cég, ahol Jared Kaplan a vezető kutató, két mesterséges intelligenciát alkalmaz a szintetikus adatok előállítására és szűrésére, hogy megoldják a minőségi problémákat.

: (The New York Times, The Verge, The Wall Street Journal)