Európa vesztésre áll a mesterséges intelligencia területén, de nem adja fel a harcot

Miközben az amerikai technológiai óriásvállalatok tarolnak a mesterséges intelligencia fejlesztésében, Európa is észbe kapott, és görcsösen próbálja felvenni a harcot az amerikai konkurenciával. Az európai kormányok úgy érzik, hogy a technológiai harc elbukása nem csak súlyos gazdasági következményekkel járna, hanem negatív kulturális hatása is jelentős lenne.

Az európaiak saját mesterséges intelligencia chatbotjaik létrehozásán dolgoznak, hogy megakadályozzák, hogy az Egyesült Államokban gyártott technológia felfalja gazdaságukat, kultúrájukat és nyelvüket is. Madridtól Szófiáig az Európai Unió országai számos olyan kezdeményezést indítottak, amelyek célja olyan chatbotok létrehozása, amelyek valóban folyékonyan beszélik a helyi nyelveket.

A legújabb mesterséges intelligencia technológiát támogató eszközök, mint például a ChatGPT, a nagy nyelvi modelleken, vagyis az LLM-en (large language model) alapulnak. Ezek olyan szisztémák, amelyek kísértetiesen emberszerű beszélgetésre képesek, ugyanis olyan mesterséges intelligencia rendszerről beszélünk, amit hatalmas mennyiségű szöveges adaton – például könyveken, weboldalak tartalmán – tanítottak be, és képes nyelvi feladatokat, például szövegértést, generálást vagy fordítást végrehajtani.

A 24 hivatalos nyelvvel rendelkező Európai Unió rájött arra, hogy mekkora lemaradásban állnak az Egyesült Államokkal szemben a mesterséges intelligenciában, így most arra törekszik, hogy a fellendülő és a mindennapokban egyre nagyobb szerephez jutó technológia a saját kulturális tartalmaival és anomáliáival gazdagodjon és működjön.

Bruno Le Maire francia gazdasági miniszter egy februári cannes-i technológiai rendezvényen kijelentette: "Mark Twainnak nem szabad kitörölnie Stendhalt". Hozzátette: "Nem akarunk megelégedni csak az angol nyelvvel. Továbbmenve, nem akarjuk, hogy nyelvünket gyengítsék az algoritmusok és az AI-rendszerek".

Az Egyesült Államok vezeti a jelenlegi innovációs hullámot az OpenAI, a Google Gemini modellje, az Anthropic, a Meta és Elon Musk xAI-ja révén, amelyek mind versenyben vannak a vezető modellek megépítésében.

Az amerikai ipar sebessége megrémisztette az európai kormányokat, ugyanis attól félnek, hogy megismétlődik az amerikai cégek dominanciája, akárcsak annak idején a közösségi média és a Web 2.0 korában. A Politico kutatása szerint csak az elmúlt egy évben 13 európai ország jelentett be konkrét eredményeket, vagy tett lépéseket a saját nyelvére összpontosító helyi modellek kidolgozása érdekében. Többek között Svédország, Dánia, Finnország, Németország, Franciaország és Görögország állt elő konkrétumokkal, miközben Románia, Lengyelország és Olaszország több más ország társaságában még fejleszti a saját modelljének kialakítását. Magyarország azon kisebbség táborát erősíti, ahol jelenleg nincs folyamatban semmilyen ilyen jellegű fejlesztés.

A meglévő vagy fejlesztés alatt álló projektek többsége nyílt forráskódú, hogy az önkéntes fejlesztők hatalmas közösségére támaszkodva pótolják az Egyesült Államokkal szembeni számítástechnikai és finanszírozási hiányosságokat. Ennek köszönhetően remény nyílt egy élénk helyi mesterséges intelligencia-gazdaság létrehozására.

Egyes országok, például Spanyolország esetében a saját nyelvű modellek segíthetnek növelni befolyásukat a világ kulturálisan és történelmileg összefüggő részein. Madrid, amely egy spanyolul beszélő LLM létrehozását finanszírozza a mesterséges intelligencia képzéséhez kiváló minőségű spanyol tartalom alapján, a feltörekvő technológiát a spanyol nyelvű amerikai országokkal való szorosabb együttműködés területeként tekinti.

Az eset Franciaországban is megkongatta a vészharangot. Cannes-i beszédében Le Maire egy árszabályozott, európai egységes piac létrehozását javasolta a „tanítási adatok” számára, hogy megakadályozza, hogy az amerikai technológiai óriáscégek túllicitálják az európai mesterséges intelligencia-cégeket az értékes tartalom utolsó töredékéhez való hozzáférésért. Franciaország élen járt az Alt-EDIC létrehozásában is, amely egy 12 országból álló EU-konzorcium, amely a blokkon belüli együttműködéssel foglalkozik az LLM-ek európai nyelveken történő fejlesztésével.

Hiába küzdenek azonban az európai országok az angol nyelv térhódítása ellen a mesterséges intelligenciában, ironikus módon ahhoz, hogy valóban versenyképesek lehessenek, az európai LLM-ek továbbra is folyékonyan kell beszélniük az angol nyelvet. Sebastian Ruder, a kanadai székhelyű, többnyelvű, mesterséges intelligencia vállalat, a Cohere kutatója szerint a tanítási adatok mennyiségét és minőségét tekintve erőkiegyensúlyozatlanság mutatkozik: "nézzük csak meg, mekkora az angol Wikipédia a más nyelvű verzióihoz képest".

Egyes USA-ban gyártott LLM-ek az angolon kívül más nyelveken is beszélnek, de nem mindig rendelkeznek a helyi felhasználók megfelelő kiszolgálásához szükséges jártassággal és árnyalati, jelentésbeli nüanszokkal. Ruder szerint a mesterséges intelligenciát meg kell tanítani az udvarias francia „vous” (ön) és az informális „tu” (te) vévmások között különbséget tenni, hogy elkerüljék az idős francia felhasználók megsértését. A University College London kutatóinak 2023. augusztusi „kulturális igazodási” értékelése megállapította, hogy az OpenAI és a Google LLM-modelljei többek között Kínában, Szaúd-Arábiában és Szlovákiában sem felelnek meg a kulturális normáknak.

Kris Shrishak, az Irish Council for Civil Liberties technológiai munkatársa szerint egy amerikai technológiai vállalat megtaníthatja modelljét például litván nyelven, de ez veszteséges, tehát általában angolul tanította, majd elvégzi a finomhangolást. Ruder szerint a megoldás az, ha az európai mesterséges intelligencia-fejlesztők a saját nyelvükön és angolul is betanítják botjaikat, így az LLM anyanyelvén beszélve hozzáférhet az angol kódolású tudáshoz.