Két adott nyelv közötti fordítás – különösen, ha egyik sem angol – jelentős kihívásnak bizonyult a mesterséges intelligencia nyelvi modelljei számára, mert e fordítórendszerek alapvetően az internetről származó írott adatokra támaszkodnak. Szuperkönnyű a fordítás a nagy nyelvek esetén, sokkal nehezebb, ha minőségi tartalmat keresel valamelyik egzotikus nyelven.
A Facebook, amely tavaly október óta Meta néven ismert, hat hónappal ezelőtt elindította ambiciózus No Language Left Behind (NLLB) projektjét, amelynek célja, hogy a mesterséges intelligencia segítségével zökkenőmentesen fordítson számos nyelv között anélkül, hogy a szöveget először angolra kellene átültetni.
Azaz egy magyar szöveget az angol közbeiktatása nélkül alakítana át például izlandira. A cég első nagy sikere az NLLB-200 névre keresztelt mesterségesintelligencia-modell, amely elvileg kétszáz nyelven tud beszélni, köztük számos kevésbé széles körben beszélten Ázsiából és Afrikából, például laoszi és kamba nyelven.
A cég szerint az NLLB-200 egyebek mellett 55 afrikai nyelvet fordít le kiváló minőségben. A Meta fejlesztői azzal büszkélkednek, hogy a modell teljesítménye átlagosan 44 százalékkal, a kiválasztott afrikai és indiai dialektusok esetében pedig hetven százalékkal felülmúlja a meglévő (nyelvátültető) csúcsmodelleket.