A különféle nagy nyelvi modellek annyira sajátos stílussal generálnak szöveget, hogy csak emberi utószerkesztők tudják helyretenni.
A Slator cikke hívta fel a figyelmet a Johns Hopkins Egyetem kutatói által végzett friss tanulmányra, amely érdekes jelenséget írt le. Az elemzésből kiderült, hogy a nagy nyelvi modellek (NYM-ek vagy LLM-ek), mint például a GPT-4, a ChatGPT és a Llama-2, sajátos stílusjegyekkel rendelkeznek, amelyek akkor is megjelennek az általuk generált szövegekben, ha különböző stílusok utánzására kérik őket. Ez azt jelenti, hogy ezek a modellek következetesen a saját "hangjukon" írnak, még akkor is, ha az eredeti szerző vagy a fordító egyedi stílusát kellene tükrözniük.
A fordítók számára ez nem újdonság, mivel munkájuk során gyakran szükséges az eredeti szerző hangnemének és stílusának pontos visszaadása, vagy alkalmazkodás specifikus stílusirányelvekhez. A kutatás szerint a fordítóknak egyedi és személyes stílusuk van, amely nem csupán nyelvi preferenciákat tükröz, hanem következetességet mutat a hangnem, a megfogalmazás és a kulturális árnyalatok kezelésében is. Ez a stílusbeli identitás formálja szakmai profiljukat és egyedivé teszi őket.
Azonban az LLM-ekkel ellentétben az emberi fordítók képesek elnyomni saját stílusukat, amikor az eredeti szerző hangja központi szerepet játszik – például irodalmi művek esetében –, vagy amikor semleges hangnem szükséges, mint például technikai dokumentumoknál. Ezzel szemben az LLM-ek ma még nehezen alkalmazkodnak ehhez az elváráshoz. A tanulmány rámutat, hogy mindegyik vizsgált LLM szövege etért stílusában az emberi szerzők és más LLM-ek stílusától.
Ez azt jelenti, hogy a finomhangolás ellenére az LLM-ek saját stílusjegyeiket viszik a szövegbe, még akkor is, ha az a feladatuk, hogy egy szerző hangját utánozzák vagy igazodjanak egy szerző stílusához.
A nyelvi iparban régóta vita tárgya, hogy mennyi utószerkesztés szükséges ahhoz, hogy a gépi fordítások megfeleljenek a minőségi követelményeknek. Az LLM-ek stílusjegyei tovább bonyolíthatják ezt a folyamatot. A fordítók nemcsak a nyelvi pontatlanságokkal találhatják szembe magukat, hanem az MI által generált szöveg és a kívánt eredmény közötti stílusbeli eltéréseket is azonosítaniuk (és kezelniük) kell.
A tanulmány kiemeli, hogy az írás stílusa legtöbbször csak akkor válik azonosíthatóvá, ha nagyobb terjedelmet figyelünk meg. Ezek szerint egyrészt ez nem egyszerű feladat, másrészt igen munkaigényes lehet az emberek számára. A fordítók és utószerkesztők számára a “nagyobb terjedelem” mindig azt jelenti, hogy több lesz a munka vele, különösen azokban az esetekben, ahol a stílushűség fontos.
A tanulmányban alkalmazott módszer alapja, hogy a gépi tanulás segítségével az algoritmus megtanulja felismerni azokat a stílusjegyeket, amelyek az emberi írásra jellemzőek.
Egy újságcikk, amelyet mesterséges intelligencia generált, így kezdődhet:
"Az éghajlatváltozás súlyos problémákat okoz világszerte."
Ez egy pontos, de általános megfogalmazás, amelyből hiányoznak az emberi szerzőre jellemző szubjektív vagy kreatív elemek. Egy emberi író például ezt írhatná:
"Amikor múlt héten megérkeztem az Alpokba, szembesültem az olvadó gleccserek látványával. Felkavart a látvány, hiszen most láttam először a saját szememmel, amit korábban csak hírekben hallottam."
Az algoritmus ezeket a különbségeket érzékeli, és megállapítja, hogy az első szöveg valószínűleg mesterséges, míg a második emberi eredetű.
Ahogy az LLM-ek egyre inkább beépülnek a munkafolyamatokba, a fordítóknak és a nyelvi szolgáltatóknak több időt kell fordítaniuk a stílusbeli igazításokra, ami tovább bonyolítja a gépi támogatású folyamatokat. Emellett a minőségértékelési szabványoknak is fejlődniük kell, hogy a stílushűséget is figyelembe vegyék a hagyományos mérőszámok, mint a pontosság és a gördülékenység mellett.
A több munka persze nem feltétlen rossz hír a nyelvi szakembereknek, hiszen az utóbbi időben főképp arról hallottunk, hogy a mesterséges intelligencia elviszi a megrendelőket. Lehet, hogy a tanulmány felismerése egy időre visszahozza az emberi munkára való igényt a fordítóiparhoz.
Forrás: www.fordit.hu
Nyelveink:
magyar, angol, német, orosz, francia, portugál, spanyol, svéd, olasz, cseh, holland, román, szerb, bolgár, horvát, szlovák, lengyel, szlovén, arab, héber, török, albán, ukrán, görög, bosnyák, dán, finn, litván, lett, észt, örmény, flamand, belorusz, máltai, ír, japán, thai, kínai, koreai, vietnámi nyelvek fordítása
1x1 Fordítóiroda
www.1x1forditoiroda.hu
1DayTranslation
www.1DayTranslation.com
Telefon: 06 70 33 24 905
Email: info@1x1forditoiroda.hu
Skype: onebyonetranslation