FordításA gépi fordítás minősége audiovizuális kontextusban [Machine translation quality in an audiovisual context]
Absztrakt
Az audiovizuális fordítások mennyisége egyre növekszik, így próbálva lépést tartani azzal a növekvő igénnyel, hogy manapság az adatoknak a világ minden pontján elérhetővé kell válniuk. A gépi fordítás (machine translation, MT) az egyik leginnovatívabb, a fordítás területén alkalmazandó technológia, de még túl korai megjósolni, hogyan tudja majd ez a technológia segíteni a hivatásos fordítók kreativitását és produktivitását a jövőben. Jelenleg a gépi fordítás használata a nem audiovizuális szövegek fordítása esetében elterjedtebbnek mutatkozik, mint az audiovizuális fordítás esetében. A jelen cikkben ismertetjük a gépi fordítás technológiáját, és szemléltetjük, hogy az audiovizuális fordításban való használata miért jelent kifejezetten nagy kihívást. Emellett bemutatunk néhány potenciálisan hasznos, a gépi fordítás minőségének mérésére használható módszert és eszközt, amelyeket eredetileg szövegfordítások értékelésére fejlesztettek ki. A végső cél, hogy áthidaljuk a szakadékot a technológiában jártas audiovizuális fordítók közössége és a jó minőségű gépi fordítással foglalkozó kutatók és fejlesztők között.
Kulcsszavak:
1.Bevezetés
A 21. században az audiovizuális fordítás alapvető szükségletté vált. A különböző médiatrendek, mint például a VHS vagy a lézerlemez, jöttek és mentek, a fordítási eszközök pedig fokozatosan fejlődtek az írógéptől kezdve egészen a teljeskörűen integrált, valós idejű webalapú fordítói környezetekig. Világunk egyre kisebbé válik, míg az információigény a világ minden pontján egyre nő. Ennek következtében drámaian növekszik az az adatmennyiség is, amelynek a világ legtöbb régiójában és nyelvén elérhetőnek kell lennie: minden percben 300 órányi videóanyag kerül fel a YouTube felületére.11. https://www.youtube.com/yt/press/en/statistics.html Még ha azt feltételezzük is, hogy ezeknek a tartalmaknak csak egy része lehet érdekes egy nagyobb, globális közönség számára, hatalmas kihívást jelent az erőfeszítés, hogy ezen tartalmak számos nyelven elérhetővé váljanak. Ezt a tényt azok a kutatószervezetek és kormányok is felismerték és elismerték, amelyek támogatták az automatikus audiovizuális fordítást is magukban foglaló korai projekteket. Ilyen projektek például a MUSA22. http://sifnos.ilsp.gr/musa/index.html és az eTITLE,33. http://www.upf.edu/glicom/en/proyectos/proyectos_finalizados/e_title.html amelyek esetében fordítómemóriával kombinált szabályalapú gépi fordítórendszereket használtak, hogy megvizsgálják, vajon lehetséges-e audiovizuális fordításhoz használni ezeket az eszközöket; a SUMAT,44. http://cordis.europa.eu/fp7/ict/language-technologies/project-sumat_en.html amelynek keretében statisztikai gépi fordítómotorokat tanítottak be hét nyelvpárban készült kétirányú feliratok segítségével, valamint alapos értékelést végeztek a gépi fordítás eredményének minőségéről; az EU-Bridge,55. https://www.eu-bridge.eu/ amely a gépi fordítással kombinált automatikus beszédfelismerés jelenleg legkorszerűbb technológiájának továbbfejlesztésére koncentrált azzal a céllal, hogy ezt a technológiát számos területen alkalmazni lehessen, többek között az audiovizuális fordítás területén is; a HBB4ALL,66. http://www.hbb4all.eu/ amely ugyan elsősorban a hozzáférhetőség kutatására koncentrált, de vizsgálódott az automatikus interlingvális feliratok befogadásáról is; valamint az ALST,77. http://ddd.uab.cat/record/137941?ln=en egy olyan projekt, amelynek az volt a célja, hogy létező automatikus beszédfelismerést, beszédszintézist és gépi fordítási technológiákat alkalmazzon a hangos leírásban és hangalámondásban, és amelynek része volt a hangalámondáshoz gépi fordítással és utószerkesztéssel készült szövegkönyvek minőségének értékelése is.
Az új technológiák megjelenése jelentős hatással volt a szöveges tartalmak fordítására. A szakfordításban a nyelvi konzisztencia biztosítását és a fordítási folyamat korszerűsítését tekintve nélkülözhetetlenné váltak a fordítómemória-rendszerek és az integrált terminológiakezelők. Az automatikus (vagy gépi) fordítási technológia az egyik legújabb fejlesztés a fordítás területén belül, de még túl korán van ahhoz, hogy meg lehessen állapítani, vajon ez a technológia hogyan és milyen mértékben tudja majd segíteni a hivatásos fordítók kreativitását és produktivitását a jövőben. Mindemellett a gépi fordítás használata elterjedtebb a nem audiovizuális szövegek fordítása során, mint az audiovizuális fordítás esetében, ahol egyelőre még ritkán alkalmazzák.
A gépi fordítás kimenete általában alapos utószerkesztést igényel, hogy közzétételre alkalmas legyen. A minősége olyan tényezőkön múlik, mint a nyelvpár, a tárgykör és a műfaj, valamint a lefordítandó szövegeknek és azoknak az anyagoknak a hasonlósága, amelyekre optimalizálták a gépet. Az Európai Bizottság által finanszírozott, és a gépi fordítás kimenetének javítására irányuló kutatások hosszú múltra tekintenek vissza. Ezen a területen a legújabb kutatási projektek közé tartozik például a QTLaunchPad,88. http://www.qt21.eu/launchpad/ a QTLeap99. http://qtleap.eu/ és a QT21,1010. http://www.qt21.eu/ valamint a fordítóipart is bevonó olyan alkalmazott kutatási projektek, mint például az MMT.1111. http://www.modernmt.eu/
A gépi fordítás használata egyre népszerűbb a szöveg-összefoglaló (csak információkat tartalmazó) fordítás esetében, az olyan ingyenes online rendszereken keresztül, mint például a Google Fordító vagy a Bing Translator. A Google egymaga körülbelül annyi tartalmat fordít le automatikusan egy nap alatt, mint amennyit az összes hivatásos fordító egy év alatt, és havonta több mint 200 millió ember használja.1212. http://googleblog.blogspot.de/2012/04/breaking-down-language-barriersix-years.html
Ez a fordítástípus nemcsak a felhasználóknak jelent segítséget az internetes információkeresésben, hanem a hírszerző szolgálatoknak és más szerveknek is, amelyeknek meg kell határozniuk, mely dokumentumok lehetnek relevánsak, és milyen szövegek kívánnak jobb minőségű fordítást. Mivel a szöveg-összefoglaló fordítás célja más, mint a publikálásra szánt jó minőségű fordításé, az előbbihez kialakított gépi fordítórendszerek valójában nem igazán alkalmasak a hivatásos fordítók támogatására az utóbbi típus esetében (habár manapság a fordítók igenis használják ezeket a rendszereket, gyakran a forrás feltüntetése nélkül).
A jelen tanulmány célja kettős. Először a gépi fordítás technológiájáról lesz szó, és arról, hogy a gépi fordítómotorok audiovizuális fordítás területén történő alkalmazása miért jelent kifejezetten nagy kihívást. Ezt követően bemutatunk néhány, a gépi fordítás minőségének mérésére használt (szövegfordításokhoz kifejlesztett) módszert és eszközt, amelyek hasznosak lehetnek az audiovizuális fordítók közössége számára. A végső célunk az, hogy áthidaljuk a szakadékot két világ között: az audiovizuális fordítók közössége és a jó minőségű gépi fordítással foglalkozó kutatók és fejlesztők világa között. A szorosabb együttműködés e két csoport között elősegítheti az újítást és a fejlődést az MT-technológiák alkalmazása terén, végül egyre több multimodális tartalomhoz biztosítva hozzáférést a lehető legtöbb nyelven.
A második fejezetben részletes áttekintést nyújtunk a gépi fordítórendszerek technikai komponenseiről, ami segítségére lehet az olvasónak, amikor a harmadik fejezetben a gépi fordítás audiovizuális fordításban való használatának korlátait és lehetőségeit fejtjük ki. A negyedik fejezet a gépi fordítás minőségének felméréséhez használt eszközök és technikák áttekintését tartalmazza. Az ötödik fejezet végül egy rövid összefoglalóval zárja a tanulmányt.
2.Háttér: a statisztikai gépi fordítás dióhéjban
A fejezet nagyon röviden bemutatja a gépi fordítórendszerek technikai komponenseit, alapot biztosítva a későbbi fejezetekben foglaltakhoz. A statisztikai gépi fordítórendszerek (statistical machine translation system, SMT), mint például a Google Fordító, a Microsoft Translator és a nyílt forráskódú Moses rendszerek a leggyakrabban használt eszközök a gépi fordítás terén.1313.A szabályalapú gépi fordítórendszerek, mint például a SYSTRAN és a Lucy LT, nem játszanak jelentős szerepet az audiovizuális tartalmak fordításánál. Ezek a rendszerek komplex algoritmusokat használnak, amelyek megtanulják, hogyan lehet karakterláncokat átvinni egyik nyelvről a másikra párhuzamos kétnyelvű szövegekből származó valószínűségek használatával. Az ilyen rendszerek alapvető komponensei a következők:
-
Kifejezéstár: egy adatbázis, amely célnyelvi szavakat és kifejezéseket tartalmaz, továbbá a valószínűségét, hogy ezek megfelelnek-e forrásnyelvi szavaknak vagy kifejezéseknek.
-
Átrendezési modell: a szavak különböző sorrendjeinek valószínűségeit tartalmazza a két érintett nyelven.
-
Egynyelvű nyelvmodell: szósorozatokhoz (n-gramok) tartalmaz valószínűségeket a célnyelven.
A statisztikai valószínűségeket a rendszer automatikusan tanulja meg, a terjedelmes, forrásnyelvi mondatokat és azok célnyelvi (ember által készített) fordítását tartalmazó párhuzamos korpuszok elemzésén keresztül. Egyszerűen fogalmazva, ezeket a valószínűségeket a kétnyelvű/egynyelvű szavak és kifejezések relatív gyakoriságaként lehet értelmezni az adott szövegekben, ahol a kifejezések egyszerű szócsoportokként vannak meghatározva a nyelvi szempontok figyelembevétele nélkül. Lényegében a komponensek megtanulják, hogy az általuk látott szavak hogyan lettek lefordítva, hogyan különbözött a forrás- és a célnyelv szórendje ezekben a fordításokban, és hogy valószínűleg mely szavak fognak egymás mellé kerülni a célnyelvben.
Általános szabály, hogy minél több tanítóanyag áll rendelkezésre, annál jobb lesz a fordítás eredménye. Minél több a hasonlóság (tárgykör, mondatszerkezet, szöveghossz stb.) a tanítóanyag és a lefordítandó szövegek között, annál jobb lesz a fordítás minősége. Tíz-húszezer tanítómondat néhány alkalmazás, szövegtípus és nyelvpár esetében jó eredményeket hozhat, míg mások esetében sokkal több anyagra lehet szükség, hogy az eredmény használható legyen.
Ebben a statisztikai fordítási paradigmában a komponensek komplex összjátéka által olyan fordítások születnek, amelyek első pillantásra olykor nehezen érthetők lehetnek, ahogyan az alábbi 1 példában is látszik, ahol a német kérdőmondat polaritása megfordult:
Forrás: Was stimmt? [Mi igaz?]
Online gépi fordítórendszer: What is wrong? [Mi baj?]
Nehéz nyomon követni, miért hoznak létre egy bizonyos fordítást a gépi fordító algoritmusok. A fenti példánál a legvalószínűbb ok, hogy a stimmt szó fordítási valószínűségét tévesen befolyásolta a tagadó stimmt nicht szóösszetétel gyakoribb előfordulása a tanítóadatokban. Ebben az esetben puszta véletlen, hogy míg a fenti fordítás önmagában ellentétes jelentést hordoz, bizonyos szövegkörnyezetekben szemantikailag mégis elfogadható lehet. Továbbá az is lehetséges, hogy ez a bizonyos fordítás előfordult a tanítóadatok között.
Általános tévhit, amikor antropomorfként tekintünk a statisztikai fordítórendszerekre, és olyan megállapításokat teszünk, hogy például a rendszer „nem látta”, miszerint X többes számban van, vagy a gép „elhibázott” egy beágyazott mondatot. Ezeknek a rendszereknek (a legegyszerűbb, leggyakoribb formájukban) nincs valódi nyelvi intelligenciájuk: nem „tudják” például, mi az a szófaj vagy a tagadás.
Míg az alapelveket könnyen el lehet magyarázni, maguk a statisztikai gépi fordítórendszerek rendkívül bonyolultak mind a matematikai és az algoritmikus komplexitás, mind pedig a számítási teljesítmény és a szükséges adatforrások tekintetében. A statisztikai gépi fordítás területe aktív kutatási terület, számos újabb módszert vizsgálnak, hogy fejlesszék a jelenlegi technológiát, például a rendszerek nyelvi és szemantikai tudással történő gazdagításával vagy a matematikai modellek javításával.
2.1A gépi fordítási minőség felmérésének nehézsége
A gépi fordítórendszereket gyakran összekeverik a fordítómemória-rendszerekkel. Bizonyos értelemben a gépi fordítás tekinthető a fordítómemória-technológia kibővítésének. Azonban míg a fordítómemóriák csak létező, ember által már korábban megalkotott fordításokat tudnak előhívni, a gépi fordítás képes ezen fordítások alapján rugalmasan új fordításokat is létrehozni.
A gépi fordítás egyik nagy hátránya az a tény, hogy nehéz felmérni egy adott gépi fordítás használhatóságát vagy a célnak való megfelelőségét. Következésképpen az utószerkesztők gyakran olyan MT-kimenetekkel találkoznak, amelyek nem használhatók, ez pedig csökkenti a produktivitást és a hatékonyságot. A helyzet orvoslására jelenleg fejlesztés alatt áll egy minőségbecslésként ismert kutatási módszer, amelynek célja az MT-kimenet minőségének felmérése (lásd 4. fejezet).
Érdekes megjegyezni, hogy az audiovizuális fordítók rendelkezésére álló viszonylag magas szintű technológiai támogatás (például speciális feliratozószoftverek és a szinkronok forgatókönyveinek előkészítésére és felvételére létrehozott szoftverek) ellenére maga a fordítás művelete meglehetősen kevés támogatást kap ezen a téren. Az audiovizuális fordítók nem használnak rutinszerűen fordítómemóriákat, bár a szövegfordításban elterjedt a használatuk.
2.2Miben a legjobb a gépi fordítás és miért?
Más technológiákhoz hasonlóan a gépi fordítás is a használattal javul. Ha a munkafolyamatok jól vannak beállítva, a gépi fordítási javaslatok hivatásos fordítók általi kiválasztása vagy elvetése, valamint a fordítás utószerkesztése visszajelzésként szolgál a rendszer folyamatos fejlődéséhez és javulásához.
A gépi fordítás különösen jól működik olyan esetekben, ahol a forrás- és célnyelv meglehetősen hasonlít egymásra többek között a szerkezet, morfológia, fogalmak tekintetében. Például egy, a spanyol és portugál nyelv között fordító rendszer kifejlesztése általánosságban könnyebb, és jobb minőségű fordítást fog létrehozni, mint egy szuahéli nyelvről japánra fordító gépi rendszer. Egy másik döntő tényező, hogy rendelkezésre állnak-e nagy mennyiségben párhuzamos kétnyelvű szövegek, amelyek például a tárgykör vagy szövegtípus tekintetében elég hasonlók a lefordítandó anyaghoz, hogy a gépi rendszerek kinyerhessék belőlük az összes lényeges információt.
A gépi fordítómotor jellegéből adódóan nagyobb eséllyel képes feldolgozni olyan nyelvtani és mondattani jelenségeket, amelyek kis távolságra vannak egymástól a mondaton belül (például a főnév és ige egyeztetése az angolban), mint azokat a jelenségeket, amelyek távolabb vannak egymástól, mint például a német igei csoportok, amelyek alkotóelemei között akár egész tagmondatok is lehetnek. Hasonlóképpen azok a jelenségek, amelyek fordításához extralingvális ismeretekre, például társalgási és világismeretre van szükség (ilyenek például a kétértelmű névmások) meghaladják a technológia jelenlegi állását.
Érdekes módon azonban a gépi fordítással készülő audiovizuális fordítás eredményén általában nem javít a kisebb távolság, mivel a beszélt nyelvi szövegek gyakran kontextus- és inferencia-függők, valamint számos rövidített és hiányos mondat, kifejezés szerepel bennük, ahogyan ezt az alábbi 2 példa is mutatja:
Audiovizuális átirat: Your mother’s house? [Anyád háza?]
Gépi fordítórendszer (német): Ihrer Mutter Haus? [Anyád háza?]
Teljes mondat: Are we meeting at your mother’s house? [Anyád házánál találkozunk?]
Gépi fordítórendszer (német): Treffen wir uns im Haus Ihrer Mutter? [Találkozzunk az anyád házában?]
Habár egyik német gépi fordítás sem tökéletes, a rövid audiovizuális átirat alapján készült fordítás érthetetlen, míg a több szóval megfogalmazott eredeti mondat fordítása viszonylag jól átadja a mondat értelmét. Hasonló eredmény látható a következő 3 példában is:
Audiovizuális átirat: Wieder ein Wochenende vorbei. [Egy újabb eltelt hétvége.]
Gépi fordítórendszer: Again a weekend pass. [Ismét egy hétvége múlik.]
Teljes mondat: Das Wochenende ist wieder vorbei. [Ismét vége a hétvégének.]
Gépi fordítórendszer: The weekend is over again [Ismét vége a hétvégének.]
3.A feliratok automatikus fordítását érintő problémák
Az audiovizuális fordítás számos egyedi kihívás elé állítja a gépi fordítást.1414.A jelen tanulmányban a feliratok fordítására fogunk koncentrálni. Nem foglalkozunk a szövegtömörítés kérdésével. Habár léteznek automatikus szövegösszefoglaló és rövidítő technikák, úgy gondoljuk, hogy túl korai lenne még ezekről értekezni. A legtöbb gépi fordítórendszer fejlesztése olyan terjedelmes adatbázisok felhasználásával történik, amelyek lefordított, nyelvtanilag helyes, megfelelő központozással, helyesírással – többek között helyes nagybetű használattal – ellátott írott szövegeket tartalmaznak (szemben az eredetileg beszélt szövegekkel). Emellett a gépi fordítást leggyakrabban szakszövegek esetében használják, ahol a szókincs és a szöveg felépítése meglehetősen kiszámítható és gyakran korlátozott.
Ezzel szemben a feliratok és a szinkronforgatókönyvek fordítási módja az audiovizuális fordítás jellegéből adódóan a szóban elhangzott párbeszédek írásos megjelenítésével foglalkozik, és olyan jellemzői vannak, amelyek megnehezítik a géppel való fordítását. (Megjegyzendő azonban, hogy a szinkronforgatókönyvek „beszédre íródtak” ennek a jelenségnek Chaume az „előregyártott szóbeliség” megnevezést adta [2004Chaume, Frederic 2004 Cine y traducción. Madrid: Cátedra.]). Ez a helyzet egy sor új kihívást teremt a gépi fordítás számára. A harmadik fejezetben szemléltetünk néhány ilyen kihívást a jövőbeli szisztematikusabb vizsgálatok kiindulópontjaként.
Ha a szöveget fordító gépi fordítómotor hagyományos írott szöveggel lett betanítva, a beszélt szövegben előforduló jellemzők esetleg nem pontosan jelennek meg a tanítóadatokban, ezért a fordítómotornak nem fognak rendelkezésére állni olyan releváns példák, amelyekből pontos fordítást tudna létrehozni. Ezért a gépi fordítás minősége szempontjából fontos, hogy az a rendszer, amelyet audiovizuális anyagoknál kívánnak alkalmazni, audiovizuális szövegek használatával legyen betanítva. Ezzel kapcsolatban problémaként merül fel az efféle korpuszok megszerzésének viszonylagos nehézsége, főként a kevesebb forrással rendelkező nyelvpárok esetében (Bywood et al. 2013Bywood, Lindsay, Martin Volk, Mark Fishel, and Panayota Georgakopoulou 2013 “Parallel Subtitle Corpora and their Applications in Machine Translation and Translatology.” In Corpus Linguistics and AVT: in Search of an Integrated Approach, special issue of Perspectives: Studies in Translatology 21 (4): 1–16.).
3.1Tárgykör és műfaj
A gépi fordítás audiovizuális fordításban történő alkalmazása során az audiovizuális fordítás „nyitott” tárgyköre jelenti az egyik problémát, abban az értelemben, hogy az audiovizuális tartalmak a témák lehető legszélesebb körét érintik, a nagyon egzakt és a szókincs tekintetében kihívást jelentő szakdokumentumfilmektől kezdve a hírességekről szóló bulvárhírekig. Ennek eredményeképpen gyakran még a bőséges tartalom sem elegendő a kiszámíthatóság megfelelő felbecsléséhez, mivel a tartalom minden szinten következetlen, beleértve a nyelvtant, a szerkezetet és a szókészletet is.
3.2A vizuális kontextus hiánya
A megfelelő audiovizuális fordításhoz szükség van a vizuális kontextus ismeretére, amelybe a forrásszöveg be van ágyazva (Díaz Cintas és Remael 2007Díaz-Cintas, Jorge, and Aline Remael 2007 Audiovisual Translation, Subtitling. Manchester: St. Jerome., 51), ehhez az információhoz egy gépi fordítórendszernek nincsen hozzáférése. A probléma illusztrálására egyszerű példaként szolgál az angol hello szó olasz nyelvű fordítása. A legtöbb esetben a szó fordítása a ciao olasz megfelelővel történne, például üdvözletként egy informális találkozás alkalmával, míg egy telefonos üdvözlés esetében a pronto volna a helyes fordítás. Ebben a példában a köszöntést megelőző megnyilvánulás adhat ugyan némi kontextusbeli utalást az adott jelenetről, azonban még gyerekcipőben jár az a gépi fordítási technológia, amely efféle mondatok közötti kontextuális jelzéseket használ fel a fordításhoz. A negyedik példa szintén egy, a SUMAT-projektből, ezúttal svéd feliratokból származik:
Forrás: The reactions I got in the market stalls with the fishermen. [A reakciók, amelyeket a halászok piaci bódéjánál kaptam.]
Fordítás: Reaktioner på marknaden toaletter med fiskarna.
Visszafordítás: Reactions on the market toilets with the fishermen. [Reakciók a piaci vécéken a halászokkal.]
A 4 példában a rendszer a stall szót hibásan a toilet megfelelővel fordította le a kontextus hiányában, amely a hivatásos fordító számára viszont elérhető.
3.3Szóbeli stílus
Ahogyan azt már sokan leírták (pl. Rubin 1978), a beszélt nyelv és az írott szöveg sokban különbözik egymástól. Például a beszélt nyelv sokkal nagyobb százalékban tartalmaz nyelvtanilag hiányos mondatokat, sokkal inkább támaszkodik a valóságos fizikai kontextusra (például egy főnévre való utaláskor az az névmás használata), és általánosságban informálisabb. Ezen felül a beszélt szöveg szókincse (általában) abban is különbözik az írott szövegétől, hogy a szleng és a köznyelvi beszéd mellett sokkal gyakoribb a verbális diskurzusjelölők használata is (például tudod, aha vagy igaz?), amelyek nem gyakran fordulnak elő írott szövegekben. Vegyük példaként az alábbi mondatot 5, amelyet egy online gépi fordítórendszer ültetett át a célnyelvre:
Forrás: Was für’n Mädel? [Milyen lány?]
Gépi fordítórendszer: What for’s girl? [Mi a lány?]
Ha az összevont névmást visszaállítjuk a teljes nyelvtani alakjába, ahogyan az a lenti 6 példában látható, akkor az online gépi fordítórendszer olyan fordítást állít elő, amely, habár nem helyes, könnyedén utószerkeszthető, hogy a határozatlan névelő egyszerű eltávolításával a felirat hibátlanná váljon.
Forrás: Was für ein Mädel? [Milyen lány?]
Gépi fordítórendszer: What a girl? [Milyen egy lány? (helyes: Milyen lány?)]
Hasonló a helyzet a köznyelvi szófordulatokkal is, ahogyan a következő 7 példában látható:
Forrás: Guy seemed high as a kite every time I met him. [Guy úgy nézett ki, mintha be lenne tépve, minden alkalommal, amikor találkoztunk.]
Gépi fordítórendszer: Guy schien hoch wie ein Drachen, jedesmal wenn ich ihn traf. [Guy úgy nézett ki, mintha magasan lenne, mint egy repülősárkány (gyerekjáték), minden alkalommal, amikor találkoztunk.]
Emberi fordítás: Jedes Mal, wenn ich ihn traf, schien er voll zugedröhnt gewesen zu sein. [Mindig, amikor találkoztam vele, úgy nézett ki, mint aki teljesen be van tépve.]
A fenti problémára megoldást jelenthet egy feliratokból összeállított korpusz alkalmazása, és ezáltal számos olyan megakadásjelenség, köznyelvi szófordulat és szóbeli jellemző rögzítése, amelyek problematikusnak bizonyulhatnak az általános írott szövegekkel betanított gépi fordítórendszerek számára. Ilyen korpuszok egyelőre nem érhetők el széles körben, amikor viszont rendelkezésre állnak, a felhasználásukkal betanított rendszerek ígéretesnek tűnnek, ahogyan ezt a SUMAT-projektből vett alábbi 8 példa is mutatja:
Forrás: I’ll have a go. [Megpróbálom.]
Gépi fordítórendszer (SUMAT): Je vais essayer. [Megpróbálom.]
Online gépi fordítórendszer: Je vais avoir un aller. [Lesz egy menetem.]
A statisztikai gépi fordítórendszer valójában jól használható ezeknek a problémáknak a kezelésére, amennyiben elegendő tanítóadat áll rendelkezésre.
3.4A kontextus hiánya
Az előző ponthoz szorosan kapcsolódik az a megfigyelés, miszerint a beszélt nyelvi szövegek általában rövidebb szegmensekből állnak. Ez a tény önmagában még nem jelent problémát (a rövidebb szegmenshossz általában egyet jelent a jobb fordítási minőséggel), ugyanakkor a kimondott szegmensek nagyobb valószínűséggel támaszkodnak a kontextusra, amely egyetlen szegmensen belül nem feltétlenül értelmezhető. Mivel a gépi fordítómotorok többnyire nem tekintenek túl egy-egy szegmensen, ez a fontos kontextus nem lesz elérhető számukra. Vegyük például a következő élőbeszédszerű szöveget a 9 példában:
Forrás: You’re asking about the accident? Well, there was a man on 42nd Street. Down by the bridge. Big fellow. He saw it. [A baleset érdekli? Hát, volt egy férfi a 42. utcán. Lent a hídnál. Nagydarab fickó. Ő látta.]
Online gépi fordítórendszer: Sie sind über den Unfall zu fragen? Nun, es war ein Mann auf der 42. Straße. Down by die Brücke. Big Kollegen. Er sah es. [A balesetről fog kérdezni? Volt egy ember a 42. utcán. Down by (lefordítatlan) a híd. Big (lefordítatlan) kolléga. Ő látta.]
A szóbeli példa utolsó mondatában szereplő it névmáshoz nem szerepel kontextus az adott szegmensen belül, és a rendszer így a semleges nemű es használatával fordítja le a helyes ihn vagy den hímnemű alak helyett. Az ilyen eredmények gyakoriak, amikor egy szó fordítása olyan kontextustól függ, amely a fordítandó szótól akár többmondatnyira is lehet. Hasonló okokból a rendszer szintén részlegesen a Big Kollegen [Big kolléga] megfelelővel fordítja a Big fellow [Nagydarab fickó] szókapcsolatot, amely megoldás azt sugallhatja, hogy a szóban forgó egyének munkatársak, bár a kontextus világossá teszi, hogy a beszélő nem ismeri a másikat. Megfelelőbb lenne például a großer Kerl [nagydarab fickó] fordítás. Ezzel szemben a fenti megszólalás írott formában valahogyan így nézne ki:
Forrás: There was a big man on 42nd street by the bridge who saw the accident. [A híd melletti 42. utcában egy nagydarab férfi látta a balesetet.]
Online gépi fordítórendszer: Es war ein großer Mann auf der 42. Straße an der Brücke, die den Unfall gesehen. [Volt egy nagydarab ember a 42. utcán a hídon, aki látott a balesetet.]
Habár a 10 példában más problémák tűnnek fel – például a férfira való utalásnál a nőnemű die vonatkozó névmás használata a hímnemű der helyett, valamint egy hiányzó főige a vonatkozó mellékmondatban (csupán a gesehen szerepel a hat gesehen helyett) –, általánosságban jobban értelmezhető, mint a 9 példa.
Hasonlóképpen az angol you személyes névmás fordítható a német Sie (formális), du (informális egyes szám), ihr (informális többes szám) vagy a man (személytelen névmás) megfelelővel is, és a választás gyakran a makroszintű kontextustól függ (például annak az ismeretétől, hogy ki kivel beszél), amely nem könnyen következtethető ki egyszerűen csak a forrásszöveg alapján. Ezt láthatjuk a következő 11 példában is, ahol a német sie névmás megfelelője lehet ő és ők is, és a gépi fordítórendszer a rossz megoldást választja (habár ebben a mondatban a hat ige egyértelművé teszi, melyik jelentés a helyes):
Forrás: Denn sie hat dich auf die Idee gebracht. [Mert ő adta neked az ötletet.]
Gépi fordítórendszer: For they gave you the idea. [Mert ők adták neked az ötletet.]
Emberi fordítás: Because she put you up to it. [Mert ő vett rá téged.]
4.A gépi fordítás minőségének felmérése
A fordított szöveggel szemben támasztott alapvető követelmény, hogy megfeleljen a céljának, vagyis eleget kell tennie az érintett felek által meghatározott célkitűzéseknek. A felhasználók által generált tartalmak esetében az elvárások szintje sokkal alacsonyabb, mint a televíziós műsorok vagy a DVD-kiadások esetében. Ahogyan a szövegek világában, ilyenkor is fontos tisztázni, mit is jelent az „elfogadható minőség” az egyes esetekben. A fordítás minőségének egy bizonyos célra történő felméréséhez használt eljárások, eszközök és metrikák (amennyiben egyáltalán megtörténik a felmérés) a feladat kívánt eredményétől és a feladat végrehajtójától függően eltérhetnek.
4.1Minőségértékelés a gépi fordítás kutatásában
A kutatásokban a gépi fordítás minőségének értékelése csaknem mindig hivatásos fordítóktól és utószerkesztőktől különböző módokon kapott visszajelzéseken alapul. A jelenleg leggyakrabban alkalmazott értékelési formák a következők:
-
Az MT-kimenet automatikus értékelése az MT-kimenet és (professzionális) emberi referenciafordítások algoritmusokkal történő összehasonlítása alapján (pl. Papineni et al. 2002Papineni, Kishore, Salim Roukos, Todd Ward, and Wei-Jing Zhu 2002 “BLEU: A Method for Automatic Evaluation of Machine Translation.” In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, 311–318. http://dl.acm.org/citation.cfm?id=1073083&picked=prox. Accessed December 22, 2015.; Banerjee és Lavie 2005Banerjee, Satanjeev, and Alon Lavie 2005 “METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments.” In Proceedings of the ACL Workshop on Intrinsic and Extrinsic Evaluation Measures for Machine Translation and/or Summarization, ed. by Jade Goldstein, Alon Lavie, Chin-Yew Lin, and Clare Voss, 65–72. Michigan, MI: University of Michigan.). Ez a módszer gyors és megismételhető, valamint a korábbi eredmények felhasználásával képes az automatikus metrikák általi fejlődésre.
-
Az MT-kimenet automatikus értékelése emberi referenciafordítások nélkül, közismert nevén minőségbecslés (pl. Shah et al. 2013). Ennél a módszernél egy (emberek által készített fordításokon alapuló) betanított rendszerre van szükség, a minőségbecslő metrikák fejlesztéséhez pedig hivatásos fordítók által (korábbi alternatív fordításokhoz) készített rangsorolásokat és pontozásokat használnak.
-
A különböző rendszerekből származó MT-kimenetek rangsorolása emberi értékelők által. A rangsorolást például a természetesnyelv-feldolgozás (natural language processing, NLP) kutatói végzik a Workshop of Statistical Machine Translation (WMT) verseny néhány megosztott feladata során.1515. http://www.statmt.org/wmt15/ Avramidis és munkatársai (2012)Avramidis, Eleftherios, Aljoscha Burchardt, Christian, Federmann, Maja Popovićs, Cindy Tscherwinka, and David Vilar 2012 “Involving Language Professionals in the Evaluation of Machine Translation.” In Proceedings of LREC 2012, 1127–1130. http://www.lrec-conf.org/proceedings/lrec2012/index.html. Accessed December 12, 2015. egy olyan kutatásról számolnak be, ahol hivatásos fordítók végezték a rangsorolást. Ez a módszer információt nyújt az egyes rendszerek vagy rendszerváltozatok relatív teljesítményéről.
-
Az MT-kimenet utószerkesztése emberi értékelők által. Az utószerkesztést például az NLP kutatói végzik a WMT verseny néhány megosztott feladata során. Avramidis és munkatársai (2012)Avramidis, Eleftherios, Aljoscha Burchardt, Christian, Federmann, Maja Popovićs, Cindy Tscherwinka, and David Vilar 2012 “Involving Language Professionals in the Evaluation of Machine Translation.” In Proceedings of LREC 2012, 1127–1130. http://www.lrec-conf.org/proceedings/lrec2012/index.html. Accessed December 12, 2015. olyan tanulmányról számolnak be, ahol hivatásos fordítók végezték az utószerkesztést. Ezzel a módszerrel az utószerkesztés hatékonyságának különböző aspektusait lehet felmérni (idő, szerkesztések száma stb.), a megszerzett adatokat pedig feldolgozzák, többek között annak vizsgálatára, milyen típusú szerkesztések fordulnak elő leggyakrabban (pl. szórend, morfológia, beszúrás stb.).
-
Az MT-kimenet hibáinak annotációja emberi értékelők által (lásd pl. Vilar et al. 2006, ahol az annotációt az NLP kutatói végzik; Lommel és munkatársai 2014Lommel, Arle, Aljoscha Burchardt, and Hans Uszkoreit 2014 “Multidimensional Quality Metrics (MQM): A Framework for Declaring and Describing Translation Quality Metrics.” In Tradumàtica: tecnologies de la traducció 0 (12): 455–463.-es tanulmányában az annotációt hivatásos fordítók végezték.) Ezzel a módszerrel részletes hibaanalízis készíthető az MT-kimenetről, beleértve a pontosságot és gördülékenységet érintő specifikus hibákat is, a szórendet és a távolságot érintő problémák mellett. A kapott információ azután felhasználható a gépi fordítórendszerek fejlesztésére.
Mindezeket a módszereket a feliratozáshoz használt gépi fordítás esetében alkalmazták, és alkalmazzák továbbra is. Ahogyan korábban kifejtettük, nem feltétlenül könnyű audiovizuális anyagokat tartalmazó párhuzamos korpuszokhoz hozzájutni. Problémák merülnek fel a feliratok és a szinkronforgatókönyvek tulajdonjogával kapcsolatban, ami megnehezíti egy bármilyen méretű minőségi korpusz összeállítását, a cégek pedig vonakodnak anyagokat megosztani a kutatókkal. Ezért a gépi fordítás referenciafordítások használatával történő kiértékelése kihívást jelenthet. A SUMAT-projektben sikeresen alkalmazták a minőségbecslés módszerét, ahol előzőleg már annotált feliratokat használtak a rendszer betanítására, hogy az elkülönítse és kiselejtezze a rossz minőségű feliratokat; az utószerkesztőknek ehelyett csupán egy „FILT” szöveget tartalmazó mappát bocsátva rendelkezésükre (Etchegoyhen et al. 2014Etchegoyhen, Thierry, Lindsay Bywood, Mark Fishel, Panayota Georgakopoulou, Jie Jiang, Gerard van Loenhout, Arantza del Pozo, Mirjam Sepesy Maucec, Anja Turner, and Martin Volk 2014 “Machine Translation for Subtitling: A Large-Scale Evaluation.” In Proceedings of LREC 2014, 46–53. http://www.lrec-conf.org/proceedings/lrec2014/index.html. Accessed December 22, 2015.). Ebben a projektben a fentiekben ismertetett többi értékelési forma használatára is sor került, megvalósítva a feliratozáshoz alkalmazott gépi fordítás eddigi legkiterjedtebb értékelését. Azonban az audiovizuális fordítás esetében szembe kell nézni azzal a speciális problémával, hogy kevés olyan utószerkesztő akad, aki betáplálandó anyagot tudna szolgáltatni a szóban forgó metrikákhoz. Mivel a gépi fordítást nem használják gyakran az audiovizuális fordításhoz, hiány van olyan képzett utószerkesztőkből, akik audiovizuális szövegekkel tudnak dolgozni, habár képzési programok már fel-felbukkannak a láthatáron, és egy kutatás (De Sousa et al. 2011De Sousa, Sheila C. M., Wilker Aziz, and Lucia Specia 2011 “Assessing the Post-Editing Effort for Automatic and Semi-Automatic Translations of DVD Subtitles.” In Proceedings of the International Conference on Recent Advances in Natural Language Processing, ed. by Galia Angelova, Kalina Bontcheva, Ruslan Mitkov, and Nikolai Nikolov, 97–103. http://www.aclweb.org/anthology/R11-1014.pdf. Accessed December 22, 2015.) bemutatta, hogy a gépi fordítás összevonása az emberi fordítók és utószerkesztők munkájával meglehetősen ígéretes módszer.
A fentebb leírt első két értékelő módszert egy bizonyos rendszer és nyelvpár összesített teljesítményének értékelésére és felbecslésére használják, gyakran egy-egy konkrét tárgykörre vonatkozóan, valamint különböző rendszerek összehasonlítására. Ezekbe a kategóriákba tartoznak az olyan automatikus értékelést végző metrikák, mint a BLEU-pontszámok (Papineni et al. 2002Papineni, Kishore, Salim Roukos, Todd Ward, and Wei-Jing Zhu 2002 “BLEU: A Method for Automatic Evaluation of Machine Translation.” In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, 311–318. http://dl.acm.org/citation.cfm?id=1073083&picked=prox. Accessed December 22, 2015.), az F-pontszámok (Popović 2011b 2011b “Morphemes and POS Tags for N-gram Based Evaluation Metrics.” In Proceedings of the Sixth Workshop on Statistical Machine Translation, 104–107. file:///Users/SRP/Downloads/ngrams.pdf. Accessed December 22, 2015.), a METEOR, (Banerjee és Lavie 2005Banerjee, Satanjeev, and Alon Lavie 2005 “METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments.” In Proceedings of the ACL Workshop on Intrinsic and Extrinsic Evaluation Measures for Machine Translation and/or Summarization, ed. by Jade Goldstein, Alon Lavie, Chin-Yew Lin, and Clare Voss, 65–72. Michigan, MI: University of Michigan.), a TER és más hasonló metrikák. Ezek a mérőeszközök használhatók a minőség egyes aspektusainak becslésére is. A professzionálisan lefordított referenciaanyag nélküli minőségbecslés egy viszonylag új és kihívást jelentő módszer a gépi fordítás értékelésének terén (pl. Shah et al. 2013). Az elképzelés nagyjából egy olyan rendszer felépítése, amely más módszereket (vagyis algoritmusokat, nyelvi eszközöket, tanítóadatokat stb.) használ a gépi fordítás kimenetének értékelésére, mint amilyeneket maga a gépi fordítómotor használt. A rendszereket különböző feladatok elvégzésére tervezték, például alternatív MT-kimenetek automatikus rangsorolására, illetve az utószerkesztéshez szükséges erőfeszítés vagy az adott MT-kimenet összességében vett minőségének felbecslésére. Ezeket a rendszereket általában emberek által létrehozott adatokkal tanítják be, többek között a rendszerek kimenetének korábbi, emberek által végzett rangsorolásainak, osztályozásainak segítségével. Továbbá az utószerkesztésekről is végeznek automatikus elemzést (lásd Popović 2011aPopović, Maja 2011a “Hjerson: An Open Source Tool for Automatic Error Classification of Machine Translation Output.” The Prague Bulletin of Mathematical Linguistics 96: 59–68. ), ami szintén információkkal szolgálhat.
A NERstar-eszközbe integrált NER-modell (Romero-Fresco és Martinez 2015Romero-Fresco, Pablo, and Juan Martínez Pérez 2015 “Accuracy Rate in Live Subtitling – the NER Model.” In Audiovisual Translation in a Global Context: Mapping an Ever-changing Landscape, ed. by Jorge Díaz Cintas, and Rocío Baños Pinero, 28–50. London: Palgrave Macmillan. http://hdl.handle.net/10142/141892(draft). Accessed November 4, 2015. ) az egyik első kifejezetten audiovizuális fordításhoz készült metrika. Eredetileg nem a gépi fordítás értékelésére tervezték, hanem az eredetileg elhangzott szöveghez hasonlított újrabeszélt feliratok pontosságának felmérésére. A modell alkalmazása vonzó lehetőséget kínál, mivel csak kétféle hibát vesz figyelembe: az emberi újrabeszélő és a beszédet szöveggé alakító rendszer által elkövetett hibákat. Az adott hibák súlyosságát kiegészítő súlyok jelzik. Bár ez az eszköz remek jelölt a számítógéppel támogatott feliratozás mindennapi minőségbiztosításához, nem alkalmas arra, hogy a gépi fordítómotorok fejlesztése céljából mérje fel az MT-kimenet minőségét. Ehhez a gépi fordítás hibáinak aprólékosabb elemzésére van szükség.
4.2Multidimenzionális Minőségmetrika
Ígéretes módszer az audiovizuális fordítás hibáinak alapos elemzésére a szövegfordításoknál alkalmazott Multidimenzionális Minőségmetrika (Multidimensional Quality Metrics, MQM) keretrendszer (Lommel et al. 2014Lommel, Arle, Aljoscha Burchardt, and Hans Uszkoreit 2014 “Multidimensional Quality Metrics (MQM): A Framework for Declaring and Describing Translation Quality Metrics.” In Tradumàtica: tecnologies de la traducció 0 (12): 455–463.).1616. http://www.qt21.eu/launchpad/content/multidimensional-quality-metrics Az MQM-rendszer már meglévő, a fordítás minőségét mérő metrikák vizsgálatán alapul, és eredetileg az Európai Unió által támogatott QTLaunchPad projekt keretében fejlesztették ki azzal a céllal, hogy olyan megoldást kínáljon, amely objektívan írja le a fordítási hibákat, és amely elég rugalmas ahhoz, hogy speciális igényeket is figyelembe vegyen. Az MQM több mint 100, a fordítás minőségét érintő hibatípust tartalmaz, amelyek a fordított szövegekben előforduló konkrét problémák leírására használhatók. Ezek a hibatípusok hierarchikusan vannak felállítva, hogy különböző részletességi szinteket tegyenek lehetővé a szövegben előforduló problémák leírásánál.
Az első ábrán egy viszonylag bonyolult, a gépi fordítás hibáinak mélyreható elemzésére használható MQM-metrika látható. A félkövér dőlt betűvel jelölt hibák nem tartoznak az MQM alapvető hibatípusai közé, csupán egyénileg választható felhasználói bővítményül szolgálnak. Nem mondanak ellent az MQM rendszerének, mivel egyszerűen csak további részletességet biztosítanak az elemzéshez, és a fő hibatípusok altípusainak tekinthetők. Ebben az esetben kiegészítő információt nyújtanak a „funkciószavakkal”, például elöljárószavakkal, névelőkkel vagy segédigékkel kapcsolatban felmerülő problémákról. Ez a metrika nagy hangsúlyt fektet a nyelvtani jellemzőkre és a pontossággal kapcsolatos hibákra.
Ezzel szemben a második ábrán egy sokkal egyszerűbb metrika látható, amely alkalmas lehet az audiovizuális fordításhoz használt gépi fordítás értékelésére.
Ez a metrika általánosságban az audiovizuális (nem kizárólag gépi) fordítások értékelésére készült. Tartalmazza a Stílus kategóriáját (egy alapvető MQM-hibatípust), amely meglehetősen releváns az audiovizuális fordítást tekintve, ugyanakkor hiányzik belőle számos valószínűleg nem kifejezetten releváns kategória. Ebben a metrikában sokkal kisebb hangsúly helyeződik a Nyelvtan kategóriájára, és két egyéni hibatípust is tartalmaz:
-
Kontextuális hiba, kontextuálisan helytelen fordításokra.
-
Időzítés, olyan esetekre, amikor a fordítás rossz időben tűnik fel.
Amint látható, az MQM előnyei közé tartozik, hogy szabványosított szókészletet kínál a hibák leírására, valamint lehetővé teszi a felhasználók számára, hogy feladatspecifikus metrikákat hozzanak létre (például egy hírekhez készült feliratot értékelő metrika valószínűleg igencsak különbözni fog egy jogi fordítás értékelésére használt metrikától). Emellett az MQM-rendszer bővíthető is, hogy kiterjedjen fő szókészletben nem szereplő hibákra is. Az MQM integráltan használható a nyílt forráskódú translate5 1717. http://www.translate5.net/ szerkesztőben, illetve továbbra is fejlesztik a QT21 projekt keretein belül. Az MQM jelenleg is zajló fejlesztésének célja, hogy a metrika további fordítástípusokra is kibővíthető legyen, többek között az audiovizuális fordításra is.
5.Összefoglalás
A jelen tanulmányban megpróbáltunk utat nyitni az audiovizuális fordítás specialistái és a gépi fordítás szakértői közötti szorosabb együttműködés előtt, hogy előmozdítsuk az audiovizuális fordításhoz használható jó minőségű gépi fordítással kapcsolatos kutatásokat. Megosztottunk néhány háttérinformációt a jelenleg elsősorban szövegfordításokhoz használatos gépi fordítás technológiájának alapjairól, és beszámoltunk néhány olyan kihívásról, amelyek a gépi fordítás feliratfordításokhoz való alkalmazásakor merülnek fel. Végül pedig áttekintettük a gépi fordítás minőségének értékelésére használt módszereket, és javaslatot tettünk a Multidimenzionális Minőségmetrika (Multidimensional Quality Metrics, MQM) kibővítésére, hogy tartalmazza az audiovizuális fordítás jellemző hibatípusait is.