7 redenen waarom DeepL nog niet kan vertalen

DeepL is heel goed, maar…

Daar hebben we het een andere keer over. In deze blog focussen we op de redenen waarom DeepL nog geen echte concurrent is van menselijke vertalers. We hebben ze op volgorde gezet, van ‘Waarschijnlijk snel oplosbaar’ tot ‘Onoplosbaar’. Want dat is nummer 7 zolang er geen klein mannetje in de machine zit.

1. DeepL raakt hopeloos in de war van opmaakkwesties

Mensen zijn in het algemeen gewend om naar het hele plaatje te kijken, en negeren de details. Software heeft daar moeite mee. Zo ook DeepL, dat zomaar kan struikelen over:

  • Een paar html-tags.
  • Een line
    break in een zin.
  • een zin die met een kleine letter begint.
  • EEN ZIN IN HOOFDLETTERS.
  • {Een fragment} dat tussen accolades is geplaatst.

Als een tekst niet strak en “schoon” is opgemaakt, blijft DeepL zijn best doen, en vertaalt het de flarden die het oppikt. Maar dat werkt niet zo goed, want de kracht van DeepL zit ‘m juist in de verwerking van complete zinnen.

Maar jongens, DeepL is zó slim, het leest over typ- en grammaticale fouten heen, dit zal dus toch wel snel op te lossen zijn?

2. DeepL maakt ongeforceerde fouten

We maken allemaal fouten. Soms slaan we zelfs de plank volledig mis. Elke vertaler heeft wel eens iets hilarisch verkeerd begrepen. Maar zelfs de grootste menselijke missers zijn te begrijpen. We beseften even niet dat dat ene woord deze keer nét iets anders betekende, of hadden een blackout en misten de voor de hand liggende oplossing. In ieder geval: anderen begrijpen waar de fout vandaan komt.

DeepL daarentegen tovert je af en toe een “vertaling” voor die kant noch wal raakt. Een volkomen toevallige, totale mismatch. Die we trouwens waarschijnlijk wél kunnen verklaren, namelijk doordat er bij het aligneren van de enorme (en in het algemeen fantastisch gecontroleerde) corpora die DeepL zijn kracht geven, even een paar regels aan elkaar gekoppeld zijn die nooit gekoppeld hadden mogen worden.

Dat DeepL af en toe klinkklare (en niet eens grappige) onzin produceert, is ongetwijfeld een van de grootste zorgen van de ontwikkelaars. Paar maanden nog?

3. DeepL piekert niet over synoniemen

Als een Nederlandse vertaler in een typische internettekst een zin leest als:

Do not post abusive, obscene, threatening, harassing, defamatory, libelous, offensive or sexually explicit material.

dan voelt hij een uitdaging. Want er zitten nogal wat woorden bij die zó weinig in betekenis verschillen, dat je je in bochten moet wringen om voor elk woord een unieke vertaling te bedenken die niet geforceerd lijkt. Een optie is om woorden weg te laten. Of, nog moeilijker, om te compenseren – zie reden 6.

DeepL lijkt de uitdaging echter niet te zien:

Plaats geen beledigend, obsceen, bedreigend, bedreigend, intimiderend, lasterlijk, lasterlijk, beledigend, beledigend of seksueel expliciet materiaal.

Toegegeven: DeepL is in het algemeen verbluffend goed in juridische teksten. Het gaat niet de fout in bij een uitdrukking als ‘null and void’ – die vertaalt het, net als geoefende menselijke vertalers, als ‘nietig’, en niet als ‘nietig en nietig’. Maar dat is dan ook een combinatie die je in betere woordenboeken letterlijk vindt, en ook in vele duizenden referentievertalingen van menselijke vertalers. DeepL put dankbaar uit hun werk.

Het is duidelijk dat DeepL heel veel taalregels heeft gecodeerd om zulke verbluffende zinnen te kunnen maken. Is eentje erbij om dit soort suffe herhalingen te voorkomen te veel gevraagd? Loop van 2019?

4. DeepL vergeet direct

Hoezo “vergeet” DeepL? Staan computers niet bekend om hun geheugencapaciteit, en was DeepL niet zelf-lerend? Dan moet het toch wel iets onthouden?

Klopt, maar DeepL onthoudt niet wat het net heeft gedaan. Dat geeft enorme problemen bij de consistentie van vertalingen. Dit probleem is in zekere zin de tegenhanger van het niet herkennen van synoniemen in de brontaal (zie reden 3): DeepL introduceert synoniemen in de doeltaal. Nou mag je af en toe best verschillende woorden voor hetzelfde begrip gebruiken, maar DeepL maakt het wel erg bont. Zo kan het rustig van ‘je’ naar ‘u’ springen en weer terug. Zelfs als voor beide veel te zeggen is, wil je toch een keus maken.

Hoe moeilijk zou het zijn om het programma, zónder het uitgebreide lijsten van verplichte en verboden woorden te voeren, duidelijk te maken dat het verder moet kijken dan één zin, en waar mogelijk bij zijn eerste keuze moet blijven? Is dit in de pijplijn, of op de radar?

5. DeepL heeft geen gevoel voor humor

Wat mensen leuk vinden, verschilt niet alleen per mens, maar ook van taal tot taal. Engelsen zijn dol op woordspelingen. Om die te herkennen, helpt een forse Engelse woordenschat. Russen maken variaties en zinspelingen op de dichtregels die ze jarenlang uit hun hoofd hebben moeten leren. Die zijn niet makkelijk te zien voor iemand die wel Russisch heeft geleerd, maar zelf is gevormd door Pluk van de Petteflet en Gerard Reve.

Als een Nederlander in een briefje op een etalageruit aanbeveelt je fiets op slot te zetten, kan hij het grappig vinden om toe te voegen “Je fiets zou gestolen kunnen worden.” Maar zelfs menselijke vertalers die het Nederlands niet als moedertaal hebben, zouden die ironie kunnen missen.

Als DeepL nu al eens een woordspeling, literaire verwijzingen of een vorm van ironie, sarcasme of cynisme oppikt, zal dat puur toeval zijn. Het lijkt ons een forse opgave om daar verandering in te brengen. Maar het is misschien wel een leuk zijprojectje voor een van de briljante ontwikkelaars om eens een begin te maken met het opstellen van regels voor het herkennen van humor?

6. DeepL compenseert niet

Je kunt als vertaler niet altijd, zin voor zin, woord voor woord, recht doen aan alle nuances van de brontekst. Soms zie je dat ze het toch proberen, wat echter leidt tot geforceerde oplossingen.

Goede menselijke vertalers doen iets eleganters: ze compenseren. Als bijvoorbeeld in de brontekst een Engelse woordspeling staat waar geen Nederlands equivalent voor te vinden is (en meestal is dat het geval), dan kan de vertaler ergens anders in de tekst een soortgelijke woordspeling gebruiken. Op die manier krijgt de lezer toch een indruk van de toon van de tekst.

Dat DeepL op dit moment zoiets zou kunnen, lijkt ons uitgesloten: het herkent niet eens de vertaalproblemen waarvoor goede menselijke vertalers de remedie van de compensatie inzetten – zie redenen 3, 4 en 5. Maar zodra die problemen zijn opgelost, zou dan kunstmatige intelligentie ooit zelf iets leuks kunnen bedenken?

7. DeepL stelt geen vragen

Vertalen is heel, heel moeilijk. De schrijver van een tekst wil iets zeggen, de vertaler moet dat met zo weinig mogelijk verlies in een andere taal zeggen. Maar is wat de vertaler leest ook werkelijk wat de schrijver wilde zeggen? Soms zijn teksten niet duidelijk. Of is het doel niet duidelijk. Of kan je iets met de beste wil van de wereld niet in een andere taal zo zeggen. Of heeft de schrijver helemaal niet gedacht aan wat een vertaling met zijn tekst zou doen.

Gelukkig weet een goede vertaler wanneer hij vragen moet stellen. Als hij iets niet begrijpt, maar ook als hij beren op de weg ziet voor de opdrachtgever: zullen we dit misschien iets anders aanpakken? Wat dacht je ervan als we die verwijzing naar … vervangen door …?

Een van de motto’s van Vertaalbureau.nl is: Vertalen doe je samen. Geen kwaad woord over DeepL, maar er valt niet mee te praten. En wij weten wel zeker dat dát niet gaat veranderen!