Bitva překladačů: DeepL vs. LLM

Představte si, že najednou rozumíte jakémukoli jazyku světa. Žádné hodiny biflování gramatiky, žádné kartičky se slovíčky, žádné trapné momenty s výslovností. Jen kliknete a – voilà – můžete číst finský román, nepálský blog nebo právní kličky v urdštině. Ještě nedávno jsme se při zmínce o strojovém překladu pobaveně ušklíbali – kdo by si nevybavil ty okouzlující překlady návodů k čínským výrobkům? „Laskavě nezpůsobovat mokrou činnost v pokoji koupání, jinak nebezpečnost zranit!“

Jenže časy se mění. Dnes máme k dispozici nástroje, které zvládají překlady s překvapivou elegancí a přesností. Stojíme na digitálním rozcestí – na jedné straně specializované překladové nástroje jako DeepL, na druhé všestranné velké jazykové modely (anglická zkratka LLM) jako ChatGPT nebo Claude. Obě technologie slibují mimořádně kvalitní výsledky, ale každá přichází s vlastními přednostmi i nedostatky.

Pojďme nahlédnout pod kapotu těchto nástrojů a zjistit, který z nich by mohl lépe posloužit právě vašim potřebám.

Jak fungují překladače: skalpel vs. švýcarák

DeepL připomíná dokonale vybroušený japonský nůž – nástroj určený pro jediný účel, ovšem s mimořádnou přesností. Byl vytrénován na pečlivě vybraných jazykových korpusech s jediným posláním: dokonale překládat mezi jazyky. Díky této specializaci dokáže DeepL poskytovat konzistentní, gramaticky přesné a významově věrné převody textů. Svou pověst si vybudoval především při práci s evropskými jazyky, kde v řadě nezávislých testů překonává většinu konkurenčních řešení. Zajímavé je, že byl z významné části trénován na oficiálních dokumentech Evropské unie – právní předpisy, materiály Evropského parlamentu a další vícejazyčné úřední dokumenty. Nasazení na vrcholné byrokratické texty se mu očividně vyplatilo.

Velké jazykové modely fungují spíše jako švýcarský armádní nůž – univerzální nástroj s množstvím funkcí, kde překlad představuje jen jednu z mnoha čepelí. ChatGPT, Claude nebo Gemini byly vyvinuty jako všestranní jazykoví asistenti schopní psát odborné texty, skládat básně nebo programovat. Překládání je pouze jednou položkou v jejich pestrém repertoáru. Tyto modely se trénovaly na ohromném množství textů v desítkách jazyků a nejrůznějších situacích. To jim dává širší přehled o světě, ale může to být na úkor specializovaných jazykových dovedností.

V tom, jak oba systémy přistupují k samotnému překladu, je zásadní rozdíl. DeepL pracuje na principu přímé transformace – bere větu v jednom jazyce a převádí ji na odpovídající větu v jazyce jiném. Velké jazykové modely naproti tomu text nejprve zpracují, „pochopí“ jeho význam a následně vytvoří novou verzi v cílovém jazyce. Nejde tedy o prostou výměnu, ale spíše o jakési „převyprávění“. Tento drobný rozdíl v přístupu má dalekosáhlé důsledky pro kvalitu a charakter výsledného překladu.

Halucinace: Když překladač experimentuje s psychedeliky

Pojem „halucinace“ v souvislosti s umělou inteligencí samozřejmě nesouvisí s psychedeliky (ačkoliv některé výstupy by tomu nasvědčovaly), ale označuje situaci, kdy systém produkuje přesvědčivě znějící, avšak fakticky smyšlené informace. Brzy o tom napíšu podrobnější článek.

Právě zde narážíme na jeden z klíčových rozdílů mezi DeepL a velkými jazykovými modely (dále LLM). DeepL byl postaven s důrazem na věrnost překladu. Funguje podobně jako precizní kopírka – nemá tendenci k vlastní tvorbě. Může občas špatně pochopit originál, ale nebude text vylepšovat vlastními nápady.

Naproti tomu LLM mají kreativitu takříkajíc v DNA. Dokážou domýšlet mezery nebo vytvářet zcela nový obsah. Když LLM narazí na nejasnou část textu, nespokojí se s doslovným převodem (jako DeepL), ale často se pokusí doplnit chybějící část tak, aby celkový výsledek dával smysl. Je to podobný rozdíl jako mezi asistentem, který vám přetlumočí zprávu přesně tak, jak zazněla, a kolegou, který řekne: „Jo, Bob cosi zmiňoval o té úterní schůzce, a podle mě tím myslel, že potřebuje přesunout prezentaci na čtvrtek, protože v úterý má objednanou dentální hygienu.“

Konkrétní příklad: Zadal jsem větu „The system was implemented in 2020 and immediately…“ do DeepL a obdržel jsem „Systém byl zaveden v roce 2020 a okamžitě…“ – tedy přesně to, co originál obsahuje, nic víc, nic míň. Tutéž větu jsem předložil jazykovému modelu s neurčitým zadáním a získal: „Systém byl zaveden v roce 2020 a okamžitě zaznamenal pozitivní ohlas mezi uživateli“ – závěrečnou část si model zcela vymyslel ve snaze dokončit myšlenku způsobem, který považoval za smysluplný. Šikovné a zároveň trochu děsivé, pokud překládáte důležitý dokument.

Věrnost vs. přirozenost

Klíčový rozdíl spočívá v překladatelské filosofii těchto nástrojů. DeepL respektuje strukturu originálu, což zajišťuje, že nic důležitého nevypadne, i když to někdy znamená, že překlad zní trochu kostrbatě. LLM naopak přistupují k překladu volněji – plynule převádějí idiomy a upravují věty tak, aby odpovídaly zvyklostem cílového jazyka. Výsledek zní přirozeněji, ale může se v detailech lišit od původního textu.

Jak výstižně poznamenává překladatel Viktor Janiš, překlad není jen mechanické hledání ekvivalentů ve slovníku: Jde o složitou kulturní operaci, při níž je text přesazován i s celým „kořenovým balem“ kultury – včetně tisíců konceptů, asociací a slovních hříček. Právě v této kulturní adaptaci vynikají LLM, zatímco DeepL je silnější v přesném zachování pojmů.

Rozdíl je nejvíc vidět u odborných textů. DeepL zachovává strukturu vět i odborné výrazy, kdežto LLM může text výrazněji přeskládat a někdy nahradit odborné termíny vysvětlujícími frázemi – což je výhodou pro běžné čtenáře, ale problémem tam, kde záleží na přesném dodržení odborného názvosloví.

Strategie pro omezení rizik při využití LLM

Rozhodnete-li se využít jazykové modely jako překladatelský nástroj, existuje několik osvědčených fíglů, jak minimalizovat riziko halucinací a nežádoucích úprav:

1. Naučte se, jak správně zadávat pokyny AI

Pro jazykové modely platí klíčové pravidlo: čím přesnější zadání, tím kvalitnější výstup. Namísto strohého „přelož tohle“ nebo „česky prosím“ zkuste formulaci:

Přelož následující text z angličtiny do češtiny. Zachovej přesný význam a strukturu originálu. Text nijak nerozšiřuj ani nezkracuj, nepřidávej žádné informace neobsažené v původním textu. Důsledně respektuj odbornou terminologii a zachovej stylistickou úroveň originálu.

Ano, efektivně promptovat je zásadní dovednost, kterou vás rád naučím:

2. Specifikujte charakter a účel textu

Další ze základních pravidel komunikace s jazykovými modely zní: kontext je král. Co tím myslím? Že máte modelu poskytnout informace o překládaném textu.

Text představuje odborný článek z oblasti strojového učení určený pro publikum s technickým vzděláním. Zachovej veškerou odbornou terminologii a formální akademický styl. Vyhni se jakémukoliv zjednodušování či popularizaci odborného obsahu.

Dobrým příkladem toho, jak zásadně kontext ovlivňuje výsledek, je následující anglická věta:

The spring was damaged during the last flood.

Bez kontextu by jazykový model pravděpodobně přeložil „spring“ jako „jaro“ (roční období) nebo „pružina“ (mechanický prvek). Ale co když se text týká vodních zdrojů? V takovém případě by správný překlad měl obsahovat slovo „pramen“. Poskytnutím kontextu dosáhnete přesného překladu:

Přelož následující větu z angličtiny do češtiny. Text pochází z dokumentu o hydrogeologii a vodních zdrojích v regionu.

S tímto kontextem model mnohem pravděpodobněji přeloží „spring“ jako „pramen“, což je správně. Možnost vysvětlit kontext je jedna z velkých výhod LLM oproti DeepL – je to jako mít možnost promluvit si s překladatelem předtím, než se pustí do práce.

3. Specifikujte charakter a účel textu

Pracujete-li s textem obsahujícím důležité odborné výrazy, vytvořte si stručný slovníček a předejte jej modelu jako součást zadání:

Při překladu důsledně dodržuj následující terminologický slovník:

  • deep research = hluboký výzkum (nikoli hluboký průzkum či podrobný výzkum)
  • language model = jazykový model (nikoli model jazyka)
  • prompt = zadání nebo prompt (nepoužívej termíny ‚pobídka‘ či ‚výzva‘)

To je obzvlášť užitečné, když překládáte dlouhý text po částech a potřebujete, aby terminologie zůstala jednotná.

4. Nechte AI vytvořit dokonalý prompt

Říkáte si, že vytvořit slovník nebo charakteristiku textu je pracné? Požádejte o to samotný model!

Potřebuji pomocí tvých schopností přeložit odborný článek z kvantové fyziky z angličtiny do češtiny. Text obsahuje specializovanou terminologii a složité koncepty. Můžeš mi navrhnout přesné zadání (prompt), které zajistí co nejkvalitnější a terminologicky přesný překlad?

Jazykový model vám navrhne podrobné instrukce, které můžete dále upravovat podle své potřeby. Je to skoro jako nechat si napsat tahák od samotného učitele.

5. Vícefázový překlad

Mimořádně účinnou metodou je rozdělení překladového procesu na více etapy:

  • Fáze 1: Přelož text
  • Fáze 2: Vylepši překlad textu

Nyní, prosím, uprav předchozí překlad, aby zněl přirozeněji v češtině, ale zcela zachovej původní význam. Zaměř se na plynulejší formulace odpovídající českému jazyku. Oprav případné nepřesnosti z první verze překladu.

Třetí fází pak může být kontrola, jestli se neobjevily halucinace a podobně.

A ještě tip pro programátory, kteří využívají k překládání API: nastavte temperature na nižší hodnotu, abyste potlačili kreativitu.

Těchto pět tipů vám může pomoci vytěžit z jazykových modelů maximum i při překládání náročných textů, a přitom mít pod kontrolou přesnost, styl i terminologii.

LLM: překlad v minovém poli

Nejvelkolepější síla jazykových modelů se projeví, když je dokážete precizně instruovat pro složité scénáře. Představte si, že potřebujete přeložit technickou dokumentaci plnou specifické syntaxe, kódových ukázek a speciálních značek. Přesně pro takové situace můžete vytvořit specializovaný prompt, který LLM detailně naviguje složitostmi překladu. Mrkněte například do zdrojových souborů dokumentace Nette, kde překladač musí respektovat specifickou Texy syntaxi, zachovat formátování, správně pracovat s bloky kódu a přitom překládat jen vhodné části.

Vytvořil jsem podrobný překladatelský manuál, ve kterém definuji desítky specifických pravidel – od vysvětlení, že [klikněte|intro] jsou odkazy, kde se překládá pouze text před svislítkem, až po explicitní instrukce pro zacházení s ukázkami kódu, kde se překládají komentáře jako // zde vložte ID, zatímco identifikátory jako $message zůstanou nedotčené, a tak dále. A LLM je respektuje.

DeepL: Bezkonkurenční rychlost jako hlavní deviza

Jednou z největších předností nástroje DeepL oproti jazykovým modelům je jeho rychlost. Zatímco ChatGPT a podobné systémy generují text kolikrát pomaleji, než dokážete číst, DeepL vyplivne kompletní překlad prakticky okamžitě. Díky tomu DeepL pravidelně používám k rychlému „skenování“ zahraničních článků a dokumentů. Ačkoliv anglicky čtu od dětství, v češtině jsem prostě řádově rychlejší. DeepL mi umožňuje bleskově prolítnout cizojazyčný obsah a vyhodnotit, zda stojí za podrobnější studium.

Co s Google Translate a dalšími konkurenty?

Google Translate dlouho představoval synonymum pro strojový překlad, i když jeho pověst byla přinejmenším kolísavá. Dobrou zprávou je, že Google průběžně nasazuje nové, vylepšené verze svého překladače. Nepříjemné zkušenosti z minulých let tak dnes mohou být již zcela passé.

Nesmím zapomenout ani na Microsoft Translator, který také využívá moderní neuronový strojový překlad a nabízí podporu pro více než 100 jazyků. Jeho integrace napříč ekosystémem Microsoft – v Office aplikacích, Teams, Skype, Edge, Windows a dalších produktech – z něj dělá snadno dostupné řešení pro uživatele těchto platforem. Ve firemním prostředí nabízí funkci Custom Translator umožňující trénování překladových modelů na vlastních firemních datech pro přesnější práci s interní hantýrkou.

Závěrečný verdikt: DeepL nebo jazykový model?

Po důkladném zvážení všech důležitých faktorů – přesnost, stylistická flexibilita, rychlost, riziko halucinací – přichází čas na závěrečné hodnocení. Kdo vítězí v této překladatelské bitvě? Odpověď je předvídatelná: záleží především na vašich konkrétních potřebách.

K DeepL se přikloňte, když:

  • Potřebujete bleskurychlý překlad pro základní orientaci v textu
  • Vyžadujete maximální věrnost originálu bez jakýchkoliv výmyslů
  • Překládáte citlivé dokumenty, kde by jakékoli nepřesnosti mohly způsobit problémy
  • Nemáte čas na vymýšlení podrobných instrukcí
  • Pracujete s formálními, právními nebo úředními texty

Jazykový model (typu ChatGPT) zvolte, když:

  • Preferujete překlad, který v cílovém jazyce zní přirozeněji
  • Potřebujete přizpůsobit styl textu (formální/neformální, odborný/popularizační)
  • Překládáte kulturně specifické výrazy, slovní hříčky nebo humor vyžadující tvořivější přístup
  • Oceníte možnost průběžné konzultace nejasností nebo alternativních překladů
  • Pracujete s jazykem, který DeepL nepodporuje

Ideálním řešením je samozřejmě přístup k oběma technologiím a jejich používání podle konkrétních okolností. V profesionálním prostředí může být nejefektivnější strategie právě v jejich kombinaci – využití DeepL pro vytvoření rychlého výchozího překladu a následná úprava problematických pasáží pomocí jazykového modelu.

Je třeba zdůraznit, že ani jeden z těchto nástrojů není dokonalý. Dokumenty zásadního významu, především právní, vědecké či technické materiály, by měl vždy zkontrolovat kvalifikovaný odborník s příslušnými znalostmi. Umělá inteligence nám sice dramaticky usnadňuje práci, konečná odpovědnost za přesnost překladu však zůstává na lidském faktoru.