Jak funguje Google Překladač?

Jak funguje Google Překladač? Možná si teď říkáte, že odpověď na tuto otázku je přece jednoduchá. Napíšeme do políčka požadované spojení a to odešleme na server. Ten pak náš požadavek vyhledá v databázi a vrátí nám požadovaný výsledek. Takhle jednoduché to ale není. A tento článek vám ukáže, jak to funguje doopravdy.

Léta tvrdé dřiny

Doby, kdy překladače fungovaly v podstatě jen jako slovníky, jsou minulostí. Statický překlad, který přeložil jednotlivě každé slovo bez ohledu na gramatiku, se dávno nepoužívá. S technologickým pokrokem, jehož se podařilo dosáhnout v posledních letech, tak přišly na scénu neuronové sítě. Představte si je jako několik vzájemně propojených počítačů, které se principem snaží napodobit lidský mozek. Poháněni metodou tzv. hlubokého učení (deep learning) se pak tento systém zdál jako dokonalý právě pro strojové překlady.

Překlad jazyků ale není to samé jako překreslení obrázku, rozpoznání zvuku nebo rozpoznání odlišností na videu. Kvalitní překlad potřebuje nejen bezchybnou slovní zásobu, ale také gramatiku, s níž měly předchozí technologie problémy. A právě nalezení toho správného receptu, jenž by se dal využít i u překladače, zabralo velké množství času. Google neupřesnil, kolik ho přesně potřebovali, každopádně na svých stránkách zmiňují, že tvorba nového řešení zabrala několik let.

Jako malé dítě

A důvodem, proč vývoj trval tak dlouho, je samotná technologie. K tomu, aby se neuronová síť naučila jazyk opravdu dobře, potřebuje obrovské množství textů. Aby pochopila jednoduchá pravidla a zařadila do svého slovníku několik slov, je k tomu opět potřeba spousta textového materiálu. Nic z toho by ale nebylo možné bez mozku, který celou síť ovládá. Ten má na starost nejen samotné učení, ale i překlad.

Oproti předchozí technologii, která ke svému fungování potřebovala prostředníka v podobě angličtiny, nyní daný text zpracovává přímo. Zeptá se v databázi a během zlomku vteřiny předloží uživateli kýžený výsledek.

A aby mohl Google Překladač do budoucna poskytovat ještě lepší služby, musí se neuronová síť neustále učit a získávat nové materiály. Ty poté analyzuje a porovnává s dalšími překlady v databázi. U podobných jazyků jako je například:

  • japonština/korejština
  • čeština/slovenština
  • švédština/norština

jde ještě dál. Porovnává překlady z těchto jazyků do jiných a postupně jasně rozpoznává odlišnosti. Ty poté může vytáhnout a použít „naostro“.

Růžová budoucnost

Díky strojovému učení a neuronovým sítím jsou výsledky Google Překladače úchvatné. Ještě dlouho ale nejspíše budeme čekat na to, než úplně nahradí lidské překladatele. Než tohoto bodu dosáhne, čeká ho spousta tvrdého učení. Studování tisíců obsáhlých textů a nespočet vyrobených chyb. A kdo ví. Třeba se jednou z laboratoří Google podívá na světlo světa mnohem lepší řešení. Ale to je v tuto chvíli ve hvězdách…