Strojový překlad
Strojový překlad (angl. machine translation) je proces automatického překladu z jednoho přirozeného jazyka do jiného pomocí počítače. Strojový překlad je už dlouhou dobu důležitou úlohou informatiky, stále však nebyl úplně uspokojivě vyřešen. Dnes jsou dostupné mnohé systémy, jejichž výstup není dokonalý, ale je dostatečně kvalitní pro použití v mnoha oblastech, kde pomáhá lidským překladatelům.
Obsah |
[editovat] Historie strojového překladu
Pokusy o strojový překlad cizojazyčných textů začaly krátce po 2. světové válce. Očekávalo se, že pro počítače, jejichž první prototypy byly v té době uvedeny do provozu, nebude tento úkol nijak složitý. Brzy se však ukázalo, že tento předpoklad byl zcela mylný.
První systém pro strojový překlad byl veřejnosti představen 7. ledna 1954 v ústředí firmy IBM. Událost přitáhla značnou pozornost médií i široké veřejnosti. Systém samotný byl ale z dnešního pohledu velmi jednoduchý, jeho slovník obsahoval pouze 250 slov a při předvádění překládal pouze 49 zvlášť vybraných vět z ruštiny do angličtiny. I přes tuto jednoduchost ale systém vzbudil dojem, že praktické nasazení strojového překladu už není daleko, což pomohlo získat dostatečné finanční prostředky na další výzkum v tomto oboru.
Hlavní motivací pro vývoj dalších podobných systémů byla eskalující studená válka. USA se začaly obávat náskoku tehdejšího Sovětského svazu ve vývoji raketové i jiné vojenské techniky a snažily se pečlivě monitorovat pokrok sovětské vědy. První systémy pro strojový překlad byly proto používány především pro překládání ruskojazyčných vědeckých a odborných publikací do angličtiny. Kvalita překladu však byla velmi nízká a takto vzniklé texty se používaly pouze pro získání základní orientace v obsahu dokumentu a rozhodování, zda stojí za to nechat dokument přeložit profesionálním překladatelem.
V průběhu dalších desetiletí bylo do vývoje v oblasti strojového překladu investováno značné úsilí jak v komerční, tak i v akademické sféře. Dosahované pokroky byly ale po celou dobu velmi skromné a ani dnešní nejmodernější systémy nedokáží překládat na úrovni, která by byla srovnatelná s člověkem.
[editovat] Strojový překlad v ČR
Strojový překlad má v České republice dlouhou a bohatou tradici, vznikla zde celá řada úspěšných akademických i komerčních systémů.
[editovat] Akademické systémy
Centrem akademického výzkumu je už po několik desetiletí Ústav formální a aplikované lingvistiky při matematicko-fyzikální fakultě Univerzity Karlovy. V průběhu sedmdesátých a odmdesátých let zde byla pod vedením prof. Sgalla vytvořena rozsáhlá teorie pro formální popis přirozeného jazyka pomocí závislostní syntaxe nazvaná funkčně-generativní popis. Na těchto teoretických základech pak na přelomu sedmdesátých a osmdesátých let minulého století vznikl pod vedením Zdeňka Kirchnera experimentální anglicko-český strojový překladač APAČ a o několik let později podobný systém pro překlad mezi češtinou a ruštinou nazvaný RUSLAN.
[editovat] Komerční systémy
Komerční systémy pro strojový překlad přišly na český trh krátce po nástupu osobních počítačů na začátku devadesátých let a poměrně rychle si mezi uživateli získaly značnou popularitu.
[editovat] PC Translator
PC Translator byl první softwarový nástroj pro překlad cizojazyčných textů na českém trhu. Pomáhal uživateli při překladu tím, že rozdělil větu na jednotlivá slova a skupiny slov a pro každé vyhledal ve slovníku několik nejvhodnějších překladů. Výsledek zobrazil v přehledné tabulce podle níž pak uživatel sám sepisoval finální text. Autorem programu byl Rostislav Janča. Program se na českém trhu velmi rychle etabloval, neustále se vyvíjí a po další dvě desetiletí patří v ČR mezi nejprodávanější překladatelské nástroje.
[editovat] Transen
Transen byl první překladač na českém trhu, který dokázal v přeloženém textu sám skloňovat nebo časovat česká slova. K tomuto účelu obsahoval podrobně rozpracovanou databázi českých ohýbacích vzorů a sadu základních pravidel české syntaxe. Anglická syntaxe v něm byla popsána pomocí větných šablon sestavených podle knihy "A Guide to Patterns and Usage in English" významného britského lingvisty A. S. Hornbyho. Klíčové součásti překladače vyvinul bratislavský programátor Jozef Baruník, původně pro překlad z angličtiny do slovenštiny. Systém byl na českém trhu nabízen v první polovině devadesátých let, ale nedosáhl většího rozšíření.
[editovat] Skik
Překladač Skik byl na český trh uveden v polovině devadesátých let. Dokázal provádět základní analýzu syntaxe anglické věty a uměl i skloňovat nebo časovat česká slova v přeloženém textu. Autorem překladače byl Vladimír Smetáček. Program se na českém trhu prodával přibližně deset let, poté jeho autor své komerční aktivity ukončil a vyvinuté know-how nabídl české akademické komunitě.
[editovat] Eurotran
Překladač Eurotran přišel na český trh na konci devadesátých let a byl prvním překladačem, který byl zaměřený na překlad internetových stránek. Autorem byl Milan Šustek. Program používal překladový model založený na paralelní bezkontextové gramatice, později přidal statistický bigramový model pro vyhlazování českého textu. Díky nasazení inovativních technik byl hned od počátku nástrojem, který poskytoval v češtině nejvyšší kvalitu překladu.[1]
[editovat] Související články
- DLT – projekt Distributed Language Translation
- Wikipedie:Strojový překlad Wikipedie – Projekty automatizovaného překladu Wikipedie
- Babelfish
[editovat] Reference
- ↑ MF DNES: Stroj živého překladatele hned tak nenahradí, test překladačů PC Translator, Skik a Eurotran.
[editovat] Externí odkazy
- Online překlad pomocí GNU/FDL slovníku (slovník je svobodný software). Nejedná se přímo o překlad, ale o zobrazení významu v jiném jazyce v bublinkové nápovědě.
- Interaktivní ukázka strojového překladu na Ústavu formální a aplikované lingvistiky MFF UK.