Post-editace

Z Wikipedie, otevřené encyklopedie
(přesměrováno z Post editing)
Skočit na navigaci Skočit na vyhledávání

Post-editace (také posteditace) neboli následná úprava strojového překladu „je procesem vylepšování překladu vytvořeného počítačem při vynaložení minimálního manuálního úsilí“.[1] Člověku, který tuto činnost vykonává, se říká post-editor.

Post-editace je úzce spjata s pojmem pre-editace (úprava textu předcházející strojovému překladu). Právě úpravou zdrojového textu před jeho podrobením strojovému překladači (například aplikováním principů redukovaného jazyka) a následnou editací výstupu ze strojového překladače je možné u strojového překladu dosáhnout nejlepších výsledků. Post-editace v tomto smyslu se od běžné editace textu vytvořeného člověkem liší. V oblasti překladu se rozlišuje mezi korekturou, revizí a editací. Zatímco korekturou se rozumí oprava pravopisu a překlepů, editace zahrnuje úpravu celých vět i opravu terminologie. Revize je pak kontrolou překladu s přihlédnutím k výchozímu textu.[2] Text, který prošel post-editací, je možné následně ještě podrobit revizi, aby se dohlédlo na správný výběr slov, nebo kontrole a korekci menších chyb.

Při post-editaci jde o úpravu výstupu strojového překladu do takové míry, na jaké se předem domluví klient a post-editor. Výsledkem základní post-editace je víceméně srozumitelný text, naopak úplná post-editace zaručí, že překlad je přiměřený také po stylistické stránce. Úplná post-editace se tak s pokrokem v strojovém překladu stává alternativou pro překlad ruční. Existuje řada softwarových nástrojů, které umožňují následně editovat výstup strojového překladu. Patří sem například Google Translator Toolkit, SDL Trados, Unbabel a Systran.[3][4]

Post-editace a strojový překlad[editovat | editovat zdroj]

Koncem sedmdesátých let strojový překlad opustil laboratoř a začal se používat na účel, pro který byl vynalezen. Používaly ho některé velké instituce jako Evropské komise a Panamerická zdravotnická organizace, později také společnosti jako Caterpillar a General Motors. První studie o post-editaci se objevily v osmdesátých letech a týkaly se právě těchto implementací.[5][6] Aby se mohly vytvořit přiměřené zásady a vzdělávací instituce, členové AMTA – Association for Machine Translation in the Americas (Sdružení pro strojový překlad v Amerikách) a EAMT – European Association for Machine Translation (Evropského sdružení pro strojový překlad) založili v roce 1999 Post-editing Special Interest Group (Zájmovou skupinu pro post-editaci).[7]

Pokroky v kapacitě a propojitelnosti počítačů po devadesátých letech urychlily vývoj strojového překladu a dovolily mu rozšířit se do webových prohlížečů, kromě jiného ve formě užitečných bezplatných doplňků pro nejznámější vyhledávače (Google Translate, Bing Translator, Yahoo! Babel Fish). Širší přijetí nedokonalého strojového překladu způsobilo, že i post-editace se stala všeobecně lépe akceptována. Poptávka po lokalizaci zboží a služeb roste tempem, které člověk jako překladatel nestíhá dohnat ani s pomocí překladových pamětí a jiných pomocných překladatelských technologií. Proto profesionální sdružení jako například TAUS – Translation Automation Users Society (Společnost uživatelů automatizace překladu) očekávají, že strojový překlad a post-editace budou během nejbližších let hrát mnohem důležitější roli.[8]

Základní a úplná post-editace[editovat | editovat zdroj]

Studie z osmdesátých let rozlišovaly mezi dvěma stupni post-editace, které byly v rámci Generálního ředitelství pro překlad Evropské komise nejprve definovány jako konvenční a rychlá,[9] nebo úplná a rychlá.[10] Dnes se nejčastěji rozlišuje mezi post-editací základní (angl. light) a úplnou (angl. full).

Při základní post-editaci zasahuje post-editor do strojového překladu jen minimálně – vždy jen tak přísně, aby koncový uživatel pochopil smysl textu. Očekává se, že klient bude takovýto překlad využívat pouze pro své interní účely. Je řešením v případech, kdy jde o urgentní překlad, nebo kdy je překlad požadován ve zkrácené lhůtě.

Při úplné post-editaci se stupně kvality vyjednané mezi klientem a post-editorem dosahuje s pomocí vyšší úrovně zásahů; výsledkem by měl být text, jenž je nejen pochopitelný, ale také prezentovaný stylisticky vhodným způsobem, takže jej lze použít pro osvojování a dokonce i šíření, pro interní i externí účely.

Hypoteticky nejkvalitnějším výstupem úplné post-editace je text, jejž nelze odlišit od překladu vytvořeného člověkem. Nicméně se předpokládá, že překládat přímo ze zdrojového textu dá překladateli méně úsilí, než aby post-editoval verzi vygenerovanou strojem. S pokroky v strojovém překladu se to ale může změnit. V dnešní době, kdy překladatelské nástroje pracují s pomocí kvalitních dat z konkrétních oborů, klienti dožadující se překladu mezi některými konkrétními jazykovými páry nebo vypracování specifických zadání často požadují od překladatele, aby místo řádného překladu text jen post-editovali. Věří, že tak za nižší cenu dostanou stejnou kvalitu.

Klasifikace post-editace na základní a úplnou pocházející z devadesátých let, kdy nástroje strojového překladu vycházely ještě na CD-ROMech, může být i v případě základní post-editace vzhledem na posun v technologiích zastaralá. Při některých jazykových párech a některých druzích zadání, a to zejména když se zdrojový text pre-edituje, může neupravovaný výstup posloužit na uchopení hlavní myšlenky textu i bez nutnosti dalších lidských zásahů.

Efektivnost post-editace[editovat | editovat zdroj]

Post-editace se používá, když neupravovaný strojový překlad nestačí a řádného lidského překladu není zapotřebí. Doporučuje se post-editace využít v případech, když produktivitu může alespoň zdvojnásobit, nebo v případě základní post-editace dokonce zčtyřnásobit.

Avšak efektivnost post-editace je obtížné předpovědět. Různé studie z akademické i průmyslové sféry ukázaly, že post-editace je obecně rychlejší než řádný překlad, a to bez ohledu na jazykový pár či překladatelovy zkušenosti.[11] Názory se ale neshodují v otázce, kolik času se ušetří post-editací v praxi. Zatímco odborníci v průmyslové praxi zaznamenali 40% úsporu času,[12] některé vědecké články tvrdí, že v reálných pracovních podmínkách je pravděpodobnější úspora mezi 15-20 %.[13]

Post-editace a jazykový průmysl[editovat | editovat zdroj]

Post-editace je i po třiceti letech pořád „profesí teprve se rodící“.[14] Dosud nebylo úplně prostudováno, jak by měl vypadat správný profil post-editora. Post-editace se, i když jenom částečně, překrývá s překladem a korekturou. Mnozí by předpokládali, že ideálním post-editorem bude překladatel, který se s nadšením nechá vycvičit v konkrétních potřebných dovednostech, ale někteří si naopak myslí, že by mohlo být jednodušší vyškolit bilingválního mluvčího, který s překladem nemá žádné zkušenosti.[15] Nedostatečně zodpovězené zůstávají také otázky jako kdo jsou skuteční post-editoři, zda pracují většinou jako zaměstnanci nebo na volné noze, a za jakých podmínek.

Neexistují ani přesná čísla, která by ilustrovala, jak velký podíl na překladatelském průmyslu má post-editace. Nedávný průzkum ukázal, že 50 % poskytovatelů jazykových služeb ji nabízí, ale až pro 85 % z nich představuje podíl post-editace na všech jejich zakázkách jenom 10 %.[16] Prostřednictvím crowdsourcingové post-editační služby Unbabel přitom bylo přeloženo již víc než 11 miliónů slov (k listopadu 2014).[17]

Produktivita a rozšíření post-editace se vzhledem k neustálému vývoji strojového překladu jen velmi těžko odhadují. Strojový překlad se zlepšuje mimo jiné i díky tomu, že post-editované texty jsou zpětně zpracovávány překladači, a proto čím více textu projde post-editací, tím kvalitnější mohou být strojové překlady. Nelze ovšem opomenout fakt, že překladače se tímto způsobem kromě správných překladů „učí“ i ty chybné.

Odkazy[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Postediting na anglické Wikipedii.

  1. Postediting in Practice. A TAUS Report, březen 2010, s.6. [online]. [cit. 2015-01-17]. Dostupné v archivu. (anglicky) 
  2. Doporučené minimální tarify za překlad a tlumočení na rok 2014. Vydává Jednota tlumočníků a překladatelů.
  3. GTS Blog
  4. Unbabel: How it works]
  5. VASCONCELLOS, M.; LÉON, M. SPANAM and ENGSPA: Machine Translation at the Pan American Health Organization. Computational Linguistics. 1985, roč. 11, s. 122-136. 
  6. SENEZ, Dorothy. Post-editing Service for Machine Translation Users at the European Commission. Translating and the Computer. 1998, roč. 20. Proceedings from ASLIB Conference, 12-13 November 1998. 
  7. ALLEN, Jeffrey. Computers and Translation. A translator’s Guide. Příprava vydání Harold Somers. Amsterdam/Philadelphia: John Benjamins, 2003. Kapitola Post-editing, s. 312. 
  8. TAUS website
  9. LOFFLER-LAURIAN, Anne-Marie. Post-édition Rapide et Post-édition Conventionelle: Deux Modalités d’une Activité Spécifique. Multilingua. Roč. 5, s. 81-88. 
  10. WAGNER, Elisabeth. Rapid Post-editing of Systran. Translating and the Computer. 1983, roč. 5. Proceedings from ASLIB conference,10-11 November 1983. 
  11. GREEN, Spencer, Jeffrey HEER, Christopher D. MANNING. The Efficacy of Human Post-Editing for Language Translation. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems [online]. 2013. S. 439–448. Dostupné online. DOI:10.1145/2470654.2470718. 
  12. PLITT, Mirko; MASSELOT, François. A Productivity Test of Statistical Machine Translation Post-Editing in A Typical Localisation Context. Prague Bulletin of Mathematical Linguistics [online]. 2010. Roč. 93, s. 7-16. Dostupné online. 
  13. LÄUBLI, Samuel, Mark FISHEL, Gary MASSEY, Maureen EHRENSBERGER-DOW, Martin VOLK. Assessing Post-editing Efficiency in a Realistic Translation Environment. Proceedings of the 2nd Workshop on Post-editing Technology and Practice (WPTP). 2013, s. 83–91. Dostupné online. 
  14. TAUS – Post editing v praxi. www.translationautomation.com [online]. [cit. 2015-01-17]. Dostupné v archivu pořízeném dne 2012-03-05. 
  15. HUTCHINS, John W. Reflections on the History and Present State of Machine Translation. MT Summit V proceedings, Luxembourg. 1995, s. 89–96. [www.mt-archive.info/MTS-1995-Hutchins.pdf Dostupné online]. 
  16. Postediting in Practice. A TAUS Report, březen 2010, s. 13.
  17. Unbabel Launches a Human-Edited Machine Translation Service To Help Businesses Go Global, Localize Customer Support

Související články[editovat | editovat zdroj]

Externí odkazy[editovat | editovat zdroj]