OCR

Z Wikipedie, otevřené encyklopedie

Skočit na: Navigace, Hledání

OCR neboli optické rozpoznávání znaků (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nerozezná všechna písmena správně. OCR - zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh např. slabě vytištěných jehličkových tiskáren nebo dohromady slitých písmen se z časového hlediska vyplatí spíše přepis textu.

[editovat] OCR software

Jméno Licence Operační systém Poznámky
ABBYY FineReader OCR Komerční Microsoft® Windows Vista®, Microsoft® Windows® Server 2003, Windows XP, Windows 2000 (SP2)..
Adobe Acrobat  ?  ?
GOCR GPL (open source)
Microsoft Office Document Imaging Komerční Windows, Mac OS X
NovoDynamics VERUS Komerční?  ?
Ocrad GPL Unix-like, OS/2
OCRopus Apache Linux
OmniPage Komerční (Nuance EULA) Windows Produkt Nuance Communications
Readiris Komerční Windows, Mac OS Produkt I.R.I.S.
ReadSoft Komerční?  ?
SimpleOCR Freeware a Komerční Windows
SmartScore Komerční Windows, Mac
Tesseract Apache Windows, Mac OS X, Linux, OS/2 Vyvíjeno Googlem

[editovat] Externí odkazy