OCR са тези за оптично разпознаване на символи или известни на испански като оптично разпознаване на символи. OCR е софтуер, който позволява разпознаване на текст, като създава негово изображение, за да го трансформира в последователност от символи и след това да ги запише в даден формат, който може да се използва в тези програми за редактиране на текст. С други думи, благодарение на тази нова технология, всеки тип текст или документ, включително PDF файлове, сканирани хартии или дори изображения, взети от цифрови фотоапарати, могат да бъдат преобразувани в данни, за да има възможност за редактиране.
Този софтуер работи по следния начин, първо анализира всяка част от изображението на въпросния документ; разпространява страницата на парчета като таблици, изображения, текстови блокове между другото; след това редовете се разпределят с думи, за да станат по-късно знаци; и тъй като символите вече са посочени, софтуерът прави сравнението с група изображения на шаблона. Това напредва според поредицата хипотези за това какъв е всеки герой; и въз основа на тези хипотези той анализира различните варианти на разбиване на редове в думи и думи в знаци. И именно след голям брой анализи и обработка на хипотезите, програмата накрая представя вече разпознатия и трансформиран текст с нов формат.
Трябва да се отбележи, че днес има поредица от програми, които компютърният пазар предлага въз основа на OCR като OmniPage, Abbyy Fine Reader или READiris. YY, които имат способността не само да анализират и разпознават текст като такъв, но също така разпознават формата и стила, но с определени ограничения, като по този начин изискват текстът след анализ да бъде редактиран, за да направи корекциите, които са изискват.