OCR, Mala Diana

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 2

OCR-технології

Для розпізнавання текстів, тобто перекладу з графічного зображення в


текстовий формат, служать програми оптичного розпізнавання текстів
(OCR).
Оптичне розпізнавання тексту (англ. optical character recognition, OCR) –
це механічне або електронне переведення збереженого рукописного,
машинописного або друкованого тексту в послідовність кодів, що
використовують для представлення в текстовому редакторі.

Оптичне розпізнавання тексту дозволяє:

редагувати текст;
здійснюваті пошук по словах або фразах;
зберігати його в компактнішій формі;
демонструвати або роздруковувати матеріал, не втрачаючи якості;
аналізувати інформацію;
застосовувати до тексту електронний переклад, форматування або
перетворення в мовлення.

Більшість сучасних OCR діють на трьох рівнях: символів, слів, сторінок.


Однак ABBYY, відповідно до принципів IPA, ввела в FineReader ще один
рівень – всього багатосторінкового документа. Перш за все це знадобилося
для коректного відтворення логічної структури, яка в сучасних документах
стає все складніше.

Саме для цього і була розроблена ADRT (Adaptive Document Recognition


Technology) – технологія аналізу і синтезу документа на логічному рівні. В
кінцевому підсумку вона допомагає зробити результат роботи FineReader
максимально схожим на оригінал.

Серед подібних до Abby FineReader систем можна назвати:


SimpleOCR;
OmniPage;
Readiris;
CuneiForm.

Отже, оптичне розпізнавання текстів є зручним інструментом для створення


цифрових документів з паперових оригіналів. Текстове подання дозволяє
здійснювати подальшу обробку інформації, отриману шляхом сканування
або фотографування. Актуальність розпізнавання текстів зросла з набуттям
поширення пристроїв для читання електронних книг, що дозволяє створити
більш комфортні умови читання. Завдяки оптичному розпізнаванню, значно
спростилося завдання пошуку інформації у електронних бібліотеках (можна
знайти не лише том або розділ книги, а навіть конкретні речення або слова.

You might also like