Professional Documents
Culture Documents
Opticko Prepoznavanje Znakova
Opticko Prepoznavanje Znakova
8. prosinca
2021
Optical Character Recognition
Sažetak
Software za optičko prepoznavanje znakova (Optical Character
Recognition, OCR) skenira i prepoznaje tekst te ga zatim zapisuje u
formatu pogodnom za za obradu dokumenata ili teksta (word procesora) u
kojem se dalje može obrađivati.
Prikazan je povijesni razvoj OCR tehnologije te stavljen naglasak na
prve komercijalne primjene.
Također je dan uvid na trenutno stanje OCR tehnologije s nekim
najnovijim postignućima, poglavito Intelligent Character Recognition
tehnologije.
OCR software postupak prepoznavanja radi na 3 glavna načina:
prepoznavanje uzoraka (Pattern Matching), prepoznavanje posebnosti
(Feature Extraction) i provjera pravopisa (Spell Checking).
Sadržaj
1. UVOD.............................................................................................................3
2. POVIJEST.......................................................................................................4
2.1. Prvi komercijalni sustavi............................................................................5
2.2. OCR-A, OCR-B..........................................................................................6
3. TRENUTNO STANJE OCR TEHNOLOGIJE..............................................................7
3.1. Intelligent Character Recognition (ICR)........................................................8
4. OCR U DRUGIM NAMJENAMA.............................................................................9
4.1. Music OCR...............................................................................................9
4.2. Magnetic Ink Character Recognition (MICR)................................................14
4.3. Bar Code Reader.....................................................................................16
4.4. Optical Mark Reader................................................................................17
5. OCR SOFTWARE............................................................................................18
6. NAČIN RADA.................................................................................................22
6.1. Prepoznavanje uzoraka (Pattern Matching).................................................22
6.2. Prepoznavanje posebnosti (Feature Extraction)...........................................22
6.3. Provjera pravopisa (Spelling Check)..........................................................23
6.4. Posebni simboli.......................................................................................23
6.5. Funkcionalni prikaz..................................................................................24
7. ZAKLJUČAK...................................................................................................30
8. Literatura.....................................................................................................31
Ovaj seminarski rad je izrađen u okviru predmeta „Podatkovni višemedijski prijenos i računalne
mreže“ na Zavodu za elektroničke sustave i obradbu informacija, Fakulteta elektrotehnike i
računarstva, Sveučilišta u Zagrebu.
Sadržaj ovog rada može se slobodno koristiti, umnožavati i distribuirati djelomično ili u cijelosti,
uz uvjet da je uvijek naveden izvor dokumenta i autor, te da se time ne ostvaruje materijalna
korist, a rezultirajuće djelo daje na korištenje pod istim ili sličnim ovakvim uvjetima.
2
Optical Character Recognition
1. Uvod
3
Optical Character Recognition
2. Povijest
4
Optical Character Recognition
5
Optical Character Recognition
6
Optical Character Recognition
7
Optical Character Recognition
8
Optical Character Recognition
9
Optical Character Recognition
10
Optical Character Recognition
Slika 4 - 2. korak otvoriti snimljenu sliku u Vivaldi Scan programu koji će zatim
prepoznati notne zapise.
11
Optical Character Recognition
12
Optical Character Recognition
13
Optical Character Recognition
Slika 12 - Primjer u MICR E13 fontu. Specijalni znakovi su redom: dash, transit,
amount, on-us.
14
Optical Character Recognition
15
Optical Character Recognition
16
Optical Character Recognition
17
Optical Character Recognition
5. OCR Software
18
Optical Character Recognition
19
Optical Character Recognition
Osim ovih aplikacija postoje još neke poput Top Image Systems,
CompuThink ViewWise, Brainware, ReadSoft i drugih koji su
specijalizirani za brzu obradu poslovnih dokumenata u vrlo velikim
količinama te svoju namjenu i nalazt u profesionalnim okruženjima poput
banaka ili srednjih i velikih tvrtki. Kao takve ove aplikacije nisu zanimljive
uobičajenom korisniku.
20
Optical Character Recognition
21
Optical Character Recognition
22
Optical Character Recognition
6. Način rada
23
Optical Character Recognition
Ime Slika
OCR Hook
OCR Chair
OCR Fork
OCR Inverted Fork
OCR Belt Buckle
OCR Bow Tie
OCR Branch Bank
Identification
OCR Amount of Check
OCR Customer Account
Number
OCR Dash
OCR Double Backslash
24
Optical Character Recognition
25
Optical Character Recognition
26
Optical Character Recognition
27
Optical Character Recognition
28
Optical Character Recognition
Slika 28 - Primjer Times New Roman fonta koji OCR sustav lako prepoznaje.
29
Optical Character Recognition
30
Optical Character Recognition
7. Zaključak
31
Optical Character Recognition
8. Literatura
32