Download as pdf or txt
Download as pdf or txt
You are on page 1of 52

ABBYY FineReader - Scan Tutorial Vol.

2 - (Advanced)

-PozdravNAKNADNO UBACIVANJE ISTE ILI MODIFICIRANE NASLOVNE STRANE

NAPOMENA, za ovo vam je potreban vanjski program za obradu slika, ako ga nemate ili neznate ili neelite da se bakete sa takvim stvarima, ne itajte dalje ovaj text, ono to ste nauili do sada je vie nego dovoljno Isto tako, ako niste skinuli "vol.1" , punog naziva "AFR-Tutorijal za skeniranje knjiga", ovo vam nee biti od neke velike koristi. Posluiu se onim batchem "orlov dar" , nije skenirana cijela knjiga, neko samo 6 stranica, ali e posluiti svrsi. Pretpostavimo da je prvobitna upotreba CROP alatke mogla poprilino usrat naslovnicu AKO smo ju skenirali u AFR-u (odsjei dio slova naslova ili bitne detalje) [ kao to znamo? Nismo tada skenirali naslovnicu (korice) knjige ...] Ja u se ovdje kao vanjskim programom za obradu slika postuiti Corel-om, a vi naravno svojim, koji ve jest, AdobePhoto-ovo Photo-ono itd Najprije u otii u "batch folder" "orlovdar", gdje sam spremio batch (kao to znamo, svi imagesi su tamo ve croppirani) i pogledati koja je veliina, izraena u pixelima, croppiranih imagesa. Za tu svrhu je dovoljno pokaziva mia dovesti iznad bilo kojeg " xxxx.TIF " imagea/slike (kaem svejedno iznad kojeg jer su SVI jednako kropirani i imaju iste mjere). Tamo NA DVA mjesta dobijemo nabrzak informaciju o veliini slike

SAD kad smo dobili i zapamtili tu informaciju pokreemo program za obradu slika i iz njega ( Corela, AdobePhotosa ili koji ve jest) POZIVAMO skener i skeniramo naslovnicu ... VANO: Rezolucija treba biti ista kao i ona u kojoj smo skenirali tu knjigu; u veini sluajeva to e biti 300 dpi i naravno postavke skenera promijenjene u COLOR mod, osim ako ba slika nije crno bijela, tada bi ostavili "Grayscale" mod .. EVO nam skenirane slike u Corelu (sl.62) :

- ove rubove najbre u sredit sa CROP alatkom, iako ima jo bar 5 naina na koji se to moe srediti ...

Kada je slika croppirana, idemo na IMAGE >>> RESAMPLE , ime emo slici promijeniti dimenzije, i to tono onakve kakve imaju sve ostale slike u batchu "orlovdar", a znamo od prije (sl.61) da su to 1079 x 1802 pixela. Da bi uspjeli ukucati tono TE dimenzije OPCIJA "Maintain Aspect Ratio" MORA biti iskljuena !

NAKON resampla na onu nau 1079 x 1802 dimenziju, moemo jo prepravljati sliku, npr ako je oteena, iarana ili slino, evo ja u maknuti onaj kvadrat u dnu slike desno sa oznakom "Drugo izdanje" , i kad konano to sve zavrimo, spremimo sliku obavezno kao " .TIF " image i to recimo (da posle ne traimo gdje je) u onaj batch folder "orlovdar", pod nekim bezveznim imenom, npr "xyz.tif "

Program AFR trebao bi biti ugaen sada kada izvodimo ovu makinaciju

SADA pokrenimo AFR ; Tamo ve postoji (textualna) naslovna stranica koju smo napravili u prolom tutorijalu, i u folderu "orlovdar" ona je pohranjena pod imenom " 0001.tif " Zato emo mi, da bi oslobodili to mjesto, izvesti jednu renumeraciju svih slika tako da prva slika u cijelom batchu nosi broj "2"

Sada sa CTRL+O ili preko file > Open Image idemo otvoriti onu nau xyz naslovnicu ..

Kada ju AFR otvori, DODIJELITI e joj, zadnji, najvii redni broj , stoga e se ona nalaziti NA DNU Batch prozora , no to e Vam odmah i biti predoeno ...

Npr ako je knjiga dotada imala 250 stranica, naa novootvorena xyz naslovnica imati e broj 251

U NAEM SLUAJU, poto ja nisam skenirao cijelu knjigu, nego nekoliko stranica, za potrebe tutorijala, naa xyz.tif naslovnica dobila je tako broj "7"

DA bi NASLOVNICA izbila na prvo mjesto naeg Batch-a, treba ju Renumerirati, odnosno dodijeliti joj broj 1 a prema onome otprije, ( slika 60 B ) znamo da imamo upranjeno mjesto na poziciji 1 . . .

Kada je konano slika dobila poziciju broj 1 , imamo vie mogunosti za njezino prepoznavanje Poeti u sa najlakom: Uzmemo alatku "Draw Picture block" i CIJELU sliku (stvarno cijelu, potrudite se da crveni okvir rastegnete do maksimuma, jer inae zna ostati koji milimetar, to kasnije izgleda neestetski) u Image prozoru uokvirimo sa njome, te stisnemo CTRL+R

Stisnemo CTRL+R i dobijemo :

Spremiu sada SAMO PRVE dvije stranice knjige u PDF da vidimo kako je ispalo ..

---------------------------------------------------------------------------SADA u opisati jo jedan nain na koji moemo u AFR-u urediti naslovnicu, i utediti stotinjak kilobajta. Kao to se vidi, naslovnica se moe podijeliti na tri dijela 1.) u kojem pie "Karlos Kastaneda, 2.) gdje je slika i 3.) gdje pie "ORLOV DAR" Shodno tome dio br.1 emo uokviriti maximalno TEXT Blokom (zeleni kvadrat), br.2 sa Slikovnim blokom (crveni kvadrat) i dio br.3 opet TextBlokom ... i to tako da se granice jedva primjetno preklapaju... U ovom sluaju, koji mi je ba dobrodoao (zbog nepravilnosti), AFR nije bio ba uspjean, tj. Napravio je sranje

U textualnom prozoru ja u uspjeti iza slova V u rijei "ORLOV" nakon "ENTER" komande dobiti novi red i upisati rije koja nedostaje, tj. Rije "DAR" i sve e timati kako treba, Meutim u bloku na vrhu, jedino mogu popraviti "Rastanjea" u "Kastaneda", i ma koliko se trudio, nemogu doi na vrh iznad te rijei da upiem rije "Karlos". (neznam zato je to tako, no TAKO JE) Zato emo se, kao i obino, posluiti malim trikom Najprije emo u Image prozoru kliknut u onaj textualni blok na vrhu i stisnut DEL. (ili desni klik > Delete Block), ime emo se rijeiti glupo neprepoznatog text blocka. ZATIM emo odmah iza rijei "Karlos" iza slova "s", u praznom prostoru, gdje je samo smea podloga, nacrtati jedan mali textualni blok

Te DesniKlik na taj novostvoreni TextBlock > Read Block (sl.73)

Zatim taj TextBlock mirne due razvuemo na veliinu cijelog gornjeg podruja, gdje je prvi puta bio, kada AFR nije proitao text kako treba (sl.74)

Sada moemo na miru upisati u to podruje u Text prozoru, to god treba, u ovom sluaju "Karlos Kastaneda", vodei rauna da po DEFAULTU upisivanje texta ide Times New Romanom veliine slova "10" i crnom bojom to emo morati promijeniti u npr. "40" da bi bili to vjerniji originalu

Desnim klikom na ta selektirana slova odaberemo "Character properties" i promijenimo boju slova u npr. Bijelu kasnije emo to isto ( promijeniti boju u bijelo ) napraviti i sa donjim textom ( "ORLOV DAR" ) tako da budu iste boje.

Prvo , Promijenimo boju texta "Karlos Kastaneda" u npr. Bijelu ( slika 78 )

Drugo, sada to isto napravimo sa textom "ORLOV DAR"

Nakon ta smo i to promijenili, spremimo to u PDF, da vidimo kako ispada i dali je OK

Sve je OK, slika je slika , a Text je Text, i kao to vidimo dade se selektirati kao text.

HTIO bih jo napomenuti da bismo dobili boju texta i boju podloge ispod texta potrebno je u opcijama za spremanje PDF-a pod TOOLS > OPTIONS > SAVE > FORMAT SETTINGS > PDF oznaiti/vrkati opciju "Retain text and background colors" to znai da e kreirani PDF iz AFR-a zadrati boju slova i pozadine. Jo da dodam da je razlika debljine ovako spremljene naslovnice 50% manja nego one kada smo cijelu stranicu uokvirili SlikovnimBlokom. NARAVNO nemaju sve naslovnice ba tako genijalno rasporeen text i sliku .. i ponekada emo ba morati cijeli image uokviriti SlikovnimBlokom ...

###########################################################

UBACIVANJE POTPUNO DRUGAIJE NASLOVNICE


I ovdje u se posluiti istim Batchem "orlovdar" iz prethodnog primjera U tu svrhu u tom batchu DELETIRAO sam staru naslovnicu sa onim maevaocima/maevalicama/maevaoice (dovraga, kako se kae kad se dve ene maevaju?) - znai ostalo mi je prazno mjesto br.1 u BATCH prozoru Najprije u u Corel-u kreirati novu sliku

Primijetite da sam stavio one mjere od prije kako bi se podudarale sa ostalim slikama u Batchu "orlovdar"(svaka knjiga koju obradite imati e drukije mjere) I na taj new image u presanjkati/ubaciti neku sliku po elji

I kada je to gotovo, spremim sliku u folder "orlovdar" pod imenom, npr. "abc.tif" Zatim u AFR-u >File>Open PDF/Image > potraim sliku abc.tif i otvorim ju.Ona se postavi, naravno na kraju Batch prozora, pod brojem 7.Otprije znamo da sam oslobodio mjesto broj 1, pa zato sada idem desnim klikom na slikicu 7 u Batch prozoru, Renumber Pages ("Selected Pages" ! ) i dam joj broj 1 ( ma sve je isto kao i u prolom primjeru kada sam ubacivao originalnu naslovnicu...)

I sada mi preostaje da na jedan od ona dva naina obiljeim Image u Image prozoru : ILI da sve uokvirim SlikovnimBlokom, ili, to je ovdje zgodno, Text-Slika-Text (vrh-sredina-dno), evo napraviu to ovom, drugom metodom (kombinacijom texta i slike)

Vidimo da je AFR otprve sve proitao i namjestio kako treba; Sada u to za kontrolu i za potrebe ovog tutorijala, spremit u PDF (samo prve dve strane), dakle CTRL+S :

KO' IVA, JEL'DA? ( orlovica orlica )

Napomena: ako ba morate promijeniti naslovnicu, onda neka to bude neto to ima veze sa naslovom knjige :p

A sada neto o obradi ZADNJE STRANICE, premda biste iz ovoga do sada reenoga, ve trebali pretpostavljati kako e to ii Za ovu priliku, takoe u se posluiti knjigom "orlov dar" Jedina razlika je to u sken izvesti direktno iz AFR-a, a ne iz Corel-a, sluajno zato to ZNAM kakva je zadnja stranica te knjige i da CROP alatkom neu nita izgubiti, osim malog dijela texta na dnu stranice koji oznaava izdavaa knjige, A TO BIH i onako izbrisao kod bilo koje knjige :p

Croppiranje U POETI ne sa njom, nego sa stranicom ispred, str.6, i tamo rastegnuti (ako ve nije) ono Croppodruje maximalno do svih rubova, IME SAM AUTOMATSKI dobio mjeru crop-podruja svih stranica knjige (znamo od prije da su sve croppirane jednako)

Nakon toga, ja elim da mi ta stranica bude druga po redu, dakle odmah iza naslovnice. Znai trebati e imati broj 2 a on je ve zauzet. Izveu mali trik sa renumeracijom: LijeviKlik u BATCH prozoru negdje na podruje izmeu dvije slikice, zatim (oslobodi klik) stisnuti CTRL+A ime emo oznaiti SVE stranice, A ONDA ponovno stisnuti CTRL i , DREI CTRL stisnut, kliknut slikicu 1 , ime ju ODSELEKTIRAM , a sve ostale ostaju selektirane. Zatim, desnim Klikom, po npr. Prvoj od tih selektiranih stranica (br.2) >Renumber Pages> iskoit e mali prozori i tamo umjesto DVOJKE stavimo TROJKU, i izvrimo renumeraciju. Sada emo imati (ako je sve OK) stranice 1-3-4-5-6-7-8, a mjesto br.2 je slobodno. Naa stranica (sl.92) sada ima broj 8 (jo uvijek je zadnja)

Najprije Lijevim klikom po njoj, da ostale stranice odselektiramo, a zatim i Desnim klikom po njoj (po str.8) > Renumber Pages > Selected Pages > ubacimo umjestobr.8 broj 2.

Sada emo probati sa CTRL+R proitati stranicu ...

Vidimo, u desnom dijelu slike kako je nakon rastezanja TextBlocka, CIJELA text stranica u pripadajuoj boji..

NO, POTO ZNAM DA JE NASLOVNICA U CRNOJ BOJI, POGOTOVO NA RUBOVIMA SA KOJIMA E GRANIITI SA OVOM SLIKOM, PROMIJENITI U BOJU POZADINE U CRNO ... Desni Klik u Text windowu > Character Properties .... Kada sam to napravio, da vidim pravi rezultat, spremiti u prve TRI stranice u PDF Najprije sa zadranim CTRLom , miem oznaim prve tri slikice u Batch prozoru, zatim CTRL+S ... ... i HOP.. iskoi PDF ... :

Pogledajmo sada prelaz izmeu druge i tree stranice :

Pogledajmo za kraj, jo i prelaz izmeu textualnih stranica ...

..nema glupih i nepotrebnih ogromnih bijelih rubova ...

EVO - da kaem/ponovim jo i jednu jaaaako bitnu stvar, koja utie na debljinu konanog PDF dokumenta koji emo kreirati. Otvorimo u AFR-u > Tools > Options > Save > Format Settingz > PDF >>> rubrika "Quality "

Cijelo ovo vrijeme, a i inae, koristim opciju MEDIUM. Ona daje optimum kvalitete i debljine zavrnog dokumenta. Opcija LOW dati e nenosno loe Slike u PDF dokumentu, a opcija HIGH, dati e slike gotovo neprimjetno bolje nego MEDIUM, ali e zato ENORMNO poveati debljinu fajla ! Molim Vas drite tu postavku na MEDIUM-u ! ( slika moe biti mutna zato to je mutna i u knjizi, a ne zbog Medium opcije! )

OCR PDF-a
Sada emo se pozabaviti sluajem kada imamo da je netko skenirao knjigu ili neki dokumenat ( NE sa AFR-om) ime je dobio SLIKE stranica knjige i kao SLIKE ih spremio u PDF. ( Kada se takav PDF otvori, na njemu se nemoe selektirati text, jer je u PDF-u pohranjena SLIKA a ne TEXT - nije izvren "OCR" (optical character recognizing) tj. Optiko prepoznavanje texta [sa slike] emu AFR i slui) OBINO su takvi PDF-ovi debeli 30 -100 Mb jer su skenirani u "sivoj skali" (grayscale) ili koloru ili nekim kombiniranim prilagoenim postavkama ----------------------------------------------------------------------------------VANO: IZUZETAK u takvom nainu rada ine oni rijetki, koji imaju malo vie znanja o tome, pa kada skeniraju knjigu (ne radei OCR) u postavkama stave da se skenira u crno-bijelom (C/B) modu, tj. u postavkama skenera (na engleskom) " Black and White" (B&W) ili "Newspaper" modu, ime se dobije najmanja mogua debljina slike. - { dodatno smanjenje moe se postii smanjivanjem rezolucije na manje od 300 dpi, ali to je dvosjekli ma, jer u konanici moe ispasti da emo pokvariti vid itajui takav rad } Taj je modus idealan za knjige koje ne sadre fotografije, no ako ih ima, a elimo ih, moraemo promijeniti modus skeniranja barem u "Grayscale". Mudrost se sastoji u tome, da, npr. Ako knjiga ima 200 stranica, od toga njih 50 sadri fotografije, NEMORAMO svih 200 stranica skenirati u "GrayScale" modu, nego onih 150 stranica (bez texta) u C/B modu, a samo onih 50 stranica (sa slikama) u "Grayscale" modu. Tako napravljen PDF nije jako debeo, dakle nema 30 100 Mb, nego otprilike 2 - 10 Mb, zavisno koliko je bilo stranica i fotografija u knjizi. ----------------------------------------------------------------------------------VANO: [ eto, kad spominjem postavke skenera, iako je o tome bilo rije u prvom tutorijalu]- Kada stavljamo postavke skenera za AFR, onda nam je Grayscale idealan oblik, jer, pogotovo kod starih knjiga, AFR e gotovu svaku tokicu praine u C/B modu (koja sada nee biti siva, nego crna, ili je nee biti) nastojati prepoznati kao neko malo slovo. ----------------------------------------------------------------------------------S obzirom da se mi bavimo OCR-om, vratimo se na temu. Otvoriu jedan takav PDF i izvriti OCR VANO: preduvjet uspjenog rada je da su sve slike u tom PDF-u skenirane rezolucijom ne manjom od 300 dpi. Otvoriu Sitchinovu knjigu "Divine Encounters" (na engleskom je) koja ima 40,5 Mb , pohranjena je kao slikovni PDF. Pokrenuo sam AFR, i NAJPRIJE spremio taj budui Batch ( > File > Save Batch As > TamoGdjeMiJeZgodno ) ZATIM sa CTRL+O ( ili >File>Open PDF/Image> "traim i otvaram pdf sitchinove knjige" ) Uitavanje traje koju minutu ... na kraju kada se otvori vidim zato je toliko trajalo ima 396 stranica. Na sliicama u Batch prozoru vidim ute trokutie upozorenja, kad prislonim mia iznad njih, vidim o emu se radi

To upozorenje znai da AFR nije splittao/podijelio sliku na dva dijela, a to je ZATO JER SAM ZABORAVIO u postavkama iskljuiti opciju "Split dual pages" PRIJE POETKA RADA. S obzirom da to nikako nee utjecati na daljni rad, praviu se da to ne vidim. Sada u malo prevrtiti sve sliice u Batch prozoru da steknem predodbu o tome ima li u knjizi slika, kako su rasporeene, kako je text prosjeno rasporeen, itd. Cilje je utvrditi koliko maximalno moemo croppirati stranicu, tj. Da se ne desi da ponemo croppiranje,a ono

naleti stranica na kojoj text ili slika izlazi iz okvira kojim je croppirano prethodnih 234 stranice ...

PRIJE nego to izgubimo 30-60 minuta na croppiranje cijele knjige, izveemo jedan "Reading" CTRL+R, za probu, npr. One stranice 192, da se ne bi desilo da je kvaliteta skeniranja TE knjige tako loa da imamo milion greaka po stranici tako da NA VRIJEME odustanemo od itavog posla . . .

Vidimo da ima svega par greki, i to je prihvatljivo . . . moemo nastaviti rad sa cijelom knjigom Dalje znate kako ide, pa u zakljuiti ovaj sluaj. -----------------------------------------------------------------------------------

TABELARNI BLOKOVI - ( Table Blocks )


Neki puta e u knjizi biti tabela sa nekim vrijednostima. AFR e ju najee i prepoznati kao tablicu, te e tako biti i oznaena u IMAGE prozoru (nakon "Readinga"). Prpajui po tim elijama te table, u image prozoru AFR-a , desnim klikovima, pojavljivae Vam se opcije koje moete skuit i sami, pa se ja neu vie uputati u objanjenja (mogunosti kao spajanje dviju ili vie elija u jednu, razdvajanje jedne na vie elija, proirivanje, smanjivanje i sl. ) Sad nemam ba nijednu knjigu sa tablicom, no sluajno znam da je u prethodnoj Sitchinovoj knjizi, Sadraj zabunom proitan kao tabela - TO NE ZNAI da je to uticalo na ispravnost Texta. Evo tog primjera: (Tabelarni blokovi uvijek su ucrtani PLAVOM bojom )

Ovaj primjer je ko naruen, jer je stranicu sadraja preporuivo obraditi kao tablicu. Zato jer se zna dogoditi da kada mijenjamo brojeve stranica, da se iz ista mira (ako je sve u TextBlock tipu zeleni kvadrat) onda rije, tj reenica u istom redu u kojem je broj koji smo promijenili neprirodno razvue. Sada u ovo spremiti kao PDF, da vidite kako e ispasti

Vidimo da nema problema, isto tako primijetite da nema vidljivih rubova tabele. RUBOVI Tabele biti e vidljivi AKO su vidljivi i u originalnom dokumentu Pogledajmo originalnu stranicu u AFR-u, vidiemo da i nije imala rubove (tablicu) ucrtanu : ( sl.108 ) [ zato sam i rekao na poetku da je AFR tu stranicu ZABUNOM prepoznao kao tablu ]

Sada u izmislit neku "pravu" tablicu (u Corel-u) i otvoriti stranicu u AFR-u, za potrebe ovog tutorijala :

Kako vidimo, nakon CRTL+R, imamo tablicu u text prozoru,

Sada u je spremiti u PDF da vidite rezultat, tj. Da e se tablica sa rubovima vidjeti, jer su prisutni i u originalu:

-----------------------------------------------------------------------------------

Vratiu se sada na pojavu koju sam maloas spominjao, koja se javlja pri obradi stranice sa SADRAJEM. Zna se dogoditi da kada mijenjamo brojeve u sadraju [kako bi stvarni brojevi stranica, koji su se promijenili naim deletiranjima stranica o emu je ve bilo rije doli u sadraj] da se iz ista mira rije, tj reenica u istom redu u kojem je broj koji smo promijenili neprirodno razvue.

S obzirom da slika govori vie nego 'iljadu rijei :

EVO, NITA NISAM MIJENJAO u Text prozoru, sve nakon CTRL+R ostaje netaknuto, sada to spremim u PDF :

SVE JE OK Sada mijenjam u Text prozoru brojeve kako bi odgovarali pravom poloaju stranica u dokumentu :

I KADA TO SPREMIM U PDF .... GLE :

SADA u Vam pokazati jedan od naina da se to pobolja Tabelarni blok bi moda uspio, no ja sluajno znam da ovdje nee, pa u: Ucrtati posebne textualne blokove za JEZGRO TEXTA, te za svaku SKUPINU brojki poseban blok ( U sluaju potrebe, moemo extremno svakoj reenici i svakom broju dati svoj textualni blok . . . ) Evo, vidi sliku 116

. . . i SAD spremim to u PDF ...

VIDIMO DA JE SADA SVE OK!

--------------------------------------------------

SKORO ZABORAVIH JEDNU VEOMA VANU NAPOMENU, ALI AKO STE SE DRALI POSTAVKI IZ TUTORIJALA BROJ 1, NE BI TREBALO BITI PROBLEMA. NAIME, NPR., PRETPOSTAVIMO DA STE CROPPIRALI CIJELU KNJIGU, OBRADILI JU, SPREMILI U PDF A KAD ONO OGROMNI BIJELI RUBOVI U FINALNOM PDF-U ! TO JE ZATO JER STE MODA SLUAJNO IZMIJENILI JEDNU POSTAVKU POD FORMAT SETTINGS / PDF ---> Keep original image size [mora biti ukljuena ]

-------------------------------------------------

TO BI BILO SVE -

- Pozdrav -

You might also like