Professional Documents
Culture Documents
Osnove Multimedijalnih Tehnologija PDF
Osnove Multimedijalnih Tehnologija PDF
Dr Zoran Bojkovi
Dr Dragoljub Martinovi
OSNOVE
MULTIMEDIJALNIH
TEHNOLOGIJA
-udbenik-
Beograd
2011.
Autori: dr Zoran Bojkovi i dr Dragoljub Martinovi
Recenzenti: dr Bratislav Milovanovi, dr Duan Starevi
Lektor: Slavica Baji, dipl. filolog
Tehniki urednik: mr Milica Mii, dipl. in. elektr.
Izdava: Visoka kola elektrotehnike i raunarstva strukovnih studija
Za izdavaa: dr Dragoljub Martinovi
tampa: MST Gaji, Beograd
Tira: 20
004.4'27(075.8)(0.034.2)
BOJKOVI, Zoran,
Osnove multimedijalnih tehnologija
[Elektronski izvor] / Zoran Bojkovi,
Dragoljub Martinovi. - Beograd : Visoka
kola elektrotehnike i raunarstva strukovnih
studija, 2011 (Beograd : MST Gaji). - 1
elektronski optiki disk (CD-ROM) ; 12 cm
ISBN 978-86-7982-105-8
1. Martinovi, Dragoljub, [koautor]
a) Multimediji
COBISS.SR-ID 186944524
PREDGOVOR
Rukopis Osnove multimedijalnih tehnologija, posle pozitivne recenzije, Nastavno vee
Visoke kole elektrotehnike i raunarstva u Beogradu odobrilo je za korienje kao udbenik za
predmete Digitalne multimedije 1 i Digitalne multimedije 2. Pisan je s namerom da bude
koristan svim studentima koji izuavaju multimedije na visokim kolama i fakultetima.
U prvih sedam poglavlja autor dr Zoran Bojkovi izloio je fundamente ove oblasti koja
se neprekidno razvija. Koautor dr Dragoljub Martinovi izloio je, u osmom i devetom
poglavlju, aplikativni aspekt multimedijalnih tehnologija.
Autori su zahvalni recenzentima dr Bratislavu Milovanoviu i dr Duanu Stareviu na
korisnim primedbama, mr Milici Mii na pomoi, redakciji i tehnikoj obradi, i Slavici Baji,
profesoru, na lekturi.
iii
iv
SADRAJ
1. Uvod .... 1
1.1 Klasifikacija medija... 2
1.2 Osobine multimedijalnih sistema... 3
1.3 Konvergencija telekomunikacija i raunara.. 4
1.4 Multimedijalni komunikacioni model... 5
1.5 Korisniki zahtevi.. 6
1.6 Mreni zahtevi... 7
1.7 Multimedijalni terminali 7
1.8 Paketski transfer. 8
1.9 Rezime... 10
Pitanja 11
Literatura... 11
2. Osnovi audia. 13
2.1 Karakteristike zvuka.. 13
2.2 Neke karakteristike oveijeg slunog sistema.. 15
2.3 Registrovanje audia 16
2.4 Predstavljanje audio signala....... 16
2.5 Rezime... 18
Pitanja 18
Literatura... 19
3. Vizuelni efekti.. 20
3.1 Neke karakteristike ula vida. 21
3.2 Vidljivost uma.. 23
3.3 oveiji vizuelni sistem. 24
3.4 Vizuelni modeli.. 26
3.4.1 Monohromatski vizuelni model... 26
3.4.2 Vizuelni model u boji... 28
3.4.3 Opti model vizuelnog komunikacionog sistema. 29
3.5 Rezime... 31
Pitanja 31
Literatura... 32
4. Audio-vizuelne integracije... 33
4.1 Interakcija medija.. 33
4.2 Bimodalnost ljudskog govora 34
4.3 Oitavanje sa usana 35
v
4.4 Praenje usana 37
4.5 Audio-vizuelno preslikavanje 37
4.5.1 Konverzija na bazi klasifikacije... 37
4.5.2 Audio i vizuelna integracija kod primena za oitavanje sa usana 38
4.6 Zdrueno audio-video kodovanje.. 38
4.7 Bimodalna personalna verifikacija 39
4.8 Rezime... 40
Pitanja 40
Literatura... 41
6. Kompresija teksta.. 62
6.1 Predstavljanje teksta u digitalnoj formi. 62
6.2 Principi kompresije teksta, statistika suvinost 64
6.3 Shannon-ova teorema kodovanja za beumni izvor.. 67
6.4 Huffman-ovo kodovanje.... 69
6.5 Aritmetiko kodovanje.. 71
6.6 Rezime... 74
Pitanja 75
Literatura... 76
vi
7.4 MPEG-2 standard.. 82
7.5 MPEG-4 standard.. 84
7.5.1 Delovi MPEG-4 standarda... 86
7.5.2 MPEG-4 standard: vizuelni deo... 89
7.5.3 MPEG-4 standard: audio...... 90
7.5.4 H.264/AVC MPEG-4 (Part 10) standard. 91
Kodovanje i dekodovanje kod H.264/AVC standarda................. 93
Entropijsko kodovanje kod H.264/AVC standarda.............. 95
7.6 Kratak pregled standarda za kodovanje mirnih slika. 96
7.7 Standard JPEG 2000.. 97
7.8 MPEG-7 standard...... 98
7.9 MPEG-21 standard 101
7.10 ITU-T proces standardizacije kod audio-vizuelnih komunikacionih sistema 104
7.10.1 Standardi za video kodovanje...... 108
7.10.2 Standardi za kodovanje govora 112
7.10.3 Standardi za multimedijalno multipleksiranje i sinhronizaciju 113
7.11 Rezime... 116
Pitanja 117
Literatura... 119
vii
8.4.2 Font... 150
8.4.3 Prikazivanje teksta na monitoru... 151
8.4.4 Veliina, razmera i tip fontova. 152
8.5 Animacija... 154
8.5.1 Tradicionalna animacija... 155
8.5.2 Kompjuterska animacija... 157
8.5.3 Animacija u multimedijalnim sistemima. 160
Trodimenzionalni objekti u animaciji 3D animacija. 160
Virtualna realnost u animaciji.. 160
8.6 Zvuk u multimediji 161
8.7 Dodir u multimediji... 163
8.8 Miris u multimediji 165
8.9 Interakcija u multimediji 167
8.10 Rezime... 168
Pitanja 170
Literatura... 171
viii
1. UVOD
Prema standardu ISO/IEC JTC1 SC29/WG12, multimedija predstavlja sposobnost
postupanja sa razliitim vidovima prezentacionih medija koji ine tip podataka sa zadatkom da
definiu prirodu informacije u njenom kodiranom formatu.
Komunikacione tehnologije imaju veliki uticaj na razvoj savremenog drutve. Pre pojave
raunara, novine, radio, bioskop i televizija bile su primerena sredstva za masovne komunikacije.
Kada su ranih osamdesetih godina uvedeni personalni raunari, malo ljudi bilo je u stanju da
pretpostavi njihov ogroman uticaj na nau svakodnevnicu. Da bi se to efikasnije koristili
raunarski potencijali, prezentacija informacija treba da bude efikasno strukturirana kroz
memorisanje, prenos i pretraivanje.
Medijum je sredina (vazduh, voda) kroz koju se neto prenosi. Poto skraenica multi
predstavlja multipl, multimedija se odnosi na sredstva komunikacije sa vie od jednog medijuma
[1.1]. Multimedijalne tehnologije su glavna pokretaka snaga za uvoenje itavog niza
pogodnosti i primena sa take gledita korisnika. Radi se o interaktivnom predstavljanju govora,
audija, videa, grafike, teksta, uz injenicu da informacione tehnologije povezuju komunikacije,
raunarsku tehniku, i procesiranje signala u jednu interdisciplinarnu celinu. Pri razmatranju
problematike multimedijalnih tehnologija, pored ostalog, treba uzeti u obzir [1.2]:
1
sloju, naglasak je na kontroli pristupa, alokaciji resursa i irine propusnog opsega, kontroli
zaguenja saobraaja, i modeliranju saobraaja. Jednako je znaajan i kvalitet servisa (eng.
quality of service QoS) u mrenim multimedijalnim sistemima. Zahtev za kvalitet servisa i
odgovarajui parametri moraju biti u skladu sa garancijama QoS [1.3].
Nagli razvoj multimedijalnih tehnologija, i mogunosti razmene multimedijalnih sadraja
preko interneta, doprineli su znaaju poveanja koliine multimedijalnih podataka i to kako broja
dokumenata, tako i veliine pojedinih fajlova. Uz to, pojavila se i potreba za efikasnim
tehnikama kompresije, pretraivanja i pronalaenja eljenih multimedijalnih dokumenata. Treba
istai da se u srcu irokopojasnih mrea nalaze tehnologije koje omoguavaju brzi prenos
podataka prenosnim putevima velikog kapaciteta izmeu razliitih taaka u mrei.
2
MULTIMEDIJALNI PODACI
DISKRETNI KONTINUALNI
3
komunicirati meusobno tako to se kroz mreu prenose multimedijalni podaci u diskretnom ili
kontinualnom obliku.
APLIKACIJE
MIDDLEWARE
TRANSPORTNI SLOJ
KORISNIK
c) KORISNIK S d) KORISNIK
E
R
KORISNIK V SERVER
E
R
KORISNIK KORISNIK
4
1.4 Multimedijalni komunikacioni model
Na multimedijalni komunikacioni model strogo utiu reenja proizvoaa opreme za
personalne raunare i radne stanice, ukljuujui odgovarajui aplikacioni softver sa jedne, i
koncept intiligentne mree sa druge strane [1.7]. Slojeviti model za dananje i budue
multimedijalne komunikacije obuhvata pet komponenata:
PROCESIRANJE,
KORISNIKI TIP B
MEMORISANJE, TRANSPORT
INTERFEJS
PRETRAIVANJE
Kod tipa A postoji korisniki interfejs koji obezbeuje da svi korisnici budu meusobno
povezani dok transportni sloj prenosi multimedijalni signal od jednog do drugog korisnika, ili ka
svim korisnicima u komunikaciji. Korisniki interfejs kreira multimedijalni signal i omoguava
korisnicima interakciju na najlaki nain. Transportni sloj uva kvalitet multimedijalnog signala
kako bi ga svaki od korisnika primio na to kvalitetniji nain. Neki od primera za tip A su
telekonferencija, radiodifuzija, videofoni, uenje na daljinu, kao i scenarija koji se odnose na
deobu radnog prostora.
Kod tipa B, postoji korisniki interfejs za interakciju, i transportni sloj za prenos
multimedijalnog signala od memorije do korisnika. Takoe, postoji i mehanizam za memorisanje
i pretraivanje multimedijalnih signala koje kreira, ili zahteva korisnik. Pored memorisanja i
pretraivanja postojeih multimedijalnih podataka, od najveeg znaaja su memorisanje i
5
auriranje ovih podataka. Neki primeri za tip B ukljuuju difuziju, video, arhive dokumenata iz
digitalne biblioteke, pristup poslovnim sastancima, itd.
Sa take gledita korisnika, njihovi zahtevi u pogledu servisa su definisani putem medija,
sadraja koji se prenose, tipa komunikacija, kao i mogunosti da se kombinuju ova tri faktora. S
druge strane multimedijalni korisniki servisi mogu se podeliti na tri kategorije: lokalni
(neinteraktivni i interaktivni), udaljeni neinteraktivni i udaljeni interaktivni. Takoe se mogu
podeliti na servise za rezidencijalnu, mobilnu i biznis upotrebu. U Tabeli 1.5.1 prikazan je
kontekst u kome se mogu koristiti multimedijalni servisi [1.8].
Uslovi korienja servisa definiu se zavisno od njihove hitnosti, mesta, nezavisnosti.
Terminali i servisi obino se koriste u kancelarijama, kod kue, u prevoznim sredstvima, ili na
javnim mestima. Nezavisnost se moe definisati kao mogunost prenoenja terminala i njegove
nezavisnosti od date infrastrukture, sa take gledita korisnika. Stepen nezavisnosti varira od
jednog do drugog terminala. S druge strane, stepen hitnosti odreuje da li e servis biti
obezbeen u realnom vremenu, ili je dovoljno oflajn servis.
6
1.6 Mreni zahtevi
Sa take gledita mree, najvaniji zahtevi multimedijalnih tehnologija ogledaju se u
sledeem:
7
postupak viestrukog pristupa uz detekciju (eng. carrier sence multiple access with collision
detection CSMA/CD).
TF LINIJA
SABIRNA MAGISTRALA
8
kanala. Video signali su naroito pogodni za paketsku komutaciju. Slike obino sadre oblasti sa
vie ili manje detalja, kao i periode brih i sporih pokreta. Otuda, video kanali treba da budu u
stanju da daju nizove podataka sa promenljivim bitskim protokom [1.11], [1.12]. Paketske mree
prenose direktno signale promenljivih bitskih brzina (eng. variable bit rate VBR). Na strani
predajnika nije potrebna bafer memorija niti kontrola bitskog protoka u povratnoj sprezi. Pod
bafer memorijom podrazumeva se mesto za skladitenje podataka koji se koriste u toku obrade i
prenosa. U principu, bafer se koristi i pri povezivanju mrea za kompenzaciju razlike u brzini
obrade signala izmeu mrenih ureaja. Treba naglasiti i to da paketske mree koje obezbeuju
prioritet paketima istovremeno omoguavaju video koderima da zatite kritinu informaciju.
Takoe, paketski video-transfer kroz mreu za asinhrono multipleksiranje sa vremenskom
raspodelom kanala (eng. asynchronous time division multiplexing ATDM) vremenski
multipleks ili internet, podrazumeva kodovanje i prenos digitalnog video signala pri emu se
vodi rauna o kvalitetu prijemnog signala. U principu, ATDM podrazumeva tehniku
multipleksiranja kod koje se prenos ostvaruje u obliku nezavisnih vremenskih intervala koji se
popunjavaju oznaenim paketima saglasno realnim trenutnim potrebama svake aplikacije. U tom
sluaju, terminalna oprema (tj. korisnika aplikacija) definie trenutni bitski protok, bez obzira
na to koliko on iznosi, a koji se moe menjati u toku trajanja same komunikacije. Na Slici 1.8.1
dat je jedan primer za transfer digitalnog video signala.
VIDEO SIGNAL
KODER
- TRANSFORMACIJA
- KVANTIZACIJA
- ENTROPIJSKO KODOVANJE
- KONTROLA BINARNOG PROTOKA
APLIKACIJA
- STRUKTURIRANJE PODATAKA
MRENO MULTIPLEKSIRANJE/RUTIRANJE
- KOREKCIJA - DETEKCIJA GREAKA
GREAKA UNAPRED - DETEKCIJA GUBITAKA
- KOREKCIJA GREKE
APLIKACIJA
- RESINHRONIZACIJA
DEKODER
- ENTROPIJSKO DEKODOVANJE
- INVERZNA TRANSFORMACIJA
- PRIKRIVANJE GUBITAKA
- POSTPROCESIRANJE
- DEKVANTIZACIJA
KORISNIK
9
servis kroz vie mrea sa komutacijom paketa. IP obezbeuje funkcije adresiranja, specifikacije
tipa servisa, rastavljanje i ponovno sastavljanje i zatite. IP je specificiran u dokumentu Zahtev
za komentar REC791 (eng. request for comment REC). REC-ovi predstavljaju standarde i
preporuke na osnovu kojih funkcionie internet. Ove preporuke objavljuje Grupa za IP standarde
(eng. Internet Engineering Task Force IETF). Ova meunarodna organizacija za standarde
sastoji se od preko 80 radnih grupa i bavi se oblastima vezanim za razvoj protokola kontrole
prenosa/internet protokola (eng. transmission control protocol/internet protocol TCP/IP).
Protokol je razvijen u SAD od strane Ministarstva odbrane, za potrebe meunarodnog rada na
sloju 3(IP) i pouzdanog prenosa na sloju 4 za dvoslojno bezbedno rutiranje (eng. two-level
secure re-routing TSR) zasnovan na klizeem prozoru i retransmisijama. Danas se ova
skraenica koristi za referenciranje na itavu grupu protokola na internetu.
Najbolji izbor za video-transfer je statistiko multipleksiranje uz garanciju kvaliteta. Novi
spojni putevi u mrei su obezbeeni ukoliko se moe unapred garantovati traeni kvalitet,
imajui u vidu optereenje mree na bazi utvrenog saobraajnog toka.
1.9 Rezime
Trend u multimedijalnim komunikacijama ogleda se u obezbeenju servisa koji integriu
tekst, zvuk, mirnu i pokretnu sliku, uz jednostavnost upotrebe i odgovarajuu interaktivnost. S
druge strane, termin multimedijalne komunikacije odnosi se na predstavljanje, memorisanje,
pretraivanje i irenje vremenski obraene informacije u obliku teksta, mirne i pokretne slike,
grafike, govora, zvuka, animacije, rukom pisanog teksta, fajlova podataka, kao to je to
prikazano na Slici 1.9.1.
AUDIO KOMUNIKACIJA
(TELEFONIJA, PRENOS ZVUKA)
10
Pitanja
1. ta je to multimedija?
2. Koje faktore treba uzeti u obzir pri razmatranju problematike multimedijalnih
tehnologija?
3. Kakva je funkcija aplikacionog i mrenog sloja u multimedijalnim komunikacijama?
4. Navesti i analizirati kriterijume prema kojima se sprovodi klasifikacija medija.
5. Koje elemente treba da obuhvati jedan multimedijalni sistem?
6. ta su to kontinualni mediji i kako se ukljuuju u multimedijalni sistem?
7. U emu se ogleda znaaj nezavisnosti medija u okviru multimedijalnog sistema i kako
se ona postie?
8. Nacrtati etiri blok-eme arhitekture za mrene multimedijalne aplikacije.
9. Koje komponente sadri slojeviti model za multimedijalne komunikacije?
10. Oblici multimedijalnih komunikacionih modela: uloga i znaaj pojedinih elemenata.
Navesti odgovarajue blok-eme.
11. Koji su najavaniji zahtevi multimedijalnih komunikacija sa take gledita korisnika?
12. Koje su sve kategorije multimedijalnih komunikacionih servisa?
13. Koji su uslovi korienja multimedijalnih servisa?
14. ta su osnovni zajedniki zahtevi kod uvoenja multimedijalnih servisa?
15. Koji su najvaniji mreni zahtevi multimedijalnih komunikacija?
16. Koja je razlika izmeu saobraajnih i funkcionalnih zahteva u multimedijalnoj mrei?
17. Koje uslove u pogledu organizovanosti treba da ispuni jedna multimedijalna mrea?
18. Koje su funkcije multimedijalnih terminala?
19. Navesti neophodnu opremu za multimedijalne terminale.
20. Koje su karakteristike paketskog transfera multimedijalnih podataka?
21. ime se karakterie paketski video transfer kroz mreu za asinhrono multipleksiranje
sa vremenskom raspodelom kanala?
Literatura
[1.1] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
[1.2] K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Introduction to Multimedia
Communications: Applications, Middleware, Networking. Wiley, 2006.
[1.3] N. Chapman and J. Chapman, Digital Multimedia. Wiley, 2000.
[1.4] T. N. Ryman, Computers learn to smell and taste, Expert Syst., vol. 12, no. 2, pp.
156161, May 1995.
[1.5] R. Steinmetz and K. Nahrstedt, Multimedia: Computing, Communications and
Applications. Prentice Hall, 1996.
[1.6] D. G. Messerschmitt, The convergence of telecommunications and computing: what
11
are the implications today? Proc. IEEE, vol. 84, pp. 11671186, 1996.
[1.7] K. Watabe et al., Distributed desktop conferencing system with multiuser multimedia
interface, IEEE J. Sel. Areas Commun., vol. 9, pp. 531539, May 1991.
[1.8] K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Multimedia Communication
Systems; Techniques, Strandardes, and Netwoks. Prentice Hall, 2002.
[1.9] E. Fouques, Switching and routing: providing value with multimedia services, Alcatel
Telecommun. Rev., no. 3, pp. 198204, 1999.
[1.10] Z. S. Bojkovi, Digital HDTV system compression, J. Commun., vol. 45, pp. 210,
MayJun. 1994.
[1.11] L. Chiariglione and L. Corgnier, System consideration for picture communications, in
Proc. IEEE Int. Conf. on Communications, ICC '84, Amsterdam, Netherlands, pp. 245
249.
[1.12] Z. S. Bojkovi, Some issues in packet video: Modeling, coding and compression, in
2nd Int. Workshop Image and Signal Processing: Theory, Methodology, Systems and
Applications, Budapest, Hungary, Nov. 1995, pp. 223.
[1.13] G. Karlsson, Asynchronous transfer of video, Swedish Institute of Computer Science,
Kist, Sweden, Res. Rep. R95:14, 1997.
[1.14] P. White and J. Groweroft, The integrated services in the Internet: State of the Art,
Proc. IEEE, vol. 85, pp. 19341946, Dec. 1997.
12
2. OSNOVI AUDIA
Audio opseg se razlikuje od osobe do osobe, a reakcija uha na zvuk visoke frekvencije
pogorava se starenjem. Srednjoveni ljudi, sa dobro ouvanim slunim sistemom, uju zvuke
frekvencije iznad 15 kHz. Zvuni talasi prostiru se brzinom od 340 m/s pri sobnoj temperaturi
(20 C). Stoga, talasna duina varira od 17 m (odgovara frekvenciji od 20 Hz) do 1.7 cm
(odgovara frekvenciji od 20 kHz). Spektar audio signala sadri frekvencije, njihove harmonike,
mogue je i modulacione produkte. Najvei broj osnovnih frekvencija zvunih talasa je ispod
5 kHz. Zvuni talasi u opsegu 5 kHz do 15 kHz uglavnom se sastoje od harmonika. Harmonici i
njihove amplitude odreuju kvalitet zvuka. To omoguuje da se razlikuju zvuci koji dolaze iz
razliitih izvora (glas, muziki instrument, npr. klavir ili gitara). Intezitet ili amplituda zvuka
odgovara glasnosti kojom ga uho registruje. Za zvuk ili audio-registrovanje i reprodukciju,
intezitet zvuka se izraunava na dva naina. Najpre se moe izraziti na akustinom nivou, to
predstavlja intezitet koji uho registruje. Drugo, moe se izraziti na elektrinom nivou, jer je zvuk
konvertovan u elektrini signal. U oba sluaja, intezitet se izraunava u dB. Akustiki, intezitet
zvuka meri se preko nivoa zvunog utiska, tj.,
13
P
Intenzitet zvuka ( dB ) = 20 log10 (2.1.1)
Pref
gde je
P akustina snaga zvuka,
Pref intenzitet zvuka na pragu ujnosti.
Utvreno je da je karakteristina vrednost za Pref = 0.0002 dyn/cm2 [2.1] ili Pref = 2 105 Pa.
Ova vrednost se koristi u (2.1.1) za obraivanje intenziteta zvuka. Treba istai da je uho
neosetljivo na nivoe zvunog pritiska manje od Pref . Intezitet audio signala izraava se preko
nivoa elektrine snage, tj.,
P
Intenzitet zvuka ( dBm ) = 10 log10 (2.1.2)
P0
gde je
P snaga audio signala,
P0 1 mW.
14
Slika 2.1.2Anvelopa za muziku notu
15
Jak ton pri zadatoj frekvenciji moe da maskira slabije signale koji odgovaraju susednim
frekvencijama, to je prikazano na Slici 2.2.1. Dakle, ovde jak ton maskira druge blisko
rasprostranjene slabije tonove.
Frekvencijska rezolucija uha nije uniformna u celom audio-spektru od 20 Hz do 20 kHz.
Osetljivost je najvia na niskim frekvencijama i opada na viim frekvencijama.
Na niskim frekvencijama uho moe da razlikuje izdvojene tonove od nekoliko Hz.
Meutim, na viim frekvencijama, tonovi se moraju razlikovati za stotine Hz da bi se mogli
registrovati.
Kombinovanjem frekvencijske osetljivosti i uma maskiranja dobija se prag ujnosti.
Svaki audio signal ija je amplituda ispod praga maskiranja ne uje se.
16
Prva metoda primenjuje se u najveem broju sluajeva kako bi se postigao to manji bitski
protok. Druga metoda se koristi u okviru standarda za digitalni interfejs za muziki instrument
(eng. musical instrument digital interface MIDI).
REGISTROVANJE PLAYBACK
AUDIA GOVORNIK
(MIKROFON)
17
MIDI SIGNAL
ZVUNI MODUL SEKVENCER
MIDI
SIGNAL
KONTROLER
2.5 Rezime
Zvuk ima osobine koje ukljuuju refleksiju, refrakciju i difrakciju. Audio sistemi imaju
mnogo specifinih karakteristika koje proizilaze iz zahteva ula sluha kao krajnjeg korisnika
zvunih informacija. Na primer, uho ima veliku osetljivost na percepciju razliitih vrsta
izoblienja signala. Audio opseg kree se od 20 Hz do 20 kHz. Zvuni talasi u opsegu 5 kHz do
15 kHz sastoje se iz harmonika. Harmonici i njihove amplitude odreuju kvalitet zvuka. Uho i
njemu pridruni nervni sistem predstavljaju kompleksan interaktivni sistem. Uho je osetljivo na
mala izoblienja u signalu, a zanemaruje one za koje se predpostavlja da su izoblieni. Ove
osobine omoguuju da se postigne dobra kompresija radi kvalitetnijeg memorisanja audio
signala. Osetljivost na zvuk se smanjuje u prisustvu drugog zvuka sa slinim frekvencijskim
sadrajem. Ovaj efekat je poznat kao maskiranje. Frekvencijska rezolucija uha nije uniformna u
celom audio spektru. Osetljivost je najvia na niskim frekvencijama i opada na viim
frekvencijama. Obrada i memorisanje zvuka potrebni su u mnogim primenama (radiodifuzija,
muzika industrija, itd.). Za registrovanje zvuka potrebni su izvor, sluaoci i okruenje. Zvuk se
reflektuje od okolnih objekata. Slualac uje zvuk direktno iz izvora, kao i reflektovani zvuk.
Ostale komponente zvuka doprinose tzv. zvunom ambijentu. Eho predstavlja diskretno
ponavljanje dela zvuka u odreenoj prostoriji koji se postepeno gubi usled parcijalne apsorpcije
nastale prilikom svake refleksije zvuka. Fenomen reverberacije zvuka doprinosi oseaju prostora
i znaajan je kod reprodukcije zvuka. Audio signal se moe prikazati pomou talasnog oblika
parametarski (sintezom govora i muzikom sintezom). Muzika se predstavlja koristei MIDI
standard. to se tie MIDI sistema on se sastoji iz kontrolera, sintisajzera, sekvencera i zvunog
modela.
Pitanja
1. Koje su osobine zvuka?
2. ime se karakterie zvuni talas?
3. Kako se deli frekvencijski opseg zvuka?
18
4. U kojim granicama varira talasna duina zvuka i kako se ona odreuje?
5. ta utie na kvalitet zvuka?
6. Kako se izraunava intezitet zvuka?
7. Skicirati dijagram granice ujnosti i podruja govora i muzike.
8. Navesti sekcije iz kojih se sastoji anvelopa zvuka. Skicirati mogui grafik.
9. Objasniti efekat maskiranja zvuka.
10. Kako se postie efikasno memorisanje audio signala?
11. Kako se ponaa uho u pogledu registrovanja tonova na niskim i visokim
frekvencijama?
12. ta je to reverberacija zvuka i kako se manifestuje?
13. Na koji nain se poboljava prostorni oseaj zvuka?
14. Kako se moe prikazati audio signal?
15. ta je to MIDI?
16. Kako izgleda blok-ema za generisanje audio signala i playback?
17. Nacrtati uproenu blok-emu MIDI sistema i opisati najvanije funkcionalne delove.
18. Koji su nedostaci MIDI standarda?
Literatura
[2.1] M. T. Smith, Audio Engineer's Reference Book. 2nd ed. Oxford, Focal Press, 1999.
[2.2] D. R. Begault, 3-D Sound for Virtual Reality and Multimedia. Cambridge, MA:
Academic Press, 1994.
[2.3] B. Bartlett and J. Bartlett, Practical Recording Techniques. 2nd ed. Focal Press, 1998.
[2.4] J. Rothstein, MIDI: A Comprehensive Introduction. 2nd ed. Madison, WI, A-R Editions,
1995.
[2.5] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
19
3. VIZUELNI EFEKTI
Kada udaljeni objekat vibrira, stvara kontrakciju i ekspanziju medijima u okruenju. Pri
tome nastaje zvuni talas koji detektuje ljudsko uho da bi se osetilo prisustvo objekta. Meutim,
kada objekat ne vibrira, ili ne postoji medijum kroz koji se prenose vibracije, uho nee biti u
stanju da oseti prisustvo objekta. Sreom, priroda nas je podarila jo jednim senzorom okom
koje moe da detektuje elektromagnetne (eng. elektromagnetic EM) talase koji dolaze sa
objekta. Od svih naih ula, oko je najefikasniji prijemnik informacija. Savremeni industrijski
svet veoma je orijentisan prema vizuelnoj komunikaciji. iroko je rasprostranjeno miljenje da se
70 % informacija koje dobijamo, prenosi posredstvom ula vida. Otuda je oko najvaniji senzor
u poreenju sa ostalim senzorima, kao to su ulo sluha, mirisa, dodira ili ukusa.
Uzimajui u obzir da se kao krajnji korisnik video informacije pojavljuje ulo vida,
naveemo najpre neke njegove karakteristike. Kako u procesu digitalne obrade slike izvesnu
panju treba posvetiti vidljivosti uma, pojasniemo i ovaj problem.
Poznato je da multimedijalne aplikacije sadre ili generiu slike koje e posmatrati ovek
[3.1], [3.15]. Meutim, ljudsko ulo vida nije dovoljno ispitano. Takoe, ne postoji objektivna
mera kvaliteta koja odgovara ljudskoj proceni o kvalitetu slike. Sreom, istraivanja u oblasti
perceptualne psihologije obezbeuju neka vana saznanja o vizuelnom sistemu.
Na Slici 3.1 prikazana je graa ljudskog oka.
Mrenjaa (retina) je prekrivena fotoreceptorskim elijama. One apsorbuju svetlost od slike koju
na mrenjai fokusiraju lea i ronjaa. Fotoreceptorske elije generiu elektrine impulse koji
20
putuju ka mozgu kroz optike nerve, od kojih se svaki sastoji od oko milion vlakana. Ove elije
su najgue u podruju ute mrlje (fovea). Kad je svetlost slaba, otvor zenice je vei, pa je
svetlost rasuta po veem delu mrenjae i slika je loije fokusirana. Postoje dve vrste
fotoreceptorskih elija, tapii (eng. rods) i unii (eng. cones). Nazive su dobile po njihovom
izgledu. tapii su mnogo osetljiviji i omoguavaju monohromatski vid nou. S druge strane,
unii omoguavaju gledanje u boji, ali samo pri jakom nivou osvetljaja. Postoje tri vrste unia.
Oni dele vidljivi spektar u tri opsega: crveni, zeleni i plavi. Zbog toga su ove tri boje oznaene
kao osnovne boje ljudskog vida. Oko opisuje boju uporeujui odzive svih tipova unia. Zbog
razliite gustine unia osetljivih na crvenu, plavu i zelenu boju, ukupna osetljivost oka je
najvea na zelenu, a najslabija na plavu svetlost. Meutim, ova osetljivost dolazi po cenu
slabijeg raspoznavanja u opsegu zelene boje. Na primer, u mikroskopiji se koriste filteri da bi se
izdvojila samo zelena boja, jer je oko najosetljivije na zelenu boju. Grubo govorei, oko moe da
vidi boje u opsegu od 400 nm do 700 nm. Pitanje koje se esto postavlja je: koja proporcija
crvene, plave i zelene boje odgovara svetlosti jedinstvene talasne duine. Na to pitanje nema
odgovora zbog nekoliko razloga. Pre svega, oseaj boje zavisi od percepcije oveka i opsega
promena od osobe do osobe, a takoe zavisi od ambijenta posmatranja. Od uticaja su i irina i
preklapanja opsega osetljivosti tri navedena tipa unia to znai da se isti oseaj boje moe
dobiti sa mnogo razliitih kombinacija talasnih duina.
21
odgovarajue sjajnosti. Produenje oseaja po prestanku pobude ili persistencija predstavlja
znaajnu karakteristiku oka. Pri odreenoj adaptaciji, persistencija je kraa ako je intenzitet
pobude vei.
Slika 3.1.1Relativna osetljivost oka u funkciji talasne duine, a) svetlost normalne jaine,
b) vrlo slaba svetlost
Neka je B1 sjaj pozadine, a B2 i B2 + B sjaj leve i desne polovine malog kruga, respektivno.
Razlika u sjaju B, koja je potrebna da bi se razlikovala promena od B2 do B2+ B varira zavisno
od razlike u sjaju |B2 B1|.
22
Naime, kada je ova razlika mala, neznatna veliina B je dovoljna da bi se promena
razlikovala. Sa poveavanjem |B2 B1|, B raste, kao to je to prikazano na Slici 3.1.2-b.
Meutim treba naglasiti da je stvarna osetljivost kompleksnija, jer ona zavisi od funkcije
|B2 B1|, od vrednosti B1 ili B2, a takoe i od veliine kruga i trajanja izloenih slika.
to se tie osetljivosti oka, ona se moe posmatrati sa tri aspekta. Prvo, kada su varijacije
osetljivosti nezavisne od slike i kada prag detekcije uma raste sa porastom frekvencije uma, to
je tzv. frekvencijska zavisnost. Drugo, kada su varijacije osetljivosti zavisne od slika i kada prag
detekcije uma raste sa porastom broja detalja na slici, to je tzv. zavisnost od detalja. I najzad,
tree, kada su varijacije osetljivosti zavisne od slike i kada prag detekcije uma raste sa porastom
osvetljaja, to je tzv. zavisnost od osvetljaja [3.3].
Na kraju, treba istai da oko ima sposobnost usrednjavanja na one delove slike koji
sadre bitnu informaciju. Poto je prenosni sistem sloeniji ukoliko je broj optikih informacija
koje treba prenositi vei, ne treba ni prenositi one optike informacije koje oko pod normalnim
uslovima ne moe da primi.
gde je
Sn () spektralna gustina signala smetnji unutar propusnog opsega W prenosnog sistema,
V() teinska funkcija koja predstavlja relativnu osetljivost oka na pojedine frekventne
komponente.
Teinska funkcija V() ukljuuje uticaj prenosne funkcije sistema za prenos slike, kao i
vizuelnog sistema posmatraa.
23
U vezi sa problemom vidljivosti uma, stoji pitanje kvaliteta pogorane slike. On je
definisan subjektivnim nalazima i moe se uporeivati na osnovu subjektivnih odgovora
posmatraa. U literaturi se esto koristi kriterijum srednje kvadratne greke [3.4].
Ako se sjajnost ulazne slike predstavi funkcijom f(x, y) a sjajnost izlazne slike funkcijom
g(x, y), gde su (x, y) prostorne koordinate, greka je data izrazom
Vidi se da kvalitet pogorane izlazne slike g(x, y) ne zavisi samo od greke (x, y) ve i
od originalne slike f(x, y).
24
Ako je L () ulazna raspodela energije koja dolazi iz svetlosnog izvora, svetlost koju
prima posmatra nekog objekta moe se izmeriti u obliku:
Ukoliko su svetlosni izvor, objekat i posmatra stacionarni, spektar od I() imae isti
frekvencijski opseg kao i L(), ali e im spektri biti razliiti, to odreuje ().
Kada posmatra primi svetlosnu energiju raspodele I() poinje kompleksan proces u
vizuelnom sistemu koji se odnosi na formiranje slike. Radi efikasnijeg projektovanja prenosnog
sistema, vano je prouiti karakteristike HVS. To je znaajno i zbog displeja informacija o slici.
Da bi se smanjila cena prenosa i displej ureaja, vai princip da ne treba prenositi niti prikazivati
informaciju koju oko ne moe da vidi.
oveiji vizuelni sistem tretira se kao optiki sistem. Naime, kada svetlost objekta padne
na oko, zenica oka deluje kao jedan prorez, slika se stvara na mrenjai, a gledalac vidi objekat.
Uoena veliina objekta zavisi od ugla pod kojim se ovaj stvara na mrenjai. Mrenjaa moe
bolje da razlui detalje kada je slika na mrenjai vea i kada se iri na vie foto receptora.
Zenica kontrolie koliinu svetlosti koja pada na oko. Ona je prenika 2 mm. Pri slabijem
osvetlenju, veliina raste kako bi se omoguilo da dolazi vie svetlosti, dok pri jaem osvetljenju
njena veliina opada da bi se ograniila koliina svetlosti.
U cilju uproenja HVS modela nainjeno je nekoliko predpostavki. Pre svega,
predpostavljeno je da je HVS linearni sistem to je u optem sluaju tano za slike sa malom
kontrau. Zatim, moe se predpostaviti da je HVS izotropan u prostornom domenu, tj. da oi
nemaju ni jedan preferencijalni pravac (prema horizontalnom, vertikalnom ili dijagonalnom).
Takoe, utvreno je da je osetljivost oiju u dijagonalnom pravcu manja nego u horizontalnom
ili vertikalnom, pa se ta injenica koristi kod mnogih modela.
Najzad, HVS se moe tretirati kao sistem koji se sastoji iz nekoliko podsistema. Istakli
smo da kada svetlost pada na oko, zenica se ponaa kao jedan prorez. To je ekvivalentno
niskopropusnom filtru. Zatim, spektralni odgovor oka (a to je funkcija efikasnosti osvetljaja
V()) se primenjuje na dolaznu svetlost, pa se dobija osvetljaj slike.
Osetljivost oveijeg vizuelnog sistema je mala na visokim prostornim frekvencijama.
Ova osobina koristi se u mnogim primerima obrade slike. U sluaju videa, kamera cilja slike (ili
video kadrove) koje brzo slede jedna za drugom. Displej ureaj (TV, kompijuterski monitor)
prikazuje individualne kadrove istom brzinom. Ukoliko je brzina prikazivanja individualnih
kadrova iznad izvesnog praga, HVS ne moe da opaa individualne kadrove, pa zato izgleda kao
da se pokretna slika menja kontinualno. Kritina brzina promene kadra zavisi od faktora kao to
su uslovi gledanja i video sadraj.
Danas postoji veliki broj istraivanja koja se bave odreivanjem kritine brzine kadra i
njene zavisnosti od eksperimentalnih rezultata. Naveemo jedan primer. Takasti izvor svetlosti
menja osvetljaj prema zakonu:
L + Lcos(2ft)
gde je
L amplituda promene,
25
f frekvencija u Hz.
Ukoliko L ima dovoljno veliku vrednost, a frekvencija nije suvie visoka, opaa se tzv. fliker
efekat. Za bilo koju datu vrednost frekvencije, vrednost L koja prizvodi prag oseaja flikera
odreena je eksperimentalno. Oznaimo tu vrednost sa LT.. Odnos L/LT poznat je kao
osetljivost na kontrast oveijeg vizuelnog sistema. Oko je osetljivije na fliker efekat pri
visokom osvetljaju. Osetljivost na fliker je zanemarljiva iznad (50 do 60) Hz. Ova osobina slui
kao polazna osnova za projektovanje TV sistema i kompjuterskih displej ureaja.
Iu(x, y) Ii(x, y)
OPTIKI SISTEM
H(x, y)
+ +
i ( x ,y ) = I ( x, y ) exp i ( x + y ) dx dy .
i x y (3.4.1.2)
26
i (x, y) = H(x, y) u (x, y). (3.4.1.3)
Polje slike na izlazu iz posmatranog sistema dobija se iz izraza (3.4.1.2) kada se primeni
inverzna Fourier-ova transformacija, tj.,
+ +
1
I i ( x, y ) =
4 2 ( , ) exp i ( x + y ) d
i x y x y x dy . (3.4.1.4)
to se tie transfer funkcije, to je u optem sluaju kompleksna veliina koja se moe predstaviti
preko modula |H(x, y)| i faze (x, y), tj.,
Moduo |H(x, y)| naziva se modulaciona transfer funkcija, dok se (x, y) po neki put sree u
literaturi pod nazivom fazna transfer funkcija [3.8].
Na Slici 3.4.1.2 prikazana je blok-ema monohromatskog vizuelnog modela
logaritamskog tipa. Ako je odziv ula na ulazni signal logaritamskog tipa, tada ukoliko signal
ima oblik jednog eksponencijalnog sinusnog talasa, tj. exp[sin Iu(x, y)], oveiji vizuelni sistem
moe biti linearizovan [3.6].
LINEARNI SISTEM
LOG H(x, y)
SIGNAL
RECEPTOR
I i ( x , y ) = k1 log [k 2 + k 3 I u ( x , y )] (3.4.1.6)
gde
ki , i = 1, 2, 3 predstavljaju konstante,
Iu (x, y) predstavlja polje objekta na ulazu u sistem.
Jedan drugi monohromatski vizuelni model predloio je Cornsweet [3.9]. Kod ovog
modela, odziv je oblika
K1 I u ( x, y )
I ( x, y ) = (3.4.1.7)
i
K 2 + I u ( x, y )
gde
27
K1 i K2 predstavljaju konstante.
( x, y ) = Iu ( x, y )
S
I i
(3.4.1.8)
gde je
S konstanta koja prua solidno slaganje mere vizuelne vernosti sa subjektivnom
procenom.
e1 = c ( ) S1 ( ) d (3.4.2.1)
e2 = c ( ) S2 ( ) d (3.4.2.2)
e3 = c ( ) S3 ( ) d (3.4.2.3)
gde je
c() raspodela spektralne energije svetlosnog izvora.
Kada se na tri napred navedena signala primeni logaritamska transfer funkcija, dobijaju
se originali:
d1 = log ( e1 ) (3.4.2.4)
e
d 2 = log ( e2 ) log ( e1 ) = log 2 (3.4.2.5)
e1
e
d3 = log ( e3 ) log ( e1 ) = log 3 . (3.4.2.6)
e1
28
Na kraju, signali d1, d2 i d3 prolaze kroz linearne sisteme ije su transfer funkcije
H1(x, y), H2(x, y) i H3(x, y) respektivno. Signali g1, g2 i g3 na izlazu iz odgovarajuih
linearnih sistema pruaju osnovu za percepciju boje u mozgu.
e2 d2
Log
+ H2 (x, y) g2
APSORPCIJA
ZELENE BOJE
e1 d1
Log H1 (x, y) g1
APSORPCIJA UTO-
-ZELENE BOJE
e3 d3
Log
+ H3 (x, y) g3
APSORPCIJA
PLAVE BOJE
29
u kanalu, a time i izoblienje slike. U principu, kod kodovanja video signala cilj moe da bude da
se pobolja kvalitet slike, a da se kapacitet kanala odrava konstantnim, zatim da se smanji
kapacitet kanala da bi se odravao dati kvalitet slike, najzad da se pogorava kvalitet slike da bi
kapacitet kanala bio optimalan.
U X Y
VIZUELNI IZVORNI KANALNI KANALNI IZVORNI PRIJEMNIK
KANAL
SVET KODER KODER DEKODER DEKODER
KRITERIJUM
UM
VERNOSTI
U X Y V
VIZUELNI IZVORNI KANALNI KANALNI IZVORNI PRIJEMNIK
KANAL
SVET KODER KODER DEKODER DEKODER
UM
30
u principu da bude kapacitet kanala C minimiziran pri emu je izoblienje D manje ili jednako
odreenom maksimumu Dmax, tj. D Dmax, ili da izoblienje D bude minimizirano pri emu je
kapacitet kanala C < Cmax, gde je Cmax maksimalni kapacitet kanala.
3.5 Rezime
Od svih naih ula, oko je najefikasniji prijemnik informacija. Oko 70 % informacija koje
dobijamo, prenosi se posredstvom ula vida. oveije ulo vida moe se smatrati diskretnim
sistemom koji karakteriu odreeni pragovi razlikovanja, gradacije sjaja i kritine duine trajanja
nadraaja. Oko je veoma osetljivo na komponente niskih uestanosti i ta osetljivost opada sa
porastom uestanosti. Oko ne reaguje trenutno na promene osvetljaja. Kada se svetlosni fluks
koji pada na mrenjau naglo povea, potrebno je izvesno vreme da se u mozgu stvori utisak
odgovarajue sjajnosti. Na raspoznavanje detalja, osim kontrasta i otrine, utie i adaptacija oka
kao i dinamika slike. Osetljivost oka moe se posmatrati sa tri aspekta: frekvencijska zavisnost,
zavisnost od detalja i zavisnost od osvetljaja. Prisustvo uma znatno smanjuje kontrast i otrinu
slike. um je vidljiviji ako je korelisan sa slikom nego ako je sluajan. Osetljivost oka na
izoblienje u slici zavisi od sadraja elemenata slike koji neposredno okruuju onaj deo gde se
izoblienje pojavilo. Kvalitet slike je definisan subjektivnim nalazima i moe se uporeivati na
osnovu subjektivnih odgovora posmatraa. Radi to efikasnijeg korienja multimedijalnih
tehnologija vano je poznavati karakteristike oveijeg vizuelnog sistema. On se tretira kao
optiki sistem. U literaturi su do danas prikazani razliiti vizuelni modeli: monohromatski
vizuelni modeli, vizuelni modeli u boji, kao i opti modeli vizuelnog komunikacionog sistema.
Prvi opti model dao je Shannon. Neki drugi istraivai (Fano, Pearson) modifikovali su ovaj
model. Na prednjoj strani uvode se izvorni i kanalni koder, dok se na prijemnoj strani uvode
odgovarajui dekoderi. Kod vizuelnih komunikacionih sistema, karakteristike izvora odreene su
metodom razlaganja, brojem elemenata u slici, prisustvom ili odsustvom slike u boji.
Pitanja
1. U emu se ogleda uloga ula vida kao senzora?
2. ime se karakterie ulo vida?
3. Skicirati dijagram relativne osetljivosti oka u funkciji talasne duine i to pri svetlosti
normalne jaine i pri vrlo slaboj svetlosti.
4. Kako se definie mera osetljivosti oka?
5. ta je to persistencija oka?
6. ta utie na raspoznavanje detalja od strane ula vida?
7. Sa kojih se aspekata moe posmatrati osetljivost oka?
8. Kako se moe predstaviti vidljivost nekorelisanih smetnji na slici?
9. Kako se definie svetlost koju prima posmatra od nekog objekta?
10. Opisati nain rada oveijeg vizuelnog sistema?
11. Od ega zavisi osetljivost oveijeg vizuelnog sistema?
12. ta je to fliker efekat i kako on utie na osetljivost oka?
31
13. Nacrtati uproenu blok-emu optikog sistema i naznaiti sve potrebne elemente za
njegovu analizu?
14. Iz kojih se elemenata sastoji monohromatski vizuelni model logaritamskog tipa?
Nacrtati odgovarajuu blok-emu.
15. Kako se odreuje odziv kod Cornsweet-ovog vizuelnog modela?
16. ime se karakterie Mannos-Sakrison-ov model vizuelnog sistema?
17. Nacrtati i opisati blok-emu Frei-ovog vizuelnog modela u boji.
18. Kako izgleda opti model Fano-ovog vizuelnog komunikacionog sistema?
19. Koje su osobine Pearson-ovog modela vizuelnog komunikacionog sistema?
20. Od ega zavisi osetljivost oka na izoblienje u slici?
21. Koja proporcija crvene, zelene i plave boje odgovara svetlosti jedinstvene talasne
duine?
Literatura
[3.1] B. Nasti, Osnovi Televizijske Tehnike. Beograd, Nauna knjiga, 1986.
[3.2] T. Fukinuki, Optimization of D-PCM for TV signals with consideration of visual
property, IEEE Trans. Commun., vol. COM-22, pp. 821826, Jun. 1974.
[3.3] D. J. Connor, R. C. Brainard, and J. O. Limb, Intraframe coding for picture
transmission, Proc. IEEE, vol. 60, no.7, pp. 779791, Sep. 1972.
[3.4] T. S. Huang, W. F. Schreiber, and O. J. Tretiak, Image processing, Proc. IEEE, vol.
59, no. 11, pp. 15861609, Nov. 1971.
[3.5] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
[3.6] W. K. Pratt, Digital Image Procesing. New York: John Wiley and Sons, 1978.
[3.7] J. W. Goodman, Introduction to Fourier Optics. New York: McGraw-Hill, 1968.
[3.8] K. D. Baker, Basic image concepts in Digital Signal Processing, N. B. Jones, Ed.,
1982.
[3.9] T. N. Cornsweet, Visual Perception. New York, NY: Academic Press, 1970.
[3.10] J. L. Mannos and D. J. Sakrison, The effect of a visual fidelity criterion of the
encoding of images, IEEE Trans. Inf. Theory, vol. IT-20, pp. 525536, Jul. 1974.
[3.11] W. Frei, A new model of color vision and some practical limitations, University of
Southern California, Image Processing Institute, Los Angeles, USCEE Rep. 530, Mar.
1974, pp. 128143.
[3.12] Z. Bojkovi, Digitalna Obrada Slike. Beograd, Nauna knjiga, 1989.
[3.13] D. E. Pearson, A realistic model for visual communication systems, Proc. IEEE, vol.
55, no. 3, Mar. 1967.
[3.14] T. Berger, Rate-Distortion Theory: A Mathematical Basis for Data Compression.
Englewood Cliffs, NJ: Prentice-Hall, 1971.
[3.15] J. C. Russ, The Image Processing Hand Book. 5th ed. Boca Raton, FL: CRC Press,
2007.
32
4. AUDIO-VIZUELNE INTEGRACIJE
U multimedijalnim komunikacijama gde je ukljuen oveiji govor, audio-vizuelna
integracija je posebno znaajna. Ne samo da je vano zanemariti verbalnu i univerzalnu
informaciju, ve je interesantno pitanje interakcije izmeu razliitih medija. U ovom poglavlju
pozabaviemo se pitanjem zato su multimedijalne komunikacije vie nego prosto objedinjivanje
teksta, audia, slike i videa. Daemo pregled trendova u multimedijalnom istraivanju radi
korienja audio-vizuelne informacije, pre svega radi uspostavljanja veze izmeu obrade audio i
video signala. Koristei tehnologiju poznavanja govora, analiziraju se govorni talasni oblici kako
bi se otkrio izgovoreni tekst. Na osnovu reenice u tekstu, integrie se glava govornika (eng.
talking head) na osnovu audio-vizuelnog niza i to korienjem kompleksne grafike za analizu
facijalnog modela kao i sintezu teksta i govora kako bi se proizveo sintetiko akustini govor
[4.1], [4.2]. Isto tako, za komunikaciju osobaosoba koja je ukljuena u multimedijalne
aplikacije (videotelefonija, videokonferencija) od interesa je audio i vizuelna interakcija. S druge
strane, audio-vizuelna integracija takoe obuhvata automatsko oitavanje sa usne, primenu kod
prepoznavanja govora animacijom lica govornika, sinhronizaciju usana, praenje crta lica, audio-
vizuelno preslikavanje, zdrueno audio-vizuelno kodovanje, itd.
33
KOMPRESIJA
SINTEZA
AUDIO 3D ZVUK
PREPOZNAVANJE
GOVORA:
SINHRONIZACIJA USANA
TEKST-GOVOR
MULTIMEDIJA ANIMACIJA LICA
ZDRUENO A/V
KODOVANJE
Primer 4.2.1
Kada ujemo zvuk (ba) i vidimo govornika kako kae (ga), on ne opaa ni
(ga) ni (ba). Umesto toga, ono to je generisano je neto to je blisko sa (da).
Neki drugi primeri audio-vizulenih kombinacija su prikazani u Tabeli 4.2.1.
BA GA DA
PA GA TA
MA GA NA
34
Do izraaja dolazi tzv. McGurk-ov efekat, to znai da govor koji registruje
ovek zavisi ne samo od akustinih znakova, ve i od vizuelnih, kao to su, na
primer, pokreti usana. Ukoliko rezultati vizuelne percepcije govora utiu na
audio govor, radi se o tzv. inverznom McGurk-ovom efektu [4.6].
Primer 4.2.2
Primer 4.3.1
Fonemi (p) i (k) imaju sline akustike karakterisitke, ali se mogu lako
razlikovati na osnovu zatvaranja usta. Za uzvrat (p) i (b) fonemi imaju sline
vizuelne karakterisitke ali se akustiki razlikju na osnovu glasnosti.
35
videokonferencijskoj opremi sa ogranienjima u irini propusnog opsega nastaje kada je brzina
kadra takva da nije u sukobu sa percepcijom sinhronizacije usana. Reenje bi mogli biti da se
izdvoji informacija iz akustinog signala koja se odnosi na odgovarajue pomeranje usana, pa da
se zatim obradi slika koja prikazuje usta govornika kako bi se postigla odgovarajua
sinhronizacija usana. Mogue je i izobliiti akustini signal tako da njegov zvuk bude
sinhronizovan sa pokretom oveijih usana. Ovaj prilaz je koristan za promene u nerealnom
vremenu. Da bi se obezbedila sinhronizacija usana, analizator spektra ispituje audio iz studija
kao i originalni zapis. Rezultati se dovode na ulaz u procesor kako bi se modifikovala vremenska
skala za redosled originalnog ubeleavanja. Video kodek esto preskae neke kodove kako bi se
udovoljilo zahtevu za irinom propusnog opsega, to daje kao rezulatat manju brzinu kadra na
dekoderskoj strani. Izostavljanje kadra dovodi do pojave pruga, podrhtavanja i gubitka
sinhronizacije usne. Da bi se reio ovaj problem moemo izdvojiti informaciju iz govornog
signala i obraditi sliku usta tako da se postigne sinhronizacija usne [4.10].
Blok-ema jednog ovakvog prilaza data je na Slici 4.3.1. Modul za praenje kadra
analizira ulazne kadrove kako bi pronaao lokaciju i oblik usta [4.11]. Audio-vizuelni model
preslikavanja analizira audio signal i proizvodi niz odgovarajuih oblika usta koji su izostavljeni
u video kadru. Izostavljanje slike se zatim koristi kod ulaznih kadrova kako bi se modifikovao
oblik usta radi proizvoenja novih kadrova koje treba uneti u originalni video. Uoava se
interakcija izmeu analize slike i analize govora. Rezultat analize slike moe se iskoristiti za
poboljanje tanosti sa kojom se prepozanje govor, kao to je to uinjeno iz automatskog
oitavanja sa usne. S druge strane, govorna informacija se moe iskoristiti za poboljanje
rezultata analize slike.
Slika 4.3.1Blok-ema sistema za izdvajanje informacije iz govornog signala i obradu slike usta radi
postizanja sinhronizacije usne
Pored male brzine kadra, i prenos prouzrokuje gubitak sinhronizacije usne kod video-
konferencije. Kanjenje kod prenosa u sluaju videa je due nego kod audio kanjenja. Tehnika
obrade videa uz pomo govora reava problem izoblienjem slike usta govornika koja je sada u
sinhronizaciji sa audio signalom. Otuda je mogue smanjiti ukupno kanjenje.
36
4.4 Praenje usana
Do danas su razvijeni mnogi postupci za parametarsko predstavljanje govora. Primera
radi, linerani prediktivni koeficijent koristi se u postupku kodovanja, dok se izlazi iz filtera
koriste u postupku prepoznavanja govora. U skladu sa tim, esto se postavlja pitanje kako
analizirati vizuelni signal, tj. u ovom sluaju pomeranje usana. Za razliku od govornog signala
koji je u sutini jednodimenzionalni (eng. one-dimensional 1D), vizuelni izlaz je predstavljen
3D video signalom sa dve prostorne dimenzije i jednom vremenskom domenzijom. Sistem za
vizuelnu analizu treba da konvertuje ovaj niz slika u znaajan parametar. Sistemi za vizuelnu
analizu mogu se podeliti u dve glavne klase. Prva klasa razvrstava sliku usta u jednu od sedam
kategorija, na primer u vizeme. Druga klasa meri parametre ili dimenzije na osnovu ulazne slike,
na primer, visinu i irinu usana. to se tie prve klase, vektorska kvantizacija i neuralne mree su
standardne metode za klasifikaciju ulaznih slika u nekoliko kategorija. Kod druge klase, trae se
parametri ili dimenzije koji imaju neko fiziko znaenje. Tako, na primer, moe se meriti visina
izmeu usana, kao i razmak izmeu uglova usana kao i da se odrede parametri tog modela koji
blisko povezuju model i slike.
Na bazi kompjuterskog vienja (engl. computer-vision) za praenje pokreta usana
govornika, raunar moe da bude tako podeen da je u stanju da razume vizuelni govor [4.12]. U
bimodulnoj analizi i sintezi govora, kljuno je pitanje uspostavljanja preslikavanja akustinih
parametara i onih koji se odnose na oblik usta. To znai da za zadate akustine parametre, kao
to su, na primer, banke filtara, treba proceniti odgovarajui oblik usta. Otuda, u nastavku panju
treba posvetiti audio-vizuelnom preslikavanju, kao i konvertovanju akustinih govornih
parametara u parametre koji karakteriu oblik usta.
37
jedan broj izlaza. Za svaku akustinu klasu ugraene su odgovarajue vizuelne kodne rei kako
bi se proizveo vizuelni efekat.
AUDIO VIZUELNI
ULAZ KLASIFIKACIJA IZLAZ
PRESLIKAVANJE
Svaka od navedenih komponenti ima odogovarajuu strategiju koja izlazi iz okvira ovog
poglavlja.
38
podaci, prijemnik je u stanju da obnovi video uz vrlo malu informaciju sa strane. Postupak
unakrsno-modalne predikcije prikazan je na Slici 4.6.1. Jedan ovakav sistem je skalabilan u
irokom opsegu bitskih brzina.
VIDEO PARAMETAR
SIGNAL X
VIZUELNA MODEL
ANALIZA ODLUIVANJA
(R-D) (X X)
AUDIO X
SIGNAL AUDIO-VIDEO X
PRESLIKAVANJE
39
4.8 Rezime
U multimedijalnim komunikacijama gde je ukljuen ljudski govor, audio-vizuelna
integracija je od posebnog znaaja. Ovaj znaaj ogleda se ne samo zbog razmatranja verbalne i
univerzalne informacije u multimedijalnim komunikacijama, nego i zbog razlike informacija i
integracija izmeu razliitih medija. U ovom poglavlju utvreno je da multimedijalna
komunikacija predstavlja esto vie od prostog objedinjavanja teksta, audia, slike i videa. Kroz
audio-vizuelnu interakciju data je veza izmeu obrade audio i video signala. Naglasak je stavljen
na oitavanje sa usne, sinhronizaciju, audio-video preslikavanje, kao i bimodalnu personalnu
verifikaciju osobe.
Zdruena obrada audio i video signala prua dodatne mogunosti koje nisu prihvatljive
ukoliko se audio i video prouavaju posebno. U dananjim komunikacijama, uglavnom se ne
integriu mediji u komunikaciji meu ljudima. Multimedijalni sistemi dolaze do izraaja kada je
integracija sprovedena na tri kljuna naina: integracija sadraja, integracija korisnika i
integracija sa drugim medijima [4.17]. Primer audio-vizuelne integracije zbog bimodalnosti
percepcije govora je oitavanje sa usana. Ono se naroito koristi u okruenju uma. Na bazi
tehnika kompjuterskog vienja za praenje pomeranja usne u toku govora, kompjuter moe da
razume vizuelni govor. Uz to, automatsko oitavanje sa usana se takoe koristi za akustino
prepoznavanje govora.
Ukoliko brzina promene kadra nije adekvatna za percepciju sinhronizacije usana, jedno
reenje je da se izdvoji informacija iz akustinog signala koji objedinjuje odgovarajue pokrete
usta. Potom se obrauje slika govornikovih usta, kako bi se postigla sinhronizacija usana.
Kljuna stvar u analizi i sintezi govora je preslikavanje izmeu akustinih parametara i
parametara koji odgovaraju obliku usta. Drugim reima, to znai da za date akustine parametre
treba proceniti odgovarajui oblik usta i obratno. Za ovaj postupak postoje mnoge procedure kao
to su korienje vektorske kvantizacije, neuralne mree i skriveni Markovski modeli. Audio-
vizuelna informacija moe se koristiti i za verifikaciju osobe. Postojee relacije izmeu audio i
video signala koriste se za efikasnije kodovanje kako audia tako i videa. Neke druge aplikacije
ukljuuju segmentaciju slike, interfejs ovek-raunar, itd. Takoe, zajednika primena audia i
videa moe posluiti za klasifikaciju multimedijalnih sadraja.
Pitanja
1. U emu se ogleda znaaj audio-vizuelnih integracija u multimedijlanim
komunikacijama?
2. Gde se danas koristi tehnologija prepoznavanja govora?
3. ta sve obuhvata audio-vizuelni interfejs?
4. Nacrtati blok-emu koja prikazuje interakciju medija i naznaiti sve potrebne elemente.
5. Navesti primer audio-vizuelne interakcije pri govornoj komunikaciji.
6. Opisati pojavu audio-vizuelne interakcije kod videokonferencije.
7. ta je to McGurk-ov efekat?
8. ta je fonem, a ta vizem?
9. Od ega zavisi oitavanje sa usana govornika?
40
10. Nacrtati blok-emu sistema za izdvajanje informacije iz govornog signala i obradu
slike usta radi postizanja sinhronizacije usana.
11. Kako se vri vizuelna analiza vezana za pokretanje usne?
12. Opisati nain na koji se vri audio-vizuelno preslikavanje.
13. Iz kojih se elmenata sastoji audio-video konverzija na bazi klasifikacije? Nacrtati
odgovarajuu blok-emu.
14. Navesti glavne komponente koje sadri audio-video sistem za oitavanje sa usana.
15. Kako izgleda blok ema unakrsno modalnog prediktivnog kodovanja?
16. ta je bimodalna personalna verifikacija?
Literatura
[4.1] K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Multimedia Communication
Systems: Techniques, Standards and Networks. Prentice-Hall, 2002.
[4.2] Z. S. Bojkovi and D. A. Milovanovi, Audiovisual integration in multimedia
communications based on MPEG-4 facial animation, Circuits Systems Signal
Processing, vol. 20, no. 3, pp. 311339, 2001.
[4.3] T. Chen and R. R. Rao, Audio-visual integration in multimodal communication, Proc.
IEEE, vol. 86, no. 5, pp. 837852, May 1998.
[4.4] L. R. Rabiner and B. H. Juang, Fundamentals of Speech Recognition. Englewood Cliffs,
NJ: Prentice Hall, 1993.
[4.5] F. Lavagetto, Converting speech into lip movements: A multimedia telephone for hard
of hearing people, IEEE Trans. Rehabil. Eng., vol. 3, no.1, pp. 90102, Mar. 1995.
[4.6] H. McGurk and J. MacDonald, Hearing lips and seeing voices, Nature, vol. 264, pp.
746748, Dec. 1976.
[4.7] D. Burnham and B. Dodd, Auditory-visual speech perception as a direct process: The
McGurk effect in infants and across languages, in Speechreading by Humans and
Machines. Stork D. G. and Hennecke M. E., Eds. Berlin: Springer-Verlag, 1996, pp.
103114.
[4.8] K. Neely, Effect of visual factors on the intelligibility of speech, J. Acoust. Soc. Am.,
vol. 28, pp. 12751277, Nov. 1956.
[4.9] B. Walden, Effects of training on the visual recognition of consonants, J. Speech
Hear. Res., vol. 20, pp. 130145, Mar. 1977.
[4.10] T. Chen, H. P. Graf, and K. Wang, Lip synchronization using speech-assisted video
processing, IEEE Signal Process. Lett., vol. 2, no. 4, pp. 5759, Apr. 1995.
[4.11] R. Rao and R. Mersereau, On merging Hidden Markov models with deformable
templates, in IEEE Proc. 1995 Int. Conf. Image Processing, vol. 3.Washington, DC,
pp. 556559.
[4.12] R. Chellappa, T. Chen, and A. K. Katsaggelos, Audio-visual interaction in multimodal
communication, IEEE Signal Processing Mag., vol. 14, pp. 3738, Jul. 1997
[4.13] S. Voran and S. Wolf, Proposed framework for subjective audiovisual testing, ANSI
41
Working group T1A1.5, vol. T1.A1.5, pp. 93151, Nov. 1993.
[4.14] P. L. Silsbee and A. C. Bovik, Computer lipreading for improved accuracy in
automatic speech recognition, IEEE Trans. Speech Audio Process., vol. 4, pp. 337
351, Sept. 1996.
[4.15] M. R. Civanlar and T. Chen, Password-free network security through joint use of audio
and video, Proc. SPIE Photonic, pp. 120125, Nov. 1996.
[4.16] J. Luettin, N. A. Thacker, and S. W. Beet, Speaker identification by lipreading, Proc.
Int. Conf. Spoken Language Processing, Philadelphia, Oct. 1996, pp. 6265.
[4.17] C. L. Nikias, Riding the new integrated media systems wave, IEEE Signal Processing
Mag., vol.14, pp. 3233, Jul. 1999.
42
5. MULTIMEDIJALNA AKVIZICIJA PODATAKA
Da bi se sprovela analiza i obrada multimedijalnih podataka, potrebno je digitalizovane
audio ili video podatke smestiti u raunar. Posle obrade digitalni signal se rekonstruie, odnosno
konvertuje u analogni oblik. Audio izvori (mikrofoni) ili izvori slike (kamere) u optem sluaju
proizvode analogne signale kontinualne u vremenu. Da bi prikupili audio ili video podatke,
moramo ih odmeravati i digitalizovati. U ovom poglavlju zadraemo se pre svega na primerima
odmeravanja i digitalizacije multimedijalnih podataka.
43
5.2 Odmeravanje
Signali koji odgovaraju realnim porukama su konanog trajanja i imaju beskonano irok
spektar. Meutim, glavni deo spektra koncentrisan je u nekom konanom opsegu uestanosti.
Izvan datog opsega, spektralna gustina amplituda signala poruka postaje toliko mala da e pri
realnim radnim uslovima praktino uvek biti prekrivena umom. Zavisnost frekvencijskog
opsega signala od nivoa uma data je na Slici 5.2.1. Smatra se da signali poruka imaju
ogranieno trajanje i ogranienu irinu spektra. Vidi se da nema razloga da se pri prenosu signala
prenosi i deo spektra iznad uestanosti oznaene sa g. Zbog toga, kontinualnim razlikama
dovodimo u korespodenciju kontinualne vremenske funkcije koje imaju strogo ogranien
spektar.
Na primer, za rad telefonskog signala dovoljno je preneti sve komponente koje se nalaze
u opsegu uestanosti od 300 Hz do 3400 Hz, a da se pri tome sauva razumljivost i snaga
signala. injenica da realni informacioni signali ne sadre spektralne komponente iznad neke
granine uestanosti fg, omoguava diskretizaciju signala po vremenu.
Postupak odmeravanja kontinualnog signala prikazan je na Slici 5.2.2. Ova slika se
sastoji iz: a) kontinualnog signala, b) povorke impulsa s0(t) dobijene odmeravanjem signala s(t) u
intervalima t i c) kola za odmeravanje kontinulanog signala.
Ako u jednakim vremenskim intervalima t uzmemo trenutne vrednosti signala, to je
prikazano na Slici 5.2.2-b, odnosno ako u tim takama generiemo impulse ija je visina jednaka
amplitudi kontinualnog signala, dobiemo povorku pravougaonih impulsa ije amplitude
pripadaju jednom kontinuitetu moguih trenutnih vrednosti signala. Postupak uzimanja trenutnih
vrednosti kontinulanog signala u odreenim vremenskim intervalima naziva se odmeravanje.
Kolo za odmeravanje sastoji se iz dvopolnog prekidaa na koji se prikljuuje signal koji se
odmerava. Prekida ravnomernom brzinom f0 = 1/t naizmenino spaja jedan od dva kontakta.
Neuzemljeni kontakt ostaje ukljuen sekundi, a uzemljeni kontakt je aktivan preostali period
vremena od t sekundi. Na izlazu kola pojavljuje se povorka impulsa irine , periode T = t
i promenljive amplitude. Diskretne vrednosti dobijene odmeravanjem nazivaju se odmerci.
Teorijski, odmerci treba da budu beskonano uski.
44
Slika 5.2.2Odmeravanje kontinualnog signala: a) kontinualni signal, b) povorka impulsa s0(t) dobijena
odmeravanjem signala s(t) u intervalima t, c) kolo za odmeravanje
1
T0 = t (5.2.1)
2 fg
1
f0 = = 2 fg (5.2.2)
T0
0
0 = = 0 f 0 = 2 f g 0 (5.2.3)
T0
45
Postupak odmeravanja moe se shvatiti kao mnoenje signala s(t) i funkcije odmeravanja h0(t) u
vremenskom domenu, tj.,
s(t) s0(t)
MNOENJE
h0(t)
46
Uoava se da je spektar zanemarljiv iznad 12 kHz. Poto su visoko frekvencijske
komponente vrlo male, moe se rei da se signal ne menja velikom brzinom. U tom sluaju,
mogue je odmeravati signal i obnoviti ga kompletno primenom interpolacije ukoliko je
frekvencija odmeravanja dovoljno visoka. Traena frekvencija odmeravanja odreuje se
primenom Nyquist-ovog kriterijuma.
Primer 5.2.1.1
47
Primer 5.2.1.2
B = fh fl
tj.
fl = fh B = 60 Hz 20 Hz = 40 Hz.
Primer 5.2.1.3
+
gs (t ) = g (t ) s (t ) = g ( kT ) s ( t kT )
k =
(5.2.1.2)
48
+
s (t ) = (t kT ) (5.2.1.3)
t =
1 +
Gs ( ) = G ( 2 kf s )
T t=
(5.2.1.4)
Primer 5.2.1.4
49
S druge strane, G(), S() i Gs() su Fourier-ove transformacije od g(t),
s(t) i gs(t) respektivno. Uoimo da je Gs() periodiko proirenje za G(). Dva
uzastopna perioda od Gs() nee se preklapati ako je:
fs > 2B (5.2.1.5)
+
sin ( f s t k )
g (t ) = g ( kt ) ( f t k )
k=
(5.2.1.6)
s
0 f fs/2 (5.2.1.7)
50
5.2.2 Odmeravanje dvodimenzionalnih (2D) slika
Nyquist-ova teorija odmeravanja moe se proiriti na diskretizaciju slika. Neka je slika
predstavljena funkcijom i(x, y) gde su x i y dve prostorne dimenzije. Dvodimenzionalna (eng.
two-dimensional 2D) formirana transformacija slike moe se predstaviti u obliku:
+ +
I ( h , v ) = i (x , y )e
j ( h x + v y )
dx dy (5.2.2.1)
gde je
h horizontalne prostorna frekvencija,
v vertikalna prostorna frekvencija.
+ +
is ( x, y ) = i ( x, y ) s ( x, y ) = i(mx, ny) ( x mx, y ny )
m = n =
(5.2.2.2)
+ +
s (x , y ) = (x m x , y n y ) . (5.2.2.3)
m = n =
51
Proirujui Nyquist-ovu teoriju na dve dimenzije, moe se pokazati da se slika i(x, y)
moe dobiti ako su ispunjeni sledei uslovi:
Jedan znaajan parametar u stvaranju digitalne slike je rezolucija slike. Tako na primer,
kada je slika skenirana, treba navesti rezoluciju skenirane slike. Pogodna rezolucija se odreuje
na osnovu (5.2.2.4) i osobina oveijeg vizuelnog sistema. S druge strane, detalji slike koje
vidimo oima zavise od ugla koji slika formira na retini.
Jedan idealni nisko-propusni filtar ima optu graninu (eng. cut-off) frekvenciju od fs/2
to je prikazano na Slici 5.2.3.1-a. U praksi je meutim nemogue realizovati jedan takav filtar.
Na Slici 5.2.3.1-b prikazan je frekvencijski odziv tipinog filtra koji se moe realizovati. Ovde je
pojaanje u propusnom opsegu blisko jedinici, dok je pojaanje u nepropusnom opsegu blisko
nuli. Prelazni opseg omoguuje postupno opadanje pojaanja i to od 1 ka 0. Projektovanje 1D
niskopropusnog/anti-aliasing filtra moe se proiriti na projektovanje 2D niskopropusnog/anti-
52
aliasing filtra za Slike. U tom sluaju filtar e imati dve granine (cut-off) frekvencije i to po
jednu u horizontalnom i vertikalnom pravcu.
a)
ANALOGNI
AUDIO (C N) ODMERAVANJE
I
DIGITALIZACIJA
DIGITALNI
AUDIO KOMPRESIJA
I KOREKCIJA SKLADITENJE
MULTIPLEKSER
GREKE PODATAKA
DIGITALNI
AUDIO
ODMERAVANJE
I
ANALOGNI DIGITALIZACIJA
AUDIO (N 1)
b)
Uzorak i zadravanje (eng. sample and hold SH) blok slui za dranje amplitudne
vrednosti odmeraka od trenutka odmeravanja audio signala do trenutka nailaska sledeeg
odmerka. Zatim se vri odmeravanje audio signala u svakom trenutku odmeravanja. Analogno
digitalni (eng. analog to digital A/D) konvertor slui za ekvivalentno digitalno predstavljanje
53
analognog signala. Multipleksiranje niza bita koji dolaze iz razliitih kanala vri se pomou
multipleksera. Komprimovanjem se smanjuje suvinost i komprimuje veliina audio fajla pri
emu se odrava prihvatljiv nivo kvaliteta audio signala.
Kada je audio signal kvantovan koristei mali broj bita po odmerku, kvalitet audio
signala je lo. Utvreno je da ako se pre kvantizacije pridoda mala koliina diter uma
subjektivni kvalitet se poboljava.
Ukoliko audio sistem ima vie kanala (na primer 7 8 kanala), gornja procedura se
primenjuje posebno na svaki kanal. To znai da se odmerci iz razliitih audio kanala
multipleksiraju, komprimuju i skladite za budui tzv. playback, to je prikazano na Slici
5.3.1-b.
54
Ukoliko su nivoi odluivanja ekvidistantni, tj. ako je (dk-1 dk) konstantno za svako k,
radi se o uniformnom kvantizeru, to je prikazano na Slici 5.3.1.1-a.
Ulaznoizlazna funkcija i greka kvantovanja za neuniformni kvantizer su dati na
Slici 5.3.1.1-b.
Kvantovane vrednosti signala mogu se predstaviti korienjem razliitih metoda. Najvie
rasprostranjena metoda je tzv. metoda PCM. Tu se svaki odmerak predstavlja korienjem
fiksnog broja bita i kodovan je nezavisno od drugih. Ukupan broj moguih amplitudnih nivoa u
PCM je povezan sa brojem bita koji se koriste za predstavljanje svakog odmerka. Ako je N broj
nivoa izlaza iz kvantizera a B broj bita po odmerku, tada je:
N = 2B. (5.3.1.2)
Vidi se da ukoliko je upotrebljen vei broj bita B za predstavljanje odmerka, broj izlaznih
nivoa N e se poveavati. To e smanjivati greku kvantovanja pa e se dobiti bolji kvalitet audio
signala. Bitski protok kvantnog audio signala dobija se iz izraza:
gde je sa fs oznaena frekvencija odmeravanja, dok je B, kao i pre, broj bita po odmerku. Za
stereo audio, kanali se mogu posmatrati kao nezavisni [5.5]. Otuda, bitski protok za stereo audio
bie dva puta od onoga za mono audio, tj. 2fsB bita u sekundi.
Neugodna smetnja 2
Smetnja se ne osea 5
55
Na skali pogoranja meri se kvalitet ujnosti obzirom na izoblienje u signalu. Za zadati
audio signal grupe ispitanika (nazvani subjekti) su ispitivani da procene kvalitet audio signala
dajui odgovarajue ocene na skali od pet opcija. Miljenja su subjektivna, a rezultati variraju od
subjekta do subjekta. Prosean rezultat (srednja vrednost) se naziva srednja vrednost miljenja
(eng. mean opinion score MOS). MOS zahtev zavisi od oblasti primene. Tako, na primer ocena
tri moe biti zadovoljavajua u telefoniji. S druge strane, za kvalitetan audio, vrednost ocene za
MOS treba da bude bliska pet (vea od 4.5). Subjektivni kvalitet audio signala na osnovu
ljudskog auditornog sistema je sloena procedura koja ukljuuje eksperimente uz prisustvo
eksperata i/ili neekspertnih subjekata. Uz to, na subjektivne procene utie izbor subjekata i
pravilno obavljanje eksperimenta. Iz tog razloga razvijeno je nekoliko kvantitativnih mera da bi
se procenio objektivni kvalitet audio signala.
Izbor objektivne (kvantitativne) mere izoblienja zavisi od vie faktora. Pre svega,
ovakva mera se moe prikazati u prirodnom analitikom obliku, a onda biti prilagoena za lako
izraunavanje. Odnos signalum (eng. signal-to-noise ratio SNR) i srednja kvadratna greka
(eng. mean square error MSE) su dva parametra za utvivanje izoblienja audio signala. Oni
su dati sledeim izrazima:
N 1
f ( n )
2
SNR = N 1
n =0
(5.3.2.1)
f ( n ) f ( n )
2
n =0
N 1 2
1
MSE =
N
f ( n ) f ( n )
n =0
(5.3.2.3)
gde su
f (n) odmerci originalnog audio signala,
f ( n ) odmerci kvantitativnog audio signala i
N predstavlja broj audio odmeraka.
Tradicionalno, SNR je najpoznatija mera za greku. Pored toga to prua korisne informacije,
ovaj odnos je matematiki prilagodljiv, pa je iz tog razloga naiao na najiru primenu. Naalost,
vrednosti SNR nisu u dobroj koleraciji sa subjektivnim ocenama, naroito pri velikim odnosima
kompresije.
Kvalitet digitalnog audio odmerka je odreen brojem bita po odmerku. U procesu
kvatizacije, ulazna vrednost odmerka je predstavljena najblie moguim izlaznim nivoom. U tom
procesu, unosi se um u kvantovani signal. Greka (um) kvantovanja je razlika izmeu stvarne
vrednosti analognog signala i njegove kvantovane vrednosti. Drugim reima
e ( nT ) = f ( nT ) g ( nT ) = g ( nT ) Q g ( nT ) (5.3.2.4)
56
gde je
g ( nT ) ulazni signal,
g ( nT ) izlaz iz kvantizera,
e ( nT ) signal greke u trenutku odmeravanja nT.
Q/2
1 Q 2 22B
Q Q/ 2
2
E= e de = = (5.3.2.5)
12 12
gde je
B broj bita upotrebljen za predstavljanje svakog odmerka.
Q2 2 2B
E = 10log10 = 10log10 = 6B 10.8 . (5.3.2.6)
12 12
Jednakost (5.3.2.6) pokazuje da svaki dodatni bit u postupku A/D konverzije smanjuje
um za oko 6 dB i na taj nain poveava SNR za isti iznos. Tako, na primer, SNR za 16 bitni
kvantovani audio signal e biti reda veliine 96 dB. Za jedan audio signal koji ima SNR vei od
90 dB se smatra da je odlinog kvaliteta za najvei broj primena.
57
vernosti: subjektivni i objektivni. U sluaju subjektivnih mera, koristi se slina skala kao i kod
audio signala za procenu kvaliteta slike. Meutim vizuelno testiranje sa realnim subjektima
predstavlja glomaznu proceduru. Otuda, kada je u pitanju vizuelna vernost, u praksi se najee
koriste objektivne mere vernosti. Ove najee koriene mere su SNR i MSE. Ovim merama
treba pridodati vrni odnos signalum (eng. peak-signal-to-noise ratio PSNR), kao i srednju
apsolutnu greku (eng. mean absolute error MAE). Ako su f ( m, n ) i f ( m, n ) originalna i
izobliena slika, respektivno, dimenzija M N, vizuelna vernost moe se oceniti primenom
sledeih parametara [5.10], [5.11]:
M 1 N 1 2
f ( m, n )
SNR ( dB ) = 10 log10 m=0 n =0
M 1 N 1 2
(5.4.1.1)
m =0 n =0
f ( m, n ) f ( m, n )
M 1 N 1
PSNR ( dB ) = 10 log10 m =0 n =0
M 1 N 1 2
(5.4.1.2)
f ( m, n ) f ( m, n )
m =0 n =0
M 1 N 1 2
1
MSE =
MN
m =0 n =0
f ( m, n ) f ( m, n )
(5.4.1.3)
M 1 N 1
1
MAE =
MN
f ( m, n ) f ( m, n )
m=0 n =0
(5.4.1.4)
Mada ove objektivne mere omoguuju da se brzo proceni izoblienje, one nisu dobro
korelisane sa subjektivnim procenama, naroito kada se radi o velikom izoblienju.
5.5 Rezime
U dananjim telekomunikacionim sistemima, analiza i obrada multimedijalnih podataka
predstavlja vrlo aktuelan problem. Kod analognih sistema javljaju se problemi uma,
nestabilnost, velike potronje energije. Da bi se audio ili video podaci smestili u raunar moraju
se digitalizovati. Digitalni sistemi omoguavaju jednostavan prenos i skladitenje podataka.
Pored toga, iroke mogunosti programiranja ine digitalne sisteme superiornim u odnosu na
analogne. Digitalizacija multimedijalnih signala je opta tema koja se pojavljuje u vie naunih
disciplina. injenica je da su audio i video sistemi uneli mnogo specifinih zahteva koji se
postavljaju prema digitalizovanom signalu, a koji su posledica izuzetnih zahteva ula sluha u
ula vida kao krajnjih korisnika informacija.
Da bi se analogni audio adekvatno digitalizovao njegov spektar mora biti ogranien u
skladu sa teoremom odabiranja. Spektar audio signala moemo ograniiti na dva naina. Prvi
nain je da ga ograniimo samo sa ulaznim filtrom. Drugi nain je da koristimo ulazni filtar u
58
kombinaciji sa tzv. oversampling-om. Pojam oversampling podrazumeva odmeravanje koje
se obavlja na mnogo vioj frekvenciji od Nyquist-ove granice. Poto je frekvencija odmeravanja
dovoljno velika, nee doi do preklapanja u spektru.
Kvantovanje je proces koji trajno unosi greku kako u audio tako i u video signal.
Veliina greke zavisi od broja nivoa kvantovanja. Zbog nelinearnosti karakteristike kvantizera
dolazi do izoblienja koja prouzrokuju harmonike (granulacioni um). Efikasna metoda za
uklanjanje granulacionog uma je diterovanje. To je nezaobilazni proces kod A/D konvertora
audio signala.
Greka kvantovanja moe se smanjiti na dva naina: da se povea broj nivoa
kvantovanja, odnosno broj bita po odmerku ili da se koristi oversampling. Kako je danas
isplativije da se poveava brzina odmeravanja nego broj bita, treba se opredeliti na primenu
oversampling-a.
Ukoliko audio signal dolazi iz vie kanala odmerci iz razliitih audio kanala se
multipleksiraju, komprimuju i skladite za budui playback.
Da bi se digitalizovala slika treba poznavati osobine ljudskog vizuelnog sistema.
Odmeravanje slike vri se pomou vie reetki. Heksagonalno odmeravanje bolje formira
frekvencijsku ravan to rezultuje manjom frekvencijom odmeravanja. Nedostatak ovih tipova
odmeravanja je u tome to nisu skalabilna. Za kvantovanje slike koriste se dve vrste kvantizacije:
skalarna i vektorska. Skalarno kvantovanje koristi uglavnom osam bita, jer vie bita nee
generalno poboljati kvalitet slike, osim ako se ne vre neka dodatna ispitivanja. Prednost
skalarne kvantizacije u odnosu na vektorsku je u tome to je skalarna kvantizacija bra.
Radi postizanja ocene kvaliteta audio signala definiu se dva kriterijuma i to subjektivni
(kvalitativni) i objektivni (kvantitativni). Subjektivni ukljuuje procene na osnovu eksperimenata
sa ispitanicima. Objektivni kriterijum, s druge strane, uzima u obzir odnos signalum i srednju
kvadratnu greku nastalu u procesu kvantizacije signala.
U procesu kvantizacije piksela pogorava se kvalitet vizuelnih podataka. Kada je re o
vizuelnoj vernosti, dva najee koriena parametra za procenu kvaliteta su opet odnos signal
um i srednja kvadratna greka. Meutim, u ovom sluaju kao parametri se jo pridodaju vrni
odnos signalum i srednja apsolutna greka.
U skoroj budunosti od ureaja za akviziciju audia oekuje se: poveanje frekvencije
odmeravanja, zamena analognih komponenti i na taj nain poboljanje performansi sistema za
akviziciju. Korienjem vektorske kvantizacije treba poveati kvalitet i kompresiju digitalnog
audio signala. Treba imati u vidu i to da je zbog porasta kompleksnosti integracije i trenda
smanjenja napona napajanja sve tee realizovati konverziju visoke rezolucije sa klasinim A/D
konvertorima. to se tie akvizicije slike, potrebno je poveanje gustine odmeravanja i na taj
nain poboljanje performansi sistema za akviziciju, korienje vektorske kvantizacije, kao i rad
na usavravanju poluprovodnikih senzora i otklanjanju njihovih nedostataka.
Napretkom tehnologije sve vie se prelazi na digitalne sisteme za akvizaciju slike. Na
primer, razvoj silicijumskih senzora i odgovarajuih ipova osnovni su razlog za iroku
eksploataciju digitalnih kamera.
Pitanja
1. Koji se postupci koriste pri diskretizaciji, a koji pri digitalizaciji kontinualnog signala?
2. ta je to odmeravanje kontinulanog signala i kako se ono vri?
59
3. ta je to kontinualno odmeravanje?
4. Nacrtati blok-emu kola za odmeravanje signala i objasniti kako radi ovo kolo.
5. Kako glasi teroema o odmeravanju?
6. ta je to faktor reima odmeravanja?
7. Nacrtati blok-emu koja ilustruje proceduru odmeravanja u vremenskom domenu.
8. ta predstavlja Nyquist-ov kriterijum?
9. Kako se Nyquist-ova teorija odmeravanja moe proiritu na diskretizaciju slike?
10. U emu se ogleda uloga tzv. anti-aliasing filtra kod multimedijalne akvizicije
podataka?
11. Nacrtati karakteristiku anti-aliasing filtra koji se moe realizovati u praksi i naznaiti
odgovarajue parametre.
12. Nacrtati blok-emu za digitalizaciju audio signala, naznaiti i objasniti funkciju svakog
elementa.
13. Na koji se nain vri N-kanalno registrovanje audio podataka?
14. ta je to uniformni, a ta neuniformni kvantizer?
15. Na koji nain se moe poboljati kvalitet audio signala kada se primeni impulsno
kodovana modulacija?
16. Kako se odreuje bitski protok kvantovanog audio signala za monoaudio i za
stereoaudio?
17. Koji se kriterijumi koriste za procenu kvaliteta audio signala?
18. Kada se koristi subjektivni, a kada objektivni kriterijum za procenu kvaliteta audio
signala?
19. Predstaviti tabelarno skalu pogoranja za procenu vernosti audio signala.
20. ta utie na subjektivne procene kvaliteta audio signala?
21. Kako glase izrazi za utvrivanje odnosa signal-um u dB i srednju kvadratnu greku
nastalu u toku obrade audio signala?
22. Predpostavljajui da je um kvantovanja statistiki nezavisan i sa uniformnom
raspodelom u intervalu [-Q/2, Q/2] odrediti srednju kvadratnu vednost uma u dB.
23. U emu se ogleda uloga dodatnog bita u postupku analogno-digitalne konverzije?
24. Kada se smatra da je za najvei broj primena audio signal odlinog kvaliteta?
25. Uporediti osetljivost ljudskog auditivnog i vizuelnog sistema.
26. ta je potrebno za opisivanje digitalne slike sivog nivoa, a ta za opisivanje kada je ista
u boji?
27. Koji se parametri koriste za utvrivanje vizuelne vernosti digitalizovane slike?
28. Kako se definie vrni odnos signal-um za odreivanje vizuelne vernosti
digitalizovane slike?
29. Napisati analitiki izraz za srednju kvadratnu greku nastalu u procesu digitalizacije
slike.
30. U emu se razlikuju subjektivne i objektivne mere za procenu vernosti digitalizovane
slike?
60
Literatura
[5.1] Z. Uroevi i M. Savi, Telekomunikacije: Elementi Teorije, Analize i Obrade Signala.
Beograd, Nauka, 1995.
[5.2] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
[5.3] B. P. Lahti, Signal Processing and Linear Systems. Carmichael, CA: Berkeley-
Cambridge Press, 1998.
[5.4] N. S. Jayant and P. Noll, Digital Coding of Waveforms: Principles and Applications to
Speech and Video. Englewood Cliffs, N. J: Prentice Hall, 1984.
[5.5] K. C. Pohlmann, Principles of Digital Audio. New York, McGraw-Hill, 2000.
[5.6] Methods for the Subjective Assessment of Small Impairments in Audio Systems,
Including Multichannel Sound Systems, ITU-R REC. BS.1116, 1994.
[5.7] Z. S. Bojkovi, C. I. Toma, V. Gui, and R. Vasiu, Advanced Topics in Digital Image
Compression. Timisoara, Romania: Politechnica, 1997.
[5.8] M. Rabbani and P. W. Jones, Digital Image Compression Techniques. Bellingham,
Washington, USA, SPIE-The International Society for Optical Engineering, 1991.
[5.9] R. W. G. Hunt, The Reproduction of Colour. England, Fountain Press, 1987.
[5.10] A. K. Jain, Fundamentals of Digital Image Processing. Englewood Cliffs, New Jersey,
Prentice Hall, 1989.
[5.11] K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio
Coding. Upper Saddle River, NJ: Prentice Hall, 1996.
61
6. KOMPRESIJA TEKSTA
Tekst je jo jedan znaajan medium za predstavljanje multimedijalnih informacija.
Ustvari, to je najstariji medijum za skladitenje i prenos informacija. Najvei broj dananjih
informacija jos uvek se uva u tekstualnom obliku. U ovom poglavlju daemo najpre kratak
uvod u predstavljanje teksta u digitalnoj formi, a zatim e biti rei o nekim tehnikama kompresije
teksta.
Poto izvor ima svoju azbuku, to znai da on moe da emituje bilo koji simbol (poruku) koji
pripada datoj azbuci. Da bi opisali izvor, moemo uzeti u obzir sve mogue simbole koje izvor
moe da emituje. To znai da e izvor biti mnogo bolje opisan nekom srednjom koliinom
informacije koju on emituje. Ova srednja koliina informcije naziva se entropija izvora.
Entropija predstavlja prosenu koliinu informacija po simbolu kojom izvor snabdeva
posmatraa, odnosno proseni izvor neizvesnosti koju posmatra poseduje pre nego sto izvri
ispitivaje izlaza iz izvora.
Neka diskretni izvor informacija emituje simbole iz azbuke tj. skupa simbola S
Ukoliko pojava datog simbola ne zavisi od prethodnih simbola, entropija ovakvog izvora
informacije data je izrazom
62
1
H ( s ) = P ( si ) log 2 , si S . (6.1.1)
S P ( si )
Maksimalnu entropiju imae izvor kod koga su verovatnoe emitovanja svih simbola date
azbuke jednako verovatne. Tada je neizvesnost najvea poto nijedan simbol nema prioritet. Ako
azbuka ima q simbola ija je verovatnoa pojavljivanja p = 1/q onda je maksimalna
entropija
q
1 1
H max = P ( si ) log 2 = log 2 ( q ) = log 2 ( q ) (6.1.2)
i=1 P ( si ) i=1 q
q
1
jer je oigledno
i =1 q
=1.
Funkcija H(p) naziva se entropijska funkcija. Izvori koji emituju simbole koji su
meusobno statistiki nezavisni nazivaju se izvori bez memorije. Najzad na osnovu svega do
sada naloenog moe se izvui zakljuak da je izvor informacija definisan: azbukom (listom
simbola) koju emituje, verovatnoom pojavljivanja simbola, brzinom emitovanja simbola i
prosenom brzinom emitovaja informacije.
63
Primer 6.1.1
gde je
i = 1, 2, , q,
jp = 1, 2, , q,
kaemo da se radi o Markovljenim izvorima m-tog reda koji generiu simbole sa liste
s = (s1, s2, sq), pri emu su pored ve opisanih uslovnih verovatnoa poznate i verovatnoe
P(si), dok se entropija ovog izvora odreuje pomou izraza
q m+1
1
H (S )= P(s
i=1
j1 , ,s jm ,s i ) log 2
P ( si | s j1 ,s j2 , ,s jm )
. (6.2.1)
Niz od prethodno emitovanih m simbola predstavlja stanje izvora. Ukupan broj stanja
iznosi qm, pa je broj uslovnih verovatnoa qm+1. Postojanje statistike zavisnosti ismeu simbola
64
smanjuje neizvesnost pa, prema tome, i koliinu informacije. To znai da e entropija izvora koji
emituje statistiki zavisne impulse uvek biti manja od entropije istog takvog izvora, ali koji
emituje statistiki nezavisne impulse.
Oznaimo sa Hp vrednost entropije neke azbuke pod pretpostavkom da je verovatnoa
pojavljivanja svih slova (simbola) date azbuke jednaka i da ne postoji nikakva statistika
zavisnost pri pojavi slova (H0 = Hmax). Neka je H stvarna vrednost entropije u sluaju da su
uzete u obzir sve statistike zavisnosti jezika koje se izrazavaju pomou date azbuke. Tada odnos
H/H0 predstavlja stepen iskoriscenja simbola (slova) ili relativnu entropiju.
Statistika suvinost odnosno redundantnost predstavlja meru za ogranienja koju tekstu
namee statistika struktura jezika. Definie se preko stepena iskorienja slova, tj.,
H
R = 1 (6.2.2)
H0
ili u procentima
Primer 6.2.1
1 1 1
H 0 = H ( s ) = P ( si ) log 2 = log 2 32 = 32 5 log 2 2 =
s P ( si ) 32 32 32 .
= 5 bita po slovu
H 1 .4
= = 0 . 28 .
H 0 5
Primer 6.2.2
Koliku koliinu informacije nosi televisijska slika koja se sastoji od 625 linija a
svaka linija od 500 elementarnih taaka pri emu svaka taka moe da ima
16 nivoa osvetljenosti u rasponu od belog do crnog?
65
625 linija 500 taaka = 312 500 taaka.
Svaka taka moe da ima 16 nivoa osvetljenosti. To znai da ukupan broj
razlilitih slika koje se mogu pojaviti iznosi 16(
625500 )
slika. Poto je pojava
svake slike jednako verovatna, bie
1
P(E)= ( 625500 )
.
16
I = log 2
1
P(E)
( )
= log 2 16( 625500) = 312 500 log 2 ( 24 ) = 312 500 4 =
.
= 1 250 000 = 1.25 Mb
Primer 6.2.3
Mada izvor informacije moe imati K simbola, informacija koju nosi svaki simbol nije
podjednako verovatna. Prosena informacija koju nosi simbol povezana je sa recipronom
vrednosu njegove verovatnoe i data je u obliku
1
I ( si ) = log . (6.2.4)
p [k ]
Iako svaki simbol moe biti analiziran posebno, korisno je razmotriti velike blokove simbola pre
nego pojedinane simbole. Izlaz iz izvora se grupie u blokove od N simbola, a za simbole se
moe predpostaviti da su generisani iz izvora SN sa alfabetom dimenzije KN. U tom sluaju izvor
SN predstavlja N-to proirenje izvora S.
66
Entropija izvora definisana je kao prosena koliina informacija po izvornom simbolu,
tj.,
K K
H ( S ) = p [ k ] I ( s k ) = p [ k ]log 2 p [ k ] (6.2.5)
k =1 k =1
Primer 6.2.4
Prema datim podacima u povorci postoji ukupno 22 slova. Od toga postoji: 6a,
13b, i 3c. Stoga je: p(a) = 6/22 = 0.27, p(b) = 13/22 = 0.59 i p(c) = 3/22 = 0.14.
Sa ovim, entropija prvog reda iznosi
67
H (S ) R H (S ) + S (6.2.6)
Drugim reima izvor moe biti kodovan bez gubitaka sa prosenim brojem bita bliskim
njihovoj entropiji ali ne manjoj od entropije. Entropija izvora ograniena je sa 0 i log2K. To
znai, drugim reima da je
U ovoj relaciji leva strana vai ako je p[k] nula za sve izvorne simbole sk izuzev jedinice.
U tom sluaju je izvor apsolutno prediktabilan. Desna strana vai kada svaki izvorni simbol sk
ima istu verovatnou pojavljivanja. Redundansa izvora je definisano kao
Ova relacija pokazuje da ukoliko izvor ima alfabet velicine K, maksimalna entropija
izvora je log2K. Ako je entropija iznosi log2K za izvor se moe kazati da je nulte suvinosti. U
najveem broju sluajeva informacija sadri suvinost.
Primer 6.3.1
Primer 6.3.2
68
samo u sluaju da svi simboli imaju podjednaku verovatnou tj. 1/K.
Treba uoiti da Shannon-ova teorema prua donju granicu zahteva za brojem bita. U
praksi je vrlo teko postii broj bita jednak entropiji. Ukoliko se eli da projektujemo koder sa tri
simbola, lako moemo dobiti koder prenoenjem dva bit/simbol. Pri tome se pojavljuje bitski
iznos od 0.64 (2 1.36) bit/simbol vei od nivoa entropije S = 0.64. Ukoliko se S smanjuje,
znatno se poveava kompleksnost kodera.
69
verovatnou nastajenja 0.2 (0.1 i 0.1). Sada vidimo da se broj simbola smanjio za jedan. U koloni
dva, izvor ima etiri simbola umesto pet. Verovatnoe ta etiri simbola su rasporeene po
opadanju, kao to je to prikazano u koloni tri. U sledeem koraku dva najmanje verovatna
simbola su ponovo spojena, pa su zatim nove verovatnoe ponovo rasporeene po opadanju.
Proces se ponavlja dok se izvor ne svede na dva simbola. U naem primeru dve poslednje
verovatnoe su 0.6 i 0.4.
d 0.1 0.1
! 0.1
! 0.1 0101
70
Posle tog dodeljivanja postoje 4 simbola sa verovatnoama 0.3, 0.3, 0.2 i 0.2 i kodovima
00, 01, 10 i 11 respektivno. U sledeem koraku, druga verovatnoa 0.3 dobijena je spajanjem dve
verovatnoe 0.2 i 0.1. Kodovi dodeljeni ovim verovatnoama (0.2 i 0.1) su 01 praen 0 i 01
praen sa 1. Posle tog dedeljivanja postoji pet simbola sa verovatnoama pojavljivanja 0.3, 0.2,
0.2, 0.2 i 0.1 sa kodovima 00, 10, 11, 010 i 011 respektivno. etvrta verovatnoa 0.2 dobijena je
spajanjem dve verovatnoe 0.1 i 0.1. U ovom koraku kod dodeljen ovim verovatnoama (0.1 i
0.1) je 010 praen sa 0 i 010 praen sa 1. Posle tog dodeljivanja postoji est simbola sa
verovatnoama 0.3, 0.2, 0.2, 0.1, 0.1 i 0.1 i odgovarajuim kodovima 00, 10, 11, 011, 0100 i
0101 respektivno. Na taj nain dobili smo Huffman-ove kodove za sve originalne izvorne
simbole.
Iako dosta korieno jo od otkria 1952 godine, Huffman-ovo kodovanje ima
nedostatke. Pre svega, ono zahteva najmanje jedan bit za predstavljanje pojavljivanja svakog
simbola. Stoga, ako je entropija izvora manje od jednog bita po simbolu, Huffman-ovo
kodovanje nije efikasno. Dalje, ovo kodovanje se ne moe efikasno prilagoditi ukoliko se
menjaju statistike izvora. Najzad, ni ureaji koji koriste Huffman-ov koder nisu jednostavni za
implementaciju.
Primer 6.5.1
71
Primer 6.5.1 pokazuje da ako izvor ima azbuku dimenzije K postoji Km razliitih moguih
poruka duine m. Ukoliko je poznata funkcija gustine verovatnoe individualnih simbola, moe
se izraunati verovatnoa nastajanja date poruke sm duine m. Poto postoji Km razliitih
moguih poruka, moe se izraunati verovatnoa p(sm) nastajanja tih individualnih poruka, pri
emu je
m
K
p (s ) = 1 .
m =0
m (6.5.1)
Korak 2: Podeliti inteval [0, 1] na 6 ( = K) podintervala poto postoji 6 simbola. irina svakog
podintervala jednaka je verovatnoi nastajanja individualnog simbola.
Korak 3: Predpostavimo da elimo da prenesemo simbol baad! Poto je prvi simbol b biramo
interval [0.2, 0.3].
72
Tabela 6.5.2Generisanje niza bita pri aritmetikom kodovanju
Korak 4: Drugi simbol je a. Otuda biramo podinterval koji odgovara a u intervalu [0.2
do 0.3]. To je [0.2, 0.22], kao to je to dato na Slici 6.5.1. Podinterval je [0.2 do 0.22] je
podeljen na 6 podintervala treeg nivoa.
Korak 5: Trei simbol je opet a. Otuda je odabran podinterval [0.2, 0.204]. Podinterval je
opet izdeljen na 6 podintervala etvrtog nivoa.
Korak 7: Poslednji, peti simbol je !. Zbog toga je uzet podinterval [0.20236, 0.2024].
Poto vie nema drugih simbola, proces kodovanja je sada kompletiran. Predajnik moe
da alje proizvoljan broj u intervalu [0.20236 do 0.2024], a dekoder e biti u stanju da
rekonstruie ulazni niz. Razume se, dekoder treba da zna informaciju koja postoji u Tabeli 6.5.1.
73
Dosadanja opisana procedura proizvodi realne brojeve koji se mogu poslati dekoderu.
Realni brojevi su predstavljeni nizom bita koji se generiu kada jednom znamo konaan realan
broj. Niz bita se generise posle nailaska ulaznih simbola i poto su podintervali segmentirani kao
to je prikazano u Tabeli 6.5.2. Za simbol b koder zadrava opseg na [0.2, 0.3]. Poto je
odreeno da je interval [0.0, 0.5], dekoder zna da je prvi simbol 0. Stoga, on sada moe da
otpone sa slanjem ulaznih bita. Posle drugog simbola, koder dalje suava opseg na [0.2, 0.22].
Tada koder zna da je drugi simbol 0, jer je interval u opsegu [0, 0.25]. Na slian nain, trei
simbol e biti ''1'', jer se interval nalazi u opsegu [0.125, 0.25]. etvrti simbol je 1, itd.
ema dekodovanja je vrlo jednostavna. Predpostavimo da je poslat broj 0.20238.
Dekoder prepoznaje da je prvi simbol b poto lei u opsegu [0.2, 0.3] kao to je prikazano u
Tabeli 6.5.2. Drugi simbol je a jer lei u opsegu [0.2, 0.22]. Zatim se proces nastavlja.
U navedenom primeru korien je fiksni model koji nije pogodan za kodovanje
nestacionarnih izvora kod kojih se statistike izvora menjaju se vremenom. U tim sluajevima
trebalo bi primeniti adaptivni model. Tako, na primer, u [6.12] je predloen efikasan model za
primenu adaptivnog aritmetikog kodovanja koji daje broj bita vrlo blizak entropiji izvora.
6.6 Rezime
Najvei broj informacija jo uvek se danas uva u tekstualnom obliku. Podaci o tekstu
stvoreni su iz diskretnog informacionog izvora koji emituje simbole a ovi predstavljaju slova
koja odgovaraju nekoj azbuci. Poto se tekstualni podaci jo uvek koriste kao razliiti
dokumenti, vano ih je predstaviti u najprihvatljivijoj formi kako bi se smanjili zahtevi za
skladitenim prostorom. Prosena koliina informacija po simbolu kojom izvor snabdeva
posmatraa predstavlja entropiju. Maksimalnu entropiju imae izvorni kod kod koga su
verovatnoe emitovanja svih simbola date azbuke podjednako verovatne. Ujedno tada je i
neizvesnot najvea, poto nijedan simbol nema prioritet. Minimalna entropija nastaje kada izvor
ne emituje nikakvu informaciji. To je sluaj kada izvor emituje samo jedan simbol ije je
verovatnoa pojavljivanja jednaka jedan, a svih ostalih je nula.
Izvori koji emituju simbole koji su medjusobno statistiki nezavisni nazivaju se izvori
bez memorije. S druge strane, izvor informacije je definisan: azbukom (listom simbola) koji
emituje, verovatnoom pojavljivanja simbola i prosenom brzinom emitovanja informacija
(simbola).
Podaci o tekstu nose suvinu informaciju. Tehnika kompresije teksta smanjuje ili
eliminie tu suvinost ime se postie kompresija. Entropija izvora koji emituje statistiki
zavisne impulse uvek e biti manja od entropije istog takvog izvora koji emituje statistiki
nezavisne impulse. Statistika suvinost odnosno redundantnost predstavlja meru ogranienja
koju tekstu namee statistika struktura jezika.
Dva ogromna koncepta u teoriji izvornog kodovanja su entropija i funkcija stepena
osteenja informacije. Entropija prua meru za informaciju izvornih simbola sadranu u izvoru
podataka i odreuje minimum prosenog bitskog protoka potrebnog za perfektnu reprodukciju
izvornih simbola. S druge strane, teorija osteenja informacije prua niu granicu za prosean
broj bita za dato izoblienje u obnovljenim simbolima.
Ukoliko izvor ima alfabet veliine K, maksimalna entropija izvora je log2 K. Ako
entropija iznosi log2 K, za izvor se kae da je nulte suvinosti. U najveim broj sluajeva
informacija sadri suvitnost.
74
Prema Shannon-ovoj teoremi o beumnom kodovanju, prosean broj bita R za
kodovanje izvorne informacije ogranien je sa donje strane entropijom izvora. Meutim
Shannon-ova teorema ne utvruje nain projektovanja kodera koji e korigovati izvornu
informaciju sa prosenim brojem bita R Huffman-ova metoda prua mogunost projektovanja
kodera koji daje broj bita blizak entropiji. Ova metoda daje kod promenljive duine za svaki
izvorni simbol i to tako da je broj bita u kodu priblino obrnuto proporcionalan verovatnoi
nastajanja simbola. Meutim, Huffman-ovo kodovanje zahteva najmanje jedan bit za
predstavljanje svakog simbola. Stoga, ako je entropija izvora manja od jednog bita po simbolu,
Huffman-ovo kodovanje nije efikasno. Dalje, ovo kodovanje se ne moe efikasno prilagoditi
ukoliko se menjaju statistike izvora. Najzad, ni ureaji koji koriste Huffman-ov koder nisu
jednostavni za implementaciju.
Dok se kod Huffman-ovog kodovanja svakom simbolu pripisuje kodna re promenljive
duine, kod aritmetikog kodovanja kodnoj rei je pripisana cela ulazna poruka. Primenom
aritmetikog kodovanja postie se vea kompresija nego kod Huffman-ovog kodovanja.
Metode entropijsnog kodovanja koriste statistiki model za kodovanje simbola sadranih
u ulaznim podacima. Kompresija je postignuta uklanjanjem statitistike suvinosti prisutne u
podacima. U tu srvrhu koristi se kodovanje simbola kodovima koji sadre manje bita za ove
simbole koji se ee pojavljaju. Mada su za kodovanje podataka o tekstu prikazane neke kodne
tehnike koje ne unose gubitke, ove tehnike se takoe koriste za kodovanje audio signala i slike.
Druga grupa tehnika koje su predloili Lempel i Ziv zasniva se na kompresiji na bazi renika
[6.13], [6.14]. Meutim ta materija izlazi iz okvira ove knjige.
Pitanja
1. ime se karakterie predstavljanje teksta u digitalnoj formi?
2. ta je to entropija izvora informacija?
3. Po emu se tekstualni podaci razlikuju od audio i video podataka?
4. Kada izvor informacija ima maksimalnu, a kada minimalnu entropiju?
5. ta su to izvori informacija bez memorije?
6. ta je to relativna entropija?
7. Kako se definie statistika suvinost nekog jezika?
8. Jedna azbuka sastoji se iz 32 slova. Stvarna entropija ove azbuke iznosi 1.4 bita po slovu.
Odrediti entropiji nultog reda, kao i stepen iskorienja slova ove azbuke.
9. ime se bavi teorija izvornog kodovanja?
10. ta prouava teorija oteenja informacije?
11. Kako glasi Shannon-ova teorema kodovanja za beumni izvor?
12. Kada se za izvor informacija kae da je nulte suvinosti?
13. ime se karakterise Huffman-ova metoda za projektovanje kodera?
14. Kako se generie Huffman-ov kod za izvor informacija?
15. U emu se ogledaju nedostaci nastali u procesu Huffman-ovog kodovanja?
16. Koja je glavna karakteriska aritmetikog kodovanja?
75
17. U emu se razlikuje aritmetiko od Huffman-ovog kodovanja?
18. Koji parametri definiu izvor informacija koji emituje simbole?
19. ime se karakteriu metode entropijskog kodovanja?
Literatura
[6.1] D. Draji, Teorija Informacija i Prenos Podataka. Elektrotehniki fakultet, Beograd,
1982.
[6.2] C. E. Shannon and W. Weaver, The Mathematical Theory of Communication. Urbana,
IL: University of Illinois Press, 1949.
[6.3] D. A. Huffman, A Method for the construction of minimum-redundancy codes, Proc.
Inst. Radio Eng., vol. 40, pp. 10981101, Sept. 1952.
[6.4] A. N. Netravali and B. Prasada, Adaptive quantization of picture signals using spatial
masking, Proc. IEEE, vol. 65, no. 4, pp. 536548, Apr. 1947.
[6.5] S. P. Lloyd, Least squares quantization in PCM, IEEE Trans. Inf. Theory, vol. IT-28,
pp. 129137, 1982.
[6.6] N. S. Jayant and P. Noll, Digital Coding of Waveforms: Principles and Applications to
Speech and Video. Englewood Cliffs, NJ: Prentice Hall, 1984.
[6.7] K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages,
Applications. New York, NY: Academic Press, 1990.
[6.8] K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio
Coding. Upper Saddle River, NJ: Prentice Hall, 1996.
[6.9] G. G. Langdon and J. Rissanen, Compression of black-white images with arithmetic
coding, IEEE Trans. Commun., vol. COM-29, pp. 858867, 1981.
[6.10] A. K. Jain, Fundamentals of Digital Image Processing. Englewood Cliffs, New Jersey,
Prentice Hall, 1989.
[6.11] M. Rabbani and P. W. Jones, Digital Image Compression Techniques. Bellingham,
Washington, USA, SPIE-The International Society for Optical Engineering, 1991.
[6.12] I. H. Witten, R. M. Neal, and J. G. Cleary, Arithmetic coding for data compression,
Commun. of ACM, vol. 30, pp. 520540, Jun. 1987.
[6.13] J. Ziv and A. Lempel, A universal algorithm for sequential data compression, IEEE
Trans. Inf. Theory, vol. IT-23, pp. 337342, 1977.
[6.14] J. Ziv and A. Lempel, Compression of individual sequences via variable-rate coding,
IEEE Trans. Inf. Theory, vol. IT-24, pp. 530536, 1978.
76
7. STANDARDI U MULTIMEDIJALNIM KOMUNIKACIJAMA
Za razmatranje standarda u oblasti multimedijalnih komunikacija postoje dva pristupa.
Jedan od pristupa se fokusira na bit-niz sintaksu u nameri da se razume ta predstavlja svaki sloj
sintakse i na ta ukazuje svaki bit u jednom odreenom nizu bita. Ovakav pristup je vaan za
proizvoae opreme u skladu sa standardima. Drugi pristup je usredsreen na algoritme za
kodiranje koji se koriste za generisanje nizova bita, u skladu sa odgovarajuim multimedijalnim
kodnim standardom. Isto tako, ovaj pristup zasniva se na istraivanju, razvoju, modernizaciji i
implementaciji razliitih tipova algoritama za kodovanje multimedijalnog sadraja kako bi se
podrao veliki broj razliitih i sve zahtevnijih multimedijalnih aplikacija i servisa.
Predstavljanje neobraenih video signala zahteva veliki kapacitet pa se, u vezi sa tim,
moraju definisati manje kompleksni video kodni algoritmi radi efikasnije kompresije video
sekvenci kako bi se iste memorisale i prenosile. Pravilni izbor algoritma za video kodovanje
multimedijalnih aplikacija je znaajan faktor koji zavisi od raspoloivog kapaciteta i
multimedijalnih zahteva za kvalitetom. Bitski prenos i brzina frejmova su faktori sa kojima se
selektovani video koder moe adaptivno birati, a sve to u skladu sa raspoloivim propusnim
opsegom medijuma za komunikaciju. Sa druge strane, stalni napredak u tehnologiji daje kao
rezultat poveanje svoga procesora digitalnih signala i znaajno smanjuje cene opreme. U oblasti
audio-vizuelnih komunikacija takvi video kodni algoritmi se koriste za kompresiju video signala
sa visokom efikasnou kodovanja i maksimalnim perceptualnim kvalitetom.
Kod video komunikacija zahtevi korisnika obino su konfliktni te se mora ii na
kompromis kako bi se obezbedio kvalitet servisa koji je korisnik zahtevao. Korisniki zahtevi za
digitalne video servise definiu se preko kvaliteta i irine opsega video signala, kompleksnosti,
sinhronizacije i kanjenja. Sa jedne strane, kompleksnost video-kodnih algoritama odnosi se na
logaritamska izraunavanja koja se izvre tokom kodovanja i dekodovanja. Sa druge strane,
sinhronizacija izmeu razliitih nizova bita mora se odravati da bi se obezbedile
zadovoljavajue performanse. to se tie kanjenja, kod aplikacija koje se odvijaju u realnom
vremenu, vano je da je vreme kanjenja izmeu frejma koji se koduje i posle toga dekoduje,
minimalno.
Sve ukazuje na to da je veoma znaajno razmotriti aspekte multimedijalnih kodnih
standarda i odgovarajuih algoritama. Od ne manjeg znaaja je svakako smanjenje
implementirane kompleksnosti multimedijalnih algoritama, a da se pri tome ne narue njihove
performanse.
77
7.1 Znaaj standardizacije
Sa neprekidnim poveanjem brzine prenosa, oigledno je da su kapacitet memorisanja
hard diskova, fle memorija i optikih medija vei nego ranije. Savremene tehnike kompresije
multimedijalnih podataka pruaju mogunost memorisanja ili prenosa velike koliine
informacija neophodnih za prezentaciju digitalnog sadraja na efikasan nain. Sa neprekidnim
poveanjem kapaciteta prenosa i memorisanja, kompresija postaje jedna od osnovnih
komponenata za multimedijalne servise [7.1]. to se tie videa, kompresija ima vane prednosti.
Pre svega, ona omoguava da se digitalni video koristi u okruenju za prenos ili memorisanje
koji ne podrava nekompresovani video. Zatim, video kompresor omoguava da se efikasnije
koriste resursi za prenos i memorisanje. Na primer, ako je raspoloiv kanal sa velikim bitskim
protokom, tada je opteprihvatljivo da se poalje komprimovani video signal velike rezolucije ili
vei broj komprimovanih video signala, nego da se poalje jedan nekomprimovani tok ili niz
nie rezolucije.
Signal koji nosi informaciju moe se komprimovati da bi se odstranila redundansa. Kod
sistema za kompresiju bez gubitka statistika redundansa je odstranjena na taj nain da se
komprimovani signal moe perfektno rekonstruisati na prijemniku. Meutim, veina praktinih
tehnika za video kompresiju, na primer, zasniva se na kompresiji sa gubicima, tako da signal koji
je dekodovan nije identian originalnom.
Cilj algoritma za kompresiju je da se postigne to efikasnija kompresija uz minimiziranje
izoblienja koje nastaje u tom procesu. Na primer, algoritmi za video kompresiju rade tako to
odstranjuju redundansu u prostornom, vremenskom, statistikom i psihovizuelnom domenu.
Odstranjivanjem redundanse u razliitim oblicima, mogue je znaajnije komprimovati podatke.
Na primer, ljudski vizuelni sistem (oko i mozak) vie je osetljiv na nie, nego na vie frekvencije
pa ako se odstrani iz slike sadrzaj sa niim frekvencijama, slika e i dalje biti prepoznatljiva
uprkos injenici da je deo informacija odstranjen. Videli smo, takoe, da se kompresija moe
postii tako to se podaci koji se prenose koduju primenom entropijskog kodovanja (Huffman-
ovo kodovanje, aritmetiko kodovanje).
Kompresija slike i videa je alternativno polje za istraivanje i razvoj oblasti
multimedijalnih komunikacija. Predloeni su mnogi razliiti algoritmi za kompresiju i
dekompresiju. U cilju podsticaja medijumskog rada, konkurencije i poveanja mogunosti
izbora, neophodno je bilo da se definiu neophodne metode za kompresiju, kako bi se obezbedilo
da ureaji razliitih proizvoaa budu kompatabilni. Ovo je dovelo do razvoja drugih kljunih
multimedijalnih standarda. to se tie tehnike kompresije slike i videa, one se razvijaju
intenzivno od pre dvadesetak i vie godina uz razvoj pratee tehnologije. Poetni algoritmi su
bili bazirani na pikselima, a neto kasniji algoritmi su koristili grupe piksela ili osobine vida, kao
i redundantna svojstva slike u prostornom, vremenskom i frekvencijskom domenu.
U postupku standardizacije kompresije slike i video signala pojavljuju se dve organizacije i to:
78
Mada deluju odvojeno, u mnogim sluajevima dolazi do konkurencije nekih njihovih rezultata,
kao to je to prikazano na Slici 7.1.1.
79
ISO/IEC, 11172 Kodovanje pokretnih slika sa pridruenim audiom do oko 1.5 Mbit/s
(MPEG-1)
ISO/IEC, 13818 Kodovanje pokretne slike i pridruenje audia (MPEG-2)
ISO/IEC, 14496 Kodovanje audio-vizuelnih objekata (MPEG-4)
ISO/IEC, 15938 Intefejs za opis multimedijalnog sadraja (MPEG-7)
ISO/IEC, 21000 Multimedijalni okvir (MPEG-21)
Iako je MPEG-3 bio predvien da se bavi velikim binarnim protocima (binarni protok se
uobiajeno izraava kao broj bita u sekundi (eng. bits per second) bit/s, b/s, bps), nikada nije
razvijen, jer su se ovi zahtevi mogli sresti kod MPEG-2. to se tie MPEG-5 i MPEG-6, oni nisu
nikada ni definisani. Najzad, treba istai da je MPEG-21 prvi standard uspostavljen u 21. veku.
MPEG sledi princip da standard treba da obezbedi interoperabilnost. To produava
ivotni vek standarda i obezbeuje istovremeno uvoenje novih tehnologija. Na primer, MPEG
standardi kodovanja specificiraju samo sintaksu i semantiku tokova bita (eng. bit stream) i
proces dekodovanja. Nita se ne govori o tome kako kodovi kreiraju tokove bita. To ostavlja
istraivaima vie slobode oko optimizacije izbora kodera (estimacija pokreta, upravljanje
protokom bita kod psihoakustinih modela), a sve se to radi zbog minimiziranja performansi za
ciljane aplikacije i sadraje. Istraivai koriste primene novih tehnologija u MPEG standardima
radi to boljeg korienja sredstava primenjenih u procesu kodovanja. Time se postie
konkurencija u kvalitetu i ceni uz stalno obezbeene uzajamne interoperebilnosti.
a) Deo 1: Sistemi
Odnosi se na kombinaciju jednog ili vie strimova podataka (MPEG-1 Video, Audio) sa
vremenskom informacijom koja formira jedinstveni strim, optimiziran za digitalno
memorisanje ili prenos.
b) Deo 2: Video
Specificira kodni format (video strim i odgovarajui proces dekodovanja) za video
sekvence pri binarnim protocima od oko 1.5 Mbit/s. Ciljano radno okruenje je memorija
pri kontinualnoj brzini prenosa, ali je modni format uopten i moe se koristiti u irem
smislu. Omoguena je interaktivnost. Kao reenje za koder ustanovljeno je hibridno
kodovanje na bazi diskretne kosinusne transformacije (eng. discrete cosine transform
80
DCT) u bloku primenjeno na jednoj slici ili na greku predikcije dobijenu posle
predikcije po vremenu (na bazi jedne ili dve slike) sa kompenzacijom pokreta. DCT je
praena kvantizacijom, cikcak smenjivanjem i kodovanjem primenom promenljive
duine kodne rei, kao to je prikazano na Slici 7.3.1. MPEG-1 video podrava samo
progresivne formate, a broj linija je fleksibilan.
INVERZNA
KVANTIZACIJA
BINARNI NIZ
INVERZNA IZLAZNI
DCT BAFER
c) Deo 3: Audio
Specificira kodne formate (audio strim i odgovarajui proces dekodovanja) za
monofonski od 32 kbit/s do 192 kbit/s i stereofonski od 128 kbit/s do 134 kbit/s zvuk.
Ovaj standard specificira tri hijerarhijska sloja kodovanja: I, II i III koji su pridrueni
zbog kompleksnosti, kanjenja i efikasnosti. Sloj III je poznatiji pod oznakom MP3. Ova
kodna reenja su namenjena za opti audio i koriste perceptualna ogranienja oveijeg
auditornog sistema sa krajnjim ciljem koji je vezan za uklanjanje parcijalnih nevanih
delova signala.
81
7.4 MPEG-2 standard
MPEG-2 je ISO/IEC 13818 standard koji specificira kompresiju audia i videa. Po pravilu
MPEG-2 komprimovani signal vieg je kvaliteta nego u sluaju MPEG-1 kompresije. Ovaj
standard specificira parametre prenosa i ini centralni deo digitalne video difuzije (eng. digital
video broadcasting DVB).
Glavni cilj MPEG-2 video standarda je definisanje formata koji e se koristiti za opis
kodovanog video signala. MPEG-2 standard definie rezultujui strim bita. Kada je MPEG-2
razvijen, jedini zahtev je bio da se formira tako da bude dovoljno fleksibilan za upotrebu kod
ireg spektra video aplikacija, koje zahtevaju binarne protoke do Mbit/s, kao to su HDTV,
DVD, interaktivna memorija (eng. interactive storage media ISM), irokodifuzni (eng.
broadcast) servisi, kablovska TV distribucija i interaktivni TV servisi pogodni za fleskibilne
mogunosti mree, ogranienja u irini mrenog opsega i kvalitetu slike [7.4].
U odnosu na MPEG-1 standard, MPEG-2 je uveo sledee razlike:
Kodni algoritmi i metode predikcije u MPEG-2 skoro su isti kao kod MPEG-1. Meutim,
MPEG-2 sadri vie mogunosti, na primer, analiza sa proredom i skalabilnost [7.5].
MPEG-2 sistemi, audio i video specifikacije su bazirani na odgovarajuim MPEG-1
specifikacijama [7.6]. Kasnije je pridodat jo jedan Audio Deo, sa novim audio kodekom koji
pripada naprednom audio kodovanju (eng. advanced audio coding AAC). Danas standard
MPEG-2 sainjavaju razliiti Delovi [7.7][7.11].
a) Deo 1:Sistemi
Ovde vae iste karakteristike kao i za MPEG-1 sisteme s tim to se jo podravaju:
Ovi zahtevi daju kao rezultat specifikaciju dva tipa sistema strimova: Programski strim
slian i kompatibilan sa MPEG-1 sistemima strimova i novi Transportni strim za prenos
vie nezavisnih programa.
b) Deo 2: Video
Odreuje opti domet kodovanja (video strim i odgovarajui proces dekodovanja) za
video sekvence sve do HDTV rezolucije. Osnovna kodna arhitektura je ista kao i za
MPEG-1 Video, uz podrku za isprepletane video formate i skalabilne/ hijerarhijske
kodne formate (vremenski, prostorni, SNR). MPEG-2 Video podrazumeva vie alata. U
nekim primenama neki, od ovih alata suvie su komplikovani za primenu. MPEG-2
82
Video definie, tzv. profile koji su u stanju da obezbede kodna reenja uz odgovarajuu
kompleksnost. Profili su podnizovi alata koji se odnose na potrebe specifinih klasa
aplikacija. Takoe, izvestan broj nivoa je definisan za svaki profil kako bi se ograniila
memorija i raunarski zahtevi za primenu dekodera. Nivoi obezbeuju donju granicu
kompleksnosti strimova bita i minimum mogunosti za dekoder. MPEG-2 Video dekoder
je u stanju da dekoduje MPEG-1 video strimove. Kompatibilnost, koja se ogleda u tome
da je MPEG-2 Video mogue kodovati pomou MPEG-1 Video dekodera, je obezbeena
preko specifinih profila kroz skalabilnost [7.13], [7.14].
c) Deo 3: Audio
Odreuje kodni fomat (audio strim i odgovarajui proces dekodovanja) za viekanalni
audio. Deo 3 obezbeuje kompatibilnost sa MPEG-1 Audio strimovima. Na primer,
MPEG-1 Stereo dekoder bio bi u stanju da reprodukuje znaajnu verziju originalnog
vuekanalnog MPEG-2 Audio strima. MPEG-2 Audio je u tehnikom pogledu slian sa
MPEG-1 Audio sa ista tri sloja.
g) Deo 7: AAC
Poto je MPEG-2 Audio (Deo3) specifian sa ogranienjem u pogledu kompatibilnosti,
odreuje multikanalni kodni format, bez zahteva u pogledu kompatibilnosti. Na taj nain
postie se slian kvalitet na znatno niim bitskim brzinama nego kod MPEG-2 audio
dela 3.
h) Deo 8:
Povuen (u poetnom stadijumu odnosi se na 10-bitno video kodovanje).
83
j) Deo 10: DSM-CC prilagoeno proirenje
Specificira testove za proveru da li strimovi bita (sadraj) i dekoderi odgovaraju
specifikaciji u Delu 6.
84
Slika 7.5.1Jedan primer za audio-vizuelnu scenu
85
MPEG-4 audio-vizuelne scene sastoje se od nekoliko medija objekata koji su organizovani na
hijerarhijski nain. U odsustvu hijerarhije mogu se pronai osnovni medija objekti (slike, video
objekti, audio objekti itd.).
MPEG-4 standardizuje brojne osnovne medija objekte i u mogunosti je da prikae i
prirodne i sintetike tipove sadraja koji mogu biti 2D ili 3D. Takoe, MPEG-4 definie i
prikazivanje podataka o objektu. Medija objekti u svojoj kodovanoj formi sastoje se od
deskriptivnih elemenata koji omoguavaju rukovanja objektima u audio-vizuelnim scenama
[7.19]. Svaki medija objekat se moe prikazati u sopstvenoj kodovanoj formi, nezavisno od
sopstvenog okruenja i pozadine.
MPEG-4 je tako koncipiran da obezbedi uspenu podrku na polju digitalne televizije
[7.20], na polju interaktivnih grafikih aplikacija (sintetizovan sadraj), kao i na polju
interaktivne multimedije (World Wide Web, distribucija i pristup sadraju). MPEG-4 obezbeuje
standardizovane tehnoloke elemente omoguavajui integraciju proizvodnje, distribucije i
pristup sadrajima u okviru navedena tri polja.
a) Deo 1: Sistemi
Odreuju arhitekturu sistema i alate koje treba pridruiti kako za binarne oblike scena
(eng. binary format for scenes BIFS), tako i za proirene MPEG-4 tekstualne (eng.
eXtensible MPEG-4 textual XMT) formate. Od ne manjeg znaaja su, takoe, i
multipleksiranje, sinhronizacija, upravljanje baferom, kao i IPMP. Takoe ovaj deo
specificira fajl format Grupe eksperata za obradu pokretne slike-4 (eng. Motion Picture
Experts Group-4 File Format MPEG-4, MP4) koji je tako sainjen da je nezavisan od
bilo kog posebnog protokola za predaju informacija, pri emu je omoguena efikasna
podrka za predaju, razmenu, upravljanje, emitovanje i prezentaciju ureaja. Isto tako,
tzv. MPEG-J (MPEG-Java) definie kako aplikacije mogu biti realizovane na
korisnikom terminalu.
b) Deo 2: Vizuelni
Odreuje kodne alate pridruene vizuelnim objektima prirodnog i sintetikog porekla. Na
primer, to podrazumeva specifikaciju reenja za video kodovanje i to od vrlo malih
bitskih brzina do vrlo zahtevnih uslova ukljuujui dinamike 3D objekte. O vizuelnom
MPEG-4 Delu bie kasnije vie govora.
c) Deo 3: Audio
Specifira sve kodne alate koji se pridruuju objektima kako prirodnog tako i sintetikog
porekla (na primer kodna reenja za muzike i govorne podatke za vrlo irok opseg
bitskih brzina i sintetikog audia ukljuujui tu i 3D audio prostore). O MPEG-4 audio-
komunikaciji bie jo rei.
86
Definie testove koji omoguavaju da se proveri da li strimovi (sadraj) i dekoderi
odgovaraju tehnikim specifikacijama propisanim prema Delovima MPEG-4 standarda.
Pri tome je za video i audio strimove profil definisan kao niz objekata.
j) Deo 10: Napredno video kodovanje (eng. advanced video coding - AVC)
Specificira napredne video-kodne alate na bazi kodera koji obezbeuju do 50 % veu
kodnu efikasnost nego najbolji profil video kodovanja u MPEG-4 Deo 2 za iroki opseg
bitskih brzina i video rezolucija. Meutim, u poreenju sa prethodnim standardima,
kompleksnost dekodera je oko etiri puta vea nego kod MPEG-2 Videa i dva puta vea u
poreenju sa jednostavnim MPEG-4 Vizuelnim profilom. Ovaj deo razvio je Zdrueni
video tim (eng. Joint Video Team - JVT) koji je osnovan u cilju formalizovanja saradnje
izmeu ISO/IEC MPEG i ITU-T VCEG za razvoj ovog kodeka. Standard MPEG-4
zdrueno video kodovanje (eng. joint video coding JVC) je ve poznat u ITU-T kao
Preporuka H.264.
87
medijumu kao to su to, na primer, audio-vizuelne prezentacije. Ovaj deo je primenjiv na
MPEG-4, a takoe i na JPEG-2000 (zdruena specifikacija) [7.22].
p) Deo 16: Proirenje okvira animacije (eng. animation framework eXtension AFX)
Odreuje alate za interaktivni 3D sadraj koji radi na geometrijskim modelirajuim i
biometrikim nivoima i obuhvata alate prethodno definisane u MPEG-4 i to u kontekstu
sintetikog prirodnog hibridnog kodovanja (eng. sinthetic natural hybrid coding
SNHC). AFX nudi jedinstveni standardizovani 3D okvir obezbeujui znaajne osobine
kao to su kompresija, striming, i integracija sa drugim audio-vizuelnim medijima i
omoguavajui uvoenje visoko kvalitetnih kreativnih unakrsnih aplikacija preko
medijuma.
u) Deo 21: Proirenja okvira grafike (eng. graphics framework eXtensions - GFX)
Obezbeuje potpuni programski okvir ukljuujui tu i operacije prirodnog i sintetikog
kodovanja. GFX koristi interfejs za programske aplikacije (eng. application
88
programming interface API), omoguavajui iroki opseg aplikacija na prijemniku od
mobilnih ureaja do stacionarnih raunara.
Zavravajui kratak prikaz delova MPEG-4 standarda koji se jo uvek proiruje, treba
rei da tehnika specifikacija ne predstavlja poslednji kodek na iroko rasprostranjenom
usvajanju i primeni. U nastavku emo se, najpre, malo opirnije pozabaviti Vizuelnim delom
MPEG-4 standarda.
Podrka za prenos preko postojeih mrea. Alati za otpornost uz greke pomau dekoderu
da se oporavi od greaka u prenosu i odri uspenu video konekciju u mrenom
okruenju. Treba imati u vidu da i skalabilni alati za kodovanje mogu pomoi u podrci
za fleksibilniji prenos kodiranih bitskih protoka;
Vizuelni deo MPEG-4 standarda obezbeuje kodne funkcije kroz kombinaciju alata,
objekata i profila. Alat predstavlja podskup kodnih funkcija za podrku specifine funkcije (na
primer, video kodovanje oblika objekta). Objekat je video element (na primer sekvenca sa
pravougaonim frejmovima, mirna slika itd) koji je kodovan korienjem jednog ili vie alata.
Profil je skup tipova objekata za koji se oekuje da koder-dekoder (eng. coder-decoder
89
CODEC) ima mogunosti da ih obrauje. Ovaj vizuelni deo MPEG-4 standarda obuhvata profile
za kodovanje prirodnih video scena. Pored podskupa alata za kodovanje, profili definiu i nivoe.
Nivoi definiu ogranienja u parametarskom bitstrimu. Svaki nivo postavlja ogranienja u
maksimalnim performansama za dekodovanje MPEG-4 kodovane sekvence. Definicije nivoa
postavljaju ogranienja na veliinu memorije bafer, veliinu dekodovanog frejma i brzinu
procesiranja.
U okviru ovog dela MPEG-4 standarda, video sekvenca se posmatra kao kolekcija jednog
ili vie objekata. Objekti se definiu kao frekvencijske celine koje korisniku omoguavaju
pristup, prezentovanje i manipulaciju. Video objekat (eng. video object - VO) je oblast video
scene koja moe zauzimati region proizvoljnog oblika i moe postojati proizvoljno vreme.
Trenutni video objekat u odreenemo trenutku vremena predstavlja video objektnu ravan (eng.
video object plane - VOP). Na Slici 7.5.2.1 prikazan je video objekat koji se sastoji od tri
pravougaone video objektne ravni. Video scena moe biti kreirana od objekata u drugom planu
(eng. background object) i posebnih objekata u prvom planu (eng. foreground object).
Ovaj pristup je fleksibilniji nego fiksna pravougaona struktura frejma kod prethodnih
standarda. Posebni objekti se mogu kodovati sa razliitim vizuelnim kvalitetom i vremenskom
rezolucijom da bi prikazali svoju vanost u konanoj sceni. Objekti sa vie izvora (ukljuujui i
sintetike i prirodne objekte) mogu se kombinovati u jednu scenu. Preko visoke interaktivne
aplikacije krajnji korisnik moe da regulie kompoziciju i ponaanje scene. Svaki objekat koduje
se posebno.
90
Meutim, sa poveanjem kvaliteta kodera, poveava se kompleksnost kao i kanjenje
signala. Poveanje kanjenja ne predstavlja problem u aplikacijama difuzije i striminga zato to
pojedini servisi dozvoljavaju kanjenje reda veliine desetak sekundi. Sa druge strane, tipine
implementacije audio kodera na procesorima za digitalnu obradu signala (eng. digital signal
procesing DSP) imaju kanjenje sa kraja na kraj od 290 ms: kanjenja ovog reda veliine su
neprihvatljiva za aplikacije sa dvosmernom komunikacijom kao to su telekomunikacije i
telefonija visokog kvaliteta. Za sve aplikacije razvijeni su kodovi od strane ITU (6.711, 6.722,
6.728, 6.729) i GSM6.10 sa algoritamskim kanjenjem od 20 ms [7.27]. Ovi koderi su
projektovani za kompresiju ljudskog govora, tako da se pri kodovanju audio signala u optem
sluaju ostvaruje nedovoljan kvalitet. Idealno reenje je algoritam koji je sposoban da ostvari
AAC i MP3 kvalitet sa algoritamskim kanjenjem tipinim za ITU-T kodere govora.
Postoje dve grupe alata za kodovanje audia kod MPEG-4 i to: Prirodni alati koji
omoguavaju da digitalni audio bude komprimovan i preneen i sintetiki alati koji koji
omoguavaju parametarsko opisivanje zvuka koji se prenosi i koristi za sintezu na prijemnoj
strani [7.28][7.31]. Prirodni audio alati omoguavaju prenos komprimovanog govora i
irokopojasni audio u opsezima od 6 kbit/s za kodovanje govora za male bitske brzine do
64 kbit/s po kanalu za niskokvalitetni viekanalni zvuk. MPEG-4 ima tri glavne alatke za audio
kodovanje. Generalni audio (eng. general audio GA) koder obezbeuje prenos visoko-
kvalitetnih irokopojasnih multikanalnih signala kao to je muzika pri bitskim brzinama od
16 kbit/s do 64 kbit/s u kanalu. Ovaj koder predstavlja skalabilnu verziju dobro poznatih
perceptuelno kompresovanih tehnika [7.32]. Zasniva se na MPEG-2 naprednom audio kodnom
standardu sa dodatnim poboljanjima u kvalitetu i fleksibilnosti [7.33].
MPEG-4 ima dva sintetika audio kodera. Jedan obezbeuje interfejs sa sistemima tekst-
govor. Tzv. interfejs tekst-govor (eng. text-to-speech interface TTSI) prihvata strim bita koji
sadri potrebne podatke o fenomenima kao i podatke o duini slojeva i kontrolie eksterni
govorni sintisajzer. U standardu nije specificifiran poseban metod za sintezu govora.
Standardizovani su samo format interfejsa i bit strima u delu MPEG-4 TTSI.
Drugi je opti alat za sintezu muzikih i zvunih efekata nazvan strukturni audio (eng.
structured audio SA). SA koder omoguava prenos algoritma za sintezu zvuka na novom tzv.
Muzikom V jeziku nazvanom strukturni jezik audio orkestra (eng. structured audio orchestra
language SAOL) [7.34]. MPEG-4 je prvi standard za prenos zvuka preko algoritama za sintezu
[7.35]. Muziki jezik SAOL je takoe vaan za audio alate. Konvergencija izmeu kodnih
tehnika za strukturni audio i efekte procesiranja u MPEG-4 je jedan od vanih aspekata ovog
standarda.
91
predikcija kompenzacije pokreta za redukciju vremenske korelacije, kao i entropijsko kodovanje
za redukciju statistike korelacije. Sa poveanjem kodne efikasnosti i fleksibilnosti dolazi i do
poveanja kompleksnosti samog kodera.
Za odreene aplikacije, H.264/AVC definie sedam Profila. Profili definiu skup kodnih
alata i algoritama koji se mogu koristiti pri generisanju odgovarajueg toka bita. Takoe, za
svaki profil H.264/AVC definie i skup nivoa i podnivoa.
Arhitektura H.264/AVC standarda se bazira na dva sloja: mrenom apstraktnom sloju
(eng. network apstraction layer NAL) i video kodnom sloju (eng. video coding layer VCL)
[7.39], kao to je to prikazano na Slici 7.5.4.1.
92
Slika 7.5.4.2Elementi VCL
Video sekvence se sastoje od okvira (eng. frame) ili polja (eng. field). H.264/AVC
standard podrava progresivnu ili analizu sa proredom koje mogu biti u istoj sekvenci. Slike su
izdeljene u iseke. Iseak je sekvenca makroblokova i ima fiksnu veliinu. Postoje tri osnovna
tipa iseka: I unutar (eng. intra - I), P prediktivni (eng. predictive - P) i B dvosmerno prediktivni,
biprediktivni (eng. bidirectionally-predictive - B) iseci. Kod H.264/AVC standarda, I-iseci
makroblokova su komprimovani bez korienja neke predikcije pokreta od iseka u drugim
slikama. P-iseci sadre makroblokove koji se mogu komprimovati sa korienjem predikcije
pokreta. P-iseci mogu sadrati i intra makroblokove. B-iseci sadre makroblokove koji se
mogu komprimovati korienjem predikcije pokreta i slino kao kod P-iseaka mogu imati intra
makroblokove.
Na Slici 7.5.4.3 prikazan je koder sa dva dela za prenos podataka unapred (sa leva u
desno) i deo za rekonstrukciju (sa desna u levo). Kod kodera (deo unapred) ulazni frejm ili
polje je procesirano u makroblok jedinice. Svaki makroblok je kodovan u Inter ili Intra modu i za
svaki blok u okviru makrobloka predikcija PRED (oznaeno sa P) se formira na osnovu
rekonstruisanih odbiraka slike. Kod Intra moda, PRED je formirana od odbiraka aktuelnog
iseka koji je perthodno kodovan, dekodovan i rekonstruisan to je oznaeno sa uF'n. Kod
Inter moda PRED je formirana pomou predikcije kompenzacije pokreta od jedne ili dve
referentne slike koje su selektovane iz skupa liste 0 i/ili liste 1 referentnih slika. Referentna slika
je prikazana kao prethodno kodovana slika F'n-1. Predikcija referentne slike za svaki deo
makrobloka (kod Intra moda) mora se izabrati izmeu selektovanih prolih ili buduih slika koje
su ve kodovane, rekonstruisane i filtrirane. Predikcija PRED se oduzima od aktuelnog bloka da
bi se dobio rezidualni (razlika) Dn blok koji se transformie (koriste se blok transformacija T) i
kvantuje Q da bi se dobio skup kvantovanih koeficijenata tranformacije X koji su ponovo
ureeni i entropijski kodovani. Koeficijenti entropijski kodovani, zajedno sa ostalim
informacijama zahtevaju da se dekoduje svaki blok unutar makrobloka (modovi predikcije,
parametri kvantizacije, informacije o vektoru pokreta itd.) komprimovanog toka koji je posle
93
prosleen mrenom apstraktnom sloju NAL radi prenosa ili memorisanja. Dekoder (deo za
rekonstrukciju) dekoduje (rekonstruie) svaki blok u makrobloku da bi obezbedio referencu za
dalje predikcije. Koeficijenti X se skaliraju (Q^-1) i inverzno transformiu (T^-1) da bi se dobio
blok razlike D'n. Predikcije bloka PRED se dodaje da bi se dobio rekonstruisani blok nF'n
(dekodovane verzije originalnog bloka). Oznaka n ukazuje na to da rekonstruisani blok nije
filtriran. Filter se primenjuje da se redukuju efekti debloking izoblienja. Rekonstruisana
referentna slika je kreirana iz serije F'n blokova.
Dn
Fn + T Q
trenutni
NAL
Inter
F'n1 Kompenzacija
referenca pokreta
P
1 ili 2 prethodno
kodovana frejma Izbor Intra Intra
predikcije predikcija
Intra
D'n
F'n Filter uF'n + T^ 1 Q^ 1
rekonstruisani
+
Slika 7.5.4.3Blok-ema kodera za prenos podataka i rekonstrukciju
NAL
Inter
F'n1 Kompenzacija
referenca pokreta
P
1 ili 2 prethodno
kodovana frejma Intra
predikcija
Intra
+ D'n
F'n Filter uF'n T^ 1 Q^ 1
rekonstruisani
+
Slika 7.5.4.4Blok-ema dekodera
94
Dekoder prima komprimovani tok bita od NAL i entropijski dekoduje elemente sa
podacima da bi se dobio skup koeficijenata kvantizacije X [7.41]. On ima mogunost skaliranja i
inverzne transformacije za dobijanje D'n. Koristei informacije iz dekodovanog zaglavlja toka
bita, dekoder kreira blok za predikciju PRED koji je identian originalnom PRED kod kodera.
PRED je pridodat D'n da bi se dobio uF'n koji se filtrira kako bi se dobio svaki dekodovani
blok F'n.
to se tie metoda entropijskog kodovanja, postoje alternativne metode o kojima e biti
rei u nastavku.
95
koder koduje svaki bit prema selektovanom modelu verovatnoe. Selektovani model konteksta je
baziran na auriranju aktuelne kodovane vrednosti.
Zavravajui ovo izlaganje, treba istai da je zahvaljujui svojim unapreenim
performansama H.264/AVC privukao panju industrije. Pored klasinih aplikacionih domena
kao to su videokonferencije i broadcasting TV sadraji (satelitski, kablovski i zemaljski), sa
poboljanjem sposobnosti kompresije, H.264/AVC je obuhvatio i nove servise i tako otvorio
nove trine mogunosti u industriji. Druga oblast koja je privikla dosta interesovanja
proizvoaa opreme je prenos i memorisanje sadraja visoke definicije (eng. high definition
HD) [7.43]. H.264/AVC standard se moe primeniti i kod korisne opreme (na primer digitalne
kamere, celularni telefoni itd.), videa preko IP mrea [7.44], [7.45], digitalnog broadcasting-a
visoke definicije (preko zemaljskih ili satelitskih kanala) i digitalnih sistema za memorisanje
(digitalni video disk (eng. digital video disk DVD ) visoke rezolucije). Danas H.264/AVC
omoguava i prenos preko IPTV preko digitalnih pertplatnikih linija i pasivnih optikih mrea.
H.264/AVC standard naao je primenu i kod mrea sa asinhronim nainom prenosa ATM.
96
JPEG-LS je ISO/ITU-T standard za kodovanje mirnih slika bez gubitaka. Zasniva se na
adaptivnoj predikciji i modelovanju teksta. Uz to, ovaj standard ocrtava ravne oblasti da bi ih
zatim kodovao. Fiksiranjem maksimalne greke odbiraka postie se kompresija skoro bez
gubitaka. Algoritam je namenjen za sluaj da se radi o maloj kompleksnosti uz veliki odnos
kompresije. Meutim, nije obezbeena podrka za skalabilnost i otpornost na greke.
Pokretna mrena grafika PNG je preporuka WWW Konzorcijuma (eng. World Wide Web
Consortium W3C) za kodovanje mirnih slika. Zasnovana je na predikciji i entropijskom
kodovanju. PNG prua kompresiju bez gubitaka i podrava sivu skalu, osnovnu boju, opcionu
alfa ravan, preplitanje na slici.
97
sloja mogu biti poslati kanalom sa boljom performansom greke. Manje kritian vii sloj alje
podatke kanalom sa smanjenom performanskom greke.
Da bi se poboljao prenos komprimovanih slika, u ovaj standard su ukljueni sinteza bita
otpornog na greke i odgovarajui alati. Kada se radi o otpornosti na greke, odgovarajui alati
koriste deobu podataka kao i resinhronizaciju, detekciju i snimanje greke uz QoS na bazi
prioriteta. Mnoge primene zahtevaju isporuku podataka o slici kroz razliite tipove
komunikacionih kanala. Tipini beini komunikacioni kanali orijentisani su ka sluajnim i
sporadinim bitskim grekama. I internet komunikacije su sline nastojanju gubitka usled
nagomilavanja saobraaja/saobraajnog preoptereenja.
to se tie mogunosti zatite intelektualne svojine, standardom je definisan opcioni fajl
format za JPEG 2000 (eng. optional file format for JPEG 2000 JP2) kod komprimovanja
podataka o slici. Format slui za mirnu sliku i meta podatke, a ima i mehanizam za naznaku
tonske skale i boja na slici. To je mehanizam pomou koga itaoci mogu da prepoznaju u fajlu
postojanje informacije o zatiti prava intelektualne svojine (eng. intelectual property rights
IPRS). Takoe, to je mehanizam pomou koga metapodaci mogu biti ukljueni u fajl. Blok-ema
kodera i dekodera za JPEG 2000 data je na Slici 7.7.1.
Najpre je primenjena diskretna tranformacija na izvorne podatke o slici. Transformacioni
koeficijenti su potom kvantovani i entropijski kodovani pre formiranja izlaznog toka bita.
Zavisno od wavelet transformacije i primenjene kvantizacije, JPEG 2000 moe biti sa gubicima i
bez gubitaka. Na strani dekodera obavljaju se procesi entropijskog dekodovanja, dekvantizacije i
inverzne transformacije kako bi se dobili rekonstruisani podaci o slici.
98
1996 godine MPEG je pokrenuo MPEG-7 projekat pod nazivom Opis interfejsa za
multimedijalni sadraj [7.50] sa ciljem da se specifira standard za opis razliitih tipova audio-
vizuelnih informacija kao to su osnovni delovi, skladitenje informacija, bez obzira na njihov
format, nain predstavljanja ili medijum. Poput drugih MPEG standarda, MPEG-7 se susree sa
nizom zahteva od prethodnih MPEG standarda, audio-vizuelna predstava ovde nema za cilj da
komprimuje i reprodukuje podatke, ve se bavi tzv. metapodacima (podaci o podacima).
MPEG-7 deskriptori obezbeuju reenje za metapodatke kod velikog broja primena. Oni
su nezavisni od medijuma i formata na bazi objekata i sa mogunou proirenja. Rade na
razliitim nivoima i to poev od opisa na niskom nivou automatskih i esto statistikih
karakteristika pa sve do predstavljanja istih na visokim nivoima gde se prenose semantika
znaenja.
Sledei princip da MPEG standardi moraju specificirati samo potreban minimum,
MPEG-7 specificira format za deskripciju i njegovo dekodovanje. Na taj nain ostavljeno je
mnogo slobode za istraivae u oblasti aplikacija. MPEG-7 specificira dva osnovna tipa alata:
deskriptori (eng. descriptor D) i eme za deskripciju (eng. descriptor scheme DS). Deskriptor
je predstavljanje karakteristika koje definiu sintaksu i semantiku. Kao primer moe posluiti
vremenski kod za predstavljanje trajanja procesa ili momenti boja i histogrami za predstavljanje
boje. Sa druge strane ema za deskripciju odreuje strukturu i semantike relacija izmeu
komponenti. To mogu biti odreeni deskriptori i eme za deskripciju. Jednostavan primer je opis
filma, struktuiranog kao scene i pucnjevi ukljuujui tekstualne deskriptore na scenskom nivou
kao i aspekte pomeranja uz deskriptor audio amplitude na nivou pucnja.
Deskripcije MPEG-7 mogu se predstaviti na dva naina: tekstualni tipovi koji koriste opis
definicije jezika (eng. desciption definition language DDL) i binarne tokove koji koriste
binarni format za metapodatke (eng. binary format for metadata BiM) MPEG-7. To je u osnovi
DDL alat za kompresiju.
MPEG-7 specifcira primenjenu tehnologiju kroz 11 Delova:
a) Deo 1: Sistemi
Specificira alate za:
b) Deo 3: Vizuelni
Odreuje alate za deskripciju osnovne strukture i deskriptore ili deskripcione eme za
opis vizuelnih karakteristika i za lokalizaciju opisanih objekata na slici ili video sekvenci.
MPEG-7 vizuelni deskriptor pokriva pet osnovnih vizuelnih karakteristika koji ukljuuju
boju, teksturu, oblik, pokret i lokalizaciju (deskriptor prepoznavanja lica je takoe
definisan).
c) Deo 4: Audio
99
Specificira alate za audio deskripciju koji su organizovani kao melodija, tiina, govorni
sadraj i zvuni efekti.
100
g) Deo 8: Ekstrakcija i primena MPEG-7 deskripcije
Obezbeuje korisne informacije o ekstrakciji i upotrebi deskripcije.
101
struktuirani digitalni obejkat sa standardnom prezentacijom, identifikacijom i meta podacima u
okviru MPEG-21 standarda. Ovaj entitet je, takoe, osnovna jedinica za raspodelu i transakciju.
Sedam delova u TR predstavljaju grupisane elemente arhitekture standarda MPEG-21.
Granice izmeu elemenata nisu striktne, a kasniji tok standardizacije je pokazao da primenjene
tehnologije mogu obuhvatiti vie elemenata. Ovi elementi su identifikovani sledeim redom:
102
agenata da konzumiraju i filtriraju sadraj za korisnike. Zato je ovaj deo standarda
uvren u oblast koja se odnosi na personalizaciju korisnika.
e) Terminali i mree
Cilj okvira ovog standarda bio je da kreira transparentni pristup za napredni
multimedijalni sadraj (onakav kakav je opisan u objektima sa digitalnim delovima).
Zbog toga je shvatanje efektivne zatite izmeu korisnika i terminala sa jedne i mree sa
103
druge strane bilo od vitalne vanosti. Povezanost elemenata, irina propusnog opsega i
kvalitet servisa predstavljaju vane komponente za adaptaciju okvira standarda [7.59].
f) Predstavljanje sadraja
TR za standard MPEG-21 pokazao je da sadraj moe biti:
U TR-u se takoe kae da okvir standarda treba da podri predstavljanje sadraja. Tako je
potrebno da MPEG-21 standard podri sinhronizovani i multipleksirani medijum.
g) Izvetavanje o dogaaju
U toku rane faze izrade ovog standarda ukazala se potreba za interakcijama sa digitalnim
delovima. Naime, radilo se o tome da se standardizuju metrike i interfejsi za interakcije
koje se oekuju kod digitalnih delova. Dalje transport podataka pridruen raznim
dogaajima-saoptenjima treba standardizovati.
104
Navedeni standardi se razlikuju u pogledu bitskog protoka. Svi ovi standardi se mogu
primeniti u irokom opsegu bitskih tokova. U zavisnosti od algoritama kodovanja, oni prate
sline standardizacione okvire.
Tabela 7.10.1Neki standardi za video kodovanje
Standard H.320
ITU-T Studijska grupa (eng. Study Group SG) SG 15 razvila je sledee dve preporuke
za audio-vizuelne komunikacione sisteme u ATM okruenjima:
105
ISDN (eng. broadband ISDN BISDN) okruenje [7.62],
H.310irokopojasni audio-vizuelni komunikacioni sistem i terminali [7.63].
106
SCN) su vezani za H.323. Kombinacija mrenog prolaza kod H.323, H.323 terminala i mree
tipa LAN pojavljuje se u SCN mrei kao H.320, H.310, ili H.324 terminal.
H.323 opisuje ukupan sistem i komponente, ukljuujui terminale, mrene prolaze (eng.
gate way GW), nadzore prolaza (eng. gate keeper GK), kontrolore procesa za vie taaka i
kontrolne jedinice za vie taaka MCUs.
Zonom koju ini kolekcija svih terminala, mrenih prolaza, i kontrolnih jedinica za vie
taaka upravlja jedinstveni nadzor prolaza. Zona obuhvata najmanje jedan terminal i moe a i ne
mora, da obuhvati mrene prolaze ili kontrolnu jedinicu za vie taaka. LAN segmenti koji su
povezani primenom rutera ili drugih ureaja mogu biti u istoj zoni.
H.324 standard
107
7.10.1 Standardi za video kodovanje
Postoje dva prilaza za razumevanje standarda za video kodovanje. Jedan prilaz je da se
fokusiramo na sintaksu niza bita i da se pokua shvatiti ta predstavlja svaki sloj sintakse i ta
svaki bit u nizu bita oznaava. Ovaj prilaz je veoma znaajan za proizvoaa opreme koji treba
da sagleda opremu koja je prilagoena standardima. Drugi prilaz je da se koncentriemo na
algoritme kodovanja koji se mogu upotrebiti za generisanje niza bita prilagoenih standardu, a
zatim da se shvati da svaka komponenta ne specifira bilo koji od kodnih algoritama. Ovaj prilaz
obezbeuje bolje razumevanje video kodnih tehnika u celini, a ne samo standardnu sintaksu niza
bita.
H.261 standard
Ovaj standard bavi se sluajevima u kojima postoji mali bitski protok i malo kodno
kanjenje. Ovde se radi o bitskim protocima od oko p 64 kbit/s, gde p varira od 1 do 30. Kodni
algoritam korien u H.261 je u osnovi hibrid kompenzacije pokreta, da bi se uklonila vremenska
suvinost, i transformacionog kodovanja DCT kako bi se redukovala prostorna suvinost. Takva
koncepcija formirala je bazu za sve standarde koji se odnose na video kodovanje. H.261 standard
je imao znaajan uticaj na mnoge postojee i ostale standarde za video kodovanje u fazi razvoja.
Digitalni video sastoji se od niza slika ili kadrova koji se odigravaju izvesnom brzinom.
Svaka slika sadri tzv. elemente slike piksele. Za standard kod video kodovanja vano je znati
dimenzije slike na koju se standard primenjuje i poloaj piksela-tela. H.261 bavi se sa dva
formata slike: zajedniki srednji format (eng. common intermediate format CIF) i etvrtni
zajedniki srednji format (eng. quarter CIF QCIF). Kod mirnih slika prema standardu H.261
koristi se etiri puta vei format. Na primer ukoliko je video format CIF, odgovarajui video
format je 4CIF.
Standard H.261 se primenjuje za video telefoniju i video konferenciju. Ovde je izvorni
materijal sastavljen od scena osoba koje govore, tzv. nizova glave i ramena osobe, pre nego
optih TV programa koji sadre dosta promena u pokretu i na sceni. Kod H.261, svaki odmerak
sadri luminentnu komponentu Y i dve hrominentne komponente oznaene sa Cb i Cr. Posebno
crna boja je predstavljena sa Y = 16, bela sa Y = 235, dok su Cb i Cr varirali izmeu 16 i 240, pri
emu 128 predstavlja sivo.
Kod standarda H.261 blok je definisan kao grupa od 8 8 pela. Jedan blok koji ine Cb
peli i jedan blok sa Cr pelima odgovara vrednosti od etiri bloka Y pela. Kolekcija ovih est
blokova predstavlja makroblok (eng. macroblock MB). Jedan makroblok sa redosledom
blokova oznaenih od 1 do 6 dat je na Slici 7.10.2. MB se tretira kao jedna jedinica u procesu
kodovanja.
108
Brojni makroblokovi grupisani zajedno predstavljaju grupu blokova (eng. group of blocks
GOB). Za H.261 GOB sadri 33 makrobloka. Rezultujue strukture za sliku u sluaju CIF
formata, kao i u sluaju formata tipa QCIF prikazane su na Slici 7.10.3 [7.68].
video +
DCT Q
ulaz
IDCT
Filter Kompenzacija
pokreta
IDCT +
+
+
Filter Kompenzacija
pokreta
Na strani dekodera, dekodovani DCT koeficijenti su inverzno DCT (eng. inverse DCT
IDCT) transformisani i zatim pridodati perthodno dekodovanoj slici sa kompenzacijom pokreta.
109
Poto je predikcija tekueg kadra sastavljena od blokova na razliitim lokacijama u referentnom
kadru, predikcija sama po sebi moe da sadri um kodovanja i izoblienja zbog postojanja
blokova, koja mogu da dovedu do poveanih greaka usled predikcije. Da bi se smanjile te
greke, prediktovani koder se proputa kroz niskopropusni filter pre nego to se upotrebi kao
predikcija za tekui kadar.
H.263 standard
H.263 podrava vie formata slika i koristi razliitu strukturu za grupu blokova GOB,
H.263 koristi polu-pikselsku kompenzaciju pokreta, ali ne koristi filtriranje ili polu
pokretne sprege kao kod H.261,
H.263 koristi 3D VLC za kodovanje DCT koeficijenata,
Uz osnovni kodni algoritam, opcije u H.263 koje se mogu ugovoriti izmeu kodera i
dekodera mogu da prue bolje performanse,
H.263 standard obezbeuje da se veliina koraka kvantizacije menja u svakom
makrobloku MB.
H.263+ (esto nazvan H.263 verzija 2) sadri oko 12 novih karakteristika koje ne postoje
u standardu H.263. One ukljuuju nove naine kodovanja za poboljanje efikasnosti kompresije,
110
podravanje skalabilnog bitskog protoka, nekoliko novih karakteristika koje podravaju paketske
mree, pridodatu funkcionalnost i podrku razliitim video formatima. Meu novim
karakteristikama H.263+, jedna od nekoliko koja tano istie neefikasnost opriginalne H.263
preporuke je modifikovani nain kvantizacije. Ovaj nain ima etiri kljuna elementa [7.70]:
Najzad, H.263+ podrava iri opseg varijacija ulaznih video formata u poreenju sa
H.263. Jedna vana osobina H.263+ je korienje dodatnih informacija koje se mogu ukljuiti u
tok bita da bi se istaklo kanjenje ili da bi se pridruila informacija za spoljanu primenu.
Dodatna informacija prisutna je u bitskom protoku i kada dekoder nije u stanju da je prihvati ili
da je jasno interpretira. Drugim reima, ukoliko zahtev za obezbeivanjem traene sposobnosti
nije dogovoren unapred, dekoder moe jednostavno da odbaci bilo ta u dodatoj informaciji.
Druga uloga korienja dodatne informacije sastoji se u tome da se specificira hroma klju za
predstavljanje transparentnih i semi transparentnih piksela [7.71].
Sledea runda korienja H.263 standada dala je treu generaciju H.263 sintakse, koja se
neformalno naziva H.263++. Identifikovane su etiri kljune tehnike oblasti za dalja
istraiavanja: tip promenljive transformacije, adaptivno aritmetiko kodovanje, tabele za kodove
promenljive duine otporne na greku, kao i filtriranje za oslobaanje od pravljenja prstenova
oko slike.
H.263++ standard
111
izvesne alternacije kod kodova promenljive duine VLC kada se radi o transformacionim
koeficijentima, vektori pokreta i oblik kodovanog bloka.
H.26L standard
U pozivu za predloge, standard H.26L trebalo je da poslui za vrlo male bitske brzine, za
rad u realnom vremenu, malo kanjenje pri kodovanju od kraja do kraja veze za razliite izvore
[7.75]. Omoguena je softverska implementacija, naglaena je robustnost na greke (naroito kod
mobilnih mrea), a zastupljeni su i mehanizmi za kontrolu brzine rada. U odgovoru na poziv za
predloge za standard H.26L procenjeni su kao korisni i uzeti u obzir sledei tehniki predlozi
[7.76]:
112
kanjenje za G.723.1 moe biti suvie veliko. Meutim, ukoliko je kanjenje prihvatljivo,
G.723.1 prua alternativu za G.729 sa manjom kompleksnou po cenu neznatnog pogoranja
kvaliteta.
Veliki broj govornih kodera je standardizovan. Na primer, davno u periodu 19951996
pojavila su se tri meunarodna standarda (ITU G.729, G.729 A, i G.723.1) i tri regionalna
standarda (koderi za evropske i severnoamerike mobilne sisteme). Kvalitet govora koji
proizvodi govorni koder zavisi od bitskog protoka, kompleksnosti, kanjenja i irine propusnog
opsega. Otuda, prilikom analize govornih kodera vano je uzeti u obzir sve te parametre. Bitno je
naglasiti da postoji stroga uzajamna povezanost izmeu njih. Dodatni faktori koji utiu na izbor
govornog kodera su uslovi dostupnosti i specificiranja radi specificiranja standarda. Najvei broj
govornih kodera radi sa fiksnim bitskim protokom bez obzira na ulazne karakteristike signala. S
obzirom da multimedijalni govorni koderi dele kanal sa drugim oblicima podataka, bolje je
odabrati koder sa promenljivim protokom.
Kod prikaza standarda za govorne kodere, vodi se rauna o tome da se specificiraju izrazi
za reference (eng. terms of reference ToR) pri emu se tu imaju u vidu: bitski protok,
kanjenje, kompleksnost i kvalitet.
Za G.729 standard jedan od ToR zahteva bio je da bi govorni koder trebalo da radi sa
8 kbit/s. Ovaj protok bio je izabran delimino i zbog toga to je opseg prve generacije digitalnih
celularnih standarda varirao od 6.7 kbit/s u Japanu, do 7.95 kbit/s u SAD, pa sve do 13 kbit/s u
Evropi. Za G.723.1, ToR zahtevi bili su da bi govorni koder trebalo da radi sa protokom niim
od 9.6 bit/s. Za koder za digitalni simultani glas i podatke (eng. digital simultaneous voice and
data DSVD), ToR zahtevi za bitski protok izvedeni su na osnovu koliine govornih podataka
koje treba preneti modemom od 14.4 kbit/s.
Kanjenje predstavlja glavnu razliku izmeu G.729 i G.723.1. ToR zahtev za kanjenje
za G.729, najpre za kodek u jednom pravcu bilo je 10 ms. Zatim je taj zahtev za kanjenje
sistema u jednom pravcu kod G.729 sveden na 35 ms.
Glavna primena za G.723.1 je videofonija sa malim bitskim protokom koja se obavlja sa
5 kadrova/s ili meto manje. Ovaj protok odgovara periodu video kodera od 200 ms. Kod
konane verzije G.723.1, kanjenje sistema u jednom pravcu iznosi 97.5 ms.
G.723.1 je manje kompleksan od G.729. On se karakterie sa 14.6 miliona instrukcija u
sekundi (eng. millions of instructions per second MIPS) pri bitskom protoku od 5.3 kbit/s i sa
16 MIPS-a pri bitskom protoku 6.3 kbit/s. Pri tome se koristi 2200 rei iz memorije sa sluajnim
pristupom (eng. radnom access memory RAM). Zahtevi za upotrebom DSVD kodera bili su 10
MIPS-a, 2000 rei iz RAM memorije i 10 000 rei iz memorije sa oitavanjem (eng. read-only
memory ROM).
Koderi govora predstavljeni na ovom mestu su slini. ini se da su G.723.1 i G.729A
(DVD verzija od G.729) malo manje robusni na greke nastale usled uma u pozadini i na uslove
rada u tandemu. Njihova karakteristika za ist govor i opta robusnost je dovoljna da ih ITU
preporui za primenu kod simultanog glasa i podataka kao to je to sluaj kod multimedijalnih
komunikacija sa malim bitskim protokom.
113
multipleksirani su u paketski strim prema preporuci H.222.0. H.222.1/H.222.0 funkcije
obuhvataju multipleksiranje obnavljanja vremenske baze, sinhronizaciju medija, otklanjanje
ditera, upravljanje baferom, kontrolu bezbednosti i pristupa, podkanalnu signalizaciju.
Preporuka H.222.1 odreuje elemente i procedure za H.222.0 radi njihove primene u ATM
okruenju a takoe specificira kodne take i procedure za ITU-T definisane osnovne strimove
[7.78]. Podkanalna signalizacija je proces na osnovu koje podkanal za audio, video i druge
osnovne strimove ESs je uspostavljen izmeu predaje i prijema H.222.1 entiteta.
Ova preporuka nosi naziv Struktura kadra za 64 kbit/s do 1920 kbit/s kanal kod audio-
vizuelnih teleservisa [7.79]. H.221 je namenski protokol koji se odnosi na multipleksiranje za
H.320 terminale. Do 30 ISDN B kanala mogu biti zdrueni da bi se formirao superkanal sa
bitskim protokom od n 64 kbit/s. Kanali media za audio, video, i informacije o podacima su
multipleksirani u superkanalu. Za audio i video informacije, H.221 ne daje bilo kakvu kontrolu
greke, ali se zato kompletno oslanja na otpornost na greke pri kodovanju medija, to je
omogueno zbog prirode mree tipa ISDN i malih vrednosti greaka. Protokol nudi samo bitski
orijentisan, nezatieni transport servis od take do take.
Preporuka H.225.0 opisuje naine na koje audio, video podaci, i kontrola mogu biti
zdrueni, kodovani, i paketizovani za transport izmeu H.323 terminala u sluaju
114
negarantovanog QoS ili izmeu H.323 terminala i H.323 mrenog prolaza koji moe biti
povezan sa H.320, H.324, ili H.310/321 terminalima u mreama tipa NISDN, GSTN, ili BISDN
respektivno. Ovaj mreni prolaz kao i konfiguracija terminala i procedura opisani su u H.323 i
H.225.0 protokolima i formatima u obliku poruke. Cilj H.225.0 komunikacije je izmeu H.323
terminala i H.323 mrenog prolaza po istoj mrei tipa LAN, pri emu se koristi isti transportni
protokol. H.225 koristi transportni protokol u realnom vremenu kontrolni protokol u realnom
vremenu (eng. real time transport protocol real time control protocol RTP/RTCP) za
paketizaciju strimova medija i sinhronizaciju mrea tipa LAN. Generalno govorei, H.225.0
treba da obezbedi nain za sinhronizaciju paketa kako bi se olakale transportne procedure u
LAN mreama. H.225.0 ne trai da svi mediji i kontrola budu zajedno u jednom strimu koji se
onda paketizuje.
H.225 terminali alju audio i video koristei RTP protokol kroz nepouzdane kanale kako
bi se minimiziralo kanjenje. Ponitavanje greaka moe se primeniti kako bi se prevaziao
problem izgubljenih paketa; u optem sluaju audio/video nisu preneeni jer bi to dalo kao
rezultat preterano veliko kanjenje. H.225.0 terminali alju i primaju audio i video po posebnim
transportnim adresama koristei posebne primere, kad RTP protokol dozvoljava za svaki
medijum posebno QoS i kadar. Poseban sluaj za analizu je kada su audio i video paketi
pomeani tako da ine jedinstveni kadar i kada su poslati na jednu adresu.
Mogunost razmene,
Procedura logike signalizacije u kanalima,
Signali kontrole i indikacije,
115
biti znaajan dokument sa dodatnim osobinama koje se pridodaju povremeno, da bi se omoguile
nove preporuke za terminal ili da se obezbedi moderna funkcionalnost za ve postojee
preporuke za terminal. Otuda je sintaksa kod H.245 iroka. To se postie korienjem markera za
proirenje u sintaksi kao i polja za identifikaciju protokola koje oznaava upotrebljenu verziju
H.245. Markeri za proirenje omoguavaju da se pridoda sintaksa na ranije dekoderske
implementacije kod H.245, mogu da preskoe dodatnu sintaksu, a da je i ne razumeju i da
nastave normalno postupak dekodovanja [7.81]. Koristie se polje identifikatora protokola da bi
se naznaile izmene u preporuci kao to su definicije novih procedura ili dodavanje nove sintakse
koju mora da prepozna udaljeni terminal.
7.11 Rezime
Standardi imaju veliku ulogu u multimedijalnim komunikacijama jer omoguavaju, pre
svega, interoperabilnost izmeu hardvera i softvera. Radi se o kompromisu izmeu onoga to je
teorijski omogueno, sa jedne, i u tehnolokom smislu ostvarljivo, sa druge strane. Standardi
mogu biti uspeni samo ukoliko su dobro izbalansirani kako u tehnikom tako i ekonomskom
smislu. To je naroito znaajno u oblasti audio-video kodovanja gde postoji raznolikost u
pogledu kodnih algoritama koji mogu biti vrlo kompleksni za implementiranje. Uspeh razliitih
MPEG i ITU-T standarda zavisi od brojnih eleemenata.
MPEG je vodee telo za standardizaciju u audio-vizuelnoj tehnologiji. MPEG-1 je
namenjen za CD-ROM sa primenama pri bitskom protoku od oko 1.5 Mbit/s. Standard se
pokazao korisnim kod kompjuterski generisanih multimedijalnih podata kada su irina
propusnog opsega i kapacitet memorije ogranieni ili skupi. Standard MPEG-2 nemenjen je za
visokokvalitetno kodovanje za sve digitalne multimedijalne prenose pri protocima od 2 Mbit/s do
50 Mbit/s. Prema ovom standardu moe se proizvesti potreban kvalitet video signala sve do kue
i to za vrlo zahtevne potrebe naunih primena i biznisa. Cilj i potencijal MPEG-4 standarda
analiziran je u kontekstu audio-vizuelnih multimedijalnih komunikacionih okruenja. Pokazano
je da ovaj standard prua alatke i algoritme za kodovanje kako prirodnog tako i sintetikog audia
i videa. Od ne manjeg znaaja je svakako predstavljanje audio/vizuelnih podataka na korisnikim
terminalima i to na jedan krajnje fleksibilan nain. Standard JPEG-2000 govori o stepenu
oteenja poruka, dok subjektivni kvalitet mirne slike treba da bude bolji od onog koji su u stanju
da proizvedu do tada postojei standardi. Cilj MPEG-7 procesa standardizacije je da olaka
pretraivanje multimedijalnih podataka. Standard MPEG-21 prua audio-vizuelnu prezentaciju u
okviru multimedijalnih poruka.
ITU-T proces standardizacije u multimedijalnim komunikacijama obuhvata pre svega
video i govorno kodovanje, multipleksiranje i sinhronizaciju (H.32x, H.26x, H.22x). ITU-T
preporuka H.261 optimizirana je u smislu primene za opremu koja se odnosi na interektivnu
audio-vizuelnu komunikaciju tj. Videofon. U skladu sa H.320 serijom preporuka koristi se za
protokole, multipleksiranje i kontrolu kod mrea tipa ISDN. to se tie H.263, to je prvi
meunarodni standard za video kompresiju koji omoguava video komunikaciju sa protokom
ispod 64 Kb/s. Kada je 1996 godine standard kompletiran, postalo je oigledno da ga treba
dograivati i poboljati: ITU-T preporuka H.263 Verzija 2 (H.263+) je prvi meunarodni
standard u oblasti video kodovanja koji je tako projektovan da podri celokupan opseg mree za
komutaciju kanala i komutaciju paketa. H.263+ sadri vie novih karakteristika u oblasti video
kodovanja u odnosu na H.263. To su poboljane efikasnosti kompresije, podrka skalabilnim
116
strimovima bita kao i razliitim video formatima, poboljan kvalitet video prenosa, itd.
Aktivnosti oko standarda H.26L sastojale su se u istraivanju naprednih kodnih tehnika koje se
razlikuju od onih iz preporuke H.263.
Pitanja
1. Zato se koriste algoritmi za video kodovanje?
2. Od ega zavisi pravilan izbor algoritama za video kodovanje?
3. Koja se ogranienja pojavljuju u postupku standardizacije mirnih slika i video
signala?
4. Kako se organizuju MPEG standardi?
5. Iz kojih se delova sastoji MPEG-1 standard?
6. ime se karakterie audio deo standarda MPEG-1?
7. ta karakterie audio deo standarda MPEG-1?
8. Nacrtati blok-emu arhitekture uproenog MPEG-1 video kodera.
9. Koji je cilj MPEG-2 video standarda?
10. Koje razlike uvodi MPEG-2 standard u odnosu na MPEG-1 standard?
11. Navesti tipove sistema strimova u standardu MPEG-2.
12. Iz kojih se delova sastoji MPEG-2 standard?
13. Kako izgleda i ime se karakterie video deo MPEG-2 standarda?
14. emu slui audio deo kod MPEG-2 standarda?
15. ime se karakterie MPEG-4 standard?
16. ta standard MPEG-4 nudi provajderima servisa, a ta korisnicima?
17. Iz kojih se delova sastoji MPEG-4 standard?
18. Po kojim karakteristikama se razlikuje MPEG-4 vizuelni kodni standard od prethodnog
standarda?
19. Na koji nain vizuelni deo MPEG-4 standarda obezbeuje funkcije kodovanja?
20. ta je to alat, a ta profil kod MPEG-4 standarda?
21. ta je to profil, a ta nivo na osnovu vizuelnog dela MPEG-4 standarda?
22. Koje vrste alata se koriste za kodovanje audija kod MPEG-4 standarda?
23. ime se karakteriu prirodni a ime sintetiki alati kod kodovanja audija za MPEG-4?
24. Gde se primenjuje standard H.264/AVC?
25. Koji su osnovni funkcionalni elementi standarda H.264/AVC?
26. Koja je uloga profila kod standarda H.264/AVC?
27. Na koliko slojeva se bazira mrena arhitektura kod H.264/AVC standarda? Koji su to
slojevi?
28. Koja je uloga mrenog apstraktnog sloja kod standarda H.264/AVC?
29. emu slui video kodni sloj kod standarda H.264/AVC?
30. Objasniti ulogu svih tipova iseaka kod H.264/AVC standarda.
117
31. Kako izgleda blok-ema kodera za prenos i rekonstrukciju podataka kod standarda
H.264/AVC?
32. Nacrtati blok-emu i objasniti princip rada dekodera kod standarada H.264/AVC.
33. Koja je uloga CABAC i CAVLC metoda kod H.264/AVC standarda?
34. U emu i gde se ogleda primena H.264/AVC standarda u industriji?
35. Koje su osnovne karakteristike i primene MPEG-4 VTC standarda?
36. ime se karakterie JPEG-LS standard?
37. ta je to pokretna mrena grafika PNE i emu slui?
38. Koje su osnovne karakteristike standarda JPEG-2000?
39. U emu se ogleda znaaj skalabilnog kodovanja mirnih slika?
40. Koji su najznaajniji tipovi skalabilnosti i koje su njihove karakteristike?
41. Kako se kod JPEG standarda moe poboljati prenos komprimovanih slika?
42. Kakve su mogunosti zatite intelektualne svojine kod JPEG-2000 standarda?
43. Nacrtati blok emu arhitekture kodera i dekodera za JPEG-2000 standard.
44. Koje su okolnosti uticale na pojavu MPEG-7 standarda?
45. Koji su osnovni tipovi alata kod standarda MPEG-7?
46. Iz kojih se delova sastoji MPEG-7 standard?
47. Navesti klase alata za multimedijalnu deskripciju kod standarda MPEG-7.
48. Koji su bili ciljevi u ranoj fazi razvoja MPEG-21 standarda?
49. U emu se ogleda osnovni koncept razvoja MPEG-21 standarda?
50. Koji su to elementi vezani za arhitekturu koji olakavaju transakcije izmeu korisnika
kod standarda MPEG-21?
51. ime se karakterie proces ITU-T standardizacije i zato su ove standardizacije
uvedene?
52. Koje su osnovne karakteristike standarda H.320?
53. ta je reilo uvoenje preporuka H.310 u multimedijalne komunikacije?
54. Zato je uvedena preporuka H. 321 u multimedijalne komunikacije?
55. ta je uticalo na pojavu standarda H.323?
56. Iz kojih se elemenata sastoji zona H.323 standarda?
57. Koje su prednosti i nedostaci sistema koji koriste H.324 standard?
58. Koje su osnovne karakteristike standarda H.261?
59. Gde se primenjuje standard H.261?
60. Kako se definiu blok, makroblok, i grupa blokova kod standarda H.261?
61. Iz kojih se elemenata sastoje blok-eme video kodera i video dekodera u standardu
H.261? Nacrtati odgovarajue blok-eme.
62. U emu se razlikuje standard H.263 od standarda H.261?
63. Koje novine unosi standard H.263+ (H.263 verzija 2) u odnosu na H.263?
64. ta se postie uvoenjem verzije standarda H.263++?
65. Koji su osnovni ciljevi standarda H.26L?
118
66. Od ega zavisi kvalitet govora koji proizvodi govorni koder?
67. ta su to referentni zahtevi kod standarda za govorne kodere?
68. Kako su formirani referentni zahtevi za bitski protok kod digitalnog simultanog
kodera za glas i podatke?
69. U emu se razlikuju standardi G.729 i G.723.1?
70. emu slui preporuka H.222.0?
71. ta predstavlja preporuka H.221?
72. ime se karakterie preporuka H.223?
73. Koji je zadatak preporuke H.225.0?
74. Koja je funkcija H.225.0, a koja H.225 terminala?
75. Iz kojih se odeljaka sastoji protokol za zajedniku kontrolu H.245?
76. Koje najvanije servise obezbeuje protokol H.245?
77. Zato se koristi polje identifikatora protokola kod H.245?
Literatura
[7.1] I. E. G. Richardson, H.264 and MPEG-4 Video Compression. Video Coding for Next-
generation Multimedia. Chichester, England, UK: John Wiley and Sons, 2003.
[7.2] K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Multimedia Communication
Systems: Techniques, Standards and Networks. Prentice Hall, 2002.
[7.3] Coding of Moving Pictures and Associated Audio at up to About 1,5 Mbit/s, ISO/IEC
11172:1991.
[7.4] Information Tehnology-Generic Coding of Moving Pictures and Associated Audio
Information: Systems, ISO/IEC 13818-1:1996.
[7.5] A. Puri, Video coding using the MPEG-2 compression standard, Proc. SPIE Visual
Commun. Image Processing, pp. 1701-1713, Nov. 1993.
[7.6] B. Heskell, A. Puri, and A. Netraveli, Digital Video: An Introduction to MPEG-2.
Chapman and Hall, 1997.
[7.7] B. L. Tseng and D. Anastassiou, Multiviewpoint video coding with MPEG-2
compatibility, IEEE Trans. Circuits Syst. Video Technol., vol. 6, pp. 414419, Aug.
1996.
[7.8] T. Homma, MPEG Contribution 95/N0861: Report of the Ad Hoc Group on MPEG-2
Applications for Multi-Viewpoint Pictures, Mar. 1995.
[7.9] J. Ni, T. Yang, and D. H. K. Tsang, CBR transportation of VBR MPEG-2 video traffic
for video-on-demand in ATM Networks, in IEEE Int. Conf. Communications, Dallas,
TX, Jun. 1996, pp. 13911395.
[7.10] M. Orzessek and P. Sommer, ATM and MPEG-2 Integration of Digital Video Into
Broadband Networks. Upper Saddle River, NJ: Prentice Hall, PTR, 1998.
[7.11] D. Milovanovi, V. Jovanovi, and Z. Bojkovi, MPEG-2 sensitivity to date loss and
effects of different packet loss patterns, WSEAS Trans. on Commun., vol. 3, pp.777
119
782, Apr. 2004.
[7.12] K. R. Rao and Z. S. Bojkovi, Packet Video Communications Over ATM Networks.
Prentice Hall, 2000.
[7.13] Z. Bojkovi, Multimedia communication systems: Modeling, standardization,
requirements, in Proc. ICOMPT96 Int. Conf. Multimedia Technology and Digital
Telecommunication Services, Budapest, Hungary, Oct. 1996, pp. 513.
[7.14] Z. Kruevac and Z. Bojkovi, SNR in MPEG video compression standard for optimum
bit allocation, in 7th IEEE Singapore Int. Conf. Communication Systems ICCS 2000,
Singapore, Nov. 2000.
[7.15] Coding of Audio-Visual Objects, ISO/IEC 14496:1999.
[7.16] F. Pereira, T. Ebrahimi, The MPEG-4 Book. Prentice Hall, 2002.
[7.17] MPEG-4 Overview - (V.18-Singapore Version), ISO/IEC JTC1/SC29/WG11 N4030,
Mar. 2001.
[7.18] F. Pereira, MPEG-4: why, what, how and when? Signal Process.: Image Commun.,
vol.15, pp.271279, Jan. 2000.
[7.19] Z. S. Bojkovi and D. A. Milovanovi, Audiovisual integration in multimedia
communications based on MPEG-4 facial animation, Circuits Systems Signal
Processing, vol. 20, no. 3, pp. 311339, 2001.
[7.20] Z. Bojkovi and B. Bakmaz, A Survey on MPEG-4 standard and digital television
deployment, WSEAS Transactions on Communications, vol. 9, pr. 3342, Jan. 2010.
[7.21] Z. Bojkovi, MPEG-4 video standardization process, in Proc. ICOMPT 97, 2nd Int.
Conf. Multimedia Technology and Digital Telecommunication Services, Invited paper,
Budapest, Hungary, Oct. 1997, pp. 110.
[7.22] S. G. Chao, Z. Bojkovi, D. Milovanovi, J. Lee, and J. J. Hwang, Image quality
evaluation: JPEG 2000 versus intra only H.264/AVC high profile, Facta Universitatis,
Nis, Series: Electronics and Energetics, vol.20, no.1, pp. 7181, Apr. 2007.
[7.23] Information Technology-Coding of Audio-Visual Objects-Part2: Visual, ISO/IEC
14496-2, Amd 1: 2001.
[7.24] Z. Bojkovi, Analysis of output signal-to-noise ratio in hybrid DCT/DPCM image
coding system, in Proc. EUSIPCO88, Grenoble, France, pp. 16611664.
[7.25] Information technology-Coding of audio-visual objects-Part 2: Visual, ISO/IEC 14496-
2:2001, Part 3: Audio, ISO/IEC 14496-3:2001.
[7.26] J. Dimkovi, D. Milovanovi, and Z. Bojkovi, Fast software implementation of
MPEG advanced audio coder, in Proc. IEEE/EURASIP Int. Conf. DSP, Santorini,
Greece, 2002.
[7.27] D. Milovanovi, J. Dimkovi, and Z. Bojkovi, MPEG-4 audio/video komunikacija:
Optimizacija implementacije i modeli licenciranja, X Telekomunikacioni Forum
TELFOR 2002, Zbornik radova, Beograd, str. 669-672.
[7.28] P. K. Doenges at al., MPEG-4 audio/video and synthetic graphics/audio for mixed
media, Signal Process.: Image Commun., vol. 9, pp. 433463, May 1997.
[7.29] S. R. Quackenbush, Coding of natural audio in MPEG-4, in Proc. IEEE Int. Conf.
Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 37973800.
120
[7.30] E. D. Sheirer, The MPEG-4 structured audio standard, in Proc. IEEE Int. Conf.
Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 38013804.
[7.31] E. D. Sheirer, Y. Lee, and J. W. Yang, Synthetic audio and SNHC audio in MPEG-4,
in Advances in Multimedia: Systems, Standards and Networks, A. Puri and T. Chen,
Eds. New York, NY: Marcel Dekker, 1999.
[7.32] N. Jayant, J. Johnston, and R. Safranek, Signal compression based on models of human
perception, Proc. IEEE, vol. 81, pp. 13851422, Oct. 1993.
[7.33] M. Bosi et al., ISO/IEC MPEG-2 advanced audio coding, J. Audio Eng. Soc., vol. 45,
pp. 789814, Oct. 1997.
[7.34] E. D. Scheirer and B. L. Vercoe, SAOL: The MPEG-4 structured audio orchestra
language, Comput. Music J., vol. 23, pp. 3551, Feb. 1999.
[7.35] B. L. Vercoe, W. G. Gardner, and E. D. Scheirer, Structured audio: The creation,
transmission, and rendering of parametric sound representations, Proc. IEEE, vol. 85,
pp. 922940, May 1998.
[7.36] A. Puri, H. Chen, and A. Luthra, Video coding using H.264/MPEG-4 AVC
compression standard, Signal Process.: Image Commun., vol.19, no. 9, pp. 793846,
Oct. 2004.
[7.37] Z. Bojkovi and Z. Milievi, Wireless multimedia networking standards: WLAN,
WPAN, WMAN, Seminar in Signal Procesing/Communications, Electrical
Engineering Faculty, University of Texas at Arlington, UTA, Texas, USA, Apr. 2006.
[7.38] K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Introduction to Multimedia
Communications: Applications, Middleware, Networking. Wiley, 2006.
[7.39] T. Weigand, G. J. Sullivan, G. Bjontegaard, and A. Luhtra, Overview of the
H.264/AVC video coding standard, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 560576, Jul. 2003.
[7.40] S. Kwon, A. Tamhankar, and K. R. Rao, Overview of H.264/MPEG-4 Part 10,
Journal of Visual Communication and Image Representation, vol. 17, no. 2, pp. 186
216, Apr. 2006.
[7.41] J. Ribas-Corbera, P. A. Chou, and S. L. Regunathan, A generalized hypothetical
reference decoder for H.264/AVC, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 674687, Jul. 2003.
[7.42] D. Marpe, H. Schwarz, and T. Wiegand, Contest-based adaptive binary arithmetic
coding in the H.264/AVC video compression standard, IEEE Trans. Circuits Syst.
Video Technol., vol. 13, pp. 620636, Jul. 2003.
[7.43] D. Marpe, T. Wiegand, and G. J. Sullivan, The H.264/MPEG-4 advanced video coding
standard and its applications, IEEE Commun. Mag., vol. 44, no. 8, pp. 134144, Aug.
2006.
[7.44] Z. Milievi and Z. Bojkovi, Kvalittet servisa u IP mreama, parametri i protokoli,
XLVII konferencija ETPAN, Zbornik radova, Sveska II, Herceg Novi, 813 juni 2003.
[7.45] S. Wenger, H.264/AVC over IP, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 645656, Jul. 2003.
[7.46] K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages,
Applications. New York, NY: Academic Press, 1990.
121
[7.47] W. B. Pennebaker and J. L. Mitchell, JPEG:Still Image Data Compression Standard.
New York, NY: Van Nostrand Reinhold, 1993.
[7.48] D. Santa Cruz and T. Ebrahimi, An analytical study of JPEG 2000 functionalities, in
Proc. IEEE Int. Conf. Image Processing ICIP, vol. 2, Vancouver, Canada, Sept. 2000,
pp. 4952.
[7.49] D. Nister and C. Christopoulos, Lossless region of interest with embedded wavelet
image coding, Signal Process., vol. 78, pp. 117, Jan. 1999.
[7.50] Multimedia Content Description Interface, ISO/IEC 15938:2002.
[7.51] F. Pereira and R. Koenen, MPEG: Context, goals and working methodologies,in The
MPEG-21 Book, I. S. Burnett et al., Eds. John Wiley and Sons, 2006, pp. 130.
[7.52] Z. Bojkovi and B. Bakmaz, MPEG-21 standardization process: Organization and rate
distortion modeling for network adaptation, in Latest Trends on Communications, N.
Mastorakis, V. Mladenov, and Z. Bojkovi, Eds. 14th WSEAS Int. Conf.
Communications, Corfu, Greece, Jul. 2010, pp. 103108.
[7.53] L. Chiariglione, K. Hill, and R. Koenen, Introduction to MPEG-21, in Open
workshop on MPEG-21-Multimedia Framework, in Doc. ISO/MPEG M5707, MPEG
Noordwijkerhout Meeting, The Netherlands, Mar. 2000.
[7.54] Information Technology-Multimedia Framework (MPEG-21)-Part1: Vision,
Technologies and Strategy, ISO/IEC TR 21000-1:2004.
[7.55] Information and documentation-International Standard Book Number (ISBN), ISO
2108: 2005.
[7.56] Information and Documentation-International Standard Recording Code (ISRC), ISO
3901:2005.
[7.57] Information and Documentation-International Standard Musical Work Code (ISWC),
ISO 15707:2001.
[7.58] MPEG Multimedia Description Schemes (MDS). FCD MPEG-21 IPMP Components,
ISO/MPEG N7196, 72nd MPEG Meeting, Busan, Korea, Apr. 2005.
[7.59] Information Technology-Multimedia Framework (MPEG-21)-Part 7: Digital Item
Adaptation, ISO/IEC TR 21000-7:2004.
[7.60] K. Asatani and S. Nogami, Trends in the standardization of telecommunications on
GII, multimedia and other network technologies and services, IEEE Commun. Mag.,
vol. 34, pp. 3244, Jun. 1996.
[7.61] M. H. Willebeek-LeMair and Z. Y. Shae, Videoconferencing over packet-based
networks, IEEE J. Sel. Areas Commun., vol.15, pp. 11011114, Aug. 1997.
[7.62] Adaptation of H.320 Visual Telephone Terminals to B-ISDN Environments, ITU-T
Recommendation H.321 (03/1996).
[7.63] Broadband Audiovisual Communication Systems and Terminals, ITU-T
Recommendation H.310 (11/1995).
[7.64] Control Protocol for Multimedia Communication, ITU-T Recommendation H.245
(03/1996).
[7.65] Procedures for the Simultaneous Transmission of Data and Digitally Encoded Voice
Signals Over the General Switched Telephone Network (GSTN), or Over 2-Wire Leased
Point-to-Point Telephone Type Circuits, ITU-T Recommendation V.70 (08/1996).
122
[7.66] Terminal for Low Bitrate Multimedia Communication, ITU-T Recommendation H.324
(03/1996).
[7.67] S. Wenger et al., Error resilience support in H.263+, IEEE Trans. Circuits Syst. Video
Technol., vol. 8, pp. 867877, Nov. 1998.
[7.68] Video Codec for Audiovisual Services at p x 64 kbit/s, ITU-T Recommendation H.261
(03/93).
[7.69] A. N. Netravali and J. D. Robbins, Motion-compensated television coding: Part I, Bell
Syst. Tech. J., vol. 58, pp. 629668, Mar. 1979.
[7.70] H.263+ Video Coding for Low Bitrate Communication, Draft ITU-T Recommendation
H.263 Version 2, Sept. 1997.
[7.71] T. Chen, C. T. Swain, and B. G. Haskell, Coding of subregions for content-based
scalable video, IEEE Trans. Circuits Syst. Video Technol., vol. 7, pp. 256260, Feb.
1997.
[7.72] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15F09,
Report of the Ad Hoc Committee H.263++ Development, Seoul, Korea, Nov. 1998.
[7.73] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15D62,
Recommended Simulation Conditions for H.263 v3, Tampere, Finland, Apr. 1998.
[7.74] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15D65,
Video Codec Test Model, Near-Term, Version 10 (TMN10), Draft 1, Tampere, Finland,
Apr. 1998.
[7.75] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15F10,
Report of the Ad Hoc Committee H.26L development, Seoul, Korea, Nov. 1998.
[7.76] ITU-T, Study Group 16, Video Coding Experts Group (Question 15), Doc. Q15D62,
call for proposals for H.26L Video coding, Geneva, Switzerland, Jan. 1998.
[7.77] R. V. Cox and P. Kroon, Low bit-rate speech coders for multimedia communications,
IEEE Commun. Mag., vol. 34, pp. 3441, Dec. 1996.
[7.78] Mulimedia Multiplex and Synchronization for Audiovisual Communication in ATM
Environment, ITU-T Recommendation H.222.1 (03/96).
[7.79] Frame Structure for a 64 to1920 kbit/s Channel in Audiovisual Teleservices, ITU-T
Recommendation H.221 (07/97).
[7.80] Multiplexing Protocol for Low Bit Rate Multimedia Communication, ITU-T
Recommendation H.223 (03/1996).
[7.81] Information Technology-Abstract Syntax Notation One (ASN.1)-Specification of Basic
Notation, ITU-T Recommendation X.680 (07/1994).
123
8. APLIKATIVNI ASPEKT MULTIMEDIJA
Aplikativni aspekt multimedija obuhvata praktina znanja, postupke i resurse koji se
koriste u procesu multimedijalnog stvaralatva.
Multimedijalnim stvaralatvom, u najirem smislu, mogu se oznaiti sve kreacije
stvorene za vieulnu percepciju oveka. Koreni multimedija mogu se traiti ve u ranoj fazi
razvoja ljudskih zajednica sa pojavom prvih oblika ulnih komunikacija. Prvobitne meuljudske
komunikacije, kao i komunikacije izmeu ivotinja, audio-vizuelne su, to znai da su se
zasnivale na percepciji zvuka i slike.
Slika koja deluje na ulo vida predstavlja ulazni signal za video percepciju.
Zvuk koji deluje na ulo sluha predstavlja ulazni signal za ujnu percepciju.
U razvoju komunikacija izmeu ljudi, kao i izmeu ljudi i ivotinja, zvuk je imao
znaajniju ulogu od slike. Komunikacija pomou zvuka moe se ostvariti u odsustvu svetlosti,
kada nema slike, to je za evolucioni opstanak vrsta izuzetno znaajno. Za oveka, zvuk je
znaajan, jer je modulisanjem i kodovanjem zvunih signala formiran govorni jezik za
sporazumevanje. Govor oveka uzdie na vii oblik komunikacija u odnosu na ivotinjski.
Logika i proces miljenja zasnovani su na reima i jeziku. Razvojem govornog jezika razvija se
proces ljudskog miljenja. Govor i govorna komunikacija opstaju kao dominantan oblik
komunikacije. Tokom razvoja civilizacije razvijali su se, pored govornih, i drugi oblici
komunikacije meu ljudima. Govor i u najrazvijenim dravama, kao i u nerazvijenim drutvenim
zajednicama i nepismenom delu stanovnitva, ostaje najznaajniji nain komunikacije.
Pojava pisma doprinela je ubrzanom razvoju ljudske civilizacije. Pismom se memorie
govorni jezik. Razvoj pisanog jezika omoguio je da se steeno znanje generacijski uva,
dopunjuje i integrie. Pismo predstavlja simbolian prikaz govornog jezika. Elementi govornog
jezika glasovi fonemi, rei i reenice, koduju se pomou vidljivih simbola zapisanih na vrstoj
podlozi. Predstavljanje govornog jezika pomou pisma, ostvareno pre vie milenijuma,
ekonomian je nain izraavanja veoma pogodan za memorisanje, obradu i prenos pomou
savremenih informaciono-komunikacionih ureaja i sistema.
Due od jednog veka govorni jezik memorie se i reprodukuje u prirodnom obliku, to
predstavlja izvanrednu pogodnost za nepismene i konfor za pismene. Iako je za generacijski
prenos znanja pisani jezik teorijski prestao da bude jedina mogunost, ne sagledava se kraj
korienja pisma. Savremeno pismo ima viestruku informacionu i dizajnersku funkciju.
Poslednje ubrzavanje civilizacijskog razvoja ostvaruje se razvojem programiranja i
primenom programabilnih sistema. Programiranjem se reguliu procesi, upravlja dogaajima u
sadanjem i buduem trenutku. U sofisticirane ureaje ugrauje se sve vie znanja i na taj nain
124
im se preputa voenje sloenih procesa koji su ranije zavisili od oveka. Razvojem
programiranja ostvarena je mogunost interakcije oveka i maina.
Razvoj sofisticiranih informaciono-komunikacionih uraaja i sistema omoguio je da se
integriu slika, zvuk i tekst to je oznaeno kao multimedija. Multimedija, o kojoj su posveena
prethodna poglavlja ove knjige, ukljuuje sva pomenuta saznajna dostignua koja se odnose na
zapisivanje, obradu, i prikazivanje audio-vizuelnih sadraja.
Sa multimedijom se uvodi pojam virtuelnog sveta i virtuelne stvarnosti. Formiran je,
takoe, pojam fizika realnost i virtuelna realnost.
Virtuelnost je pojam kojim se oznaava neto to nije a prikazuje se kao da jeste. Primer
za virtuelnost su ceremonijali koji prikazuje englesku kraljicu kao da ima apsolutnu vlast, iako
ona nema stvarnu vlast. U demokratskim monarhijama, za vlast kraljeva kae se da je
protokolarna, odnosno virtuelna. Protokoli posebne vrste koriste se i u multimedijalnim
sistemima na kojima se prikazuje virtuelna stvarnost.
Pomou multimedijalnih tehnologija umetnici kreiraju nove imaginarne svetove,
pokuavajui da to vie budu originalni, razliiti od poznatog realnog sveta. Da bi se imaginarni
svetovi predstavili oveku, dizajniraju se prema mogunostima ulne percepcije. To znai da se
u prezentaciju imaginarnog sveta ugrauju zakonitosti fizikog sveta, jer su ula na njih
adaptirana. Imaginarni svetovi na taj nain postaju virtuelni. Virtuelni svet kreira se pomou
signala slike i zvuka, a u novije vreme ukljuuju se i ureaji za generisanje signala mirisa.
Najvei stepen virtualizacije ostvaruje se u multimedijalnim prezentacijama u koje je
uprogramirana mogunost interakcije sa korisnikom.
Virtuelna, kao i realna stvarnost prezentira se oveijim ulima u prostorno-vremenskim
koordinatama. U prostoru i vremenu ispoljava se sve ono to sadri fiziki svet. Virtuelni svet i
virtuelna realnost, koji se kreira pomou multimedijalnih tehnologija, kao i fiziki svet i fizika
realnost, takoe se neizbeno prikazuju u prostoru i vremenu.
Prostor i vreme su fizike veliine koje imaju presudnu ulogu u svim fazama realizacije
multimedijalnog projekta.
Angaovani multimedijalni resursi definiu se na osnovu prostornih i vremenskih
parametara informacionih sadraja multimedijalnog proizvoda.
Prostorni domen informacionih sadraja odreuje potrebnu veliinu, odnosno kapacitet
memorijskih resursa.
Vremenski domen informacionih sadraja odreuje zahtevanu propusnu mo, odnosno
kapacitet prenosnih resursa komunikacionog sistema.
Alati za multimedijalnu produkciju kojima se obrauju informacioni sadraji u
prostornom i vremenskom domenu isprogramirani su na osnovama analitike geometrije i
Fourier-ovih transformacija. Prostorne i vremenske koordinate signala meusobno se povezuju i
transformiu u cilju obrade i prenosa vizuelnih sadraja. Tako se prenos 2D slike kroz 1D kanal
ostvaruje zahvaljujui prostorno-vremenskoj transformaciji. Slika, kao 2D raspodela svetlosti,
tretira se kao skup piksela koji se mogu sukcesivno preneti kroz 1D kanal i na odreditu
rasporediti u 2D prostor na osnovu vremenskog redosleda pristizanja.
125
8.1 Aplikativni aspekt osnovnih
informaciono-komunikacionih pojmova
U ovom poglavlju multimedija se razmatra sa aplikativnog aspekta. itaoce koje
multimedija interesuje samo sa aplikativnog aspekta korisno je podsetiti na pojednostavljene
definicije osnovnih pojmova u oblasti multimedija.
Medij, re starogrkog porekla koristi se da oznai sredinu, prostor, ili sredstvo za
prenos, memorisanje i prezentaciju informacija.
Multimedija, to bukvalno znai mnogo sredina, sadri pojmovnu suvinost jer je medija
mnoina od medij, a poinje da se koristi sedamdesetih godina prolog veka u razliitim
kontekstima da bi se devedesetih godina preciznije definisala.
Multimedija, prema standardu ISO/IEC JTC1 SC29/WG12, kako je ve navedeno na
poetku ove knjige, predstavlja sposobnost postupanja sa razliitim vidovima prezentacionih
medija koji ine tip podataka sa zadatkom da definiu prirodu informacije u njenom kodiranom
formatu.
Navedena definicija najkompetentnijih asocijacija za multimediju je uoptena i strogo
egzaktna. Iako se sa naunog aspekta ne moe dati primedba, data definicija je, zbog
apstraktnosti, suvie neprikladna za iru upotrebu.
Za praktiare zadovoljavajue je koristiti jednostavniju definiciju.
Multimedija, sa aplikativnog aspekta, predstavlja informaciono-komunikacioni proizvod
raunarskih tehnologija koji pomou integrisanih hardverskih i softverskih ureaja prikazuju
pojave za ulo vida, sluha, i dodira, u novije vreme i za ulo mirisa. Multimedijalni proizvod
predstavlja sintezu slika, teksta, animacije, zvuka, taktilnih elementa, u novije vreme i mirisa.
Multimedija pojmovno obuhvata razliite medije, informacione sadraje, i interaktivnost.
Interaktivna multimedija podrazumeva postojanje interakcije sa korisnikom. Savremeni
multimedijalni proizvodi su, po pravilu, interaktivni, pa se pod pojmom multimedija
interaktivnost ve podrazumeva, i pridev interaktivna izostavlja.
Hipermedija je interaktivna multimedija sa linkovima za navoenje korisnika.
U savremenom drutvu miltimedija postaje nova pismenost i opti nain izraavanja.
Multimedija se koristi u marketingu, obrazovanju, zabavi, medicini i poslovanju. Skoro
da nema delatnosti gde multimedija ne nalazi primenu.
Proces realizacije multimedijalnih proizvoda definiu: namena, sadraj, raspoloive
tehnologije i korieni mediji.
Namena multimedijalnog proizvoda definisana je funkcijom koju proizvod treba da
ostvari da bi se ulaganja u njegovu realizaciju isplatila.
Sadraj se odreuje prema nameni, i prema raspoloivim tehnologijama i korienim
medijima. Koje e se raspoloive tehnologije i mediji koristiti zavisi od namene proizvoda i
izdvojenog budeta.
Prema funkciji, mediji se klasifikuju na: memorijske, prenosne i prezentacione.
Memorijski medij je fiziko sredstvo za skladitenje informacija, kao to su:
poluprovodnike, magnetne i optike memorije.
Osnovni parametri koji karakteriu memorijske medije su: kapacitet memorije, vreme
pristupa i fiziki gabariti.
Prenosni medij je sredina ili sredstvo za prenos signala kao to su: bakarni provodnici,
staklena vlakna i slobodan prostor.
126
Osnovni parametri kojim se karakteriu prenosni mediji su: poduno slabljenje i prenosni
kapacitet.
Prezentacioni medij je fiziko sredstvo ili ureaj pomou koga se informacije
predstavljaju korisniku, kao to su ureaji sa ekranima za prikazivanje slike i ureaji sa
zvunicima za generisanje zvuka.
Medij za prikazivanje slike karakteriu parametri za rezoluciju, kontrast i osvetljaj slike.
Medij za generisanje zvuka karakterie dinamiki i frekvencijski opseg audio pojaavaa
i zvunika.
Kroz medij cirkulie energija, materija i informacija. Komunikacije se zasnivaju na
razmeni informacija. U informaciono-komunikacionim tehnologijama, od interesa je
informacioni aspekt korienja medija.
Osnovni informaciono-komunikacioni pojmovi su: informacija, poruka, podatak,
komunikacija, signal i kodovanje.
Informacija predstavlja skup poruka.
Poruka predstvalja skup podataka.
Podatak predstavlja karakteristiku elementa, sistema, ili procesa.
Komunikacija predstavlja proces prenoenja informacija.
Prenoenje informacija se ostvaruje pomou signala.
Signal je materijalizovani nosilac informacija.
Po obliku razlikuju se analogni i digitalni signali.
Analogni signali nastaju kao neposredan odraz procesa koji generiu fiziki fenomeni i
na prijemu donose informacije u istom obliku kako ih fiziki fenomeni, iji su odraz, generiu.
Primeri analognih signala su zvuni i svetlosni talasi, odnosno zvuci koje sluamo i slike koje
gledamo. oveija ula predstavljaju prijemnike za analogne signale slike, zvuka, dodira, mirisa
i ukusa.
Digitalni signali nastaju u procesu kodovanja i prenose informacije pomou simbola
odreenog kodnog sistema.
Kodovanje je postupak simbolinog ifrovanog predstavljanja informacija pomou
elemenata odreenog brojnog sistema ili azbuke odreenog jezika.
Za memorisanje, obradu, prenos i korienje digitalnih signala koriste se sofisticirani
ureaji i sistemi.
Signali se karakteriu dinamikim, frekvencijskim i vremenskim domenom.
Dinamiki domen signala koristi se za predstavljanje snage, odnosno intenziteta signala.
Za obradu i prenos signala znaajan je raspon ili odnos maksimalnog i minimalnog intenziteta
signala to se oznaava kao dinamika signala. Od dinamike signala zavisi sa koliko bita,
osnovnih informacionih jedinica, analogni signal se koduje i prevodi u digitalni oblik.
Frekvencijski domen koristi se za predstavljanje brzine promena signala. Za obradu,
memorisanje i prenos signala znaajna je maksimalna brzina promene, odnosno maksimalna
uestanost frekvencija signala. Poveanjem maksimalne uestanosti rastu i zahtevi u pogledu
potrebnih resursa za obradu, memorisanje, i prenos signala.
Vremenski domen koristi se za predstavljanje brzine promena, trajanja pojedinih
intervala, i ukupno trajanje signala. Brzine promena povezane su sa spektrom signala, odnosno
frekvencijskim domenom. Trajanja pojedinih intervala i ukupno trajanje signala odreuje
zauzetost procesorskih, memorijskih i prenosnih resursa.
127
Pomou multimedijalnih tehnologija obrauju se pojedinano i/ili objedinjuju podaci koji
se odnose na tekst, zvuk i sliku. Od podataka se formiraju signali za potrebe memorisanja,
prenoenja ili prikazivanja multimedijalnih informacija.
Signali sa tekstualnim, zvunim i slikovnim sadrajima razlikuju se po koliini
informacija, odnosno brzini prenoenja.
Najmanje memorije zauzimaju i najbre se prenose signali sa tekstualnim sadrajem.
Najvie memorije zauzimaju i najsporije se prenose video signali, odnosno signali koji
nose informacije o pokretnim slikama.
Signali zvuka predstavljaju talasni prenos oscilacija kroz materijalnu sredinu i imaju u
osnovnom opsegu spektar irine 20 kHz i dinamiki opseg od preko 100 dB. Kod prevoenja
zvunog signala u elektronski analogni ekvivalent koji se zovu audio signali potrebni su veliki
kapaciteti memorija i prenosnih kanala. Za prevoenje analognih u digitalne signale potrebno je
jo vie kapaciteta.
Signali pokretnih slika, odnosno njihovi elektrini ekvivalenti koji se najee nazivaju
video signali, imaju u osnovnom opsegu spektar irine od 5 MHz i dinamiki opseg od 50 dB,
zbog ega je i za njih, kod prevoenja u digitalni oblik, potrebna velika memorija i velike brzine
prenosa.
Za ekonomino memorisanje i prenos audio i video signala razvijeni su postupci
kompresije pomou kojih se smanjuje koliina podataka koja reprezentuje signale. Prenos i
memorisanje digitalnih audio i video signala bez kompresije bili bi izuzetno zahtevni i mnoge
komunikacije praktino neostvarljive. Procesom kompresije omoguava se memorisanje i prenos
digitalnih audio i video signala sa viestruko manjim memorijskim i prenosnim resursima.
Postupci kompresije su dugo godina razvijani i usavravani da bi se na kraju optimalne varijante
kompresije usvojile u formi standarda. Usvojeni su standardi za kompresiju mirne slike,
kompresiju audio signala i za kompresiju video signala.
Kompresioni postupci mogu biti reverzibilni bez gubitaka, i nereverzibilni sa
gubicima.
Za prezentaciju kod krajnjeg korisnika neophodno je postupcima dekompresije vratiti
signal u prirodni oblik. Dekompresovani signal, zavisno od toga da li je kompresija reverzibilna
ili nereverzibilna, moe biti potpuno veran originalu, ili unekoliko degradiran zbog gubitka
odreenog procenta informacionog sadraja.
Multimedijalni sistem predstavlja skup ureaja i programa za integrisanu obradu i
upravljanje nezavisnim diskretnim i kontinualnim medijima u cilju prilagoavanja realnih
pobudastimulusa oveijem ulnom sistemu za zadovoljenje odgovarajue percepcije.
Multimedijalni sistemi obrauju nezavisne medije i kada su oni funkcionalno povezani, na
primer snimak lica govornika i njegovog govora. Ako je zbog sinhronizacije i prepoznavanja
govora potrebno da se povee izgovor sa pokretima usana, onda se koriste multimodalni sistemi.
Multimodalnost predstavlja povezanost meusobno zavisnih kanala modalities za
ulnu percepciju, kao to je zavisnost govora od pokretanja usana i izraza lica.
Multimodalni sistem predstavlja skup ureaja i programa za integrisanu obradu i
upravljanje meusobno zavisnih medija odnosno meusobno zavisnih komunikacionih kanala.
Govor je povezan sa pokretanjem usana i izrazima lica, pa se preko ula vida dopunjava doivljaj
koji dolazi od ula sluha.
128
8.2 Osnovne multimedijalne delatnosti
Multimedijalna delatnost je multidisciplinarna i obuhvata razne tehniko-tehnoloke,
ekonomske, socioloke i umetnike specijalnosti.
Stvaranje multimedijalnog dela, zavisno od njegove kompleksnosti, zahteva angaovanje
razliitog broja i profila strunjaka. Kreiranje multimedijalnog proizvoda moe da bude
nemetodino ili proceduralno strukturirano. Primer nemetodinog stvaranja su pojedinani
proizvodi koji nisu dobro definisani.
Za realizaciju kompleksnih projekata ukljuuju se timovi strunjaka, dok odreeni
jednostavni proizvod moe da kreira samo jedan izvrilac. Projekti zatevaju procedure i
metodoloku strukturalizaciju.
Za poetak rada treba da postoje odreeni zahtevi kojima se specificiraju zahtevi
investitora. Ti zahtevi predstavljaju projektni zadatak za realizaciju multimedijalnog proizvoda.
Projektni zadatak predstavlja dokument kojim se izraavaju:
Potrebe,
Sadraj,
Propisi,
Specifikacija naruioca klijenata,
Proizvodnja ili izbor multimedijalnih komponenti teksta, slike/ grafike, audio i
video/animacije koji e najbolje preneti poruku,
Navigacija koja odreuje eljeni nain prezentacije multimedijalnog proizvoda,
Tehnoloka ogranienja: potrebe zahtevi za materijal, softver, hardver, trokovi i vreme
stvaranja, su ograniavajui inioci stvaranja multimedijalne aplikacije koje je potrebno
uzeti u obzir u procesu stvaranja,
Kontrola ispravnog funkcionisanja multimedijalnog proizvoda,
Trite,
Medij za isporuku, nain distribuiranja,
Transport, reklamiranje i odravanje podrka multimedijalnog proizvoda,
129
Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se
neposredno formira sadraj koji e se ugraivati u proizvod. Zavisno od kompleksnosti
proizvoda koristi se raunar, kamera, glumci, kostimi, studija i scenografija.
130
Demografska analiza strukture ljudske populacije koristi statistiku koja se odnosi na
godinu roenja, smrti, ekonomski nivo, bolesti, geografske koncentracije ili znanja
proizvoda.
Psihografskom analizom se vri klasifikacija populacije prema njihovim osobinama, kao
to su nain ivota, primarni interesi, verovanja.
Na dizajn poruke utiu faktori kao to su: publika kojoj je namenjena, medijum, svrha i
priroda poruke. Kada se planira za multimedijalnu produkciju, vano je definisati gde e
se distribuirati zaveni projekat, definisati krajnjeg korisnika ciljnu publiku, to
odreuje kako e sadraj biti prezentovan.
c) Definisanje cilja
Definisanje cilja koji se eli postii multimedijalnim projektom slui kao odrednica
multimedijalnoj produkciji. Kada se postavljaju ciljevi projekta, treba da budu jasno
definisani, hijerarhijski ureeni i kvantitativno formulisani. Brojne vrednosti za
prikazivanje poruke omoguavaju da se kasnijim prikupljanjem podataka moe ustanoviti
da li je konaan proizvod uspean. Ciljevi treba da budu realno dostini, to znai da se
uzimaju u obzir realne mogunosti, isplativost i trokovi proizvodnje.
d) Osnovno istraivanje
Osnovno istraivanje obuhvata prouavanje teme i tehnologije na kojoj se radi. Kreator
multimedijalnog proizvoda istraivanjem izgrauje subjektivno znanje o predmetnoj
materiji. Istraivanje moe ukljuiti susret sa ekspertima, itanje publikacije, istraivanje
na internetu, ili pogledati kako su drugi profesionalci reili sline probleme.
Proces generisanja ideje Brainstorming za stvaranje multimedijalnog proizvoda
ukljuuje i razmiljanje:
e) Razmatranje sadraja
Posle definisanja ideje razmatra se prototip/skica sadraja. U multimedijalnom dizajnu
prototip se moe izraditi kao: serija skica, storyboard, Powerpoint slide show, Flash
prezentacija, video koji simulira korienje sistema, kartonska simulacija, serija veb
stranica.
Skica sadraja je narativni opis sadraja multimedijalnog proizvoda, konfiguracija
istorije/prie ili poruke koja treba da se prenese korisnicima, koristei odgovarajuu
usmenu ili pismenu tehniku. Istraivane informacije se prikazuju odreenim redosledom.
Dizajnirane su da obezbede usredsreivanje na ideju ili subjekat videa.
Razvijanje teme multimedijalnog projekta ukljuuje:
131
2) Razmatranja dizajna screen layout ukljuujui: ravnoteu (eng. balance),
jedinstvo (eng. unity), boju (eng. color).
3) Skiciranje na papiru screen layout, raspored osnovnih elemenata.
4) Definisanje interfejs dizajna.
132
Identifikaciju sadraja koji treba da ima specijalnu dozvolu ili copyright izdanje,
Ukupan broj stranica layout-a,
Neophodne detalje za navigaciju,
Definisanje odreenih oblika interaktivnosti,
Informacije u vezi sa projektantima (dizajniranje) multimedijalnog proizvoda,
Komentare i druge korisne informacije za programere koji e da preuzmu kreiranje
multimedijalnog proizvoda.
PROCENA TROKOVA
133
mogu raditi izvrioci koji objedinjuju vie razliitih funkcija. Sledee specijalnosti se mogu
izdvojiti kao posebne:
Menader projekta oblikuje projekt u svim fazama rada, poev od trenutka programske
i urednike odluke za odreeni projekat pa do njegove potpune realizacije. Predlae i
usvaja tehnoloko-produkciona reenja realizacije projekta. Vri rediteljsku razradu
emisije i izrauje detaljnu knjigu snimanja.
Urednik osmiljava projekte i akcije, obavlja predistraivanje, istrauje, prikuplja,
stilski i anrovski klasifikuje i ureuje sadraj, uestvuje u realizaciji, koordinira rad
ekipe.
Direktor produkcije upravlja, organizuje, koordinira i kontrolie tehnoloki proces
proizvodnje.
Producent izrauje/odobrava plan proizvodnje, organizuje i finansijski vodi
proizvodnju i finalizaciju projekata, odgovoran je za budet projekta, sprovoenje
tehnikih standarda i rokove proizvodnje.
Reditelj uestvuje u oblikovanju projekta u svim fazama rada, poev od trenutka
programske i urednike odluke za odreeni projekat pa do njegove potpune realizacije,
predlae i usvaja tehnoloko-produkciona reenja realizacije projekta, uestvuje na
dramaturkoj obradi scenarija, vri rediteljsku razradu emisije i izrauje detaljnu knjigu
snimanja, vri izbor glumaca, izvoaa i drugih uesnika u projektu, rukovodi kreativnim
procesom snimanja slike i zvuka, kreativno rukovodi postprodukcijskim procesom.
Snimatelj slike u pripremnoj fazi uestvuje u utvrivanju tehniko-produkcionih uslova,
utvruje tehnike standarde snimanja slike, potrebnu tehniku i opremu za snimanje slike,
u fazi snimanja postavlja svetlosnu postavku, pozicionira kameru, snima sliku u skladu sa
produkcijskim zahtevima, utvruje sve pokrete kamere, nain i opremu za njihovo
izvoenje.
Pisanje scripta,
Istraivanje i pisanje sadraja,
Izbor i priprema odgovarajue opreme za video snimanje: kamera, tripod, mikrofoni,
134
svetlo,
Snimanje audio i video sadraja koristei storyboard,
Montaa audio i video sadraja,
Stvaranje multimedijalnih komponenti,
Razvoj kompjuterske animacije,
Interfejs dizajn,
Grafiko oblikovanje,
Integrisanje multimedijalnih komponenti u multimedijalni proizvod (eng. authoring),
Testiranje proizvoda.
135
zum (eng. zoom). Kombinacija geografskog i vremenskog prikazivanja je veoma esta,
jer pokriva veliki broj multimedijalnih proizvoda, kao to je prikazivanje istorijskih
dogaaja za oblast neke drave, ili prikazivanje prostorno-vremenskih manifestacija.
Video postprodukcija je obrada snimljenog videa, materijala ili filma u zavrni proizvod
za emitovanje ili distribuciju. Osnovni procesi u video postprodukciji su rendering i snimanje
zavrne verzije na prenosni medij.
Rendering (eng. rendering) predstavlja proces kompjuterske sinteze slike od sirovih
podataka, modela, odnosno elemenata scene ije objekte i osobine materijala uobliavaju
svetlosni izvori, poloaji i pravac posmatranja gledaoca. Osvetljenje ima presudan uticaj na
scenski doivljaj pa se renderovanje esto oznaava kao poslednja faza u procesu dizajniranja
slika.
Poslednja faza pred distribuciju multimedijalnog proizvoda je snimanje kreiranog
proizvoda na spoljanji prenosni medij: tejp, DVD, CD, fle memoriju.
Distribucija multimedijalnog proizvoda moe da se obavlja preko interneta on-line, ili
pomou memorijskih medija CD-ROM, DVD, fle memorija off-line.
136
8.3 Slika u multimediji
Slika, sa fizikog aspekta, predstavlja raspodelu svetlosti na povrini, u ravni ili prostoru.
Svetlost je elektromagnetni talas sa irokim opsegom talasnih duina od 390 nm do
760 nm, koje se pojedinano vide kao boje svetlosti.
Boja predstavlja jedan ui deo svetlosnog spektra koji sistem za vid razlikuje od susednih
delova spektra. Boje se klasifikuju na primarne, sekundarne i tercijarne.
Primarne ili osnovne boje su crvena, plava i uta.
Sekundarne boje ili boje drugog reda su narandasta (uta + crvena), zelena (plava +
uta) i ljubiasta (crvena + plava).
Tercijarne boje boje vieg reda su kombinacije primarnih i sekundarnih boja. Ljudsko
oko razlikuje oko 10 miliona razliitih boja. Ogromna paleta tercijarnih boja dobija se meanjem
primarnih i sekundarnih boja.
Postoje dva naina meanja boja, aditivno i subtraktivno meanje boja.
Aditivno meanje boja odvija se na osnovu superpozicije, sabiranja svetlosnih talasa
pojedinih boja. Svaka boja se moe sintetizovati od odgovarajue koliine tri osnovne boje.
Primer aditivnog meanja boja su slike na ekranima.
Subtraktivno meanje boja odvija se na osnovu meusobne apsorpcije obojenih estica,
to je sluaj u slikarstvu.
Monohromatska slika je crno-bela slika, a hromatska slika je slika u boji.
Slika u multimediji predstavlja 2D tabelu diskretnih elemenata slike piksela.
Piksel (eng. picture element) je elemenat slike odreen svojom sjajnou i poloajem u
slici.
Sjajnost piksela se izraava brojnom vrednosti intenziteta.
Poloaj piksela predstavlja se koordinatama (x, y).
137
Kod sofisticiranih tennikih video sistema, razvijaju se, po ugledu na modani centar za
vid, vii nivoi obrade slike. Istrauje se sadraj, semantika slike, i razvijaju sistemi za
prepoznavanje oblika. Ureaji koji transformiu optiku u elektrinu sliku pogodnu za obradu i
prenos su elektronske kamere i skeneri. To su ureaji za snimanje capture ureaji.
Optika slika kao 2D raspodela svetlosti transformie se u 2D sliku raspodele
elektronskih naelektrisanja.
Dvodimenzionalna slika raspodele elektronskih naelektrisanja transformie se u analogni
video signal.
Memorisanje slike vri se posredstvom video signala u kome su sadrane informacije o
svim elementima slike pikselima.
Kod savremenih ureaja analogni video signal transformie se u digitalni video signal
koji obrauju mikroprocesori. Slika se u digitalnom obliku memorie kao matrica u kojoj su
redovi pikseli na koordinati X, a kolone pikseli na koordinati Y.
138
Fotodiode se integriu u 1D nizove koji se koriste kao senzori u skenerima. Napon na
izlazu fotodiode je proporcionalan intenzitetu svetlosti.
PAL sistem 625/50 Hz (Evropski standard linijske promene faze (eng. phase alternating
line PAL)),
NTSC sistem 525/60 Hz (Ameriki standard nacionalnog komiteta za televizijski sistem
(eng. National Television System Committee NTSC))
HDTV . Televizija visokokog kvaliteta definicije (eng. high-definition television
HDTV) postoji vie varijanti. Osnovne su dve: 1125 /60 Hz i 1250/50 Hz, ali obzirom na
digitalnost fleksibilan je i razvijaju se nove verzije sa znatno veim brojem linija.
139
Kodovanje je proces izraavanja kvantovane vrednosti odbiraka pomou odreenog koda,
odnosno brojnog sistema. Po pravilu koristi se binarni brojni sistem gde je ukupan broj simbola
N odreen eljenim brojem bita B prema formuli N = 2B.
Poboljanje slike predstavlja postupak obrade kojim se vri poboljanje kontrasta,
potiskivanje uma, pojaanje otrine i bojenje.
Postupci za poboljanje slike relativno su jednostavni i mogu se obavljati u realnom
vremenu.
Restauracija slike je postupak obrade kojim se poboljava kvalitet slike kada je
degradacija slike poznata i kada se moe formirati model degradacije. Tu spada korekcija
geometrijskih izoblienja optikog sistema kamere, potiskivanje uma iji je statistiki model
poznat i korekcija smanjene otrine slike usled pokreta ili defokusacije kamere.
Metode restauracije su kompleksni i najee se ne mogu izvravati u realnom vremenu.
Kompresija slike je postupak smanjenja broja informacionih bita pomou kojih se slika
memorie i prenosi.
Standardna filmska slika dimenzija 24 mm 36 mm, ima oko 107 piksela ako je
rezolucija filma 0.01 mm.
Standardna digitalna slika rezolucije 512 512 piksela ima oko 256 000 elemenata
kodovanih sa 8 bita/odbirku smeta se u 256 KB memorije.
Za memorisanje TV slika u toku jedne sekunde potrebno je 10 MB.
Efikasnost kompresije zavisi od sadraja slike.
Sve metode kompresije sadre programski deo i deo za podatke koji se poveava sa
poveanjem stepena kompresije to ograniava krajnju utedu u potrebnom memorijskom i
prenosnom kapacitetu.
Kompresija bez gubitaka (eng. lossless compression) omoguava dekompresiju
originalne slike. Dekomprimovana slika je identina originalnoj slici. Kodovanje duine niza
(eng. run-length encoding RLE) je kompresija sadraja slike bez gubitaka pomou beleenja
duine niza istih vrednosti piksela. Algoritmi RLE kompresije su:
140
kvantizacionom matricom. Mnoge komponente, naroito na viim frekvencijama, aproksimiraju
se sa vrednou nula, dok je kod ostalih komponenti smanjen broj bitova potrebnih za
memorisanje vrednosti komponenata koje nemaju vrednost nula. Naknadno se na njih primenjuje
RLE kodovanje.
Selekcija se vri specijalizovanim alatima za izdvajanje pravougaonih i eliptinih oblika,
nepravilnih povrina sa tkz. maginim tapom (eng. magic wand) i magnetskim lasom (eng.
magnetic lasso). Selekcija definie masku koja stoji preko dela slike koji nije selektovan i koji je
zatien od obrade.
Maska moe biti: providna, neprovidna, i poluprovidna. Nijansirane maske nazivaju se
alfa kanali (eng. alpha channel), mogu imati 256 nivoa providnosti. Bojenje, filtracija i druge
modifikacije piksela pomou digitalnih maski proporcionalno je vrednosti zapisanoj u alfa
kanalu. Dve ili vie slika mogu se utopiti u jednu pomou raznih veliina prozirnosti maski kao i
ublaiti otre ivice objekata na slici.
Obrada pojedinanih piksela omoguava proporcionalne promene bitmapirane slike u
celini kao to su dobijanje negativa, korekcija sjajnosti i kontrasta, kao i korekcija boja. Za
vrednost piksela p nova vrednost p' se dobija kada se primeni funkcija f, tj.,
p' = f(p).
f(p) = W p
gde je
W vrednost piksela koja reprezentuje belu boju.
141
mestu slike. Opseg moguih vrednosti intenziteta svetlosti je odreen brojem kvantizacionih
nivoa brojem nivoa sivog, zavisno od broja bita po pikselu.
Hromatska slika predstavlja se sa tri 2D matrice (crvena, zelena i plava) gde su
reprezentovane vrednosti odbiraka na koordinatama X i Y koje odgovaraju vrednostima
intenziteta boje na odreenom mestu slike.
Rezolucija slike, kao osnovni parametar bitmapirane slike, predstavlja meru sa kolikom
finoom digitalna slika, sa konanim brojem piksela, aproksimira kontinualnu sliku. Kvalitet
slike zavisi od broja piksela prostorne rezolucije i broja kvantizacionih nivoa nijansi.
Geometrijske promene u bitmapiranoj slici vre se transformacijama za rekonstrukciju
slike iz jednog oblika u drugi. To je ekvivalentno transformaciji u analogni video signal i
ponovno odabiranje pri emu se koriste metode interpolacije.
Rezolucija za tampae i skenere izraava se brojem taaka po jedinici duine (eng. dots
per inch dpi).
Rezolucija tampaa se definie brojem linija po inu. Rezolucija tampai je 600 dpi do
1200 dpi, a najbolji do 2700 dpi. tampai u boji mogu imati rezoluciju ak i 1200 taaka po
inu, to ne znai da se tako velika rezolucija koristi za tampanje svih fotografija. asopisi u
boji koriste rezoluciju od 137 linija po inu, dok se u knjigama najvie upotrebljavaju rezolucije
od 150 taaka po inu. tampai u boji koriste etiri do est osnovnih boja. Rasterska elija
tampaa u boji sadri osnovne boje i definie veliinu piksela kolor slike.
Rezolucija skenera odreuje sa kolikom finoom e raster slike biti iskorien da
reprezentuje datu sliku. Bitmapirana slika e imati vie detalja ako je vei dpi skenera. Tipian
opseg vrednosti rezolucije skenera je oko 300 dpi do 3600 dpi i vie. Veliina rezolucije za
skeniranje bitmapirane slike zavisi od toga za koju je namenu planirana slika: da li e se slika
tampati, da li je slika planirana za prikazivanje na monitoru, ili za veb prezentaciju. Fotografije
u asopisima reprodukovane su sa oko 200 dpi do 300 dpi. Ako se planira skeniranje slike iz
asopisa i slanje na veb, skeniranje se moe izvriti sa rezolucijom od 72 dpi.
Dubina boje (eng. bit depth) je broj bita koji se dodeljuje svakoj taki i koristi se za opis
boje. Sa veom vrednosti bit depth skener je u mogunosti da odabira vie boja, to omoguava
vei raspon u promeni kontrasta (eng. contrast) i sjajnosti (eng. brightness) bitmapirane slike. Da
bi se formirala true colour skeneru je potrebno 24 bit depth, znai da se dodeljuje po 8 bita za
crevenu, plavu i zelenu boju za svaku taku piksel. U tom sluaju ukupan broj moguih boja je
28 28 28 = 256 256 256 = 16 777 216 16.7 miliona boja.
Rezolucija bitmapiranih slika na televizijskim ekranima i raunarskih monitora izraava
se brojem piksela u slici. Primeri slika sa visokom i niskom rezolucijom dati su na Slici 8.3.4.1.
Nezavisno od veliine ekrana, televizijska slika se prikazuje pomou istog broja piksela i
to:
VGA standard (video grafika kartica niz (eng. video graphics array VGA)):
640 480 pixela,
SVGA standard (super video grafika kartica niz (eng. super video graphics array
142
SVGA)): 800 600 pixela,
XGA standard (proirena grafika kartica niz (eng. eXtended graphics array XGA):
1024 768 pixela,
14 inni monitor sa 72 dpi = 640 480 piksela,
17 inni monitor sa 72 dpi = 832 624 piksela.
fizike dimenzije slike (inch) = dimenzije ekrana u pikselima (pix) / rezolucija ureaja (pix/inch).
143
pravih i krivih linija i oblika. Vektorska aritmetika ili analitika geometrija glavni je matematiki
aparat koji se koristi pri proraunu vrednosti piksela. Sa operativnog aspekta, vektorska grafika
predstavlja niz komandi kojima se ostvaruje generisanje i transformacije raznih geometrijskih
oblika. Prilikom prikazivanja vektorske grafike na ekranu, odvija se proces renderovanja.
Prikazivanje vektorskih slika renderovanje zahteva prethodni proraun za generisanje vrednosti
piksela.
144
Slika 8.3.5.2Ilustracija vektorskih transformacija: skaliranje, rotacija, translacija i refleksija
Jednostavnije su za editovanje,
Lake se pamte jer se percepcija mozga zasniva na pamenju osnovnih karakteristika
slike, kontura, engrama,
Pogodnije su za internet,
Reprezentacija vektorskih slika je kompaktna, skalabilna, nezavisna od rezolucije ekrana
to nije sluaj sa bitmapiranom slikom,
Uveanje objekta i pribliavanje ne izaziva smanjenje rezolucije detalja i gubitka na
kvalitetu,
Informacije o transformacijama i procedurama se pamte to omoguava da se mogu
kasnije menjati; to znai da pomeranje, skaliranje, rotiranje, popunjavanje, ili neka druga
geometrijska transformacija ne smanjuju kvalitet crtea kao kod bitmapirane slike.
Zbog istih i otrih prelaza izmeu boja, vektorskom grafikom se ne mogu prikazati
fotorealistine slike, fotografije.
145
Tabela 8.3.5.1Poreenje veliine datoteke bitmapirane i vektorske slike
Filmske tehnike
Video tehnike
Tehnike animacije
146
Filmska tehnika predstavlja proizvodnju pokretnih slika pomou celuloidne trake, tako
to se u procesu snimanja slike pokretnih i promenljivih objekata projektuju na filmsku traku, a u
procesu reprodukcije slike sa filmske trake projektuju se na ekran. Prenos slike na filmsku traku,
u toku snimanja, kao i prenos slike sa filmske trake, u toku prikazivanja, ostvaruje se
projekcijom pomou svetlosnih zraka.
U toku postprodukcije, sa filmom je mogua takozvana linearna montaa, koja se svodi
na nadovezivanje i lepljenje filmske trake.
Dimenzije filma su standardizovane. Filmski formati za irinu trake su: 8 mm, 16 mm, 32
mm.
Fuziona frekvenca kod filma iznosi 24 slike u sekundi sa po dva prosvetljavanja, to za
smanjenje treptanja daje efekat kao da je 48 slika.
Prednost filmske tehnike je visoka rezolucija slike.
Nedostatak filmske tehnike je nemogunost kontrole snimka u realnom vremenu.
147
vremenske transformacije. Iz video signala se vremensko prostornom koverzijom
reprodukuje slika na TV ekranima i monitorima.
Osnovne prednosti video tehnike koje joj obezbeuju primat nad filmskom tehnikom, su
mogunosti kontrole kvaliteta slike tokom snimanja i elektronska obrada video slike sa velikim
mogunostima za razliite transformacije, promenu sadraja, kompresiju, dekompresiju i
nelinearnu montau u procesu editovanja.
Klasinom video tehnikeom ostvarivana je manja rezolucija slike u odnosu na film, a
finansijska ulaganja su velika zbog potreba za velikim memorijskim kapacitetom raunara,
irokim opseom kanala za prenos video signala i veoma brzim video procesorima. Tokom
razvoja, navedeni problemi praktino su prevazieni.
Standardi u video tehnici usklaeni su sa televizijskim standardima:
Raunarski video sistemi nisu zavisni od TV standarda, broj kadrova se moe podeavati.
Za internet broj kadrova za prenos smanjuje se na (12 do 15) kadrova u sekundi, jer se na
prijemu mogu interpolirati meukadrovi i poveati brzina osveavanja ekrana.
Potrebni kapaciteti memorije i prenosnih kanala za tekst, sliku, zvuk i video znatno se
razlikuju.
Tekst jedna stranica sa 80 slova po liniji i 64 linije po stranici zahteva:
80 slova po liniji 64 linije 1 stranica 8 bita po slovu = 40 960 bita = 41 kbit/stranici.
Slika 24 bita po pikselu, 512 512 piksela, zahteva: 512 512 piksela 24 bita po
pikselu = 6 Mbit/slici.
Zvuk CD kvalitet odabiranja 44.1 kHz i 16 bita po odmerku zahteva za mono:
44 100 odmeraka/s 16 bita/odmerku = 706 kbit/s, i za stereo 1412 kbit/s.
Videokadar 360 240 piksela, kodovanih sa 24 bita po pikselu, 30 kadrova u sekundi
zahteva: 360 240 piksela 24 bita po pikselu 30 kadrova u sekundi = 60 Mbit/s.
Zvuk i slika u originalnom obliku teko bi se memorisali i prenosili.
Za memorisanje i prenos audio i video signala neminovna je potreba za kompresijom
signala zvuka i slike.
Kompresija signala zvuka i slike detaljno je obraena u okviru sedmog poglavlja ove
knjige Standardi u multimedijalnim komunikacijama.
148
Tekst u multimediji predstavlja vidljivu reprezentaciju govornog jezika i istovremeno
predstavlja grafiki, dizajnerski i estetski element. O dualistikoj prirodi teksta u multimediji
dizajneri posveuju posebnu panju.
Kao reprezent govornog jezika tekst nosi semantiki smisao zapisan slovima
odgovarajue azbuke korienog pisma.
Vizuelni izgled teksta u multimediji posebno je znaajan, a odnosi se na oblik slova
karaktera, prostor koji oni zauzimaju, kao i raspored po redovima, pasusima i veim delovima
teksta na ekranu ili stranici, to je problematika kojom se bavi umetnost tipografije.
Tekst se sastoji od reenica, reenice su sastavljene od rei, a rei predstavljaju
kombinaciju slova. Pored slova, tekst sadri interpunkcijske znake, brojeve i matematike
simbole. Tekst u dalekoistonim zemljama, koje koriste slikovno pismo, sastoji se od ideograma.
Uopteno, moe se rei da su osnovni elementi teksta karakteri.
Karakter, kao tekstualni elemenat, naziv je za slova, brojeve, interpunkcijske ili
matematike znake, ili pisane simbole. U informaciono-komunikacionim tehnologijama, karakter
se predstavlja, memorie i prenosi u binarnoj formi.
Razvoj digitalizacije i uvoenje teksta u raunar poeo je sa digitalnim kodovanjem
engleskog jezika, da bi se irio preko jezika razvijenih zemalja i danas obuhvatio idiograme i
praktino sva postojea pisma.
149
samo alternativno kreiranje akcentovanih slova, ve odgovara matematiarima koji po navici
prave nove karaktere dekoriui postojee. Obezbeene su kodne vrednosti za gotovo 39 000
karaktera, ostavljajui neke od kodnih poena neiskorienim.
Markap jezici kakvi su HTML i XML i programski jezik Java, koriste Unicode kao svoj
skup karaktera. Kada jednom bude usvojen kao skup karaktera veih operativnih sistema,
zadatak prenosa teksta koji koristi karaktere van SAD engleskog ASCII repertoara trebalo bi da
bude viestruko olakan.
Unicode je kompatibilan sa ISO 10646 standardom koji predstavlja dalje proirenje za
zapise koji nisu obuhvaeni sa prethodnim standardima, kao to su, na primer, notni zapisi.
ISO 10646 je 32-bitni kd karaktera, od kojih je 8 bita za 256 grupa, 8 bita za 256 ravni
za svaku od grupa i 16 bita za 65 536 karaktera u svakoj od ravni. Sa ovim standardom
ostavljene su najire mogunosti za sva budua proirenja.
8.4.2 Font
Font je izraz koji se u tipografiji koristio za skup slova jedne veliine i jednog tipa, a u
multimedijalnim tehnologijama font oznaava fajl sa glifovima i slovnim ornamentima. Font
predstavlja jednu odreenu familiju glifova.
Glif je izraz za aru, grafiki oblik i sliicu, a u multimedijalnim tehnologijama glif
oznaava spoljanji lik sa kojim se prezentira karakter.
Tekst se sastoji od nizova karaktera koji se u raunaru memoriu kao binarni kodovi
odreenog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali, kodovi karaktera
se povezuju sa glifovima smetenim u glifovskim datotekama fontovima. Datoteke glifova,
odnosno fontovi, razlikuju se po stilu, dizajnu i nainu memorisanja glifova.
Glifovi predstavljaju sliice i formiraju se, kao i slike, pomou bitmapirane ili vektorske
grafike. Nain formiranja glifova uzima se kao osnova za klasifikaciju fontova koji predstavljaju
zbirku glifova.
Fontovi se, na osnovu naina formiranja glifova, dele na bitmapirane i vektorske.
Bitmapirani Bitmap ili rasterski fontovi sastavljeni su od niza taaka, piksela, pomou
kojih se prikazuje slika karaktera. Prednost ovih fontova je to se brzo oitavaju, a nedostatak to
nisu skalabilni, jer je za svaku veliinu potrebno imati poseban skup fontova.
Bitmapirani fontovi pokazuju iste karakteristike kao i bitmapirane slike klasinih formata:
.bmp bitska mapa (eng. bitmap), .png pokretna mrena grafika (eng. portable network
graphics), i .tif format oznaene slike (eng. tagged image format) ili .tiff format dat. oznaene
slike (eng. tagged image file format). Svaka platforma poseduje sopstveni format bitmapiranih
fontova, najee poboljan na neki nain, da bi efikasno radio sa rutinama sistemskog softvera
koje obrauju prikazivanje teksta.
Konturni (eng. outline) ili vektorski fontovi sadre skup instrukcija, pomou kojih se
iscrtava glif kao vizuelna predstava karaktera. Velika im je prednost to su skalabilni, odnosno,
mogu menjati veliinu. Promena veliine glifa ne utie na njegovu rezoluciju, tako da se moe
koristiti samo jedan tip datog fonta.
Konturni fontovi grade se po pravilima vektorske grafike od krivih i pravih linija, i
obino su smeteni u formate za vie platformi. Dva najee koriena formata su Adobe Type
1, koji se esto jednostavno naziva PostScript font, iako postoji jo drugih PostScript fontova, i
TrueType.
150
TrueType font originalno je uveden od strane Apple-a, ali ga vie koristi Windows nego
Macintosh operativni sistem (eng. operating system OS)) Mac OS, kod koga se zbog
popularnosti Adobe vie koristi Type 1.
Konturni fontovi mogu biti proizvoljno skalirani i isti font moe biti korien za
prikazivanje na niskoj rezoluciji ili tampanje na jako visokoj. Program za prikazivanje moe da
prevodi konturne fontove bilo koje veliine. Program Adobe Type Manager (ATM) obavlja ovu
funkciju na sistemskom nivou za Type 1 fontove.
Konturni fontovi u bilo kom od popularnih formata mogu sadrati do 256 glifova. Glifovi
u Type 1 fontu jednostavno su mali programi, napisani u ogranienom podskupu PostScripta.
Ogranienja su namenjena da uine moguim da glifovi budu efikasno prikazani na ekranu,
programima kao to je ATM, u dovoljnom kvalitetu kada se prikau na rezoluciji ekrana.
TrueType je alternativni format. Konturni karakter u TrueType fontu uva se kao serija
taaka koje definiu linije i krive inei njihov oblik.
Novorazvijeni format OpenType ujedinjuje Type 1 i TrueType fontove, obezbeujui
format fajla koji omoguava da bilo koja vrsta konturnih fontova bude sauvana. OpenType su
razvili Adobe i Microsoft zajedno 19978 godine, a pojavio se 1998 i Type 3 format.
Postoji i format Type 0 u kome elementi fonta nisu glifovi karaktera, ve drugi fontovi.
Type 0 font namenjen je za uvanje kombinovanih fontova, od kojih je svaki sastavljen od
nekoliko Type 1 fontova. Njegova glavna namena je da obezbedi veliki repertoar karaktera, koji
bi bili potrebni za korienje u saradnji sa Unicode-om.
Type 1 i TrueType sadre, pored opisa glifova, i informacije koje mogu biti iskoriene
od strane programa za prikazivanje, da bi se poboljao izgled teksta na niskim rezolucijama. Ove
informacije odnose se na izuzetno fine osobine, koje mogu izgubiti svoju finou kada se manje
piksela koristi za svaku liniju. U Type 1 fontovima nalaze se u obliku saveta (eng. hints), koji
obezbeuju vrednosti i parametre koji mogu biti iskorieni da upravljaju prikazivanjem glifova
na niskim rezolucijama. Na primer, saveti su namenjeni da izazovu smanjenje prelaza. Kao to
smo pomenuli, prelaz normalno pomae da se pobolja propisani izgled fonta. Kako bilo, na
niskim rezolucijama, kada se veliina prelaza zaokrui na najblii piksel, efekat moe biti
preteran i tekst e izgledati nepravilnije nego to bi izgledao da mala slova budu tano visine h.
Taka na kojoj e se ukljuiti smanjenje prelaza direktno zavisi od dizajna fonta, pa ne moe biti
ukljuena bez informacija koje prua sam dizajner fonta. Saveti Type 1 fontova omoguavaju
distribuciju ovih informacija. Ostali saveti srazmerno smanjuju varijacije u osnovi fonta, koje e
iako estetski ugodne na velikim rezolucijama, izgledati u najmanju ruku nejednako na niskim
rezolucijama.
151
Problem povratka iz pisanog teksta u memoriju kodova karaktera javlja se zato to je kod
karaktera jedinstven i zauzima manje bita, dok je njegova grafika predstava glif sloenija i
zauzima vie memorije. Niz kodova karaktera kompaktniji je od niza glifova koji predstavljaju
isti tekst, pa zamena karakter kodova glifovima uveava veliinu fajla koji sadri tekst.
Grafiki prikaz teksta neefikasan je za pretraivanje i zbog toga to ne koristi ponavljajuu
prirodu teksta. Isti karakter, odnosno glif, viestruko e se ponavljati, pa ako je izvren prelaz u
glifove, mnogo kopija istog glifa e biti korieno, a svaki e biti mnogo vei nego odgovarajui
kd karaktera.
Vraanje u kod karaktere iz prikazivanog teksta moe da se ostvari na posredan nain,
pomou specijalizovanog raunarskog programa. Ako je stranica odtampana pa tekst skeniran,
rezultat je bitmapirana slika teksta. Do karaktera skeniranog teksta moe se doi pomou
specijalizovanog programa za optiko prepoznavanje znakova (eng. optical character
recognition OCR) koji analizira oblike na bitmapiranoj slici i prepoznaje koje karaktere ti
oblici predstavljaju. Ne postoji potpuna uspenost prepoznavanja ali je primena ovog programa
veoma zahvalna naroito kod digitalizacije papirnih izdanja.
Za sigurnu reprodukciju karaktera kod razmene tekstualnih dokumenata, naroito u
sluaju ree korienih fontova, postoji mogunost da se korieni font ugnezdi i alje zajedno sa
dokumentom. To poveava veliinu fajla ali obezbeuje sigurnost repliciranja.
152
Svako slovo ima svoj prihvatni prostor (eng. bounding box) koji je u stvari najmanji
prostor koji moe da obuhvati to slovo. Najee se ostavlja mali razmak meu prihvatnim
prostorima susednih karaktera. Drugim reima kada crtamo glif neposredno pored drugog,
prazan prostor se umee blizu glifa, i nalazi se van prihvatnog prostora, najee levo, na
razmaku koji je poznat kao nosa leve strane (eng. left side bearing), to je prikazano na Slici
8.4.4.1-b. Ponekad, kada se dva odreena slova smeste jedno pored drugog, prostor meu njima
izgleda premali ili preveliki. Postoji mogunost podeavanja letter spacing.
Veliine koje opisuju veliinu pojedinog karaktera i razmak meu karakterima, zajedno
su poznate kao metrika fonta. Programi koji obavljaju slovoslaganje, zahtevaju pristup metrici
fonta da bi odredili gde tano da smeste glif dok prave linije, pasuse i stranice. Organizacija ovih
informacija zavisi od formata fonta, raunarskog sistema i slovoslagakog softvera koji se
koristi.
Tip fonta predstavlja dizajn sa kojim su uraeni glifovi koji pripadaju odreenom fontu.
Razvijen je veliki broj razliitih tipova fontova. Ne postoji jedinstvena klasifikacija tipova
fontova.
Najosnovnija podela fontova po tipu je na fontove fiksne veliine jednomesne i
proporcionalne fontove.
Fontovi fiksne veliine sadre glifove koji za svaki karakter horizontalno zauzima
jednaku veliinu prostora, nezavisno od svoje veliine. Neka slova imaju, oko sebe, vie praznog
mesta od drugih. Na primer, uski oblik malog slova j ima oko sebe onoliko praznog prostora
koliko je potrebno da se popuni irina malog slova .
Proporcionalni fontovi sadre glifove koji za svaki karakter zauzimaju onoliko mesta
kolika je irina slova. Na primer, slovo zauzima vie mesta od slova j. Pokazalo se da tekst sa
proporcionalnim fontovima izgleda skladnije i laki je za itanje, u veini sluajeva. Osim toga,
vie rei staje u redovima.
153
Sledea klasifikacija odnosi se na serif i sans serif (ponekad sanserif) fontove.
Serifi su crtice dodate na krajeve fontova kao na Slici 8.4.4.2. Crtice se nalaze na serif
fontovima, ali su izostavljene na sans serif glifovima, to im daje uobiajeni izgled. Serifi potiu
od tragova dleta na rimskim kamenim ploama, pa se serif fontovi nekad nazivaju i rimski.
Slika 8.4.4.2Serifi
Opta je mogunost ispisivanja slova sa vertikalnim linijama, ili koso sa italik fontom.
Italik fontovi imitiraju glifove sa slovima nagnutim na desnu stranu, ime se imitira
odreeni stil pisanja. Veina italik fontova su ili parnjaci, ili razliite varijante uspravnih fontova.
Na primer, Times italik je italik verzija fonta Times Roman. Postoje, ipak, neki italik fontovi koji
imaj svoj sopstveni dizajn, koji su obino dizajnirani da imaju izgled rukopisa, i koriste se kada
je potreban lepi, humaniji izgled od obinog kucanog teksta.
Postoje konturni fontovi koji imaju uplja slova i fontovi koji bacaju senku.
Razvijeni su fontovi koji izgledaju malo horizontalno spljoteni, kada se uporede sa
proporcijama veine fontova. Nazivaju se skraeni fontovi, i namenjeni su prilozima, kao to
su poruke na marginama ili uske novinske rubrike, gde se zahteva da tekst bude upakovan na to
manje prostora. Za razliku od ovih, fontovi koji se nazivaju proireni izgledaju horizontalno
razvueni, to ih ini pogodnijim za naslove i druge izolovane tekstualne elemente.
Fontovi se mogu klasifikovati prema teini, to jest, prema debljini crta koje ine slova.
Deblje crte ine da tekst izgleda tamnije i vre. Po konvenciji, ovi fontovi se nazivaju tekim
(debljih crta), boldfejs ili jednostavno bold. Kao i italik, bold fontovi su obino verzije fontova sa
manjom teinom. Rezultat toga je da teina nije apsolutna osobina, bold teina nekog jako lakog
fonta moe biti laka od obine teine nekog jako tekog fonta, ija bi bold verzija bila jo tea.
Neki od fontova mogu postojati u vie varijanti, predstavljajui razliite stepene teine. Pod
ovim okolnostima, pojedini stilovi se opisuju terminima kao to su: ultra-bold, semi-bold, laki i
ultra-laki.
Tekst procesori esto tretiraju podvlaenje kao stilsku opciju slinu italik ili boldu, pa se
moe pretpostaviti da su i to, takoe, podvuene verzije fontova. Podvueni fontovi veoma su
retki, jer se u tipografskim krugovima smatra da su loa zamena italizacije, pogodna samo za
slovoslagae koji nemaju italik-opciju. Kao i veina tipografske rutine, i nepoeljnost
podvlaenja je dovedena u pitanje. Poto se raznovrsniji efekti mogu postii kombinovanjem
obinih fontova sa linijama razliitih debljina, ovo preispitivanje nije dovelo do ekspanzije u
korienju podvuenih fontova.
8.5 Animacija
Animirati znai oiveti, pokrenuti, udahnuti duu (eng. to animate to get thing alive, to
make them change).
154
Animacija je postupak stvaranja iluzije o kretanju 2D i 3D objekata, slika, crtea i
modela.
Prikazivanje pokreta moe se videti na crteima iz paleolitskog doba. Nizovi slika, slino
savremenim stripovima, postoje u staroegipatskim, persijskim, indijskim i kineskim hramovima.
Ideja o animaciji je veoma stara, ali je tehniki realizovana tek krajem 19. veka, pojavom filma.
U razvoju animacije karakteristina su dva perioda. Prvi period je do poetka primene raunara
za obradu i montau slike krajem 20. veka, to se oznaava kao tradicionalna animacija. U 21.
veku, tradicionalnu animaciju potiskuje kompjuterska animacija.
Pojedinane slike od kojih se pravi niz za animaciju mogu biti snimci crtea ili modeli
objekata koji se namenski kreiraju. Animacioni niz se moe praviti i kombinovanjem
pojedinanih slika snimljenog filma ili frejmova TV slika. U nizu slika koje se formiraju za
animaciju, objekti na slikama imaju tendenciju promene pozicije, oblika, boje, transparencije,
strukture usled aktivnosti samih objekata ili promene uslova okoline. Promene izmeu dve
susedne slike mogu biti jedva primetne, ili opaljivo primetne. Prikazivanjem niza slika dobija se
iluzija kretanja zbog perzistencije ula vida. Minimalni broj slika za doivljaj kontinuiteta,
odnosno iluzije kretanja, je niz od 12 slika u sekundi.
Proces animacije oznaava formiranje niza razliitih crtea i/ili fotografija koji se u toku
prikazivanja smenjuju dovoljno velikom brzinom, da se stvara doivljaj pokretnih slika. Svaka
pojedinana slika predstavlja jedan okvir frejm. Animacija se proizvodi frejm po frejm (eng.
a frame at a time). Princip je isti kao i kod filma i televizije, jer se slike frejmovi sukcesivno
smenjuju slino prikazivanju pomou kono-projektora. Brzina smenjivanja je 24 slike u sekundi,
25 slika u sekundi u PAL TV mrei i 30 slika u sekundi u NTSC TV mrei. U raunarskim
mreama, brzina promene frejmova moe se proizvoljno menjati. Savremena digitalna animacija
obino se projektuje, zbog ekonominosti i mogunosti interpolacije, sa manjima brojem slika u
sekundi, u odnosu na TV standarde i film.
155
Slika 8.5.1.1Ilustracija postupka kreiranja animacija koriem folija
156
Planiranje i odreivanje pogodnog zavretaka akcije (eng. follow through and
overlapping action). U jednoj akciji moe biti vie planiranih kretanja ili promena koje se
ne odvijaju simultano i koji mogu da se preklapaju u vremenu.
Izbor jednog od dva postupka u procesu stvaranja animacije. Prvim postupkom se vri
kreiranje svih slika u sekvenci, od prve do poslednje (eng. straight ahead action).
Drugim postupkom se naglaava akcija i njene faze: prvo se vri kreiranje glavnih slika
scena, dok se ostale slike stvaraju kasnije (eng. pose-to-pose action).
Usporavanje kretanja u krajnjim ekstremnim takama (eng. slow in and out), lagan
ulazak i izlazak.
Luk (eng. arcs) predstalja prikazivanje putanje kretanja objekta koja moe biti prava
linija ili, to je ee i prirodnije, u obliku luka.
Preuveliavanja (eng. exaggeration) objekata ili kretanja ima za cilj da se bolje definie
neko emocionalno stanje.
Sekundarna akcija (eng. secondary action) predstavlja sporednu radnju koja se odvija
istovremeno sa glavnom akcijom sa kojom ima veze, a koristi se da naglasi realnost
glavne akcije.
Princip vrstog crtea (eng. solid drawing) uzima u obzir oblike u 3D prostoru, dajui im
jainu i teinu. Animator treba da bude vet crta i razume osnove 3D oblika, anatomije,
teine, svetlosti i senke.
Privlanost (eng. appeal) crtanih likova odgovara harizmi glumca koji ne mora da bude
simpatian i pozitivan. Vano je da gledalac osea da je lik realan i interesantan.
157
Animacija se moe generisati uvoenjem, importovanjem svakog pojedinanog kadra
frejma u vremensku osu, odnosno animacioni niz i kreiranjem sadraja svakog pojedinanog
kadra u nizu. Takav postupak animacije poznat je kao niz fajlova sa slikama.
Niz fajlova sa slikama (eng. sequence of image files) predstavlja reprezentaciju
animacije koja je veoma fleksibilna, jer daje mogunost obrade pojedinih fajlova u izabranom
grafikom programu, pojedinaan fajl moe biti uklonjen iz sekvence, zamenjen ili dodat.
Sequence of image files moe se importovati u video-editing aplikaciju i konvertovati u format za
video isprepletani zvuk i slika (eng. audio video interleave, audio video interleaved AVI) ili
QuickTime standard za video format.
Drugi nain generisanja animacije je pomou kljunih kadrova frejmova.
Kljuni kadrovi su prvi i poslednji kadar jedne akcije. Mogu se koristiti u svakoj taki
ili momentu, u kojem postoji ili nastaje znaajna promena. Kljuni kadrovi se obino uzimaju za
karakteristine poloaje pokretanih objekata, takozvane ekstreme.
Animacija pomou kljunih kadrova (eng. key frame animation) je postupak
formiranja frejmova izmeu dva kljuna frejma in-betweeners automatski, primenom
interpolacije.
Interpolacija je matematiki postupak za proraunavanje vrednosti funkcije izmeu
poznatih taaka. Kreiranje frejmova koji posreduju izmeu kljunih frejmova oznaen kao
proces raanja bliznaka tvining (eng. tweening). U tvining-procesu, kreiraju se prvo dva
kljuna kadra koji reprezentuju odreenu promenu, zatim se crta niz progresivno razliitih
frejmova meukadrova. Kreiranje meukadrova moe da odradi raunar pomou
interpolacionih algoritama, to je prikazano na Slici 8.5.2.1.
158
prikazati razni oblici promena i realizovati niz slika sa kojima se stvara iluzija kretanja. Za
animaciju vektorskim slikama razvijeni su specijalizovani softverski alati kao to je iroko
primenjivani Macromedia Flash.
Animacija bitmapiranim slikama izvodi se zahvaljujui mogunostima da se
bitmapirana, kao i vektorska slika, moe pomerati, rotirati i skalirati i na taj nain uticati na
karakteristike slike, kao to je srazmera, ugao i veliina ime se moe formirati niz za animaciju.
Algoritmi za navedene operacije drugaiji su, i vreme izvrenja je due nego u sluaju vektorskih
slika. Program After Efect je softverski alat za kreiranje animacije sa bitmapitanim slikama.
Za jednostavnije animacije popularna su dva postupka pod nazivom grafiki fajl format
za razmenu (eng. graphics interchange format GIF) i Sprajt animacija.
GIF fajl format jedan je od dva najee koriena raunarska grafika formata za
razmenu slika koji se moe koristiti za kreiranje malih animacija sa niom rezolucijom i paletom
od 256 boja.
GIF fajl format se koristi da bi se sauvala sekvenca slika. GIF89 fajl format moe da
kontrolie ponaanje animacije, npr. ponavljanje odreeni broj puta ili neogranieno, minimalno
kanjenje izmeu frejmova. Nedostaci su to se ne moe dodati zvuk i ogranienje na paletu od
256 boja. Ovo ogranienje se moe prevazii korienjem QuickTime video formata koji moe
da se menja, kombinuje sa drugim klipovima, pa ak i da mu se dodaju efekti.
Sprajt - sprite animacija je animacija na raunarima koja se zasniva na objektima koji se
pomeraju. Sloen pokret moe se dobiti dodeljivanjem vie slika jednom sprajtu. Sprajt
animacija se najee koristi za simulaciju hodanja kod ljudskih slika, to je prikazano na Slici
8.5.2.2, za kreiranje 2D video igrica, za razliite tipove simulacija, kao i za same prezentacije na
internetu.Vrednosti koje se menjaju pri pomeranju objekta proraunava kompjuter.
159
8.5.3 Animacija u multimedijalnim sistemima
Animacija u multimedijalnim sistemima predstavlja informacionu tehnologiju za
kreiranje najupeatljivije virtualne realnosti koja se ostvaruje trodimenzionalnim objektima,
virtualnom realnou i interakcijom to je najvie dolo do izraaja u raunarskim igrama.
Predvia se da i razvoj budue filmske industrije ide u pravcu sve vee primene multimedijalnih
animacija, aktivnim ukljuivanjem gledaoca kroz interaktivne mogunosti buduih kreacija, to
film usmerava, u odreenom smislu, na igru. Sledei odeljci su abstrakti za trodimenzionalnu
animaciju i virtualnu realnost dok se interakcija kao opta mogunost ukratko razmatra u
posebnom poglavlju.
Virtuelna stvarnost (eng. virtual reality) predstavlja kompjuterski kreiranu okolinu koja
moe da simulira fiziko prisustvo objekata u realnom svetu kao i u zamiljenom svetu.
Prvobitno, izraz virtuelna stvarnost se koristio da opie doivljaj sintetikog sveta.
Ekrani koji su osetljivi na pomeranje glave korieni su da projektuju slike na korisnikove oi,
modifikujui ih dok se glava pomera, tako da korisnik ima utisak da se nalazi u 3D svetu. Postoje
160
i rukavice, koje su osetljive na pomeranje ruke. Visoka cena opreme ograniila je njeno
korienje na simulacije letenja i industrijske simulacije.
Za programiranje distribucije multimedijalnih proizvoda sa virtuelnom realnou preko
interneta koristi se jezik modelovanja virtualne realnosti (eng. virtual reality modeling language
VRML). VRML je bio jezik zasnovan na tekstu, koji je omoguavao da 3D objekti i scene
budu opisani u programskom jeziku. Poboljane verzije su VRML 1.0 i VRML 2.0.
VRML omoguava specifikaciju objekata, odnosno njihove geometrije i materijala od
koga su sastavljeni. Razliite teksture mogu biti primenjene na povrine objekta, koji e se
postaviti u 3D prostor. Scene mogu biti napravljene u uobiajenim tekstualnim editorima, ili u
programima za 3D modelovanje i osvetljene na razliite naine.
Objekti u VRML fajlu nazivaju se vorovi nodovi. Kada su ureeni hijerarhijski,
nodovi predstavljaju graf scene. Svaki VRML svet, bez obzira koliko jednostavan, predstavlja
graf scene. Graf scene sadri nodove koji opisuju objekte i njihove osobine. On sadri
hijerarhijski grupisanu geometriju da bi obezbedio audio-vizuelnu reprezentaciju objekata, kao i
uee nodova u generisanju dogaaja i mehanizmu rutiranja. Zajedniki efekat nodova u grafu
scene naziva se stanje (eng. state). Oblik noda pridruuje geometriju noda nodovima koji
definiu dati geometrijski izgled. Oblik noda bie deo transformisane hijerarhije koja ima vidljiv
rezultat, a sadraj transformisane hijerarhije bie oblik noda za neku vidljivu geometriju.
Grupisanje nodova ima polja koja sadre listu dece nodova. Svako grupisanje noda definie
koordinatan prostor za njegovu decu. Ovaj koordinatni prostor relativan je u odnosu na
koordinatan prostor noda ije je dete grupisani nod. Takav nod zove se roditelj nod. Ovo znai da
transformacija akumulira nii graf scene u hijerarhiji.
161
Pojednostavljena ilustracija sistema za ulnu percepciju zvuka i principa procesa
snimanja data je na Slici 8.6.1.
162
8.7 Dodir u multimediji
Dodir hapts predstavlja stimulaciju, pobudu somatosenzora u koi za percepciju
prostornih i kinetikih karakteristika objekata.
Dorir u multimediji primenom heptik tehnologija (eng. haptic technology) omoguava
dobijanje informacije o veliini, obliku, teksturi, teini ili vibracijama objekata i uspostavljanje
interakcije u multimedijalnom sistemu.
U informaciono-komunikacionim tehnologijama, dodir se koristi od poetka razvoja
prvih ureaja ne gubei znaaj do najsavremenijih sistema. Prstima se i danas kuca tekst i
upravlja raunarom preko tastature i mia. Osim neposrednog upravljanja dodirom, razvijeni su
raznovrsni taktilni senzori koji doprinose vernijoj virtualizaciji realnih sistema.
Percepcija dodira je proces prepoznavanja objekata dodirom.
Oseaj dodira se sastoji od tri glavna oseaja koja je esto teko razdvojiti. To su:
Opipljiva, dodirna percepcija (eng. tactile perception) prima informacije preko kone
senzitivnosti kada se ovek ne kree. Dodir je senzorska stimulacija koju osoba osea
kada neto dolazi u dodir sa koom. Izaziva nekoliko tipova oseaja: temperature,
vibracija, teksture.
Percepcija pokreta (eng. kinaesthetic sense) je svest pokreta, pozicije i orijentacije delova
ljudskog tela.
Oseaj pokreta moe biti rezultat akcije oveka aktivni dodir, koji ukljuuje signale
koje mozak alje u miie, ili moe biti od sila izvan tela pasivni dodir.
Aktivna haptic percepcija, kada se uzimaju informacije o objektu izvan tela, glavna je
informacija oseaja koja se pridruuje interfejsu dodira.
Interfejsi dodira su ureaji koji mere kretanje i obezbeuju pobudu senzora od
korisnikih ruku i prstiju. Interfejs dodira daje informacije kompjuteru zasnovane na poziciji
ureaja i stimuliu korisnikov oseaj dodira snabdevanjem izlaza u formi sile povratne sprege i
dodira. Interfejsi dodira omoguavaju korisniku da dodirne, oseti, manipulie, stvara ili menja, sa
njegovim rukama ili prstima, objekte prisutne na displeju raunara, kao da su oni realni fiziki
objekti. To je ostvareno paljivim merenjem sile koju bi neko oseao kada dodirne realan
objekat. Prezentovanjem tih sila korisniku, korienjem sile povratne sprege i dodirne
sposobnosti displeja heptik ureaja, stvara se iluzija dodirivanja objekta.
Nain ostvarivanja komunikacije preko taktilnog ekrana prikazan je na Slici 8.7.1.
Primena heptik tehnologije kod mobilnih telefona prikazana je na Slici 8.7.2.
163
Slika 8.7.1Komunikacija preko taktilnog ekrana
Spoljanji skelet (eng. exoskeletal): prati kretanje ramena, ili ak celog tela,
dozvoljavajui visoku interaktivnost, ali i ekstremno visoke cene. Te maine se koriste u
medicini, za ljude sa nekim nemogunostima, u vojsci.
Sutinski pasivni ureaji (eng. inherently passive devices) ili inteligentni pomoni ureaji
(eng. intelligent assist devices): pasivni roboti za direktnu fiziku interakciju sa ovekom
operatorom.
164
8.8 Miris u multimediji
Miris (lat. olfactus, nem. geruch, eng. odor ili odour) predstavlja oseaj (eng. sense)
prisustva odreene supstance u vazduhu to detektuju hemoreceptori nosa povezani olfaktornim
ivcem (eng. olfactory nerve) sa modanim centrom za miris. ulo mirisa nalazi se u nosu i
detektuje koncentraciju supstanci koje su u gasovitom stanju rastvorene u vazduhu. Pomou
hemoreceptora, na slinom principu kao ulo mirisa, funkcionie ulo ukusa koje detektuje
koncentraciju supstance u tenom stanju.
Receptorski neuroni za miris su specijalizovane elije koje mogu da transformiu prisutne
molekule mirisa u povorku akcionih potencijala koje alju u mozak snadbevajui, na taj nain,
centar za miris informacijama o prisustvu odreene supstance u vazduhu. Na Slici 8.8.1-a
prikazan je princip percepcije mirisa bioloki nos. Intenzitet mirisa je u direktnoj srazmeri sa
elektrinim odzivom elija za miris (eng. olfactory cell). elije organa za miris koriste jedan
mali deo od ukupno 1000 receptora. elije prepoznaju odreeni miris selektovanjem koji e
receptori imati odziv. U nosu postoje oko 10 miliona olfactory cells. Postoji najmanje 1000
razliitih vrsta receptora mirisa (eng. olfactory receptors), ali svaki prepoznaje i odgovara samo
jednoj vrsti mirisa (eng. fragrance). Svaka elija mirisa moe upotrebiti samo nekoliko njenih
receptora odjednom. Svaki molekul se kombinuje sa jednim brojem receptora u promenljivom
stepenu i proizvodi se karakteristian odziv. Karakteristino je da miris nije aditivan, sabiranjem
dva razliita mirisa dobija se u potpunosti nov, razliiti miris. Miris je najkompleksniji ljudski
oseaj.
Istraivanja mirisa, za koja je najvie zainteresovana farmaceutska industrija, kao i vojska
zbog hemijskih i biolokih detektora, prenose se i u oblast informatike. Najnovija istraivanja
idu ka modelovanju ponaanja elije za miris.
Miris u multimediji predstavlja novi medij za koji se razvijaju senzori mirisa i generatori
mirisa. Uvoenjem mirisa menja se dosadanje iskustvo u interaktivnom domenu. Miris se uvodi
u filmove, igre, animaciju, ili neki drugi oblik digitalnog medija.
Senzori mirisa predstavljaju sonde koje detektuju prisustvo koncentracije odreene
supstance u vazduhu i generiu signale mirisa.
Generatori mirisa su ureaji koji kontroliu isparavanje odreene mirisne supstance.
U multimedijalnom sistemu koji ukljuuje i medij mirisa, interfejsi za miris detektuju ili
reprodukuju miris. Postoje dva tipa interfejsa za miris: ulazni interfejs za miris i izlazni sistem za
miris.
Ulazni interfejs za miris ine senzori mirisa koji detektuju prisustvo supstance u gasnom
okruenju. Ulazni interfejs za miris zove se i elektronski nos (eng. electronic nose, e-nose).
Elektronski nos je ureaj koji oponaa nain delovanja olfaktornog sistema oveka
korienjem niza senzora koji mogu simulirati odziv na miris, sa ciljem prepoznavanja sloenih
mirisa. Koristi se za sakupljanje i interpretaciju mirisa. Na Slici 8.8.1-b prikazan je osnovni
koncept projekta e-nosa. Elektronski nos je instrument kojim se analizira miris i isparljiva
organska jedinjenja (eng. volatile organic compounds VOCs).
Isparljiva organska jedinjenja su organska, hemijska jedinjenja koja imaju znaajne
pritiske pare (eng. vapor pressures) i koja mogu uticati na okolinu i ljudsko zdravlje.
Na nain slian ljudskom nosu, elektronski nos doputa globalnu analizu isparljivih
organskih jedinjenja generisanih tenim, gasovitim ili vrstim uzorcima.
165
Elektronski nos za analizu mirisa se sastoji od tri dela: sistema uzoraka (eng. sampling
system), detekcionog sistema (eng. detection system), sistema prikupljanja podataka (eng. data
acquisition) i sistema za obradu (eng. processing system).
Molekuli gasa interaguju sa senzorima vrstog stanja, sa tanjim ili debljim filmom od
senzorskog materijala, absorbcijom, adsorbcijom ili hemijskim reakcijama. Senzorski ureaj
detektuje fizike i/ili hemijske promene nastale tim procesima i te promene se mere kao jedan
elektrini signal.
166
Hromatografija gasa: odvajanje, identifikacija i odreivanje hemijskih komponenti u
kompleksnoj smei koristei razlike u migration rates du komponenata;
Spektrometrija mase: detekcija modela molekula koristei razliku mere masa-naboj (eng.
mass-to-charge ratio) jonizovanih atoma;
Hemijski senzorski niz (eng. chemical sensor arrays): odziv niza hemijskih senzora se
koristi za identifikaciju komponenti gasa.
167
Kompjuter, kao jedan elektronski sistem, generie odzive preko izlaznih ureaja u
interfejsu, koju su perceptibilni za oveka. To su virtuelni odzivi jer oni nisu stvarno tu, ali mogu
biti perceptovani.
Multimodalni interfejsi omoguavaju korisniku da uje, vidi i osea virtuelni svet.
Audio-vizuelni multimedijalni tipovi podataka mogu biti: diskretni ili statini podaci i
kontinualni ili dinamiki podaci.
Diskretni podaci su oni koji ne zavise od vremenske ose: tekst, grafika i slike.
Kontinualni podaci audio i video zavise od vremenske ose, kompleksniji su od diskretnih
podataka, upotrebljavaju mnogo bolje kompresione i dekompresione algoritme i sofisticirane
operacije za njihovu interpretaciju i manipulaciju.
Generisani mediji su razliite vrste kompjuterski generisanih prezentacija, kao to su
animacija i muzika. Kada su memorisani u audio i video fajlove, nema razlike u odnosu na audio
i video podatke. Ako su generisani u realnom vremenu koristei specifine ureaje i instrumente,
tretiraju se kao posebni mediji. Generisani mediji zasnovani su na interakciji ovek kompjuter
zbog ega se oznaavaju kao interaktivni mediji.
8.10 Rezime
Sa aplikativnog aspekta, multimedija je informaciono-komunikacioni proizvod
raunarskih tehnologija koji pomou integrisanih hardversih i softverskih ureaja prikazuju
pojave za ulo vida, sluha i dodira, a u novije vreme i za ulo mirisa.
Multimedijalna delatnost predstavlja multidisciplinarnu oblast koja obuhvata razne
tehniko-tehnoloke, ekonomske, socioloke i umetnike postupke.
Proces stvaranja multimedijalnog dela zapoinje definisanjem projektnog zadatka
kojim se izraavaju potrebe, postavljaju ciljevi i definiu ogranienja.
Karakteristine su tri faze u realizaciji projekata iz oblasti multimedija: preprodukcija,
produkcija i postprodukcija.
Multimedijalna preprodukcija predstavlja prvu fazu realizacije projekta u kojoj se
razrauju zahtevi naruioca, definiu ciljevi, analizira interesna grupa, postavljaju zadaci,
odreuje anr, vrsta medija, sadrina proizvoda, sastavlja detaljan pregledan plan, najee u
vidu ilustrovane prie koja je, zbog veanja na tablu, nazvana storibord.
Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se
neposredno formira sadraj koji e se ugraivati u proizvod. Zavisno od kompleksnosti
proizvoda koristi se raunar, kamera, glumci, kostimi, studio i scenografija.
Multimedijalna postprodukcija predstavlja zavrnu fazu realizacije projekta u kojoj se
formira konana verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija
se svodi na urednitvo, editing. Kad se radi sa zvukom i pokretnim slikama onda je to montaa.
Prostor i vreme su fizike veliine koje imaju presudnu ulogu u svim fazama realizacije
multimedijalnog projekta.
Angaovani multimedijalni resursi definiu se na osnovu prostornih i vremenskih
parametara informacionih sadraja multimedijalnog proizvoda.
Prostorni domen informacionih sadraja odreuje potrebnu veliinu, odnosno kapacitet
memorijskih resursa.
Vremenski domen informacionih sadraja odreuje zahtevanu propusnu mo, odnosno
kapacitet prenosnih resursa komunikacionog sistema.
168
Multimedijalni proizvod predstavlja sintezu slika, teksta, animacije, zvuka, taktilnih
elementa i u novije vreme mirisa.
Slika u multimediji predstavlja najzahtevniji sadraj koji se obrauje na nivou
pojedinanih piksela, na nivou pojedinanih slika, frejmova kao i skupovima slika pokretnih
slika, videa i animacija. Za obradu slika potrebni su moni hardverski resursi, a za prenos veliki
kapaciteti prenosnog kanala. Da bi se ublaili zahtevi za korienje multimedijalnih resursa
nuna je kompresija video signala.
Multimedijalni proizvodi mogu sadrati bitmapirane i/ili vektorske slike.
Pokretne slike se formiraju od niza pojedinanih slika koje se smenjuju dovoljnom
brzinom da se u procesu percepcije, zbog inercije ula vida, ostvari doivljaj kontinuiteta.
Tekst u multimediji tretira se kao skup karaktera koji se u raunaru memoriu kao binarni
kodovi odreenog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali kodovi
karaktera povezuju se sa glifovima smetenim u glifovskim datotekama fontovima. Datoteke
glifova, odnosno fontovi, razlikuju se po stilu, dizajnu i nainu memorisanja glifova. Font je
izraz koji se u tipografiji koristio za skup slova jedne veliine i jednog tipa, a u multimedijalnim
tehnologijama font oznaava fajl sa glifovima i slovnim ornamentima. Font predstavlja jednu
odreenu familiju glifova. Glif je izraz za aru, grafiki oblik i sliicu, a u multimedijalnim
tehnologijama glif oznaava spoljanji lik kojim se prezentira karakter.
Animacija u multimediji predstavlja kreiranje virtuelnog sveta od velikog broja
pojedinanih slika koje se sukcesivno snimaju i prikazuju kao niz koji stvara doivljaj pokretnih
slika.
Pojedinane slike od kojih se pravi niz za animaciju mogu biti fotografije crtea ili
objekata koji se namenski kreiraju. Animacioni niz se moe praviti i kombinovanjem
pojedinanih slika snimljenog filma ili frejmova TV slika. U nizu slika koje se formiraju za
animaciju, objekti na slikama imaju tendenciju promene pozicije, oblika, boje, transparencije,
strukture usled aktivnosti samih objekata ili promene uslova okoline. Promene izmau dve
susedne slike mogu biti jedva primetne ili opaljivo primetne. Prikazivanjem niza slika dobija se
utisak kretanja zbog perzistencije ula vida.
Za kreiranje animacije nephodna su dizajnerska znanja kao i moan raunarski hardver i
softver. Postoje 2D i 3D kompjuterske animacije. Preteno se kreiraju 2D animacije, jer ih je
lake i jeftinije realizovati. Postoje vie razliitih, kako visoko profesionalnih i skupih, tako i
jeftinih i besplatnih open sors softverskih alata za izradu animacija.
Animacija u multimedijalnim sistemima predstavlja informacionu tehnologiju za
kreiranje najupeatljivije virtualne realnosti koja se ostvaruje 3D objektima, virtualnom
realnou i interakcijom, to je najvie dolo do izraaja u raunarskim igrama.
Zvuk u multimediji koristi se u razliite svrhe, zavisno od vrste multimedijalnog
proizvoda i informacionog sadraja koje zvuk nosi. U multimediji se koriste tri osnovna
informaciona sadraja koje zvuk moe da nosi: govor, muzika i zvuni efekti raznih zvunih
izvora. Drugo poglavlje ove knjige Osnovi audija posveeno je zvuku.
Govor u multimediji koji nosi informacioni sadraj, moe da ima primarnu funkciju i
bude vaniji od slike i teksta. etvrto poglavlje ove knjige posveeno je audio vizuelnim
integracijama i bimodalnosti ljudskog govora.
Muzika u multimediji moe da bude primarna kada je slika pratea, kao u sluaju
muzikih koncerata i spotova, ili da prati sliku kada ima funkciju da poboljava raspoloenje i
oseanja koja pobuuje multimedijalna prezentacija.
169
Zvuni efekti u multimediji koriste se da pojaavaju odreene funkcije, virtualnost i
interaktivnost multimedijalne prezentacije.
Dodir u informaciono-komunikacionim tehnologijama uopte, kao i u multimedijalnim
sistemima posebno, postoji od poetka razvoja prvih ureaja, ne gubei znaaj do
najsavremenijih sistema. Prstima korisnika i danas se kuca tekst i upravlja raunarom preko
tastature i mia. Danas se ve iroko primenjuje heptik tehnologija neposrednog upravljanja
dodirom, kao to je to sluaj u kod mobilnih telefona. Razvijeni su raznovrsni specijalizovani
heptik sistemi koji doprinose vernijoj virtualizaciji realnih sistema.
Miris u savremenoj multimediji ne predstavlja nedostini novi medij, jer su ve razvijeni
senzori i generatori mirisa.
Senzori mirisa predstavljaju visoku tehnologiju i skupe su komponente koje se ugrauju u
sistem oznaen kao elektronski nos.
Generatori mirisa su ureaji koji kontroliu oslobaanje mirisa iz odreenih rezervoara.
Elektronski signali od senzora koji detektuju dodir i miris su, u poreenju sa signalima
slike i zvuka, sporo promenljivi signali. Spektar signala dodira i mirisa viestruko je ui od
spektra audio i video signala. Pridruivanje ovih signala tonu i slici prvenstveno zavisi od ideja i
opredeljenja dizajnera jer njihovo memorisanje, obrada, i prenos ne predstavlja problem imajui
u vidu da praktino neznatno optereuju multimedijalni sistem.
Interakcija u multimediji predstavlja meusobno delovanje izmeu korisnika i
multimedijalnog sistema, a ostvaruje se tako to korisnik upravlja sofisticiranim sistemom na
osnovu njegovog odziva. Upravljanje (eng. control) se ostvaruje na osnovu povratne sprege
(eng. feedback). Sistem obrauje ulazne informacije, proizvodi odziv, i prikazuje rezultat
korisniku. Interakcija se ostvaruje preko interfejsa.
Pitanja
1. ta je projektni zadatak?
2. ta je multimedijalna preprodukcija?
3. ta je multimedijalna produkcija?
4. ta je multimedijalna postprodukcija?
5. ta je prethodna analiza u preprodukciji?
6. ta je storibord?
7. ta predstavlja slika u multimediji?
8. ta su primarne boje?
9. ta su sekundarne boje?
10. ta su tercijarne boje?
11. ta predstavlja aditivno meanje boja?
12. ta predstavlja subtraktivno meanje boja?
13. Iz ega se sastoji elektronska kamera?
14. ta predstavlja bitmapirana slika?
15. ta predstavlja rezolucija slike?
16. ta je vektorski generisana slika?
170
17. Koji su osnovni elementi za formiranje vektorske slike?
18. Kakve su vektorske slike u poreenju sa bitmapiranim slikama?
19. ta predstavljaju pokretne slike na prezentacionim medijima?
20. Pomou ega se obavlja proizvodnja pokretnih slika?
21. ta predstavlja filmska tehnika?
22. ta predstavlja video tehnika?
23. ta predstavlja tekst u multimediji?
24. ta predstavlja karakter?
25. ta predstavlja font?
26. ta predstavlja glif?
27. Koji su standardi za digitalnu reprezentaciju karaktera?
28. Kako se fontovi mogu klasifiovati?
29. ta predstavlja animacija?
30. ta predstavljaju tradicionalne animacije?
31. ta predstavlja kompjuterska animacija?
32. Kako se koristi zvuk u multimediji?
33. Kako se koristi dodir u multimediji?
34. Kako se koristi miris u multimediji?
35. ta predstavlja i kako se ostvaruje interakcija u multimediji?
Literatura
[8.1] H. Harrison, T. Loveland, V. Deaton, and K. Squibb, Film technology, in The TECH-
Know Project: High School Student Edition 2., R. Peterson, Ed. Cincinnati, OH: Centre
Pointe Learning, 2005, pp. 1823.
[8.2] Ireland Department of Education and Science. Storyboards: www.fis.ie/default.
asp?PageName =Lesson7.
[8.3] E. L. Counts, Multimedia Design and Production for Student and Teachers.
Pearson/Allyn and Bacon, 2004.
[8.4] V. Ray, Multimedia for Designers. New York, Delamar Cengage Learning, 2008.
[8.5] N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons,
2002.
[8.6] N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007.
[8.7] T. Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.
[8.8] D. E. Knuth, Metafont. Addison-Wesley, 1986.
[8.9] B. Kerr, Effective use of audio media in multimedia presentations, Middle Tennessee
State University, 1999.
[8.10] B. L. Mann, The evolution of multimedia sound, Computers and Education, 2007.
[8.11] http://de.wikipedia.org/wiki/Haptische_Wahrnehmung
171
9. APLIKATIVNI SOFTVER ZA MULTIMEDIJE
Aplikativni softver za multimedije su raunarski programi koji se koriste kao sredstvo,
odnosno alat za izradu multimedijalnih proizvoda.
Proizvodnja softvera, te specifine meke robe, veoma je zahtevan posao u koji treba
uloiti puno pameti i jo vie vremena, to iziskuje velika finansijska ulaganja u rad. Cena
softvera, slino kao i kod opipljivih roba, zavisi od uloenog rada i broja korisnika, odnosno
veliine serije. Kompleksni i skupi proizvodi ne mogu imati velike serije i obrnuto, jednostavniji
proizvodi su jeftiniji zbog manjih poetnih ulaganja i mogunosti da budu pristupani veem
broju korisnika.
Postoje vie klasifikacija aplikativnog softvera od kojih je dobro znati onu koja se odnosi
na njegovu dostupnost. Osnovna podela se odnosi na vlasnika prava.
Vlasniki softver (eng. Proprietary software) su raunarski programi koji su licencirani
sa ekskluzivnim legalnim autorskim pravima copyright. Licenca daje pravo korienja softvera
pod odreenim uslovima. Nije dozvoljena modifikacija i distribuiranje.
Softver u javnom vlasnitvu (eng. Public domain software) nekomercijalan je softver,
nema autorskih prava i moe se slobodno preuzimati i koristiti.
GNUs je dizajn slian Unix-u, ali se razlikuje od Unix-a jer je slobodan softver i ne sadri
Unix kod (eng. Gnus Not Unix GNU). GNU opta javna licenca (eng. General Public
License GPL), GNU GPL ili GPL, je slobodna softverska licenca copyleft license koja
omoguava da se izvedeni posao moe distribuirati pod uslovima koje definie licenca.
Slobodan softver (eng. Free software) su programi licencirani od vlasnika sa tolerantnim
uslovima. Generalno je dostupan i besplatno, ili sa mnogo niom cenom u odnosu na Vlasniki
softver. Dozvoljena je modifikacija softvera. Ovakvi softveri nemaju garanciju i ne dodeljuju
zakonsku odgovornost.
Slobodan softver i Softver otvorenog koda (eng. Free and Open source software) je
softver koji je slobodno licenciran da odobri pravo korisnicima da koriste, ili menjaju dizajn, sa
dostupnim izvornim kodom softvera. Re slobodan (eng. free) odnosi se na slobodu da se softver
kopira i ponovo koristi, sloboda u filozofskom smislu rei koju softver daje korisniku. Re
Softver otvorenog koda fokusira na percepciju jaine razvoja modela. Softver otvorenog koda
moe se instalirati na vie raunara istovremeno, dozvoljen je pristup izvornom kodu za
prepravke.
Slobodnorobni softver (eng. Freeware software) su programi dostupni za upotrebu
besplatno, ali obino sa jednim ili vie ogranienjem korisnikog prava.
Komercijalni softver (eng. Commercial software, payware software) proizveden je za
prodaju, ili slui u komercijalne svrhe. Komercijalni softver je najee Vlasniki Proprietary
172
softver ali moe biti i free software i free and open source software. Prilikom kupovine programa
kupac dobija binarnu verziju programa. Licencirani program iskljuuje pristup kodu, prepravke,
promene tehnike prirode i umnoavanje.
Intenzivan razvoj softvera za obradu slike i zvuka datira poetkom devedesetih godina
prolog veka. U tom razvoju prednjae amerike kompanije AVID, Adobe i Apple koje i danas
vode sa najmonijim softverima za snimanje, obradu i editovanje zvuka, slike i videa.
Za razvoj multimedijalnih proizvoda postoji mnotvo programskih alata za realizaciju
projekata za razliite namene i nivoe sloenosti. Osnovna podela po nameni su alati za izradu
multimedijalnih prezentacija, obradu slike i alati za obradu zvuka.
Ovladavanje vetinom pravljenja multimedijalnih proizvoda dobro je zapoeti izradom
najjednostavnijh prezentacija sa ureivanjem i kreiranjem mirnih slika, nastaviti sa digitalnim
video editovanjem, raditi zatim sa multimedijalnim prezentacijama da bi se ovladalo izradom
ozbiljnih prezentacija sa multimedijalnim interaktivnim sadrajem. Izrada animacija i filmova,
kao najvii multimedijalni nivo, zahteva i najvii profesionalizam, znaajan utroak vremena i
budeta.
Profesionalno uraeni multimedijalni proizvodi odlikuju se visokim kvalitetom dizajna i
ugraenim mogunostima za interakciju sa korisnikom. Rade se pomou monih softverskih
alata, ili programskih jezika, zbog ega je potrebno da dizajner ima neophodna struna i
programerska znanja. Za multimedijalnu produkciju postoji vie softverskih alata i programskih
jezika razliitih mogunosti, namena i cena. Izbor zavisi kako od vrste multimedijalnog
proizvoda tako i od znanja i afiniteta dizajnera.
173
Dreamweaver je predvien za konstrukciju interaktivnih veb sajtova, a koristi se kao
odlina platforma za isporuku i prikazivanje multimedijalne produkcije uraene u Flash-u.
Slian je sa Adobe GoLive i Microsoft Front Page.
After Effects je za kreiranje pomeranja i animacija ono to je Photoshop za mirne slike.
Ovaj programski paket omoguava dizajniranje u dve i tri dimenzije, i kreiranje efekata za
korienje u drugim softverima za multimedije.
Ulide GIF Animator veoma je popularan i jeftin programski paket za pravljenje
pokretanja grafikih slika i jednostavnih animacija na vebu, oznaenih kao Graphics Interchange
Format GIF.
QuickTime i Real Media su programski paketi sa velikim mogunostima za ureivanje,
beleenje zvuka, konverziju, i eksportovanje razliitih datoteka, od jednostavno animiranh gifova
do digitalnog video striminga.
Dizajniranje veb stranica mogue je ostvariti linijskim kodovanjem. Popularni jezici za
kreiranje veb stranica su Hiper Text Markup Language - HTML, Java i Javascript.
Linijsko kodovanje moe se u izvesnoj meri ostvariti i pomou Flash-a. Actionscript je
programski paket koji ima jo vee mogunosti za linijsko kodovnje.
Dizajneri pomou linijkog kodovanja mogu da ostvare najrazliitije efekte i
visokoprofesionalne kreacije. Da bi to ostvarili potrebno je, pre svega, da se familijarizuju sa
softverima za linijsko kodovanje, to zahteva vreme i strpljenje.
Za multimedijalnu, kao i za svaku, kreaciju, pored znanja, koje se podrazumeva, dizajner
treba da ima sklonost i ljubav prema poslu na koji se troi puno vremena.
174
Corel Painter je softverski alat koji se moe kvalifikovati kao elektronska slikarska
etkica, to omoguava umetnii rad sa slikama. Program usko specijalizovan prvenstveno za
crtanje i slikanje. Koriste ga slikari i crtai, manje dizajneri i oni koji se bave obradom slike.
Dobro simulira alate za crtanje, kao to su olovka, pero, temper.
Corel PHOTO-PAINT, obino je u sastavu CorelDRAW paketa programa namenjenih
generisanju i obradi grafike. Moe se koristiti kao alternativa Photoshop-u.
Macromedia Fireworks, obino je u sastavu paketa sa programima kao to su Flash i
Dreamweaver, prvenstveno se koristi za generisanje i obradu bitmapiranih slika namenjenih veb
stranicama.
Corel DRAW je program koji se koristi za generisanje i obradu vektorskih slika i teksta, a
sadri neke jednostavnije alate za obradu bitmapiranih slika. Na Slici 9.2.2.2-a prikazan je radni
ekran programa CorelDRAW a na Slici 9.2.2.2-b prikazano je radno okruenje programa Flash.
175
Slika 9.2.2.2Radno okruenje programa Adobe : a) CorelDRAW i b) Flash
176
Digitalizacijom video i audio signala stvorena je mogunost montae pomou raunara
koja je oznaena kao nelinearna montaa ili digitalni video editing.
Nelinearna montaa (eng. non-linear editing) predstavlja ureivanje i obradu slika
pomou raunara u cilju kreiranja digitalnog videa. Nelinearna montaa prua daleko vee
mogunosti za kreiranje raznovrsnih multimedijalnih proizvoda od filmske i linearne video
montae.
Za nelinearnu montau, odnosno digitalno video editovanje, razvijeno je vie softverskih
alata za razliite operativne sisteme. Najznaajnije programe za video editovanje razvile su
firme Avid Technology, Adobe i Apple Macintosh.
Detaljniji opis i pregled softverskih alata za video montau bio bi obiman i zato su
nabrojani samo najznaajniji programi, a u sledeim odeljcima dat je kratak opis samo
softverskih alata Premiere i Final Cut.
Media Composer, najee se po firmi koja ga je 1989 godine razvila, zove Avid, prvi je
hardversko softverski sistem na Macintosh II za nelinearnu montau koji je dominirao u
filmskoj i televizijskoj produkciji u proloj deceniji i dalje ostao znaajan sa novim verzijama za
visoke rezolucije slike i niskobudetne primene.
Premiere jedan je od prvih programa za digitalnu video montau razvijen pre dve
decenije i danas u najnovijim CS verzijama jedan je od najpopularinijih programa za video
editing. Instalira se na operativne sisteme Apple Macintosh kao i za Microsoft Windows.
Final Cut Studio je softverski komplet (eng. software suite) za profesionalnu video i
audio produkciju koji je u filmskoj i televizijskoj produkciji postao konkurencija Avidovom
Media Composer-u. To je moan i ire dostupan komplet koji sadri est osnovnih i vie manjih
aplikacija za video editing. To su: Final Cut Pro 7 za video editing, Motion 4 za grafike
animacije, Soundtrack Pro 3 za napredno editovanje i dizajniranje zvuka, DVD Studio Pro 4 za
kodiranje, autorizaciju i disk izdavatvo, Color 1.5 za nijansiranje boja i Compressor 3.5 za
kodovanje finalnog video proizvoda u razliite formate.
iMovie veoma je popularan sistem za montau ulaznog nivoa i sadri filtriranje slike,
konverziju ka sepia tonalitetu ili belom i crnom, mogunost titlovanja i montau zvuka. Nije
skup i dobija se ve instaliran na mnogim Macintosh raunarima.
Video Wave i Studio Deluxe, slino iMovie-u, jednostavni su i jeftini, namenjeni
studentima i nastavnicima koji mogu raditi DVD, VHS, CD-ROM formate i veb filmove.
EDIUS NEO je softver namenjen za nelinearnu video montau za operativni sistem
Microsoft Windows. Poseduje dobre karakteristike nelinearne montae kao to su realno vreme,
miksovani format HD/SD editovanja, titlovanje, i stvaranje DVD.
EDIUS Neo 2 je program koji prua mogunost editovanja raznih formata ukljuujui
AVCHD, HDV, DV, Windows Media i QuickTime, podrava rad u realnom vremenu, ima
mogunost miksovanja razliitih formata unutar iste vremenske ose. EDIUS Neo 2 je namenjen
za nastavnu okolinu, ima veoma dobre karakteristike nelinearne montae. Ima mogunost
stvaranja Blu-ray Disc i DVD (DVD authoring).
EDIUS 5 je softverski alat dizajniran za profesionalni nivo montae, za postprodukciju.
Avid Liquid Pro7 je SD i HD video editor koji ima mogunost obrade okruavajueg
zvuka sa preko 1000 efekata u realnom vremenu. Edituje DV, MPEG I, MPEG IBP (eng. I-
frame, B-frame, P-frame IBP), nekompresovani, Windows Media, ekspres digitalni video (eng.
digital video express DIVX) i MPEG-4 u SD kao i HDV. Ima mogunost stvaranja DVD
(DVD authoring): definisanjem interaktivnosti, kreiranjem menija, audio izlaza Dolby Digital
5.1 surround mix.
177
Sony Vegas Movie Studio 9 Platinum je program za video editovanje i kreiranje DVD.
Namenjen je za kune raunare. Softver ima mogunost prihvatanja i organizacije DV videa,
editovanje klipova u vremenskoj osi i eksportovanje videa u DVD ili video CD (eng. video CD
VCD). Takoe omoguava eksporovanje videa za korienje sa pokretnom konzolom za igranje
(eng. PlayStation Portable PSP), iPod i YouTube. Prua mogunost HDV i AVCHD
editovanja. Podrava snimanje, editovanje i kodovanje videa. Ima podrku za 5.1 surround sound
miksovanje i kodovanje.
SONY Vegas Pro 9 je profesionalni softver za video i audio postprodukciju za difuziju
broadcast i digitalne video diskove (eng. digital video disc DVD) i plave blu-rej diskove
optike diskove za memorisanje podataka (eng. blu-ray disc BD).
Adobe Encore DVD je softverski alat namenjen profesionalnoj izradi DVD-a. Format
videa uvedenog u programsko okruenje se automatski prebacuje u MPEG-2 format. Izlazni
oblik audio formata je Dolby Digital sistem. Kompatibilan je sa Photoshop-om. Interaktivan
meni se moe kreirati u Photoshop-u i koristiti u programu Adobe Encore DVD.
Pinnacle Studio HD je program za video editovanje u mnogim Windows raunarima.
Podrava HD video i prua mogunosti tranzicija, animacije i efekata.
CINEFORM NeoScene je program za nelinearnu montau u filmskom stvaralatvu,
daje izuzetno visok kvalitet CineForm fajlova.
178
Monitor je radni ekran u kome se prikazuje stvarna slika. Obino je podeljen na dva
okvira, od kojih svaki ima posebnu kontrolu playback, jog, shuttle. Leva polovina prikazuje
izvorni klip. Moe se izabrati odreeni frejm u klipu u prozoru i mogu se postaviti ulazne in i
izlazne out take. Desna polovina prozora monitora koristi se za prikazivanje filma (eng.
movie) u procesu sastavljanja (eng. asemblovanja) na vremenskoj osi.
Final Cut Pro FCP je razvijen 1999 godine kao modul Final Cut Studio koji
omoguava korisniku da prikljuuje video sa spoljnih ureaja ili iz raunarskih memorija i na
hard disku ga edituje, obrauje i isporuuje u raznim verzijama formata. Prve verzije razvila je
firma Macromedia Inc. a kasnije Apple Inc.
Final Cut Pro 7 je verzija za Mac raunare sa Mac OS X verzijom operativnog sistema,
ili kasnijom, koristei Intel procesore. Sadri jednostavne kao i napredne editing alate za
neprimetne tranzicije i precizne video manipulacije. Ima izuzetne profesionalne mogunosti za
kreiranje tokom procesa nelinearne montae kao to su: editovanje sa formatima HDV, XDCAM
HD , DVCPRO HD, preko 150 filtera u realnom vremenu, veliki broj efekta, prikazivanje u
179
realnom vremenu za vreme editovanja, 2D/3D prostor, audio postprodukcija, 5.1 surround sound
mixing, finalizacija profesionalnog DVD sa interaktivnim karakteristikama, autorizaciju SD i
dvoslojnog HD DVD-9.
Radni ekran Final Cut Pro 7 sadri etiri osnovna dela: okvir pretraiva (eng. Browser),
ulazni prozor za pregled programskog matrijala (eng. Viewer window), izlazni prozor (eng.
Canvas) i vremensku liniju (eng. Timeline) kao to je prikazano na Slici 9.2.3.2.
180
vremenskoj osi. Na njoj se video i audio klipovi mogu pomerati, menjati, rasporeivati i brisati u
cilju kreiranja sekvence kakva bi na kraju trebala da se pojavi u eljenom filmu. Na vremenskoj
osi se postavljaju i sadraji sekvence kao to su natpisi (eng. titles) i prelazi (eng. transitions).
181
SWF (eng. shockwave flash ili small web file SWF) je format vektorske grafike koji se
moe generisati sa fleom. Pogodan je za veb animacije. Grafiki objekti su predstavljeni u
vektorskom obliku. SWF fajl je slian programu, ukljuuje definicije objekata i instrukcije kako
sa njima manipulisati. SWF podaci su kodovani u binarnoj formi i komprimovani, rezultujui u
vrlo malu veliinu fajla.
Fle dozvoljava da se importuje bitmapirana slika u animaciju, ali time se poveava
veliina fajla.
U fleu s koriste tri razliite vrste simbola:
Vremenska linija (eng. timeline) predstavlja grafiki prikaz niza slika, odnosno sekvence
kadrova koja se koristi za kreiranje animacije u fleu. Animacija se moe graditi jedan frejm u
jednom trenutku, insertujui kljune frejmove u timeline sekvencijalno. Drugi nain je
ubacivanje glavnih frejmova u vremensku liniju.
Flash pozornica (eng. stage) je pozornica, prozor u kojoj se kreira frejm crtanjem
objekata. Objekti se mogu kreirati koristei drawing tools, ili mogu biti importovani.
Bitmapirane slike, ukljuujui formate JPEG i PNG, mogu se importovati i transformisati u auto-
traced vektorski objekat. Bitmapirane slike se mogu koristiti unutar Flash frame, ali se kasnije
ne moe vriti skaliranje ili rotacija bez potencijalnog degradiranja slike.
Koriste se lejeri da bi se organizovali elementi u frejmu, interpolirano kretanje (eng.
interpolating motion).
Grafiki objekti mogu biti sauvani u biblioteci u specijalnom obliku zvanom simbol
(eng. symbol), koji omoguava da objekat bude ponovo korien. Potreban broj instances mogu
se postaviti na stage. Instances ostaju linkovani za simbol. Ako se simbol menja, automatski se
menjaju i instances. Instances su identini, i na njih se primenjuju transformacije, da bi se
promenila veliina ili orijentacija od svake instances.
182
animacija u softveru Maya, uz niu rezoluciju slike, prikazuju se karakteristike, funkcionalnost i
tok procesa eljene aplikacije to omoguava brz i lak nain ostvarivanja promena do postizanja
eljenog rezultata.
Vizuelni efekati iz realnog sveta kao to su dim, vatra, eksplozija, tok fluida, efekat kose
u filmskoj i televizijskoj produkciji mogu se simulirati u softveru Maya. Na primer simulator za
realistiki izgled ljudske kose je ostvaren korienjem krivih i efekata crtanja. Simulacija
ivotinjskog krzna dlake slina je sa efektom kose. Moe se koristiti i za simulaciju drugih
slinih objekata kao to je trava, fizika sudarenih objekata, simulacija tkanine i materijala,
simulacija spreja, prskalica, simulacija praine, praha.
Modelovanje u raunarskim tehnologijama je proces predstavljanja realnih objekata
pomou tehnika kompjuterske grafike. Maja je mono sredstvo za kreiranje raunarski
generisanih slika (eng. computer-generated imagery CGI).
Raunarski generisane slike predstavljaju oblast primene kompjuterske 3D grafike za
specijalne efekte u filmovima, televizijekim programima i raunarskim igrama.
Modelovanje pomou programa Maja zavisi od tipa objekta. Definisana su tri tipa
objekata: poligoni, NURBS i izdeljene manje povrine.
Poligoni su geometrijski oblici sa tri ili vie pravih stranica. Poligoni omoguavaju
modelovanje povrina graenjem i promenom oblika manjih delova povrine.
Neuniformne racionalne osnovne krive (eng. non-uniform rational B-splines NURBS)
geometrijski su tipovi koji se mogu koristiti za stvaranje 3D krivih i povrina. NURBS
omoguavaju, sa visokim nivoom kontrole, kreiranje blagih, krivih povrina.
Izdeljenim manjim povrinama (eng. subdivision surfaces) se omoguava editovanje
povrina. Oblik nekog objekta se prikazuje geometrijom, materijal objekta opisuje izgled
povrine nakon renderovanja. Materijali i teksture se postavljaju tako da simuliraju realnu
reakciju povrina na svetlost.
3D animacija predstavlja vaan deo televizijskih, filmskih i multimedijalnih projekata za
animaciju karaktera.
Animacija karaktera predstavlja proces oivljavanja virtualnih objekata koji mogu biti
osobe, ivotinje, roboti ili neki predmeti koji se animiraju izrazima lica, u cilju komunikacije sa
publikom kroz akciju. Karakteri kao to su ljudi i ivotinje mogu se proizvesti sa visokim
stepenom realizma. Pre animacije karaktera u sceni, crta se skelet karaktera, a zatim se skelet
oblae koom. Aplikacija Maja omoguava definisanje unutranjeg skeleta za karaktere i
dodeljivljnje koe za stvaranje realistikih pokreta sa deformacijama. Proces pripreme kontrole
karaktera je nazvan rigging i omoguava fokusiranje na proces animacije. U procesu dizajna i
animacije karaktera kombinuju se transformacije digitalnog skeleta sa deformacijama povrine
koe spoljanjeg omotaa skeleta. Specifini zahtevi za kretanje karaktera odreuju
kompleksnost kontrole karaktera. Mehanika karaktera treba da bude ubedljiva publici, koa i
odea treba, takoe, da se kreu i na odgovarajui nain savijaju. Maja omoguava da se upravlja
delovima koji konstituiu tipian karakter.
Rendering je raunarski proces koji omoguava da se komponente kao to su povrine,
materijali, teksture, efekti, osvetljenja, modeli, kamere i kretanja postavljaju u sekvencu
bitmapiranih slika.
Maja softver sadri ugraen programski skript jezik (eng. Maya embedded language
MEL).
Maja programski jezik MEL omoguava prilagoavanje korisnikog interfejsa i pisanje
skripta i makroa za kreiranje objekta, osvetljenja, kamere i tekstura. Na taj nain se pomou
183
Maja softvera mogu po zamisli autora kreirati raznovrsni efekti i animacije. MEL omoguava da
se promenom vrednosti parametara u vremenu animiraju objekati, svetlo ili samo bilo koji
entitet.
Maja korisniki interfejs (eng. Maya user interface) predstavlja, sa funkcionalnog
aspekta, skup alata dostupnih korisniku na radnom ekranu monitora, koji osim funkcija
zajednikih za sve razliite aspekte 3D grafike softverskih aplikacija, sadri skup alata
namenjenih specifinim zadacima kao to su modeliranje, teksturisanje, animacija, renderovanje
i sl.
Podrazumevani (eng. default) Maja korisniki interfejs, prikazan na Slici 9.2.4.1 i na Slici
9.2.4.2, sadri sledee osnovne sekcije:
Slika 9.2.4.1Radni ekran sa Maja interfejsom (eng. Maya Interface) i radnim prostorom
184
Korisnik na radnom ekranu monitora definie virtuelni radni prostor, scenu, za realizaciju
projekta. Scena moe da bude sauvana u raznim formatima. Standardni format je .mb Maya
binary.
U aplikaciji Maya 2010 dodat je MatchMover kojim se omoguava kombinovanje
elemenata raunarskog grafikog interfejsa (eng. computer graphics interface CGI).
Kamera sekventor (eng. camera sequencer) jedna je od najoriginalnijih karakteristika u
softveru Maya 2011. Dodat je u aplikaciji Maya 2010. Koristi se za raspodelu planova vie
kamera i njihovo rukovanje u sekvenci animacije. Omoguava korienje razliitih kamera
analogno realizaciji u filmskim i televizijskim studijima. Kamera sekventor povezuje planove iz
vie kamera smetenih u 3D sceni, aranirajui planove i sviujui izmeu uglova i planova
kamera, korienjem vie kamera, uglova i pogleda, za stvaranje kompletne sekvence animacije.
Aplikacija Maya je organizovana u tri sloja, lejera: GUI, MEL Engine i
Dependency Graph.
GUI lejer predstavlja grafiki korisniki interfejs dostupan animatorima, dizajnerima i
programerima.
MEL Engine je Maya lejer u kome se izvravaju komande korisnika sa GUI lejera.
Dependency Graph je lejer gde su smeteni svi podaci o sceni i gde se izvrava
neophodna modifikacija podataka na osnovu skripta MEL komandi.
185
procedure. Aplikacija Maja ima arhitekturu dijagrama grafa vora (eng. node graph
architecture). Svaki elemenat scene, na primer, svaka kriva, link, slika, tekstura, kljuni frejm se
definie kao vor. Svaki vor ima svoje osobine (eng. attributes) i prilagoenost. Svaki vor
moe primiti, modifikovati i transmitovati podatke sledeem voru. Da bi se ostvarila eljena
funkcionalnost formira se mrea vorova ili preko grafikog korisnikog interfejsa ili
programiranjem (MEL ili C++). Svaki 3D zadatak se realizuje protokom i modifikacijom
podataka kroz mreu meusobno povezanih vorova. Informacija koja se koristi za konstrukciju
scene je u obliku osobina i prenosi se meusobno zavisnim vorovima. Jedan vor moe imati
veliki broj osobina koje moe proslediti dalje ili zahtevati kao ulaz. Primeri vorova su vor
transformacije koji sadri informacije o lokaciji, vor oblika sadri geometrijske informacije i
vor materijala koji sadri informacije o boji. vor predstavlja jedan blok building block scene.
Blokovi se linkuju da bi kreirali kompleksnije blokove.
Blokovi formiraju model protoka podataka koji se zove Maya's pipeline.
Maya's pipeline omoguava digitalni produkcioni pipeline:
Pria Story
Preslikavanje prie u vizuelni domen Visual Development
Kreiranje karaktera - Character Design
Storibord Storyboards
Postavka scene Scene Layout
Modelovanje Modeling
Animacija Animation
Senenje i tekstura Shading and Texturing
Osvetljenje Lighting
Rendering
186
realizovan za snimanje jednog traga, gde se u jednom trenutku prikazuje samo jedan audio signal
mono ili stereo, ili vie tragova, koji omoguava da se signal snima sa nekoliko mikrofona ili
razliitih ulaza na disk u istom trenutku na posebne tragove. Za svaki trag posebno moe se
podeavati jaina ili stereo balans audio signala. Svaki trag se snima u posebnom fajlu u
memoriji kompjutera i moe se posebno editovati. U finalizaciji se vri miksovanje tragova u dva
stereo traga ili vie saraund tragova.
Razvoj softvera za digitalni audio poinje poetkom devedesetih godina prolog veka.
Kompanije koje su razvile najmonije softvere koji i danas dominiraju u profesionalnim
primenama su AVID, Adobe, Apple, Steinberg i Sony. Na tritu se nude softverski alati i
kolekcije razliitog nivoa sloenosti i cene kotanja.
Najpoznatije digitalne radne stanice i softverski kompleti su:
Kao primer i ilustracija za mogunosti koje imaju softverski alati za editovanje zvuka
dataljnije e biti opisan softverski alat Sound Forge.
187
Funkcije i instrukcije editovanja Sound Forge-a:
Spektralna analiza Spectrum Analysis: nadzor u realnom vremenu (eng. real time).
Monitoring i prikaz trenutnih vrednosti zvunog signala Sonogram;
Uklanjanje uma: Noise Gate, Noise Reduction, EQ, Click and Crackle Removal, Audio
Restoration;
Dinamika kompresija Compressor: Threshold, Ration, Attack and Release time;
Promena uestanosti Time Stretch, Pitch, Vibrato.
188
Slika 9.3.1.3Prikaz sonograma u Sound Forge-u
Noise Gate slui za uklanjanje uma ispod izabranog nivoa praga (eng.treshold) kao to
je prikazano na Slici 9.3.1.4.
189
ali poveavaju mogunost da se ukloni i koristan signal niskog nivoa. Vrednosti ispod 0 dB
uklanjaju manje korisnog signala, ali ako je vrednost preniska bie uklonjeno veoma malo uma.
190
Slika 9.3.1.6Radna povrina za Izjednaavanje EQ
191
Slika 9.3.1.7Parametri dinamike kompresije: prag - THRESHOLD, prelazne faze: vreme uspostave
ATTACK TIME i vreme oslobaanja RELEASE TIME, stepen kompresije RATIO
192
PROMENA UESTANOSTI U SOUND FORGE-U
Time Stretch menja duinu snimka, bez promene osnovne frekvencije.Pri ubrzanoj
reprodukciji i skraivanju trajanja snimka komprimovanja u vremenu, iri se spektar, javljaju
se vie frekvencije. Ako se usporava originalni snimak, dolazi do komprimovanja spektra.
Najbolji rezultati postiu se za Time Stretch izmeu 75% i 115%, kao to je prikazano na
Slici 9.3.1.9. Van ovog opsega, mogua je pojava izoblienja. Obradom snimka vie puta sa
malim priratajem, na primer 10 %, dobija se bolji rezultat nego jednom jednokratnom obradom
sa veom promenom duine snimka.
193
Slika 9.3.1.10Radna povrina za reverberaciju
9.4 Rezime
Aplikativni softver za multimedije su raunarski programi koji se koriste kao sredstvo,
odnosno alat za izradu multimedijalnih proizvoda.
Intenzivan razvoj softvera za obradu slike i zvuka datira poetkom devedesetih godina
prolog veka. U tom razvoju prednjae amerike kompanije AVID, Adobe i Apple koje i danas
vode sa najmonijim softverima za snimanje, obradu i editovanje zvuka, slike i videa.
Postoji znaajan broj programa razvijenih za obradu slike i zvuka, pojedinano, ili
objedinjenih u video.
194
Softverski alati za obradu bitmapiranih slika omoguavaju poboljanje kvaliteta slika i
njihovo prilagoavanje krajnjoj nameni. Razvijeno je vie softverskih alata od kojih su
najpoznatiji Photoshop, Corel Painter i CorelDRAW.
Za obradu vektorske slike postoji vie softverskih alata od kojih su najpoznatiji Adobe
Illustrator, CorelDRAW i Macromedia Freehand.
Za nelinearnu video montau Media Composer, Premiere i Final Cut Studio.
Za snimanje, obradu, editing i reprodukciju zvuka koriste se digitalne radne stanice sa
odgovarajuim softverskim kompletima. Najpoznatije kolekcije programa za audio su:
Pitanja
1. ta je aplikativni softver za multimedije?
2. ta je vlasniki softver Proprietary software?
3. ta je softver u javnom vlasnitvu Public domain software?
4. ta je slobodan softver i softver otvorenog koda free and open source
software?
5. ta je Power Point?
6. ta je Flash?
7. ta je Dreamweaver?
8. ta je AfterEffects?
9. ta je Ulide GIF Animator?
10. ta je Photoshop?
11. ta je CorelDRAW?
12. ta je Adobe Illustrator?
13. ta je Adobe Premier?
14. ta je EDIUS?
15. ta je Final Cut?
16. ta je Maya?
195
17. ta je Sound Forge?
18. Koja editovanja podrava Sound Forge?
19. ta je spektralna analiza?
20. Koje su instrukcije za spektralnu analizu u Sound Forge-u?
21. ta je um?
22. Koje su instrukcije za uklanjanje uma u Sound Forge-u?
23. ta je to dinamika kompresija?
24. Koje su instrukcije za dinamiku kompresiju u Sound Forge-u?
25. Koje su instrukcije za promenu uestanosti u Sound Forge-u?
Literatura
[9.1] http://en.wikipedia.org/wiki/Video_editing
[9.2] http://en.wikipedia.org/wiki/Linear_video_editing
[9.3] http://en.wikipedia.org/wiki/Non-linear_editing_system
[9.4] http://en.wikipedia.org/wiki/List_of_video_editing_software
[9.5] http://www.expertrating.com/courseware/MayaCourse/MAYA-Animation-Basics 1.asp
[9.6] N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons,
2002.
[9.7] N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007.
[9.8] Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.
196
SPISAK SKRAENICA
AAC advanced audio coding
napredno audio kodovanje
ACELP algebraic code excited linear prediction
algebarski kod pobuene linerane predikcije
A/D analog to digital
analogno digitalni
AFX animation framework eXtension
proirenje okvira animacije
AL adaption layer
adaptacioni sloj
API application programming interface
interfejs za programske aplikacije
ASCII American standard code for information interchange
Ameriki standardni kod za razmenu informacija
ATDM asynchronous time-division multiplexing
asinhrono multipleksiranje sa vremenskom raspodelom kanala
ATM asynchronous transfer mode
asinhroni transfer mod
AVC advanced video coding
napredno video kodovanje
AVCHD advanced video coding high definition
napredno video kodovanje visoke definicije
AVI audio video interleave, audio video interleaved
isprepletani zvuk i slika
BB band by band
opseg po opseg
b bit
bit
B byte
bajt
B bidirectionally-predictive
dvosmerno prediktivni, biprediktivni
B-frame bidirectional-frame, backwards-predicted frame, B-picture, inter-frame
dvosmerni-frejm, unazad-predvidiv frejm, B-slika, meu-frejm
BD blu-ray disc
optiki disk za memorisanje podataka
BIFS binary format for scenes
binarni oblik scena
BiM binary format for metadata
binarni format za metapodatke
197
BISDN broadband ISDN
irokopojasni ISDN
BMP bitmap
bitska mapa
BQ bi-level quantization
dvostruka kvantizacija
CABAC context adaptive binary arithmetic coding
binarno aritmetiko adaptivno kodovanje konteksta
CAVLC context arithmetic variable-length coding
adaptivno kodovanje sa promenljivom kodnom rei
CCD charge-coupled device
ureaji sa spregnutim naelektrisanjem
CD compact disc
kompakt disk
CD committee draft
dodeljeni draft
CGI computer-generated imagery
raunarski generisane slike
CGI computer graphics interface
raunarski grafiki interfejs, raunarska grafika
CID charge injection device
ureaj za detektovanje punjenja
CIF common intermediate format
zajedniki srednji format
CMOS complemantary metal-oxide-semiconductor
komplementarne logike tranzistorski metal-oksid-poluprovodnik
CODEC coder-decoder
koder-dekoder
CRC cyclic redundancy check
ciklina provera suvinosti
CS conjugate structure
konjugovana struktura
CS-ACELP conjugate structure ACELP
konjugovana struktura ACELP
CSMA/CD carrier sense multiple access with collision detection
postupak viestrukog pristupa uz detekciju kolizije
CSS cascading style sheets
kaskadni stil listova
1D one-dimensional
jednodimenzionalni
2D two-dimensional
dvodimenzionalni
198
3D three-dimesional
trodimenzionalni
D descriptor
deskriptor
DAW digital audio workstation
digitalna audio radna stanica
dB decibel
decibel
DBC dictionary-based coding
kodiranje na bazi renika
DCT discrete cosine transform
diskretna kosinusna transformacija
DDL description definition language
opis definicije jezika
DI digital item
digitalni deo
DID digital item declaration
deklaracija o digitalnim delovima
DIVX digital video express
ekspres digitalni video
DMIF delivery multimedia integration framework
okvir za isporuku multimedijalnih komunikacija
DPCM/DCT differential pulse code modulation /discrete cosine transform
diferencijalna impulsno kodovana modulacija/diskretna kosinusna
transformacija
dpi dots per inch
broj taaka po jedinici duine
DRM digital rights managment
upravljanje digitalnim pravima
DS descriptor scheme
ema za deskripciju
DSM-CC dgital storage media-command and control
digitalna memorija-komanda i kontrola
DSP digital signal processing
digitalna obrada signala
DSVD digital simultaneous voice and data
digitalni simultani glas i podaci
DV digital video
digitalni video
DVB digital video broadcasting
digitalna video difuzija
199
DWT discrete wavelet transform
diskretna wavelet transformacija
EM electromagnetic
elektromagnetni
EQ equalizer
izjednaava
ES elementary stream
osnovni strim
FEC forward error correction
korekcija greaka unapred
FOE first order entropy
entropija prvog reda
3G third generation
trea generacija
GA general audio
generalni audio
GDF grade distortion function
funkcija stepena oteenja informacije
GFX graphics framework eXtensions
proirenja okvira grafike
GIF graphics interchange format
grafiki format za razmenu
GII global information infrastructure
globalna informaciona infrastruktura
GK gate keeper
nadzor prolaza
GNU Gnus Not Unix
GNUs dizajn slian Unix-u, ali se razlikuje od Unix-a jer je slobodan softver i
ne sadri Unix kod
GOB group of blocks
grupa blokova
GPL General Public License
opta javna licenca
GSTN general switched telephone network
opta komutaciona telefonska mrea
GW gate way
mreni prolaz
HD high-definition
visoka definicija
HDV high-definition video
video visoke definicije, video visoke rezolucije
200
HDTV high-definition television
televizija visoke definicije, televizija visoke rezolucije
HMM hidden Markov model
skriveni model Markova
HTML hyper text markup language
hipertekst sa oznaenim jezikom
HVS human visual system
oveiji vizuelni system
I intra
unutar
I-frame intra-frame
unutranji-frejm
IBP I-frame, B-frame, P-frame
I-frejm, B-frejm, P-frejm
IDCT inverse DCT
inverzna DCT
IEC International Electrotechnical Committee
Meunarodni elektrotehniki komitet
IETF Internet Engineering Task Force
Grupa za IP standarde
IP internet protocol
internet protocol
IPMP intellectual property management and protection
upravljanje intelektualnoim svojinom i zatita
IPRS intelectual property rights
prava intelektualne svojine
ISDN integrated services digital network
digitalna mrea integrisanih servisa
ISM interactive storage media
interaktivna memorija
ISO Internatonal Standard Organization
Meunarodna organizacija za standardizaciju
ITU International Telecommunication Union
Meunarodna unija za telekomunikacije
ITU-R International Telecommunication UnionRadio Standardization Sector
Meunarodna unija za telekomunikacijeRadio sektor za standardizaciju
ITUT International Telecommunication UnionTelecommunication Sector
Meunarodna unija za telekomunikacijeTelekomunikacioni sektor
JPEG Joint Photographic Experts Group
Grupa eksperata za fotografiju
JPEG-LS JPEG standard for image lossless coding
JPEG standard za kodovanje mirnih slika bez gubitaka
201
JP2 optional file format for JPEG 2000
opcioni fajl format za JPEG 2000
JTC Joint Technical Committee
Pridruni tehniki komitet
JVC joint video coding
zdrueno video kodovanje
JVT Joint Video Team
Zdrueni video tim
LAN local area network
lokalna raunarska mrea
MAE mean absolute error
srednja apsolutna greka
MB macroblock
makroblok
MCU multipoint control unit
kontrolna jedinica za vie taaka
MDS multimedia description schemes
multimedijalne eme za deskripciju
MEL Maya embedded language
ugraen programski skript jezik u Maya softver
MIDI musical instrumment digital interface
digitalni interfejs za muziki instrument
MIPS millions of instructions per second
milioni instrukcija u sekundi
MOS mean opinion score
srednja vrednost miljenja
MOS metal oxide sensors
senzori gasa
MPEG Motion Picture Experts Group
Grupa eksperata za obradu pokretne slike, Ekspertna grupa za pokretne slike
MPEG-J Motion Picture Experts Group-Java
Grupa eksperata za obradu pokretne slike-Java
MP3 Motion Picture Experts Group-1 Audio Layer 3
Grupa eksperata za obradu pokretne slike-1 audio sloj 3
MP4 Motion Picture Experts Group-4 File Format
Grupa eksperata za obradu pokretne slike-4 fajl format
MQ multiple quantization
multipl kvantizacija
MSE mean square error
srednja kvadratna greka
NAL network apstraction layer
mreni apstrakcioni sloj
202
NISDN narrow-band ISDN
uskopojasni ISDN
NTSC National Television System Committee
Nacionalni komitet za televizijski sistem
NURBS non-uniform rational B-spline
neuniformna racionalna osnovna kriva
OCR optical character recognition
optiko prepoznavanje znakova
OS operating system
operativni sistem
OSI open system interconnection
povezivanje otvorenih sistema
P predictive
prediktivni
P-frame predicted-frame, forward-predicted frame, inter-frame
predvidiv-frejm, unapred-predvidiv frejm, meu-frejm
PAL phase alternating line
linijska promena faze
PC personal computer
personalni raunar
PCM pulse code modulation
impulsna kodna modulacija
PDF probability density function
funkcija gustine verovatnoe
PNG portable network graphic
pokretna mrena grafika
PSNR peak-signal-to-noise ratio
vrni odnos signalum
PSP PlayStation portable
pokretna konzola za igranje
PSTN public switched telephone network
javna telefonska mrea sa komutacijom, javna komutirana telefonska mrea
QCIF quarter common intermediate format
etvrtni zajedniki srednji format
QoS quality of service
kvalitet servisa
RAM random access memory
memorija sa sluajnim pristupom
RDF rate distortion function
funkcije stepena oteenja
REC request for comment
zahtev za komentar
203
RLE run-length encoding
kodovanje duine niza
ROI region of interest
region od interesa
ROM read-only memory
memorija sa oitavanjem
RTCP real time control protocol
kontrolni protokol u realnom vremenu
RTP real time transport protocol
transportni protokol u realnom vremenu
SA structured audio
strukturni audio
SAOL structured audio orchestra language
strukturni jezik audio orkestra
SC sub-committee
podkomitet
SCN switched circuit network
mrea za komutaciju kanala
SDTV standard definision television
televizija standardne rezolucije
SECAM fran. sequentiel couleur a memoire, eng. sequential color with memory
Francuski televizijski standard
SG Study Group
Studijska grupa
SGML standard generalized markup language
standardni generalizovani jezik za markiranje
SH sample and hold
uzorak i zadravanje
SNHC synthetic natural hybrid coding
sintetiko prirodno hibridno kodovanje
SNR signal-to-noise ratio
odnos signalum
SQ single quantization
jednostruka kvantizacija
SWF shockwave Flash ili small web file
format vektorske grafike koji se moe generisati sa fleom
SVGA super video graphics array
super video grafika kartica niz
TC technical committee
tehniki komitet
TCP/IP transmission control protocol/internet protocol
protokol kontrole prenosa/internet protocol
204
TDNN time-delayed neural network
neuralne mree sa vremenskim kanjenjem
TIF tagged image format
format oznaene slike
TIFF tagged image file format
format dat. oznaene slike
ToR terms of reference
izrazi za reference
TR Technical report
Tehniki izvetaj
TSR two-level secure re-routing
dvoslojno bezbedno rutiranje
TTSI text-to-speech interface
interfejs tekst-govor
VBR variable bit rate
promenljiva bitska brzina
VCD video CD, view CD, compact disc digital video
video CD
VCEG Video Coding Expert Group
Ekspertska grupa za video kodovanje
VCL video coding layer
video kodni sloj
VGA video graphics array
video grafika kartica niz
VHDL very high speed integrated circuit hardware description language
hardverski opisni jezik za vrlo brzo integrisano kolo
VLC variable-length code
kod promenljive duine
VM verification model
verifikaconi model
VO video object
video objekat
VOC volatile organic compound
isparljivo organsko jedinjenje
VOP video object plane
ravan video objekta
VQ vector quantization
vektorska kvantizacija
VRML virtual reality modeling language
jezik modelovanja virtualne realnosti
VTC visual texture coding
kodovanje vizuelne teksture
205
W3C World Wide Web Consortium
WWW Konzorcijum
WD working draft
radni draft
WG Working Group
Radna grupa
XGA eXtended graphics array
proirena grafika kartica
XML eXtensible markup language
oznaeni jezik za proirenje
XMT eXtensible MPEG-4 textual
proireni MPEG-4 tekstualni
wavelength
talasna duina
206