Professional Documents
Culture Documents
Osnove Multimedijalnih Tehnologija PDF
Osnove Multimedijalnih Tehnologija PDF
Dr Zoran Bojkovi
Dr Dragoljub Martinovi
OSNOVE
MULTIMEDIJALNIH
TEHNOLOGIJA
-udbenik-
Beograd
2011.
Autori:
Recenzenti:
Lektor:
Tehniki urednik:
Izdava:
Za izdavaa:
dr Dragoljub Martinovi
tampa:
Tira:
20
PREDGOVOR
Rukopis Osnove multimedijalnih tehnologija, posle pozitivne recenzije, Nastavno vee
Visoke kole elektrotehnike i raunarstva u Beogradu odobrilo je za korienje kao udbenik za
predmete Digitalne multimedije 1 i Digitalne multimedije 2. Pisan je s namerom da bude
koristan svim studentima koji izuavaju multimedije na visokim kolama i fakultetima.
U prvih sedam poglavlja autor dr Zoran Bojkovi izloio je fundamente ove oblasti koja
se neprekidno razvija. Koautor dr Dragoljub Martinovi izloio je, u osmom i devetom
poglavlju, aplikativni aspekt multimedijalnih tehnologija.
Autori su zahvalni recenzentima dr Bratislavu Milovanoviu i dr Duanu Stareviu na
korisnim primedbama, mr Milici Mii na pomoi, redakciji i tehnikoj obradi, i Slavici Baji,
profesoru, na lekturi.
Beograd, septembar, 2011. godine
Autori
iii
iv
SADRAJ
1. Uvod .... 1
1.1 Klasifikacija medija...
1.2 Osobine multimedijalnih sistema...
1.3 Konvergencija telekomunikacija i raunara..
1.4 Multimedijalni komunikacioni model...
1.5 Korisniki zahtevi..
1.6 Mreni zahtevi...
1.7 Multimedijalni terminali
1.8 Paketski transfer.
1.9 Rezime...
Pitanja
Literatura...
2
3
4
5
6
7
7
8
10
11
11
2. Osnovi audia. 13
2.1 Karakteristike zvuka..
2.2 Neke karakteristike oveijeg slunog sistema..
2.3 Registrovanje audia
2.4 Predstavljanje audio signala.......
2.5 Rezime...
Pitanja
Literatura...
13
15
16
16
18
18
19
3. Vizuelni efekti.. 20
3.1
3.2
3.3
3.4
21
23
24
26
26
28
29
31
31
32
4. Audio-vizuelne integracije... 33
4.1 Interakcija medija.. 33
4.2 Bimodalnost ljudskog govora 34
4.3 Oitavanje sa usana 35
v
37
37
37
38
38
39
40
40
41
43
44
46
51
52
53
54
55
57
57
58
59
61
6. Kompresija teksta.. 62
6.1 Predstavljanje teksta u digitalnoj formi.
6.2 Principi kompresije teksta, statistika suvinost
6.3 Shannon-ova teorema kodovanja za beumni izvor..
6.4 Huffman-ovo kodovanje....
6.5 Aritmetiko kodovanje..
6.6 Rezime...
Pitanja
Literatura...
62
64
67
69
71
74
75
76
vi
82
84
86
89
90
91
93
95
96
97
98
101
104
108
112
113
116
117
119
126
129
130
130
132
133
133
134
136
137
137
138
139
141
143
146
148
149
8.4.2 Font...
8.4.3 Prikazivanje teksta na monitoru...
8.4.4 Veliina, razmera i tip fontova.
8.5 Animacija...
8.5.1 Tradicionalna animacija...
8.5.2 Kompjuterska animacija...
8.5.3 Animacija u multimedijalnim sistemima.
Trodimenzionalni objekti u animaciji 3D animacija.
Virtualna realnost u animaciji..
8.6 Zvuk u multimediji
8.7 Dodir u multimediji...
8.8 Miris u multimediji
8.9 Interakcija u multimediji
8.10 Rezime...
Pitanja
Literatura...
150
151
152
154
155
157
160
160
160
161
163
165
167
168
170
171
Spisak skraenica..
viii
173
174
174
175
176
178
179
181
181
182
186
187
188
188
191
193
194
195
196
197
1. UVOD
Prema standardu ISO/IEC JTC1 SC29/WG12, multimedija predstavlja sposobnost
postupanja sa razliitim vidovima prezentacionih medija koji ine tip podataka sa zadatkom da
definiu prirodu informacije u njenom kodiranom formatu.
Komunikacione tehnologije imaju veliki uticaj na razvoj savremenog drutve. Pre pojave
raunara, novine, radio, bioskop i televizija bile su primerena sredstva za masovne komunikacije.
Kada su ranih osamdesetih godina uvedeni personalni raunari, malo ljudi bilo je u stanju da
pretpostavi njihov ogroman uticaj na nau svakodnevnicu. Da bi se to efikasnije koristili
raunarski potencijali, prezentacija informacija treba da bude efikasno strukturirana kroz
memorisanje, prenos i pretraivanje.
Medijum je sredina (vazduh, voda) kroz koju se neto prenosi. Poto skraenica multi
predstavlja multipl, multimedija se odnosi na sredstva komunikacije sa vie od jednog medijuma
[1.1]. Multimedijalne tehnologije su glavna pokretaka snaga za uvoenje itavog niza
pogodnosti i primena sa take gledita korisnika. Radi se o interaktivnom predstavljanju govora,
audija, videa, grafike, teksta, uz injenicu da informacione tehnologije povezuju komunikacije,
raunarsku tehniku, i procesiranje signala u jednu interdisciplinarnu celinu. Pri razmatranju
problematike multimedijalnih tehnologija, pored ostalog, treba uzeti u obzir [1.2]:
Kontinualni trend u digitalizaciji,
Brzo irenje digitalnih mrea i naroito interneta,
Konvergenciju razliitih tehnologija, ukljuujui komunikacije, distribuciju digitalnih
medija, informacione tehnologije,
Pojavu novih komunikacijskih servisa i primene koje potiu od interneta i beinih
tehnologija,
Zahtev za multimedijalnim komunikacijama u realnom vremenu kao proirenje
monomedijalnih sistema.
Sa take gledita multimedijalnih komunikacija, cilj je da se najpre obezbede one
primene kojima se integriu tekst, zvuk i video informacija, a da se pri tome omogui u svakom
trenutku, interakcija. Pre svega, aplikacije Meunarodne unije za telekomunikacije (eng.
International Telecomunications Union ITU) i Grupe eksperata za obradu pokretne slike (eng.
Motion Picture Expert Group MPEG) treba da budu uzete u obzir. One podrazumevaju
integracije, interaktivnosti, memorisanja, striminga, pretraivanja i distribucije digitalnih medija,
kao i odgovarajuu infrastrukturu. S take gledita aplikacionog sloja znaajni su i mobilni
servisi, korisniki intrerfejsi i mobilni pristupi bazama podataka. Sa druge strane, na mrenom
1
sloju, naglasak je na kontroli pristupa, alokaciji resursa i irine propusnog opsega, kontroli
zaguenja saobraaja, i modeliranju saobraaja. Jednako je znaajan i kvalitet servisa (eng.
quality of service QoS) u mrenim multimedijalnim sistemima. Zahtev za kvalitet servisa i
odgovarajui parametri moraju biti u skladu sa garancijama QoS [1.3].
Nagli razvoj multimedijalnih tehnologija, i mogunosti razmene multimedijalnih sadraja
preko interneta, doprineli su znaaju poveanja koliine multimedijalnih podataka i to kako broja
dokumenata, tako i veliine pojedinih fajlova. Uz to, pojavila se i potreba za efikasnim
tehnikama kompresije, pretraivanja i pronalaenja eljenih multimedijalnih dokumenata. Treba
istai da se u srcu irokopojasnih mrea nalaze tehnologije koje omoguavaju brzi prenos
podataka prenosnim putevima velikog kapaciteta izmeu razliitih taaka u mrei.
MULTIMEDIJALNI PODACI
DISKRETNI
KONTINUALNI
PODACI:
TEKST
MIRNA SLIKA
AUDIO
VIDEO
INTERAKTIVNOST:
NEINTERAKTIVNI
INTERAKTIVNI
NEINTERAKTIVNI
INTERAKTIVNI
PRIMENE,
PRIMERI:
KNJIGE
SLAJDOVI
RAZGOVORI
U MREI
DVD FILMOVI
TV/AUDIO
DISTRIBUCIJA
VIDEO KONFER.
INTERAKTIVNA
TELEVIZIJA
komunicirati meusobno tako to se kroz mreu prenose multimedijalni podaci u diskretnom ili
kontinualnom obliku.
KORISNIK
b)
KORISNIK
KORISNIK
KORISNIK
KORISNIK
c)
KORISNIK
KORISNIK
KORISNIK
S
E
R
V
E
R
d)
KORISNIK
SERVER
KORISNIK
TRANSPORT
KORISNIKI
INTERFEJS
TIP A
PROCESIRANJE,
MEMORISANJE,
PRETRAIVANJE
TRANSPORT
KORISNIKI
INTERFEJS
TIP B
Kod tipa A postoji korisniki interfejs koji obezbeuje da svi korisnici budu meusobno
povezani dok transportni sloj prenosi multimedijalni signal od jednog do drugog korisnika, ili ka
svim korisnicima u komunikaciji. Korisniki interfejs kreira multimedijalni signal i omoguava
korisnicima interakciju na najlaki nain. Transportni sloj uva kvalitet multimedijalnog signala
kako bi ga svaki od korisnika primio na to kvalitetniji nain. Neki od primera za tip A su
telekonferencija, radiodifuzija, videofoni, uenje na daljinu, kao i scenarija koji se odnose na
deobu radnog prostora.
Kod tipa B, postoji korisniki interfejs za interakciju, i transportni sloj za prenos
multimedijalnog signala od memorije do korisnika. Takoe, postoji i mehanizam za memorisanje
i pretraivanje multimedijalnih signala koje kreira, ili zahteva korisnik. Pored memorisanja i
pretraivanja postojeih multimedijalnih podataka, od najveeg znaaja su memorisanje i
auriranje ovih podataka. Neki primeri za tip B ukljuuju difuziju, video, arhive dokumenata iz
digitalne biblioteke, pristup poslovnim sastancima, itd.
Udaljeni neinteraktivni
Difuzija
Mobilni: prezentacije,
demonstracije
Biznis: multimedijalna prezentacija,
vebanje, konsultacija baze podataka
Udaljeni interaktivni
Telefonija, videofoni, kupovina od
kue, igre, konsultacije na daljinu,
video na zahtev
Upravljanje, ugovaranje
Video sastanak, videokonferencije,
uenje na daljinu, upravljanje,
bezbednost na daljinu, monitoring,
daljinska dijagnostika
postupak viestrukog pristupa uz detekciju (eng. carrier sence multiple access with collision
detection CSMA/CD).
BRZA EKSTERNA MREA
LAN, KABLOVSKA, SATELITSKA
LAN/ETERNET MREA
TF LINIJA
Set Top Box
MODEM
KAMERA
SABIRNA MAGISTRALA
VIDEO
RIKORDER
RAUNAR
INTERAKTIVNA
TV
KANCELARIJSKO/
KUNO OKRUENJE
KUNO OKRUENJE
kanala. Video signali su naroito pogodni za paketsku komutaciju. Slike obino sadre oblasti sa
vie ili manje detalja, kao i periode brih i sporih pokreta. Otuda, video kanali treba da budu u
stanju da daju nizove podataka sa promenljivim bitskim protokom [1.11], [1.12]. Paketske mree
prenose direktno signale promenljivih bitskih brzina (eng. variable bit rate VBR). Na strani
predajnika nije potrebna bafer memorija niti kontrola bitskog protoka u povratnoj sprezi. Pod
bafer memorijom podrazumeva se mesto za skladitenje podataka koji se koriste u toku obrade i
prenosa. U principu, bafer se koristi i pri povezivanju mrea za kompenzaciju razlike u brzini
obrade signala izmeu mrenih ureaja. Treba naglasiti i to da paketske mree koje obezbeuju
prioritet paketima istovremeno omoguavaju video koderima da zatite kritinu informaciju.
Takoe, paketski video-transfer kroz mreu za asinhrono multipleksiranje sa vremenskom
raspodelom kanala (eng. asynchronous time division multiplexing ATDM) vremenski
multipleks ili internet, podrazumeva kodovanje i prenos digitalnog video signala pri emu se
vodi rauna o kvalitetu prijemnog signala. U principu, ATDM podrazumeva tehniku
multipleksiranja kod koje se prenos ostvaruje u obliku nezavisnih vremenskih intervala koji se
popunjavaju oznaenim paketima saglasno realnim trenutnim potrebama svake aplikacije. U tom
sluaju, terminalna oprema (tj. korisnika aplikacija) definie trenutni bitski protok, bez obzira
na to koliko on iznosi, a koji se moe menjati u toku trajanja same komunikacije. Na Slici 1.8.1
dat je jedan primer za transfer digitalnog video signala.
VIDEO SIGNAL
KODER
- TRANSFORMACIJA
- KVANTIZACIJA
- ENTROPIJSKO KODOVANJE
- KONTROLA BINARNOG PROTOKA
APLIKACIJA
- STRUKTURIRANJE PODATAKA
MRENO MULTIPLEKSIRANJE/RUTIRANJE
- KOREKCIJA
GREAKA UNAPRED
- DETEKCIJA GREAKA
- DETEKCIJA GUBITAKA
- KOREKCIJA GREKE
APLIKACIJA
- RESINHRONIZACIJA
DEKODER
- ENTROPIJSKO DEKODOVANJE
- INVERZNA TRANSFORMACIJA
- PRIKRIVANJE GUBITAKA
- POSTPROCESIRANJE
- DEKVANTIZACIJA
KORISNIK
Slika 1.8.1Operacije prilikom paketskog transfera digitalnog video signala
servis kroz vie mrea sa komutacijom paketa. IP obezbeuje funkcije adresiranja, specifikacije
tipa servisa, rastavljanje i ponovno sastavljanje i zatite. IP je specificiran u dokumentu Zahtev
za komentar REC791 (eng. request for comment REC). REC-ovi predstavljaju standarde i
preporuke na osnovu kojih funkcionie internet. Ove preporuke objavljuje Grupa za IP standarde
(eng. Internet Engineering Task Force IETF). Ova meunarodna organizacija za standarde
sastoji se od preko 80 radnih grupa i bavi se oblastima vezanim za razvoj protokola kontrole
prenosa/internet protokola (eng. transmission control protocol/internet protocol TCP/IP).
Protokol je razvijen u SAD od strane Ministarstva odbrane, za potrebe meunarodnog rada na
sloju 3(IP) i pouzdanog prenosa na sloju 4 za dvoslojno bezbedno rutiranje (eng. two-level
secure re-routing TSR) zasnovan na klizeem prozoru i retransmisijama. Danas se ova
skraenica koristi za referenciranje na itavu grupu protokola na internetu.
Najbolji izbor za video-transfer je statistiko multipleksiranje uz garanciju kvaliteta. Novi
spojni putevi u mrei su obezbeeni ukoliko se moe unapred garantovati traeni kvalitet,
imajui u vidu optereenje mree na bazi utvrenog saobraajnog toka.
1.9 Rezime
Trend u multimedijalnim komunikacijama ogleda se u obezbeenju servisa koji integriu
tekst, zvuk, mirnu i pokretnu sliku, uz jednostavnost upotrebe i odgovarajuu interaktivnost. S
druge strane, termin multimedijalne komunikacije odnosi se na predstavljanje, memorisanje,
pretraivanje i irenje vremenski obraene informacije u obliku teksta, mirne i pokretne slike,
grafike, govora, zvuka, animacije, rukom pisanog teksta, fajlova podataka, kao to je to
prikazano na Slici 1.9.1.
AUDIO KOMUNIKACIJA
(TELEFONIJA, PRENOS ZVUKA)
PRENOS TEKSTA I
MIRNE SLIKE
MULTIMEDIJALNA
KOMUNIKACIJA
PRENOS
PROMENLJIVIH
SLIKA
10
Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
ta je to multimedija?
Koje faktore treba uzeti u obzir pri razmatranju problematike multimedijalnih
tehnologija?
Kakva je funkcija aplikacionog i mrenog sloja u multimedijalnim komunikacijama?
Navesti i analizirati kriterijume prema kojima se sprovodi klasifikacija medija.
Koje elemente treba da obuhvati jedan multimedijalni sistem?
ta su to kontinualni mediji i kako se ukljuuju u multimedijalni sistem?
U emu se ogleda znaaj nezavisnosti medija u okviru multimedijalnog sistema i kako
se ona postie?
Nacrtati etiri blok-eme arhitekture za mrene multimedijalne aplikacije.
Koje komponente sadri slojeviti model za multimedijalne komunikacije?
Oblici multimedijalnih komunikacionih modela: uloga i znaaj pojedinih elemenata.
Navesti odgovarajue blok-eme.
Koji su najavaniji zahtevi multimedijalnih komunikacija sa take gledita korisnika?
Koje su sve kategorije multimedijalnih komunikacionih servisa?
Koji su uslovi korienja multimedijalnih servisa?
ta su osnovni zajedniki zahtevi kod uvoenja multimedijalnih servisa?
Koji su najvaniji mreni zahtevi multimedijalnih komunikacija?
Koja je razlika izmeu saobraajnih i funkcionalnih zahteva u multimedijalnoj mrei?
Koje uslove u pogledu organizovanosti treba da ispuni jedna multimedijalna mrea?
Koje su funkcije multimedijalnih terminala?
Navesti neophodnu opremu za multimedijalne terminale.
Koje su karakteristike paketskog transfera multimedijalnih podataka?
ime se karakterie paketski video transfer kroz mreu za asinhrono multipleksiranje
sa vremenskom raspodelom kanala?
Literatura
[1.1]
[1.2]
[1.3]
[1.4]
[1.5]
[1.6]
M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Introduction to Multimedia
Communications: Applications, Middleware, Networking. Wiley, 2006.
N. Chapman and J. Chapman, Digital Multimedia. Wiley, 2000.
T. N. Ryman, Computers learn to smell and taste, Expert Syst., vol. 12, no. 2, pp.
156161, May 1995.
R. Steinmetz and K. Nahrstedt, Multimedia: Computing, Communications and
Applications. Prentice Hall, 1996.
D. G. Messerschmitt, The convergence of telecommunications and computing: what
11
[1.7]
[1.8]
[1.9]
[1.10]
[1.11]
[1.12]
[1.13]
[1.14]
are the implications today? Proc. IEEE, vol. 84, pp. 11671186, 1996.
K. Watabe et al., Distributed desktop conferencing system with multiuser multimedia
interface, IEEE J. Sel. Areas Commun., vol. 9, pp. 531539, May 1991.
K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Multimedia Communication
Systems; Techniques, Strandardes, and Netwoks. Prentice Hall, 2002.
E. Fouques, Switching and routing: providing value with multimedia services, Alcatel
Telecommun. Rev., no. 3, pp. 198204, 1999.
Z. S. Bojkovi, Digital HDTV system compression, J. Commun., vol. 45, pp. 210,
MayJun. 1994.
L. Chiariglione and L. Corgnier, System consideration for picture communications, in
Proc. IEEE Int. Conf. on Communications, ICC '84, Amsterdam, Netherlands, pp. 245
249.
Z. S. Bojkovi, Some issues in packet video: Modeling, coding and compression, in
2nd Int. Workshop Image and Signal Processing: Theory, Methodology, Systems and
Applications, Budapest, Hungary, Nov. 1995, pp. 223.
G. Karlsson, Asynchronous transfer of video, Swedish Institute of Computer Science,
Kist, Sweden, Res. Rep. R95:14, 1997.
P. White and J. Groweroft, The integrated services in the Internet: State of the Art,
Proc. IEEE, vol. 85, pp. 19341946, Dec. 1997.
12
2. OSNOVI AUDIA
2.1 Karakteristike zvuka
Kada proizvedeni zvuni talas doe do uha i obradi ga mozak, ujemo zvuk. Zvuk, kao i
svaki talas, ima osobine koje ukljuuju refleksiju, refrakciju i difrakciju. Zvuni talas ima svoju
frekvenciju, amplitudu (glasnost) i anvelopu (talasni oblik). Audio sistemi su uneli mnogo
specifinih karakterisitka koje su rezultat izuzetnih zahteva ula sluha kao krajnjeg korisnika
zvunih informacija. Izvesne specifinosti proizilaze kao posledica velikog informacionog polja
koje je odreeno rasponom dinamikog opsega reda veliine 100 dB i vie, uz frekvencijski
opseg irine od 20 Hz do 20 kHz. Treba dodati i injenicu da ulo sluha ima veliku osetljivost i
detekciju razliitih vrsta izoblienja signala. Frekvencijski opseg zvuka moe se podeliti u etiri
kategorije:
Audio opseg se razlikuje od osobe do osobe, a reakcija uha na zvuk visoke frekvencije
pogorava se starenjem. Srednjoveni ljudi, sa dobro ouvanim slunim sistemom, uju zvuke
frekvencije iznad 15 kHz. Zvuni talasi prostiru se brzinom od 340 m/s pri sobnoj temperaturi
(20 C). Stoga, talasna duina varira od 17 m (odgovara frekvenciji od 20 Hz) do 1.7 cm
(odgovara frekvenciji od 20 kHz). Spektar audio signala sadri frekvencije, njihove harmonike,
mogue je i modulacione produkte. Najvei broj osnovnih frekvencija zvunih talasa je ispod
5 kHz. Zvuni talasi u opsegu 5 kHz do 15 kHz uglavnom se sastoje od harmonika. Harmonici i
njihove amplitude odreuju kvalitet zvuka. To omoguuje da se razlikuju zvuci koji dolaze iz
razliitih izvora (glas, muziki instrument, npr. klavir ili gitara). Intezitet ili amplituda zvuka
odgovara glasnosti kojom ga uho registruje. Za zvuk ili audio-registrovanje i reprodukciju,
intezitet zvuka se izraunava na dva naina. Najpre se moe izraziti na akustinom nivou, to
predstavlja intezitet koji uho registruje. Drugo, moe se izraziti na elektrinom nivou, jer je zvuk
konvertovan u elektrini signal. U oba sluaja, intezitet se izraunava u dB. Akustiki, intezitet
zvuka meri se preko nivoa zvunog utiska, tj.,
13
P
Intenzitet zvuka ( dB ) = 20 log10
Pref
gde je
P
Pref
(2.1.1)
Utvreno je da je karakteristina vrednost za Pref = 0.0002 dyn/cm2 [2.1] ili Pref = 2 105 Pa.
Ova vrednost se koristi u (2.1.1) za obraivanje intenziteta zvuka. Treba istai da je uho
neosetljivo na nivoe zvunog pritiska manje od Pref . Intezitet audio signala izraava se preko
nivoa elektrine snage, tj.,
P
Intenzitet zvuka ( dBm ) = 10 log10
P0
gde je
P
P0
(2.1.2)
14
15
Jak ton pri zadatoj frekvenciji moe da maskira slabije signale koji odgovaraju susednim
frekvencijama, to je prikazano na Slici 2.2.1. Dakle, ovde jak ton maskira druge blisko
rasprostranjene slabije tonove.
Frekvencijska rezolucija uha nije uniformna u celom audio-spektru od 20 Hz do 20 kHz.
Osetljivost je najvia na niskim frekvencijama i opada na viim frekvencijama.
Na niskim frekvencijama uho moe da razlikuje izdvojene tonove od nekoliko Hz.
Meutim, na viim frekvencijama, tonovi se moraju razlikovati za stotine Hz da bi se mogli
registrovati.
Kombinovanjem frekvencijske osetljivosti i uma maskiranja dobija se prag ujnosti.
Svaki audio signal ija je amplituda ispod praga maskiranja ne uje se.
Prva metoda primenjuje se u najveem broju sluajeva kako bi se postigao to manji bitski
protok. Druga metoda se koristi u okviru standarda za digitalni interfejs za muziki instrument
(eng. musical instrument digital interface MIDI).
Audio izvor
Uho
REGISTROVANJE
AUDIA
(MIKROFON)
PLAYBACK
GOVORNIK
ODMERAVANJE I
KVANTOVANJE
(DIGITALIZACIJA)
MEMORISANJE
ILI
PRENOS
PRIJEMNIK
DIGITALNO
ANALOGNA
KONVERZIJA
17
MIDI SIGNAL
SEKVENCER
ZVUNI MODUL
MIDI
SIGNAL
KONTROLER
Slika 2.4.2Uproena blok ema MIDI sistema
2.5 Rezime
Zvuk ima osobine koje ukljuuju refleksiju, refrakciju i difrakciju. Audio sistemi imaju
mnogo specifinih karakteristika koje proizilaze iz zahteva ula sluha kao krajnjeg korisnika
zvunih informacija. Na primer, uho ima veliku osetljivost na percepciju razliitih vrsta
izoblienja signala. Audio opseg kree se od 20 Hz do 20 kHz. Zvuni talasi u opsegu 5 kHz do
15 kHz sastoje se iz harmonika. Harmonici i njihove amplitude odreuju kvalitet zvuka. Uho i
njemu pridruni nervni sistem predstavljaju kompleksan interaktivni sistem. Uho je osetljivo na
mala izoblienja u signalu, a zanemaruje one za koje se predpostavlja da su izoblieni. Ove
osobine omoguuju da se postigne dobra kompresija radi kvalitetnijeg memorisanja audio
signala. Osetljivost na zvuk se smanjuje u prisustvu drugog zvuka sa slinim frekvencijskim
sadrajem. Ovaj efekat je poznat kao maskiranje. Frekvencijska rezolucija uha nije uniformna u
celom audio spektru. Osetljivost je najvia na niskim frekvencijama i opada na viim
frekvencijama. Obrada i memorisanje zvuka potrebni su u mnogim primenama (radiodifuzija,
muzika industrija, itd.). Za registrovanje zvuka potrebni su izvor, sluaoci i okruenje. Zvuk se
reflektuje od okolnih objekata. Slualac uje zvuk direktno iz izvora, kao i reflektovani zvuk.
Ostale komponente zvuka doprinose tzv. zvunom ambijentu. Eho predstavlja diskretno
ponavljanje dela zvuka u odreenoj prostoriji koji se postepeno gubi usled parcijalne apsorpcije
nastale prilikom svake refleksije zvuka. Fenomen reverberacije zvuka doprinosi oseaju prostora
i znaajan je kod reprodukcije zvuka. Audio signal se moe prikazati pomou talasnog oblika
parametarski (sintezom govora i muzikom sintezom). Muzika se predstavlja koristei MIDI
standard. to se tie MIDI sistema on se sastoji iz kontrolera, sintisajzera, sekvencera i zvunog
modela.
Pitanja
1.
2.
3.
18
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
Literatura
[2.1]
[2.2]
[2.3]
[2.4]
[2.5]
M. T. Smith, Audio Engineer's Reference Book. 2nd ed. Oxford, Focal Press, 1999.
D. R. Begault, 3-D Sound for Virtual Reality and Multimedia. Cambridge, MA:
Academic Press, 1994.
B. Bartlett and J. Bartlett, Practical Recording Techniques. 2nd ed. Focal Press, 1998.
J. Rothstein, MIDI: A Comprehensive Introduction. 2nd ed. Madison, WI, A-R Editions,
1995.
M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.
19
3. VIZUELNI EFEKTI
Kada udaljeni objekat vibrira, stvara kontrakciju i ekspanziju medijima u okruenju. Pri
tome nastaje zvuni talas koji detektuje ljudsko uho da bi se osetilo prisustvo objekta. Meutim,
kada objekat ne vibrira, ili ne postoji medijum kroz koji se prenose vibracije, uho nee biti u
stanju da oseti prisustvo objekta. Sreom, priroda nas je podarila jo jednim senzorom okom
koje moe da detektuje elektromagnetne (eng. elektromagnetic EM) talase koji dolaze sa
objekta. Od svih naih ula, oko je najefikasniji prijemnik informacija. Savremeni industrijski
svet veoma je orijentisan prema vizuelnoj komunikaciji. iroko je rasprostranjeno miljenje da se
70 % informacija koje dobijamo, prenosi posredstvom ula vida. Otuda je oko najvaniji senzor
u poreenju sa ostalim senzorima, kao to su ulo sluha, mirisa, dodira ili ukusa.
Uzimajui u obzir da se kao krajnji korisnik video informacije pojavljuje ulo vida,
naveemo najpre neke njegove karakteristike. Kako u procesu digitalne obrade slike izvesnu
panju treba posvetiti vidljivosti uma, pojasniemo i ovaj problem.
Poznato je da multimedijalne aplikacije sadre ili generiu slike koje e posmatrati ovek
[3.1], [3.15]. Meutim, ljudsko ulo vida nije dovoljno ispitano. Takoe, ne postoji objektivna
mera kvaliteta koja odgovara ljudskoj proceni o kvalitetu slike. Sreom, istraivanja u oblasti
perceptualne psihologije obezbeuju neka vana saznanja o vizuelnom sistemu.
Na Slici 3.1 prikazana je graa ljudskog oka.
Mrenjaa (retina) je prekrivena fotoreceptorskim elijama. One apsorbuju svetlost od slike koju
na mrenjai fokusiraju lea i ronjaa. Fotoreceptorske elije generiu elektrine impulse koji
20
putuju ka mozgu kroz optike nerve, od kojih se svaki sastoji od oko milion vlakana. Ove elije
su najgue u podruju ute mrlje (fovea). Kad je svetlost slaba, otvor zenice je vei, pa je
svetlost rasuta po veem delu mrenjae i slika je loije fokusirana. Postoje dve vrste
fotoreceptorskih elija, tapii (eng. rods) i unii (eng. cones). Nazive su dobile po njihovom
izgledu. tapii su mnogo osetljiviji i omoguavaju monohromatski vid nou. S druge strane,
unii omoguavaju gledanje u boji, ali samo pri jakom nivou osvetljaja. Postoje tri vrste unia.
Oni dele vidljivi spektar u tri opsega: crveni, zeleni i plavi. Zbog toga su ove tri boje oznaene
kao osnovne boje ljudskog vida. Oko opisuje boju uporeujui odzive svih tipova unia. Zbog
razliite gustine unia osetljivih na crvenu, plavu i zelenu boju, ukupna osetljivost oka je
najvea na zelenu, a najslabija na plavu svetlost. Meutim, ova osetljivost dolazi po cenu
slabijeg raspoznavanja u opsegu zelene boje. Na primer, u mikroskopiji se koriste filteri da bi se
izdvojila samo zelena boja, jer je oko najosetljivije na zelenu boju. Grubo govorei, oko moe da
vidi boje u opsegu od 400 nm do 700 nm. Pitanje koje se esto postavlja je: koja proporcija
crvene, plave i zelene boje odgovara svetlosti jedinstvene talasne duine. Na to pitanje nema
odgovora zbog nekoliko razloga. Pre svega, oseaj boje zavisi od percepcije oveka i opsega
promena od osobe do osobe, a takoe zavisi od ambijenta posmatranja. Od uticaja su i irina i
preklapanja opsega osetljivosti tri navedena tipa unia to znai da se isti oseaj boje moe
dobiti sa mnogo razliitih kombinacija talasnih duina.
21
Slika 3.1.1Relativna osetljivost oka u funkciji talasne duine, a) svetlost normalne jaine,
b) vrlo slaba svetlost
Neka je B1 sjaj pozadine, a B2 i B2 + B sjaj leve i desne polovine malog kruga, respektivno.
Razlika u sjaju B, koja je potrebna da bi se razlikovala promena od B2 do B2+ B varira zavisno
od razlike u sjaju |B2 B1|.
22
Vn = V ( ) S n ( ) d
(3.2.1)
gde je
Sn ()
V()
Teinska funkcija V() ukljuuje uticaj prenosne funkcije sistema za prenos slike, kao i
vizuelnog sistema posmatraa.
Eksperimentalno je dokazano da oko slabije uoava um pridodat video signalu u
trenutku znatnih promena, nego u oblastima slike gde se video signal relativno malo menja.
Odnos vidljivosti uma i brzine promene video signala zavisi od ukupnog sadraja slike.
23
(3.2.2)
+ +
+ +
( x, y ) dx dy =
2
F ( u , v ) du dv .
2
(3.2.3)
Vidi se da kvalitet pogorane izlazne slike g(x, y) ne zavisi samo od greke (x, y) ve i
od originalne slike f(x, y).
24
Ako je L () ulazna raspodela energije koja dolazi iz svetlosnog izvora, svetlost koju
prima posmatra nekog objekta moe se izmeriti u obliku:
I() = () L()
gde je
()
(3.3.1)
refleksija od objekta.
Ukoliko su svetlosni izvor, objekat i posmatra stacionarni, spektar od I() imae isti
frekvencijski opseg kao i L(), ali e im spektri biti razliiti, to odreuje ().
Kada posmatra primi svetlosnu energiju raspodele I() poinje kompleksan proces u
vizuelnom sistemu koji se odnosi na formiranje slike. Radi efikasnijeg projektovanja prenosnog
sistema, vano je prouiti karakteristike HVS. To je znaajno i zbog displeja informacija o slici.
Da bi se smanjila cena prenosa i displej ureaja, vai princip da ne treba prenositi niti prikazivati
informaciju koju oko ne moe da vidi.
oveiji vizuelni sistem tretira se kao optiki sistem. Naime, kada svetlost objekta padne
na oko, zenica oka deluje kao jedan prorez, slika se stvara na mrenjai, a gledalac vidi objekat.
Uoena veliina objekta zavisi od ugla pod kojim se ovaj stvara na mrenjai. Mrenjaa moe
bolje da razlui detalje kada je slika na mrenjai vea i kada se iri na vie foto receptora.
Zenica kontrolie koliinu svetlosti koja pada na oko. Ona je prenika 2 mm. Pri slabijem
osvetlenju, veliina raste kako bi se omoguilo da dolazi vie svetlosti, dok pri jaem osvetljenju
njena veliina opada da bi se ograniila koliina svetlosti.
U cilju uproenja HVS modela nainjeno je nekoliko predpostavki. Pre svega,
predpostavljeno je da je HVS linearni sistem to je u optem sluaju tano za slike sa malom
kontrau. Zatim, moe se predpostaviti da je HVS izotropan u prostornom domenu, tj. da oi
nemaju ni jedan preferencijalni pravac (prema horizontalnom, vertikalnom ili dijagonalnom).
Takoe, utvreno je da je osetljivost oiju u dijagonalnom pravcu manja nego u horizontalnom
ili vertikalnom, pa se ta injenica koristi kod mnogih modela.
Najzad, HVS se moe tretirati kao sistem koji se sastoji iz nekoliko podsistema. Istakli
smo da kada svetlost pada na oko, zenica se ponaa kao jedan prorez. To je ekvivalentno
niskopropusnom filtru. Zatim, spektralni odgovor oka (a to je funkcija efikasnosti osvetljaja
V()) se primenjuje na dolaznu svetlost, pa se dobija osvetljaj slike.
Osetljivost oveijeg vizuelnog sistema je mala na visokim prostornim frekvencijama.
Ova osobina koristi se u mnogim primerima obrade slike. U sluaju videa, kamera cilja slike (ili
video kadrove) koje brzo slede jedna za drugom. Displej ureaj (TV, kompijuterski monitor)
prikazuje individualne kadrove istom brzinom. Ukoliko je brzina prikazivanja individualnih
kadrova iznad izvesnog praga, HVS ne moe da opaa individualne kadrove, pa zato izgleda kao
da se pokretna slika menja kontinualno. Kritina brzina promene kadra zavisi od faktora kao to
su uslovi gledanja i video sadraj.
Danas postoji veliki broj istraivanja koja se bave odreivanjem kritine brzine kadra i
njene zavisnosti od eksperimentalnih rezultata. Naveemo jedan primer. Takasti izvor svetlosti
menja osvetljaj prema zakonu:
L + Lcos(2ft)
gde je
L
amplituda promene,
25
frekvencija u Hz.
Ukoliko L ima dovoljno veliku vrednost, a frekvencija nije suvie visoka, opaa se tzv. fliker
efekat. Za bilo koju datu vrednost frekvencije, vrednost L koja prizvodi prag oseaja flikera
odreena je eksperimentalno. Oznaimo tu vrednost sa LT.. Odnos L/LT poznat je kao
osetljivost na kontrast oveijeg vizuelnog sistema. Oko je osetljivije na fliker efekat pri
visokom osvetljaju. Osetljivost na fliker je zanemarljiva iznad (50 do 60) Hz. Ova osobina slui
kao polazna osnova za projektovanje TV sistema i kompjuterskih displej ureaja.
Ii(x, y)
OPTIKI SISTEM
H(x, y)
Slika 3.4.1.1Uproena blok ema optikog sistema
+ +
I ( x, y ) exp i ( x + y ) dx dy
u
(3.4.1.1)
i ( x ,y ) =
+ +
I ( x, y ) exp i ( x + y ) dx dy .
i
26
(3.4.1.2)
(3.4.1.3)
Polje slike na izlazu iz posmatranog sistema dobija se iz izraza (3.4.1.2) kada se primeni
inverzna Fourier-ova transformacija, tj.,
I i ( x, y ) =
1
4 2
+ +
( , ) exp i ( x + y ) d
i
dy .
(3.4.1.4)
to se tie transfer funkcije, to je u optem sluaju kompleksna veliina koja se moe predstaviti
preko modula |H(x, y)| i faze (x, y), tj.,
H(x, y) = |H(x, y)| exp[i (x, y)].
(3.4.1.5)
Moduo |H(x, y)| naziva se modulaciona transfer funkcija, dok se (x, y) po neki put sree u
literaturi pod nazivom fazna transfer funkcija [3.8].
Na Slici 3.4.1.2 prikazana je blok-ema monohromatskog vizuelnog modela
logaritamskog tipa. Ako je odziv ula na ulazni signal logaritamskog tipa, tada ukoliko signal
ima oblik jednog eksponencijalnog sinusnog talasa, tj. exp[sin Iu(x, y)], oveiji vizuelni sistem
moe biti linearizovan [3.6].
LINEARNI SISTEM
H(x, y)
LOG
SIGNAL
RECEPTOR
Slika 3.4.1.2Monohromatski vizuelni model logoritamskog tipa
I i ( x , y ) = k1 log [k 2 + k 3 I u ( x , y )]
(3.4.1.6)
gde
ki , i = 1, 2, 3
Iu (x, y)
predstavljaju konstante,
predstavlja polje objekta na ulazu u sistem.
Jedan drugi monohromatski vizuelni model predloio je Cornsweet [3.9]. Kod ovog
modela, odziv je oblika
( x, y ) =
K1 I u ( x, y )
K 2 + I u ( x, y )
gde
27
(3.4.1.7)
K1 i K2
predstavljaju konstante.
I
gde je
S
( x, y ) = Iu ( x, y )
(3.4.1.8)
gde je
c()
e1 = c ( ) S1 ( ) d
(3.4.2.1)
e2 = c ( ) S2 ( ) d
(3.4.2.2)
e3 = c ( ) S3 ( ) d
(3.4.2.3)
Kada se na tri napred navedena signala primeni logaritamska transfer funkcija, dobijaju
se originali:
d1 = log ( e1 )
(3.4.2.4)
e
d 2 = log ( e2 ) log ( e1 ) = log 2
e1
(3.4.2.5)
e
d3 = log ( e3 ) log ( e1 ) = log 3 .
e1
(3.4.2.6)
28
Na kraju, signali d1, d2 i d3 prolaze kroz linearne sisteme ije su transfer funkcije
H1(x, y), H2(x, y) i H3(x, y) respektivno. Signali g1, g2 i g3 na izlazu iz odgovarajuih
linearnih sistema pruaju osnovu za percepciju boje u mozgu.
e2
Log
d2
H2 (x, y)
g2
H1 (x, y)
g1
H3 (x, y)
g3
APSORPCIJA
ZELENE BOJE
e1
d1
Log
d3
APSORPCIJA
PLAVE BOJE
Slika 3.4.2.1Blok-ema Frei-ovog vizuelnog modela u boji
u kanalu, a time i izoblienje slike. U principu, kod kodovanja video signala cilj moe da bude da
se pobolja kvalitet slike, a da se kapacitet kanala odrava konstantnim, zatim da se smanji
kapacitet kanala da bi se odravao dati kvalitet slike, najzad da se pogorava kvalitet slike da bi
kapacitet kanala bio optimalan.
U
VIZUELNI
SVET
IZVORNI
KODER
X
KANALNI
KODER
Y
KANALNI
DEKODER
KANAL
KRITERIJUM
VERNOSTI
IZVORNI
DEKODER
PRIJEMNIK
UM
IZVORNI
KODER
X
KANALNI
KODER
Y
KANAL
V
KANALNI
DEKODER
IZVORNI
DEKODER
PRIJEMNIK
UM
u principu da bude kapacitet kanala C minimiziran pri emu je izoblienje D manje ili jednako
odreenom maksimumu Dmax, tj. D Dmax, ili da izoblienje D bude minimizirano pri emu je
kapacitet kanala C < Cmax, gde je Cmax maksimalni kapacitet kanala.
3.5 Rezime
Od svih naih ula, oko je najefikasniji prijemnik informacija. Oko 70 % informacija koje
dobijamo, prenosi se posredstvom ula vida. oveije ulo vida moe se smatrati diskretnim
sistemom koji karakteriu odreeni pragovi razlikovanja, gradacije sjaja i kritine duine trajanja
nadraaja. Oko je veoma osetljivo na komponente niskih uestanosti i ta osetljivost opada sa
porastom uestanosti. Oko ne reaguje trenutno na promene osvetljaja. Kada se svetlosni fluks
koji pada na mrenjau naglo povea, potrebno je izvesno vreme da se u mozgu stvori utisak
odgovarajue sjajnosti. Na raspoznavanje detalja, osim kontrasta i otrine, utie i adaptacija oka
kao i dinamika slike. Osetljivost oka moe se posmatrati sa tri aspekta: frekvencijska zavisnost,
zavisnost od detalja i zavisnost od osvetljaja. Prisustvo uma znatno smanjuje kontrast i otrinu
slike. um je vidljiviji ako je korelisan sa slikom nego ako je sluajan. Osetljivost oka na
izoblienje u slici zavisi od sadraja elemenata slike koji neposredno okruuju onaj deo gde se
izoblienje pojavilo. Kvalitet slike je definisan subjektivnim nalazima i moe se uporeivati na
osnovu subjektivnih odgovora posmatraa. Radi to efikasnijeg korienja multimedijalnih
tehnologija vano je poznavati karakteristike oveijeg vizuelnog sistema. On se tretira kao
optiki sistem. U literaturi su do danas prikazani razliiti vizuelni modeli: monohromatski
vizuelni modeli, vizuelni modeli u boji, kao i opti modeli vizuelnog komunikacionog sistema.
Prvi opti model dao je Shannon. Neki drugi istraivai (Fano, Pearson) modifikovali su ovaj
model. Na prednjoj strani uvode se izvorni i kanalni koder, dok se na prijemnoj strani uvode
odgovarajui dekoderi. Kod vizuelnih komunikacionih sistema, karakteristike izvora odreene su
metodom razlaganja, brojem elemenata u slici, prisustvom ili odsustvom slike u boji.
Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
31
13.
14.
15.
16.
17.
18.
19.
20.
21.
Literatura
[3.1]
[3.2]
[3.3]
[3.4]
[3.5]
[3.6]
[3.7]
[3.8]
[3.9]
[3.10]
[3.11]
[3.12]
[3.13]
[3.14]
[3.15]
32
4. AUDIO-VIZUELNE INTEGRACIJE
U multimedijalnim komunikacijama gde je ukljuen oveiji govor, audio-vizuelna
integracija je posebno znaajna. Ne samo da je vano zanemariti verbalnu i univerzalnu
informaciju, ve je interesantno pitanje interakcije izmeu razliitih medija. U ovom poglavlju
pozabaviemo se pitanjem zato su multimedijalne komunikacije vie nego prosto objedinjivanje
teksta, audia, slike i videa. Daemo pregled trendova u multimedijalnom istraivanju radi
korienja audio-vizuelne informacije, pre svega radi uspostavljanja veze izmeu obrade audio i
video signala. Koristei tehnologiju poznavanja govora, analiziraju se govorni talasni oblici kako
bi se otkrio izgovoreni tekst. Na osnovu reenice u tekstu, integrie se glava govornika (eng.
talking head) na osnovu audio-vizuelnog niza i to korienjem kompleksne grafike za analizu
facijalnog modela kao i sintezu teksta i govora kako bi se proizveo sintetiko akustini govor
[4.1], [4.2]. Isto tako, za komunikaciju osobaosoba koja je ukljuena u multimedijalne
aplikacije (videotelefonija, videokonferencija) od interesa je audio i vizuelna interakcija. S druge
strane, audio-vizuelna integracija takoe obuhvata automatsko oitavanje sa usne, primenu kod
prepoznavanja govora animacijom lica govornika, sinhronizaciju usana, praenje crta lica, audiovizuelno preslikavanje, zdrueno audio-vizuelno kodovanje, itd.
KOMPRESIJA
SINTEZA
3D ZVUK
AUDIO
PREPOZNAVANJE
GOVORA:
TEKST-GOVOR
TEKST
PREVOD
PRIRODAN JEZIK
SINHRONIZACIJA USANA
ANIMACIJA LICA
ZDRUENO A/V
KODOVANJE
MULTIMEDIJA
JEZIK OITAVANJE
SA USANA
MIRNA SLIKA/VIDEO
KOMPRESIJA, GRAFICI
INDEKSIRANJE/PRETRAIVANJE
BAZE PODATAKA
VIZUELNO
PERCEPIRANO
BA
GA
DA
PA
GA
TA
MA
GA
NA
34
AUDIO
AUDIO-VIZUELNO
PRESLIKAVANJE
OBLICI USTA
IZLAZNI
VIDEO
(VELIKA
BRZINA
KADRA)
VREMENSKO
IZGLAIVANJE
Slika 4.3.1Blok-ema sistema za izdvajanje informacije iz govornog signala i obradu slike usta radi
postizanja sinhronizacije usne
Pored male brzine kadra, i prenos prouzrokuje gubitak sinhronizacije usne kod videokonferencije. Kanjenje kod prenosa u sluaju videa je due nego kod audio kanjenja. Tehnika
obrade videa uz pomo govora reava problem izoblienjem slike usta govornika koja je sada u
sinhronizaciji sa audio signalom. Otuda je mogue smanjiti ukupno kanjenje.
36
jedan broj izlaza. Za svaku akustinu klasu ugraene su odgovarajue vizuelne kodne rei kako
bi se proizveo vizuelni efekat.
AUDIO
ULAZ
KLASIFIKACIJA
PRESLIKAVANJE
VIZUELNI
IZLAZ
podaci, prijemnik je u stanju da obnovi video uz vrlo malu informaciju sa strane. Postupak
unakrsno-modalne predikcije prikazan je na Slici 4.6.1. Jedan ovakav sistem je skalabilan u
irokom opsegu bitskih brzina.
VIDEO
SIGNAL
AUDIO
SIGNAL
VIZUELNA
ANALIZA
PARAMETAR
X
MODEL
ODLUIVANJA
(R-D)
(X X)
X
AUDIO-VIDEO
PRESLIKAVANJE
39
4.8 Rezime
U multimedijalnim komunikacijama gde je ukljuen ljudski govor, audio-vizuelna
integracija je od posebnog znaaja. Ovaj znaaj ogleda se ne samo zbog razmatranja verbalne i
univerzalne informacije u multimedijalnim komunikacijama, nego i zbog razlike informacija i
integracija izmeu razliitih medija. U ovom poglavlju utvreno je da multimedijalna
komunikacija predstavlja esto vie od prostog objedinjavanja teksta, audia, slike i videa. Kroz
audio-vizuelnu interakciju data je veza izmeu obrade audio i video signala. Naglasak je stavljen
na oitavanje sa usne, sinhronizaciju, audio-video preslikavanje, kao i bimodalnu personalnu
verifikaciju osobe.
Zdruena obrada audio i video signala prua dodatne mogunosti koje nisu prihvatljive
ukoliko se audio i video prouavaju posebno. U dananjim komunikacijama, uglavnom se ne
integriu mediji u komunikaciji meu ljudima. Multimedijalni sistemi dolaze do izraaja kada je
integracija sprovedena na tri kljuna naina: integracija sadraja, integracija korisnika i
integracija sa drugim medijima [4.17]. Primer audio-vizuelne integracije zbog bimodalnosti
percepcije govora je oitavanje sa usana. Ono se naroito koristi u okruenju uma. Na bazi
tehnika kompjuterskog vienja za praenje pomeranja usne u toku govora, kompjuter moe da
razume vizuelni govor. Uz to, automatsko oitavanje sa usana se takoe koristi za akustino
prepoznavanje govora.
Ukoliko brzina promene kadra nije adekvatna za percepciju sinhronizacije usana, jedno
reenje je da se izdvoji informacija iz akustinog signala koji objedinjuje odgovarajue pokrete
usta. Potom se obrauje slika govornikovih usta, kako bi se postigla sinhronizacija usana.
Kljuna stvar u analizi i sintezi govora je preslikavanje izmeu akustinih parametara i
parametara koji odgovaraju obliku usta. Drugim reima, to znai da za date akustine parametre
treba proceniti odgovarajui oblik usta i obratno. Za ovaj postupak postoje mnoge procedure kao
to su korienje vektorske kvantizacije, neuralne mree i skriveni Markovski modeli. Audiovizuelna informacija moe se koristiti i za verifikaciju osobe. Postojee relacije izmeu audio i
video signala koriste se za efikasnije kodovanje kako audia tako i videa. Neke druge aplikacije
ukljuuju segmentaciju slike, interfejs ovek-raunar, itd. Takoe, zajednika primena audia i
videa moe posluiti za klasifikaciju multimedijalnih sadraja.
Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
40
10.
11.
12.
13.
14.
15.
16.
Literatura
[4.1]
[4.2]
[4.3]
[4.4]
[4.5]
[4.6]
[4.7]
[4.8]
[4.9]
[4.10]
[4.11]
[4.12]
[4.13]
41
[4.14]
[4.15]
[4.16]
[4.17]
42
43
5.2 Odmeravanje
Signali koji odgovaraju realnim porukama su konanog trajanja i imaju beskonano irok
spektar. Meutim, glavni deo spektra koncentrisan je u nekom konanom opsegu uestanosti.
Izvan datog opsega, spektralna gustina amplituda signala poruka postaje toliko mala da e pri
realnim radnim uslovima praktino uvek biti prekrivena umom. Zavisnost frekvencijskog
opsega signala od nivoa uma data je na Slici 5.2.1. Smatra se da signali poruka imaju
ogranieno trajanje i ogranienu irinu spektra. Vidi se da nema razloga da se pri prenosu signala
prenosi i deo spektra iznad uestanosti oznaene sa g. Zbog toga, kontinualnim razlikama
dovodimo u korespodenciju kontinualne vremenske funkcije koje imaju strogo ogranien
spektar.
Na primer, za rad telefonskog signala dovoljno je preneti sve komponente koje se nalaze
u opsegu uestanosti od 300 Hz do 3400 Hz, a da se pri tome sauva razumljivost i snaga
signala. injenica da realni informacioni signali ne sadre spektralne komponente iznad neke
granine uestanosti fg, omoguava diskretizaciju signala po vremenu.
Postupak odmeravanja kontinualnog signala prikazan je na Slici 5.2.2. Ova slika se
sastoji iz: a) kontinualnog signala, b) povorke impulsa s0(t) dobijene odmeravanjem signala s(t) u
intervalima t i c) kola za odmeravanje kontinulanog signala.
Ako u jednakim vremenskim intervalima t uzmemo trenutne vrednosti signala, to je
prikazano na Slici 5.2.2-b, odnosno ako u tim takama generiemo impulse ija je visina jednaka
amplitudi kontinualnog signala, dobiemo povorku pravougaonih impulsa ije amplitude
pripadaju jednom kontinuitetu moguih trenutnih vrednosti signala. Postupak uzimanja trenutnih
vrednosti kontinulanog signala u odreenim vremenskim intervalima naziva se odmeravanje.
Kolo za odmeravanje sastoji se iz dvopolnog prekidaa na koji se prikljuuje signal koji se
odmerava. Prekida ravnomernom brzinom f0 = 1/t naizmenino spaja jedan od dva kontakta.
Neuzemljeni kontakt ostaje ukljuen sekundi, a uzemljeni kontakt je aktivan preostali period
vremena od t sekundi. Na izlazu kola pojavljuje se povorka impulsa irine , periode T = t
i promenljive amplitude. Diskretne vrednosti dobijene odmeravanjem nazivaju se odmerci.
Teorijski, odmerci treba da budu beskonano uski.
44
Slika 5.2.2Odmeravanje kontinualnog signala: a) kontinualni signal, b) povorka impulsa s0(t) dobijena
odmeravanjem signala s(t) u intervalima t, c) kolo za odmeravanje
1
2 fg
(5.2.1)
f0 =
1
= 2 fg
T0
(5.2.2)
0 =
0
T0
= 0 f 0 = 2 f g 0
45
(5.2.3)
Postupak odmeravanja moe se shvatiti kao mnoenje signala s(t) i funkcije odmeravanja h0(t) u
vremenskom domenu, tj.,
s0(t) = s(t)h0(t).
(5.2.2)
MNOENJE
s0(t)
h0(t)
Slika 5.2.3Procedura odmeravanja
46
Primer 5.2.1.1
Ako je periodini signal dekomponovan u pet sinusnih talasa sa frekvencijama
100 Hz, 300 Hz, 500 Hz, 700 Hz i 900 Hz treba odrediti irinu propusnog
opsega i nacrtati spektar signala uz predpostavku da su sve komponente
maksimalne amplitude od 10 V.
U odgovoru na ovaj primer, oznaiemo sa fh najviu a sa fl najniu
frekvenciju, dok je B irina propusnog opsega. Tada je
B = fh fl = 900 Hz 100 Hz = 800 Hz.
Odgovarajui spektar signala dat je na Slici 5.2.1.3.
47
Primer 5.2.1.2
Signal ima irinu propusnog opsega od 20 Hz. Najvia frekvencija je 60 Hz.
Koja je najnia frekvencija? Nacrtati spektar signala koji sadre sve frekvencije
iste amplitude.
Ako je sa fh oznaena najvia, a sa fl najnia frekvencija, tada je irina
propusnog opsega:
B = fh fl
tj.
fl = fh B = 60 Hz 20 Hz = 40 Hz.
Spektar koji sadri sve integralne frekvencije prikazan je na Slici 5.2.1.4
Primer 5.2.1.3
Posmatrajmo neki audio signal predstavljen funkcijom g(t). Fourier-ova
transformacija signala je oblika:
G () =
g (t ) e
jt
dt
(5.2.1.1)
g ( kT ) s ( t kT )
k =
48
(5.2.1.2)
s (t ) =
(t kT )
t =
(5.2.1.3)
1 +
G ( 2 kf s )
T t=
(5.2.1.4)
Primer 5.2.1.4
Na Slici 5.2.1.5 prikazan je vremenski i frekvencijski domen signala koji
ilustruju proces odmeravanja u ogranienom opsegu. Ovde g(t) predstavlja
ulazni signal, fs je frekvencija odmeravanja, s(t) predstavlja talasni oblik
prilikom odmeravanja, dok je gs(t) odmeravani signal.
49
(5.2.1.5)
sin ( f s t k )
g ( kt ) ( f t k )
k=
(5.2.1.6)
(5.2.1.7)
50
+ +
i (x , y )e
j ( h x + v y )
dx dy
(5.2.2.1)
gde je
h
v
is ( x, y ) = i ( x, y ) s ( x, y ) =
m = n =
(5.2.2.2)
(x m x , y n y ) .
m = n =
(5.2.2.3)
51
(5.2.2.4)
Jedan znaajan parametar u stvaranju digitalne slike je rezolucija slike. Tako na primer,
kada je slika skenirana, treba navesti rezoluciju skenirane slike. Pogodna rezolucija se odreuje
na osnovu (5.2.2.4) i osobina oveijeg vizuelnog sistema. S druge strane, detalji slike koje
vidimo oima zavise od ugla koji slika formira na retini.
Jedan idealni nisko-propusni filtar ima optu graninu (eng. cut-off) frekvenciju od fs/2
to je prikazano na Slici 5.2.3.1-a. U praksi je meutim nemogue realizovati jedan takav filtar.
Na Slici 5.2.3.1-b prikazan je frekvencijski odziv tipinog filtra koji se moe realizovati. Ovde je
pojaanje u propusnom opsegu blisko jedinici, dok je pojaanje u nepropusnom opsegu blisko
nuli. Prelazni opseg omoguuje postupno opadanje pojaanja i to od 1 ka 0. Projektovanje 1D
niskopropusnog/anti-aliasing filtra moe se proiriti na projektovanje 2D niskopropusnog/anti-
52
aliasing filtra za Slike. U tom sluaju filtar e imati dve granine (cut-off) frekvencije i to po
jednu u horizontalnom i vertikalnom pravcu.
ANALOGNI
AUDIO SIGNAL
IZ MIKROFONA
POJAAVA
DISKRETNI
DIGITALNI
AUDIO
ANTI-ALIASING
FILTER
SH
A/D
KONVERTOR
a)
ANALOGNI
AUDIO (C N)
ODMERAVANJE
I
DIGITALIZACIJA
DIGITALNI
AUDIO
KOMPRESIJA
I KOREKCIJA
GREKE
MULTIPLEKSER
DIGITALNI
AUDIO
ANALOGNI
AUDIO (N 1)
SKLADITENJE
PODATAKA
ODMERAVANJE
I
DIGITALIZACIJA
b)
Slika 5.3.1Digitalizacija audio signala: a) odmeravanje i digitalizacija, b) N-kanalno registrovanje i
skladitenje audio podataka
Uzorak i zadravanje (eng. sample and hold SH) blok slui za dranje amplitudne
vrednosti odmeraka od trenutka odmeravanja audio signala do trenutka nailaska sledeeg
odmerka. Zatim se vri odmeravanje audio signala u svakom trenutku odmeravanja. Analogno
digitalni (eng. analog to digital A/D) konvertor slui za ekvivalentno digitalno predstavljanje
53
analognog signala. Multipleksiranje niza bita koji dolaze iz razliitih kanala vri se pomou
multipleksera. Komprimovanjem se smanjuje suvinost i komprimuje veliina audio fajla pri
emu se odrava prihvatljiv nivo kvaliteta audio signala.
Kada je audio signal kvantovan koristei mali broj bita po odmerku, kvalitet audio
signala je lo. Utvreno je da ako se pre kvantizacije pridoda mala koliina diter uma
subjektivni kvalitet se poboljava.
Ukoliko audio sistem ima vie kanala (na primer 7 8 kanala), gornja procedura se
primenjuje posebno na svaki kanal. To znai da se odmerci iz razliitih audio kanala
multipleksiraju, komprimuju i skladite za budui tzv. playback, to je prikazano na Slici
5.3.1-b.
54
(5.3.1.1)
Ukoliko su nivoi odluivanja ekvidistantni, tj. ako je (dk-1 dk) konstantno za svako k,
radi se o uniformnom kvantizeru, to je prikazano na Slici 5.3.1.1-a.
Ulaznoizlazna funkcija i greka kvantovanja za neuniformni kvantizer su dati na
Slici 5.3.1.1-b.
Kvantovane vrednosti signala mogu se predstaviti korienjem razliitih metoda. Najvie
rasprostranjena metoda je tzv. metoda PCM. Tu se svaki odmerak predstavlja korienjem
fiksnog broja bita i kodovan je nezavisno od drugih. Ukupan broj moguih amplitudnih nivoa u
PCM je povezan sa brojem bita koji se koriste za predstavljanje svakog odmerka. Ako je N broj
nivoa izlaza iz kvantizera a B broj bita po odmerku, tada je:
N = 2B.
(5.3.1.2)
Vidi se da ukoliko je upotrebljen vei broj bita B za predstavljanje odmerka, broj izlaznih
nivoa N e se poveavati. To e smanjivati greku kvantovanja pa e se dobiti bolji kvalitet audio
signala. Bitski protok kvantnog audio signala dobija se iz izraza:
BITSKI PROTOK = fsB (bita/kanal/sekundi)
(5.3.1.3)
gde je sa fs oznaena frekvencija odmeravanja, dok je B, kao i pre, broj bita po odmerku. Za
stereo audio, kanali se mogu posmatrati kao nezavisni [5.5]. Otuda, bitski protok za stereo audio
bie dva puta od onoga za mono audio, tj. 2fsB bita u sekundi.
Neugodna smetnja
Smetnja se ne osea
55
SNR =
f ( n )
n =0
N 1
f ( n ) f ( n )
(5.3.2.1)
n =0
1
MSE =
N
gde su
f (n)
f ( n )
N
N 1
f ( n ) f ( n )
(5.3.2.2)
2
(5.3.2.3)
n =0
Tradicionalno, SNR je najpoznatija mera za greku. Pored toga to prua korisne informacije,
ovaj odnos je matematiki prilagodljiv, pa je iz tog razloga naiao na najiru primenu. Naalost,
vrednosti SNR nisu u dobroj koleraciji sa subjektivnim ocenama, naroito pri velikim odnosima
kompresije.
Kvalitet digitalnog audio odmerka je odreen brojem bita po odmerku. U procesu
kvatizacije, ulazna vrednost odmerka je predstavljena najblie moguim izlaznim nivoom. U tom
procesu, unosi se um u kvantovani signal. Greka (um) kvantovanja je razlika izmeu stvarne
vrednosti analognog signala i njegove kvantovane vrednosti. Drugim reima
e ( nT ) = f ( nT ) g ( nT ) = g ( nT ) Q g ( nT )
56
(5.3.2.4)
gde je
g ( nT )
ulazni signal,
g ( nT )
izlaz iz kvantizera,
e ( nT )
1
Q 2 22B
2
E=
e de =
=
Q Q/ 2
12
12
gde je
B
(5.3.2.5)
2 2B
Q2
= 10log10
= 6B 10.8 .
12
12
(5.3.2.6)
Jednakost (5.3.2.6) pokazuje da svaki dodatni bit u postupku A/D konverzije smanjuje
um za oko 6 dB i na taj nain poveava SNR za isti iznos. Tako, na primer, SNR za 16 bitni
kvantovani audio signal e biti reda veliine 96 dB. Za jedan audio signal koji ima SNR vei od
90 dB se smatra da je odlinog kvaliteta za najvei broj primena.
57
vernosti: subjektivni i objektivni. U sluaju subjektivnih mera, koristi se slina skala kao i kod
audio signala za procenu kvaliteta slike. Meutim vizuelno testiranje sa realnim subjektima
predstavlja glomaznu proceduru. Otuda, kada je u pitanju vizuelna vernost, u praksi se najee
koriste objektivne mere vernosti. Ove najee koriene mere su SNR i MSE. Ovim merama
treba pridodati vrni odnos signalum (eng. peak-signal-to-noise ratio PSNR), kao i srednju
apsolutnu greku (eng. mean absolute error MAE). Ako su f ( m, n ) i f ( m, n ) originalna i
izobliena slika, respektivno, dimenzija M N, vizuelna vernost moe se oceniti primenom
sledeih parametara [5.10], [5.11]:
M 1 N 1
SNR ( dB ) = 10 log10
f ( m, n )
m=0 n =0
M 1 N 1
f ( m, n ) f ( m, n )
m =0 n =0
M 1 N 1
PSNR ( dB ) = 10 log10
(5.4.1.1)
m =0 n =0
M 1 N 1
f ( m, n ) f ( m, n )
(5.4.1.2)
m =0 n =0
1
MSE =
MN
MAE =
M 1 N 1
f ( m, n ) f ( m, n )
m =0 n =0
1
MN
(5.4.1.3)
M 1 N 1
f ( m, n ) f ( m, n )
(5.4.1.4)
m=0 n =0
Mada ove objektivne mere omoguuju da se brzo proceni izoblienje, one nisu dobro
korelisane sa subjektivnim procenama, naroito kada se radi o velikom izoblienju.
5.5 Rezime
U dananjim telekomunikacionim sistemima, analiza i obrada multimedijalnih podataka
predstavlja vrlo aktuelan problem. Kod analognih sistema javljaju se problemi uma,
nestabilnost, velike potronje energije. Da bi se audio ili video podaci smestili u raunar moraju
se digitalizovati. Digitalni sistemi omoguavaju jednostavan prenos i skladitenje podataka.
Pored toga, iroke mogunosti programiranja ine digitalne sisteme superiornim u odnosu na
analogne. Digitalizacija multimedijalnih signala je opta tema koja se pojavljuje u vie naunih
disciplina. injenica je da su audio i video sistemi uneli mnogo specifinih zahteva koji se
postavljaju prema digitalizovanom signalu, a koji su posledica izuzetnih zahteva ula sluha u
ula vida kao krajnjih korisnika informacija.
Da bi se analogni audio adekvatno digitalizovao njegov spektar mora biti ogranien u
skladu sa teoremom odabiranja. Spektar audio signala moemo ograniiti na dva naina. Prvi
nain je da ga ograniimo samo sa ulaznim filtrom. Drugi nain je da koristimo ulazni filtar u
58
Pitanja
1.
2.
Koji se postupci koriste pri diskretizaciji, a koji pri digitalizaciji kontinualnog signala?
ta je to odmeravanje kontinulanog signala i kako se ono vri?
59
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
ta je to kontinualno odmeravanje?
Nacrtati blok-emu kola za odmeravanje signala i objasniti kako radi ovo kolo.
Kako glasi teroema o odmeravanju?
ta je to faktor reima odmeravanja?
Nacrtati blok-emu koja ilustruje proceduru odmeravanja u vremenskom domenu.
ta predstavlja Nyquist-ov kriterijum?
Kako se Nyquist-ova teorija odmeravanja moe proiritu na diskretizaciju slike?
U emu se ogleda uloga tzv. anti-aliasing filtra kod multimedijalne akvizicije
podataka?
Nacrtati karakteristiku anti-aliasing filtra koji se moe realizovati u praksi i naznaiti
odgovarajue parametre.
Nacrtati blok-emu za digitalizaciju audio signala, naznaiti i objasniti funkciju svakog
elementa.
Na koji se nain vri N-kanalno registrovanje audio podataka?
ta je to uniformni, a ta neuniformni kvantizer?
Na koji nain se moe poboljati kvalitet audio signala kada se primeni impulsno
kodovana modulacija?
Kako se odreuje bitski protok kvantovanog audio signala za monoaudio i za
stereoaudio?
Koji se kriterijumi koriste za procenu kvaliteta audio signala?
Kada se koristi subjektivni, a kada objektivni kriterijum za procenu kvaliteta audio
signala?
Predstaviti tabelarno skalu pogoranja za procenu vernosti audio signala.
ta utie na subjektivne procene kvaliteta audio signala?
Kako glase izrazi za utvrivanje odnosa signal-um u dB i srednju kvadratnu greku
nastalu u toku obrade audio signala?
Predpostavljajui da je um kvantovanja statistiki nezavisan i sa uniformnom
raspodelom u intervalu [-Q/2, Q/2] odrediti srednju kvadratnu vednost uma u dB.
U emu se ogleda uloga dodatnog bita u postupku analogno-digitalne konverzije?
Kada se smatra da je za najvei broj primena audio signal odlinog kvaliteta?
Uporediti osetljivost ljudskog auditivnog i vizuelnog sistema.
ta je potrebno za opisivanje digitalne slike sivog nivoa, a ta za opisivanje kada je ista
u boji?
Koji se parametri koriste za utvrivanje vizuelne vernosti digitalizovane slike?
Kako se definie vrni odnos signal-um za odreivanje vizuelne vernosti
digitalizovane slike?
Napisati analitiki izraz za srednju kvadratnu greku nastalu u procesu digitalizacije
slike.
U emu se razlikuju subjektivne i objektivne mere za procenu vernosti digitalizovane
slike?
60
Literatura
[5.1]
[5.2]
[5.3]
[5.4]
[5.5]
[5.6]
[5.7]
[5.8]
[5.9]
[5.10]
[5.11]
61
6. KOMPRESIJA TEKSTA
Tekst je jo jedan znaajan medium za predstavljanje multimedijalnih informacija.
Ustvari, to je najstariji medijum za skladitenje i prenos informacija. Najvei broj dananjih
informacija jos uvek se uva u tekstualnom obliku. U ovom poglavlju daemo najpre kratak
uvod u predstavljanje teksta u digitalnoj formi, a zatim e biti rei o nekim tehnikama kompresije
teksta.
Ukoliko pojava datog simbola ne zavisi od prethodnih simbola, entropija ovakvog izvora
informacije data je izrazom
62
H ( s ) = P ( si ) log 2
S
1
, si S .
P ( si )
(6.1.1)
Maksimalnu entropiju imae izvor kod koga su verovatnoe emitovanja svih simbola date
azbuke jednako verovatne. Tada je neizvesnost najvea poto nijedan simbol nema prioritet. Ako
azbuka ima q simbola ija je verovatnoa pojavljivanja p = 1/q onda je maksimalna
entropija
H max = P ( si ) log 2
i=1
jer je oigledno
i =1
q
1
1
= log 2 ( q ) = log 2 ( q )
P ( si ) i=1 q
(6.1.2)
1
=1.
q
Funkcija H(p) naziva se entropijska funkcija. Izvori koji emituju simbole koji su
meusobno statistiki nezavisni nazivaju se izvori bez memorije. Najzad na osnovu svega do
sada naloenog moe se izvui zakljuak da je izvor informacija definisan: azbukom (listom
simbola) koju emituje, verovatnoom pojavljivanja simbola, brzinom emitovanja simbola i
prosenom brzinom emitovaja informacije.
63
Primer 6.1.1
Odrediti entropiju diskretnog izvora bez memorije sa etiri izvorna simbola
S = { A, B, C, D} ije su verovatnoe pojavljivanja: P(A) = 0.60, P(B) = 0.30, i
P(C) = P(D) = 0.05.
Traena entropija dobija se iz izraza:
1
H ( s ) = P ( si ) log 2
P ( si )
i=1
q
= P ( si ) log 2 P ( si )
i=1
q m+1
P(s
i=1
j1
, ,s jm ,s i ) log 2
1
.
P ( si | s j1 ,s j2 , ,s jm )
(6.2.1)
Niz od prethodno emitovanih m simbola predstavlja stanje izvora. Ukupan broj stanja
iznosi qm, pa je broj uslovnih verovatnoa qm+1. Postojanje statistike zavisnosti ismeu simbola
64
smanjuje neizvesnost pa, prema tome, i koliinu informacije. To znai da e entropija izvora koji
emituje statistiki zavisne impulse uvek biti manja od entropije istog takvog izvora, ali koji
emituje statistiki nezavisne impulse.
Oznaimo sa Hp vrednost entropije neke azbuke pod pretpostavkom da je verovatnoa
pojavljivanja svih slova (simbola) date azbuke jednaka i da ne postoji nikakva statistika
zavisnost pri pojavi slova (H0 = Hmax). Neka je H stvarna vrednost entropije u sluaju da su
uzete u obzir sve statistike zavisnosti jezika koje se izrazavaju pomou date azbuke. Tada odnos
H/H0 predstavlja stepen iskoriscenja simbola (slova) ili relativnu entropiju.
Statistika suvinost odnosno redundantnost predstavlja meru za ogranienja koju tekstu
namee statistika struktura jezika. Definie se preko stepena iskorienja slova, tj.,
R = 1
H
H0
(6.2.2)
ili u procentima
R (%) = 100 (H0 H)/H0.
(6.2.3)
Primer 6.2.1
Koliki je stepen iskorisenja slova ruske azbuke (32 slova) i kolika je
redundantnost ruskog jezika ako se zna da stvarna entropija ove azbuke (H)
iznosi 1.4 bita po slovu?
Najpre treba odrediti entropiju nultog reda koja iznosi:
H 0 = H ( s ) = P ( si ) log 2
s
1
1
1
= log 2 32 = 32 5 log 2 2 =
32
P ( si ) 32 32
.
= 5 bita po slovu
1 .4
= 0 . 28 .
5
Primer 6.2.2
Koliku koliinu informacije nosi televisijska slika koja se sastoji od 625 linija a
svaka linija od 500 elementarnih taaka pri emu svaka taka moe da ima
16 nivoa osvetljenosti u rasponu od belog do crnog?
Posmatrana TV slika sastoji se od
65
1
16
( 625500 )
1
= log 2 16( 625500) = 312 500 log 2 ( 24 ) = 312 500 4 =
P(E)
.
1
.
p [k ]
(6.2.4)
Iako svaki simbol moe biti analiziran posebno, korisno je razmotriti velike blokove simbola pre
nego pojedinane simbole. Izlaz iz izvora se grupie u blokove od N simbola, a za simbole se
moe predpostaviti da su generisani iz izvora SN sa alfabetom dimenzije KN. U tom sluaju izvor
SN predstavlja N-to proirenje izvora S.
66
k =1
k =1
H ( S ) = p [ k ] I ( s k ) = p [ k ]log 2 p [ k ]
(6.2.5)
67
H (S ) R H (S ) + S
(6.2.6)
Drugim reima izvor moe biti kodovan bez gubitaka sa prosenim brojem bita bliskim
njihovoj entropiji ali ne manjoj od entropije. Entropija izvora ograniena je sa 0 i log2K. To
znai, drugim reima da je
0 H(S) log2 K.
(6.2.7)
U ovoj relaciji leva strana vai ako je p[k] nula za sve izvorne simbole sk izuzev jedinice.
U tom sluaju je izvor apsolutno prediktabilan. Desna strana vai kada svaki izvorni simbol sk
ima istu verovatnou pojavljivanja. Redundansa izvora je definisano kao
REDUNDANSA = log2K H(S).
(6.2.8)
Ova relacija pokazuje da ukoliko izvor ima alfabet velicine K, maksimalna entropija
izvora je log2K. Ako je entropija iznosi log2K za izvor se moe kazati da je nulte suvinosti. U
najveem broju sluajeva informacija sadri suvinost.
Primer 6.3.1
Posmatrajmo izvor informacija sa alfabetom {a, b, c, d}. Simboli imaju
podjednaku verovatnou nastajanja. Treba odrediti entropiju i redundansu
izvora. Takoe treba pronai broj bita potreban za prenos simbola iz izvora a
zatim i koder pogodan za kodovanje simbola.
Poto je p(a) = p(b) = p(c) = p(d) = 0.25, entropija izvora iznosi:
4 0.25 log2 0.25 ili 2 bita/simbol.
Imajui u vidu da je veliina alfabeta K = 4, redundansa je nula, poto je
entropija jednaka log2 K = 2.
Prosean broj bita potreban za prenos simbola je 2 bita/simbol. U tom sluaju,
projektovanje kodera je trivijalno. Naime bie a: 00, b: 01, c: 10 i d:11.
Primer 6.3.2
Koliki je prosean broj bita potreban za izvor od tri simbola? Koliki je
minimalan broj bita potreban za kodovanje izvora od tri simbola koji je inae
oblika {aaabbbbbbbccaaabbcbbbb}. Takoe treba odrediti redundansu izvora.
Kada je redundansa izvora jednaka nuli?
Broj bita potreban za jedan izvor informacije od tri simbola je
log2 3 = 1.59 bit/simbol.
U primeru 6.2.4 pokazali smo da je entropija za zadati izvor informacija 1.36
bit/simbol. Suvinost u datom izvoru informacije sa 3 simbola je:
log2K H(S) = 1.59 1.36 = 0.23 bit/simbol.
Suvinost izvora je nula kada je entropija H(S) jednaka log2K. To e se dogoditi
68
Verovatnoa
0.2
0.1
0.2
0.2
0.3
0.1
Huffman-ov kod
10
011
11
0100
00
0101
verovatnou nastajenja 0.2 (0.1 i 0.1). Sada vidimo da se broj simbola smanjio za jedan. U koloni
dva, izvor ima etiri simbola umesto pet. Verovatnoe ta etiri simbola su rasporeene po
opadanju, kao to je to prikazano u koloni tri. U sledeem koraku dva najmanje verovatna
simbola su ponovo spojena, pa su zatim nove verovatnoe ponovo rasporeene po opadanju.
Proces se ponavlja dok se izvor ne svede na dva simbola. U naem primeru dve poslednje
verovatnoe su 0.6 i 0.4.
ORIGINALNI IZVOR
DODELJIVANJE KODA
Simbol
Verovatnoa
0.3
0.3
0.3
0.4
0.6
0.2
0.2
0.3
0.3
0.4
0.2
0.2
0.2
0.3
0.1
0.2
0.2
0.1
0.1
0.1
Slika 6.4.1Huffman-ov proces redukcije izvora
DODELJIVANJE KODA
Simbol
Verovatnoa
KOD
0.3
00
0.3
00
0.3
00
0.4
0.6
0.2
10
0.2
10
0.3
01
0.3
00
0.4
0.2
11
0.2
11
0.2
10
0.3
01
0.1
001
0.2
010
0.2
11
0.1
0100
0.1
011
0.1
0101
Slika 6.4.2Proces dodeljivanja Huffman-ovog koda
Posle tog dodeljivanja postoje 4 simbola sa verovatnoama 0.3, 0.3, 0.2 i 0.2 i kodovima
00, 01, 10 i 11 respektivno. U sledeem koraku, druga verovatnoa 0.3 dobijena je spajanjem dve
verovatnoe 0.2 i 0.1. Kodovi dodeljeni ovim verovatnoama (0.2 i 0.1) su 01 praen 0 i 01
praen sa 1. Posle tog dedeljivanja postoji pet simbola sa verovatnoama pojavljivanja 0.3, 0.2,
0.2, 0.2 i 0.1 sa kodovima 00, 10, 11, 010 i 011 respektivno. etvrta verovatnoa 0.2 dobijena je
spajanjem dve verovatnoe 0.1 i 0.1. U ovom koraku kod dodeljen ovim verovatnoama (0.1 i
0.1) je 010 praen sa 0 i 010 praen sa 1. Posle tog dodeljivanja postoji est simbola sa
verovatnoama 0.3, 0.2, 0.2, 0.1, 0.1 i 0.1 i odgovarajuim kodovima 00, 10, 11, 011, 0100 i
0101 respektivno. Na taj nain dobili smo Huffman-ove kodove za sve originalne izvorne
simbole.
Iako dosta korieno jo od otkria 1952 godine, Huffman-ovo kodovanje ima
nedostatke. Pre svega, ono zahteva najmanje jedan bit za predstavljanje pojavljivanja svakog
simbola. Stoga, ako je entropija izvora manje od jednog bita po simbolu, Huffman-ovo
kodovanje nije efikasno. Dalje, ovo kodovanje se ne moe efikasno prilagoditi ukoliko se
menjaju statistike izvora. Najzad, ni ureaji koji koriste Huffman-ov koder nisu jednostavni za
implementaciju.
71
Primer 6.5.1 pokazuje da ako izvor ima azbuku dimenzije K postoji Km razliitih moguih
poruka duine m. Ukoliko je poznata funkcija gustine verovatnoe individualnih simbola, moe
se izraunati verovatnoa nastajanja date poruke sm duine m. Poto postoji Km razliitih
moguih poruka, moe se izraunati verovatnoa p(sm) nastajanja tih individualnih poruka, pri
emu je
K
p (s ) = 1 .
m =0
(6.5.1)
Verovatnoa
0.2
0.1
0.2
0.1
0.3
0.1
72
Binarni interval
Generisani
niz bita
[ 0, 1.0]
START
b
[ 0.2, 0.3 ]
[ 0.0, 0.5 ]
[ 0.2, 0.22 ]
[ 0.0, 0.25 ]
[ 0.2, 0.204 ]
[ 0.125, 0.25 ]
[ 0.1875, 0.25 ]
[ 0.1875, 0.21875 ]
[ 0.2020, 0.2024 ]
[ 0.20236, 0.2024 ]
73
Dosadanja opisana procedura proizvodi realne brojeve koji se mogu poslati dekoderu.
Realni brojevi su predstavljeni nizom bita koji se generiu kada jednom znamo konaan realan
broj. Niz bita se generise posle nailaska ulaznih simbola i poto su podintervali segmentirani kao
to je prikazano u Tabeli 6.5.2. Za simbol b koder zadrava opseg na [0.2, 0.3]. Poto je
odreeno da je interval [0.0, 0.5], dekoder zna da je prvi simbol 0. Stoga, on sada moe da
otpone sa slanjem ulaznih bita. Posle drugog simbola, koder dalje suava opseg na [0.2, 0.22].
Tada koder zna da je drugi simbol 0, jer je interval u opsegu [0, 0.25]. Na slian nain, trei
simbol e biti ''1'', jer se interval nalazi u opsegu [0.125, 0.25]. etvrti simbol je 1, itd.
ema dekodovanja je vrlo jednostavna. Predpostavimo da je poslat broj 0.20238.
Dekoder prepoznaje da je prvi simbol b poto lei u opsegu [0.2, 0.3] kao to je prikazano u
Tabeli 6.5.2. Drugi simbol je a jer lei u opsegu [0.2, 0.22]. Zatim se proces nastavlja.
U navedenom primeru korien je fiksni model koji nije pogodan za kodovanje
nestacionarnih izvora kod kojih se statistike izvora menjaju se vremenom. U tim sluajevima
trebalo bi primeniti adaptivni model. Tako, na primer, u [6.12] je predloen efikasan model za
primenu adaptivnog aritmetikog kodovanja koji daje broj bita vrlo blizak entropiji izvora.
6.6 Rezime
Najvei broj informacija jo uvek se danas uva u tekstualnom obliku. Podaci o tekstu
stvoreni su iz diskretnog informacionog izvora koji emituje simbole a ovi predstavljaju slova
koja odgovaraju nekoj azbuci. Poto se tekstualni podaci jo uvek koriste kao razliiti
dokumenti, vano ih je predstaviti u najprihvatljivijoj formi kako bi se smanjili zahtevi za
skladitenim prostorom. Prosena koliina informacija po simbolu kojom izvor snabdeva
posmatraa predstavlja entropiju. Maksimalnu entropiju imae izvorni kod kod koga su
verovatnoe emitovanja svih simbola date azbuke podjednako verovatne. Ujedno tada je i
neizvesnot najvea, poto nijedan simbol nema prioritet. Minimalna entropija nastaje kada izvor
ne emituje nikakvu informaciji. To je sluaj kada izvor emituje samo jedan simbol ije je
verovatnoa pojavljivanja jednaka jedan, a svih ostalih je nula.
Izvori koji emituju simbole koji su medjusobno statistiki nezavisni nazivaju se izvori
bez memorije. S druge strane, izvor informacije je definisan: azbukom (listom simbola) koji
emituje, verovatnoom pojavljivanja simbola i prosenom brzinom emitovanja informacija
(simbola).
Podaci o tekstu nose suvinu informaciju. Tehnika kompresije teksta smanjuje ili
eliminie tu suvinost ime se postie kompresija. Entropija izvora koji emituje statistiki
zavisne impulse uvek e biti manja od entropije istog takvog izvora koji emituje statistiki
nezavisne impulse. Statistika suvinost odnosno redundantnost predstavlja meru ogranienja
koju tekstu namee statistika struktura jezika.
Dva ogromna koncepta u teoriji izvornog kodovanja su entropija i funkcija stepena
osteenja informacije. Entropija prua meru za informaciju izvornih simbola sadranu u izvoru
podataka i odreuje minimum prosenog bitskog protoka potrebnog za perfektnu reprodukciju
izvornih simbola. S druge strane, teorija osteenja informacije prua niu granicu za prosean
broj bita za dato izoblienje u obnovljenim simbolima.
Ukoliko izvor ima alfabet veliine K, maksimalna entropija izvora je log2 K. Ako
entropija iznosi log2 K, za izvor se kae da je nulte suvinosti. U najveim broj sluajeva
informacija sadri suvitnost.
74
Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
75
17.
18.
19.
Literatura
[6.1]
[6.2]
[6.3]
[6.4]
[6.5]
[6.6]
[6.7]
[6.8]
[6.9]
[6.10]
[6.11]
[6.12]
[6.13]
[6.14]
76
77
Mada deluju odvojeno, u mnogim sluajevima dolazi do konkurencije nekih njihovih rezultata,
kao to je to prikazano na Slici 7.1.1.
79
ISO/IEC, 11172 Kodovanje pokretnih slika sa pridruenim audiom do oko 1.5 Mbit/s
(MPEG-1)
ISO/IEC, 13818 Kodovanje pokretne slike i pridruenje audia (MPEG-2)
ISO/IEC, 14496 Kodovanje audio-vizuelnih objekata (MPEG-4)
ISO/IEC, 15938 Intefejs za opis multimedijalnog sadraja (MPEG-7)
ISO/IEC, 21000 Multimedijalni okvir (MPEG-21)
Iako je MPEG-3 bio predvien da se bavi velikim binarnim protocima (binarni protok se
uobiajeno izraava kao broj bita u sekundi (eng. bits per second) bit/s, b/s, bps), nikada nije
razvijen, jer su se ovi zahtevi mogli sresti kod MPEG-2. to se tie MPEG-5 i MPEG-6, oni nisu
nikada ni definisani. Najzad, treba istai da je MPEG-21 prvi standard uspostavljen u 21. veku.
MPEG sledi princip da standard treba da obezbedi interoperabilnost. To produava
ivotni vek standarda i obezbeuje istovremeno uvoenje novih tehnologija. Na primer, MPEG
standardi kodovanja specificiraju samo sintaksu i semantiku tokova bita (eng. bit stream) i
proces dekodovanja. Nita se ne govori o tome kako kodovi kreiraju tokove bita. To ostavlja
istraivaima vie slobode oko optimizacije izbora kodera (estimacija pokreta, upravljanje
protokom bita kod psihoakustinih modela), a sve se to radi zbog minimiziranja performansi za
ciljane aplikacije i sadraje. Istraivai koriste primene novih tehnologija u MPEG standardima
radi to boljeg korienja sredstava primenjenih u procesu kodovanja. Time se postie
konkurencija u kvalitetu i ceni uz stalno obezbeene uzajamne interoperebilnosti.
DCT) u bloku primenjeno na jednoj slici ili na greku predikcije dobijenu posle
predikcije po vremenu (na bazi jedne ili dve slike) sa kompenzacijom pokreta. DCT je
praena kvantizacijom, cikcak smenjivanjem i kodovanjem primenom promenljive
duine kodne rei, kao to je prikazano na Slici 7.3.1. MPEG-1 video podrava samo
progresivne formate, a broj linija je fleksibilan.
ORIGINALI
DCT
KVANTIZER
KREACIJA
SIMBOLA
ENTROPIJSKO
KODOVANJE
INVERZNA
KVANTIZACIJA
BINARNI NIZ
INVERZNA
DCT
IZLAZNI
BAFER
Kompenzacija
pokreta
Prethodni
kadar
ENTROPIJSKO
KODOVANJE
c) Deo 3: Audio
Specificira kodne formate (audio strim i odgovarajui proces dekodovanja) za
monofonski od 32 kbit/s do 192 kbit/s i stereofonski od 128 kbit/s do 134 kbit/s zvuk.
Ovaj standard specificira tri hijerarhijska sloja kodovanja: I, II i III koji su pridrueni
zbog kompleksnosti, kanjenja i efikasnosti. Sloj III je poznatiji pod oznakom MP3. Ova
kodna reenja su namenjena za opti audio i koriste perceptualna ogranienja oveijeg
auditornog sistema sa krajnjim ciljem koji je vezan za uklanjanje parcijalnih nevanih
delova signala.
d) Deo 4: Prilagoeno ispitivanje
Odreuje testove za proveru da li su strimovi bita (sadraj) i dekoderi korektni u odnosu
na specifikacije u delovima 1, 2 i 3.
e) Deo 5: Softverska simulacija
Sastoji se iz softvera koji primenjuje alate specifine u Delovima 1, 2 i 3. To je tehniki
izvetaj koji ima samo informativnu vrednost. U kasnijim MPEG standardima tzv.
Referentni softver postaje deo standarda. MPEG-1 je jo uvek popularan kod internet
video striminga i downloading-a. Isto tako, poznato je da je u oblasti distribucije digitalne
muzike znaajan standard Grupe eksperata za obradu pokretne slike-1 audio sloj 3 (eng.
Motion Picture Experts Group-1 Audio Layer 3 MP3), odnosno MPEG-1 audio sloj 3.
81
Kodni algoritmi i metode predikcije u MPEG-2 skoro su isti kao kod MPEG-1. Meutim,
MPEG-2 sadri vie mogunosti, na primer, analiza sa proredom i skalabilnost [7.5].
MPEG-2 sistemi, audio i video specifikacije su bazirani na odgovarajuim MPEG-1
specifikacijama [7.6]. Kasnije je pridodat jo jedan Audio Deo, sa novim audio kodekom koji
pripada naprednom audio kodovanju (eng. advanced audio coding AAC). Danas standard
MPEG-2 sainjavaju razliiti Delovi [7.7][7.11].
a) Deo 1:Sistemi
Ovde vae iste karakteristike kao i za MPEG-1 sisteme s tim to se jo podravaju:
1)
2)
3)
4)
Ovi zahtevi daju kao rezultat specifikaciju dva tipa sistema strimova: Programski strim
slian i kompatibilan sa MPEG-1 sistemima strimova i novi Transportni strim za prenos
vie nezavisnih programa.
b) Deo 2: Video
Odreuje opti domet kodovanja (video strim i odgovarajui proces dekodovanja) za
video sekvence sve do HDTV rezolucije. Osnovna kodna arhitektura je ista kao i za
MPEG-1 Video, uz podrku za isprepletane video formate i skalabilne/ hijerarhijske
kodne formate (vremenski, prostorni, SNR). MPEG-2 Video podrazumeva vie alata. U
nekim primenama neki, od ovih alata suvie su komplikovani za primenu. MPEG-2
82
Video definie, tzv. profile koji su u stanju da obezbede kodna reenja uz odgovarajuu
kompleksnost. Profili su podnizovi alata koji se odnose na potrebe specifinih klasa
aplikacija. Takoe, izvestan broj nivoa je definisan za svaki profil kako bi se ograniila
memorija i raunarski zahtevi za primenu dekodera. Nivoi obezbeuju donju granicu
kompleksnosti strimova bita i minimum mogunosti za dekoder. MPEG-2 Video dekoder
je u stanju da dekoduje MPEG-1 video strimove. Kompatibilnost, koja se ogleda u tome
da je MPEG-2 Video mogue kodovati pomou MPEG-1 Video dekodera, je obezbeena
preko specifinih profila kroz skalabilnost [7.13], [7.14].
c) Deo 3: Audio
Odreuje kodni fomat (audio strim i odgovarajui proces dekodovanja) za viekanalni
audio. Deo 3 obezbeuje kompatibilnost sa MPEG-1 Audio strimovima. Na primer,
MPEG-1 Stereo dekoder bio bi u stanju da reprodukuje znaajnu verziju originalnog
vuekanalnog MPEG-2 Audio strima. MPEG-2 Audio je u tehnikom pogledu slian sa
MPEG-1 Audio sa ista tri sloja.
d) Deo 4: Prilagoeno ispitivanje
Obuhvata specifine testove koji omoguavaju da se proveri da li su strimovi bita
(sadraj) i dekoderi takvi da odgovaraju specifikacijama i tehnikim delovima MPEG-2.
Za video strimove prilagoavanje je definisano za strimove odreenog nivoa i odreenog
profila.
e) Deo 5: Softverska simulacija
Sastoji se iz softvera i koristi alate specificirane u delovima 1, 2, i 3. Opis je dat u obliku
informativnog Tehnikog Izvetaja.
f) Deo 6: Digitalna memorija-komanda i kontrola (eng. digital storage media- command
and control DSM-CC)
Obuhvata specifine opte komande i kontrole nezavisno od vrste DSM, kako bi se
predstavile funkcije specifine za MPEG strimove bez potrebe da se znaju detalji o DSM.
Ove komande se primenjuju na MPEG-1 Sisteme, kao i na MPEG-2 Programske i
Transportne strimove.
g) Deo 7: AAC
Poto je MPEG-2 Audio (Deo3) specifian sa ogranienjem u pogledu kompatibilnosti,
odreuje multikanalni kodni format, bez zahteva u pogledu kompatibilnosti. Na taj nain
postie se slian kvalitet na znatno niim bitskim brzinama nego kod MPEG-2 audio
dela 3.
h) Deo 8:
Povuen (u poetnom stadijumu odnosi se na 10-bitno video kodovanje).
i) Deo 9: Interfejs u realnom vremenu
Odreuje dodatne alatke za korienje MPEG-2 sistema za razmenu podataka u realnom
vremenu, to je praktian zahtev u telekomunikacionim primenama.
83
85
86
87
88
Podrka za prenos preko postojeih mrea. Alati za otpornost uz greke pomau dekoderu
da se oporavi od greaka u prenosu i odri uspenu video konekciju u mrenom
okruenju. Treba imati u vidu da i skalabilni alati za kodovanje mogu pomoi u podrci
za fleksibilniji prenos kodiranih bitskih protoka;
Vizuelni deo MPEG-4 standarda obezbeuje kodne funkcije kroz kombinaciju alata,
objekata i profila. Alat predstavlja podskup kodnih funkcija za podrku specifine funkcije (na
primer, video kodovanje oblika objekta). Objekat je video element (na primer sekvenca sa
pravougaonim frejmovima, mirna slika itd) koji je kodovan korienjem jednog ili vie alata.
Profil je skup tipova objekata za koji se oekuje da koder-dekoder (eng. coder-decoder
89
CODEC) ima mogunosti da ih obrauje. Ovaj vizuelni deo MPEG-4 standarda obuhvata profile
za kodovanje prirodnih video scena. Pored podskupa alata za kodovanje, profili definiu i nivoe.
Nivoi definiu ogranienja u parametarskom bitstrimu. Svaki nivo postavlja ogranienja u
maksimalnim performansama za dekodovanje MPEG-4 kodovane sekvence. Definicije nivoa
postavljaju ogranienja na veliinu memorije bafer, veliinu dekodovanog frejma i brzinu
procesiranja.
U okviru ovog dela MPEG-4 standarda, video sekvenca se posmatra kao kolekcija jednog
ili vie objekata. Objekti se definiu kao frekvencijske celine koje korisniku omoguavaju
pristup, prezentovanje i manipulaciju. Video objekat (eng. video object - VO) je oblast video
scene koja moe zauzimati region proizvoljnog oblika i moe postojati proizvoljno vreme.
Trenutni video objekat u odreenemo trenutku vremena predstavlja video objektnu ravan (eng.
video object plane - VOP). Na Slici 7.5.2.1 prikazan je video objekat koji se sastoji od tri
pravougaone video objektne ravni. Video scena moe biti kreirana od objekata u drugom planu
(eng. background object) i posebnih objekata u prvom planu (eng. foreground object).
Ovaj pristup je fleksibilniji nego fiksna pravougaona struktura frejma kod prethodnih
standarda. Posebni objekti se mogu kodovati sa razliitim vizuelnim kvalitetom i vremenskom
rezolucijom da bi prikazali svoju vanost u konanoj sceni. Objekti sa vie izvora (ukljuujui i
sintetike i prirodne objekte) mogu se kombinovati u jednu scenu. Preko visoke interaktivne
aplikacije krajnji korisnik moe da regulie kompoziciju i ponaanje scene. Svaki objekat koduje
se posebno.
91
92
Video sekvence se sastoje od okvira (eng. frame) ili polja (eng. field). H.264/AVC
standard podrava progresivnu ili analizu sa proredom koje mogu biti u istoj sekvenci. Slike su
izdeljene u iseke. Iseak je sekvenca makroblokova i ima fiksnu veliinu. Postoje tri osnovna
tipa iseka: I unutar (eng. intra - I), P prediktivni (eng. predictive - P) i B dvosmerno prediktivni,
biprediktivni (eng. bidirectionally-predictive - B) iseci. Kod H.264/AVC standarda, I-iseci
makroblokova su komprimovani bez korienja neke predikcije pokreta od iseka u drugim
slikama. P-iseci sadre makroblokove koji se mogu komprimovati sa korienjem predikcije
pokreta. P-iseci mogu sadrati i intra makroblokove. B-iseci sadre makroblokove koji se
mogu komprimovati korienjem predikcije pokreta i slino kao kod P-iseaka mogu imati intra
makroblokove.
KODOVANJE I DEKODOVANJE KOD H.264/AVC STANDARDA
Na Slici 7.5.4.3 prikazan je koder sa dva dela za prenos podataka unapred (sa leva u
desno) i deo za rekonstrukciju (sa desna u levo). Kod kodera (deo unapred) ulazni frejm ili
polje je procesirano u makroblok jedinice. Svaki makroblok je kodovan u Inter ili Intra modu i za
svaki blok u okviru makrobloka predikcija PRED (oznaeno sa P) se formira na osnovu
rekonstruisanih odbiraka slike. Kod Intra moda, PRED je formirana od odbiraka aktuelnog
iseka koji je perthodno kodovan, dekodovan i rekonstruisan to je oznaeno sa uF'n. Kod
Inter moda PRED je formirana pomou predikcije kompenzacije pokreta od jedne ili dve
referentne slike koje su selektovane iz skupa liste 0 i/ili liste 1 referentnih slika. Referentna slika
je prikazana kao prethodno kodovana slika F'n-1. Predikcija referentne slike za svaki deo
makrobloka (kod Intra moda) mora se izabrati izmeu selektovanih prolih ili buduih slika koje
su ve kodovane, rekonstruisane i filtrirane. Predikcija PRED se oduzima od aktuelnog bloka da
bi se dobio rezidualni (razlika) Dn blok koji se transformie (koriste se blok transformacija T) i
kvantuje Q da bi se dobio skup kvantovanih koeficijenata tranformacije X koji su ponovo
ureeni i entropijski kodovani. Koeficijenti entropijski kodovani, zajedno sa ostalim
informacijama zahtevaju da se dekoduje svaki blok unutar makrobloka (modovi predikcije,
parametri kvantizacije, informacije o vektoru pokreta itd.) komprimovanog toka koji je posle
93
prosleen mrenom apstraktnom sloju NAL radi prenosa ili memorisanja. Dekoder (deo za
rekonstrukciju) dekoduje (rekonstruie) svaki blok u makrobloku da bi obezbedio referencu za
dalje predikcije. Koeficijenti X se skaliraju (Q^-1) i inverzno transformiu (T^-1) da bi se dobio
blok razlike D'n. Predikcije bloka PRED se dodaje da bi se dobio rekonstruisani blok nF'n
(dekodovane verzije originalnog bloka). Oznaka n ukazuje na to da rekonstruisani blok nije
filtriran. Filter se primenjuje da se redukuju efekti debloking izoblienja. Rekonstruisana
referentna slika je kreirana iz serije F'n blokova.
+
Fn
trenutni
Dn
Estimacija
pokreta
Preraspodela
Entropijsko
kodovanje
NAL
F'n1
referenca
1 ili 2 prethodno
kodovana frejma
F'n
rekonstruisani
Inter
Kompenzacija
pokreta
P
Intra
predikcija
Izbor Intra
predikcije
Intra
uF'n +
Filter
D'n
T^ 1
Q^ 1
+
Slika 7.5.4.3Blok-ema kodera za prenos podataka i rekonstrukciju
Preraspodela
Entropijsko
kodovanje
NAL
F'n1
referenca
Kompenzacija
pokreta
1 ili 2 prethodno
kodovana frejma
F'n
rekonstruisani
Inter
Intra
predikcija
Filter
Intra
uF'n
D'n
+
Slika 7.5.4.4Blok-ema dekodera
94
T^ 1
Q^ 1
95
koder koduje svaki bit prema selektovanom modelu verovatnoe. Selektovani model konteksta je
baziran na auriranju aktuelne kodovane vrednosti.
Zavravajui ovo izlaganje, treba istai da je zahvaljujui svojim unapreenim
performansama H.264/AVC privukao panju industrije. Pored klasinih aplikacionih domena
kao to su videokonferencije i broadcasting TV sadraji (satelitski, kablovski i zemaljski), sa
poboljanjem sposobnosti kompresije, H.264/AVC je obuhvatio i nove servise i tako otvorio
nove trine mogunosti u industriji. Druga oblast koja je privikla dosta interesovanja
proizvoaa opreme je prenos i memorisanje sadraja visoke definicije (eng. high definition
HD) [7.43]. H.264/AVC standard se moe primeniti i kod korisne opreme (na primer digitalne
kamere, celularni telefoni itd.), videa preko IP mrea [7.44], [7.45], digitalnog broadcasting-a
visoke definicije (preko zemaljskih ili satelitskih kanala) i digitalnih sistema za memorisanje
(digitalni video disk (eng. digital video disk DVD ) visoke rezolucije). Danas H.264/AVC
omoguava i prenos preko IPTV preko digitalnih pertplatnikih linija i pasivnih optikih mrea.
H.264/AVC standard naao je primenu i kod mrea sa asinhronim nainom prenosa ATM.
96
97
sloja mogu biti poslati kanalom sa boljom performansom greke. Manje kritian vii sloj alje
podatke kanalom sa smanjenom performanskom greke.
Da bi se poboljao prenos komprimovanih slika, u ovaj standard su ukljueni sinteza bita
otpornog na greke i odgovarajui alati. Kada se radi o otpornosti na greke, odgovarajui alati
koriste deobu podataka kao i resinhronizaciju, detekciju i snimanje greke uz QoS na bazi
prioriteta. Mnoge primene zahtevaju isporuku podataka o slici kroz razliite tipove
komunikacionih kanala. Tipini beini komunikacioni kanali orijentisani su ka sluajnim i
sporadinim bitskim grekama. I internet komunikacije su sline nastojanju gubitka usled
nagomilavanja saobraaja/saobraajnog preoptereenja.
to se tie mogunosti zatite intelektualne svojine, standardom je definisan opcioni fajl
format za JPEG 2000 (eng. optional file format for JPEG 2000 JP2) kod komprimovanja
podataka o slici. Format slui za mirnu sliku i meta podatke, a ima i mehanizam za naznaku
tonske skale i boja na slici. To je mehanizam pomou koga itaoci mogu da prepoznaju u fajlu
postojanje informacije o zatiti prava intelektualne svojine (eng. intelectual property rights
IPRS). Takoe, to je mehanizam pomou koga metapodaci mogu biti ukljueni u fajl. Blok-ema
kodera i dekodera za JPEG 2000 data je na Slici 7.7.1.
Najpre je primenjena diskretna tranformacija na izvorne podatke o slici. Transformacioni
koeficijenti su potom kvantovani i entropijski kodovani pre formiranja izlaznog toka bita.
Zavisno od wavelet transformacije i primenjene kvantizacije, JPEG 2000 moe biti sa gubicima i
bez gubitaka. Na strani dekodera obavljaju se procesi entropijskog dekodovanja, dekvantizacije i
inverzne transformacije kako bi se dobili rekonstruisani podaci o slici.
98
1996 godine MPEG je pokrenuo MPEG-7 projekat pod nazivom Opis interfejsa za
multimedijalni sadraj [7.50] sa ciljem da se specifira standard za opis razliitih tipova audiovizuelnih informacija kao to su osnovni delovi, skladitenje informacija, bez obzira na njihov
format, nain predstavljanja ili medijum. Poput drugih MPEG standarda, MPEG-7 se susree sa
nizom zahteva od prethodnih MPEG standarda, audio-vizuelna predstava ovde nema za cilj da
komprimuje i reprodukuje podatke, ve se bavi tzv. metapodacima (podaci o podacima).
MPEG-7 deskriptori obezbeuju reenje za metapodatke kod velikog broja primena. Oni
su nezavisni od medijuma i formata na bazi objekata i sa mogunou proirenja. Rade na
razliitim nivoima i to poev od opisa na niskom nivou automatskih i esto statistikih
karakteristika pa sve do predstavljanja istih na visokim nivoima gde se prenose semantika
znaenja.
Sledei princip da MPEG standardi moraju specificirati samo potreban minimum,
MPEG-7 specificira format za deskripciju i njegovo dekodovanje. Na taj nain ostavljeno je
mnogo slobode za istraivae u oblasti aplikacija. MPEG-7 specificira dva osnovna tipa alata:
deskriptori (eng. descriptor D) i eme za deskripciju (eng. descriptor scheme DS). Deskriptor
je predstavljanje karakteristika koje definiu sintaksu i semantiku. Kao primer moe posluiti
vremenski kod za predstavljanje trajanja procesa ili momenti boja i histogrami za predstavljanje
boje. Sa druge strane ema za deskripciju odreuje strukturu i semantike relacija izmeu
komponenti. To mogu biti odreeni deskriptori i eme za deskripciju. Jednostavan primer je opis
filma, struktuiranog kao scene i pucnjevi ukljuujui tekstualne deskriptore na scenskom nivou
kao i aspekte pomeranja uz deskriptor audio amplitude na nivou pucnja.
Deskripcije MPEG-7 mogu se predstaviti na dva naina: tekstualni tipovi koji koriste opis
definicije jezika (eng. desciption definition language DDL) i binarne tokove koji koriste
binarni format za metapodatke (eng. binary format for metadata BiM) MPEG-7. To je u osnovi
DDL alat za kompresiju.
MPEG-7 specifcira primenjenu tehnologiju kroz 11 Delova:
a) Deo 1: Sistemi
Specificira alate za:
1) Transportovanje i memorisanje MPEG-7 deskripcije na efikasan nain koristei
BiM format za binarno predstavljanje;
2) Deo 2: Opis jezika po definiciji DDL
Specificira jezik kod kreiranja novih ema za deskripciju kao i za proirenje i
modifikaciju postojeih. DDL je baziran na oznaenom jeziku za proirenje (eng.
eXtensible markup language XML) koji je deo W3C. Neka proirenja za XML
su razvijena da bi se ispunili DDL zahtevi.
b) Deo 3: Vizuelni
Odreuje alate za deskripciju osnovne strukture i deskriptore ili deskripcione eme za
opis vizuelnih karakteristika i za lokalizaciju opisanih objekata na slici ili video sekvenci.
MPEG-7 vizuelni deskriptor pokriva pet osnovnih vizuelnih karakteristika koji ukljuuju
boju, teksturu, oblik, pokret i lokalizaciju (deskriptor prepoznavanja lica je takoe
definisan).
c) Deo 4: Audio
99
Specificira alate za audio deskripciju koji su organizovani kao melodija, tiina, govorni
sadraj i zvuni efekti.
d) Deo 5: eme za multimedijalnu deskripciju (eng. multimedia description schemes
MDS)
Specificira deskripcione alate koji se bave optim i multimedijalnim entitetima. Opti
entiteti su oni koji se mogu primeniti kod audio, vizuelnih i tekstualnih deskripcija pa se
mogu tretirati kao opti u svim medijima. Alati za multimedijalnu deskripciju mogu se
grupisati u est razliitih klasa prema svojoj funkcionalnosti kao to je to prikazano na
Slici 7.8.1. Prva klasa sadri deskripciju sadraja: strukturne i semantike aspekte. Druga
klasa sadri upravljanjem sadrajem: medije, korienje, kreaciju i produkciju. Treu ini
organizacija sadraja: kolekcija i modeli. etvrta klasa bavi se navigacijom i pristupom:
rezimea, varijacije i gledita. Sledi klasa koja se odnosi na korisnike: davanje prvenstva
korisnicima i poreklo primene. Najzad esta klasa bavi se bazinim elementima: tipovima
podataka i strukturama, emama razliitih alata, linkovima i lokalizacijom medija kao i
osnovnim deskripcionim emama DS.
100
102
103
druge strane bilo od vitalne vanosti. Povezanost elemenata, irina propusnog opsega i
kvalitet servisa predstavljaju vane komponente za adaptaciju okvira standarda [7.59].
f) Predstavljanje sadraja
TR za standard MPEG-21 pokazao je da sadraj moe biti:
1) Predstavljen MPEG standardima,
2) Upotrebljen od strane MPEG ali da nije pokriven MPEG standardima, na primer
puni tekst, hipertekst sa oznaenim jezikom (eng. hyper text markup language
HTML) i standardni generalizovani jezik za markiranje (eng. standard
generalized markup language SGML),
3) Prikazan pomou prethodna dva stava,
4) Predstavljen preko standarda za sezonske medije.
U TR-u se takoe kae da okvir standarda treba da podri predstavljanje sadraja. Tako je
potrebno da MPEG-21 standard podri sinhronizovani i multipleksirani medijum.
g) Izvetavanje o dogaaju
U toku rane faze izrade ovog standarda ukazala se potreba za interakcijama sa digitalnim
delovima. Naime, radilo se o tome da se standardizuju metrike i interfejsi za interakcije
koje se oekuju kod digitalnih delova. Dalje transport podataka pridruen raznim
dogaajima-saoptenjima treba standardizovati.
Ovih sedam delova - elemenata mogu se preklapati. U svakom elementu identifikovane su
oblasti standardizacije, generisani su zahtevi, a odgovarajue tehnologije odabrane su na osnovu
tih zahteva.
104
Navedeni standardi se razlikuju u pogledu bitskog protoka. Svi ovi standardi se mogu
primeniti u irokom opsegu bitskih tokova. U zavisnosti od algoritama kodovanja, oni prate
sline standardizacione okvire.
Tabela 7.10.1Neki standardi za video kodovanje
Organizacije
standarda
ITU-T
Video kodni
standard
H.261
ISO
ISO/IEC 11172-2
MPEG-1 VIDEO
ISO/IEC 13818-2
MPEG-2 VIDEO
H.263
CD 14496-2
MPEG-4 VIDEO
H.263 Verzija 2
H.26L
ISO
ITU-T
ISO
ITU-T
ITU-T
Tipian opseg
bitskog protoka
p 64 kbit/s;
p = 1, 2, 30
1.2 Mbit/s
Tipine primene
od 4 Mbit/s do 80 Mbit/s
SDTV, HDTV
PSTN VIDEOFON
Interaktivni
Audio-Video
PSTN VIDEOFON
Mrea na bazi paketskog videa
Manje od 64 kbit/s
Manje od 64 kbit/s
ISDN VIDEOFON
CD ROM
Standard H.320
ITU-T Studijska grupa (eng. Study Group SG) SG 15 razvila je sledee dve preporuke
za audio-vizuelne komunikacione sisteme u ATM okruenjima:
H.321Prilagoenje standarda H.320 za vizuelne telefonske terminale na irokopojasno
105
106
SCN) su vezani za H.323. Kombinacija mrenog prolaza kod H.323, H.323 terminala i mree
tipa LAN pojavljuje se u SCN mrei kao H.320, H.310, ili H.324 terminal.
H.323 opisuje ukupan sistem i komponente, ukljuujui terminale, mrene prolaze (eng.
gate way GW), nadzore prolaza (eng. gate keeper GK), kontrolore procesa za vie taaka i
kontrolne jedinice za vie taaka MCUs.
Zonom koju ini kolekcija svih terminala, mrenih prolaza, i kontrolnih jedinica za vie
taaka upravlja jedinstveni nadzor prolaza. Zona obuhvata najmanje jedan terminal i moe a i ne
mora, da obuhvati mrene prolaze ili kontrolnu jedinicu za vie taaka. LAN segmenti koji su
povezani primenom rutera ili drugih ureaja mogu biti u istoj zoni.
H.324 standard
107
Ovaj standard bavi se sluajevima u kojima postoji mali bitski protok i malo kodno
kanjenje. Ovde se radi o bitskim protocima od oko p 64 kbit/s, gde p varira od 1 do 30. Kodni
algoritam korien u H.261 je u osnovi hibrid kompenzacije pokreta, da bi se uklonila vremenska
suvinost, i transformacionog kodovanja DCT kako bi se redukovala prostorna suvinost. Takva
koncepcija formirala je bazu za sve standarde koji se odnose na video kodovanje. H.261 standard
je imao znaajan uticaj na mnoge postojee i ostale standarde za video kodovanje u fazi razvoja.
Digitalni video sastoji se od niza slika ili kadrova koji se odigravaju izvesnom brzinom.
Svaka slika sadri tzv. elemente slike piksele. Za standard kod video kodovanja vano je znati
dimenzije slike na koju se standard primenjuje i poloaj piksela-tela. H.261 bavi se sa dva
formata slike: zajedniki srednji format (eng. common intermediate format CIF) i etvrtni
zajedniki srednji format (eng. quarter CIF QCIF). Kod mirnih slika prema standardu H.261
koristi se etiri puta vei format. Na primer ukoliko je video format CIF, odgovarajui video
format je 4CIF.
Standard H.261 se primenjuje za video telefoniju i video konferenciju. Ovde je izvorni
materijal sastavljen od scena osoba koje govore, tzv. nizova glave i ramena osobe, pre nego
optih TV programa koji sadre dosta promena u pokretu i na sceni. Kod H.261, svaki odmerak
sadri luminentnu komponentu Y i dve hrominentne komponente oznaene sa Cb i Cr. Posebno
crna boja je predstavljena sa Y = 16, bela sa Y = 235, dok su Cb i Cr varirali izmeu 16 i 240, pri
emu 128 predstavlja sivo.
Kod standarda H.261 blok je definisan kao grupa od 8 8 pela. Jedan blok koji ine Cb
peli i jedan blok sa Cr pelima odgovara vrednosti od etiri bloka Y pela. Kolekcija ovih est
blokova predstavlja makroblok (eng. macroblock MB). Jedan makroblok sa redosledom
blokova oznaenih od 1 do 6 dat je na Slici 7.10.2. MB se tretira kao jedna jedinica u procesu
kodovanja.
108
Brojni makroblokovi grupisani zajedno predstavljaju grupu blokova (eng. group of blocks
GOB). Za H.261 GOB sadri 33 makrobloka. Rezultujue strukture za sliku u sluaju CIF
formata, kao i u sluaju formata tipa QCIF prikazane su na Slici 7.10.3 [7.68].
DCT
IDCT
+
Filter
Kompenzacija
pokreta
+
+
Filter
Kompenzacija
pokreta
Na strani dekodera, dekodovani DCT koeficijenti su inverzno DCT (eng. inverse DCT
IDCT) transformisani i zatim pridodati perthodno dekodovanoj slici sa kompenzacijom pokreta.
109
H.263+ (esto nazvan H.263 verzija 2) sadri oko 12 novih karakteristika koje ne postoje
u standardu H.263. One ukljuuju nove naine kodovanja za poboljanje efikasnosti kompresije,
110
podravanje skalabilnog bitskog protoka, nekoliko novih karakteristika koje podravaju paketske
mree, pridodatu funkcionalnost i podrku razliitim video formatima. Meu novim
karakteristikama H.263+, jedna od nekoliko koja tano istie neefikasnost opriginalne H.263
preporuke je modifikovani nain kvantizacije. Ovaj nain ima etiri kljuna elementa [7.70]:
Oznaavanje veih promena od makrobloka do makrobloka kod kvantizera kako bi se
bolje sprovodila kontrola protoka;
Sposobnost korienja finijeg hrominentnog kvantizera kako bi se bolje ouvala
hrominentna vernost;
Sposobnost da se podri celokupni opseg kvantovanih vrednosti koeficijenata pre nego da
se klipuju vrednosti vee od 128;
Eksplicitno ogranienje prilikom predstavljanja kvantovanih transformacionih
koeficijenata na one koji mogu sigurno nastati.
Najzad, H.263+ podrava iri opseg varijacija ulaznih video formata u poreenju sa
H.263. Jedna vana osobina H.263+ je korienje dodatnih informacija koje se mogu ukljuiti u
tok bita da bi se istaklo kanjenje ili da bi se pridruila informacija za spoljanu primenu.
Dodatna informacija prisutna je u bitskom protoku i kada dekoder nije u stanju da je prihvati ili
da je jasno interpretira. Drugim reima, ukoliko zahtev za obezbeivanjem traene sposobnosti
nije dogovoren unapred, dekoder moe jednostavno da odbaci bilo ta u dodatoj informaciji.
Druga uloga korienja dodatne informacije sastoji se u tome da se specificira hroma klju za
predstavljanje transparentnih i semi transparentnih piksela [7.71].
Sledea runda korienja H.263 standada dala je treu generaciju H.263 sintakse, koja se
neformalno naziva H.263++. Identifikovane su etiri kljune tehnike oblasti za dalja
istraiavanja: tip promenljive transformacije, adaptivno aritmetiko kodovanje, tabele za kodove
promenljive duine otporne na greku, kao i filtriranje za oslobaanje od pravljenja prstenova
oko slike.
H.263++ standard
111
izvesne alternacije kod kodova promenljive duine VLC kada se radi o transformacionim
koeficijentima, vektori pokreta i oblik kodovanog bloka.
H.26L standard
U pozivu za predloge, standard H.26L trebalo je da poslui za vrlo male bitske brzine, za
rad u realnom vremenu, malo kanjenje pri kodovanju od kraja do kraja veze za razliite izvore
[7.75]. Omoguena je softverska implementacija, naglaena je robustnost na greke (naroito kod
mobilnih mrea), a zastupljeni su i mehanizmi za kontrolu brzine rada. U odgovoru na poziv za
predloge za standard H.26L procenjeni su kao korisni i uzeti u obzir sledei tehniki predlozi
[7.76]:
Modifikovana metoda na bazi predikcije/transformacije,
Vektorska kvantizacija sa blok aproksimacijom koristei kodnu knjigu ili kompenzaciju
pokreta iz prethodnog kadra,
Filtriranje u kolu povratne sprege radi smanjenja bloking efekta, ugaonih ocrtavanja i
prstenastog uma,
Adaptivna skalarna kvantizacija koja koristi kodne knjige na nivou razliitom od nule,
Video koder na bazi DCT uz korienje preureivanja DCT koeficijenata,
Gruba segmentacija slina emi koja koristi kompenzaciju pokreta, vektorsku
kvantizaciju i DCT,
Deoba podataka primenom algoritma s preureivanjem podataka,
Video kodovanje koje koristi memoriju za vie referentnih kadrova slino predikciji sa
kompenzacijom pokreta.
Iz napred izloenog, proizalo je da je primarni cilj za standard H.26L to jednostavnije
video kodovanje uz postojanje to efikasnije kompresije. Uz to, u govornom domenu uveden je u
mreu paketski video (video-telefonija), kao i negovorne aplikacije (memorisanje, difuzija).
H.26L ima video kodni sloj VCL koji omoguava video prezentaciju sa velikom kompresijom,
kao i umreen sloj NAL za isporuku video sadraja preko specijalne mree. Sa H.26L VCL,
postignuto je znaajno poboljanje u pogledu efikasnosti stepena oteenja u poreenju sa
drugim standardima. H.26L NAL je razvijen sa ciljem da se transportuje video kroz razliite
mree kao to su to, na primer IP mree i beini sistemi tree generacije (eng. third generation
3G).
kanjenje za G.723.1 moe biti suvie veliko. Meutim, ukoliko je kanjenje prihvatljivo,
G.723.1 prua alternativu za G.729 sa manjom kompleksnou po cenu neznatnog pogoranja
kvaliteta.
Veliki broj govornih kodera je standardizovan. Na primer, davno u periodu 19951996
pojavila su se tri meunarodna standarda (ITU G.729, G.729 A, i G.723.1) i tri regionalna
standarda (koderi za evropske i severnoamerike mobilne sisteme). Kvalitet govora koji
proizvodi govorni koder zavisi od bitskog protoka, kompleksnosti, kanjenja i irine propusnog
opsega. Otuda, prilikom analize govornih kodera vano je uzeti u obzir sve te parametre. Bitno je
naglasiti da postoji stroga uzajamna povezanost izmeu njih. Dodatni faktori koji utiu na izbor
govornog kodera su uslovi dostupnosti i specificiranja radi specificiranja standarda. Najvei broj
govornih kodera radi sa fiksnim bitskim protokom bez obzira na ulazne karakteristike signala. S
obzirom da multimedijalni govorni koderi dele kanal sa drugim oblicima podataka, bolje je
odabrati koder sa promenljivim protokom.
Kod prikaza standarda za govorne kodere, vodi se rauna o tome da se specificiraju izrazi
za reference (eng. terms of reference ToR) pri emu se tu imaju u vidu: bitski protok,
kanjenje, kompleksnost i kvalitet.
Za G.729 standard jedan od ToR zahteva bio je da bi govorni koder trebalo da radi sa
8 kbit/s. Ovaj protok bio je izabran delimino i zbog toga to je opseg prve generacije digitalnih
celularnih standarda varirao od 6.7 kbit/s u Japanu, do 7.95 kbit/s u SAD, pa sve do 13 kbit/s u
Evropi. Za G.723.1, ToR zahtevi bili su da bi govorni koder trebalo da radi sa protokom niim
od 9.6 bit/s. Za koder za digitalni simultani glas i podatke (eng. digital simultaneous voice and
data DSVD), ToR zahtevi za bitski protok izvedeni su na osnovu koliine govornih podataka
koje treba preneti modemom od 14.4 kbit/s.
Kanjenje predstavlja glavnu razliku izmeu G.729 i G.723.1. ToR zahtev za kanjenje
za G.729, najpre za kodek u jednom pravcu bilo je 10 ms. Zatim je taj zahtev za kanjenje
sistema u jednom pravcu kod G.729 sveden na 35 ms.
Glavna primena za G.723.1 je videofonija sa malim bitskim protokom koja se obavlja sa
5 kadrova/s ili meto manje. Ovaj protok odgovara periodu video kodera od 200 ms. Kod
konane verzije G.723.1, kanjenje sistema u jednom pravcu iznosi 97.5 ms.
G.723.1 je manje kompleksan od G.729. On se karakterie sa 14.6 miliona instrukcija u
sekundi (eng. millions of instructions per second MIPS) pri bitskom protoku od 5.3 kbit/s i sa
16 MIPS-a pri bitskom protoku 6.3 kbit/s. Pri tome se koristi 2200 rei iz memorije sa sluajnim
pristupom (eng. radnom access memory RAM). Zahtevi za upotrebom DSVD kodera bili su 10
MIPS-a, 2000 rei iz RAM memorije i 10 000 rei iz memorije sa oitavanjem (eng. read-only
memory ROM).
Koderi govora predstavljeni na ovom mestu su slini. ini se da su G.723.1 i G.729A
(DVD verzija od G.729) malo manje robusni na greke nastale usled uma u pozadini i na uslove
rada u tandemu. Njihova karakteristika za ist govor i opta robusnost je dovoljna da ih ITU
preporui za primenu kod simultanog glasa i podataka kao to je to sluaj kod multimedijalnih
komunikacija sa malim bitskim protokom.
113
Ova preporuka nosi naziv Struktura kadra za 64 kbit/s do 1920 kbit/s kanal kod audiovizuelnih teleservisa [7.79]. H.221 je namenski protokol koji se odnosi na multipleksiranje za
H.320 terminale. Do 30 ISDN B kanala mogu biti zdrueni da bi se formirao superkanal sa
bitskim protokom od n 64 kbit/s. Kanali media za audio, video, i informacije o podacima su
multipleksirani u superkanalu. Za audio i video informacije, H.221 ne daje bilo kakvu kontrolu
greke, ali se zato kompletno oslanja na otpornost na greke pri kodovanju medija, to je
omogueno zbog prirode mree tipa ISDN i malih vrednosti greaka. Protokol nudi samo bitski
orijentisan, nezatieni transport servis od take do take.
ITU-T preporuka H.223
Preporuka H.225.0 opisuje naine na koje audio, video podaci, i kontrola mogu biti
zdrueni, kodovani, i paketizovani za transport izmeu H.323 terminala u sluaju
114
negarantovanog QoS ili izmeu H.323 terminala i H.323 mrenog prolaza koji moe biti
povezan sa H.320, H.324, ili H.310/321 terminalima u mreama tipa NISDN, GSTN, ili BISDN
respektivno. Ovaj mreni prolaz kao i konfiguracija terminala i procedura opisani su u H.323 i
H.225.0 protokolima i formatima u obliku poruke. Cilj H.225.0 komunikacije je izmeu H.323
terminala i H.323 mrenog prolaza po istoj mrei tipa LAN, pri emu se koristi isti transportni
protokol. H.225 koristi transportni protokol u realnom vremenu kontrolni protokol u realnom
vremenu (eng. real time transport protocol real time control protocol RTP/RTCP) za
paketizaciju strimova medija i sinhronizaciju mrea tipa LAN. Generalno govorei, H.225.0
treba da obezbedi nain za sinhronizaciju paketa kako bi se olakale transportne procedure u
LAN mreama. H.225.0 ne trai da svi mediji i kontrola budu zajedno u jednom strimu koji se
onda paketizuje.
H.225 terminali alju audio i video koristei RTP protokol kroz nepouzdane kanale kako
bi se minimiziralo kanjenje. Ponitavanje greaka moe se primeniti kako bi se prevaziao
problem izgubljenih paketa; u optem sluaju audio/video nisu preneeni jer bi to dalo kao
rezultat preterano veliko kanjenje. H.225.0 terminali alju i primaju audio i video po posebnim
transportnim adresama koristei posebne primere, kad RTP protokol dozvoljava za svaki
medijum posebno QoS i kadar. Poseban sluaj za analizu je kada su audio i video paketi
pomeani tako da ine jedinstveni kadar i kada su poslati na jednu adresu.
Protokoli za zajedniku kontrolu H.245
115
7.11 Rezime
Standardi imaju veliku ulogu u multimedijalnim komunikacijama jer omoguavaju, pre
svega, interoperabilnost izmeu hardvera i softvera. Radi se o kompromisu izmeu onoga to je
teorijski omogueno, sa jedne, i u tehnolokom smislu ostvarljivo, sa druge strane. Standardi
mogu biti uspeni samo ukoliko su dobro izbalansirani kako u tehnikom tako i ekonomskom
smislu. To je naroito znaajno u oblasti audio-video kodovanja gde postoji raznolikost u
pogledu kodnih algoritama koji mogu biti vrlo kompleksni za implementiranje. Uspeh razliitih
MPEG i ITU-T standarda zavisi od brojnih eleemenata.
MPEG je vodee telo za standardizaciju u audio-vizuelnoj tehnologiji. MPEG-1 je
namenjen za CD-ROM sa primenama pri bitskom protoku od oko 1.5 Mbit/s. Standard se
pokazao korisnim kod kompjuterski generisanih multimedijalnih podata kada su irina
propusnog opsega i kapacitet memorije ogranieni ili skupi. Standard MPEG-2 nemenjen je za
visokokvalitetno kodovanje za sve digitalne multimedijalne prenose pri protocima od 2 Mbit/s do
50 Mbit/s. Prema ovom standardu moe se proizvesti potreban kvalitet video signala sve do kue
i to za vrlo zahtevne potrebe naunih primena i biznisa. Cilj i potencijal MPEG-4 standarda
analiziran je u kontekstu audio-vizuelnih multimedijalnih komunikacionih okruenja. Pokazano
je da ovaj standard prua alatke i algoritme za kodovanje kako prirodnog tako i sintetikog audia
i videa. Od ne manjeg znaaja je svakako predstavljanje audio/vizuelnih podataka na korisnikim
terminalima i to na jedan krajnje fleksibilan nain. Standard JPEG-2000 govori o stepenu
oteenja poruka, dok subjektivni kvalitet mirne slike treba da bude bolji od onog koji su u stanju
da proizvedu do tada postojei standardi. Cilj MPEG-7 procesa standardizacije je da olaka
pretraivanje multimedijalnih podataka. Standard MPEG-21 prua audio-vizuelnu prezentaciju u
okviru multimedijalnih poruka.
ITU-T proces standardizacije u multimedijalnim komunikacijama obuhvata pre svega
video i govorno kodovanje, multipleksiranje i sinhronizaciju (H.32x, H.26x, H.22x). ITU-T
preporuka H.261 optimizirana je u smislu primene za opremu koja se odnosi na interektivnu
audio-vizuelnu komunikaciju tj. Videofon. U skladu sa H.320 serijom preporuka koristi se za
protokole, multipleksiranje i kontrolu kod mrea tipa ISDN. to se tie H.263, to je prvi
meunarodni standard za video kompresiju koji omoguava video komunikaciju sa protokom
ispod 64 Kb/s. Kada je 1996 godine standard kompletiran, postalo je oigledno da ga treba
dograivati i poboljati: ITU-T preporuka H.263 Verzija 2 (H.263+) je prvi meunarodni
standard u oblasti video kodovanja koji je tako projektovan da podri celokupan opseg mree za
komutaciju kanala i komutaciju paketa. H.263+ sadri vie novih karakteristika u oblasti video
kodovanja u odnosu na H.263. To su poboljane efikasnosti kompresije, podrka skalabilnim
116
strimovima bita kao i razliitim video formatima, poboljan kvalitet video prenosa, itd.
Aktivnosti oko standarda H.26L sastojale su se u istraivanju naprednih kodnih tehnika koje se
razlikuju od onih iz preporuke H.263.
Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
117
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
118
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
Literatura
[7.1]
[7.2]
[7.3]
[7.4]
[7.5]
[7.6]
[7.7]
[7.8]
[7.9]
[7.10]
[7.11]
I. E. G. Richardson, H.264 and MPEG-4 Video Compression. Video Coding for Nextgeneration Multimedia. Chichester, England, UK: John Wiley and Sons, 2003.
K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Multimedia Communication
Systems: Techniques, Standards and Networks. Prentice Hall, 2002.
Coding of Moving Pictures and Associated Audio at up to About 1,5 Mbit/s, ISO/IEC
11172:1991.
Information Tehnology-Generic Coding of Moving Pictures and Associated Audio
Information: Systems, ISO/IEC 13818-1:1996.
A. Puri, Video coding using the MPEG-2 compression standard, Proc. SPIE Visual
Commun. Image Processing, pp. 1701-1713, Nov. 1993.
B. Heskell, A. Puri, and A. Netraveli, Digital Video: An Introduction to MPEG-2.
Chapman and Hall, 1997.
B. L. Tseng and D. Anastassiou, Multiviewpoint video coding with MPEG-2
compatibility, IEEE Trans. Circuits Syst. Video Technol., vol. 6, pp. 414419, Aug.
1996.
T. Homma, MPEG Contribution 95/N0861: Report of the Ad Hoc Group on MPEG-2
Applications for Multi-Viewpoint Pictures, Mar. 1995.
J. Ni, T. Yang, and D. H. K. Tsang, CBR transportation of VBR MPEG-2 video traffic
for video-on-demand in ATM Networks, in IEEE Int. Conf. Communications, Dallas,
TX, Jun. 1996, pp. 13911395.
M. Orzessek and P. Sommer, ATM and MPEG-2 Integration of Digital Video Into
Broadband Networks. Upper Saddle River, NJ: Prentice Hall, PTR, 1998.
D. Milovanovi, V. Jovanovi, and Z. Bojkovi, MPEG-2 sensitivity to date loss and
effects of different packet loss patterns, WSEAS Trans. on Commun., vol. 3, pp.777
119
[7.12]
[7.13]
[7.14]
[7.15]
[7.16]
[7.17]
[7.18]
[7.19]
[7.20]
[7.21]
[7.22]
[7.23]
[7.24]
[7.25]
[7.26]
[7.27]
[7.28]
[7.29]
120
[7.30]
[7.31]
[7.32]
[7.33]
[7.34]
[7.35]
[7.36]
[7.37]
[7.38]
[7.39]
[7.40]
[7.41]
[7.42]
[7.43]
[7.44]
[7.45]
[7.46]
E. D. Sheirer, The MPEG-4 structured audio standard, in Proc. IEEE Int. Conf.
Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 38013804.
E. D. Sheirer, Y. Lee, and J. W. Yang, Synthetic audio and SNHC audio in MPEG-4,
in Advances in Multimedia: Systems, Standards and Networks, A. Puri and T. Chen,
Eds. New York, NY: Marcel Dekker, 1999.
N. Jayant, J. Johnston, and R. Safranek, Signal compression based on models of human
perception, Proc. IEEE, vol. 81, pp. 13851422, Oct. 1993.
M. Bosi et al., ISO/IEC MPEG-2 advanced audio coding, J. Audio Eng. Soc., vol. 45,
pp. 789814, Oct. 1997.
E. D. Scheirer and B. L. Vercoe, SAOL: The MPEG-4 structured audio orchestra
language, Comput. Music J., vol. 23, pp. 3551, Feb. 1999.
B. L. Vercoe, W. G. Gardner, and E. D. Scheirer, Structured audio: The creation,
transmission, and rendering of parametric sound representations, Proc. IEEE, vol. 85,
pp. 922940, May 1998.
A. Puri, H. Chen, and A. Luthra, Video coding using H.264/MPEG-4 AVC
compression standard, Signal Process.: Image Commun., vol.19, no. 9, pp. 793846,
Oct. 2004.
Z. Bojkovi and Z. Milievi, Wireless multimedia networking standards: WLAN,
WPAN, WMAN, Seminar in Signal Procesing/Communications, Electrical
Engineering Faculty, University of Texas at Arlington, UTA, Texas, USA, Apr. 2006.
K. R. Rao, Z. S. Bojkovi, and D. A. Milovanovi, Introduction to Multimedia
Communications: Applications, Middleware, Networking. Wiley, 2006.
T. Weigand, G. J. Sullivan, G. Bjontegaard, and A. Luhtra, Overview of the
H.264/AVC video coding standard, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 560576, Jul. 2003.
S. Kwon, A. Tamhankar, and K. R. Rao, Overview of H.264/MPEG-4 Part 10,
Journal of Visual Communication and Image Representation, vol. 17, no. 2, pp. 186
216, Apr. 2006.
J. Ribas-Corbera, P. A. Chou, and S. L. Regunathan, A generalized hypothetical
reference decoder for H.264/AVC, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 674687, Jul. 2003.
D. Marpe, H. Schwarz, and T. Wiegand, Contest-based adaptive binary arithmetic
coding in the H.264/AVC video compression standard, IEEE Trans. Circuits Syst.
Video Technol., vol. 13, pp. 620636, Jul. 2003.
D. Marpe, T. Wiegand, and G. J. Sullivan, The H.264/MPEG-4 advanced video coding
standard and its applications, IEEE Commun. Mag., vol. 44, no. 8, pp. 134144, Aug.
2006.
Z. Milievi and Z. Bojkovi, Kvalittet servisa u IP mreama, parametri i protokoli,
XLVII konferencija ETPAN, Zbornik radova, Sveska II, Herceg Novi, 813 juni 2003.
S. Wenger, H.264/AVC over IP, IEEE Trans. Circuits Syst. Video Technol., vol. 13,
pp. 645656, Jul. 2003.
K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages,
Applications. New York, NY: Academic Press, 1990.
121
[7.47]
[7.48]
[7.49]
[7.50]
[7.51]
[7.52]
[7.53]
[7.54]
[7.55]
[7.56]
[7.57]
[7.58]
[7.59]
[7.60]
[7.61]
[7.62]
[7.63]
[7.64]
[7.65]
[7.66]
[7.67]
[7.68]
[7.69]
[7.70]
[7.71]
[7.72]
[7.73]
[7.74]
[7.75]
[7.76]
[7.77]
[7.78]
[7.79]
[7.80]
[7.81]
123
124
125
126
Osnovni parametri kojim se karakteriu prenosni mediji su: poduno slabljenje i prenosni
kapacitet.
Prezentacioni medij je fiziko sredstvo ili ureaj pomou koga se informacije
predstavljaju korisniku, kao to su ureaji sa ekranima za prikazivanje slike i ureaji sa
zvunicima za generisanje zvuka.
Medij za prikazivanje slike karakteriu parametri za rezoluciju, kontrast i osvetljaj slike.
Medij za generisanje zvuka karakterie dinamiki i frekvencijski opseg audio pojaavaa
i zvunika.
Kroz medij cirkulie energija, materija i informacija. Komunikacije se zasnivaju na
razmeni informacija. U informaciono-komunikacionim tehnologijama, od interesa je
informacioni aspekt korienja medija.
Osnovni informaciono-komunikacioni pojmovi su: informacija, poruka, podatak,
komunikacija, signal i kodovanje.
Informacija predstavlja skup poruka.
Poruka predstvalja skup podataka.
Podatak predstavlja karakteristiku elementa, sistema, ili procesa.
Komunikacija predstavlja proces prenoenja informacija.
Prenoenje informacija se ostvaruje pomou signala.
Signal je materijalizovani nosilac informacija.
Po obliku razlikuju se analogni i digitalni signali.
Analogni signali nastaju kao neposredan odraz procesa koji generiu fiziki fenomeni i
na prijemu donose informacije u istom obliku kako ih fiziki fenomeni, iji su odraz, generiu.
Primeri analognih signala su zvuni i svetlosni talasi, odnosno zvuci koje sluamo i slike koje
gledamo. oveija ula predstavljaju prijemnike za analogne signale slike, zvuka, dodira, mirisa
i ukusa.
Digitalni signali nastaju u procesu kodovanja i prenose informacije pomou simbola
odreenog kodnog sistema.
Kodovanje je postupak simbolinog ifrovanog predstavljanja informacija pomou
elemenata odreenog brojnog sistema ili azbuke odreenog jezika.
Za memorisanje, obradu, prenos i korienje digitalnih signala koriste se sofisticirani
ureaji i sistemi.
Signali se karakteriu dinamikim, frekvencijskim i vremenskim domenom.
Dinamiki domen signala koristi se za predstavljanje snage, odnosno intenziteta signala.
Za obradu i prenos signala znaajan je raspon ili odnos maksimalnog i minimalnog intenziteta
signala to se oznaava kao dinamika signala. Od dinamike signala zavisi sa koliko bita,
osnovnih informacionih jedinica, analogni signal se koduje i prevodi u digitalni oblik.
Frekvencijski domen koristi se za predstavljanje brzine promena signala. Za obradu,
memorisanje i prenos signala znaajna je maksimalna brzina promene, odnosno maksimalna
uestanost frekvencija signala. Poveanjem maksimalne uestanosti rastu i zahtevi u pogledu
potrebnih resursa za obradu, memorisanje, i prenos signala.
Vremenski domen koristi se za predstavljanje brzine promena, trajanja pojedinih
intervala, i ukupno trajanje signala. Brzine promena povezane su sa spektrom signala, odnosno
frekvencijskim domenom. Trajanja pojedinih intervala i ukupno trajanje signala odreuje
zauzetost procesorskih, memorijskih i prenosnih resursa.
127
128
Potrebe,
Sadraj,
Propisi,
Specifikacija naruioca klijenata,
Proizvodnja ili izbor multimedijalnih komponenti teksta, slike/ grafike, audio i
video/animacije koji e najbolje preneti poruku,
Navigacija koja odreuje eljeni nain prezentacije multimedijalnog proizvoda,
Tehnoloka ogranienja: potrebe zahtevi za materijal, softver, hardver, trokovi i vreme
stvaranja, su ograniavajui inioci stvaranja multimedijalne aplikacije koje je potrebno
uzeti u obzir u procesu stvaranja,
Kontrola ispravnog funkcionisanja multimedijalnog proizvoda,
Trite,
Medij za isporuku, nain distribuiranja,
Transport, reklamiranje i odravanje podrka multimedijalnog proizvoda,
129
130
c) Definisanje cilja
Definisanje cilja koji se eli postii multimedijalnim projektom slui kao odrednica
multimedijalnoj produkciji. Kada se postavljaju ciljevi projekta, treba da budu jasno
definisani, hijerarhijski ureeni i kvantitativno formulisani. Brojne vrednosti za
prikazivanje poruke omoguavaju da se kasnijim prikupljanjem podataka moe ustanoviti
da li je konaan proizvod uspean. Ciljevi treba da budu realno dostini, to znai da se
uzimaju u obzir realne mogunosti, isplativost i trokovi proizvodnje.
d) Osnovno istraivanje
Osnovno istraivanje obuhvata prouavanje teme i tehnologije na kojoj se radi. Kreator
multimedijalnog proizvoda istraivanjem izgrauje subjektivno znanje o predmetnoj
materiji. Istraivanje moe ukljuiti susret sa ekspertima, itanje publikacije, istraivanje
na internetu, ili pogledati kako su drugi profesionalci reili sline probleme.
Proces generisanja ideje Brainstorming za stvaranje multimedijalnog proizvoda
ukljuuje i razmiljanje:
1) O emocijama kakva oseanja su povezana sa projektom na kom se radi, kojim
se vizuelnim sredstvima i sumbolima mogu izraziti;
2) O analogijama kakvim oblicima i bojama se mogu izraziti odreene emocije, ili
toplota na primer; analogije pomau da se ode dalje od originalnih rei i osmisle
konkretni vizuelni elementi za projekat;
3) O suprotnostima; ideje treba svesti na jednu, onu koja najbolje moe izraziti
ciljeve.
e) Razmatranje sadraja
Posle definisanja ideje razmatra se prototip/skica sadraja. U multimedijalnom dizajnu
prototip se moe izraditi kao: serija skica, storyboard, Powerpoint slide show, Flash
prezentacija, video koji simulira korienje sistema, kartonska simulacija, serija veb
stranica.
Skica sadraja je narativni opis sadraja multimedijalnog proizvoda, konfiguracija
istorije/prie ili poruke koja treba da se prenese korisnicima, koristei odgovarajuu
usmenu ili pismenu tehniku. Istraivane informacije se prikazuju odreenim redosledom.
Dizajnirane su da obezbede usredsreivanje na ideju ili subjekat videa.
Razvijanje teme multimedijalnog projekta ukljuuje:
1) Identifikaciju stila multimedijalnog proizvoda,
131
132
Identifikaciju sadraja koji treba da ima specijalnu dozvolu ili copyright izdanje,
Ukupan broj stranica layout-a,
Neophodne detalje za navigaciju,
Definisanje odreenih oblika interaktivnosti,
Informacije u vezi sa projektantima (dizajniranje) multimedijalnog proizvoda,
Komentare i druge korisne informacije za programere koji e da preuzmu kreiranje
multimedijalnog proizvoda.
133
mogu raditi izvrioci koji objedinjuju vie razliitih funkcija. Sledee specijalnosti se mogu
izdvojiti kao posebne:
Menader projekta oblikuje projekt u svim fazama rada, poev od trenutka programske
i urednike odluke za odreeni projekat pa do njegove potpune realizacije. Predlae i
usvaja tehnoloko-produkciona reenja realizacije projekta. Vri rediteljsku razradu
emisije i izrauje detaljnu knjigu snimanja.
Urednik osmiljava projekte i akcije, obavlja predistraivanje, istrauje, prikuplja,
stilski i anrovski klasifikuje i ureuje sadraj, uestvuje u realizaciji, koordinira rad
ekipe.
Direktor produkcije upravlja, organizuje, koordinira i kontrolie tehnoloki proces
proizvodnje.
Producent izrauje/odobrava plan proizvodnje, organizuje i finansijski vodi
proizvodnju i finalizaciju projekata, odgovoran je za budet projekta, sprovoenje
tehnikih standarda i rokove proizvodnje.
Reditelj uestvuje u oblikovanju projekta u svim fazama rada, poev od trenutka
programske i urednike odluke za odreeni projekat pa do njegove potpune realizacije,
predlae i usvaja tehnoloko-produkciona reenja realizacije projekta, uestvuje na
dramaturkoj obradi scenarija, vri rediteljsku razradu emisije i izrauje detaljnu knjigu
snimanja, vri izbor glumaca, izvoaa i drugih uesnika u projektu, rukovodi kreativnim
procesom snimanja slike i zvuka, kreativno rukovodi postprodukcijskim procesom.
Snimatelj slike u pripremnoj fazi uestvuje u utvrivanju tehniko-produkcionih uslova,
utvruje tehnike standarde snimanja slike, potrebnu tehniku i opremu za snimanje slike,
u fazi snimanja postavlja svetlosnu postavku, pozicionira kameru, snima sliku u skladu sa
produkcijskim zahtevima, utvruje sve pokrete kamere, nain i opremu za njihovo
izvoenje.
Pored navedenih za vee projekte i televizijsku produkciju postoje sledee specijalnoasti:
dizajner svetla, montaer, video-mikser, majstor zvuka, mikser zvuka, majstor slike, dizajner
video grafike i snimatelj tona.
Pisanje scripta,
Istraivanje i pisanje sadraja,
Izbor i priprema odgovarajue opreme za video snimanje: kamera, tripod, mikrofoni,
134
svetlo,
Snimanje audio i video sadraja koristei storyboard,
Montaa audio i video sadraja,
Stvaranje multimedijalnih komponenti,
Razvoj kompjuterske animacije,
Interfejs dizajn,
Grafiko oblikovanje,
Integrisanje multimedijalnih komponenti u multimedijalni proizvod (eng. authoring),
Testiranje proizvoda.
U video produkciji postoje sledee faze:
a)
b)
c)
d)
e)
136
137
Kod sofisticiranih tennikih video sistema, razvijaju se, po ugledu na modani centar za
vid, vii nivoi obrade slike. Istrauje se sadraj, semantika slike, i razvijaju sistemi za
prepoznavanje oblika. Ureaji koji transformiu optiku u elektrinu sliku pogodnu za obradu i
prenos su elektronske kamere i skeneri. To su ureaji za snimanje capture ureaji.
Optika slika kao 2D raspodela svetlosti transformie se u 2D sliku raspodele
elektronskih naelektrisanja.
Dvodimenzionalna slika raspodele elektronskih naelektrisanja transformie se u analogni
video signal.
Memorisanje slike vri se posredstvom video signala u kome su sadrane informacije o
svim elementima slike pikselima.
Kod savremenih ureaja analogni video signal transformie se u digitalni video signal
koji obrauju mikroprocesori. Slika se u digitalnom obliku memorie kao matrica u kojoj su
redovi pikseli na koordinati X, a kolone pikseli na koordinati Y.
138
PAL sistem 625/50 Hz (Evropski standard linijske promene faze (eng. phase alternating
line PAL)),
NTSC sistem 525/60 Hz (Ameriki standard nacionalnog komiteta za televizijski sistem
(eng. National Television System Committee NTSC))
HDTV . Televizija visokokog kvaliteta definicije (eng. high-definition television
HDTV) postoji vie varijanti. Osnovne su dve: 1125 /60 Hz i 1250/50 Hz, ali obzirom na
digitalnost fleksibilan je i razvijaju se nove verzije sa znatno veim brojem linija.
139
140
141
mestu slike. Opseg moguih vrednosti intenziteta svetlosti je odreen brojem kvantizacionih
nivoa brojem nivoa sivog, zavisno od broja bita po pikselu.
Hromatska slika predstavlja se sa tri 2D matrice (crvena, zelena i plava) gde su
reprezentovane vrednosti odbiraka na koordinatama X i Y koje odgovaraju vrednostima
intenziteta boje na odreenom mestu slike.
Rezolucija slike, kao osnovni parametar bitmapirane slike, predstavlja meru sa kolikom
finoom digitalna slika, sa konanim brojem piksela, aproksimira kontinualnu sliku. Kvalitet
slike zavisi od broja piksela prostorne rezolucije i broja kvantizacionih nivoa nijansi.
Geometrijske promene u bitmapiranoj slici vre se transformacijama za rekonstrukciju
slike iz jednog oblika u drugi. To je ekvivalentno transformaciji u analogni video signal i
ponovno odabiranje pri emu se koriste metode interpolacije.
Rezolucija za tampae i skenere izraava se brojem taaka po jedinici duine (eng. dots
per inch dpi).
Rezolucija tampaa se definie brojem linija po inu. Rezolucija tampai je 600 dpi do
1200 dpi, a najbolji do 2700 dpi. tampai u boji mogu imati rezoluciju ak i 1200 taaka po
inu, to ne znai da se tako velika rezolucija koristi za tampanje svih fotografija. asopisi u
boji koriste rezoluciju od 137 linija po inu, dok se u knjigama najvie upotrebljavaju rezolucije
od 150 taaka po inu. tampai u boji koriste etiri do est osnovnih boja. Rasterska elija
tampaa u boji sadri osnovne boje i definie veliinu piksela kolor slike.
Rezolucija skenera odreuje sa kolikom finoom e raster slike biti iskorien da
reprezentuje datu sliku. Bitmapirana slika e imati vie detalja ako je vei dpi skenera. Tipian
opseg vrednosti rezolucije skenera je oko 300 dpi do 3600 dpi i vie. Veliina rezolucije za
skeniranje bitmapirane slike zavisi od toga za koju je namenu planirana slika: da li e se slika
tampati, da li je slika planirana za prikazivanje na monitoru, ili za veb prezentaciju. Fotografije
u asopisima reprodukovane su sa oko 200 dpi do 300 dpi. Ako se planira skeniranje slike iz
asopisa i slanje na veb, skeniranje se moe izvriti sa rezolucijom od 72 dpi.
Dubina boje (eng. bit depth) je broj bita koji se dodeljuje svakoj taki i koristi se za opis
boje. Sa veom vrednosti bit depth skener je u mogunosti da odabira vie boja, to omoguava
vei raspon u promeni kontrasta (eng. contrast) i sjajnosti (eng. brightness) bitmapirane slike. Da
bi se formirala true colour skeneru je potrebno 24 bit depth, znai da se dodeljuje po 8 bita za
crevenu, plavu i zelenu boju za svaku taku piksel. U tom sluaju ukupan broj moguih boja je
28 28 28 = 256 256 256 = 16 777 216 16.7 miliona boja.
Rezolucija bitmapiranih slika na televizijskim ekranima i raunarskih monitora izraava
se brojem piksela u slici. Primeri slika sa visokom i niskom rezolucijom dati su na Slici 8.3.4.1.
Nezavisno od veliine ekrana, televizijska slika se prikazuje pomou istog broja piksela i
to:
PAL standard: 720 576 piksela,
NTSC standard: 640 480 piksela,
HDTV standard: 1280 720 piksela.
Rezolucija slike raunarskih monitora moe biti:
VGA standard (video grafika kartica niz (eng. video graphics array VGA)):
640 480 pixela,
SVGA standard (super video grafika kartica niz (eng. super video graphics array
142
143
pravih i krivih linija i oblika. Vektorska aritmetika ili analitika geometrija glavni je matematiki
aparat koji se koristi pri proraunu vrednosti piksela. Sa operativnog aspekta, vektorska grafika
predstavlja niz komandi kojima se ostvaruje generisanje i transformacije raznih geometrijskih
oblika. Prilikom prikazivanja vektorske grafike na ekranu, odvija se proces renderovanja.
Prikazivanje vektorskih slika renderovanje zahteva prethodni proraun za generisanje vrednosti
piksela.
Osnovni elementi za formiranje vektorskih slika su:
Jednostavnije su za editovanje,
Lake se pamte jer se percepcija mozga zasniva na pamenju osnovnih karakteristika
slike, kontura, engrama,
Pogodnije su za internet,
Reprezentacija vektorskih slika je kompaktna, skalabilna, nezavisna od rezolucije ekrana
to nije sluaj sa bitmapiranom slikom,
Uveanje objekta i pribliavanje ne izaziva smanjenje rezolucije detalja i gubitka na
kvalitetu,
Informacije o transformacijama i procedurama se pamte to omoguava da se mogu
kasnije menjati; to znai da pomeranje, skaliranje, rotiranje, popunjavanje, ili neka druga
geometrijska transformacija ne smanjuju kvalitet crtea kao kod bitmapirane slike.
Zbog istih i otrih prelaza izmeu boja, vektorskom grafikom se ne mogu prikazati
fotorealistine slike, fotografije.
145
Bitmapa
57 KB
581 KB
2000 MB
Vektorski
zapis
36KB
36KB
36KB
Filmske tehnike
Video tehnike
Tehnike animacije
146
Filmska tehnika predstavlja proizvodnju pokretnih slika pomou celuloidne trake, tako
to se u procesu snimanja slike pokretnih i promenljivih objekata projektuju na filmsku traku, a u
procesu reprodukcije slike sa filmske trake projektuju se na ekran. Prenos slike na filmsku traku,
u toku snimanja, kao i prenos slike sa filmske trake, u toku prikazivanja, ostvaruje se
projekcijom pomou svetlosnih zraka.
U toku postprodukcije, sa filmom je mogua takozvana linearna montaa, koja se svodi
na nadovezivanje i lepljenje filmske trake.
Dimenzije filma su standardizovane. Filmski formati za irinu trake su: 8 mm, 16 mm, 32
mm.
Fuziona frekvenca kod filma iznosi 24 slike u sekundi sa po dva prosvetljavanja, to za
smanjenje treptanja daje efekat kao da je 48 slika.
Prednost filmske tehnike je visoka rezolucija slike.
Nedostatak filmske tehnike je nemogunost kontrole snimka u realnom vremenu.
Video tehnika, odnosno video, predstavlja elektronsko snimanje, obradu i reprodukciju
niza slika koje se sukcesivno smenjuju. Kod reprodukcije niza slika sa razliitim sadrajem, koje
se smenjuju dovoljno brzo da vizuelna percepcija ne uspeva da prati sadraje svake slike
pojedinano, ve da ih povezuje u kontinuitet, stvara se doivljaj promena odnosno pokreta u
sadraju posmatrane video slike.
Video tehnika omoguava da se optike slike pomou fotoelektrinog efekta transformiu
u elektrine slike, a zatim linijskom analizom se pikseli elektrine slike sukcesivno transformiu
u video signal. Iz video signala sukcesivnom linijskom sintezom reprodukuju se slike na ekranu
monitora ili na bioskopskom ekranu pomou video projektora.
Jedna video slika se naziva frejm (eng. frame). U televizijskom sistemu jedan frejm
sastavlja se ispisivanjem linija dve poluslike koje se zovu fild (eng. field) sistemom ueljavanja
sa proredom (eng. interlaced), sa parnim i neparnim linijama. Kod raunarskih video monitora,
za razliku od ispisivanja sa proredom, ispisivanje slike moe da bude progresivno (eng.
progressive) ispisivanje, odnosno skeniranje (eng. scan), to znai linija za linijom. Prikazivanje
pomou poluslika, slino dvostrukom prosvetljavanju svake pojedinane slike kod filma, vri se
zbog smanjenja efekta treptanja video slike.
U televizijskom PAL sistemu uestanost sukcesivnog smenjivanja slika je 25 frejma u
sekundi (eng. frames per second). Veliina jedne slike je 576 linija 720 kolona.
U televizijskom sistemu NTSC uestanost je 30 frejma u sekundi. Veliina jedne slike je
480 linija 720 kolona.
U HDTV veliina jedne slike je u granicama od 720 linija 1280 kolona do 1080 linija
1920 kolona.
Obrada slike u video tehnici moe biti prostorna, vremenska i prostorno vremenska.
Prostorna obrada video slike vri se pojedinano unutar slike i sastoji se od otklanjanja
uma u slici, izdvajanja ivica i poboljanja kvaliteta slike.
Vremenska obrada video slike podrazumeva obradu piksela u slici u vie uzastopnih
vremenskih trenutaka i vri se u cilju detekcije i estimacije pokreta i vremenskog filtriranja.
Prostorno vremenska obrada video slike omoguava transformaciju formata slike kao
to je video skaliranje 4:3 slike u 16:9 sliku.
U procesu snimanja vri se opto elektrina, a u procesu reprodukcije elektro optika
transformacija slike. Konverzija povrinske slike u video signal obavlja se postupkom prostorno
147
Raunarski video sistemi nisu zavisni od TV standarda, broj kadrova se moe podeavati.
Za internet broj kadrova za prenos smanjuje se na (12 do 15) kadrova u sekundi, jer se na
prijemu mogu interpolirati meukadrovi i poveati brzina osveavanja ekrana.
Potrebni kapaciteti memorije i prenosnih kanala za tekst, sliku, zvuk i video znatno se
razlikuju.
Tekst jedna stranica sa 80 slova po liniji i 64 linije po stranici zahteva:
80 slova po liniji 64 linije 1 stranica 8 bita po slovu = 40 960 bita = 41 kbit/stranici.
Slika 24 bita po pikselu, 512 512 piksela, zahteva: 512 512 piksela 24 bita po
pikselu = 6 Mbit/slici.
Zvuk CD kvalitet odabiranja 44.1 kHz i 16 bita po odmerku zahteva za mono:
44 100 odmeraka/s 16 bita/odmerku = 706 kbit/s, i za stereo 1412 kbit/s.
Videokadar 360 240 piksela, kodovanih sa 24 bita po pikselu, 30 kadrova u sekundi
zahteva: 360 240 piksela 24 bita po pikselu 30 kadrova u sekundi = 60 Mbit/s.
Zvuk i slika u originalnom obliku teko bi se memorisali i prenosili.
Za memorisanje i prenos audio i video signala neminovna je potreba za kompresijom
signala zvuka i slike.
Kompresija signala zvuka i slike detaljno je obraena u okviru sedmog poglavlja ove
knjige Standardi u multimedijalnim komunikacijama.
148
149
8.4.2 Font
Font je izraz koji se u tipografiji koristio za skup slova jedne veliine i jednog tipa, a u
multimedijalnim tehnologijama font oznaava fajl sa glifovima i slovnim ornamentima. Font
predstavlja jednu odreenu familiju glifova.
Glif je izraz za aru, grafiki oblik i sliicu, a u multimedijalnim tehnologijama glif
oznaava spoljanji lik sa kojim se prezentira karakter.
Tekst se sastoji od nizova karaktera koji se u raunaru memoriu kao binarni kodovi
odreenog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali, kodovi karaktera
se povezuju sa glifovima smetenim u glifovskim datotekama fontovima. Datoteke glifova,
odnosno fontovi, razlikuju se po stilu, dizajnu i nainu memorisanja glifova.
Glifovi predstavljaju sliice i formiraju se, kao i slike, pomou bitmapirane ili vektorske
grafike. Nain formiranja glifova uzima se kao osnova za klasifikaciju fontova koji predstavljaju
zbirku glifova.
Fontovi se, na osnovu naina formiranja glifova, dele na bitmapirane i vektorske.
Bitmapirani Bitmap ili rasterski fontovi sastavljeni su od niza taaka, piksela, pomou
kojih se prikazuje slika karaktera. Prednost ovih fontova je to se brzo oitavaju, a nedostatak to
nisu skalabilni, jer je za svaku veliinu potrebno imati poseban skup fontova.
Bitmapirani fontovi pokazuju iste karakteristike kao i bitmapirane slike klasinih formata:
.bmp bitska mapa (eng. bitmap), .png pokretna mrena grafika (eng. portable network
graphics), i .tif format oznaene slike (eng. tagged image format) ili .tiff format dat. oznaene
slike (eng. tagged image file format). Svaka platforma poseduje sopstveni format bitmapiranih
fontova, najee poboljan na neki nain, da bi efikasno radio sa rutinama sistemskog softvera
koje obrauju prikazivanje teksta.
Konturni (eng. outline) ili vektorski fontovi sadre skup instrukcija, pomou kojih se
iscrtava glif kao vizuelna predstava karaktera. Velika im je prednost to su skalabilni, odnosno,
mogu menjati veliinu. Promena veliine glifa ne utie na njegovu rezoluciju, tako da se moe
koristiti samo jedan tip datog fonta.
Konturni fontovi grade se po pravilima vektorske grafike od krivih i pravih linija, i
obino su smeteni u formate za vie platformi. Dva najee koriena formata su Adobe Type
1, koji se esto jednostavno naziva PostScript font, iako postoji jo drugih PostScript fontova, i
TrueType.
150
TrueType font originalno je uveden od strane Apple-a, ali ga vie koristi Windows nego
Macintosh operativni sistem (eng. operating system OS)) Mac OS, kod koga se zbog
popularnosti Adobe vie koristi Type 1.
Konturni fontovi mogu biti proizvoljno skalirani i isti font moe biti korien za
prikazivanje na niskoj rezoluciji ili tampanje na jako visokoj. Program za prikazivanje moe da
prevodi konturne fontove bilo koje veliine. Program Adobe Type Manager (ATM) obavlja ovu
funkciju na sistemskom nivou za Type 1 fontove.
Konturni fontovi u bilo kom od popularnih formata mogu sadrati do 256 glifova. Glifovi
u Type 1 fontu jednostavno su mali programi, napisani u ogranienom podskupu PostScripta.
Ogranienja su namenjena da uine moguim da glifovi budu efikasno prikazani na ekranu,
programima kao to je ATM, u dovoljnom kvalitetu kada se prikau na rezoluciji ekrana.
TrueType je alternativni format. Konturni karakter u TrueType fontu uva se kao serija
taaka koje definiu linije i krive inei njihov oblik.
Novorazvijeni format OpenType ujedinjuje Type 1 i TrueType fontove, obezbeujui
format fajla koji omoguava da bilo koja vrsta konturnih fontova bude sauvana. OpenType su
razvili Adobe i Microsoft zajedno 19978 godine, a pojavio se 1998 i Type 3 format.
Postoji i format Type 0 u kome elementi fonta nisu glifovi karaktera, ve drugi fontovi.
Type 0 font namenjen je za uvanje kombinovanih fontova, od kojih je svaki sastavljen od
nekoliko Type 1 fontova. Njegova glavna namena je da obezbedi veliki repertoar karaktera, koji
bi bili potrebni za korienje u saradnji sa Unicode-om.
Type 1 i TrueType sadre, pored opisa glifova, i informacije koje mogu biti iskoriene
od strane programa za prikazivanje, da bi se poboljao izgled teksta na niskim rezolucijama. Ove
informacije odnose se na izuzetno fine osobine, koje mogu izgubiti svoju finou kada se manje
piksela koristi za svaku liniju. U Type 1 fontovima nalaze se u obliku saveta (eng. hints), koji
obezbeuju vrednosti i parametre koji mogu biti iskorieni da upravljaju prikazivanjem glifova
na niskim rezolucijama. Na primer, saveti su namenjeni da izazovu smanjenje prelaza. Kao to
smo pomenuli, prelaz normalno pomae da se pobolja propisani izgled fonta. Kako bilo, na
niskim rezolucijama, kada se veliina prelaza zaokrui na najblii piksel, efekat moe biti
preteran i tekst e izgledati nepravilnije nego to bi izgledao da mala slova budu tano visine h.
Taka na kojoj e se ukljuiti smanjenje prelaza direktno zavisi od dizajna fonta, pa ne moe biti
ukljuena bez informacija koje prua sam dizajner fonta. Saveti Type 1 fontova omoguavaju
distribuciju ovih informacija. Ostali saveti srazmerno smanjuju varijacije u osnovi fonta, koje e
iako estetski ugodne na velikim rezolucijama, izgledati u najmanju ruku nejednako na niskim
rezolucijama.
151
Problem povratka iz pisanog teksta u memoriju kodova karaktera javlja se zato to je kod
karaktera jedinstven i zauzima manje bita, dok je njegova grafika predstava glif sloenija i
zauzima vie memorije. Niz kodova karaktera kompaktniji je od niza glifova koji predstavljaju
isti tekst, pa zamena karakter kodova glifovima uveava veliinu fajla koji sadri tekst.
Grafiki prikaz teksta neefikasan je za pretraivanje i zbog toga to ne koristi ponavljajuu
prirodu teksta. Isti karakter, odnosno glif, viestruko e se ponavljati, pa ako je izvren prelaz u
glifove, mnogo kopija istog glifa e biti korieno, a svaki e biti mnogo vei nego odgovarajui
kd karaktera.
Vraanje u kod karaktere iz prikazivanog teksta moe da se ostvari na posredan nain,
pomou specijalizovanog raunarskog programa. Ako je stranica odtampana pa tekst skeniran,
rezultat je bitmapirana slika teksta. Do karaktera skeniranog teksta moe se doi pomou
specijalizovanog programa za optiko prepoznavanje znakova (eng. optical character
recognition OCR) koji analizira oblike na bitmapiranoj slici i prepoznaje koje karaktere ti
oblici predstavljaju. Ne postoji potpuna uspenost prepoznavanja ali je primena ovog programa
veoma zahvalna naroito kod digitalizacije papirnih izdanja.
Za sigurnu reprodukciju karaktera kod razmene tekstualnih dokumenata, naroito u
sluaju ree korienih fontova, postoji mogunost da se korieni font ugnezdi i alje zajedno sa
dokumentom. To poveava veliinu fajla ali obezbeuje sigurnost repliciranja.
152
Svako slovo ima svoj prihvatni prostor (eng. bounding box) koji je u stvari najmanji
prostor koji moe da obuhvati to slovo. Najee se ostavlja mali razmak meu prihvatnim
prostorima susednih karaktera. Drugim reima kada crtamo glif neposredno pored drugog,
prazan prostor se umee blizu glifa, i nalazi se van prihvatnog prostora, najee levo, na
razmaku koji je poznat kao nosa leve strane (eng. left side bearing), to je prikazano na Slici
8.4.4.1-b. Ponekad, kada se dva odreena slova smeste jedno pored drugog, prostor meu njima
izgleda premali ili preveliki. Postoji mogunost podeavanja letter spacing.
Veliine koje opisuju veliinu pojedinog karaktera i razmak meu karakterima, zajedno
su poznate kao metrika fonta. Programi koji obavljaju slovoslaganje, zahtevaju pristup metrici
fonta da bi odredili gde tano da smeste glif dok prave linije, pasuse i stranice. Organizacija ovih
informacija zavisi od formata fonta, raunarskog sistema i slovoslagakog softvera koji se
koristi.
Tip fonta predstavlja dizajn sa kojim su uraeni glifovi koji pripadaju odreenom fontu.
Razvijen je veliki broj razliitih tipova fontova. Ne postoji jedinstvena klasifikacija tipova
fontova.
Najosnovnija podela fontova po tipu je na fontove fiksne veliine jednomesne i
proporcionalne fontove.
Fontovi fiksne veliine sadre glifove koji za svaki karakter horizontalno zauzima
jednaku veliinu prostora, nezavisno od svoje veliine. Neka slova imaju, oko sebe, vie praznog
mesta od drugih. Na primer, uski oblik malog slova j ima oko sebe onoliko praznog prostora
koliko je potrebno da se popuni irina malog slova .
Proporcionalni fontovi sadre glifove koji za svaki karakter zauzimaju onoliko mesta
kolika je irina slova. Na primer, slovo zauzima vie mesta od slova j. Pokazalo se da tekst sa
proporcionalnim fontovima izgleda skladnije i laki je za itanje, u veini sluajeva. Osim toga,
vie rei staje u redovima.
153
Slika 8.4.4.2Serifi
Opta je mogunost ispisivanja slova sa vertikalnim linijama, ili koso sa italik fontom.
Italik fontovi imitiraju glifove sa slovima nagnutim na desnu stranu, ime se imitira
odreeni stil pisanja. Veina italik fontova su ili parnjaci, ili razliite varijante uspravnih fontova.
Na primer, Times italik je italik verzija fonta Times Roman. Postoje, ipak, neki italik fontovi koji
imaj svoj sopstveni dizajn, koji su obino dizajnirani da imaju izgled rukopisa, i koriste se kada
je potreban lepi, humaniji izgled od obinog kucanog teksta.
Postoje konturni fontovi koji imaju uplja slova i fontovi koji bacaju senku.
Razvijeni su fontovi koji izgledaju malo horizontalno spljoteni, kada se uporede sa
proporcijama veine fontova. Nazivaju se skraeni fontovi, i namenjeni su prilozima, kao to
su poruke na marginama ili uske novinske rubrike, gde se zahteva da tekst bude upakovan na to
manje prostora. Za razliku od ovih, fontovi koji se nazivaju proireni izgledaju horizontalno
razvueni, to ih ini pogodnijim za naslove i druge izolovane tekstualne elemente.
Fontovi se mogu klasifikovati prema teini, to jest, prema debljini crta koje ine slova.
Deblje crte ine da tekst izgleda tamnije i vre. Po konvenciji, ovi fontovi se nazivaju tekim
(debljih crta), boldfejs ili jednostavno bold. Kao i italik, bold fontovi su obino verzije fontova sa
manjom teinom. Rezultat toga je da teina nije apsolutna osobina, bold teina nekog jako lakog
fonta moe biti laka od obine teine nekog jako tekog fonta, ija bi bold verzija bila jo tea.
Neki od fontova mogu postojati u vie varijanti, predstavljajui razliite stepene teine. Pod
ovim okolnostima, pojedini stilovi se opisuju terminima kao to su: ultra-bold, semi-bold, laki i
ultra-laki.
Tekst procesori esto tretiraju podvlaenje kao stilsku opciju slinu italik ili boldu, pa se
moe pretpostaviti da su i to, takoe, podvuene verzije fontova. Podvueni fontovi veoma su
retki, jer se u tipografskim krugovima smatra da su loa zamena italizacije, pogodna samo za
slovoslagae koji nemaju italik-opciju. Kao i veina tipografske rutine, i nepoeljnost
podvlaenja je dovedena u pitanje. Poto se raznovrsniji efekti mogu postii kombinovanjem
obinih fontova sa linijama razliitih debljina, ovo preispitivanje nije dovelo do ekspanzije u
korienju podvuenih fontova.
8.5 Animacija
Animirati znai oiveti, pokrenuti, udahnuti duu (eng. to animate to get thing alive, to
make them change).
154
155
156
157
158
prikazati razni oblici promena i realizovati niz slika sa kojima se stvara iluzija kretanja. Za
animaciju vektorskim slikama razvijeni su specijalizovani softverski alati kao to je iroko
primenjivani Macromedia Flash.
Animacija bitmapiranim slikama izvodi se zahvaljujui mogunostima da se
bitmapirana, kao i vektorska slika, moe pomerati, rotirati i skalirati i na taj nain uticati na
karakteristike slike, kao to je srazmera, ugao i veliina ime se moe formirati niz za animaciju.
Algoritmi za navedene operacije drugaiji su, i vreme izvrenja je due nego u sluaju vektorskih
slika. Program After Efect je softverski alat za kreiranje animacije sa bitmapitanim slikama.
Za jednostavnije animacije popularna su dva postupka pod nazivom grafiki fajl format
za razmenu (eng. graphics interchange format GIF) i Sprajt animacija.
GIF fajl format jedan je od dva najee koriena raunarska grafika formata za
razmenu slika koji se moe koristiti za kreiranje malih animacija sa niom rezolucijom i paletom
od 256 boja.
GIF fajl format se koristi da bi se sauvala sekvenca slika. GIF89 fajl format moe da
kontrolie ponaanje animacije, npr. ponavljanje odreeni broj puta ili neogranieno, minimalno
kanjenje izmeu frejmova. Nedostaci su to se ne moe dodati zvuk i ogranienje na paletu od
256 boja. Ovo ogranienje se moe prevazii korienjem QuickTime video formata koji moe
da se menja, kombinuje sa drugim klipovima, pa ak i da mu se dodaju efekti.
Sprajt - sprite animacija je animacija na raunarima koja se zasniva na objektima koji se
pomeraju. Sloen pokret moe se dobiti dodeljivanjem vie slika jednom sprajtu. Sprajt
animacija se najee koristi za simulaciju hodanja kod ljudskih slika, to je prikazano na Slici
8.5.2.2, za kreiranje 2D video igrica, za razliite tipove simulacija, kao i za same prezentacije na
internetu.Vrednosti koje se menjaju pri pomeranju objekta proraunava kompjuter.
159
160
i rukavice, koje su osetljive na pomeranje ruke. Visoka cena opreme ograniila je njeno
korienje na simulacije letenja i industrijske simulacije.
Za programiranje distribucije multimedijalnih proizvoda sa virtuelnom realnou preko
interneta koristi se jezik modelovanja virtualne realnosti (eng. virtual reality modeling language
VRML). VRML je bio jezik zasnovan na tekstu, koji je omoguavao da 3D objekti i scene
budu opisani u programskom jeziku. Poboljane verzije su VRML 1.0 i VRML 2.0.
VRML omoguava specifikaciju objekata, odnosno njihove geometrije i materijala od
koga su sastavljeni. Razliite teksture mogu biti primenjene na povrine objekta, koji e se
postaviti u 3D prostor. Scene mogu biti napravljene u uobiajenim tekstualnim editorima, ili u
programima za 3D modelovanje i osvetljene na razliite naine.
Objekti u VRML fajlu nazivaju se vorovi nodovi. Kada su ureeni hijerarhijski,
nodovi predstavljaju graf scene. Svaki VRML svet, bez obzira koliko jednostavan, predstavlja
graf scene. Graf scene sadri nodove koji opisuju objekte i njihove osobine. On sadri
hijerarhijski grupisanu geometriju da bi obezbedio audio-vizuelnu reprezentaciju objekata, kao i
uee nodova u generisanju dogaaja i mehanizmu rutiranja. Zajedniki efekat nodova u grafu
scene naziva se stanje (eng. state). Oblik noda pridruuje geometriju noda nodovima koji
definiu dati geometrijski izgled. Oblik noda bie deo transformisane hijerarhije koja ima vidljiv
rezultat, a sadraj transformisane hijerarhije bie oblik noda za neku vidljivu geometriju.
Grupisanje nodova ima polja koja sadre listu dece nodova. Svako grupisanje noda definie
koordinatan prostor za njegovu decu. Ovaj koordinatni prostor relativan je u odnosu na
koordinatan prostor noda ije je dete grupisani nod. Takav nod zove se roditelj nod. Ovo znai da
transformacija akumulira nii graf scene u hijerarhiji.
161
162
Opipljiva, dodirna percepcija (eng. tactile perception) prima informacije preko kone
senzitivnosti kada se ovek ne kree. Dodir je senzorska stimulacija koju osoba osea
kada neto dolazi u dodir sa koom. Izaziva nekoliko tipova oseaja: temperature,
vibracija, teksture.
Percepcija pokreta (eng. kinaesthetic sense) je svest pokreta, pozicije i orijentacije delova
ljudskog tela.
Oseaj pokreta moe biti rezultat akcije oveka aktivni dodir, koji ukljuuje signale
koje mozak alje u miie, ili moe biti od sila izvan tela pasivni dodir.
Aktivna haptic percepcija, kada se uzimaju informacije o objektu izvan tela, glavna je
informacija oseaja koja se pridruuje interfejsu dodira.
Interfejsi dodira su ureaji koji mere kretanje i obezbeuju pobudu senzora od
korisnikih ruku i prstiju. Interfejs dodira daje informacije kompjuteru zasnovane na poziciji
ureaja i stimuliu korisnikov oseaj dodira snabdevanjem izlaza u formi sile povratne sprege i
dodira. Interfejsi dodira omoguavaju korisniku da dodirne, oseti, manipulie, stvara ili menja, sa
njegovim rukama ili prstima, objekte prisutne na displeju raunara, kao da su oni realni fiziki
objekti. To je ostvareno paljivim merenjem sile koju bi neko oseao kada dodirne realan
objekat. Prezentovanjem tih sila korisniku, korienjem sile povratne sprege i dodirne
sposobnosti displeja heptik ureaja, stvara se iluzija dodirivanja objekta.
Nain ostvarivanja komunikacije preko taktilnog ekrana prikazan je na Slici 8.7.1.
Primena heptik tehnologije kod mobilnih telefona prikazana je na Slici 8.7.2.
Interfejsi dodira, na osnovu interakcije izmeu korisnika i maine, mogu se klasifikivati
kao:
163
Spoljanji skelet (eng. exoskeletal): prati kretanje ramena, ili ak celog tela,
dozvoljavajui visoku interaktivnost, ali i ekstremno visoke cene. Te maine se koriste u
medicini, za ljude sa nekim nemogunostima, u vojsci.
Sutinski pasivni ureaji (eng. inherently passive devices) ili inteligentni pomoni ureaji
(eng. intelligent assist devices): pasivni roboti za direktnu fiziku interakciju sa ovekom
operatorom.
164
165
Elektronski nos za analizu mirisa se sastoji od tri dela: sistema uzoraka (eng. sampling
system), detekcionog sistema (eng. detection system), sistema prikupljanja podataka (eng. data
acquisition) i sistema za obradu (eng. processing system).
Molekuli gasa interaguju sa senzorima vrstog stanja, sa tanjim ili debljim filmom od
senzorskog materijala, absorbcijom, adsorbcijom ili hemijskim reakcijama. Senzorski ureaj
detektuje fizike i/ili hemijske promene nastale tim procesima i te promene se mere kao jedan
elektrini signal.
166
167
Kompjuter, kao jedan elektronski sistem, generie odzive preko izlaznih ureaja u
interfejsu, koju su perceptibilni za oveka. To su virtuelni odzivi jer oni nisu stvarno tu, ali mogu
biti perceptovani.
Multimodalni interfejsi omoguavaju korisniku da uje, vidi i osea virtuelni svet.
Audio-vizuelni multimedijalni tipovi podataka mogu biti: diskretni ili statini podaci i
kontinualni ili dinamiki podaci.
Diskretni podaci su oni koji ne zavise od vremenske ose: tekst, grafika i slike.
Kontinualni podaci audio i video zavise od vremenske ose, kompleksniji su od diskretnih
podataka, upotrebljavaju mnogo bolje kompresione i dekompresione algoritme i sofisticirane
operacije za njihovu interpretaciju i manipulaciju.
Generisani mediji su razliite vrste kompjuterski generisanih prezentacija, kao to su
animacija i muzika. Kada su memorisani u audio i video fajlove, nema razlike u odnosu na audio
i video podatke. Ako su generisani u realnom vremenu koristei specifine ureaje i instrumente,
tretiraju se kao posebni mediji. Generisani mediji zasnovani su na interakciji ovek kompjuter
zbog ega se oznaavaju kao interaktivni mediji.
8.10 Rezime
Sa aplikativnog aspekta, multimedija je informaciono-komunikacioni proizvod
raunarskih tehnologija koji pomou integrisanih hardversih i softverskih ureaja prikazuju
pojave za ulo vida, sluha i dodira, a u novije vreme i za ulo mirisa.
Multimedijalna delatnost predstavlja multidisciplinarnu oblast koja obuhvata razne
tehniko-tehnoloke, ekonomske, socioloke i umetnike postupke.
Proces stvaranja multimedijalnog dela zapoinje definisanjem projektnog zadatka
kojim se izraavaju potrebe, postavljaju ciljevi i definiu ogranienja.
Karakteristine su tri faze u realizaciji projekata iz oblasti multimedija: preprodukcija,
produkcija i postprodukcija.
Multimedijalna preprodukcija predstavlja prvu fazu realizacije projekta u kojoj se
razrauju zahtevi naruioca, definiu ciljevi, analizira interesna grupa, postavljaju zadaci,
odreuje anr, vrsta medija, sadrina proizvoda, sastavlja detaljan pregledan plan, najee u
vidu ilustrovane prie koja je, zbog veanja na tablu, nazvana storibord.
Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se
neposredno formira sadraj koji e se ugraivati u proizvod. Zavisno od kompleksnosti
proizvoda koristi se raunar, kamera, glumci, kostimi, studio i scenografija.
Multimedijalna postprodukcija predstavlja zavrnu fazu realizacije projekta u kojoj se
formira konana verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija
se svodi na urednitvo, editing. Kad se radi sa zvukom i pokretnim slikama onda je to montaa.
Prostor i vreme su fizike veliine koje imaju presudnu ulogu u svim fazama realizacije
multimedijalnog projekta.
Angaovani multimedijalni resursi definiu se na osnovu prostornih i vremenskih
parametara informacionih sadraja multimedijalnog proizvoda.
Prostorni domen informacionih sadraja odreuje potrebnu veliinu, odnosno kapacitet
memorijskih resursa.
Vremenski domen informacionih sadraja odreuje zahtevanu propusnu mo, odnosno
kapacitet prenosnih resursa komunikacionog sistema.
168
169
Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
ta je projektni zadatak?
ta je multimedijalna preprodukcija?
ta je multimedijalna produkcija?
ta je multimedijalna postprodukcija?
ta je prethodna analiza u preprodukciji?
ta je storibord?
ta predstavlja slika u multimediji?
ta su primarne boje?
ta su sekundarne boje?
ta su tercijarne boje?
ta predstavlja aditivno meanje boja?
ta predstavlja subtraktivno meanje boja?
Iz ega se sastoji elektronska kamera?
ta predstavlja bitmapirana slika?
ta predstavlja rezolucija slike?
ta je vektorski generisana slika?
170
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
Literatura
[8.1]
[8.2]
[8.3]
[8.4]
[8.5]
[8.6]
[8.7]
[8.8]
[8.9]
[8.10]
[8.11]
H. Harrison, T. Loveland, V. Deaton, and K. Squibb, Film technology, in The TECHKnow Project: High School Student Edition 2., R. Peterson, Ed. Cincinnati, OH: Centre
Pointe Learning, 2005, pp. 1823.
Ireland Department of Education and Science. Storyboards: www.fis.ie/default.
asp?PageName =Lesson7.
E. L. Counts, Multimedia Design and Production for Student and Teachers.
Pearson/Allyn and Bacon, 2004.
V. Ray, Multimedia for Designers. New York, Delamar Cengage Learning, 2008.
N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons,
2002.
N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007.
T. Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.
D. E. Knuth, Metafont. Addison-Wesley, 1986.
B. Kerr, Effective use of audio media in multimedia presentations, Middle Tennessee
State University, 1999.
B. L. Mann, The evolution of multimedia sound, Computers and Education, 2007.
http://de.wikipedia.org/wiki/Haptische_Wahrnehmung
171
172
softver ali moe biti i free software i free and open source software. Prilikom kupovine programa
kupac dobija binarnu verziju programa. Licencirani program iskljuuje pristup kodu, prepravke,
promene tehnike prirode i umnoavanje.
Intenzivan razvoj softvera za obradu slike i zvuka datira poetkom devedesetih godina
prolog veka. U tom razvoju prednjae amerike kompanije AVID, Adobe i Apple koje i danas
vode sa najmonijim softverima za snimanje, obradu i editovanje zvuka, slike i videa.
Za razvoj multimedijalnih proizvoda postoji mnotvo programskih alata za realizaciju
projekata za razliite namene i nivoe sloenosti. Osnovna podela po nameni su alati za izradu
multimedijalnih prezentacija, obradu slike i alati za obradu zvuka.
Ovladavanje vetinom pravljenja multimedijalnih proizvoda dobro je zapoeti izradom
najjednostavnijh prezentacija sa ureivanjem i kreiranjem mirnih slika, nastaviti sa digitalnim
video editovanjem, raditi zatim sa multimedijalnim prezentacijama da bi se ovladalo izradom
ozbiljnih prezentacija sa multimedijalnim interaktivnim sadrajem. Izrada animacija i filmova,
kao najvii multimedijalni nivo, zahteva i najvii profesionalizam, znaajan utroak vremena i
budeta.
Profesionalno uraeni multimedijalni proizvodi odlikuju se visokim kvalitetom dizajna i
ugraenim mogunostima za interakciju sa korisnikom. Rade se pomou monih softverskih
alata, ili programskih jezika, zbog ega je potrebno da dizajner ima neophodna struna i
programerska znanja. Za multimedijalnu produkciju postoji vie softverskih alata i programskih
jezika razliitih mogunosti, namena i cena. Izbor zavisi kako od vrste multimedijalnog
proizvoda tako i od znanja i afiniteta dizajnera.
173
174
Corel Painter je softverski alat koji se moe kvalifikovati kao elektronska slikarska
etkica, to omoguava umetnii rad sa slikama. Program usko specijalizovan prvenstveno za
crtanje i slikanje. Koriste ga slikari i crtai, manje dizajneri i oni koji se bave obradom slike.
Dobro simulira alate za crtanje, kao to su olovka, pero, temper.
Corel PHOTO-PAINT, obino je u sastavu CorelDRAW paketa programa namenjenih
generisanju i obradi grafike. Moe se koristiti kao alternativa Photoshop-u.
Macromedia Fireworks, obino je u sastavu paketa sa programima kao to su Flash i
Dreamweaver, prvenstveno se koristi za generisanje i obradu bitmapiranih slika namenjenih veb
stranicama.
Corel DRAW je program koji se koristi za generisanje i obradu vektorskih slika i teksta, a
sadri neke jednostavnije alate za obradu bitmapiranih slika. Na Slici 9.2.2.2-a prikazan je radni
ekran programa CorelDRAW a na Slici 9.2.2.2-b prikazano je radno okruenje programa Flash.
175
176
177
Sony Vegas Movie Studio 9 Platinum je program za video editovanje i kreiranje DVD.
Namenjen je za kune raunare. Softver ima mogunost prihvatanja i organizacije DV videa,
editovanje klipova u vremenskoj osi i eksportovanje videa u DVD ili video CD (eng. video CD
VCD). Takoe omoguava eksporovanje videa za korienje sa pokretnom konzolom za igranje
(eng. PlayStation Portable PSP), iPod i YouTube. Prua mogunost HDV i AVCHD
editovanja. Podrava snimanje, editovanje i kodovanje videa. Ima podrku za 5.1 surround sound
miksovanje i kodovanje.
SONY Vegas Pro 9 je profesionalni softver za video i audio postprodukciju za difuziju
broadcast i digitalne video diskove (eng. digital video disc DVD) i plave blu-rej diskove
optike diskove za memorisanje podataka (eng. blu-ray disc BD).
Adobe Encore DVD je softverski alat namenjen profesionalnoj izradi DVD-a. Format
videa uvedenog u programsko okruenje se automatski prebacuje u MPEG-2 format. Izlazni
oblik audio formata je Dolby Digital sistem. Kompatibilan je sa Photoshop-om. Interaktivan
meni se moe kreirati u Photoshop-u i koristiti u programu Adobe Encore DVD.
Pinnacle Studio HD je program za video editovanje u mnogim Windows raunarima.
Podrava HD video i prua mogunosti tranzicija, animacije i efekata.
CINEFORM NeoScene je program za nelinearnu montau u filmskom stvaralatvu,
daje izuzetno visok kvalitet CineForm fajlova.
PROGRAM ADOBE PREMIERE
Adobe Premiere, najee oznaen samo Premiere, jedan je od prvih programa za
digitalno editovanje, raspoloiv za operativne sisteme Apple Macintosh kao i za Microsof
Windows. Ima mnogostruku primenu, od kratkih filmova za veb sajtove do visokoprofesionalnih
produkcija. Poseduje velik izbor postprodukcijskih efekata od prelaza do dizajna i montae
zvuka.
Prva verzija Adobe Premiere 1.0 razvijena je 1993 da bi potom sledile nove serije do
2002 godine sa oznakom Adobe Premiere 6.5. Zatim sledi razvoj sa oznakama Adobe Premiere
Pro i to 2003 godine Adobe Premiere Pro 1.0, to bi odgovaralo Adobe Premiere 7.0, a zatim
2004 godine Adobe Premiere Pro 1.5 i 2005 godine Adobe Premiere Pro 1.5.1. Naredne 2006
godine razvijen je Adobe Premiere Pro 2.0 a sledee 2007 godine puten je pod novim nazivom
Adobe Premiere Pro CS3. Naredne 2008 i 2009 godine su Adobe Premiere Pro CS4 a 2010
godine Adobe Premiere Pro CS5 da bi najnovija verzija u 2011 godine bila oznaena sa Adobe
Premiere Pro CS5.5.
Adobe Premiere koristi tri glavna radna ekrana prozora: projekat, vremenska osa i
monitor kao to je prikazano na Slici 9.2.3.1.
Radni ekran projekat (eng. project) koristi SE za prikupljanje sirovog ili osnovnog
materijala (eng. raw materijal) za projekat: video i audio klipove, nepokretne slike. Video
klipovi mogu biti uneti (eng. captured) u Premiere direktno sa kamere ili sa trake, ili mogu biti
importovani sa diska. Unutar prozora projekat svaki klip se prikazuje sa njegovom slikom,
imenom, duinom trajanja i drugim informacijama.
Radni ekran vremenske ose (eng. timeline) vizuelno prikazuje linearni opseg
kompletiranog filma (eng. movie), prikazujui redosled komponentnih klipova. Vreme se
poveava sa leva na desno. Vremenski prozori mogu imati nekoliko video i audio tragova. Vei
broj tragova se koristi za tranzicije i preklapanje (eng. transitions and overlays).
178
Monitor je radni ekran u kome se prikazuje stvarna slika. Obino je podeljen na dva
okvira, od kojih svaki ima posebnu kontrolu playback, jog, shuttle. Leva polovina prikazuje
izvorni klip. Moe se izabrati odreeni frejm u klipu u prozoru i mogu se postaviti ulazne in i
izlazne out take. Desna polovina prozora monitora koristi se za prikazivanje filma (eng.
movie) u procesu sastavljanja (eng. asemblovanja) na vremenskoj osi.
179
realnom vremenu za vreme editovanja, 2D/3D prostor, audio postprodukcija, 5.1 surround sound
mixing, finalizacija profesionalnog DVD sa interaktivnim karakteristikama, autorizaciju SD i
dvoslojnog HD DVD-9.
Radni ekran Final Cut Pro 7 sadri etiri osnovna dela: okvir pretraiva (eng. Browser),
ulazni prozor za pregled programskog matrijala (eng. Viewer window), izlazni prozor (eng.
Canvas) i vremensku liniju (eng. Timeline) kao to je prikazano na Slici 9.2.3.2.
180
vremenskoj osi. Na njoj se video i audio klipovi mogu pomerati, menjati, rasporeivati i brisati u
cilju kreiranja sekvence kakva bi na kraju trebala da se pojavi u eljenom filmu. Na vremenskoj
osi se postavljaju i sadraji sekvence kao to su natpisi (eng. titles) i prelazi (eng. transitions).
181
SWF (eng. shockwave flash ili small web file SWF) je format vektorske grafike koji se
moe generisati sa fleom. Pogodan je za veb animacije. Grafiki objekti su predstavljeni u
vektorskom obliku. SWF fajl je slian programu, ukljuuje definicije objekata i instrukcije kako
sa njima manipulisati. SWF podaci su kodovani u binarnoj formi i komprimovani, rezultujui u
vrlo malu veliinu fajla.
Fle dozvoljava da se importuje bitmapirana slika u animaciju, ali time se poveava
veliina fajla.
U fleu s koriste tri razliite vrste simbola:
Vremenska linija (eng. timeline) predstavlja grafiki prikaz niza slika, odnosno sekvence
kadrova koja se koristi za kreiranje animacije u fleu. Animacija se moe graditi jedan frejm u
jednom trenutku, insertujui kljune frejmove u timeline sekvencijalno. Drugi nain je
ubacivanje glavnih frejmova u vremensku liniju.
Flash pozornica (eng. stage) je pozornica, prozor u kojoj se kreira frejm crtanjem
objekata. Objekti se mogu kreirati koristei drawing tools, ili mogu biti importovani.
Bitmapirane slike, ukljuujui formate JPEG i PNG, mogu se importovati i transformisati u autotraced vektorski objekat. Bitmapirane slike se mogu koristiti unutar Flash frame, ali se kasnije
ne moe vriti skaliranje ili rotacija bez potencijalnog degradiranja slike.
Koriste se lejeri da bi se organizovali elementi u frejmu, interpolirano kretanje (eng.
interpolating motion).
Grafiki objekti mogu biti sauvani u biblioteci u specijalnom obliku zvanom simbol
(eng. symbol), koji omoguava da objekat bude ponovo korien. Potreban broj instances mogu
se postaviti na stage. Instances ostaju linkovani za simbol. Ako se simbol menja, automatski se
menjaju i instances. Instances su identini, i na njih se primenjuju transformacije, da bi se
promenila veliina ili orijentacija od svake instances.
PROGRAM AUTODESK MAYA
Autodesk Maya, skraeno Maya, je moan komercijalni softver za 3D animaciju koji
omoguava previzualizaciju, vizuelne efekte, modelovanje, animaciju karaktera i rendering za
razvoj projekata filmske i video produkcije, raunarskih igara, arhitekture, obrazovanja i naunih
istraivanja.
Program Maya razvila je 1998 godine firma Alias Systems Corporation koju je 2005
godine otkupila firma Autodesk.
Verzija Maya 2012 moe se instalirati na raunarima sa operativnim sistemima Linux,
Mac OS X i Microsoft Windows.
Previzualizacija (eng. previsualization) predstavlja proces, razvijen u filmskoj industriji,
za kreiranje prototipa kroz vizuelno istraivanje i scensko planiranje to omoguava bolje
razumevanje projekta i generisanje preliminarne verzije video proizvoda. Kod kreiranja 3D
182
183
Maja softvera mogu po zamisli autora kreirati raznovrsni efekti i animacije. MEL omoguava da
se promenom vrednosti parametara u vremenu animiraju objekati, svetlo ili samo bilo koji
entitet.
Maja korisniki interfejs (eng. Maya user interface) predstavlja, sa funkcionalnog
aspekta, skup alata dostupnih korisniku na radnom ekranu monitora, koji osim funkcija
zajednikih za sve razliite aspekte 3D grafike softverskih aplikacija, sadri skup alata
namenjenih specifinim zadacima kao to su modeliranje, teksturisanje, animacija, renderovanje
i sl.
Podrazumevani (eng. default) Maja korisniki interfejs, prikazan na Slici 9.2.4.1 i na Slici
9.2.4.2, sadri sledee osnovne sekcije:
Slika 9.2.4.1Radni ekran sa Maja interfejsom (eng. Maya Interface) i radnim prostorom
184
Korisnik na radnom ekranu monitora definie virtuelni radni prostor, scenu, za realizaciju
projekta. Scena moe da bude sauvana u raznim formatima. Standardni format je .mb Maya
binary.
U aplikaciji Maya 2010 dodat je MatchMover kojim se omoguava kombinovanje
elemenata raunarskog grafikog interfejsa (eng. computer graphics interface CGI).
Kamera sekventor (eng. camera sequencer) jedna je od najoriginalnijih karakteristika u
softveru Maya 2011. Dodat je u aplikaciji Maya 2010. Koristi se za raspodelu planova vie
kamera i njihovo rukovanje u sekvenci animacije. Omoguava korienje razliitih kamera
analogno realizaciji u filmskim i televizijskim studijima. Kamera sekventor povezuje planove iz
vie kamera smetenih u 3D sceni, aranirajui planove i sviujui izmeu uglova i planova
kamera, korienjem vie kamera, uglova i pogleda, za stvaranje kompletne sekvence animacije.
i
Aplikacija Maya je organizovana u tri sloja, lejera: GUI, MEL Engine
Dependency Graph.
GUI lejer predstavlja grafiki korisniki interfejs dostupan animatorima, dizajnerima i
programerima.
MEL Engine je Maya lejer u kome se izvravaju komande korisnika sa GUI lejera.
Dependency Graph je lejer gde su smeteni svi podaci o sceni i gde se izvrava
neophodna modifikacija podataka na osnovu skripta MEL komandi.
185
procedure. Aplikacija Maja ima arhitekturu dijagrama grafa vora (eng. node graph
architecture). Svaki elemenat scene, na primer, svaka kriva, link, slika, tekstura, kljuni frejm se
definie kao vor. Svaki vor ima svoje osobine (eng. attributes) i prilagoenost. Svaki vor
moe primiti, modifikovati i transmitovati podatke sledeem voru. Da bi se ostvarila eljena
funkcionalnost formira se mrea vorova ili preko grafikog korisnikog interfejsa ili
programiranjem (MEL ili C++). Svaki 3D zadatak se realizuje protokom i modifikacijom
podataka kroz mreu meusobno povezanih vorova. Informacija koja se koristi za konstrukciju
scene je u obliku osobina i prenosi se meusobno zavisnim vorovima. Jedan vor moe imati
veliki broj osobina koje moe proslediti dalje ili zahtevati kao ulaz. Primeri vorova su vor
transformacije koji sadri informacije o lokaciji, vor oblika sadri geometrijske informacije i
vor materijala koji sadri informacije o boji. vor predstavlja jedan blok building block scene.
Blokovi se linkuju da bi kreirali kompleksnije blokove.
Blokovi formiraju model protoka podataka koji se zove Maya's pipeline.
Maya's pipeline omoguava digitalni produkcioni pipeline:
Pria Story
Preslikavanje prie u vizuelni domen Visual Development
Kreiranje karaktera - Character Design
Storibord Storyboards
Postavka scene Scene Layout
Modelovanje Modeling
Animacija Animation
Senenje i tekstura Shading and Texturing
Osvetljenje Lighting
Rendering
186
realizovan za snimanje jednog traga, gde se u jednom trenutku prikazuje samo jedan audio signal
mono ili stereo, ili vie tragova, koji omoguava da se signal snima sa nekoliko mikrofona ili
razliitih ulaza na disk u istom trenutku na posebne tragove. Za svaki trag posebno moe se
podeavati jaina ili stereo balans audio signala. Svaki trag se snima u posebnom fajlu u
memoriji kompjutera i moe se posebno editovati. U finalizaciji se vri miksovanje tragova u dva
stereo traga ili vie saraund tragova.
Razvoj softvera za digitalni audio poinje poetkom devedesetih godina prolog veka.
Kompanije koje su razvile najmonije softvere koji i danas dominiraju u profesionalnim
primenama su AVID, Adobe, Apple, Steinberg i Sony. Na tritu se nude softverski alati i
kolekcije razliitog nivoa sloenosti i cene kotanja.
Najpoznatije digitalne radne stanice i softverski kompleti su:
Kao primer i ilustracija za mogunosti koje imaju softverski alati za editovanje zvuka
dataljnije e biti opisan softverski alat Sound Forge.
187
Spektralna analiza Spectrum Analysis: nadzor u realnom vremenu (eng. real time).
Monitoring i prikaz trenutnih vrednosti zvunog signala Sonogram;
Uklanjanje uma: Noise Gate, Noise Reduction, EQ, Click and Crackle Removal, Audio
Restoration;
Dinamika kompresija Compressor: Threshold, Ration, Attack and Release time;
Promena uestanosti Time Stretch, Pitch, Vibrato.
188
Noise Gate slui za uklanjanje uma ispod izabranog nivoa praga (eng.treshold) kao to
je prikazano na Slici 9.3.1.4.
189
ali poveavaju mogunost da se ukloni i koristan signal niskog nivoa. Vrednosti ispod 0 dB
uklanjaju manje korisnog signala, ali ako je vrednost preniska bie uklonjeno veoma malo uma.
190
191
Slika 9.3.1.7Parametri dinamike kompresije: prag - THRESHOLD, prelazne faze: vreme uspostave
ATTACK TIME i vreme oslobaanja RELEASE TIME, stepen kompresije RATIO
192
Time Stretch menja duinu snimka, bez promene osnovne frekvencije.Pri ubrzanoj
reprodukciji i skraivanju trajanja snimka komprimovanja u vremenu, iri se spektar, javljaju
se vie frekvencije. Ako se usporava originalni snimak, dolazi do komprimovanja spektra.
Najbolji rezultati postiu se za Time Stretch izmeu 75% i 115%, kao to je prikazano na
Slici 9.3.1.9. Van ovog opsega, mogua je pojava izoblienja. Obradom snimka vie puta sa
malim priratajem, na primer 10 %, dobija se bolji rezultat nego jednom jednokratnom obradom
sa veom promenom duine snimka.
193
9.4 Rezime
Aplikativni softver za multimedije su raunarski programi koji se koriste kao sredstvo,
odnosno alat za izradu multimedijalnih proizvoda.
Intenzivan razvoj softvera za obradu slike i zvuka datira poetkom devedesetih godina
prolog veka. U tom razvoju prednjae amerike kompanije AVID, Adobe i Apple koje i danas
vode sa najmonijim softverima za snimanje, obradu i editovanje zvuka, slike i videa.
Postoji znaajan broj programa razvijenih za obradu slike i zvuka, pojedinano, ili
objedinjenih u video.
194
Pitanja
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
195
17.
18.
19.
20.
21.
22.
23.
24.
25.
ta je Sound Forge?
Koja editovanja podrava Sound Forge?
ta je spektralna analiza?
Koje su instrukcije za spektralnu analizu u Sound Forge-u?
ta je um?
Koje su instrukcije za uklanjanje uma u Sound Forge-u?
ta je to dinamika kompresija?
Koje su instrukcije za dinamiku kompresiju u Sound Forge-u?
Koje su instrukcije za promenu uestanosti u Sound Forge-u?
Literatura
[9.1]
[9.2]
[9.3]
[9.4]
[9.5]
[9.6]
[9.7]
[9.8]
http://en.wikipedia.org/wiki/Video_editing
http://en.wikipedia.org/wiki/Linear_video_editing
http://en.wikipedia.org/wiki/Non-linear_editing_system
http://en.wikipedia.org/wiki/List_of_video_editing_software
http://www.expertrating.com/courseware/MayaCourse/MAYA-Animation-Basics 1.asp
N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons,
2002.
N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007.
Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.
196
SPISAK SKRAENICA
AAC
ACELP
A/D
AFX
AL
API
ASCII
ATDM
ATM
AVC
AVCHD
AVI
BB
b
B
B
B-frame
BD
BIFS
BiM
197
BISDN
BMP
BQ
CABAC
CAVLC
CCD
CD
CD
CGI
CGI
CID
CIF
CMOS
CODEC
CRC
CS
CS-ACELP
CSMA/CD
CSS
1D
2D
broadband ISDN
irokopojasni ISDN
bitmap
bitska mapa
bi-level quantization
dvostruka kvantizacija
context adaptive binary arithmetic coding
binarno aritmetiko adaptivno kodovanje konteksta
context arithmetic variable-length coding
adaptivno kodovanje sa promenljivom kodnom rei
charge-coupled device
ureaji sa spregnutim naelektrisanjem
compact disc
kompakt disk
committee draft
dodeljeni draft
computer-generated imagery
raunarski generisane slike
computer graphics interface
raunarski grafiki interfejs, raunarska grafika
charge injection device
ureaj za detektovanje punjenja
common intermediate format
zajedniki srednji format
complemantary metal-oxide-semiconductor
komplementarne logike tranzistorski metal-oksid-poluprovodnik
coder-decoder
koder-dekoder
cyclic redundancy check
ciklina provera suvinosti
conjugate structure
konjugovana struktura
conjugate structure ACELP
konjugovana struktura ACELP
carrier sense multiple access with collision detection
postupak viestrukog pristupa uz detekciju kolizije
cascading style sheets
kaskadni stil listova
one-dimensional
jednodimenzionalni
two-dimensional
dvodimenzionalni
198
three-dimesional
trodimenzionalni
descriptor
D
deskriptor
digital audio workstation
DAW
digitalna audio radna stanica
decibel
dB
decibel
dictionary-based coding
DBC
kodiranje na bazi renika
discrete cosine transform
DCT
diskretna kosinusna transformacija
description definition language
DDL
opis definicije jezika
digital item
DI
digitalni deo
digital item declaration
DID
deklaracija o digitalnim delovima
digital video express
DIVX
ekspres digitalni video
delivery multimedia integration framework
DMIF
okvir za isporuku multimedijalnih komunikacija
DPCM/DCT differential pulse code modulation /discrete cosine transform
diferencijalna impulsno kodovana modulacija/diskretna kosinusna
transformacija
dots per inch
dpi
broj taaka po jedinici duine
digital rights managment
DRM
upravljanje digitalnim pravima
descriptor scheme
DS
ema za deskripciju
dgital storage media-command and control
DSM-CC
digitalna memorija-komanda i kontrola
digital signal processing
DSP
digitalna obrada signala
digital simultaneous voice and data
DSVD
digitalni simultani glas i podaci
digital video
DV
digitalni video
digital video broadcasting
DVB
digitalna video difuzija
3D
199
DWT
EM
EQ
ES
FEC
FOE
3G
GA
GDF
GFX
GIF
GII
GK
GNU
GOB
GPL
GSTN
GW
HD
HDV
200
HDTV
HMM
HTML
HVS
I
I-frame
IBP
IDCT
IEC
IETF
IP
IPMP
IPRS
ISDN
ISM
ISO
ITU
ITU-R
ITUT
JPEG
JPEG-LS
high-definition television
televizija visoke definicije, televizija visoke rezolucije
hidden Markov model
skriveni model Markova
hyper text markup language
hipertekst sa oznaenim jezikom
human visual system
oveiji vizuelni system
intra
unutar
intra-frame
unutranji-frejm
I-frame, B-frame, P-frame
I-frejm, B-frejm, P-frejm
inverse DCT
inverzna DCT
International Electrotechnical Committee
Meunarodni elektrotehniki komitet
Internet Engineering Task Force
Grupa za IP standarde
internet protocol
internet protocol
intellectual property management and protection
upravljanje intelektualnoim svojinom i zatita
intelectual property rights
prava intelektualne svojine
integrated services digital network
digitalna mrea integrisanih servisa
interactive storage media
interaktivna memorija
Internatonal Standard Organization
Meunarodna organizacija za standardizaciju
International Telecommunication Union
Meunarodna unija za telekomunikacije
International Telecommunication UnionRadio Standardization Sector
Meunarodna unija za telekomunikacijeRadio sektor za standardizaciju
International Telecommunication UnionTelecommunication Sector
Meunarodna unija za telekomunikacijeTelekomunikacioni sektor
Joint Photographic Experts Group
Grupa eksperata za fotografiju
JPEG standard for image lossless coding
JPEG standard za kodovanje mirnih slika bez gubitaka
201
JP2
JTC
JVC
JVT
LAN
MAE
MB
MCU
MDS
MEL
MIDI
MIPS
MOS
MOS
MPEG
MPEG-J
MP3
MP4
MQ
MSE
NAL
202
NISDN
NTSC
NURBS
OCR
OS
OSI
P
P-frame
PAL
PC
PCM
PDF
PNG
PSNR
PSP
PSTN
QCIF
QoS
RAM
RDF
REC
narrow-band ISDN
uskopojasni ISDN
National Television System Committee
Nacionalni komitet za televizijski sistem
non-uniform rational B-spline
neuniformna racionalna osnovna kriva
optical character recognition
optiko prepoznavanje znakova
operating system
operativni sistem
open system interconnection
povezivanje otvorenih sistema
predictive
prediktivni
predicted-frame, forward-predicted frame, inter-frame
predvidiv-frejm, unapred-predvidiv frejm, meu-frejm
phase alternating line
linijska promena faze
personal computer
personalni raunar
pulse code modulation
impulsna kodna modulacija
probability density function
funkcija gustine verovatnoe
portable network graphic
pokretna mrena grafika
peak-signal-to-noise ratio
vrni odnos signalum
PlayStation portable
pokretna konzola za igranje
public switched telephone network
javna telefonska mrea sa komutacijom, javna komutirana telefonska mrea
quarter common intermediate format
etvrtni zajedniki srednji format
quality of service
kvalitet servisa
random access memory
memorija sa sluajnim pristupom
rate distortion function
funkcije stepena oteenja
request for comment
zahtev za komentar
203
RLE
ROI
ROM
RTCP
RTP
SA
SAOL
SC
SCN
SDTV
SECAM
SG
SGML
SH
SNHC
SNR
SQ
SWF
SVGA
TC
TCP/IP
run-length encoding
kodovanje duine niza
region of interest
region od interesa
read-only memory
memorija sa oitavanjem
real time control protocol
kontrolni protokol u realnom vremenu
real time transport protocol
transportni protokol u realnom vremenu
structured audio
strukturni audio
structured audio orchestra language
strukturni jezik audio orkestra
sub-committee
podkomitet
switched circuit network
mrea za komutaciju kanala
standard definision television
televizija standardne rezolucije
fran. sequentiel couleur a memoire, eng. sequential color with memory
Francuski televizijski standard
Study Group
Studijska grupa
standard generalized markup language
standardni generalizovani jezik za markiranje
sample and hold
uzorak i zadravanje
synthetic natural hybrid coding
sintetiko prirodno hibridno kodovanje
signal-to-noise ratio
odnos signalum
single quantization
jednostruka kvantizacija
shockwave Flash ili small web file
format vektorske grafike koji se moe generisati sa fleom
super video graphics array
super video grafika kartica niz
technical committee
tehniki komitet
transmission control protocol/internet protocol
protokol kontrole prenosa/internet protocol
204
TDNN
TIF
TIFF
ToR
TR
TSR
TTSI
VBR
VCD
VCEG
VCL
VGA
VHDL
VLC
VM
VO
VOC
VOP
VQ
VRML
VTC
205
W3C
WD
WG
XGA
XML
XMT
206