Download as pdf or txt
Download as pdf or txt
You are on page 1of 33

Digitális képek szegmentálása

4.
Szín

Kató Zoltán

http://www.cab.u-szeged.hu/~kato/segmentation/
Mi a szín? (fizika) 2

Fény = elektromágneses
sugárzás
Fizikailag a spektrális
energia-eloszlás
segítségével írható le:
Az egyes hullámhosszok
intenzitása
3
4
Színlátás 5

Az emberi látás több százezer színárnyalatot és


mindössze ~100 szürkeárnyalatot képes
megkülönböztetni Î szín fontos információt
tartalmaz!!
Hue: ~domináns hullámhossz ('színfajta')
Saturation: tisztaság (mennyi fehér fénnyel kevert)
Intensity: ~fotonok száma, fizikai tulajdonság, ami
mérhető.
Luminance: ~visszavert fény érzékelt intenzitása,
pszihofizikai tulajdonság (emberi érzékeléssel
kapcsolatos, pl. azonos intenzitású kék és zöld...)
Brightness: ~fénykibocsájtó felület érzékelt intenzitása,
szintén pszihofizikai tulajdonság
Az emberi szem 6

Rods (pálcikák)
Fényintenzitást érzékelnek
Csak a beérkező fény
intenzitása (~fotonok száma) a
fontos, nem a hullámhossz.
kevés fény esetén is működnek
részletek, objektumok alakja
Sokkal több van belőle
Cones (csapok)
Színérzékelés
Három típus
L ~ Red
M ~ Green
S ~ Blue
Színlátás 7

A különböző csapok görbéi átfedik


egymást, különböző hullámhosszra
másképp reagálnak.
550nm (zöld) körül a legérzékenyebb
A csapok ingerei együttesen adják a
színérzetet.
A szín nem írható le egyértelműen a
hullámhosszal
A szín 3 dimenziós – tristimulus
Színek hasonlósága (pszihofizika) 8

Metamer: Vizuálisan egyforma színpár (spektrális energia-eloszlás


lehet teljesen különböző!)
Mi a szín??? 9

... the Rays to speak properly are not coloured. In them there
is nothing else than a certain Power and Disposition to stir up
a Sensation of this or that Colour. (Newton: Opticks. 1704.)

A színérzékelés teljesen az agyunkban történik, a


hullámhosszban nincs semmi 'színes'.
Színterek segítségével írhatjuk le a színeket
3D koordinátarendszerben egy altérrel adhatjuk meg az
összes kikeverhető színt. Minden színnek egy pont felel
meg az altérben
RGB 10

RGB a legismertebb színtér, de a képfeldolgozásban alig


használható
Additív színmodell
Nem állítható elő minden látható szín RGB komponensekből.
Főként monitorokban, kamerákban használják
RGB 11
RGB példa 12

G B
Kamerák színrögzítése 13

Nem rögzít RGB értéket


minden pixelben (olcsóbb)
Minden RGB érték egy
interpolált érték, amelyet a
közeli pixelekben rögzített R,
G, B értékekből számolunk
(Bayer szűrő)
G érzékelő sűrűbben van,
mert ez az emberi látás
számára jobb minőségű
képet ad (ld. színérzékelés).
CMYK 14

Cyan, Magneta, Yellow and


blacK
kiegészítője az RGB-nek
[ ] [] []
C
M
Y
=
1
1
1
_
R
G
B
Szubtraktív színmodell
NegatívÎPozitív fényképek
Nyomtatás
A blacK komponensnek
nyomtatás során van
jelentősége:
Tisztább szürkeárnyalatok
állíthatók elő
Kevesebb tinta kell
CMY példa 15

M Y
HSV 16

Számitógépes grafikában használatos


HSV példa 17

S V
YUV, YIQ 18

Intenzitás (Y) és színinformáció szétválasztása


TV adásokban (PAL, SECAM, NTSC) használják
Y = 0.299R + 0.587G + 0.114B
RGB-ből számolható
U = 0.492 ( B - Y )
UV-t (illetve IQ)-t általában V = 0.877 ( R - Y )

kevesebb biten ábrázolják,  I  = 0 1  cos(33) sin(33)  U 


Q  1 0 − sin(33) cos(33) V 
így kisebb sávszélességet      

igényel a jelátvitel.
Kihasználja, hogy az emberi látás kevésbé érzékeny a
színekre, mint az intenzitásra.
YIQ: IntenzitásÍÎSzín érzékenység 19
YCbCr 20

ITU-R BT.601 digital video component standard


A legtöbb képtömörítő eljárás ezt használja (JPEG,
H.261, MPEG) Y = 219 Y + 16

Többféle mintavételezési standard: Cb= 126(B-Y)+128


Cr = 160(R-Y)+128
4:4:4, 4:2:2, 4:1:1
Egész értékeket ad (8 bites kódoláshoz hasznos).
YCbCr példa 21

Cb Cr
XYZ 22

Comission International de
l'Éclairage 1931
RGB-ben nehéz a színeket
keverni (negatív értékek is
előfordulhatnak)
Szín = Rr + Gg + Bb
Hogyan adjuk meg a
színeket 3D trérben?
standard observer
x, y, z standard fények:
Bármely szín kikeverhető e
három fény pozitív
kombinációjával (XYZ)
Ezek az értékek egyértelműen
jellemzik az adott színérzetet
(humán kísérletek)
Szín = Xx + Yy + Zz, X,Y,Z ≥ 0
XYZ 23

Standard tristimulus: XYZ


Minden látható szín kikeverhető
Y luminance, XYZ iránya - szín
Színdiagram: XYZ vektorok metszete egy síkkal
(általában X+Y+Z=1).

To transform into RGB, we need the xy coordinates of the RGB


primaries and the alignment white. I'll use a set of typical values.

x y
Red 0.628 0.346 call these xr and yr
Green 0.268 0.588 " " xg and yg
Blue 0.150 0.070 " " xb and yb
White 0.313 0.329 " " xw and yw

From these we can compute the linear transformation from CIEXYZ


to RGB.It is:

[R] = [ 2.739 -1.145 -0.424 ] [X]


[G] = [ -1.119 2.029 0.033 ] [Y]
[B] = [ 0.138 -0.333 1.105 ] [Z]
XYZ példa 24

Y Z
L*u*v*, L*a*b* 25

XYZ nem lineáris színtér,


ahol a színkülönbségek
egyenletesek
Az ellipsziseken belül a
színeket egyneműnek
érzékeljük
Színkülönbségek
nehezen számolhatók
(nem Euklideszi
távolság)
L*u*v*, L*a*b* 26

Uniform színtér (euklideszi távolsággal mérhető a


színek távolsága)
1/3
L* =116 (Y/Yn) - 16
L - luminance
*
a* =500[(X/Xn)1/3 - (Y/Yn)1/3]
u*,v* - kromatikus információ b* =200[(Y/Yn)1/3 - (Z/Zn)1/3]
a*, b* - kromatikus információ
u* = 13*(L*)*(u'-u'n)
v* = 13*(L*)*(v'-v'n)

where

u'=4*X/(X+15*Y*+3*Z) and v'=9*Y/(X+15*Y+3*Z)

and u'n and v'n have the same definitions for u' and v' but applied
to the white point reference. So, you have:
u'n=4*Xn/(Xn+15*Yn*+3*Zn) and v'n=9*Yn/(Xn+15*Yn+3*Zn)
L*a*b*- Euklideszi tér 27
L*u*v* példa 28

L*

u* v*
Szín-hisztogram 29

3 dimenziós térben
pontfelhőként ábrázoljuk
Statisztikailag keveset
mond (sokkal több
lehetséges szín, mint
pixel van)
A szín-hisztogram
klaszterezésével
előállíthatunk küszöbölt
képeket, de a
gyakorlatban inkább
más, hatékonyabb
szegmentáló eljárásokat
használnak
Szín-hisztogram függ a színtértől 30

HSV

XYZ

L*u*v*
Canny színes éldetektáló 31

A Canny éldetektor kiterjeszthető színes képekre.


A klasszikus Canny detektor azon alapszik, hogy a
simított képen kiszámolja a parciális differenciákat, majd
ez alapján megkeresi a „legjobb él” magnitudóját és
irányát.
Hogyan kell színes képeken kiszámolni a gradienst?
A színes kép egy olyan függvénynek tekinthető,
amely egy ponthoz hozzárendel egy 3D vektort az
adott színtérben: C(x,y)=(c1,c2,c3).  ∂c1 ∂c1 
A képfüggvény változását  ∂x ∂y 
 ∂c2 ∂c2 
egy adott (x,z) pontban le tudjuk írni J =  ∂x  = (C x , C y )
 ∂y 
a ∆C=J∆(x,y), ahol J a Jacobi mátrix:  ∂c3 ∂c3 
 ∂x ∂y 

Canny színes éldetektáló 32

A legnagyobb képfüggvény-változás irányát a JTJ


mátrix legnagyobb sajátértékéhez tartozó sajátvektor
adja meg.
Az él iránya (θ) az alábbi képlettel számolható
(Tetszőleges normával): 2C x C y
tan(2θ ) = 2 2
Cx − C y
A él magnitudója (m) pedig:
2 2
m = C x cos (θ ) + 2C x C y sin(θ ) cos(θ ) + C y sin 2 (θ )
2 2

Az így kapott gradiensből már a klasszikus Canny


detektor szerint számoljuk az élképet. Vagyis
a nem lokális maximumok törlése és azután
hiszterézis
Canny színes éldetektáló 33

Különböző színek,
közel azonos intenzitás Színes kép Szürkeárnyalatos kép

Színes és intenzitás alapú Canny eredmények


Színes és intenzitás alapú Canny eredmények

You might also like