Download as pdf or txt
Download as pdf or txt
You are on page 1of 39

Podstawowe metody przetwarzania obrazów

¾ Przekształcenia geometryczne – pełnią rolę pomocniczą w procesie


przetwarzania obrazu (przesunięcia, obroty, odbicia).
¾ Przekształcenia punktowe (bezkontekstowe) – (operacje logiczne i
arytmetyczne, normalizacja, wyrównywanie histogramu, binaryzacja).
¾ Filtracja kontekstowa – (filtry uśredniające, wykrywające krawędzie i
narożniki, wyostrzające, medianowe, ekstremalne, kombinowane).
¾ Przekształcenia morfologiczne (kontekstowe)
¾ Przekształcenia widmowe (wykorzystujące transformację Fouriera)
Przekształcenia kontekstowe obrazu

Przekształcenia kontekstowe obrazu cyfrowego są to przekształcenia dotyczące


stopnia szarości lub intensywności barwy poszczególnych punktów (pikseli) obrazu.
Cechą charakterystyczną kontekstowych przekształceń obrazu jest to, że wynikowy stan
danego punktu (piksela) obrazu zależy od stanu pierwotnego tego punktu i stanu
punktów (pikseli) z jego otoczenia.
W przekształceniach kontekstowych wykorzystuje się funkcje, których argumentami są
wartość przekształcanego piksela oraz wartości pikseli z jego otoczenia, które w
ogólnym przypadku może mieć różną formę, ale często utożsamiane jest z
kwadratowym „oknem” otaczającym symetrycznie aktualnie przetwarzany punkt
obrazu.
Przekształcenia morfologiczne (1)

Fundamentalnym pojęciem przekształceń morfologicznych jest tzw. szablon


strukturalny (element strukturalny) obrazu. Jest to pewien wycinek obrazu (w
przypadku obrazów cyfrowych – pewien podzbiór jego elementów) z wyróżnionym
jednym punktem (tzw. punktem centralnym). Szablon strukturalny w najprostszej
formie ma postać macierzy SE. Współrzędne (mc,nc) punktu centralnego szablonu
strukturalnego określa wówczas zależność:
[mc nc] = floor((size(SE)+1)/2)

W ogólnym przypadku macierz szablonu strukturalnego jest macierzą


zerojedynkową, w której położenie jedynek definiuje otoczenie punktu centralnego.
Przekształcenia morfologiczne (2)
Cechą charakterystyczną przekształceń morfologicznych obrazu jest to, że dany punkt
(piksel) obrazu nie jest modyfikowany zawsze (tak jak ma to miejsce w filtracji
kontekstowej), ale tylko wtedy, gdy spełniony jest zadany warunek logiczny.
Wprowadzenie warunku logicznego jako czynnika determinującego modyfikację piksela
obrazu pozwala na szczególnie subtelne przeprowadzenie przetwarzania obrazu.
Przekształcenia morfologiczne poszczególnych punktów (pikseli) obrazu są wykonywane
w następujący sposób:
¾ punkt centralny szablonu strukturalnego jest przykładany kolejno do wszystkich
punktów (pikseli) obrazu;
¾ w każdym punkcie (pikselu) obrazu sprawdza się pewien warunek logiczny na
otoczeniu tego punktu zdefiniowanym otoczeniem punktu centralnego szablonu
strukturalnego;
¾ jeżeli jest spełniony zadany warunek logiczny, następuje wykonanie pewnej ustalonej
operacji na badanym punkcie (pikselu) – zazwyczaj jest to zmiana wartości poziomu
szarości lub intensywności barwy tego punktu (piksela);
¾ jeżeli nie jest spełniony zadany warunek logiczny, na badanym punkcie (pikselu) nie
wykonuje się żadnej operacji.
Podstawowe przekształcenia morfologiczne

Podstawowe przekształcenia morfologiczne stanowią bazę do tworzenia bardziej


złożonych przekształceń morfologicznych. Do podstawowych przekształceń
morfologicznych zaliczamy:
z erozję;
z dylatację;
z przekształcenie HM (trafi-nie trafi – ang. hit-miss).
Erozja (1)
Erozję figury X (obszaru obrazu źródłowego wyróżniającego się poziomem jasności)
szablonem strukturalnym SE można zdefiniować na różne sposoby. Przykładowe
definicje mogą być następujące:
z figura zerodowana to zbiór punktów centralnych wszystkich szablonów
strukturalnych SE, których otoczenie (zdefiniowane szablonem strukturalnym) w
całości zawarte jest we wnętrzu figury X (interpretacja binarna);
z erozja może być interpretowana jako taki operator, w którym każdemu punktowi
(pikselowi) obrazu przypisuje się minimum z wartości poziomów jasności
(poziomów szarości lub intensywności barwy) punktów (pikseli) należących do
jego otoczenia (zdefiniowanego szablonem strukturalnym SE).
Erozja (2)
Proces erozji na obrazach binarnych można sobie wyobrazić jako odcięcie pasa o
zadanej szerokości wzdłuż brzegu figury. Szerokość odciętego pasa jest określona
wielkością otoczenia punktu centralnego szablonu strukturalnego SE.
Erozja (3)
Proces erozji na obrazach monochromatycznych i kolorowych można sobie wyobrazić
jako efekt działania filtra minimalnego, co można zapisać w sposób następujący:

E ( L, SE ) = min [ L( mi , ni )]
mi ,ni ∈ T ( m ,n )

gdzie symbol L(m,n) oznacza wartość poziomu jasności (poziomu szarości lub
intensywności barwy) punktu (piksela) o współrzędnych m i n obrazu źródłowego, a
T(m,n) symbolizuje otoczenie punktu (piksela) obrazu źródłowego o współrzędnych m i n
zdefiniowane szablonem strukturalnym SE z punktem centralnym przyłożonym do punktu
(piksela) obrazu źródłowego o współrzędnych m i n.

Erozję obrazu kolorowego można zdefiniować jako złożenie niezależnych erozji


przeprowadzonych na jego poszczególnych składowych RGB.
Erozja (4)
Przykładowe szablony strukturalne mają następującą postać:

„Liniowe” szablony strukturalne są przydatne do detekcji elementów obrazu


zorientowanych w tym samym kierunku, co szablon strukturalny. Erozja
“liniowym” szablonem strukturalnym równoległym do założonego kierunku usunie z
obrazu wszystkie te elementy obrazu, które są odchylone od założonego kierunku.
Erozja (5)
Operacja erozji ma następujące cechy:

z erozja zmniejsza powierzchnie figur (odizolowane, drobne figury zostają


usunięte);
z erozja wygładza brzegi figur;
z erozja może podzielić większe figury na mniejsze (gdy mają przewężenia).

Szczególną odmianą erozji obrazów binarnych jest erozja warunkowa. Erozja


warunkowa eroduje figury w taki sposób, aby z każdej figury pozostał znacznik
(punkt lub grupa punktów, która w następnym kroku erozji znika).
Dylatacja (1)
Dylatacja jest przekształceniem odwrotnym do erozji. Dylatację figury X szablonem
strukturalnym SE można zdefiniować na różne sposoby. Przykładowe definicje mogą
być następujące:
z figura po dylatacji to zbiór punktów centralnych wszystkich szablonów
strukturalnych SE, których którykolwiek punkt otoczenia (zdefiniowanego
szablonem strukturalnym) zawarty jest we wnętrzu figury X (interpretacja
binarna);
z dylatacja może być interpretowana jako taki operator, w którym każdemu
punktowi (pikselowi) obrazu przypisuje się maksimum z wartości poziomów
jasności (poziomów szarości lub intensywności barwy) punktów (pikseli)
należących do jego otoczenia (zdefiniowanego szablonem strukturalnym SE).
Dylatacja (2)
Proces dylatacji na obrazach binarnych można sobie wyobrazić jako dodanie pasa o
zadanej szerokości wzdłuż brzegu figury. Szerokość dodanego pasa jest określona
wielkością otoczenia punktu centralnego szablonu strukturalnego SE.
Dylatacja (3)
Proces dylatacji na obrazach monochromatycznych i kolorowych można sobie
wyobrazić jako efekt działania filtra maksymalnego, co można zapisać w sposób
następujący:

D ( L, SE ) = max [ L( mi , ni )]
mi ,ni ∈ T ( m ,n )

Dylatację obrazu kolorowego można zdefiniować jako złożenie niezależnych


dylatacji przeprowadzonych na jego poszczególnych składowych RGB.

Operacja dylatacji ma następujące cechy:

• dylatacja zwiększa powierzchnie figur;


z dylatacja wygładza brzegi figur (zamykają się małe otwory i wąskie “zatoki” w
konturach figur);
z dylatacja może połączyć figury, które są położone blisko siebie.
Przekształcenie HM (trafi-nie trafi – ang. hit-miss)
Wykonywane na obrazach binarnych przekształcenie HM określa wartość poziomu
jasności punktów (pikseli) obrazu w zależności od tego, czy ich lokalne otoczenie spełnia
pewien warunek. Warunek ten jest zdefiniowany macierzą szablonu strukturalnego, której
elementy mogą przyjmować wartości 1, 0, –1.
Wartości 1 oznaczają miejsca szablonu, które mają “trafić” (ang. hit) w punkty (piksele)
obrazu o określonej wartości poziomu jasności, wartości –1 oznaczają miejsca, które mają
“chybić” (ang. miss), a wartości 0 oznaczają miejsca, które nie są analizowane.

Przekształcenie HM jest najogólniejszą operacją morfologiczną, na tyle uniwersalną, że


można na jej podstawie zdefiniować wszystkie inne przekształcenia morfologiczne (np.
erozję i dylatację).

Przekształcenie HM jest morfologicznym ekwiwalentem operacji pasowania wzorców i


szczególnie dobrze nadaje się do detekcji charakterystycznych elementów obrazu,
takich jak odizolowane punkty, krawędzie, narożniki, węzły.
Złożone przekształcenia morfologiczne

Złożone przekształcenia morfologiczne są kombinacją podstawowych przekształceń


morfologicznych. Do złożonych przekształceń morfologicznych zaliczamy:

z otwarcie i zamknięcie;
z automedianę morfologiczną;
z morfologiczne wyznaczanie konturu obiektu;
z morfologiczne mapowanie ekstremów;
z morfologiczną korektę kontrastu;
z morfologiczne wyznaczanie lokalnego progu binaryzacji.
Otwarcie i zamknięcie (1)
Otwarcie figury X szablonem strukturalnym SE można zdefiniować następująco:
otwarcie polega na przesunięciu otoczenia zdefiniowanego szablonem strukturalnym po
wewnętrznej stronie brzegu figury i odrzuceniu z niej wszystkich tych punktów, które nie
mogą być osiągnięte przez to otoczenie (interpretacja binarna).
Zamknięcie figury X szablonem strukturalnym SE można zdefiniować następująco:
zamknięcie polega na przesunięciu otoczenia zdefiniowanego szablonem strukturalnym po
zewnętrznej stronie brzegu figury i dodaniu do niej wszystkich tych punktów, które nie
mogą być osiągnięte przez to otoczenie (interpretacja binarna).

Operacja otwarcia to kolejno wykonane operacje erozji i dylatacji:

O ( L, SE ) = D ( E ( L, SE ), SE ) = max [ min [ L( mi , ni )]]


mi ,ni ∈ T ( m ,n ) mi ,ni ∈ T ( m ,n )

Operacja zamknięcia to kolejno wykonane operacje dylatacji i erozji:

C ( L, SE ) = E ( D ( L, SE ), SE ) = min [ max [ L( mi , ni )]]


mi ,ni ∈ T ( m ,n ) mi ,ni ∈ T ( m ,n )
Otwarcie i zamknięcie (2)
Jeśli dla figury X wykonamy odpowiednie przekształcenia morfologiczne, to pola figur
będących wynikiem tych przekształceń spełniają warunek:

# E ( X ) ≤# O ( X ) ≤# C ( X ) ≤# D( X )
gdzie symbole #E(X), #O(X), #C(X), #D(X) oznaczają pola figur będących skutkiem
odpowiednio erozji, otwarcia, zamknięcia, dylatacji figury X (tym samym szablonem
strukturalnym SE).
Operacje otwarcia i zamknięcia mają następujące cechy:
• otwarcie usuwa drobne figury i drobne szczegóły figur, jak półwyspy i wypustki,
nie zmieniając wielkości zasadniczej części większych figur, może też podzielić
większe figury na mniejsze (gdy mają przewężenia);
z zamknięcie wypełnia wąskie wcięcia i zatoki oraz drobne otwory wewnątrz
figury, nie zmieniając wielkości jej zasadniczej części, może też połączyć figury,
które są położone blisko siebie;
z obydwie operacje nie zmieniają kształtu ani wymiarów dużych figur o
wyrównanym, gładkim brzegu.
po operacji zamknięcia: po operacji otwarcia:
Automediana morfologiczna
Automedianę morfologiczną obrazu L wykonaną przy pomocy szablonu strukturalnego SE
można zdefiniować następująco:

Amed ( L, SE ) = max[O (C (O ( L, SE ), SE ), SE ), min[ L, C (O (C ( L, SE ), SE ), SE )]]

Wyznaczenie automediany może prowadzić do regularyzacji konturów figur


(zwłaszcza na obrazach binarnych).
Morfologiczne wyznaczanie konturu obiektu
Gradient morfologiczny obrazu L wykonany przy pomocy szablonu strukturalnego SE
można zdefiniować następująco:
grad ( L, SE ) = D ( L, SE ) − E ( L, SE )
Wyznaczony gradient morfologiczny przedstawia kontury figur i wykazuje małą
zależność od kierunku konturów. Ponieważ tak wyznaczony kontur jest gruby, dlatego
stosuje się półgradienty.
Półgradient morfologiczny wewnętrzny obrazu L wykonany przy pomocy szablonu
strukturalnego SE można zdefiniować następująco:
grad − ( L, SE ) = L − E ( L, SE )
Półgradient morfologiczny zewnętrzny obrazu L wykonany przy pomocy szablonu
strukturalnego SE można zdefiniować następująco:
grad + ( L, SE ) = D ( L, SE ) − L

Półgradienty dzielą kontur figury na kontur wewnętrzny i zewnętrzny. Nowe


kontury są cieńsze. Kontur wewnętrzny zawsze należy do figury, natomiast kontur
zewnętrzny leży na zewnątrz figury.
Morfologiczne mapowanie ekstremów
Morfologiczne mapowanie ekstremów polega na wykryciu takich obszarów obrazu, które
są jaśniejsze (szczyty – maksima) lub ciemniejsze (doliny – minima) niż okoliczne
obszary.
Mapę szczytów obrazu L wykonaną przy pomocy szablonu strukturalnego SE można
zdefiniować następująco:
M S ( L, SE ) = B[ N [ L − O ( L, SE )]]
gdzie N, B oznaczają odpowiednio operator normalizacji i binaryzacji.

Mapę dolin obrazu L wykonaną przy pomocy szablonu strukturalnego SE można


zdefiniować następująco:
M D ( L, SE ) = B[ N [C ( L, SE ) − L]]

Rozmiar szablonu strukturalnego SE powinien być nieco większy od rozmiaru


poszukiwanych szczytów i dolin.
Detekcja szczytów

Detekcja dolin
Morfologiczna korekta kontrastu
Morfologiczna korekta kontrastu polega na zmianie kontrastu obrazu operacjami
morfologicznymi. Formuła poprawy kontrastu obrazu L operacjami morfologicznymi
wykonanymi przy pomocy szablonu strukturalnego SE jest następująca:
contr ( L, SE ) = N (3 ⋅ L − O ( L, SE ) − C ( L, SE ))
gdzie N oznacza operator normalizacji.
Wybrane przekształcenia morfologiczne obrazów binarnych
Przekształcenia morfologiczne znalazły szerokie zastosowanie w przetwarzaniu obrazów
binarnych. Do najważniejszych przekształceń morfologicznych obrazów binarnych
zaliczamy:
z pogrubianie i ścienianie figur;
z szkieletyzację figur;
z „obcinanie gałęzi” (eliminacja ostróg) szkieletów figur;
• wyznaczanie centroidów figur;
z „zalewanie otworów” w figurach;
z usuwanie wnętrza figur.
Pogrubianie i ścienianie figur
Pogrubianie i ścienianie figur polega na nałożeniu lub odcięciu zewnętrznej warstwy
figury. Operacje te nie muszą się ograniczać do jednego kroku, ale mogą być wykonywane
sekwencyjnie.
Szkieletyzacja figur
Szkieletyzacja jest operacją uproszczenia kształtu figury do jej szkieletu. Szkielet figury
jest zbiorem wszystkich punktów figury, które są równoodległe od co najmniej dwóch
punktów należących do brzegu figury. Intuicyjnie szkielet rozumiany jest jako “rama”, do
której zamocowane jest “ciało” figury.
„Obcinanie gałęzi” (eliminacja ostróg) szkieletów figur
Postać szkieletu figury w dużym stopniu zależy od regularności brzegu figury.
Nieregularności brzegu figury powodują powstanie dodatkowych, niepotrzebnych
odgałęzień (artefaktów) wynikowego szkieletu (tzw. „gałązkowanie” szkieletu). W celu
usunięcia tego typu zniekształceń stosuje się przekształcenia morfologiczne dokonujące
“obcinania gałęzi”.
Wyznaczanie centroidów figur
Centroid jest szkieletem figury z szczególnie mocno obciętymi gałęziami. Operacja
wyznaczania centroidów sprowadza figurę do punktu w przypadku, gdy figura nie posiada
otworów lub do pętli, gdy figura posiada otwory.
„Zalewanie otworów” w figurach
Często spotykanym zadaniem w przetwarzaniu obrazu jest zadanie wypełnienia otworów
w figurach znajdujących się na obrazie. Można tego dokonać przy pomocy przekształceń
morfologicznych dokonujących “zalewania otworów”.
Usuwanie wnętrza figur
Często spotykanym zadaniem w przetwarzaniu obrazu jest zadanie usunięcia wnętrza figur
znajdujących się na obrazie czyli uproszczenie figur do ich konturu (obwodu). Można tego
dokonać przy pomocy odpowiednich przekształceń morfologicznych.

You might also like