Professional Documents
Culture Documents
Projekt Izvjestaj
Projekt Izvjestaj
IZVJEŠTAJ PROJEKTA
Peter Škoda
Roko Končurat
Zagreb, 03.06.2004.
Sažetak
1. Uvod
2
3. Metode
3
Procjena gradijenta izračunata je funkcijom “grad2d”. Za procjenu su korištene
Sobelove maske (operatori). Funkcija kao ulazni argument prima matricu (sliku) i
vraća matricu gradijenta po recima (po frekvenciji) i matricu gradijenta po stupcima
(po vremenu). Ulaznu matricu potrebno je proširiti ponavljanjem elemenata na
rubovima radi izbjegavanja rubnih efekata koji nastaju zbog proširenja matrice
nulama pri konvoluciji. Pri izračunu procjene gradijenta uzimaju se samo vrijednosti
izračunate bez nula dodanih na rubovima.
Funkcija “fpeak” je funkcija koja pronalazi vrhove u matrici nagiba. Vrhovi se
nalaze na onim dijelovima spektrograma gdje je udaljenost između piksela ruba sa
uzlaznim i piksela ruba sa silaznim nagibom manja ili jednaka 3 piksela. Vrhovi se
traže samo po stupcima matrice. Vrhovi se traže po stupcima računanjem korelacije
između ulazne matrice i stupac vektora h, za udaljenost rubova od 1, 2 i 3 piksela.
Vrh se nalazi tamo gdje je korelacija jednaka 2. Tamo gdje je korelacija jednaka –2
nalazi se dol. Vektori h koji imaju paran broj elemenata prošireni su jednom nulom da
bi broj redaka matrice korelacije bio za paran broj veći od broja redaka ulazne
matrice. To će omogućiti jednostavnije uzimanje središnjeg dijela matrice. Pri
ispitivanju vrhova najznačajniji vrh je onaj pri udaljenosti 1, a najmanje značajan vrh
je pri udaljenosti 3. Ako je na nekom pikselu nađen vrh, manje značajni vrhovi na
susjednim pikselima se odbacuju. Provjera se vrši samo po stupcima jer su nam
zanimljivi jedino vrhovi po frekvenciji.
Nakon dobivenih svih vrhova potrebno je eliminirati što više komponenata koje
pripadaju šumu i izdvojiti različita piskutanja. Da bismo razlikovali pojedine piskutanja
potrebno je izvršiti “označavanje”. To označavanje se vrši labeling algoritmom, koji
svakoj 8-povezanoj komponenti (8-susjedstvo piksela) dodjeljuje jedinstveni broj.
Korištena je MATLAB funkcija (Image Processing Toolbox) “bwlabeln”. Ovim
postupkom su se odvojila različita piskutanja. Nakon označavanja traži se duljina
svake komponente i odbacuju se komponente kraće od praga. Na ovaj način
eliminira se velik dio šuma.
4. Rezultati
Slika 1.
4
Slika 2.
Slika 3.
Slika 4.
Slika 5.
Slika 6.
5
3.) Uzorak zvuka daha jedanaestogodišnje djevojčice s astmom. Spektrogram
uzorka prikazan je na slici 7. Na slici 8 je spektrogram sa svim vrhovima, a na slici 9
je spektrogram s vrhovima nakon primjene labeling algoritma i odbacivanja
komponenti kraćih od 5 piksela. Koeficijenti: c_a=1, c_b=0.
Slika 7.
Slika 8.
Slika 9.
Sva tri uzorka zvuka daha su uzeta sa [4]. U svim uzorcima je prisutno dosta šuma,
što je otežalo detekciju. Zbog nesavršenosti metode, posebno dijela u kojem se šum
eliminira na temelju trajanja pronađenih komponenti, imali smo velik broj lažnih
detekcija.
5. Zaključak
6
Nepotpunost kriterija za razlikovanje piskutanja od šuma.
Metodu je moguće poboljšati uvođenjem kriterija za izdvajanje piskutanja iz
šuma na temelju intenziteta i trajanja pojedine komponente. U [1] je upotrebljen
eksponencijalno vremensko ovisni kriterij. Prema tom kriteriju jačina komponente
mora bi to veća što je njena duljina manja, da bi bila prihvaćena kao piskutanje.
Dodatno poboljšanje postiglo bi se i spajanjem pojedinih komponenti koje su
dovoljno blizu u vremenu i frekvenciji u jednu komponentu, nakon što je primijenjen
kriterij za razlikovanje piskutanja od šuma. Time bi se izbjeglo lažno prepoznavanje
više piskutanja tamo gdje se nalazi samo jedno.
6. Literatura