Professional Documents
Culture Documents
Razvoj Merno-Informacionog EEG Sistema Za Istraživanje Uticaja Kognitivnih Stanja Na Prostorno Razmišljanje I Logičko Rezonovanje
Razvoj Merno-Informacionog EEG Sistema Za Istraživanje Uticaja Kognitivnih Stanja Na Prostorno Razmišljanje I Logičko Rezonovanje
Kratak sadržaj – Rad istražuje primenu EEG tehnologije u analizi kognitivnih procesa tokom igranja video
igre "Minolovac". Fokusiran na Emotiv EPOC sistem, procesiranje EEG signala, i evaluaciju klasifikacije i
regresije, rad pruža dublje razumevanje neuroloških aspekata igračkog iskustva. Kroz implementaciju u
Python-u i korišćenje Streamlit interfejsa, istraživanje olakšava analizu rezultata, naglašavajući značaj
analize EEG signala za personalizovane sisteme povratnih informacija i unapređenje iskustva igranja.
.
Ključne reči: EEG, video igre, Minolovac, Emotiv EPOC, mašinsko učenje, klasifikacija, regresija,
prostorno razmišljanje, logičko rezonovanje, Python, Streamlit.
1. UVOD
Analiza elektroencefalografskih (EEG) signala izmerenih tokom igranja video igrica predstavlja fascinantno
polje preseka mnoštva nauka, između ostalog: neurologije, biomedicine, matematike, i psihologije. Ovo novo
istraživačko područje unosi značajne mogućnosti za unapređenje ljudskog razumevanja moždanog
reagovanja na interaktivne digitalne stimulanse. U ovom naučno-istraživačkom radu, dublje će se zalaziti u
analizu EEG signala u kontekstu igranja video igrica; razlažući ovu temu na manje, razumljivije korake.
Pre svega, ključno je prvo razumeti osnove EEG signala – EEG je neinvazivna neuroimaging tehnika koja
beleži grupnu (sumarnu) električnu aktivnost neurona iz kore velikog mozga. Elektrode postavljene na
skalpu mere fluktuacije napona koje proizilaze iz kolektivne aktivnosti hiljada neurona pri izvršavanju bilo
koje misli ili radnje. EEG pruža visoku temporalnu rezoluciju, omogućavajući nam da uhvatimo aktivnost
mozga u stvarnom vremenu.
Video igrice, u 21. veku, evoluirale su u široko prihvaćen oblik zabave, a i kognitivnog angažovanja (tj.
zanimacije). Igrači, kada ih koriste, prolaze kroz kompleksne virtuelne okoline, donose brze odluke i
doživljavaju širok spektar emocija tokom samog procesa igranja. Ovi interakcioni procesi čine video igrice
jednim od idealnih polja za proučavanje kognitivnih procesa, pažnje, regulacije emocija i učenja u
kontrolisanom, ali pritom i dinamičnom okruženju.
Ovde predstavljeno istraživanje se fokusira na inovativan pristup razumevanju toga kako kognitivni procesi
utiču na performanse u zadacima koji zahtevaju prostorno razmišljanje i logičko zaključivanje. Korišćeni su
EEG signali prikupljeni tokom igranja Majkrosoftove igrice Minesweeper (u duhu srpskog jezika:
Minolovac), putem komercijalizovanog uređaja Emotiv EPOC.
Podaci prikupljeni na ovaj način su korišćeni za obuku modela baziranog na veštačkoj inteligenciji (eng.
Artificial Intelligence; AI); tačnije na mašinskom učenju (eng. Machine Learning; ML). Ovaj model ima
zadatak da na osnovu EEG signala predviđa performanse igrača, konkretno: ishod igrice (pobeda ili poraz) i
vreme potrebno za završetak (u sekundama).
Integrirani pristup ne samo da otkriva dinamične veze između kognitivnih procesa, već takođe prikazuje
bazu za razvoj sopstvene metodologije za analizu i tumačenje kognitivnih stanja na osnovu EEG signala.
Plan istraživanja uključuje razvoj sistema za procesiranje i sinhronizaciju EEG podataka, nakon toga za
klasifikaciju i regresiju, i na kraju za analizu rezultata – kako bi se potvrdila hipoteza o mogućnosti
predviđanja performansi na osnovu EEG signala.
Na Sl. 1 ispod je prikazana blok šema jednog složenog EEG sistema, koji u sebi sadrži bitne elemente i
pojmove o kojima će biti priče u daljem tekstu.
Slika 1. Blok šema složenog BCI sistema baziranog na ML (sa posebnim akcentom na feedback-u)
3. EEG OPSEZI
EEG frekventni ospezi (eng. bands) predstavljaju različite frekvencije električnih oscilacija koje se mogu
uočiti na snimcima. U ovom radu oni su iskorišćeni za formiranje nekih od obeležja – zato što dovoljno
distinktni; svaki opseg ima svoje karakteristike i povezan je sa određenim stanjima svesti i mentalnim
procesima (Sl. 3). Nazive su dobili iz grčkog alfabeta, i to po redosledu otkrića.
Slika 3. Matrica veza između mentalnog stanja i različitih EEG opsega, dobijena putem neuroimaging-a
3.1. Alfa (α) talasi
Tokom igranja video igrica, prisustvo ili odsustvo alfa talasa može pružiti uvide u nivo pažnje i
angažovanosti igrača. Smanjena alfa moć u određenim delovima mozga može ukazivati na povećanu pažnju i
kognitivno angažovanje (uz to ide i kognitivno opterećenje), sugerišući da je igrač duboko uronjen u igru.
Takođe, analogno prethodno rečenom, mogu otkriti nivo stresa ili opuštanja igrača. Povećana alfa moć,
posebno u okcipitalnom regionu, može ukazivati na stanje opuštanja, dok smanjenje aktivnosti alfa može
značiti stres ili povećanu emocionalnu uzbuđenost.
Dugotrajna visoka aktivnost alfa talasa, posebno u odsustvu angažujućih stimulansa, može ukazivati na
mentalni umor ili dosadu. Developeri igrica mogu koristiti ove informacije da identifikuju trenutke kada
igrači mogu da se isključe iz igrice zbog percipirane monotonije.
Pošto EEG tehnologija omogućava povratne informacije u realnom vremenu i prilagodbu u video igricama,
podaci o alfa talasima se mogu koristiti da prilagode nivo težine igrice ili da uvedu umirujuće elemente kao
odgovor na stres igrača, stvarajući tako prilagođeno i uživanje igračko iskustvo.
3.2. Beta 1 (β1) talasi
Pri igranju video igrica, povećanje moći niskih beta talasa može sugerisati da igrač aktivno koncentriše na
zadatke unutar igrice, kao što su strategija, donošenje odluka ili rešavanje novonastalih problema (bez obzira
na to da li su već viđeni). Pošto su povezani i sa senzomotornom obradom, njihova analiza može pružiti
uvide u performanse motoričkih veština igrača. Visok nivo aktivnosti niskih beta talasa može ukazivati na
preciznu kontrolu radnji unutar igrice, kao što su nišanjenje, ciljanje ili navigacija kroz kompleksne igračke
okoline.
Praćenje promena u niskim beta talasima tokom vremena može pomoći u proceni učenja i prilagođavanja
igrača unutar igrice. Povećanje snage niskih beta talasa može ukazivati na to da igrač postaje veštiji u
mehanici ili strategijama neke igrice. Inverzno u odnosu na alfa, ali sa istim zaključkom: prekomerno visok
nivo aktivnosti niskih beta talasa može ukazivati na kognitivno opterećenje ili stres tokom izazovnih
scenarija igrice – ove informacije mogu pomoći da se izbalansira težina igrice (ovo konkretno važi za sve
opsege).
3.3. Beta 2 (β2) talasi
Uloga visokih beta talasa u analizi video igrica se ogleda u intenzivnoj kognitivnoj obradi i aktivnom
rešavanju složenih zadataka. Povećanje snage visokih beta talasa može ukazivati na to da je igrač duboko
uronjen u strateško razmišljanje, rešavanje problema tokom scenarija koji podrazumevaju visok pritisak na
performanse igrača, iliti multitasking unutar igrice.
Kao i niski beta talasi, visoka beta aktivnost može biti povezana sa preciznom motoričkom kontrolom; gde je
tajming jako bitan. Štaviše, promene u obrascima visokih beta talasa tokom vremena ukazuju na učenje i
razvoj veština igrača. Povećanje snage visokih beta talasa može da sugeriše da igrač postaje veštiji u
savladavanju mehanike igrice ili strategijama.
3.4. Gama (γ) talasi
U analizi video igrica gama talasi nam govore o poboljšanoj percepciji i pažnji – povećanje gama snage
može ukazivati da je igrač intenzivno usmeren na vizuelne i auditivne signale igrice, poboljšavajući njihov
stepen reaktivnosti. Video igrice često uključuju kompleksna senzorna iskustva, kombinujući vizuelne,
auditivne i ponekad taktilne elemente. Analogno njihovoj biološkoj ulozi, gama talasi i ovde pomažu
postizanju sinhronizacije različitih stimulansa.
Procesi memorije su vitalni u video igricama, posebno za sećanje na pravila igrice, strategije i prostorne
informacije – analizom gama talasa možemo otkriti neuronske mehanizme iza kodiranja i oporavka
memorije tokom igranja. U strategijskim ili slagalicama, igrači se bave rešavanjem složenih problema –
povećanje gama aktivnosti može ukazivati na aktivno kognitivno procesiranje vezano za rešavanje izazova ili
slagalica unutar igrice. Posmatranjem koherentnosti gama talasa može se pružiti uvid u to kako različite
moždane oblasti komuniciraju tokom igranja. [6]
Spektar EEG signala je strukturiran tako da ima manju snagu na višim frekvencijama, što približno sledi 1/f
obrazac – to znači da je snaga signala obrnuto proporcionalna frekvenciji, tj. da niske frekvencije imaju veću
snagu nego visoke frekvencije.
Video igrice se mogu koristiti za stimulaciju mnogih delova mozga, a snaga EEG signala može pružiti uvid u
to kako se različiti delovi mozga aktiviraju tokom igranja video igrica
Ukratko, snaga EEG signala je korisna alatka kada se analiziraju podaci prikupljeni tokom igranja video
igrica, koja nam pruža daleko širu sliku o tome šta se događa u našim mozgovima. [7]
4. MINOLOVAC
Minolovac je popularna jednoigračka slagalica razvijena od strane Microsofta, često prisutna na različitim
operativnim sistemima. Ova kultna igra zahteva od igrača da koriste svoju logiku i sposobnost dedukcije
kako bi otkrili skrivene mine na igraćoj tabli, a pritom izbegli aktiviranje bilo koje od njih. [8]
Cilj igre:
Glavni cilj Minolovca je otkriti sve kvadrate na tabli koji ne sadrže mine.
Igrač pobeđuje kada su svi sigurni kvadrati otkriveni, što znači da su sve mine bezbedno označene.
Tok igre:
Da bismo ilustrovali neke od složenijih scenarija, razmotrimo sledeći primer (vidljiv na Slici 5 ispod):
Ako se usredsredimo na izolovani kvadrat 2 (koji se nalazi između dva kvadrata sa brojem 1), tj. na
8 kvadrata oko njega, primećujemo da postoje 3 neproverena polja u njegovoj neposrednoj blizini
(iznad njega). Pošto nijedno od 5 već otkrivenih polja oko tog kvadrata ne krije mine, to implicira da
obe od tih 3 neproverena polja ne sadrže mine.
Kako bismo odredili lokacije mina, koristimo informaciju iz dva kvadrata sa brojem 1 - ako bismo
pretpostavili da su 2 mine na leva dva neproverena polja od tih 3, to bi značilo da su i dva kvadrata
sa brojem 1 iznad tih 2 mina, što nije moguće.
Slično razmišljanje primenjujemo na desni kvadrat sa brojem 1. To nas dovodi do zaključka da se 2
mine nalaze u neposrednoj blizini kvadrata 2, tačno iznad dva pomenuta kvadrata sa brojem 1.
Nakon ovih zaključaka, možemo bezbedno kliknuti (otvoriti) kvadrat direktno iznad kvadrata 2, kao
i kvadrate levo i desno od dva kvadrata za koja smo utvrdili da sadrže mine.
Bodovanje:
Ova verzija Minolovca dodaje dodatan sloj kompleksnosti klasičnoj igri, stavljajući veći naglasak na
deduktivno zaključivanje i logičko razmišljanje. Obezbeđujući rešivost, igrači mogu pristupiti svakoj igri s
uverenjem da postoji logičan put do pobede, uz pažljivu analizu tragova na tabli i primenu odgovarajućih
strategija za otkrivanje mina i čišćenje sigurnih polja.
4.3.Analiza EEG-a tokom igranja Minolovca
Analiziranje moždane aktivnosti tokom igranja uvek rešive verzije igre može dati vredan uvid u kognitivne
procese, donošenje odluka i rešavanje problema. Neki od zaključaka i saznanja koja se mogu izvući iz takve
analize su da:
Podaci mogu otkriti kognitivno opterećenje koje igrači doživljavaju prilikom donošenja odluka u
Minolovcu.
Analiza pomaže da se identifikuju neuronski korelati procene rizika tokom igrice. Promene u
moždanoj aktivnosti mogu otkriti emocionalne reakcije, kao što su anksioznost ili olakšanje, kada
igrači naiđu na mine ili bezbedna polja.
Praćenje neuronskih podataka u više igrica može pružiti uvid u krivu učenja u Minolovcu. Promene
u moždanoj aktivnosti mogu odražavati poboljšanje veština i razvoj efikasnijih strategija za
rešavanje problema.
Nedostatak dovoljno kvalitetnih EEG podataka i statistike igre može otežati obuku i testiranje
modela, što može dovesti do preprilagođavanja.
Teško je uhvatiti složene kognitivne procese u igri Minolovac putem EEG podataka, što može
dovesti do pojednostavljenja i nedovoljnog razumevanja ljudskog razmišljanja.
Dinamična priroda igre Minolovac otežava modelima ML-a praćenje brzih promena u ponašanju
igrača.
Ograničenost konteksta - modeli ML-a nemaju pristup važnim kontekstualnim informacijama i
namerama igrača.
Složenost i teškoća u tumačenju nekih ML algoritama.
ML modeli mogu postići razumnu tačnost predviđanja ishoda i vremena završetka igre uz
odgovarajuće podatke i izbor modela.
Personalizacija predviđanja za pojedinačne igrače uzimajući u obzir njihove kognitivne razlike.
Mogućnost kontinuirane obuke modela sa sve više dostupnih podataka za poboljšanje tačnosti
predviđanja.
Automatizacija procesa predviđanja čini ga efikasnim i skalabilnim.
Mogućnost automatskog identifikovanja važnih karakteristika unutar podataka olakšava
istraživačima razumevanje kognitivnih procesa u igri Minolovac putem EEG obrazaca.
5.EMOTIV EPOC
Emotiv EPOC predstavlja napredan neurotehnološki uređaj za snimanje i analizu moždanih signala. Ovaj
uređaj omogućava korisnicima da interagiraju s računarima i drugim uređajima koristeći svoje moždane
aktivnosti. Postoje verzije uređaja i za istraživačke i za potrošačke svrhe, pri čemu istraživačke verzije sadrže
više elektroda i naprednije funkcionalnosti. Emotiv EPOC ima širok spektar primena, uključujući video igre,
virtuelnu stvarnost, istraživanje kognitivnih funkcija, neurofeedback terapiju i mnoge druge. Ovaj uređaj
omogućava korisnicima kontrolu virtualnih objekata, upravljanje sučeljima bez dodira i praćenje vlastite
koncentracije i emocionalnog stanja. Emotiv EPOC predstavlja značajan napredak u oblasti Brain-Computer
Interface (BCI) i otvara mogućnosti za razvoj inovativnih aplikacija i istraživanje u različitim oblastima,
unapređujući ljudske performanse.
5.1.Specifikacije i ključne karakteristike sistema
Najbitnije karakteristike Emotiv EPOC sistema uključuju:
Broj elektroda: Sistem obično ima 14 ili 16 elektroda postavljenih preko glave kako bi snimio
moždanu aktivnost iz različitih regija.
Senzori: Koristi senzore na bazi fiziološkog rastvora koji omogućavaju dobar kontakt s kožom glave
radi prikupljanja EEG signala.
Bežično povezivanje: Omogućava bežično povezivanje s računarom ili mobilnim uređajem putem
Bluetooth-a.
Frekvencija odabiranja: Obično je podešena na 128 Hz.
Rezolucija: Analognu-digitalnu konverziju vrši u 14-bitnom formatu, što čini sistem
visokoresolutnim.
Žiroskop i akcelerometar: Koristi ih za praćenje pokreta i orijentacije glave, što se može integrisati u
aplikacije koje uključuju virtualnu stvarnost, proširenu stvarnost i prepoznavanje pokreta glavom.
Baterije: Napajanje je osigurano putem punjive litijum-polimerske baterije, koja obično omogućava
nekoliko sati neprekidnog korišćenja s jednim punjenjem.
Kompatibilnost: Emotiv pruža kompletan razvoj softvera i API-je za kompatibilnost s različitim
platformama, uključujući Windows, macOS i Android.
Softver: EmotivPRO se koristi za vizualizaciju podataka, real-time obradu signala i razvoj aplikacija.
Izlazni podaci: Podaci se čuvaju u standardnim formatima poput CSV-a ili JSON-a, što olakšava
analizu i primenu metoda strojnog učenja.
Omogućava praćenje EEG signala u stvarnom vremenu, što je korisno u različitim aplikacijama koje
zahtevaju trenutne informacije o moždanoj aktivnosti.
Koristi se u širokom spektru aplikacija, uključujući neuroznanstvena istraživanja, kognitivni trening,
interakciju čoveka i računara, kao i igranje video igara.Slušalice su dizajnirane s udobnošću
korisnika na umu, s podesivim trakama i laganim dizajnom kako bi se osiguralo sigurno i udobno
nošenje tokom duže upotrebe.
6.PROCESIRANJE SIGNALA
Svaki signal, nakon što je filtriran u analognom i digitalnom domenu, treba dodatno procesirati, ne bi li ga
doveli u nama pogodan oblik za analizu. To uključuje razne tehnike koje imaju za cilj da odstrane sve ono
što nam nije potrebno, a da pritom i naglase sve ono što je bitno.
6.1.Mašinsko učenje
Mašinsko učenje (ML) predstavlja ključnu granu veštačke inteligencije (AI), fokusiranu na razvoj tehnika i
algoritama koji omogućavaju računarima da uče i izvode zaključke iz podataka bez eksplicitnog
programiranja. Ovaj koncept igra ključnu ulogu u analizi podataka i donošenju informisanih odluka u
različitim oblastima, uključujući medicinu, ekonomiju, marketing, industriju i mnoge druge. Na početku,
algoritam za ML se trenira na osnovu skupa podataka koji može sadržavati različite vrste informacija, poput
teksta, slika, brojeva ili drugih podataka. Tokom treninga, algoritam uči prepoznavanje obrazaca i veza
između podataka. Primarni cilj ML-a je omogućiti algoritmu da generalizuje svoje znanje i primeni ga na
nove, nepoznate podatke. Ovo se postiže identifikacijom skrivenih obrazaca u trening podacima i
korišćenjem tih obrazaca za donošenje predviđanja ili klasifikacije novih podataka. Postoje različite vrste
ML, uključujući nadgledano učenje (gde se algoritam trenira na parovima ulaza i izlaza), nenadgledano
učenje (gde algoritam uči bez tačnih odgovora) i pojačano učenje (koje se koristi za razvoj sistema koji
donose odluke kako bi maksimizovali nagrade) Primenom ML-a u analizi podataka postižu se različiti
ciljevi, uključujući predviđanje budućih događaja, klasifikaciju podataka, segmentaciju grupa podataka i
otkrivanje anomalija. Svaka primena ML zahteva odgovarajuću pripremu i obradu podataka, uključujući
čišćenje podataka od nedostajućih vrednosti, skaliranje i normalizaciju podataka. Jedan od izazova u ML-u je
overfitting, kada model previše uči trening podatke i ne uspeva dobro da generalizuje na nove podatke. Ovaj
problem se često rešava tehnikama poput regularizacije i validacije modela. Važno je napomenuti da izbor
odgovarajućeg algoritma za ML zavisi od specifičnog zadatka i vrste podataka sa kojima se radi. Postoje
različiti algoritmi, uključujući algoritme za duboko učenje koji su posebno moćni za analizu složenih
podataka poput slika, zvuka ili prirodnog jezika. ML ima ključnu ulogu u analizi kompleksnih naučnih
podataka, poput genomske analize, astrofizičkih podataka ili analize klimatskih modela. Ova tehnologija se
kontinuirano razvija, transformišući naše društvo na različite načine. Primeri primene uključuju pobedu
programa AlphaGo nad svetskim šampionom u igri Go [10], analizu medicinskih slika, razvoj autonomnih
vozila, primenu ML na uređajima (edge AI), generativne modele, optimizaciju sportskih performansi, kao i
korišćenje chat botova i virtuelnih asistenata u svakodnevnom životu. Ovim se ilustruje širina i dubina
primene ML-a u različitim aspektima života i industrije, pružajući bolje razumevanje i informacije za
donošenje odluka.
6.2.Proziranje
Prozoriranje je ključna tehnika u obradi EEG signala koja omogućava temporalnu analizu. Ova metoda deli
EEG signal na manje segmente, olakšavajući analizu oko specifičnih događaja. Prozoriranje pretpostavlja
stacionarnost unutar svakog segmenta, što je važno za primenu statističkih i spektralnih analiza. U
mašinskom učenju, prozori su ključni za ekstrakciju karakteristika, omogućavajući relevantne ulaze za
modele predviđanja. Ova tehnika doprinosi efikasnijoj analizi EEG signala i poboljšava performanse modela
u prepoznavanju obrazaca.
6.3.Matrica obeležja i vektor klasa
Matrica obeležja organizuje EEG podatke u tabelu gde redovi predstavljaju različite uzorke, a kolone
karakteristike svakog uzorka. Obeležja mogu biti statistike igre ili izvedena merenja iz EEG podataka. Ova
matrica omogućava formatiranje podataka za mašinsko učenje, pružajući numeričku reprezentaciju koju
modeli mogu razumeti. Vektori klasa su oznake koje označavaju kategorije kojima svaki uzorak pripada. U
kontekstu EEG analize, oni mogu predstavljati ishode kao što su pobeda ili poraz. Oni se koriste kao ciljne
vrednosti koje model uči predviđati. Vektori klasa daju smernice modelu, a tokom obuke model prilagođava
svoje parametre kako bi što bolje predvideo te kategorije. Kombinacija matrice obeležja i vektora klasa
ključna je za prediktivno modeliranje EEG signala. [11] Ovaj pristup omogućava razvoj modela za
klasifikaciju i predviđanje ishoda na osnovu karakteristika izdvojenih iz EEG podataka.
6.4.Korelacija i kros-varijansa
Korelacija je statistička mera koja kvantifikuje linearni odnos između dva ili više skupa podataka. Vrednosti
se kreću između -1 i 1, gde pozitivna vrednost ukazuje na pozitivnu korelaciju, a negativna na negativnu
korelaciju. Visoka pozitivna korelacija sugeriše na sinhronizaciju, dok niska ili negativna ukazuje na
asinhroniju. Korelacija se često koristi za proučavanje funkcionalne povezanosti u mozgu, identifikujući
koordinaciju između različitih moždanih regiona. Kros-varijansa je mera zajedničke varijabilnosti između
dve slučajne varijable. Ova mera kvantifikuje kako se dve varijable zajedno menjaju. Pozitivna kros-
varijansa ukazuje na rast zajedno, negativna na opadanje zajedno, a nulta na nedostatak veze. Unakrsna
kovarijanca pruža informacije o vremenskim odnosima između dva prozora EEG signala, identifikujući
vremenska kašnjenja ili interakcije između različitih kanala ili regiona mozga. Ove metode su ključne za
analizu odnosa i zavisnosti između segmenata ili kanala EEG signala, omogućavajući bolje razumevanje
funkcionalne povezanosti u mozgu tokom određenih zadataka ili stanja.
6.5.Klasifikacija i regresija
Klasifikacija se koristi za dodeljivanje uzoraka unapred definisanim kategorijama, dok se regresija koristi za
procenu kontinuiranih vrednosti. U analizi EEG signala, klasifikacija može predviđati ishode kao što su
"pobeda" ili "poraz," dok regresija može procenjivati vreme (u sekundama) potrebno za završetak igre.
Algoritmi, poput stabala odlučivanja ili neuronskih mreža, uče obrasce iz matrice obeležja i vektora klasa.
Evaluacija modela klasifikacije koristi metrike poput tačnosti, preciznosti, opoziva i F1 rezultata. Tačnost
meri ukupnu ispravnost predviđanja, dok preciznost i opoziv ocenjuju sposobnost modela da tačno
identifikuje specifične klase, poput pobedničkih partija. Regresioni modeli se ocenjuju srednjom apsolutnom
greškom i srednjom srednjom kvadratnom greškom, kvantifikujući tačnost predviđanja vremena završetka.
Klasifikacija i regresija su ključne tehnike nadgledanog učenja za predviđanje ishoda i vremena završetka u
analizi EEG podataka. Razlika između ove dve tehnike ogleda se u vrsti ishoda koji se predviđaju:
kategorički za klasifikaciju i kontinuirani za regresiju.
6.6.Klasifikator vektora podrške
Support Vector Machine (SVM) je snažan algoritam za klasifikaciju i regresiju u analizi EEG signala. SVM
pronalazi hiperravan koja maksimizira razmak između tačaka različitih klasa ili predviđa numeričke
vrednosti. Fokusira se na vektore podrške, tačke najbliže hiperravni, i maksimizira njihovu udaljenost,
poboljšavajući generalizaciju modela.
Prednosti SVM-a u analizi EEG podataka:
Efikasan je za rad sa velikim skupovima podataka i atributima.
Može se koristiti za klasifikaciju različitih podataka, podržavajući različite kernel funkcije za rad s
nelinearnim podacima.
Otporan je na overfitting zbog maksimizacije razmaka između klasa.
Mane:
SVM-a uključuju potrebu za pažljivim odabirom parametara, kao što su C (koji kontroliše meku ili
tvrdu marginu) i tip kernel funkcije.
Za velike skupove podataka i/ili veliki broj atributa, obučavanje SVM-a može biti vremenski
zahtevno.
Modeli zasnovani na SVM-u često su teški za interpretaciju.
U kontekstu Minolovca, SVM klasifikator može biti koristan za predviđanje ishoda partija. Ako postoje
podaci o različitim aspektima igre, kao što su broj poteza ili veličina igre, SVM može obučiti model koji
razdvaja podatke na osnovu tih atributa i predviđa ishod partije (pobeda/poraz).
6.7.Klasifikator stabla odlučivanja
Decision Tree Classifier (DTC) koristi se za klasifikaciju podataka na osnovu niza atributa. DTC je grafički
model sastavljen od čvorova i grana, predstavljajući logičke odluke za razdvajanje podataka. Proces
odlučivanja u DTC počinje s korenskim čvorom koji predstavlja najbitniji atribut za deljenje podataka. Svaki
čvor predstavlja test na određeni atribut, a grane čvora predstavljaju moguće vrednosti tog atributa. Proces se
nastavlja kroz drvo do listova koji predstavljaju klase ili izlazne vrednosti.
Prednosti DTC-a u analizi EEG podataka:
Lako je interpretiran, predstavljajući se kao niz ako-onda pravila.
Može se koristiti s kategoričkim i numeričkim podacima bez velikog napora.
Efikasno radi s nesimetričnim i neizbalansiranim podacima.
Mane:
DTC-a uključuju mogućnost overfittinga, posebno ako se ne primene odgovarajuće metode
prekidanja i upravljanja overfittingom.
Male promene u podacima mogu dovesti do značajnih promena u strukturi drveta, čineći ga
nestabilnim.
U kontekstu Minolovca, DTC može biti koristan za predviđanje ishoda partija. Ako imate podatke o
različitim aspektima igre (npr. broj poteza, veličina igre, raspoloženje mina), možete trenirati DTC na tim
podacima i koristiti ga za klasifikaciju partija. Ipak, trebate biti oprezni s overfittingom i nesimetričnim
podacima, primenjujući tehnike poput obrezivanja (pruning) i obrade podataka za optimalne rezultate.
6.8.Klasifikator slučajne šume
Random Forest Classifier (RFC) je ansambl algoritam u mašinskom učenju koji se koristi za klasifikaciju i
regresiju, zasnovan na ideji umnožavanja Decision Tree Classifier-a (DTC) radi poboljšanja predviđanja
ishoda. Proces rada RFC-a počinje generisanjem slučajnog skupa podataka iz trening seta (podskup
podataka). Zatim se nad ovim slučajnim skupom podataka gradi nekoliko drveta odluke. Svako od ovih
drveta radi nezavisno i predviđa klasu za dati ulazni primerak. Klasifikacija se vrši putem glasanja, gde
svako DTC ima jedan glas za klasu koju predviđa, a klasa s najviše glasova postaje finalni ishod
klasifikacije.
Prednosti RFC-a u analizi EEG podataka:
Robustnost na autlajere i šum u podacima.
Često postiže dobre rezultate bez potrebe za dubokim ili kompleksnim modelima.
Otpornost na overfitting, jer se specifičnost RFC-a ograničava slučajnim izborom podskupa
podataka i atributa, što pomaže u smanjenju overfittinga.
Mane RFC-a:
Izgradnja velikog broja DTC-ova može biti vremenski i računski zahtevna operacija.
Konsolidovanje rezultata iz velikog broja stabala može biti komplikovano, što otežava interpretaciju
modela.
U kontekstu predikcije ishoda Minolovac partija, glavna prednost RFC-a leži u sposobnosti obrađivanja
velikog broja faktora i izbegavanju overfittinga. Važno je obratiti pažnju na hiperparametre i važnost atributa
kako bi se postigli najbolji rezultati pri korišćenju ovog klasifikatora.
6.9.Upoređivanje klasifikatora
Support Vector Classifier (SVC) se ističe na složenim podacima, dok Decision Tree Classifier (DTC) pruža
jednostavnu interpretaciju. Random Forest Classifier (RFC) kombinuje robustnost i dobre performanse, ali
može biti vremenski zahtevan. Odabir algoritma zavisi od prirode podataka i resursa računara. Važno je
praktično testiranje za optimalan izbor.
6.10.Theil-Sen regresor
Theil-Sen regresija je robustan i neparametrički metod koji ne zahteva pretpostavke o raspodeli podataka.
Ova metoda je efikasna i otporna na prisustvo anomalija. Iako može izgubiti informacije o varijabilitetu,
korisna je za analizu veza između faktora poput broja poteza i vremena trajanja Minolovac partije. Važno je
imati na umu da može biti izazovna sa velikim brojem podataka.
6.11.Razlika između Linearnog i Theil-Sen
Linear Regression (LR) modelira linearnu vezu između promenljivih, pretpostavljajući konstantan
koeficijent. Theil-Sen Regresija (TSR) je neparametrički metod koji ne zahteva pretpostavku o linearnosti
veze, koristeći medijanu sklonova. LR je osetljiv na autlajere, dok je TSR robustan i efikasno se nosi s njima.
LR ima pretpostavke o linearnosti i normalnosti podataka, dok TSR ne zahteva takve pretpostavke. Odabir
između njih zavisi od karakteristika podataka; TSR može biti bolji izbor s autlajerima ili kada linearnost nije
očigledna, dok LR može biti prikladniji kada su ispunjene pretpostavke o linearnosti.
6.12.Regresor na bazi gradijentnog pojačanja
Gradient Boosting Regresija (GBR) je snažan algoritam za predviđanje neprekidnih vrednosti, pripadajući
grupi ansambl algoritama. Proces počinje sa baznim modelom, obično jednostavnim drvetom odlučivanja.
Naredni modeli se grade tako da koriguju preostalu pogrešku prethodnog, postižući visoku prediktivnu
sposobnost. GBR je robustan na anomalije i koristan za različite tipove podataka. Ipak, može biti vremenski
zahtevan i sklon preletanju, zahtevajući pažljivo podešavanje parametara. U kontekstu Minolovac partije,
GBR može efikasno modelirati nelinearne veze između faktora i vremena trajanja igre, ali zahteva precizno
podešavanje parametara radi optimalnih predikcija.
6.13.Regresor na bazi multislojnog perceptrona
Multislojni perceptron (MLP) ili neuronska mreža je moćan algoritam za regresiju i klasifikaciju. Sastoji se
od slojeva neurona - ulaznog, skrivenih i izlaznog. Trenira se optimizacijom težina kroz algoritme poput
gradijentnog spusta. MLP je efikasan u modeliranju složenih nelinearnih veza, prilagodljiv kroz
konfiguraciju slojeva i neurona. Međutim, zahteva obiman skup podataka i može biti sklon preletanju ako
nije pravilno regulisan. U analizi vremena trajanja Minolovac partije, MLP se može koristiti za predviđanje
na osnovu raznolikih faktora u velikom skupu podataka.
6.14.Upoređivanje regresora
Kada se upoređuju Theil-Sen regresor (TSR), regresor na bazi multislojnog perceptrona (MLP) i regresor na
bazi gradijentnog pojačanja (GBR) na malim skupovima podataka, ključne tačke u izboru modela uključuju:
TSR: Robustan je na malim skupovima podataka i ne zahteva pretpostavke o raspodeli. Efikasan je
za nelinearne i neuniformne raspodele, ali može biti manje precizan ako podaci i veza nisu linearni.
MLP: Može modelirati složene nelinearne veze, ali je osetljiv na overfitting na malim skupovima.
Zahteva više podataka i može biti izazovan za obučavanje, ali je moćan za precizno modeliranje
različitih oblika podataka.
GBR: Postiže visoku tačnost regresije i obično je robustan. Prilagođava se i na malim skupovima, ali
može biti sklon overfittingu ako nisu dobro podešeni parametri.
Izbor zavisi od prirode podataka, cilja regresije i dostupnih resursa. TSR je dobar za robustnost, MLP za
nelinearne veze s dovoljno podataka, a GBR za visoku tačnost uz dodatne podatke. Važno je prilagoditi izbor
specifičnim zahtevima problema.
6.15.Evaluacija performansi klasifikatora
U evaluaciji klasifikacionih modela, ključne metrike obuhvataju:
• Matricu konfuzije: Ovo je ključni alat za analizu performansi klasifikacionih modela. Uključuje
četiri osnovne vrednosti: True Positives (TP), False Positives (FP), True Negatives (TN), i False
Negatives (FN).
• Tačnost (Accuracy): Mera ukupnog broja tačnih predikcija u odnosu na ukupan broj instanci u
testnom skupu.
• Preciznost (Precision): Mera tačnosti pozitivnih predikcija, korisna za smanjenje False Positives.
• Odziv (Recall ili True Positive Rate): Mera identifikacije pravih pozitivnih instanci, važna za
smanjenje False Negatives.
• Specifičnost (Specificity): Mera sposobnosti modela da identifikuje sve True Negatives.
• F1-skor: Harmonijski odnos između preciznosti i odziva, koristan za postizanje balansa između ove
dve metrike.
• AUC-ROC: Površina ispod Receiver Operating Characteristic (ROC) krive, korisna za procenu
performansi u situacijama sa neravnoteženim klasama.
• Klasifikacioni izveštaj: Pruža informacije o preciznosti, odzivu, F1-skoru i drugim metrikama za
svaku klasu u klasifikaciji. Pomaže u brzom pregledu ukupnih performansi modela.
Matrica konfuzije omogućava dublju analizu i dijagnostiku grešaka modela, dok klasifikacioni izveštaj pruža
informacije o performansama za svaku klasu. Ovi alati zajedno omogućavaju sveobuhvatnu procenu
performansi klasifikacionih modela.
6.16.Evaluacija performansi regreesora
U evaluaciji regresionih modela, ključne metrike obuhvataju:
• Srednja kvadratna greška (MSE): Meri prosečnu kvadratnu razliku između stvarnih i predviđenih
vrednosti. Veće vrednosti ukazuju na veću grešku.
• Srednja apsolutna greška (MAE): Meri prosečnu apsolutnu razliku između stvarnih i predviđenih
vrednosti, manje osetljiva na outliere.
• Srednja apsolutna procenjena greška: Meri prosečnu relativnu grešku u odnosu na stvarne vrednosti,
korisna za razumevanje relativne tačnosti predikcija.
• R-kvadrat (R2): Meri udeo varijacije u zavisnoj varijabli koji je objašnjen modelom, sa vrednostima
od 0 do 1.
Evaluacija se često vrši na odvojenom testnom skupu podataka koji model nije video tokom treninga. Odabir
odgovarajućih metrika zavisi od specifičnog problema i cilja modela, a korisno je koristiti više metrika kako
biste dobili sveobuhvatnu sliku o performansama modela.
7.IMPLEMENTACIJA SISTEMA PUTEM PYTHON-a
Implementacija sistema putem Python-a obuhvata niz koraka od učitavanja neophodnih podataka do konačne
evaluacije modela. U prvom koraku, neophodne biblioteke i moduli uvoze se kako bi se omogućile različite
manipulacije podacima, obrada signala, primena mašinskog učenja i evaluacija modela unutar Python
okruženja. U okviru čitanja snimljenih EEG podataka, funkcija extract_data (Listing 3) dizajnirana je za
ekstrakciju informacija iz određenog direktorijuma. Tri ključne liste se inicijalizuju za čuvanje podataka o
EEG signalima (CSV), vremenskim intervalima (CSV) i dodatnim metapodacima (JSON). Nakon izdvajanja
podataka, sledi korak izvlačenja informacija o amplitudi i snazi, kreiranje imena kolona matrice obeležja,
prozoriranje EEG-a preko amplitude i snage, izvlačenje obeležja iz EEG signala i formiranje matrice
obeležja. Kroz korake klasifikacije, regresije, i evaluacije modela, koriste se različiti algoritmi mašinskog
učenja poput Support Vector Machines, Decision Trees, Random Forests, Theil-Sen Regressor, Neural
Networks i Gradient Boosting Regressor. Metrike performansi, poput tačnosti, matrice konfuzije i izveštaja o
klasifikaciji, koriste se za evaluaciju modela. Na kraju, vizualizacija dobijenih metrika i čuvanje vrednosti
skorova zatvaraju implementaciju. Program je dizajniran da se izvršava kao regularna skripta ili kao
interaktivna Streamlit aplikacija, pružajući fleksibilnost u eksperimentisanju s različitim postavkama i
opcijama. Ovaj sistem, kroz svoje raznovrsne korake, omogućava analizu EEG podataka s ciljem dubljeg
razumevanja i primene mašinskog učenja u neurološkim istraživanjima.
8.REZULTATI PREDIKCIJE I EVALUACIJE
U ovom poglavlju predstavljamo rezultate predikcije i evaluacije naše ML modela. Kroz Streamlit interfejs,
omogućili smo korisnicima da podešavaju parametre modela i pokreću eksperimente, a zatim smo prikazali
rezultate na veb stranici.
8.1.Streamlit interfejs
Streamlit je odabran kao platforma za izradu veb aplikacije zbog svoje jednostavnosti i efikasnosti.
Omogućava brzu prototipizaciju i jednostavno deljenje aplikacija za ML i nauku o podacima. Bez potrebe za
dubokim znanjem JavaScript-a ili CSS-a, Streamlit pruža intuitivan način za kontrolu elemenata na veb
stranici pomoću Python koda. Dodatno, Streamlit je optimizovan za brzinu, koristeći keš memoriju kako bi
smanjio vreme izvršavanja skripti, što ga čini pogodnim za rad s velikim skupovima podataka. Automatsko
osvežavanje omogućava trenutno ažuriranje veb stranice nakon izmena u kodu. U kombinaciji s CSS-om,
Streamlit omogućava detaljno prilagođavanje izgleda veb aplikacija. Naša aplikacija koristi CSS za
podešavanje izgleda elemenata na veb stranici.
8.2.Prikaz aplikacije
Aplikacija se pokreće pomoću naredbe streamlit run nemanja_perunicic_mas.py u terminalu. Prikazane slike
(Slika 8, Slika 9, Slika 10) predstavljaju korake kroz aplikaciju. Slika 8 Prikazuje izgled aplikacije za
podešavanje parametara i pokretanje eksperimenta. Važno je napomenuti da su svi elementi generisani
putem Streamlit komandi.
Slika 8. Streamlit – izgled aplikacije za podešavanje parametara i pokretanje eksperimenta
Slika 9 Prikazuje promene u aplikaciji nakon klika na dugme "Start". Očigledno je da aplikacija reaguje na
korisnički input.
NAPOMENA
Za proveru rada datuma 20.11.2023. korišten je softver/sajt https://www.grammarly.com/plagiarism-
checker?network=g&utm_source=google&utm_search4&matchtype=b&gclid=EAIaIQobChMlw9CU07-
l3glVR4fVCh1JUwsIEAAYASAAEgL4JvD_BwE&placement=&utm&utm_content=283084818863 za
detekciju plagijarizma, koji je ustanovio da u radu ne postoji plagijarizam.
Kratka biografija:
Kasandra Galić rođena sam u Kikindi 1994. god. Završila sam srednju medicinsku
školu “Miloš Crnjanski” u Kikindi 2013.god. Student sam master akademskih studija
programa Biomedicinsko inženjerstvo na Fakultetu tehničkih nauka u Novom Sadu.