Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

Diskriminativno učenje

Diskriminativno učenje
• Kombinacija učenja putem nagrađivanja
(kažnjavanja) i operacije razlikovanja draži
• Učenje putem nagrađivanja
– Nagrada sledi reakciju samo u prisustvu
diskriminativne draži
• Učenje putem kažnjavanja
– Kazna sledi reakciju samo u prisustvu
diskriminativne draži
Diskriminativno učenje
• Učenje razlika može da se odvija u kontekstu:
– Klasičnog uslovljavanja
– Instrumentalnog učenja
• Teorijska objašnjenja diskriminativnog učenja
– S-R teorije (apsolutna svojstva draži)
– S-S teorije (relativna svojstva draži)
• Pomeraj maksimalnog odgovora (eng. peak shift)
Model Reskorle i Vagnera
Noviji pristup klasičnom uslovljavanju
• Uslovna draž pouzdan prediktor bezuslovne draži
• Informativnost draži

• Uslovne draži = znakovi


• Bezuslovne draži = ishodi

• Cilj: učenje prediktivne strukture okruženja


• Mehanizam: korekcija greške u predviđanju ishoda
• Produkt: diskriminacija znakova po informativnosti
Model Reskorle i Vagnera
• Matematički model klasičnog uslovljavanja
• Definiše promenu jačine veze između znaka i
ishoda u jedinici vremena
t 1
V i  V  V
i
t
i
t

• Promena zavisi od odstupanja realnih ishoda od


predikcija jedinke i zasidenosti znaka i ishoda

V  io (   Vj )
i
t
Model Reskorle i Vagnera
• U tipičnoj situaciji uslovljavanja, model daje
negativno ubrzanu krivulju učenja
• Adaptivna vrednost učenja očigledna
• Pod određenim uslovima, ekvivalentan je
delta pravilu, široko zastupljenom u
mašinskom učenju
• Definitivno jedan od najuticajnijih modela u
istoriji psihologije (učenja)

You might also like