Professional Documents
Culture Documents
Tsne Nemeth Kristof Isy54f
Tsne Nemeth Kristof Isy54f
Döntéstámogató rendszerek
TSNE eljárás
Sorra vesszük az összes adatpontot, egy normális eloszlás közepébe helyezzük, majd vesszük
az euklideszi távolságot a közte és a többi pont között. Ez alapján képet kapunk arról, hogy
mekkora valószínűséggel választaná 2 adatpont „szomszédnak” egymást.
Normalizáljuk ezeket az értékeket, az összes pont valószínűsége alapján:
Ez a fentihez hasonló képlet, viszont itt normál eloszlás helyett T-eloszlást alkalmazunk.
Ezek után a két fenti eloszlás Kullback–Leibler relatív entrópiáját minimalizáljuk, ez
határozza meg az pontok pozícióját.
Az egyik hangolható argumentum a perplexity, ajánlott értéke 5-50 szokott lenni. Megadja, hogy hány
közeli szomszédja legyen egy adatpontnak. Továbbá, számít a végeredmény szempontjából iterációk
száma is. És mivel az első lépésben random helyezzük el a pontokat, ezért a folyamat más eredményt
adhat ugyan olyan paraméterek mellett is.
https://towardsdatascience.com/t-sne-python-example-1ded9953f26
https://distill.pub/2016/misread-tsne/
https://en.wikipedia.org/wiki/T-distributed_stochastic_neighbor_embedding
https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence