Professional Documents
Culture Documents
Kolos + Notatki
Kolos + Notatki
Kolos + Notatki
B. błędy prognoz ex ante są możliwe do wyznaczenia, gdy czas t, na który tworzono prognozę
zrealizuje się
D. błąd MAPE może zostać wykorzystany zamiast RMSPE bez strat dla poprawności oceny prognoz
2. Regresja pozorna:
B. metodę Holta
C. metodę Browna
D. metodę Wintera
A. co do zasady metoda średniej ruchomej pozwala na lepszą prognozę niż metoda naiwna
B. metoda Holta znajduje zastosowanie w takich samych przypadkach co średnia ruchoma zwykła
C. metoda Holta wymaga wykorzystania stałej wygładzania trendu i stałej wygładzania poziomu
A. zmienne oznaczające sezonowość w modelu regresji nie muszą być statystycznie istotne
8. Model Holta:
11. Jakiej metody prognozowanie zdecydowanie nie należy stosować, gdy analizowany szereg
czasowy nie ma ani trendu ani sezonowości:
A. metoda naiwna poziom bez zmian jest bardziej podatna na wahania niż metoda średniej ruchomej
prostej
B. metody naiwne powinny być traktowane jako punkt odniesienia do oceny prognoz tworzonych z
wykorzystaniem innych metod
A. jest wyrażony w % i pozwala jednoznacznie ocenić czy błędy są małe czy duże
B. mogą być wykorzystane do prognozowanie danych sezonowych o ile odwołamy się do okresów
„jednomiennych”
A. błędy prognoz są małe i zastosowana metoda bardzo dobrze prognozuje analizowane zjawisko
22. Jaką metode prognozowania można wykorzystać, gdy analizowany szereg czasowy ma
charakter sezonowy:
A. średni błąd prognozy ME równy 150 informuje o systematycznym przeszacowaniu prognozy ( jeżeli
liczymy jak w prognozowaniu czyli e=(y^ - y) to tak
NOTATKI
Ćw1.
Problemy modelowania:
Wahania sezonowe- nie dłuższy niż rok (efekt poniedziałku, rynki finansowe) może mieć charakter
addytywny (wyższe o ileś) i multiplikatywny (zużycie energii elektrycznej)
Normalność rozkładu, stacjonarność szeregu czasowego, brak rozkładu normalnego- będą miały
gruby ogon- pojawianie się wartości znacznie odstających od średniej- rozkład platykurtyczny.
Stacjonarność szeregu czasowego (słaba)-jeżeli jego średnia i wariancja są stałe, a kowariancja zależy
tylko od opóźnienia występującego między okresami, nie od konkretnego czasu od którego
zaczynami liczyć kowariancje.
Próbka a populacja
Miara skośności trzeci moment centralny standaryzowany- bardzo ważna miara „-„ lewostronna
asymetria
Rozstęp=maksimum-minimum
Czy szereg ma rozkład normalny- histogram a krzywa rozkładu normalnego, wykres kwantylowy,
testy zgodności z rozkładem (shapiro-wilka itp.), wykres skrzynkowy/ramkowy
Test Jarque-Bera: omnibusowy, test oparty o moment próby, precyzyjniej o miarę skośności i marę
kurtozy.
Test zgodności chi kwadrat- pozwala badać zgodność z dowolnym teoretycznym rozkładem.
Wykres skrzynkowy- wąsy tej samej długości i wysokości/długości prostokątów takie same
Sprawdzanie normalności- test chi kwadrat- przedziały i ile jest elementów w danej klasie,
dystrybuanta empiryczna. Excel --> rozkład normalny (x, średnia, odchylenie standardowe) i czy
interesuje nas funkcja gęstości czy dystrybuanty (szereg skumulowany) tak wyliczymy dystrybuantę
teoretyczną i potem możemy wyliczyć prawdopodobieństwo teoretyczne (różnica między
dystrybuantą) potem mnożymy przez liczebność-liczebność teoretyczna (porównujemy liczebności N
a N teoretyczne) to jest chi kwadrat (chi test) chi kwadrat=0 to odrzucamy h0 na rzecz hipotezy
alternatywnej wiec nie może być nazwane normalnym, h0-zgodność z rozkładem teoretycznym, h1-
nie ma
Wykres kwantylowy jak krańce odstają od prostej to brak zgodności z rozkładem normalnym (kwantyl
teoretyczny porównywany z kwantylem z rozkładu empirycznego)
Stopa zwrotu jest bardziej zmienna niż logarytmiczna. Logarytmiczna stopa ma rozkład bliższy
rozkładowi normalnemu- częściej ma rozkład normalny niż klasyczna stopa zwrotu. Logarytmiczna
lepsza do modeli
ĆW 2.
Prognozowanie- co, dlaczego – wybór szeregu czasowego i modelu (czy szereg ma trend,
sezonowość) dekompozycja szeregu czasowego, właściwości- stacjonarność, sezonowość, błędy
prognoz
Metoda naiwna- niewielkie wahania szeregu prognozowanego, krótkookresowe np. dzienne, punkt
odniesienia dla innych prognoz przez porównywanie, możemy stworzyć lepszą prognozę
3 GRUPA. METODA NAIWNA PRZYROST PROCENTOWY BEZ ZMIAN, GDY PRZYROSTY LEPIEJ WYRAŻAĆ
W UJĘCIU PROCENTOWYM A NIE LINIOWYM, WARTOŚCIOWYM, RZADKO SIĘ UŻYWA I ANALIZUJE
Poziom bez zmian- nie ma trendu (jutro będzie tak jak dziś) pojutrze i dalej tak samo. Będzie tak samo
jak ostatnio
Przyrost bez zmian- cena z ostatniego tygodnia + zmiana jaką zaobserwowaliśmy t-(t-1). Jutro będzie
tak jak dziś + przyrost który widzimy że się ostatnio realizuje. Ostatnia obserwacja + ostatni przyrost.
Poziom i przyrost. Przyrost razy 2 i 3
Przyrost procentowy bez zmian- rzadko stosowana, trzeba być ostrożnym, trend wykładniczy
występuje rzadko. 5% zmiany. Prognozując na jutro bierzemy ostatnią wartość t x (t/t-1). Przyrost w
ujęciu procentowym zostanie bez zmian. Ostatnia wartość jest mnożona przez iloraz
(ostatnia/pierwsza). Przyrost do potęgi 2 i 3
Metoda średniej ruchomej zwykła/prosta- zamiast spoglądania na jedną ostatnią wartość, chcemy
patrzeć na k ostatnich okresów i wyliczyć średnią. Na okres na jutro prognozuję wykorzystując
średnią z k ostatnich okresów. Im większe k czyli większa skala wygładzania tym silniejszy efekt
wygładzenia. Nie przewiduje trendu, gdy nie ma sezonowości, nie ma trendu. Poziom poziom
średnia. Średnia z 5 ostatnich okresów. (kiedy k=5) Patrzymy k okresów wstecz. Mix obserwacji i
prognoz czasami jak nie mamy już obserwacji.
Metoda średniej ruchomej uśredniającej przyrost- gdy jest trend. Weź ostatnią obserwację i dodaj
średni przyrost. Skala wygładzania wskazuje jak bardzo wygładzam przyrost. Obserwacja poprzednia
+ 5 uśrednionych przyrostów, ale wygodniej policzyć: obserwacja poprzednia + (obserwacja
poprzednia-obserwacja najpóźniejsza)/przez k. 5 przyrostów oznacza 6 okresów w tej metodzie.
Poziom + 2,3 uśrednione takie przyrosty, wcześniej zablokowana cała komórka $.
Metoda średniej ruchomej ważonej – poziom x waga + poziom x waga + poziom x waga. Nie ma
trendu, przeciętna stała wartość zjawiska. Może służyć do danych z trendem ale wtedy wzór wygląda
inaczej. Dodaj wagi. Obserwacja x waga, gdzie wagi blokujemy $. Optymalizacja wag
exceldanesolver. SOLVER pomaga nam do optymalizacji błędu np. chce minimalizować błąd
RMSPE, przez zmienianie wag, gdzie każda musi być mniejsza od 1 i musi być większa lub = 0.
Dane kwartalne, sezonowość, bez trendu, q2 podobny do q2 roku poprzedniego -jednoimienne
ME - nie jest gwarantem sukcesu. sprawdzam jak y-realizacja różni się od prognozy i obliczam średnią
odchyleń. Chcemy by błąd wynosił 0. Jeśli ME>0 to prognozy są systematycznie (stale)
niedoszacowane, za małe. ME<0 to prognozy są za duże (prognoza>realizacja). Średnia z odchyleń
. czy bardzo prognoza różni się w stosunku do realizacji. Czy jest czy nie ma stałego
obciążenia
RMSE- pierwiastek z MSE- tym mniejszy im mniejszy błąd MSE, o ile przeciętnie prognoza odchyla się
RMSPE- procentowe, jeżeli jest mniejszy od 3% to prognoza jest rewelacyjna, mniejszy niż 5% to
dobra, jeśli 5%-10% to powinniśmy się zastanowić nad wybraną metodą prognozowania. (można
zwiększyć ilość danych - długość szeregu czasowego, poszukać lepszej metody), jak powyżej 10% to
MAPE- moduł z odchyleń prognoz od realizacji, skrajne, największe odchylenia nie mają aż tak dużego
ĆW 3.
WYGŁADZANIE WYKŁADNICZE
Metoda Browna krótkoterminowe, dotyczy sytuacji kiedy nie mamy trendu i nie mamy
sezonowości. Jest stosowany gdy w danych występuje przeciętnie stała wielkość zjawiska. Patrzy na
ostatnią realizację, tylko z wagą alfa z przedziału 0;1, oprócz tego patrzymy na prognozy na okres t.
Prognoza na okres t zależy od realizacji z okresu t-1 i prognozy z okresu t-1. ALFA<0,5 Jeśli wychodzi
nam większe to znaczy, że metoda Browna nie jest optymalną metodą prognozowania. 1 realizacja to
1 prognoza. Jak alfa 1 to tak jak metoda naiwna wykres w lewo, jeśli małe wartości to wyrównanie do
poziomu średniej-dane się nie nadają. Alfa mniejsze od 0,5. Solver- optymalne rozwiązanie. Im
mniejsze alfa tym bardziej wygładzony staje się szereg. Np. minimalizacja błędu RMSPE, zmieniając
alfa – z przedziału 0;1 i otrzymujemy zoptymalizowane alfa. JAKBY SOLVER WYKAZAŁ NAM
OPTYMALNE ALFA > 0,5 TO ZNACZY ŻE NIE JEST TO OPTYMALNA METODA Z PRZERSPEKTYWY TYCH
DANYCH. Założenie: pierwsza prognoza jest równa pierwszej realizacji. Druga to alfa x (y wcześniejszy
okres)+(1-alfa) x (y^ z wcześniejszego okresu). Jeżeli potrzebujemy prognozy na więcej niż 1 okres do
przodu (tu dwa) to przyjmujemy ostatnia wartość z prognozy. Błąd od drugiego okresu liczymy, gdyż
w pierwszym by wyszło 0 i obniżałoby to sztucznie wyniki.
Metoda Holta dodajmy trend liniowy, prognoza wymaga wielorównaniowego modelu. Pierwszym
równaniem F dokonujemy wygładzania poziomu zmiennej, wykorzystując alfa czyli stałą wygładzania
tego poziomu. Wygładzony poziom w okresie t to to co jest aktualnie y (nasza realizacja) ale zważone
prognozą F+T (wcześniejszy poziom + wcześniejszy przyrost). POZIOM, PRZYROST, PROGNOZA
(WZÓR)
POZIOM F wygładzony w okresie t (jeszcze nie prognozuje) wygładzony poziom na okres t ma związek
z realizacją z okresu t, ale spoglądam też jakbym prognozowała poziom (brała wcześniejszy
wygładzony poziom i dodawała do niego przyrost) na ten okres
WYGŁADZONY PRZYROST T ze stałą wygładzenia beta, mówimy o trendzie liniowym, przyrost między
beta x różnica między poziomami + (1-beta) x (wcześniejszy przyrost). Jeśli przyrastało 5 z okresu na
okres to przewidujemy że o tyle samo wzrośnie.
PROGNOZA na okres t+1=F+T (poziom+przyrost) Jeśli chcemy prognozować dalej niż t+1 (czyli t+tau)
to oznacza, że poziom+ tau przyrostów (tau x T) 1,2,3 PRZYROSTY itp.
Metoda Wintersa a co jeśli dodamy sezonowość, będę wygładzała poziom, przyrost ale także efekt
sezonowy.
Efekt sezonowy może być addytywny (będę dodawała go) lub multiplikatywny (w procentach).
Przeciętnie w grudniu to mam obroty zawsze o średnio 50 000 zł wyższe i będę posługiwać się
jednostkami analizowanej zmiennej czy jednak amplituda moich wahań się zmienia i lepiej ujmować
sezonowość w procentach a zatem model multiplikatywny.
Jeśli wygładzam POZIOM to od realizacji muszę odjąć wpływ efektu sezonowości, który jest wyliczony
dla okresu t-r (r-liczba okresów sezonowości w danym cyklu) Gdy nie mamy zamkniętego cyklu to nie
wiemy jaki jest efekt sezonowy, jaki jest jego wpływ. Ocenę możemy zrobić na cyklu który już się
zamknął-na podstawie minionego roku mogę ocenić jaki był efekt sezonowy w danym miesiącu. Stąd
też cofamy się o r okresów. Amplituda wahań jest stała. Sezonowość żeby określić trzeba mieć cały
okres, suma wskaźników sezonowych musi wynosi 0.
Wzór na SEZONOWOŚĆ- to trzecia stała wygładzania gamma (y-F) jeśli od realizacji odejmę poziom to
zostanie sezonowość +(1-gamma) x (St-r) „sezonowość teoretyczna”. Najlepszą prognozą efektu
sezonowego na okres t jest sezonowość z okresu t-r.
Y^= (POZIOM+PRZYROST)+SEZONOWOŚĆ
Jeśli chce prognozować na więcej niż jeden okres do przodu to robimy podobnie jak u Holta (poziom
+ tau przyrostu) HOLT + SEZONOWOŚĆ
MODEL MULTIPLIKATYWNY
W kliku miejscach odejmowanie zamienia nam się na dzielenie, żeby uzyskać indeks sezonowości,
żeby dobrze odczytać zmieniające się wartości w ujęciu bezwzględnym, ale względnie stałym. Przy
wyliczaniu wartości mnożymy przez efekt sezonowy. To co jest w nawiasie do wzoru na więcej niż
jeden okres to jest Holt. POZIOM + PRZYROST, SEZONOWOŚĆ jest indeksem. Rosnąca amplituda
wahań.
To metody rozszerzenia idei średniej ruchomej. Ocena zakłóceń, które pojawiają się historycznie i na
tej podstawie tworzona jest lepsza wartość prognozowana. Wykorzystują informacje zawarte w
całym szeregu czasowym, a nie jak w średniej ruchomej, gdzie bierzemy tylko k ostatnich
okresów/przyrostów.
Alternatywny dla modelu Wintersa, zmiennej sztuczne, zerojedynkowe, które pokażą jaki okres
mamy, q1 czy q2.
r-1, do danych kwartalny 3 zmienne zerojedynkowe, miesięcznych 11
Patrzymy na wartość p: informuje czy zmienna jest istotna w modelu. H0 mówi ze zmienna jest
nieistotna, chcemy odrzucić h0 wiec p musi mieć mniej niż poziom istotności (0,05) żeby odrzucić
Przecięcie to stała, Współczynniki o ile przeciętnie z okresu na okres zmienia się wielkość zjawiska