Saturday 16 December 2017

Ruchowy model średniej arimy


Autoregresywna średnia ruchoma - ARIMA. Definicja autoregresji zintegrowanej średniej ruchomej - ARIMA. A model statystyczny, który wykorzystuje dane szeregowe do przewidywania przyszłych trendów Jest to forma analizy regresji, która ma na celu przewidywanie przyszłych ruchów wzdłuż pozornie losowego chodu prowadzonego przez zapasy a rynek finansowy, analizując różnice między wartościami w szeregu zamiast używać rzeczywistych wartości Znaczenie różnicowanych serii jest określane jako autoregresywne i opóźnienia w przewidywanych danych są określane jako średnia ruchoma. BREAKING DOWN Autoregresywna średnia ruchoma - ARIMA . Ten typ modelu zazwyczaj nazywany jest ARIMA p, d, q, z liczbami całkowitymi odnoszącymi się do autoregresywnych zintegrowanych i przeciętnych części danych zestawu danych, odpowiednio modelowanie ARIMA może uwzględniać trendy, cykle sezonowości, błędy i niestacjonarne aspekty zbioru danych podczas tworzenia prognoz. Wprowadzenie do modeli nieuzasadnionych ARIMA. ARIMA p, d, q forec modelowanie ARIMA jest, teoretycznie, najbardziej ogólną klasą modeli przewidywania szeregów czasowych, które mogą być stacjonarne poprzez różnicowanie w razie potrzeby, być może w połączeniu z transformacjami nieliniowymi, takimi jak rejestrowanie lub deflacja w razie potrzeby zmienna losowa szereg czasowy jest stacjonarny, jeśli jego właściwości statystyczne są stałe w czasie A stacjonarne serie nie mają tendencji, jej odchylenia wokół jego średniej mają stałą amplitudę, i wibruje w spójny sposób tj. jego krótkotrwałe losowe wzorce czasu zawsze wyglądają tak samo w sensie statystycznym Ten ostatni warunek oznacza, że ​​jego korelacje autokorelacji z własnymi wcześniejszymi odchyleniami od średniej pozostają niezmienne w czasie lub równoważnie, że jego widmo mocy pozostaje niezmienne w czasie Zmienna losowa tego formu może być postrzegana jak zwykle jako kombinacja sygnału i hałasu, a sygnał, jeśli jest pozorny może być wzorem szybkiego lub powolnego przecięcia średniego lub sinusoidalnego oscylatora jonowa lub szybka zmiana w znaku i może mieć również składnik sezonowy Model ARIMA może być postrzegany jako filtr, który próbuje oddzielić sygnał od hałasu, a następnie sygnał jest ekstrapolowany w przyszłości, aby uzyskać prognozy. ARIMA równanie prognostyczne dla szeregów czasowych stacjonarnych jest liniowym równaniem regresji typu, w którym predykatory składają się z opóźnień zmiennej zależnej i / lub opóźnień prognozowanych błędów. Prawidłowa wartość Y jest stałą lub ważoną sumą jednego lub ostatnie wartości Y i lub ważona suma jednej lub kilku ostatnich wartości błędów. Jeśli predykatory składają się tylko z opóźnionych wartości Y, jest to czysty, autoregresywny samoregulowany model, który jest tylko szczególnym przypadkiem modelu regresji Na przykład, autoregresywny model AR1 dla pierwszego rzędu jest prostym modelem regresji, w którym zmienna niezależna jest po prostu Y oparta o jeden okres LAG Y, 1 w Statgraphics lub Y LAG1 w RegressIt Jeśli niektóre predykatory są błędami, model ARIMA nie jest modelem regresji liniowej, ponieważ nie ma sposobu na określenie błędu ostatniego okresu jako niezależnej zmiennej, a błędy muszą być obliczane w okresie - okresy, gdy model jest dopasowany do danych Z technicznego punktu widzenia problem z wykorzystaniem opóźnionych błędów jako predykcyjnych jest taki, że przewidywania modelu nie są funkcjami liniowymi współczynników, nawet jeśli są to liniowe funkcje poprzednich danych. Więc współczynniki w modelach ARIMA, w których występują opóźnienia w błędach, należy oszacować przez nieliniowe metody optymalizacji - wspinaczka górska, a nie tylko przez rozwiązanie układu równań. Akronim ARIMA oznacza automatyczną regresywną średnią ruchową regresji stacjonarnych serii w równaniu prognozowania nazywa się autoregresywnym terminy, opóźnienia w błędach prognozy nazywane są średnią ruchoma, a seria czasowa, która powinna być różna, aby była stacjonarna, to inte tkana wersja serii stacjonarnej Modele losowego i losowego trendu, modele autoregresyjne oraz modele wygładzania wykładniczego są szczególnymi przypadkami modeli ARIMA. Niespotykany model ARIMA jest klasyfikowany jako model ARIMA p, d, q, where. p jest liczba terminów autoregresyjnych. d jest liczbą nierównomiernych różnic koniecznych dla stacjonarności, a. q jest liczbą opóźnionych błędów prognozowanych w równaniu predykcyjnym. Równanie prognozowania jest skonstruowane w następujący sposób: Po pierwsze, niech y oznacza dtową różnicę Y Oznacza to, że druga różnica Y przypadku d2 nie różni się od 2 okresów temu Raczej jest to pierwsza różniczka pierwszej różnicy, która jest dyskretnym analogiem drugiej pochodnej, tzn. lokalnej przyspieszenie szeregu, a nie jego lokalny trend. Pod względem y ogólny wzór prognozowania jest tutaj. Przekroczone średnie parametry s są zdefiniowane tak, że ich znaki są ujemne w równaniu, zgodnie z konwencją wprowadzoną przez Boxa i Jen kins Niektórzy autorzy i oprogramowanie, w tym język programowania R definiują je tak, że posiadają znaki plus Gdy faktyczne liczby są podłączone do równania, nie ma dwuznaczności, ale ważne jest, aby wiedzieć, która konwencja używa Twojego oprogramowania podczas odczytywania danych wyjściowych Często parametry są tam oznaczone przez AR 1, AR 2, i MA 1, MA 2 itd. Aby zidentyfikować odpowiedni model ARIMA dla Y, zaczynasz od określenia kolejności różnicowania d wymagających stacjonowania serii i usunięcia cech brutto sezonowości, być może w połączeniu z transformacją stabilizującą wariancję, taką jak rejestrowanie lub deflacja Jeśli zatrzymasz się w tym punkcie i przewidujesz, że zróżnicowane serie są stałe, masz tylko dopasowany losowy chód lub losowy model tendencji Jednak stacjonarne serie mogą wciąż mają błędy autokorelacyjne, co sugeruje, że w równaniu prognozowym potrzebna jest pewna liczba terminów AR1 i / lub pewnych numerów q1 q. Proces wyznaczania e wartości p, d i q, które są najlepsze dla danej serii czasowej zostaną omówione w dalszej części notatek, których łącza są u góry tej strony, ale podgląd niektórych typów nieuzasadnionych modeli ARIMA, które są powszechnie spotykane jest poniżej. ARIMA 1,0,0 pierwszego rzędu autoregresji modelu, jeśli seria jest stacjonarna i autocorrelated, być może może być przewidywana jako wielokrotność swojej własnej poprzedniej wartości, a także stała Równanie prognozowania w tym przypadku jest. która jest z regresji regresji Y z opóźnieniem o jeden okres Jest to model stały ARIMA 1,0,0 Jeśli średnia Y jest równa zeru, wówczas nie będzie uwzględnione określenie stałe. Jeśli współczynnik nachylenia 1 jest dodatni i mniejszy niż 1 wielkość musi wynosić mniej niż 1 w przypadku, gdy Y jest nieruchoma, model opisuje zachowanie średniego zwrotu, w którym przewiduje się, że wartość następnego okresu 1-krotnego jest większa niż średnia ze względu na wartość tego okresu Jeśli 1 jest ujemna, przewiduje zachowanie średnio-odwrotne z naprzemiennym znakiem s, tzn. przewiduje również, że Y będzie poniżej średniej następnego okresu, jeśli jest powyżej średniej tego okresu. W modelu autoregresji drugiego rzędu ARIMA 2,0,0, po prawej stronie znajdowałby się termin Y t-2 jak również itd. W zależności od oznakowania i wielkości współczynników, model ARIMA 2,0,0 może opisywać system, którego średnie odwrócenie zachodzi w sinusoidalnie oscylujący sposób, jak ruch masy na sprężynie, która jest poddane losowym wstrząsom. ARIMA 0,1,0 przypadkowy spacer Jeśli seria Y nie jest stacjonarna, najprostszym modelem jest model przypadkowego spaceru, który może być uważany za ograniczającą przypadek modelu AR1, w którym autoregresywny współczynnik jest równy 1, tj. seria z nieskończenie powolnym średnim odwróceniem Współczynnik predykcji dla tego modelu może być zapisany jako. gdzie stały termin jest średnią zmianą okresu między okresami, tj. długoterminowym dryftem w Y Ten model może być zamontowany jako model regresji bez przechwytywania, w którym pierwszą różnicą Y jest d zmienna ependentowa Ze względu na to, że zawiera tylko nieuzasadnioną różnicę i stały termin, jest on klasyfikowany jako model ARIMA 0,1,0 ze stałą Model bez luzu bez przeszkód byłby modelem ARIMA 0,1,0 bez stałej. ARIMA 1,1,0 zróżnicowany model autoregresji pierwszego rzędu Jeśli błędy modelu losowego spaceru są autokorelowane, być może problem można rozwiązać przez dodanie jednego opóźnienia zmiennej zależnej do równania predykcji - tzn. Przez regresję pierwszej różnicy Y na sobie opóźnione przez jeden okres To przyniosłoby następujące równanie predykcyjne, które można przestawić na. Jest to model autoregresji pierwszego rzędu z jednym porządkiem nierównomiernego różnicowania i stałym terminem - tj. Modelem ARIMA 1,1,0.ARIMA 0,1,1 bez stałego prostego wygładzania wykładniczego Inna strategia korygowania błędów autokorelacji w modelu losowego spaceru jest sugerowana przez prosty model wygładzania wykładnicza Przypomnijmy, że w przypadku pewnych niestałych serii czasowych np. Tych, które wykazują hałas tuziny wokół zmiennej wielkości powoli, model losowego chodu nie wykonuje się, a także średnia ruchoma poprzednich wartości Innymi słowy, a nie biorąc pod uwagę najnowsze obserwacje jako prognozę następnej obserwacji, lepiej jest użyć średniej z ostatnich kilku obserwacji w celu odfiltrowania szumu i dokładniejsze oszacowanie lokalnej średniej Prosty model wygładzania wykładniczego wykorzystuje wykładniczą ważoną średnią ruchliwą poprzednich wartości, aby osiągnąć ten efekt. Równanie predykcji dla prostego modelu wykładnicza może być zapisane liczbę równoważnych form matematycznych, z których jedna jest tak zwana korekcją błędów, w której poprzednia prognoza jest dostosowywana w kierunku popełnionego błędu. Ponieważ e t-1 Y t-1 - t-1 z definicji, to może być przepisane jako., co oznacza równanie ARIMA 0,1,1 bez stałych prognoz z 1 1 - Oznacza to, że można dopasować proste wyrównanie wykładnicze, określając go jako model ARIMA 0,1,1 bez koni stant, a szacunkowy współczynnik MA1 odpowiada 1-minus-alfa w formule SES Przypomnijmy, że w modelu SES średni wiek danych w prognozach na 1 rok jest 1, co oznacza, że ​​będą one pozostawać w tyle trendy i punkty zwrotne o około 1 okresy Wynika z tego, że średni wiek danych w prognozie 1-przedziału czasowego dla modelu ARIMA 0,1,1 - bez modelu stałego wynosi 1 1 - 1 Więc na przykład jeśli 1 0 8, średni wiek wynosi 5 W miarę zbliżania się 1, ARIMA 0,1,1 - bez modelu stałego staje się bardzo długoterminową średnią ruchoma, a gdy 1 zbliża się 0, staje się przypadkowym chodem bez drift model. What jest najlepszym sposobem na poprawienie autokorelacji dodawanie terminów AR lub dodawanie terminów typu MA W poprzednich dwóch omawianych modelach, problem błędów autokorelacji w modelu losowego chodu został ustalony na dwa różne sposoby, dodając lagged wartości różnic serie do równania lub dodanie opóźnionej wartości błędu prognozy Jakie podejście jest najlepszym Zasadą dla tego s ituation, która zostanie omówiona bardziej szczegółowo później, jest pozytywna autokorelacja najlepiej jest traktowana przez dodanie terminu AR do modelu, a negatywna autokorelacja najlepiej jest najlepiej traktować przez dodanie określenia MA W serii biznesowych i ekonomicznych często występuje negatywna autokorelacja powstaje jako artefakt różniczkujący Ogólnie rzecz biorąc, rozbieżność zmniejsza dodatnią autokorelację, a nawet może powodować przejście z dodatniej na ujemną autokorelację Więc model ARIMA 0,1,1, w którym często towarzyszy termin MA, jest używany częściej niż model ARIMA 1,1,0.ARIMA 0,1,1 ze stałym prostym wyrównywaniem wykładniczym ze wzrostem Dzięki wdrożeniu modelu SES jako modelu ARIMA uzyskujesz pewną elastyczność Przede wszystkim szacuje się współczynnik MA 1 negatywny odpowiada współczynnikowi wygładzania większym niż 1 w modelu SES, co zwykle nie jest dozwolone w procedurze dopasowania modelu SES Po drugie, masz możliwość włączenia stałego terminu t model ARIMA, jeśli chcesz, w celu oszacowania średniej niezerowej tendencji Model ARIMA 0,1,1 ze stałą ma równanie predykcyjne. Prognozy wyprzedzające o jeden krok przed tym modelem są jakościowo podobne do modelu SES , z wyjątkiem tego, że trajektoria prognoz długoterminowych jest zazwyczaj linią ukośną, której nachylenie jest równe mu, a nie w linii poziomej. ARIMA 0,2,1 lub 0,2,2 bez stałych linearnych wygładzeń wykładniczych Liniowe modele wygładzania wykładniczego są modele ARIMA, które wykorzystują dwie nierównomierne różnice w powiązaniu z warunkami MA Drugą różnicą serii Y jest nie tylko różnica między Y i sobą opóźniona przez dwa okresy, ale jest to pierwsza różnica pierwszej różnicy - w drugiej t = Y t-1 Y t-2 Y t-2Y t-1 Y t -2 Druga różnica funkcji dyskretnej jest analogiczna do drugiej pochodnej funkcji ciągłej mierzonej res przyspieszenie lub krzywiznę w funkcji w danym punkcie czasu. Model ARIMA 0,2,2 bez stałej przewiduje, że druga różnica serii jest równa liniowej funkcji ostatnich dwóch błędów prognozy, które można przekształcić jako. gdzie 1 i 2 to współczynniki MA 1 i MA 2 Jest to ogólny liniowy model wygładzania wykładniczego, zasadniczo taki sam jak model Holt, a model Brown's jest szczególnym przypadkiem. Wykorzystuje obliczone ważone średnie ruchome, aby oszacować zarówno poziom lokalny, jak i lokalny trend w serii Długoterminowe prognozy z tego modelu zbliżają się do prostej, której nachylenie zależy od średniej tendencji obserwowanej pod koniec serii. ARIMA 1,1,2 bez stałego tłumienia liniowego tłumienia liniowego. Model ten jest zilustrowany na załączonych slajdach w modelach ARIMA Wykracza poza tendencję lokalną na końcu serii, ale spłaszczając ją w dłuższych horyzontach prognoz, aby wprowadzić notatkę konserwatywizmu, praktykę, która ma empiryczne wsparcie Zobacz artykuł o tym, dlaczego "Damped Trend" działa przez Gardnera i McKenziego oraz artykuł Golden Rule autorstwa Armstronga i innych o szczegóły. Zazwyczaj zaleca się przyklejenie się do modeli, w których co najmniej jedno z p i q nie jest większe niż 1, tzn. nie próbuj dopasować modelu, takiego jak ARIMA 2,1,2, ponieważ prawdopodobnie doprowadzi to do nadmiernych i ogólnych problemów, które są bardziej szczegółowo omówione w uwagach dotyczących struktury matematycznej modeli ARIMA. Implementacja arkusza ARIMA jak opisano powyżej są łatwe do wdrożenia w arkuszu kalkulacyjnym Równanie predykcji jest po prostu równaniem liniowym, które odnosi się do poprzednich wartości oryginalnych serii czasowych i wartości przeszłych błędów W ten sposób można utworzyć arkusz kalkulacyjny ARIMA, przechowując dane w kolumnie A, formuła prognozowania w kolumnie B oraz dane o błędach pomniejszone o prognozy w kolumnie C Formuła prognozowania w typowej komórce w kolumnie B będzie po prostu wyrażeniem liniowym odnoszącym się do wartości poprzednich wierszy kolumn A i C , pomnożone przez odpowiednie współczynniki AR lub MA przechowywane w komórkach gdzie indziej w arkuszu kalkulacyjnym. A RIMA oznacza autoregresywne modele ruchome ze zintegrowanym ruchem Jednostka jednowarstwowa ARIMA jest techniką prognozowania, która przewiduje przyszłe wartości serii oparte całkowicie na własnej bezwładności Jego głównym aplikacja znajduje się w obszarze prognoz krótkoterminowych wymagających co najmniej 40 historycznych punktów danych Najlepiej sprawdza się, gdy Twoje dane wykazują stały lub spójny wzorzec w czasie z minimalną kwotą odchylenia Niekiedy nazywany Box-Jenkins po pierwotnych autorach ARIMA jest zwykle lepszy do wykładniczej techniki wygładzania, gdy dane są dość długie i korelacja między obserwacjami jest stabilna Jeśli dane są krótkie lub bardzo niestabilne, to niektóre metody wygładzania mogą działać lepiej Jeśli nie masz co najmniej 38 punktów danych, należy rozważyć inne niż ARIMA. Pierwszym krokiem w stosowaniu metodologii ARIMA jest sprawdzenie stacjonarności stacjonarnej imp polega na tym, że seria pozostaje na stałym poziomie w miarę upływu czasu Jeśli tendencja istnieje, podobnie jak w przypadku większości zastosowań ekonomicznych lub biznesowych, dane nie są stacjonarne Dane powinny również wykazać stałą wahania wahań w czasie Jest to łatwo widać z seria, która jest mocno sezonowa i rośnie szybciej W takim przypadku wzloty i upływy w sezonie staną się bardziej dramatyczne w czasie Bez tych warunków stacjonarnych, nie można obliczyć wielu obliczeń związanych z procesem. wykres graficzny danych wskazuje na niestabilność, to należy różnicować szereg Differencing jest doskonałym sposobem na przekształcanie serii nie stacjonarnych w stacjonarne To odbywa się przez odjęcie obserwacji w bieżącym okresie od poprzedniego Jeśli transformacja odbywa się tylko raz do serii, mówisz, że dane zostały po raz pierwszy differenced Ten proces zasadniczo eliminuje tendencję, jeśli seria rośnie na fairl y stała stopa Jeśli rośnie tempo wzrostu, możesz zastosować tę samą procedurę i różnicę danych znowu Twoje dane byłyby drugie zróżnicowane. Autokorelacje są wartościami liczbowymi wskazującymi, jak serie danych są związane z czasem w sposób bardziej szczegółowy Dokładniej, mierzy, jak silne wartości danych w określonej liczbie okresów są ze sobą skorelowane z czasem Liczba okresów oddzielonych nazywana jest zwykle opóźnieniem przykład autokorelacja w punkcie 1 opóźnia korelację między wartościami okresu 1 w stosunku do siebie w całej serii. Autokorelacja w punkcie 2 mierzy, jak dane między dwoma okresami są skorelowane w całej serii Autokorelacje mogą wahać się od 1 do -1 A w przybliżeniu 1 wskazuje na wysoką dodatnią korelację, przy czym wartość zbliżona do -1 sugeruje wysoką ujemną korelację Te działania są najczęściej oceniane za pomocą graficznych działek zwanych skorelagami. Korelagram przedstawia wartości autokorelacji dla danej serii w różnym opóźnieniu. Jest to określane jako funkcji autokorelacji i jest bardzo ważna w metodzie ARIMA. Metodologia metodyARIMA próbuje opisać ruchy w a stacjonarne szeregy czasowe w funkcji tzw. parametrów autoregresywnych i ruchomych średnich Parametry te określa się jako parametry AR, autoregesywne i parametry MA przenoszące średnie. Model AR z tylko jednym parametrem może być zapisany jako. gdzie seria czasowa X t została zbadana. A 1 autoregresywny parametr rzędu 1.X t-1 szereg czasowy opóźniał się o jeden okres. E t termin błędu modelu. Oznacza to w prosty sposób, że każda wartość Xt może być wyjaśniona przez pewną funkcję jego poprzedniej wartości, X t - 1, plus niewyjaśniony błąd losowy, E t Jeśli szacunkowa wartość A 1 wyniosła 30, wówczas aktualna wartość serii będzie związana z 30 jego wartości 1 przedziału czasowego Oczywiście, seria może być związana z czymś więcej niż tylko jedna z poprzednich wartości Na przykład. X t A 1 X t-1 A 2 X t-2 E t. Wskazuje to, że bieżącą wartością serii jest kombinacja dwóch poprzednich wartości, X t-1 i X t - 2 plus kilka przypadkowych błędów E t Nasz model jest teraz autoregresywnym modelem zamówienia 2.Moving Aver wiek modeli. Drugi typ modelu Box-Jenkins nazywa się modelem średniej ruchomości. Choć modele te wyglądają bardzo podobnie do modelu AR, pojęcie za nimi jest zupełnie inne. Ruchome średnie parametry dotyczą tego, co dzieje się w okresie t tylko do przypadkowych błędów , tzn. E t-1, E t-2 itd., a nie do X t-1, X t-2, Xt-3, jak w podejściach autoregresywnych. w następujący sposób. Termin B 1 nazywany jest MA o kolejności 1 Znak negatywny przed parametrem jest używany tylko w konwencjach i zazwyczaj drukowany jest automatycznie przez większość programów komputerowych Powyższy model po prostu mówi, że każda wartość X t jest bezpośrednio związana tylko z błędem losowym w poprzednim okresie, E t-1 i bieżącym błędem, E t Podobnie jak w przypadku modeli autoregresji, średnie ruchome modele mogą być rozszerzone do struktur wyższego rzędu, obejmujących różne kombinacje średniej długości ruchomej o pozwala budować modele, które zawierają zarówno parametry autoregresji, jak i ruchome średnie razem Modele te są często określane jako modele mieszane Chociaż to sprawia, że ​​bardziej skomplikowane narzędzie prognozowania, struktura może rzeczywiście symulować serię i tworzyć bardziej dokładną prognozę. sugerują, że struktura składa się wyłącznie z parametrów AR lub MA - nie obu. Modele opracowane przez to podejście są zwykle nazywane modelami ARIMA, ponieważ używają kombinacji autoregresywnego AR, integracji I - nawiązującego do odwrotnego procesu różnicowania w celu wygenerowania prognozy, i średnie operacje MA operacyjne Model ARIMA jest zwykle określany jako ARIMA p, d, q Oznacza to kolejność składowych autoregresji p, liczby operatorów różnicujących d oraz najwyższego rzędu średniej ruchomej Na przykład ARIMA 2, 1,1 oznacza, że ​​masz autoregresywny model drugiego rzędu ze średnim ruchem pierwszego rzędu, którego seria została zróżnicowana e do wywołania stacjonowania. Plikowanie właściwej specyfikacji. Głównym problemem klasycznego Box-Jenkins jest próba określenia, która specyfikacja ARIMA ma być używana - jak wiele parametrów AR i MA ma zawierać Do tego jest wiele Box-Jenkings 1976 poświęconych proces identyfikacji zależny od graficznej i numerycznej oceny autokorelacji próbki i częściowych funkcji autokorelacji Cóż, dla podstawowych modeli zadanie nie jest zbyt trudne Każda funkcja autokorelacji wygląda pewnie W miarę uproszczenia , wzorce nie są tak łatwo wykrywane W celu utrudnienia trudności, dane reprezentują tylko próbkę procesu bazowego Oznacza to, że błędy pobierania próbek, błędy pomiarowe itp. mogą zniekształcać teoretyczny proces identyfikacji. Dlatego tradycyjne modelowanie ARIMA jest sztuką a nie nauki.

No comments:

Post a Comment