Friday 3 November 2017

Flytte Gjennomsnittet Alltid Stasjonær


Flytte gjennomsnittlige og eksponensielle utjevningsmodeller. Som et første skritt i å bevege seg ut over gjennomsnittlige modeller, kan tilfeldige gangmodeller og lineære trendmodeller, ikke-sone-mønstre og trender ekstrapoleres ved hjelp av en gjennomsnittlig eller utjevningsmodell. Den grunnleggende forutsetningen bak gjennomsnittlige og utjevningsmodeller er at tidsserien er lokalt stasjonær med et sakte varierende gjennomsnitt. Derfor tar vi et lokalt lokalt gjennomsnitt for å estimere nåverdien av gjennomsnittet og deretter bruke det som prognosen for nær fremtid. Dette kan betraktes som et kompromiss mellom den gjennomsnittlige modellen og den random-walk-uten-drift-modellen Den samme strategien kan brukes til å estimere og ekstrapolere en lokal trend. Et glidende gjennomsnitt kalles ofte en glatt versjon av den opprinnelige serien, fordi kortsiktig gjennomsnittsverdi har til formål å utjevne støtene i den opprinnelige serien Ved å justere graden av utjevning av bredde av det bevegelige gjennomsnittet, kan vi håpe å finne en slags optimal balanse mellom ytelsen til den gjennomsnittlige og tilfeldige gangmodeller Den enkleste typen gjennomsnittsmodell er det enkle, likevektede flytende gjennomsnittet. Forventningen for verdien av Y på tidspunktet t 1 som er laget på tidspunktet t, er det enkle gjennomsnittet av de nyeste m-observasjonene. Her og andre steder vil jeg bruke symbolet Y-hatten til å utgjøre en prognose av tidsserien Y laget så tidlig som mulig før en bestemt modell. Dette gjennomsnittet er sentrert i perioden t-m 1 2, noe som innebærer at estimatet av det lokale gjennomsnittet vil ha en tendens til å ligge bak den sanne verdien av det lokale gjennomsnittet med ca. m 1 2 perioder. Således sier vi at gjennomsnittsalderen for dataene i det enkle glidende gjennomsnittet er m 1 2 i forhold til perioden for prognosen beregnes dette er hvor lang tid prognosene vil ha til å ligge bak vendepunkter i dataene. For eksempel, hvis du er gjennomsnittlig de siste 5 verdiene, vil prognosene være ca 3 perioder sent i å svare på vendepunkt. Merk at hvis m 1, Den enkle glidende SMA-modellen er ekvivalent med den tilfeldige turmodellen uten vekst Hvis m er veldig stor i forhold til lengden av estimeringsperioden, er SMA-modellen tilsvarlig for den gjennomsnittlige modellen. Som med hvilken som helst parameter i en prognosemodell, er det vanlig å justere verdien av ki n for å få den beste pasienten til dataene, dvs. de minste prognosefeilene i gjennomsnitt. Her er et eksempel på en serie som ser ut til å vise tilfeldige svingninger rundt et sakte varierende middel. Først må vi prøve å passe den med en tilfeldig spasertur modellen, som tilsvarer et enkelt bevegelige gjennomsnitt på 1 sikt. Den tilfeldige turmodellen reagerer veldig raskt på endringer i serien, men ved å gjøre det plukker mye av støyen i dataene de tilfeldige svingningene samt signalet den lokale mener Hvis vi i stedet prøver et enkelt glidende gjennomsnitt på 5 vilkår, får vi et smidigere sett med prognoser. Det 5-termens enkle glidende gjennomsnittet gir betydelig mindre feil enn den tilfeldige turmodellen i dette tilfellet Gjennomsnittsalderen for dataene i dette prognosen er 3 5 1 2, slik at den har en tendens til å ligge bak vendepunkter med om lag tre perioder. For eksempel synes det å ha oppstått en nedgang i perioden 21, men prognosene vender seg ikke til flere perioder senere. langsiktige prognoser fra SMA mod el er en horisontal rett linje, akkurat som i den tilfeldige turmodellen. Således antar SMA-modellen at det ikke er noen trend i dataene. Mens prognosene fra den tilfeldige turmodellen ganske enkelt er lik den siste observerte verdien, vil prognosene fra SMA-modellen er lik et vektet gjennomsnitt av de siste verdiene. Forsikringsgrensene beregnes av Statgraphics for de langsiktige prognosene for det enkle glidende gjennomsnittet, blir ikke større enn forventningshorisonten øker. Dette er åpenbart ikke riktig. Dessverre er det ingen underliggende statistisk teori som forteller oss hvordan konfidensintervallene skal utvides for denne modellen. Det er imidlertid ikke så vanskelig å beregne empiriske estimater av konfidensgrensene for lengre horisont-prognoser. For eksempel kan du sette opp et regneark der SMA-modellen vil bli brukt til å prognose 2 trinn foran, 3 trinn foran osv. i den historiske dataprøven. Du kan deretter beregne utvalgsstandardavvikene til feilene ved hver prognose h orizon, og deretter konstruere konfidensintervaller for langsiktige prognoser ved å legge til og trekke ut multipler av passende standardavvik. Hvis vi prøver et 9-glatt simpelt glidende gjennomsnitt, får vi enda jevnere prognoser og mer av en slående effekt. Gjennomsnittsalderen er nå 5 perioder 9 1 2 Hvis vi tar et 19-årig glidende gjennomsnitt, øker gjennomsnittsalderen til 10. Merk at prognosene nå ligger nede etter vendepunkter med ca 10 perioder. Hvor mye utjevning er best for denne serien Her er et bord som sammenligner deres feilstatistikk, også inkludert et 3-årig gjennomsnitt. Modell C, det 5-årige glidende gjennomsnittet, gir den laveste verdien av RMSE med en liten margin over 3 og 9-siktene, og deres andre statistikker er nesten identiske Så, blant modeller med svært like feilstatistikk, kan vi velge om vi foretrekker litt mer respons eller litt mer glatt i prognosene. Tilbake til toppen av siden. Bronse s Enkel eksponensiell utjevning eksponentielt vektet glidende gjennomsnitt. Den enkle bevegelige gjennomsnittsmodellen beskrevet ovenfor har den uønskede egenskapen som den behandler de siste k-observasjonene, like og fullstendig ignorerer alle foregående observasjoner. Intuitivt bør tidligere data diskonteres på en gradvis måte - for eksempel bør den nyeste observasjonen få litt mer vekt enn 2. siste, og den 2. siste skal få litt mer vekt enn den 3. siste, og så videre. Den enkle eksponensielle utjevning SES-modellen oppnår dette. La oss angi en utjevningskonstant et tall mellom 0 og 1 En måte å skrive modellen på er å definere en serie L som representerer det nåværende nivået, dvs. lokal middelverdi av serien som estimert fra data til nåtid. Verdien av L til tid t beregnes rekursivt fra sin egen tidligere verdi som dette. Den nåværende glatteverdien er således en interpolasjon mellom den forrige glattede verdien og den nåværende observasjonen, hvor kontrollen av nærheten til den interpolerte verdien til de mest re cent observasjon Prognosen for neste periode er bare den nåværende glatteverdien. Tilsvarende kan vi uttrykke neste prognose direkte i forhold til tidligere prognoser og tidligere observasjoner, i en hvilken som helst av følgende ekvivalente versjoner. I den første versjonen er prognosen en interpolering mellom forrige prognose og forrige observasjon. I den andre versjonen blir neste prognose oppnådd ved å justere forrige prognose i retning av den forrige feilen med en brøkdel. erroren til tid t I den tredje versjonen er prognosen en eksponentielt vektet dvs. nedsatt glidende gjennomsnitt med rabattfaktor 1.Interpoleringsversjonen av prognoseformelen er den enkleste å bruke hvis du implementerer modellen på et regneark det passer i en enkelt celle og inneholder cellehenvisninger som peker på forrige prognose, den forrige observasjon, og cellen der verdien av er lagret. Merk at hvis 1, SES-modellen er ekvivalent med en tilfeldig turmodell med trevekst Hvis 0 er SES-modellen ekvivalent med middelmodellen, forutsatt at den første glattede verdien er satt lik gjennomsnittet Tilbake til toppen av siden. Gjennomsnittsalderen for dataene i den enkle eksponensielle utjevningsprognosen er 1 relativ til den perioden som prognosen beregnes for. Dette er ikke ment å være åpenbart, men det kan enkelt vises ved å evaluere en uendelig serie. Derfor har den enkle glidende gjennomsnittlige prognosen en tendens til å ligge bak vendepunkter med ca. 1 perioder. For eksempel når 0 5 Laget er 2 perioder når 0 2 Laget er 5 perioder når 0 1 Laget er 10 perioder, og så videre. For en gitt gjennomsnittsalder, dvs. mengdeforsinkelse, er den enkle eksponensielle utjevning SES-prognosen noe bedre enn den enkle bevegelsen gjennomsnittlig SMA-prognose fordi den plasserer relativt mer vekt på den siste observasjonen - det er litt mer lydhør overfor endringer som skjedde i nyere tid. For eksempel har en SMA-modell med 9 vilkår og en SES-modell med 0 2 begge en gjennomsnittlig alder av 5 for da ta i sine prognoser, men SES-modellen legger mer vekt på de siste 3 verdiene enn SMA-modellen, og samtidig gliser den ikke helt over verdier som er mer enn 9 perioder gamle, som vist i dette diagrammet. En annen viktig fordel ved SES-modellen over SMA-modellen er at SES-modellen bruker en utjevningsparameter som er kontinuerlig variabel, slik at den enkelt kan optimaliseres ved å bruke en solveralgoritme for å minimere gjennomsnittlig kvadratfeil. Den optimale verdien av SES-modellen for denne serien viser seg å være 0 2961, som vist her. Gjennomsnittlig alder av dataene i denne prognosen er 1 0 2961 3 4 perioder, noe som ligner på et 6-rent simpelt gjennomsnitt. De langsiktige prognosene fra SES-modellen er en horisontal rettlinje som i SMA-modellen og den tilfeldige turmodellen uten vekst. Vær imidlertid oppmerksom på at konfidensintervallene som beregnes av Statgraphics, divergerer nå på en rimelig måte, og at de er vesentlig smalere enn konfidensintervaller for rand om gangmodellen SES-modellen antar at serien er noe mer forutsigbar enn den tilfeldige turmodellen. En SES-modell er egentlig et spesielt tilfelle av en ARIMA-modell, slik at den statistiske teorien om ARIMA-modeller gir et godt grunnlag for å beregne konfidensintervall for SES-modell Spesielt er en SES-modell en ARIMA-modell med en ikke-sesongforskjell, en MA 1-term, og ingen konstant term, ellers kjent som en ARIMA 0,1,1-modell uten konstant. MA 1-koeffisienten i ARIMA-modellen tilsvarer kvantum 1 i SES-modellen For eksempel, hvis du passer på en ARIMA 0,1,1 modell uten konstant til serien analysert her, viser den estimerte MA 1-koeffisienten seg å være 0 7029, som nesten er nesten en minus 0 2961. Det er mulig å legge til antagelsen om en ikke-null konstant lineær trend på en SES-modell. For å gjøre dette, bare angi en ARIMA-modell med en ikke-sesongforskjell og en MA 1-term med en konstant, dvs. en ARIMA 0,1,1 modell med konstant De langsiktige prognosene vil da har en trend som er lik den gjennomsnittlige trenden observert over hele estimeringsperioden. Du kan ikke gjøre dette i forbindelse med sesongjustering, fordi sesongjusteringsalternativene er deaktivert når modelltypen er satt til ARIMA. Du kan imidlertid legge til en konstant lang langsiktig eksponensiell trend til en enkel eksponensiell utjevningsmodell med eller uten sesongjustering ved å benytte inflasjonsjusteringsalternativet i prospektprosedyren. Den aktuelle inflasjonsprosentveksten per periode kan estimeres som hellingskoeffisienten i en lineær trendmodell som er montert på dataene i sammen med en naturlig logaritme transformasjon, eller det kan være basert på annen uavhengig informasjon om langsiktige vekstutsikter. Tilbake til toppen av siden. Brett s Lineær, dvs. dobbel eksponensiell utjevning. SMA-modellene og SES-modellene antar at det ikke er noen trend av noe som helst i dataene som vanligvis er OK eller i det minste ikke for dårlig for 1-trinns prognoser når dataene er relativt nei sy, og de kan endres for å inkorporere en konstant lineær trend som vist over. Hva med kortsiktige trender Hvis en serie viser en varierende veksthastighet eller et syklisk mønster som skiller seg klart ut mot støyen, og hvis det er behov for å prognose mer enn 1 år framover, kan estimering av en lokal trend også være et problem. Den enkle eksponensielle utjevningsmodellen kan generaliseres for å oppnå en lineær eksponensiell utjevning av LES-modell som beregner lokale estimater av både nivå og trend. Den enkleste tidsvarierende trenden modellen er Brown s lineær eksponensiell utjevningsmodell, som bruker to forskjellige glatte serier som er sentrert på forskjellige tidspunkter. Forutsigelsesformelen er basert på en ekstrapolering av en linje gjennom de to sentrene. En mer sofistikert versjon av denne modellen, Holt s, er diskuteres nedenfor. Den algebraiske formen av Browns lineære eksponensielle utjevningsmodell, som for den enkle eksponensielle utjevningsmodellen, kan uttrykkes i en rekke forskjellige, men e kvivalente former Standardformen til denne modellen uttrykkes vanligvis som følger. La S betegne den enkeltglattede serien som er oppnådd ved å anvende enkel eksponensiell utjevning til serie Y Det er verdien av S ved period t gitt av. Husk at under enkel eksponensiell utjevning ville dette være prognosen for Y ved periode t 1 Så la S betegne den dobbeltslettede serien oppnådd ved å anvende enkel eksponensiell utjevning ved å bruke det samme til serie S. Til slutt er prognosen for Y tk for noen k 1, gis av. Dette gir e 1 0, dvs lurer litt, og la den første prognosen ligne den faktiske første observasjonen, og e 2 Y 2 Y 1 hvoretter prognosene genereres ved hjelp av ligningen over. Dette gir de samme monterte verdiene som formelen basert på S og S dersom sistnevnte ble startet med S 1 S 1 Y 1 Denne versjonen av modellen brukes på neste side som illustrerer en kombinasjon av eksponensiell utjevning med sesongjustering. Helt s lineær eksponensiell utjevning. s LES-modellen beregner lokale estimater av nivå og trend ved å utjevne de siste dataene, men det faktum at det gjør det med en enkelt utjevningsparameter, stiller en begrensning på datamønstrene som det er i stand til å passe nivået og trenden, ikke tillates å variere ved uavhengige priser Holt s LES-modellen løser dette problemet ved å inkludere to utjevningskonstanter, en for nivået og en for trenden. På et hvilket som helst tidspunkt t, som i Browns modell, er det et estimat L t på lokalt nivå og et estimat T t av den lokale trenden Her beregnes de rekursivt fra verdien av Y observert ved tid t og de forrige estimatene av nivået og trenden ved to likninger som gjelder eksponensiell utjevning til dem separat. Hvis estimert nivå og trend ved tid t-1 er henholdsvis L t 1 og T t 1, vil prognosen for Y t som ville vært blitt gjort på tidspunktet t-1 være lik L t-1 T t 1 Når den virkelige verdien observeres, vil det oppdaterte estimatet av nivå beregnes rekursivt ved å interpolere mellom Y t og dets prognose, L t-1 T t-1, med vekt på og 1. Forandringen i estimert nivå, nemlig L t L t 1, kan tolkes som en støyende måling av trend på tiden t Det oppdaterte estimatet av trenden beregnes deretter rekursivt ved å interpolere mellom L t L t 1 og det forrige estimatet av trenden, T t-1 ved bruk av vekt og 1.Tolkningen av trend-utjevningskonstanten er analog med den for nivåutjevningskonstanten. Modeller med små verdier antar at trenden endrer seg bare veldig sakte over tid, mens modeller med større antar at det endrer seg raskere. En modell med en stor mener at den fjerne fremtiden er veldig usikker, fordi feil i trendberegning blir ganske viktig når prognose for mer enn en periode fremover. Tilbake til toppen av side. Utjevningskonstantene og kan estimeres på vanlig måte ved å minimere den gjennomsnittlige kvadriske feilen i 1-trinns prognosene. Når dette gjøres i Statgraphics, viser estimatene seg å være 0 3048 og 0 008. Den svært små verdien av betyr at modellen antar svært liten endring i trenden fra en periode til den neste. Så i utgangspunktet prøver denne modellen å estimere en langsiktig trend. I analogi med begrepet gjennomsnittlig alder av dataene som brukes til estimering av t Han lokale nivå av serien, er gjennomsnittsalderen for dataene som brukes til å estimere den lokale trenden, proporsjonal med 1, men ikke akkurat lik den. I dette tilfellet viser det sig å være 1 0 006 125 Dette er ikke veldig presis tall forutsatt at nøyaktigheten av estimatet ikke er virkelig 3 desimaler, men det er av samme generelle størrelsesorden som prøvestørrelsen på 100, så denne modellen er gjennomsnittlig over ganske mye historie for å estimere trenden. Prognosen nedenfor viser at LES-modellen anslår en litt større lokal trend på slutten av serien enn den konstante trenden som er estimert i SES-trendmodellen. Den estimerte verdien er nesten identisk med den som oppnås ved å montere SES-modellen med eller uten trend , så dette er nesten den samme modellen. Nå ser disse ut som rimelige prognoser for en modell som skal estimere en lokal trend. Hvis du eyeball denne plottet, ser det ut som om den lokale trenden har vendt nedover på slutten av serie Wh ved har skjedd Parametrene til denne modellen har blitt estimert ved å minimere den kvadratiske feilen i 1-trinns prognoser, ikke langsiktige prognoser, i hvilket tilfelle trenden ikke gjør stor forskjell. Hvis alt du ser på er 1 Forsinkede feil ser du ikke det større bildet av trender over si 10 eller 20 perioder. For å få denne modellen mer i tråd med øye-ekstrapoleringen av dataene, kan vi manuelt justere trendutjevningskonstanten slik at den bruker en kortere basislinje for trendestimering. For eksempel, hvis vi velger å angi 0 1, er gjennomsnittsalderen for dataene som brukes til å estimere den lokale trenden, 10 perioder, noe som betyr at vi gjennomsnittsverdi trenden over de siste 20 perioder eller så Her ser prognoseplottet ut om vi stiller 0 1 mens du holder 0 3 Dette ser intuitivt rimelig ut på denne serien, selv om det er sannsynligvis farlig å ekstrapolere denne trenden mer enn 10 perioder i fremtiden. Hva med feilstatistikken her er en modell sammenligning f eller de to modellene som er vist ovenfor, samt tre SES-modeller. Den optimale verdien av SES-modellen er ca. 0 3, men tilsvarende resultater med litt mer eller mindre respons er henholdsvis oppnådd med 0 5 og 0 2. En Holt s lineær utglatting med alfa 0 3048 og beta 0 008. B Holt s lineær utjevning med alfa 0 3 og beta 0 1. C Enkel eksponensiell utjevning med alfa 0 5. D Enkel eksponensiell utjevning med alfa 0 3. E Enkel eksponensiell utjevning med alfa 0 2.De statistikkene er nesten identiske, slik at vi virkelig ikke kan velge på grunnlag av 1-trinns prognosefeil i dataprøven. Vi må falle tilbake på andre hensyn. Hvis vi sterkt tror at det er fornuftig å basere dagens trendoverslag over hva som har skjedd i løpet av de siste 20 perioder, kan vi gjøre et tilfelle for LES-modellen med 0 3 og 0 1 Hvis vi vil være agnostiker om det er en lokal trend, kan en av SES-modellene være enklere å forklare og vil også gi mer middl e-of-the-road prognoser for de neste 5 eller 10 periodene. Tilbake til toppen av siden. Hvilken type trend-ekstrapolering er best horisontal eller lineær? Empiriske bevis tyder på at hvis dataene allerede er justert om nødvendig for inflasjon, så Det kan være uhensiktsmessig å ekstrapolere kortsiktige lineære trender svært langt inn i fremtiden. Trender som tydeligvis i dag kan løsne seg i fremtiden på grunn av ulike årsaker som forverring av produkt, økt konkurranse og konjunkturnedganger eller oppgang i en bransje. Derfor er enkel eksponensiell utjevning utføres ofte bedre ut av prøven enn det ellers kunne forventes, til tross for den naive horisontale trendenes ekstrapolering. Dampede trendmodifikasjoner av den lineære eksponensielle utjevningsmodellen brukes også i praksis til å introdusere en konservatismeddel i dens trendfremskrivninger. Den dempede trenden LES-modellen kan implementeres som et spesielt tilfelle av en ARIMA-modell, spesielt en ARIMA 1,1,2-modell. Det er mulig å beregne konfidensintervall arou nd langsiktige prognoser produsert av eksponentielle utjevningsmodeller, ved å betrakte dem som spesielle tilfeller av ARIMA-modeller Pass på at ikke alle programmer beregner konfidensintervall for disse modellene riktig. Bredden på konfidensintervaller avhenger av RMS-feilen i modellen, ii typen av utjevning enkel eller lineær iii verdien av utjevningskonstanten s og iv antall perioder fremover du progniserer Generelt sprer intervallene raskere som blir større i SES-modellen, og de sprer seg mye raskere når de er lineære i stedet for enkle utjevning er brukt Dette emnet blir diskutert videre i ARIMA-modellene i notatene. Tilbake til toppen av siden. En kort introduksjon til moderne tidsrekkefølge. Definisjon En tidsserie er en tilfeldig funksjon xt av et argument t i et sett T Med andre ord , en tidsrekkefølge er en familie av tilfeldige variabler x t-1 xtxt 1 som tilsvarer alle elementene i settet T, hvor T skal antas å være et tallbart, uendelig sett. Definisjon En observert tid serie tte T o T regnes som en del av en realisering av en tilfeldig funksjon xt Et uendelig sett med mulige realisasjoner som kunne ha blitt observert kalles et ensemble. For å sette ting strengere er tidsserien eller tilfeldig funksjon en reell funksjon xw, t av de to variablene w og t, hvor wW og t T Hvis vi fastsetter verdien av w, har vi en reell funksjon xtw av tiden t, som er en realisering av tidsserien Hvis vi fastsetter verdien av t, da har vi en tilfeldig variabel xwt For et gitt tidspunkt er det en sannsynlighetsfordeling over x Dermed kan en tilfeldig funksjon xw, t betraktes som enten en familie av tilfeldige variabler eller som en familie av realisasjoner. Definisjon Vi definerer distribusjonsfunksjonen av den tilfeldige variabelen w gitt t 0 som P oxx På samme måte kan vi definere fellesfordelingen for n tilfeldige variabler. Poengene som skiller tidsserieanalyse fra vanlige statistiske analyser er følgende 1 Beroendet mellom observasjoner ved forskjellige chro Nologiske tidspunkter spiller en viktig rolle Med andre ord er rekkefølgen av observasjoner viktig. I vanlig statistisk analyse antas det at observasjonene er gjensidig uavhengige 2 Domenet til t er uendelig 3 Vi må gjøre en innledning fra en realisering Realiseringen av den tilfeldige variabelen kan bare observeres én gang på hvert tidspunkt i multivariat analyse har vi mange observasjoner på et begrenset antall variabler Denne kritiske forskjellen krever antagelsen om stationaritet. Definisjon Den tilfeldige funksjonen xt sies å være strengt stasjonær dersom alle Endtidsdimensjonale distribusjonsfunksjoner som definerer xt, forblir det samme selv om hele gruppen av poeng t 1 t 2 tn forskyves langs tidsaksen. Det er, hvis. for alle heltall t 1 t 2 tn og k Grafisk kan man forestille realiseringen av en strengt stasjonær serie som å ha ikke bare det samme nivået i to forskjellige intervaller, men også den samme fordelingsfunksjonen, helt ned til parameteren ters som definerer det. Forutsetningen om stasjonar gjør våre liv enklere og mindre kostbare. Uten stasjonæritet må vi prøve prosessen ofte på hvert tidspunkt for å bygge opp en karakterisering av distribusjonsfunksjonene i den tidligere definisjonen. Stasjonar betyr at vi kan begrense vår oppmerksomhet til noen av de enkleste numeriske funksjonene, det vil si distributionsmomentene De sentrale øyeblikkene er gitt ved Definisjon i Gjennomsnittlig verdi av tidsseriene t er det første ordens øyeblikk ii Autokovariansfunksjonen av t er den andre øyeblikk om gjennomsnittet Hvis ts så har du variansen av xt Vi vil bruke til å betegne autokovariansen til en stasjonær serie, hvor k betegner forskjellen mellom t og s iii Autokorrelasjonsfunksjonen ACF av t er. Vi vil bruke til å betegne autokorrelasjonen av en stasjonær serie, hvor k betegner forskjellen mellom t og s iv Den partielle autokorrelasjonen PACF f kk er korrelasjonen mellom zt og ztk etter re flytte sin gjensidige lineære avhengighet av de mellomliggende variablene zt 1 zt 2 zt k-1 En enkel måte å beregne den delvise autokorrelasjonen mellom zt og ztk er å kjøre de to regressions. then beregne korrelasjonen mellom de to restvektorer eller, etter å ha målt variabler som avvik fra deres måte, kan den delvise autokorrelasjonen bli funnet som LS-regresjonskoeffisienten på zt i modellen. Der punktet over variabelen indikerer at det måles som en avvik fra dens gjennomsnitt v. Yule-Walker-ligningene gir en viktig forholdet mellom de delvise autokorrelasjonene og autokorrelasjonene Multiply begge sider av ligning 10 av zt kj og ta forventninger Denne operasjonen gir oss følgende forskjelllig likning i autocovariances. or, når det gjelder autokorrelasjoner. Denne tilsynelatende enkle representasjonen er virkelig et kraftig resultat Namely , for j 1,2 k kan vi skrive hele systemet av ligninger, kjent som Yule-Walker-ligningene. Fra lineær algebra y du vet at matrisen til rs er fullstendig. Derfor er det mulig å anvende Cramers regel suksessivt for k 1,2 å løse systemet for de delvise autokorrelasjonene De tre første er Vi har tre viktige resultater på strengt stasjonære serier. Implikasjonen er at vi kan bruke en hvilken som helst endelig realisering av sekvensen til å anslå gjennomsnittet Second hvis t er strengt stillestående og E t 2 da. Implikasjonen er at autokovariansen bare avhenger av forskjellen mellom t og s, ikke deres kronologiske punkt i tid Vi kunne bruke noen par intervaller i beregningen av autokovariansen så lenge tiden mellom dem var konstant. Og vi kan bruke en hvilken som helst begrenset realisering av dataene til å estimere autocovariances. For det tredje er autokorrelasjonsfunksjonen ved strenge stasjonar gitt av. Implikasjonen er at autokorrelasjonen bare avhenger av forskjellen mellom t og s, og igjen kan de estimeres ved en endelig realisering av dataene. Hvis vårt mål er i s for å estimere parametere som er beskrivende for de mulige realiseringene av tidsseriene, så er kanskje strenge stasjonære for restriktive. For eksempel, hvis middel og covariances of xt er konstant og uavhengig av kronologisk punkt i tid, er det kanskje ikke viktig til oss at fordelingsfunksjonen er den samme for ulike tidsintervaller. Definisjon En tilfeldig funksjon er stasjonær i vid forstand eller svakt stasjonær eller stasjonær i Khinchin s-forstand, eller kovarians stasjonær hvis m 1 tm og m 11 t, s. trict Stasjonaritet innebærer ikke i seg selv svak stasjonar. Svak stasjonaritet innebærer ikke strenge stasjonar. Streng stasjonar med E t 2 innebærer svak stasjonar. Øvrige teoremer er opptatt av spørsmålet om nødvendige og tilstrekkelige forhold for å gjøre avstand fra en enkelt realisering av en tidsserie. det koker ned for å anta svak stasjonar. Tetningen Hvis t er svakt stasjonær med gjennomsnittlig m og kovariansfunksjon, så. Det er for en gitt e 0 og h 0 finnes det noen tall T o slik at for alle TT o hvis og bare hvis. Denne nødvendige og tilstrekkelige betingelsen er at autocovariances dør ut, i hvilket tilfelle prøven betyr en konsistent estimator for befolkningen mean. Corollary Hvis t er svakt stasjonær med E tkxt 2 for noen t, og E tkxtxtskxts er uavhengig av t for noe heltall s, then. if og bare hvis where. A. konsekvens av sammenhengen er antakelsen om at xtxtk er svakt stasjonær Den ergotiske setningen er ikke mer enn en lov av store tall når observasjonene er korrelerte. Man kan kanskje spørre om de praktiske implikasjonene av stasjonar Den vanligste bruken av bruk av tidssergeteknikker er å modellere makroøkonomiske data, både teoretiske og atoretisk Som et eksempel på den tidligere, kan man ha en multiplikator-akseleratormodell For at modellen skal være stasjonær, må parameterne ha visse verdier En test av modellen er da å samle relevansen nt-data og estimere parametrene Hvis estimatene ikke stemmer overens med stasjonar, må man revurdere enten den teoretiske modellen eller statistisk modell eller begge. Vi har nå nok maskiner til å begynne å snakke om modellering av univariate tidsseriedata. Det er fire trinn i prosessen 1 bygningsmodeller fra teoretisk og opplevelseskunnskap 2 identifisere modeller basert på dataobserverte serie 3 tilpasse modellene estimere parametrene til modellen s 4 sjekke modellen Hvis i fjerde trinn vi ikke er fornøyd, går vi tilbake til trinn én Prosessen er iterativ til ytterligere kontroll og respektering gir ingen ytterligere forbedringer i resultatene Diagrammatisk. Definisjon Noen enkle operasjoner inkluderer følgende Backshift-operatøren Bx tx t-1 Fremoveroperatøren Fx txt 1 Differensialoperatøren 1 - B xtxt - x t -1 Forskjellen operatøren oppfører seg på en måte som er konsistent med konstanten i en uendelig serie. Det vil si at dens inverse er limi t av en uendelig sum Namn, -1 1-B -1 1 1-B 1 BB 2 Integrert operatør S -1 Siden det er invers av differanseoperatøren, tjener integrasjonsoperatøren til å konstruere summen. MODUL BUILDING I dette avsnittet gir vi en kort gjennomgang av de vanligste typene av tidsseriemodeller På grunnlag av en s-kunnskap om datagenereringsprosessen velger man en klasse av modeller for identifisering og estimering fra mulighetene som følger. Definisjon Anta at Ex tm er uavhengig av t En modell som med egenskapene kalles den autoregressive bestillingsmodellen p, AR p. Definisjon Hvis en tidsavhengig variabel stokastisk prosess t tilfredsstiller, er t sagt å tilfredsstille Markov-egenskapen På LHS er forventningen betinget av uendelig historie om xt På RHS er det betinget av kun en del av historien. Fra definisjonene er en AR p-modell sett til å tilfredsstille Markov-eiendommen. Ved hjelp av backshift-operatøren kan vi skrive vår AR-modell som. Ordningen A nødvendig og suff Forståelse for AR-modellen er å være stasjonær, er at alle polynomens røtter ligger utenfor enhetens sirkel. Eksempel 1 Vurder AR 1 Den eneste roten av 1 - f 1 B 0 er B 1 f 1 Forutsetningen for Stasjonar krever det. Hvis den observerte serien vil se ut som meget frenetisk, så vurderer den. Den hvite støybegrepet har en normal fordeling med nullverdier og en varians av en Observasjonsbryteren skilt med nesten alle observasjoner. Hvis den andre hånden, så vil den observerte serien bli mye jevnere. I denne serien har en observasjon en tendens til å ligge over 0 hvis forgjengeren var over null Variansen av et er se 2 for alle t Variasjonen av xt når den har null betyr, er gitt av Siden serien er stasjonær kan vi skrive Hence. The autocovariance-funksjonen til en AR 1-serie er å anta uten tap av generality m 0. For å se hvordan dette ser ut i forhold til AR-parametrene, vil vi gjøre bruk av det faktum at vi kan skriv xt som følger. Multiplying ved x tk og ta e xpectations. Note at autocovariances dør ut som k grows Autocorrelation funksjonen er autocovariance divideres med variansen av den hvite støy termen Eller, Ved hjelp av tidligere Yule-Walker formler for de delvise autokorrelasjoner vi har. For en AR 1 dør autokorrelasjonene ut eksponentielt og de delvise autokorrelasjonene viser en spike i ett lag og er null deretter. Eksempel 2 Vurder AR2 Det tilhørende polynomet i lagoperatøren er. Røttene kan bli funnet ved hjelp av den kvadratiske formelen Røttene er. Når røttene er ekte og som en konsekvens vil serien falle eksponentielt som svar på et sjokk Når røttene er komplekse og serien vil vises som en dempet tegnbølge. Stasjonsarbeidsormen pålegger følgende forhold på AR-koeffisientene. Autokovariansen for en AR 2-prosess med null betyr, er. Dividing gjennom av variansen av xt gir autocorrelation funksjonen Siden vi kan skrive Tilsvarende for andre og tredje autocorrelations. The o Disse autokorrelasjonene løses for rekursivt. Mønsteret styres av røttene til den andre ordens lineære forskjellsligning. Hvis røttene er ekte, vil autokorrelasjonene synke eksponentielt. Når røttene er komplekse, vil autokorrelasjonene vises som en dempet sinusbølge. Bruk Yule - Walker-ligningene, de delvise autokorrelasjonene er. Again, de autokorrelasjoner dør sakte. Den delvise autokorrelasjonen derimot, er ganske særpreget. Den har pigger på en og to lags og er null deretter. Skjemaet Hvis xt er en stationær AR p-prosess, kan den være ekvivalent skrevet som en lineær filtermodell Det vil si at polynomet i backshift-operatøren kan omvendt og AR p skrives som et bevegelig gjennomsnitt av uendelig rekkefølge istedenfor. Eksempel Anta at zt er en AR 1-prosess med null-middel Hva er sant for Nåværende periode må også være sant for tidligere perioder. Dermed ved rekursiv substitusjon kan vi skrive. Kant begge sider og ta forventninger. høyre side vanishe s som k siden f 1 Derfor summen konvergerer til zt i kvadratisk gjennomsnitt Vi kan omskrive AR p-modellen som et lineært filter som vi vet å være stasjonære. Autokorrelasjonsfunksjonen og partiell autokorrelasjon Generelt antar at en stasjonær serie zt med middel null er kjent for å være autoregressiv Autokorrelasjonsfunksjonen til en AR p er funnet ved å ta forventningene til. og dele seg gjennom variansen av z t. Dette forteller oss at rk er en lineær kombinasjon av tidligere autokorrelasjoner. Vi kan bruke dette ved å anvende Cramer s regel til jeg i å løse for f kk Spesielt kan vi se at denne lineære avhengigheten vil forårsake f kk 0 for kp Dette karakteristiske trekk ved autoregressive serier vil være svært nyttig når det gjelder identifisering av en ukjent serie. Hvis du har enten MathCAD eller MathCAD Explorer, så kan du eksperimentere med noen av AR-ideene som presenteres her. Gjennomgang av gjennomsnittlige modeller Vurder en dynamisk modell der serien av interesse bare avhenger av en del av historien til den hvite støytermen Diagrammatisk kan dette bli representert som. Definisjon Anta at det er en ukorrelert sekvens av iid tilfeldige variabler med null gjennomsnittlig og endelig varianse. Deretter er en glidende gjennomsnittlig prosess av rekkefølge q, MA q, gitt av. Theorem A Flytende gjennomsnittsprosess er alltid stasjonær Bevis I stedet for å starte med et generelt bevis, vil vi gjøre det for et bestemt tilfelle. Antag at zt er MA 1 Da Selvfølgelig har null null og endelig varians. Middelet av zt er alltid null. Autokonferansen vil bli gitt av. Du kan se at gjennomsnittet av tilfeldig variabel ikke avhenger av tid på noen måte. Du kan også se at autokovariansen bare avhenger av offset s, ikke hvor i serien vi starter. Vi kan bevise det samme resultatet mer vanligvis ved å begynne med, som har den alternative glidende gjennomsnittlige representasjonen. Først sett av variansen av z t. Ved rekursiv substitusjon kan du vise at dette er lik. Summen vi vet er en konvergent serie, slik at variansen er endelige og er uavhengig av tiden. Kovariansene er for eksempel. Du kan også se at auto-kovarianene bare avhenger av de relative punktene i tid, ikke det kronologiske punktet i tid. Vår konklusjon fra alt dette er at en MA-prosess er stasjonær For Den generelle MA q-prosessen autokorrelasjonsfunksjonen er gitt av. Den delvise autokorrelasjonsfunksjonen vil dø ut jevnt. Du kan se dette ved å invertere prosessen for å få en AR-prosess. Hvis du har enten MathCAD eller MathCAD Explorer, kan du eksperimentere interaktivt med noen av MA q ideene presenteres her. Blandede autoregressive - Moving Average Models. Definisjon Anta at er en ukorrelert sekvens av iid tilfeldige variabler med null gjennomsnittlig og endelig varianse. Deretter er en autoregressiv, bevegelig gjennomsnittlig prosess av orden p, q, ARMA p, q, gitt av. Den autoregressive operatørens røtter må alle ligge utenfor enhetens sirkel. Antallet ukjente er pq. 2 P og q er åpenbare. Den 2 inneholder prosessnivået, m an d variansen av den hvite støybegrepet, sa 2. Anta at vi kombinerer våre AR - og MA-representasjoner slik at modellen er. og koeffisientene er normalisert slik at bo 1 Da blir denne representasjonen kalt en ARMA p, q hvis røttene til 1 alle ligger utenfor enhetens sirkel. Anta at yt måles som avvik fra gjennomsnittet, slik at vi kan slippe da blir autokovariansfunksjonen avledet fra. if jq, da MA-vilkårene faller ut i forventning om å gi. Det er autokovariansfunksjonen ser ut som en typisk AR for lags etter at q de dør jevnt etter q, men vi kan ikke si hvordan 1,2, q vil se. Vi kan også undersøke PACF for denne klassen av modellen. Modellen kan skrives som. Vi kan skrive dette som en MA inf prosess. Som antyder at PACF s dør ut sakte Med noen aritmetiske vi kunne vise at dette skjer bare etter de første p pigger bidratt av AR-delen. Empirisk lov I virkeligheten kan en stasjonær tidsserie godt bli representert ved p 2 og q 2 Hvis virksomheten din skal prøves ide en god tilnærming til virkeligheten og godhet av passform er ditt kriterium, da er en fortapt modell foretrukket Hvis interessen din er prediktiv effektivitet, så er den parsimoniske modellen foretrukket. Eksperiment med ARMA ideene presentert ovenfor med et MathCAD-regneark. Utviklingsregistrerende Integrer Flytte Gjennomsnittsmodeller. MA filter AR filter Integrere filter. Noen ganger prosessen eller serien, vi prøver å modellere, er ikke stasjonære i nivåer. Men det kan være stasjonært, for eksempel første forskjeller. Det er i sin opprinnelige form kanskje ikke autocovariances for serien. uavhengig av det kronologiske punktet i tid Men hvis vi bygger en ny serie som er de første forskjellene i den opprinnelige serien, oppfyller denne nye serien definisjonen av stasjonar. Dette er ofte tilfelle med økonomiske data som er svært trended. Definition Anta at zt er ikke stasjonær, men zt - z t - 1 tilfredsstiller definisjonen av stasjonar. Videre har den hvite støybegrepet endelige mål og varians. Vi kan w rite modellen som. Dette kalles en ARIMA p, d, q modell p identifiserer AR-operatørens rekkefølge, d identifiserer strømmen q identifiserer rekkefølgen til MA-operatøren Hvis røttene til f B ligger utenfor enhetens sirkel så vi kan omskrive ARIMA p, d, q som et lineært filter. Jeg kan skrive det som en MA. Vi reserverer diskusjonen om deteksjon av enhetsrøtter for en annen del av forelesningsnotatene. Se på et dynamisk system med xt som en inngang serier og yt som en utgangsserie Diagrammatisk har vi. Disse modellene er en diskret analogi av lineære differensialligninger. Vi antar følgende forhold. hvor b indikerer en ren forsinkelse. Husk at 1-B Gjør denne substitusjonen modellen kan skrives. Hvis koeffisienten polynom på yt kan omvendt, så modellen kan skrives som. VB er kjent som impulsresponsfunksjonen. Vi vil komme over denne terminologien igjen i vår senere diskusjon av vektor autoregressive cointegrerings - og feilkorrigeringsmodeller. MODELL IDENTIFIKASJON Å ha de cided på en klasse av modeller, må man nå identifisere rekkefølgen av prosessene som genererer dataene. Det er man må gjøre beste gjetninger om rekkefølgen av AR - og MA-prosessene som kjører den stationære serien. En stasjonær serie er fullstendig preget av sin gjennomsnittlige og autocovariances Av analytiske grunner jobber vi vanligvis med autokorrelasjoner og delvise autokorrelasjoner. Disse to grunnleggende verktøyene har unike mønstre for stasjonære AR - og MA-prosesser. En kunne beregne utvalgsestimater av autokorrelasjon og delvise autokorrelasjonsfunksjoner og sammenligne dem med tabulerte resultater for standardmodeller. Eksempel Autocovariance Function. Sample Autocorrelation Function. The sample partial autocorrelations will be. Using autocorrelations og partial autocorrelations er ganske enkelt i utgangspunktet Anta at vi har en serie zt med null gjennomsnitt, som er AR 1 Hvis vi skulle kjøre regresjonen av zt 2 på zt 1 og zt ville vi regne med å finne at koeffisienten på zt ikke var annerledes m null siden denne delvise autokorrelasjonen burde være null På den annen side bør autokorrelasjonene for denne serien falle eksponentielt for å øke lagene se AR 1-eksemplet over. Anta at serien er virkelig et bevegelige gjennomsnitt. Autokorrelasjonen skal være null overalt, men ved første forsinkelse Den delvise autokorrelasjonen burde dø ut eksponentielt. Selv fra vår veldig oversiktlige tromme gjennom grunnleggende tidsserier, er det tydelig at det er en dualitet mellom AR og MA prosesser. Denne dualiteten kan oppsummeres i følgende tabell.2 1 Flytte gjennomsnittlige modeller MA modeller. Tidsseriemodeller kjent som ARIMA-modeller kan omfatte autoregressive termer og eller bevegelige gjennomsnittsvilkår I uke 1 lærte vi et autoregressivt uttrykk i en tidsserie-modell for variabelen. Xt er en forsinket verdi på xt. For eksempel en lag 1 autoregressiv term er x t-1 multiplisert med en koeffisient Denne leksjonen definerer glidende gjennomsnittlige termer. En glidende gjennomsnittlig term i en tidsseriemodell er en siste e rror multiplisert med en koeffisient. La oss oversette N 0, sigma 2w, noe som betyr at vekten er identisk, uavhengig distribuert, hver med en normal fordeling som har gjennomsnittlig 0 og samme varians. Den 1 st ordningsgjøre gjennomsnittsmodellen, betegnet med MA 1 er. xt mu wt theta1w. Den 2. ordre flytte gjennomsnittlig modell, betegnet av MA 2 er. xt mu wt theta1w theta2.Den q ordreberegning av gjennomsnittlig modell, betegnet med MA q er. xt mu wt theta1w theta2w prikker thetaq. Note Mange lærebøker og programvare definerer modellen med negative tegn før betingelsene. Dette endrer ikke de generelle teoretiske egenskapene til modellen, selv om den ikke flipper de algebraiske tegnene på estimerte koeffisientverdier og ubetingede vilkår i formler for ACFer og avvik Du må sjekke programvaren din for å verifisere om negative eller positive tegn har blitt brukt for å skrive riktig estimert modell R bruker positive tegn i sin underliggende modell, slik vi gjør her. Theoretiske egenskaper av en tidsrekke med en MA 1-modell. Merk at den eneste ikke-nullverdien i teoretisk ACF er for lag 1 Alle andre autokorrelasjoner er 0 Således er en prøve-ACF med en signifikant autokorrelasjon bare ved lag 1 en indikator på en mulig MA 1-modell. For interesserte studenter, Bevis på disse egenskapene er et vedlegg til denne utleveringen. Eksempel 1 Anta at en MA 1-modell er xt 10 wt 7 w t-1 hvor overskuddet N 0,1 Altså koeffisienten 1 0 7 Th e teoretisk ACF er gitt av. Et plott av denne ACF følger. Plottet som nettopp er vist er den teoretiske ACF for en MA 1 med 1 0 7 I praksis fikk en prøve t vanligvis et slikt klart mønster. Ved hjelp av R simulerte vi n 100 Eksempelverdier ved hjelp av modellen xt 10 wt 7 w t-1 hvor w t. iid N 0,1 For denne simuleringen følger en tidsserier av prøvedataene. Vi kan ikke fortelle mye fra denne plottet. Prøven ACF for den simulerte data følger Vi ser en spike i lag 1 etterfulgt av generelt ikke signifikante verdier for lags fortid 1 Merk at prøven ACF ikke samsvarer med det teoretiske mønsteret til den underliggende MA 1, som er at alle autokorrelasjoner for lags forbi 1 vil være 0 A forskjellig prøve ville ha en litt annen prøve-ACF som vist nedenfor, men vil trolig ha de samme brede funksjonene. Deoretiske egenskaper av en tidsrekkefølge med en MA 2-modell. For MA 2-modellen er teoretiske egenskaper følgende. Merk at den eneste ikke-null Verdiene i teoretisk ACF er for lags 1 og 2 Autocorrelat ioner for høyere lags er 0 Så, en prøve-ACF med signifikante autokorrelasjoner på lags 1 og 2, men ikke-signifikante autokorrelasjoner for høyere lags indikerer en mulig MA 2-modell. Nid koeffisientene er 1 0 5 og 2 0 3 Fordi dette er en MA 2, vil den teoretiske ACF ha null nullverdier bare ved lags 1 og 2.Values ​​av de to ikke-autokorrelasjonene er. En plot av den teoretiske ACF følger. Som nesten alltid er tilfellet, vil prøvedata vunnet t oppføre seg ganske så perfekt som teori Vi simulerte n 150 utvalgsverdier for modellen xt 10 wt 5 w t-1 3 w t-2 hvor w t. iid N 0,1 Tidsseriens plott av dataene følger Som med tidsseriens plott for MA1-prøvedataene, kan du ikke fortelle mye av det. Prøven ACF for de simulerte dataene følger Mønsteret er typisk for situasjoner der en MA 2-modell kan være nyttig. Det er to statistisk signifikante pigger på lags 1 og 2 etterfulgt av ikke - - sviktige verdier for andre lag. Merk at på grunn av prøvetakingsfeil ikke samsvarte ACF det teoretiske mønsteret nøyaktig. ACF for General MA q Models. A egenskapen til MA q - modeller generelt er at det er ikke-null autokorrelasjoner for de første q lags og autocorrelations 0 for alle lags q. Non-uniqueness av forbindelse mellom verdier på 1 og rho1 i MA 1-modell. I MA 1-modellen, for en verdi på 1, gir den gjensidige 1 1 samme verdi. For eksempel, bruk 0 5 for 1 og bruk deretter 1 0 5 2 for 1 Du får rho1 0 4 i begge tilfeller. For å tilfredsstille en teoretisk begrensning som kalles invertibilitet begrenser vi MA 1-modeller til å ha verdier med absolutt verdi mindre enn 1 I eksemplet som er gitt, vil 1 0 5 være en tillatelig parameterverdi, mens 1 1 0 5 2 ikke vil. Invertibility av MA modeller. En MA-modell sies å være invertibel hvis den er algebraisk tilsvarer en konvergerende uendelig rekkefølge AR-modell. Ved konvertering mener vi at AR-koeffisientene reduseres til 0 når vi beveger oss tilbake i tiden. Invertibility er en begrensning programmert inn i tidsserier programvare som brukes til å estimere coeff ICE-modeller med MA-vilkår Det er ikke noe vi ser etter i dataanalysen. Ytterligere informasjon om inverterbarhetsbegrensningen for MA 1-modeller er gitt i vedlegget. Avansert teoretisk merknad For en MA q-modell med en spesifisert ACF, er det bare en inverterbar modell Den nødvendige betingelsen for inverterbarhet er at koeffisientene har verdier slik at ligningen 1- 1 y - qyq 0 har løsninger for y som faller utenfor enhetens sirkel. R Kode for eksemplene. I eksempel 1 plottet vi teoretisk ACF av modellen xt 10 wt 7w t-1 og deretter simulert n 150 verdier fra denne modellen og plottet prøve tidsseriene og prøven ACF for de simulerte data R-kommandoene som ble brukt til å plotte den teoretiske ACF var. acfma1 ARMAacf ma c 0 7, 10 lags av ACF for MA 1 med theta1 0 7 lags 0 10 skaper en variabel som heter lags som varierer fra 0 til 10 plot lags, acfma1, xlim c 1,10, ylab r, type h, hoved ACF for MA 1 med theta1 0 7 abline h 0 legger en horisontal akse til plottet. Th e første kommandoen bestemmer ACFen og lagrer den i en gjenstand som heter acfma1 vårt valg av navn. Plot-kommandoen 3. kommando-plottene lags versus ACF-verdiene for lags 1 til 10 ylab-parameteren merker y-aksen og hovedparameteren setter en tittel på plottet. For å se de numeriske verdiene til ACF, bruk bare kommandoen acfma1. Simuleringen og plottene ble gjort med følgende kommandoer. liste ma c 0 7 Simulerer n 150 verdier fra MA 1 x xc 10 legger til 10 for å lage gjennomsnitt 10 Simuleringsstandarder betyr 0 plot x, type b, hoved Simulert MA 1 data acf x, xlim c 1,10, hoved ACF for simulert prøve-data. I eksempel 2 skisserte vi den teoretiske ACF av modellen xt 10 wt 5 w t-1 3 w t-2 og simulerte deretter n 150 verdier fra denne modellen og plottet prøve tidsserien og prøven ACF for den simulerte data R-kommandoene som ble brukt var. acfma2 ARMAacf ma c 0 5,0 3, acfma2 lags 0 10 plot lags, acfma2, xlim c 1,10, ylab r, type h, hoved ACF for MA 2 med theta1 0 5, theta2 0 3 abline h 0 liste ma c 0 5, 0 3 x xc 10 plot x, type b, hoved Simulert MA 2-serie acf x, xlim c 1,10, hoved ACF for simulert MA 2 Data. Appendix Bevis på egenskaper til MA 1 . For interesserte studenter, her er det bevis på teoretiske egenskaper til MA 1-modellen. Varianttekst xt tekst mu wt theta1 w 0 tekst wt tekst theta1w sigma 2w theta 21 sigma 2w 1 theta 21 sigma 2When h 1 er det forrige uttrykket 1 w 2 For noen h 2 , forrige uttrykk 0 Årsaken er at ved definisjon av uavhengighet av Wt E wkwj 0 for noen kj Videre, fordi wt har betyde 0, E wjwj E wj 2 w 2.For en tidsserie. Bruk dette resultatet for å få ACF gitt ovenfor. En inverterbar MA-modell er en som kan skrives som en uendelig rekkefølge AR-modell som konvergerer slik at AR-koeffisientene konvergerer til 0 mens vi beveger oss uendelig tilbake i tid. Vi skal demonstrere inverterbarhet for MA 1-modellen. substituttforhold 2 for w t-1 i ligning 1. 3 zt wt theta1 z - theta1w wt theta1z - theta 2w. At tiden t-2 ligning 2 blir. Vi erstatter deretter forhold 4 for w t-2 i ligning 3. zt wt theta1 z - theta 21w wt theta1z - theta 21 z - theta1w wt theta1z - theta1 2z theta 31.If vi skulle fortsette uendelig, ville vi få den uendelige rekkefølgen AR - modellen. Zt wt theta1 z - theta 21z theta 31z - theta 41z prikker. Merk at hvis 1 1, vil koeffisientene som multipliserer lagene av z, øke uendelig i størrelse når vi beveger seg tilbake i tid. For å forhindre dette, trenger vi 1 1 Dette er betingelsen for en inverterbar MA 1 modell. Infinite Order MA modell. I uke 3 ser vi at en AR 1-modell kan konverteres til en uendelig rekkefølge MA-modell. xt - mu wt phi1w phi 21w prikker phi k1 w prikker sum phi j1w. Denne summeringen av tidligere hvite støybetingelser er kjent som en årsakssammenstilling av en AR 1 Med andre ord er xt en spesiell type MA med et uendelig antall termer går tilbake i tid Dette kalles en uendelig ordre MA eller MA En endelig ordre MA er en uendelig orden AR og en hvilken som helst endelig ordre AR er en uendelig ordre MA. Recall i uke 1, bemerket vi at et krav til en stasjonær AR 1 er at 1 1 La oss beregne Var xt ved hjelp av årsakssammensetningen. Dette siste trinnet bruker et grunnleggende faktum om geometriske serier som krever phi1 1 ellers ser serien ut.

No comments:

Post a Comment