Proc Arima Moving Average


Introduksjon til ARIMA: nonseasonal modeller ARIMA (p, d, q) prognoser likning: ARIMA modeller er i teorien den mest generelle klassen av modeller for å prognose en tidsserie som kan gjøres til å være 8220stationary8221 ved differensiering (om nødvendig), kanskje i forbindelse med ikke-lineære transformasjoner som logging eller deflatering (om nødvendig). En tilfeldig variabel som er en tidsserie er stasjonær hvis dens statistiske egenskaper er konstante over tid. En stasjonær serie har ingen trend, dens variasjoner rundt sin gjennomsnitt har en konstant amplitude, og den svinger på en konsistent måte. det vil si at kortsiktige tilfeldige tidsmønstre alltid ser like ut i statistisk forstand. Den sistnevnte tilstanden betyr at dets autokorrelasjoner (korrelasjoner med sine egne tidligere avvik fra gjennomsnittet) forblir konstante over tid, eller tilsvarende, at dets effektspektrum forblir konstant over tid. En tilfeldig variabel i dette skjemaet kan ses som en kombinasjon av signal og støy, og signalet (hvis det er tydelig) kan være et mønster av rask eller langsom, gjennomsnittlig reversering eller sinusformet svingning eller rask veksling i tegn , og det kan også ha en sesongbestemt komponent. En ARIMA-modell kan ses som en 8220filter8221 som forsøker å skille signalet fra støyen, og signalet blir deretter ekstrapolert inn i fremtiden for å oppnå prognoser. ARIMA-prognose-ligningen for en stasjonær tidsserie er en lineær (dvs. regresjonstype) ekvation hvor prediktorene består av lag av de avhengige variable ogor lagene av prognosefeilene. Det er: Forutsigbar verdi for Y en konstant og en vektet sum av en eller flere nylige verdier av Y og eller en vektet sum av en eller flere nylige verdier av feilene. Hvis prediktorene kun består av forsinkede verdier av Y. Det er en ren autoregressiv (8220self-regressed8221) modell, som bare er et spesielt tilfelle av en regresjonsmodell, og som kunne være utstyrt med standard regresjonsprogramvare. For eksempel er en førsteordens autoregressiv (8220AR (1) 8221) modell for Y en enkel regresjonsmodell der den uavhengige variabelen bare er Y forsinket med en periode (LAG (Y, 1) i Statgraphics eller YLAG1 i RegressIt). Hvis noen av prediktorene er lags av feilene, er en ARIMA-modell det IKKE en lineær regresjonsmodell, fordi det ikke er mulig å spesifisere 8220last period8217s error8221 som en uavhengig variabel: feilene må beregnes fra tid til annen når modellen er montert på dataene. Fra et teknisk synspunkt er problemet med å bruke forsinkede feil som prediktorer at modellen8217s spådommer ikke er lineære funksjoner av koeffisientene. selv om de er lineære funksjoner av tidligere data. Så koeffisienter i ARIMA-modeller som inkluderer forsinkede feil må estimeres ved ikke-lineære optimaliseringsmetoder (8220hill-klatring8221) i stedet for bare å løse et system av ligninger. Akronymet ARIMA står for Auto-Regressive Integrated Moving Average. Lags av den stasjonære serien i prognosekvotasjonen kalles kvotoregressivequot vilkår, lags av prognosefeilene kalles quotmoving averagequot vilkår, og en tidsserie som må differensieres for å bli stillestående, sies å være en quotintegratedquot-versjon av en stasjonær serie. Tilfeldige gange og tilfeldige trendmodeller, autoregressive modeller og eksponentielle utjevningsmodeller er alle spesielle tilfeller av ARIMA-modeller. En nonseasonal ARIMA-modell er klassifisert som en quotARIMA (p, d, q) kvotemodell hvor: p er antall autoregressive termer, d er antall ikke-sekundære forskjeller som trengs for stasjonar, og q er antall forsinkede prognosefeil i prediksjonsligningen. Forutsigelsesligningen er konstruert som følger. Først, la y angi den forskjellen på Y. Det betyr: Merk at den andre forskjellen på Y (d2-saken) ikke er forskjellen fra 2 perioder siden. Snarere er det den første forskjellen-av-første forskjellen. som er den diskrete analogen til et andre derivat, det vil si den lokale akselerasjonen av serien i stedet for sin lokale trend. Når det gjelder y. Den generelle prognosekvasjonen er: Her er de bevegelige gjennomsnittsparametrene (9528217s) definert slik at deres tegn er negative i ligningen, etter konvensjonen innført av Box og Jenkins. Noen forfattere og programvare (inkludert R programmeringsspråket) definerer dem slik at de har pluss tegn i stedet. Når faktiske tall er koblet til ligningen, er det ingen tvetydighet, men det er viktig å vite hvilken konvensjon programvaren bruker når du leser utgangen. Ofte er parametrene benevnt der av AR (1), AR (2), 8230 og MA (1), MA (2), 8230 etc. For å identifisere den aktuelle ARIMA modellen for Y. begynner du ved å bestemme differensordren (d) trenger å stasjonærisere serien og fjerne bruttoegenskapene til sesongmessighet, kanskje i forbindelse med en variansstabiliserende transformasjon som logging eller deflating. Hvis du stopper på dette punktet og forutsier at den forskjellige serien er konstant, har du bare montert en tilfeldig tur eller tilfeldig trendmodell. Den stasjonære serien kan imidlertid fortsatt ha autokorrelerte feil, noe som tyder på at noen antall AR-termer (p 8805 1) og eller noen nummer MA-termer (q 8805 1) også er nødvendig i prognosekvasjonen. Prosessen med å bestemme verdiene p, d og q som er best for en gitt tidsserie, vil bli diskutert i senere avsnitt av notatene (hvis koblinger er øverst på denne siden), men en forhåndsvisning av noen av typene av nonseasonal ARIMA-modeller som ofte oppstår, er gitt nedenfor. ARIMA (1,0,0) førstegangs autoregressiv modell: Hvis serien er stasjonær og autokorrelert, kan den kanskje forutsies som et flertall av sin egen tidligere verdi, pluss en konstant. Forutsigelsesligningen i dette tilfellet er 8230 som er Y regressert i seg selv forsinket med en periode. Dette er en 8220ARIMA (1,0,0) constant8221 modell. Hvis gjennomsnittet av Y er null, vil ikke det konstante begrepet bli inkludert. Hvis hellingskoeffisienten 981 1 er positiv og mindre enn 1 i størrelsesorden (den må være mindre enn 1 i størrelsesorden dersom Y er stasjonær), beskriver modellen gjennomsnittsreferanseadferd hvor neste periode8217s verdi skal anslås å være 981 1 ganger som langt unna gjennomsnittet som denne perioden8217s verdi. Hvis 981 1 er negativ, forutser det middelreferanseadferd med skifting av tegn, dvs. det forutsier også at Y vil være under gjennomsnittlig neste periode hvis den er over gjennomsnittet denne perioden. I en andre-ordregivende autoregressiv modell (ARIMA (2,0,0)), ville det være et Y t-2 begrep til høyre også, og så videre. Avhengig av tegnene og størrelsene på koeffisientene, kunne en ARIMA (2,0,0) modell beskrive et system hvis gjennomsnitts reversering foregår i sinusformet oscillerende mote, som bevegelse av en masse på en fjær som er utsatt for tilfeldige støt . ARIMA (0,1,0) tilfeldig tur: Hvis serien Y ikke er stasjonær, er den enkleste modellen for den en tilfeldig turmodell, som kan betraktes som et begrensende tilfelle av en AR (1) modell der autoregressive koeffisienten er lik 1, det vil si en serie med uendelig sakte gjennomsnittlig reversering. Forutsigelsesligningen for denne modellen kan skrives som: hvor den konstante sikt er den gjennomsnittlige period-til-periode-endringen (dvs. den langsiktige driften) i Y. Denne modellen kan monteres som en ikke-avskjæringsregresjonsmodell der Første forskjell på Y er den avhengige variabelen. Siden den inneholder (bare) en ikke-sesongforskjell og en konstant periode, er den klassifisert som en quotARIMA (0,1,0) modell med constant. quot. Den tilfeldige tur-uten-drift modellen ville være en ARIMA (0,1, 0) modell uten konstant ARIMA (1,1,0) forskjellig førsteordens autoregressiv modell: Hvis feilene i en tilfeldig turmodell er autokorrelert, kan problemet løses ved å legge til et lag av den avhengige variabelen til prediksjonsligningen - - dvs ved å regresse den første forskjellen på Y i seg selv forsinket med en periode. Dette vil gi følgende prediksjonsligning: som kan omarrangeres til Dette er en førsteordens autoregressiv modell med en rekkefølge av ikke-soneforskjeller og en konstant term, dvs. en ARIMA (1,1,0) modell. ARIMA (0,1,1) uten konstant enkel eksponensiell utjevning: En annen strategi for korrigering av autokorrelerte feil i en tilfeldig gangmodell er foreslått av den enkle eksponensielle utjevningsmodellen. Husk at for noen ikke-stationære tidsserier (for eksempel de som viser støyende svingninger rundt et sakte varierende gjennomsnitt), utfører ikke den tilfeldige turmodellen så vel som et glidende gjennomsnittsverdier av tidligere verdier. Med andre ord, i stedet for å ta den nyeste observasjonen som prognosen for neste observasjon, er det bedre å bruke et gjennomsnitt av de siste observasjonene for å filtrere ut støy og mer nøyaktig anslå det lokale gjennomsnittet. Den enkle eksponensielle utjevningsmodellen bruker et eksponentielt vektet glidende gjennomsnitt av tidligere verdier for å oppnå denne effekten. Forutsigelsesligningen for den enkle eksponensielle utjevningsmodellen kan skrives i en rekke matematisk ekvivalente former. hvorav den ene er den såkalte 8220error correction8221 skjemaet, der den forrige prognosen er justert i retning av feilen den gjorde: Fordi e t-1 Y t-1 - 374 t-1 per definisjon kan dette omskrives som : som er en ARIMA (0,1,1) - out-konstant prognosekvasjon med 952 1 1 - 945. Dette betyr at du kan passe en enkel eksponensiell utjevning ved å angi den som en ARIMA (0,1,1) modell uten konstant, og den estimerte MA (1) - koeffisienten tilsvarer 1-minus-alfa i SES-formelen. Husk at i SES-modellen er gjennomsnittsalderen for dataene i 1-periode fremover prognosene 1 945. Det betyr at de vil ha en tendens til å ligge bak trender eller vendepunkter med ca 1 945 perioder. Det følger at gjennomsnittlig alder av dataene i 1-periode fremover prognosene for en ARIMA (0,1,1) uten konstant modell er 1 (1 - 952 1). For eksempel, hvis 952 1 0,8 er gjennomsnittsalderen 5. Når 952 1 nærmer seg 1, blir ARIMA (0,1,1) uten konstant modell et veldig langsiktig glidende gjennomsnitt og som 952 1 nærmer seg 0 blir det en tilfeldig tur uten drivmodell. What8217s den beste måten å korrigere for autokorrelasjon: legge til AR-vilkår eller legge til MA-vilkår I de to foregående modellene ble problemet med autokorrelerte feil i en tilfeldig turmodell løst på to forskjellige måter: ved å legge til en forsinket verdi av differensierte serier til ligningen eller legge til en forsinket verdi av prognosen feil. Hvilken tilnærming er best En tommelfingerregel for denne situasjonen, som vil bli nærmere omtalt senere, er at positiv autokorrelasjon vanligvis behandles best ved å legge til et AR-uttrykk for modellen og negativ autokorrelasjon vanligvis behandles best ved å legge til en MA term. I forretnings - og økonomiske tidsserier oppstår negativ autokorrelasjon ofte som en artefakt av differensiering. (Generelt reduserer differensiering positiv autokorrelasjon og kan til og med føre til en bryter fra positiv til negativ autokorrelasjon.) Så, ARIMA (0,1,1) modellen, der differensiering er ledsaget av en MA-term, brukes hyppigere enn en ARIMA (1,1,0) modell. ARIMA (0,1,1) med konstant enkel eksponensiell utjevning med vekst: Ved å implementere SES-modellen som en ARIMA-modell, får du faktisk en viss fleksibilitet. Først og fremst er estimert MA (1) - koeffisient tillatt å være negativ. Dette tilsvarer en utjevningsfaktor som er større enn 1 i en SES-modell, som vanligvis ikke er tillatt i SES-modellprosedyren. For det andre har du muligheten til å inkludere en konstant periode i ARIMA-modellen hvis du ønsker det, for å estimere en gjennomsnittlig ikke-null trend. ARIMA-modellen (0,1,1) med konstant har prediksjonsligningen: Forventningene for en periode fremover fra denne modellen er kvalitativt lik SES-modellen, bortsett fra at bane av de langsiktige prognosene vanligvis er en skrånende linje (hvis skråning er lik mu) i stedet for en horisontal linje. ARIMA (0,2,1) eller (0,2,2) uten konstant lineær eksponensiell utjevning: Linjære eksponentielle utjevningsmodeller er ARIMA-modeller som bruker to ikke-soneforskjeller i sammenheng med MA-termer. Den andre forskjellen i en serie Y er ikke bare forskjellen mellom Y og seg selv forsinket av to perioder, men det er den første forskjellen i den første forskjellen - dvs. Y-endringen i Y i periode t. Således er den andre forskjellen på Y ved periode t lik (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. En annen forskjell på en diskret funksjon er analog med et andre derivat av en kontinuerlig funksjon: det måler kvoteringsberegningsquot eller quotcurvaturequot i funksjonen på et gitt tidspunkt. ARIMA-modellen (0,2,2) uten konstant forutser at den andre forskjellen i serien er lik en lineær funksjon av de to siste prognosefeilene: som kan omarrangeres som: hvor 952 1 og 952 2 er MA (1) og MA (2) koeffisienter. Dette er en generell lineær eksponensiell utjevningsmodell. i hovedsak det samme som Holt8217s modell, og Brown8217s modell er et spesielt tilfelle. Den bruker eksponensielt vektede glidende gjennomsnitt for å anslå både et lokalt nivå og en lokal trend i serien. De langsiktige prognosene fra denne modellen konvergerer til en rett linje hvis skråning avhenger av den gjennomsnittlige trenden observert mot slutten av serien. ARIMA (1,1,2) uten konstant fuktet trend lineær eksponensiell utjevning. Denne modellen er illustrert i de tilhørende lysbildene på ARIMA-modellene. Den ekstrapolerer den lokale trenden i slutten av serien, men flater ut på lengre prognoshorisonter for å introdusere et konservatismedokument, en praksis som har empirisk støtte. Se artikkelen om hvorfor Damped Trend worksquot av Gardner og McKenzie og quotgolden Rulequot-artikkelen av Armstrong et al. for detaljer. Det er generelt tilrådelig å holde fast i modeller der minst en av p og q ikke er større enn 1, dvs. ikke prøv å passe på en modell som ARIMA (2,1,2), da dette sannsynligvis vil føre til overfitting og kvadrat-faktorquot problemer som er omtalt nærmere i notatene om den matematiske strukturen til ARIMA-modellene. Implementering av regneark: ARIMA-modeller som de som er beskrevet ovenfor, er enkle å implementere på et regneark. Forutsigelsesligningen er bare en lineær ligning som refererer til tidligere verdier av originale tidsserier og tidligere verdier av feilene. Dermed kan du sette opp et ARIMA prognose regneark ved å lagre dataene i kolonne A, prognoseformelen i kolonne B, og feilene (data minus prognoser) i kolonne C. Forutsigelsesformelen i en typisk celle i kolonne B ville ganske enkelt være et lineært uttrykk som refererer til verdier i forrige rader med kolonner A og C, multiplisert med de relevante AR - eller MA-koeffisientene lagret i celler andre steder på regnearket. PROC ARIMA-alternativer Følgende alternativer kan brukes i PROC ARIMA-setningen. Angir navnet på SAS datasettet som inneholder tidsseriene. Hvis forskjellige DATA-spesifikasjoner vises i PROC ARIMA - og IDENTIFY-setningene, brukes den i IDENTIFY-setningen. Hvis DATA-alternativet ikke er angitt i enten PROC ARIMA eller IDENTIFY-setningen, brukes det sist opprettede SAS datasettet. PLOTSlt (global-plot-opsjoner) lt plot-request lt (alternativer) PLOTSlt (plott-opsjoner) lt (plot-request lt (opsjoner) lt plot-request lt (opsjoner)) styrer plottene produsert gjennom ODS Graphics . Når du angir bare en plotforespørsel, kan du utelate parentesene rundt plotforespørselen. Her er noen eksempler: Du må aktivere ODS-grafikk før du ber om tomter som vist i de følgende setningene. For generell informasjon om ODS Graphics, se Kapittel 21, Statistisk grafikk ved hjelp av ODS (SASSTAT User Guide). Hvis du har aktivert ODS-grafikk, men ikke spesifiserer en bestemt plotforespørsel, blir standardplottene knyttet til hver av PROC ARIMA-setningene som brukes i programmet, produsert. De gamle linjeprinterplottene blir undertrykt når ODS Graphics er aktivert. Siden det ikke er forespurt noe bestemt plott i dette programmet, blir standardplottene tilknyttet identifikasjons - og estimeringsstadiene produsert. Global Plot Options: Global Plot-alternativene gjelder for alle relevante plott generert av ARIMA-prosedyren. Følgende globale plot-alternativer støttes: KUN undertrykker standardplottene. Bare de spesifiserte tomtene er produsert. bryter en grafikk som ellers er panelert i enkelte komponentplott. Spesifikke plottalternativer: Følgende liste beskriver de konkrete plottene og deres alternativer. produserer alle tomter som passer for den aktuelle analysen. undertrykker alle tomter. produserer tomter assosiert med identifikasjonsfasen av modelleringen. Panelplottene som korresponderer med CORR og CROSSCORR-alternativene, blir som standard produsert. Følgende serie-plott-alternativer er tilgjengelige: produserer plott av autokorrelasjoner. produserer alle tomter knyttet til identifikasjonstrinnet. produserer et panel av tomter som er nyttige i trenden og korrelasjonsanalysen av serien. Panelet består av følgende: tidsserien plott serie-autokorrelasjonsplottet serie-partiell-autokorrelasjonsplottet serie-inverse-autokorrelasjonsplottet produserer paneler med krysskorrelasjonsplott. produserer plottet av inverse-autokorrelasjoner. produserer plottet av delvise autokorrelasjoner. produserer residuals tomter. Resterende korrelasjons - og normalitetsdiagnostiske paneler produseres som standard. Følgende rest-plott-alternativer er tilgjengelige: produserer plottet av gjenværende autokorrelasjoner. produserer alle restdiagnostikkplottene som er passende for den aktuelle analysen. produserer et oppsummeringspanel av gjenværende korrelasjonsdiagnostikk som består av følgende: residual-autokorrelasjon plot residual-partial-autocorrelation plot residual-inverse-autocorrelation plot et plott av Ljung-Box white-noise test p - verdier på forskjellige lag produserer histogrammet av residuene. produserer plottet av gjenværende inverse-autokorrelasjoner. produserer et oppsummeringspanel av residual normalitetsdiagnostikk som består av følgende: Histogram av residualene Normale kvantile plott av residualene frembringer plottet av gjenværende partielle autokorrelasjoner. produserer den normale kvantile plottet av residuene. produserer et spredningsdiagram av residualene mot tid, som har en overlaid jevn passform. produserer plottet av Ljung-Box white-noise test p-verdier på forskjellige lag. produserer prognosen tomter i prognosen scenen. Den prognose-bare plottet som viser multistep prognosene i prognosen regionen produseres som standard. Følgende prognose-plott-alternativer er tilgjengelige: ALLE produserer prognose-bare plottet, samt prognose-plottet. produserer et tomt som viser de en-trinns prognosene samt de flertallige prognosene. produserer en tomt som bare viser de multistep-prognosene i prognosen regionen. spesifiserer et SAS datasett som prognosene utgis. Hvis forskjellige OUT-spesifikasjoner vises i PROC ARIMA - og FORECAST-setningene, brukes den i FORECAST-setningen. Innføring i SAS: Proc Arima Analyse av tidsseriedata i tidsdomene gjøres med denne prosedyren. Box-Jenkins metodikk (montering av ARIMA-modeller til tidsseriedata) og også overføringsfunksjon (inngangstype) modeller kan brukes. Frekvensdomeneanalyse av tidsserier kan gjøres ved hjelp av Proc Spectra. Rammen for analysen er at den observerte tidsserien X (t) er stasjonær og tilfredsstiller en ARMA-ligning i skjemaet der Z (t) er en hvit støyprosess. Konstantene phi (1). phi (p) kalles de autoregressive koeffisientene, og tallet p kalles rekkefølgen til den autoregressive komponenten. Konstantene theta (1). theta (q) kalles de bevegelige gjennomsnittlige koeffisientene, og tallet q kalles rekkefølgen av den bevegelige middelkomponent. Det er mulig for enten p eller q å være null. Bruk av proc arima til å passe ARMA modeller består av 3 trinn. Det første trinnet er modellidentifikasjon, hvor den observerte serien blir transformert til å være stasjonær. Den eneste transformasjonen som er tilgjengelig innen proc arima, er differensiering. Det andre trinnet er modellestimering, der ordrene p og q velges og de tilsvarende parametrene estimeres. Det tredje trinnet er prognose, hvor den estimerte modellen brukes til å prognose fremtidige verdier av observerbare tidsserier. Som et eksempel blir datafilen milk. dat som inneholder data om melkeproduksjon hentet fra Cryer, analysert. Her er kommandoene som kan brukes for hver av de tre trinnene. OPPSJONER FOR IDENTIFISERING AV ERKLÆRING: Var-erklæringen kreves og spesifiserer variabelen (rene) i datasettet som skal analyseres. De valgfrie tallene i parentes angir LAG ved hvilke forskjeller som skal beregnes. En uttalelse varmilk ville analysere melkeserien uten noen differensierende varmilk (1) ville analysere den første forskjellen i melkevarmelk (1,1) den andre forskjellen i melk. Var-setningen produserer 3 tomter for den angitte variabelen: prøveautokorrelasjonsfunksjonen, prøvens inverse autokorrelasjonsfunksjon og prøven delvis autokorrelasjonsfunksjon. Disse råplottene og tabellene av verdiene er trykt i utgangsvinduet. Høyere kvalitet tomter kan produseres ved bruk av andre alternativer (detaljert nedenfor) og proc gplot. Alternativet nlag fører til at de 3 plottene skriver ut verdier opptil lag 30. Hvis ikke spesifisert, er standard nlag24 eller 25 av antall observasjoner, avhengig av hvilket som er mindre. Senteralternativet trekker gjennomsnittet av serien angitt av var-setningen. Gjennomsnittet legges tilbake automatisk under prognostrinnet. Outcov-alternativet plasserer verdiene for prøvekorrelasjonsfunksjonene i et SAS datasett. Disse verdiene kan brukes til å produsere høykvalitets plott av disse funksjonene ved hjelp av proc gplot. Utgangene for variabler er: LAG. VAR (navnet på varibelen spesifisert i var-alternativet), CROSSVAR (navn på variabelen spesifisert i krysscorr-alternativet), N (antall observasjoner som brukes til å beregne gjeldende verdi av kovarians eller krysskovarians), COV (kryssværdi covariances), CORR (verdi av prøveautokorrelasjonsfunksjonen), STDERR (standardfeil av autokorrelasjonene), INVCORR (verdier av prøveinverterte autokorrelasjonsfunksjonen) og PARTCORR (verdier av prøven delvis autokorrelasjonsfunksjon). Alternativet noprint undertrykker utgangen av grafikkene med lav kvalitet som normalt opprettes av var-setningen. Dette alternativet brukes primært med alternativet outcov. OPTIONS FOR ESTIMATE STATEMENT: P1 q3-alternativene angir de automatisk regressive og bevegelige gjennomsnittlige ordrene som passer. Andre former for disse spesifikasjonene er: q (3) for å angi at BARE parameteren theta (3) kan være ikke-null p (12) (3) for en sesongmodell (1-phi (12) B12) - phi (3) B3) hvor B er backshift operatøren p (3,12) for en modell der bare phi (3) og phi (12) får lov til å være null. Nøkkelfunksjonen bruker prøvestørrelsen i stedet for graden av frihet som divisoren ved estimering av den hvite støyvariansen. Metodealternativet velger estimeringsmetoden for parametrene. Valgene er ml for maksimal (Gaussisk) sannsynlighet estimering, uls for ubetingede minste kvadrater, og cls for betinget minste kvadrater. Plot-alternativet produserer de samme 3 plottene som i identifikasjonserklæringen for RESIDUALS etter at modellparametrene er estimert. Dette er en annen nyttig kontroll på hvitheten av restene. OPTIONS FOR FORECAST STATEMENT: Hovedalternativet angir antall tidsintervaller i fremtiden for hvilke prognoser som skal foretas. Ved å bruke ut - og printall-alternativene i prognostiseringen, vil det bli opprettet et SAS datasett som vil inneholde verdiene til den opprinnelige serien og de forventede verdiene til serien ved hjelp av modellen til enhver tid. Dette kan være nyttig for en analyse av modellens tidligere ytelse. I praksis forsøks flere forskjellige estimatuttalelser i rekkefølge for å se hvilken modell som passer best for dataene. Proc arima er interaktiv, i den forstand kan disse sekvensielle forsøkene gjøres uten å starte prosedyren på nytt. Bare send inn de påfølgende estimatuttalelsene, den opprinnelige identifikasjonserklæringen vil bli beholdt. Overføringsfunksjonsmodeller kan passe ved å bruke krysscorr-alternativet til identifikasjonserklæringen og inntastingsalternativet i estimatoppstillingen. Mekanikken i denne prosedyren er illustrert for en datasettfake som inneholder to tidsserier som er relatert til en overføringsfunksjonsmodell. I dette tilfellet er Y avhengig av X. Først blir prosessen X modellert ved å identifisere og anslå uttalelser. Deretter identifiseres Y og krysskorrelasjonen mellom de pre-hvite prosessene X og Y estimeres. Programmet kan se slik ut. Fra krysskorrelasjonsinformasjonen kan lagsene der innspillingsprosessen X påvirker Y, bli tentativt identifisert. Merk at bare årsaksmodeller er tillatt, ikke-null krysskorrelasjoner ved negative lag kan ikke modelleres i proc arima. For å illustrere, si at null-lags er 2 og 4. Prosessen Y kan estimeres som følger. Inngangen er av formen cB2 dB4 B2 (c dB2). Det er dette sistnevnte skjemaet som gir formen på inngangserklæringen. Vær oppmerksom på at estimatoppstillingen alltid refererer til den siste identifiseringsoppstillingen for å bestemme hvilken variabel (er) som skal inkluderes i modellen. Dermed differensiering og sentrering håndteres automatisk (hvis brukt) Bortsett fra at differensiering må spesifiseres eksplisitt i crosscorr-setningen. For ytterligere detaljer, se den elektroniske hjelpen under SAS SYSTEM HELP - MODELLER amp ANALYSIS TOOLS - ECONOMETRICS amp TIME SERIES - ARIMA eller SASETS Guide. Kopier Copyright 2016 Jerry Alan Veeh. Alle rettigheter reservert.

Comments

Popular Posts