Skip to main content

Abgrenzung Von Zeitreihendaten In Stata Forex


Für schnelle Fragen email dataprinceton. edu. Keine Appts. Notwendig während der begehbaren Stunden. Hinweis: Das DSS-Labor ist geöffnet, solange Firestone geöffnet ist, keine Termine erforderlich, um die Labor-Computer für Ihre eigene Analyse zu verwenden. Zeitreihen-Daten in Stata Zeitreihendaten und tsset Um Statas-Zeitreihenfunktionen und - analysen verwenden zu können, müssen Sie zunächst sicherstellen, dass Ihre Daten in der Tat Zeitreihen sind. Zuerst müssen Sie eine Datumsvariable haben, die im Format Stata Datum ist. Zweitens müssen Sie sicherstellen, dass Ihre Daten nach dieser Datumsvariablen sortiert werden. Wenn Sie Paneldaten haben, müssen Ihre Daten nach der Datumsvariablen innerhalb der Variablen sortiert werden, die das Panel identifiziert. Schließlich müssen Sie den tsset-Befehl verwenden, um Stata mitzuteilen, dass Ihre Daten Zeitreihen sind: Das erste Beispiel sagt Stata, dass Sie einfache Zeitreihen-Daten haben, und das zweite sagt Stata, dass Sie Paneldaten haben. Stata Datumsformat Stata speichert Daten als die Anzahl der verstrichenen Tage seit dem 1. Januar 1960. Es gibt verschiedene Möglichkeiten, verstrichene Stata-Daten zu erstellen, die davon abhängen, wie Daten in Ihren Daten dargestellt werden. Wenn Ihr ursprüngliches Dataset bereits eine einzelne Datumsvariable enthält, verwenden Sie die Funktion date () oder einen der anderen String-Datumsbefehle. Wenn Sie separate Variablen, die verschiedene Teile des Datums (Monat, Tag und Jahr Jahr und Quartal, etc.) speichern, dann müssen Sie die partielle Datumsvariable Funktionen verwenden. Date-Funktionen für eine einzelne String-Datumsvariable Manchmal haben Ihre Daten die Daten im String-Format. (Eine String-Variable ist einfach eine Variable, die etwas anderes als nur Zahlen enthält.) Stata bietet eine Möglichkeit, diese in Zeitreihen-Daten zu konvertieren. Das erste, was Sie wissen müssen, ist, dass die Zeichenfolge muss leicht in ihre Komponenten getrennt werden. Mit anderen Worten, Strings wie 01feb1990 1. Februar 1990 020190 sind akzeptabel, aber 020190 nicht. Beispielsweise können Sie sagen, dass Sie eine String-Variable sdate mit Werten wie 01feb1990 haben und Sie müssen es in eine tägliche Zeitreihe Datum zu konvertieren: Beachten Sie, dass in dieser Funktion, wie mit den anderen Funktionen, um Zeichenfolgen in Zeitreihen-Daten konvertieren, Zeigt der DMY-Teil die Reihenfolge des Tages, des Monats und des Jahres in der Variablen an. Wären die Werte als 1. Februar 1990 codiert, hätten wir stattdessen MDY verwendet. Was ist, wenn das ursprüngliche Datum nur zwei Ziffern für das Jahr hat Dann würden wir verwenden: Wann immer Sie zwei Ziffern Jahre haben, einfach das Jahrhundert vor dem Y. Wenn Sie die letzten zwei Ziffern Jahre gemischt haben, wie 1298 und 1200, verwenden Sie: Wo 2020 das größte Jahr ist, das Sie in Ihrem Datensatz haben. Hier sind die weiteren Funktionen: wöchentlich (stringvar, wy) monatlich (stringvar, my) quartalsweise (stringvar, qy) halbjährlich (stringvar, hy) yearly (stringvar, y) Anmerkung: Stata 10 verwendet Großbuchstaben als DMY Stata verwendet Kleinbuchstaben, dmy. Datumsfunktionen für partielle Datumsvariablen Oft haben Sie separate Variablen für die verschiedenen Komponenten des Datums, die Sie zusammenfügen müssen, bevor Sie sie als richtige Zeitreihendaten festlegen können. Stata bietet eine einfache Möglichkeit, dies mit numerischen Variablen zu tun. Wenn Sie separate Variablen für Monat, Tag und Jahr haben, verwenden Sie die Funktion mdy (), um eine verstrichene Datumsvariable zu erstellen. Wenn Sie eine verstrichene Datumsvariable erstellt haben, werden Sie sie wahrscheinlich wie nachfolgend beschrieben formatieren wollen. Verwenden Sie die Funktion mdy (), um eine verstrichene Datumsvariable zu erstellen, wenn Ihre ursprünglichen Daten separate Variablen für Monat, Tag und Jahr enthalten. Die Variablen für Monat, Tag und Jahr müssen numerisch sein. Angenommen, Sie arbeiten mit diesen Daten: Konvertieren einer Datumsvariablen, die als einzelne Zahl gespeichert ist Wenn Sie eine Datumsvariable haben, in der das Datum als eine einzelne Zahl des Formulars yyyymmdd gespeichert wird (beispielsweise 20041231 für den 31. Dezember 2004) Wird der folgende Satz von Funktionen es in ein verstrichene Datum verwandeln. Gen-Datum int (Datum 10000) Genmonat int ((Datum-Jahr10000) 100) gen Tag int ((Datum-Jahr10000-Monat100)) gen mydate mdy (Monat, Tag, Jahr) Format mydate d Zeitreihen-Datumsformate Verwenden Sie den Befehl format Um verstrichene Stata-Daten als Kalendertermine anzuzeigen. Im obigen Beispiel hat die verstrichene Datumsvariable mydate die folgenden Werte, die die Anzahl der Tage vor oder nach dem 1. Januar 1960 darstellen. Weitere Informationen finden Sie im Stata Benutzerhandbuch, Kapitel 27. Termine festlegen Oft müssen wir Eine bestimmte Analyse nur auf Beobachtungen beziehen, die zu einem bestimmten Zeitpunkt fallen. Um dies zu tun, müssen wir etwas namens ein Datum Literal verwenden. Ein Datum Literal ist einfach eine Möglichkeit, ein Datum in Worten und haben Stata automatisch wandelt es in ein verstrichenes Datum. Wie bei dem d () - Literal, um ein reguläres Datum anzugeben, stehen w (), m (), q (), h () und y () für die Eingabe wöchentlich, monatlich, vierteljährlich, halbjährlich und Jährlichen Daten. Hier einige Beispiele: Wenn Sie einen Bereich von Daten angeben möchten, können Sie die Funktionen tin () und twithin () verwenden: Der Unterschied zwischen tin () und twithin () besteht darin, dass tin () Anfangs - und Enddatum enthält, Während twithin () diese ausschließt. Geben Sie immer zuerst das Anfangsdatum ein und schreiben Sie es wie für eine der d (), w (), etc.-Funktionen aus. Zeitreihen-Variablenlisten Häufig müssen wir in Zeitreihenanalysen die Werte einer Variablen von einer Beobachtung zur nächsten verlegen oder führen. Wenn wir viele Variablen haben, kann dies umständlich sein, vor allem, wenn wir eine Variable mehr als einmal behalten müssen. In Stata können wir festlegen, welche Variablen verzögert werden sollen und wie oft ohne neue Variablen erstellt werden müssen, wodurch viel Speicherplatz und Speicherplatz gespart wird. Sie sollten beachten, dass der Befehl tsset ausgestellt wurde, bevor einer der Tricks in diesem Abschnitt funktioniert. Wenn Sie Ihre Daten als Panel-Daten definiert haben, wird Stata automatisch die Berechnungen neu beginnen, so wie es am Anfang eines Panels steht, so dass Sie sich keine Sorgen um Werte machen müssen, die von einem Panel auf das nächste übertragen werden. L. varname und F. varname Wenn Sie für eine Analyse eine Variable verzögern oder führen müssen, können Sie dies mit den L. varname (to lag) und F. varname (zu führen) tun. Beide arbeiten auf die gleiche Weise, so gut nur zeigen einige Beispiele mit L. varname. Lassen Sie uns sagen, Sie wollen in diesem Jahr Einkommen auf die letzten Jahre Einkommen: würde dies zu erreichen. Die L. erzählt Stata, um Einkommen um ein Zeitalter zu verzögern. Wenn Sie das Einkommen um mehr als einen Zeitraum verlängern wollten, würden Sie einfach die L. ändern, um etwas wie L2. Oder L3. Um sie um 2 bzw. 3 Zeitdauern zu verzögern. Die folgenden zwei Befehle werden die gleichen Ergebnisse: Eine andere nützliche Verknüpfung ist D. varname, die den Unterschied des Einkommens in der Zeit 1 und Einkommen in der Zeit 2 nimmt. Zum Beispiel können wir sagen, eine Person verdient 20 gestern und 30 heute. Statistische Stationarität: Eine stationäre Zeitreihe ist eine, deren statistische Eigenschaften wie Mittelwert, Varianz, Autokorrelation usw. alle über die Zeit konstant sind. Die meisten statistischen Prognosemethoden beruhen auf der Annahme, dass die Zeitreihen durch die Verwendung von mathematischen Transformationen annähernd stationär (d. h., zitatiert werden können) werden können. Eine stationarisierte Serie ist relativ einfach vorherzusagen: Sie prognostizieren einfach, dass ihre statistischen Eigenschaften in Zukunft dieselben sein werden, wie sie es in der Vergangenheit waren (erinnern Sie sich an unsere berühmten Prognosezitate.) Die Vorhersagen für die stationäre Reihe können dann zertifiziert werden Durch Umkehrung von mathematischen Transformationen, die vorher verwendet wurden, um Vorhersagen für die ursprüngliche Reihe zu erhalten. (Die Details werden in der Regel von Ihrer Software betreut.) Das Finden der Sequenz von Transformationen, die für die Stationarisierung einer Zeitreihe erforderlich sind, liefert oft wichtige Hinweise bei der Suche nach einem geeigneten Prognosemodell. Stationarisierung einer Zeitreihe durch Differenzierung (wo nötig) ist ein wichtiger Teil des Prozesses der Montage eines ARIMA-Modells. Wie auf den Seiten der ARIMA-Seiten beschrieben. Ein weiterer Grund für den Versuch, eine Zeitreihe zu stationarisieren, besteht darin, sinnvolle Stichprobenstatistiken wie Mittelwerte, Abweichungen und Korrelationen mit anderen Variablen zu erhalten. Solche Statistiken sind als Deskriptoren für zukünftiges Verhalten nur dann nützlich, wenn die Serie stationär ist. Wenn beispielsweise die Reihe über die Zeit immer größer wird, wachsen die Stichprobenmittelwerte und die Varianz mit der Größe der Stichprobe, und sie werden das Mittel und die Varianz in zukünftigen Perioden immer unterschätzen. Und wenn der Mittelwert und die Varianz einer Reihe nicht genau definiert sind, so sind sie auch keine Korrelationen mit anderen Variablen. Aus diesem Grund sollten Sie vorsichtig sein, wenn Sie versuchen, Regressionsmodelle zu extrapolieren, die an nichtstationäre Daten angepasst sind. Die meisten Geschäfts - und Wirtschaftszeitreihen sind weit von stationär, wenn sie in ihren ursprünglichen Maßeinheiten ausgedrückt werden, und selbst nach Deflation oder Saisonbereinigung werden sie typischerweise immer noch Trends, Zyklen, zufälliges Gehen und anderes nicht-stationäres Verhalten aufweisen. Hat die Baureihe einen stabilen Langzeittrend und neigt nach einer Störung dazu, auf die Trendlinie zurückzukehren, kann sie durch Abtrennung (zB durch Anpassen einer Trendlinie und Subtrahieren vor dem Einbau eines Modells, Oder auch indem der Zeitindex als unabhängige Variable in einem Regression - oder ARIMA-Modell eingeschlossen wird), vielleicht in Verbindung mit dem Logging oder dem Abflachen. Solch eine Reihe soll tendenziell stationär sein. Allerdings reicht es manchmal auch nicht aus, die Serie stationär zu machen, wobei es in diesem Fall notwendig sein kann, sie in eine Reihe von Periodenperiodenperioden umzuwandeln und zwischen Jahreszeitunterschieden zu unterscheiden. Wenn der Mittelwert, die Varianz und die Autokorrelationen der ursprünglichen Reihe nicht zeitlich konstant sind, auch nach der Detrierung, so werden vielleicht die Statistiken der Veränderungen in der Reihe zwischen den Perioden oder zwischen den Jahreszeiten konstant sein. Eine solche Reihe wird als Differenz stationär bezeichnet. (Manchmal kann es schwierig sein, den Unterschied zwischen einer Serie, die Trend-stationär ist und eine, die Differenz-stationär ist zu sagen, und ein so genannter Einheit Root-Test kann verwendet werden, um eine endgültigere Antwort zu erhalten. Wir kehren zu diesem Thema Später im Kurs.) (Rückkehr nach oben.) Der erste Unterschied einer Zeitreihe ist die Reihe von Änderungen von einer Periode zur nächsten. Wenn Y t den Wert der Zeitreihe Y in der Periode t angibt, ist die erste Differenz von Y in der Periode t gleich Y t - Y t-1. In Statgraphics wird die erste Differenz von Y als DIFF (Y) ausgedrückt, und in RegressIt ist es YDIFF1. Wenn die erste Differenz von Y stationär und auch vollständig zufällig (nicht autokorreliert) ist, dann wird Y durch ein Zufallswegmodell beschrieben: jeder Wert ist ein zufälliger Schritt von dem vorherigen Wert entfernt. Wenn die erste Differenz von Y stationär, aber nicht vollständig zufällig ist - d. h. Wenn sein Wert bei Periode t mit seinem Wert zu früheren Perioden autokorreliert wird - dann kann ein anspruchsvolleres Prognosemodell wie Exponentialglättung oder ARIMA geeignet sein. (Hinweis: wenn DIFF (Y) stationär und zufällig ist, zeigt dies an, dass ein zufälliges Wandermodell für die ursprüngliche Serie Y geeignet ist, nicht dass ein zufälliges Wandermodell an DIFF (Y) angebracht werden sollte Ist logisch gleichbedeutend mit der Anpassung eines mittleren (nur konstanten) Modells an DIFF (Y). Hier ist ein Graph der ersten Differenz von AUTOSALECPI, der deflationierten Autoverkäufe. Beachten Sie, dass es jetzt ungefähr stationär aussieht (zumindest sind die Mittelwerte und die Varianz mehr oder weniger konstant), aber es ist überhaupt nicht zufällig (ein starkes saisonales Muster bleibt): Die folgende Tabelle veranschaulicht, wie die erste Differenz für das Deflationäre berechnet wird Auto Verkaufsdaten:

Comments