Was sind Relation und Unterschied zwischen Zeitreihen und Regression Für Modelle und Annahmen. Ist es richtig, dass die Regressionsmodelle die Unabhängigkeit zwischen den Ausgangsvariablen für verschiedene Werte der Eingangsvariablen übernehmen, während das Zeitreihenmodell nicht ist. Was sind einige andere Unterschiede Es gibt eine Reihe von Ansätzen zur Zeitreihenanalyse, aber die beiden bekanntsten sind die Regressionsmethode und die Box-Jenkins (1976) oder ARIMA (AutoRegressive Integrated Moving Average) Methode. Dieses Dokument stellt die Regressionsmethode vor. Ich halte die Regressionsmethode weit überlegen ARIMA aus drei Hauptgründen Ich verstehe nicht ganz, was die Regressionsmethode für Zeitreihen auf der Website ist und wie es sich von der Box-Jenkins oder ARIMA-Methode unterscheidet. Ich schätze, wenn jemand etwas Einblicke auf diese Fragen geben kann. Danke und Grüße Ich denke wirklich, das ist eine gute Frage und verdient eine Antwort. Der Link zur Verfügung gestellt wird von einem Psychologen, der behauptet, dass einige Home-Brew-Methode ist ein besserer Weg, um Zeitreihen-Analyse als Box-Jenkins. Ich hoffe, dass mein Versuch auf eine Antwort andere ermutigen wird, die mehr über Zeitreihen kenntnisreich sind, um dazu beizutragen. Von seiner Einleitung aus sieht es aus, als würde Darlington den Ansatz der Anpassung eines AR-Modells durch kleinste Quadrate verteidigen. Das heißt, wenn du das Modell zt alpha1 z cdots alphak z varepsilont an die Zeitreihe zt passen möchtest, kannst du einfach die Serie zt auf der Serie mit lag 1, lag 2, und so weiter bis hin zu k, mit einem Gewöhnliche Mehrfachregression. Dies ist sicher in R erlaubt, es ist sogar eine Option in der ar-Funktion. Ich habe es getestet, und es neigt dazu, ähnliche Antworten auf die Standardmethode für die Anpassung eines AR-Modells in R zu geben. Er befürwortet auch das Regressing zt auf Sachen wie t oder Kräfte von t, um Trends zu finden. Auch hier ist das ganz in Ordnung. Viele Zeitreihenbücher diskutieren dies, zum Beispiel Shumway-Stoffer und Cowpertwait-Metcalfe. Typischerweise könnte eine Zeitreihenanalyse entlang der folgenden Zeilen verlaufen: Sie finden einen Trend, entfernen ihn und passen dann ein Modell an die Residuen. Aber es scheint, als ob er sich auch für eine Überfüllung einsetzt und dann die Verringerung des Mittelquadratfehlers zwischen den eingeführten Serien und den Daten als Beweis dafür, dass seine Methode besser ist, Zum Beispiel: Ich fühle, dass Korrelogramme jetzt veraltet sind. Ihr Hauptzweck war es, den Arbeitern zu erlauben, zu erraten, welche Modelle die Daten am besten passen werden, aber die Geschwindigkeit der modernen Computer (zumindest in der Regression, wenn nicht in der Zeitreihenmodell-Anpassung) erlaubt einem Arbeiter, einfach mehrere Modelle zu passen und genau zu sehen, wie Jeder passt so, wie es durch einen mittleren quadratischen Fehler gemessen wird. Die Frage der Kapitalisierung auf den Zufall ist für diese Wahl nicht relevant, da die beiden Methoden gleichermaßen anfällig für dieses Problem sind. Das ist keine gute Idee, denn der Test eines Modells soll sein, wie gut es prognostizieren kann, nicht wie gut es zu den vorhandenen Daten passt. In seinen drei Beispielen verwendet er angepasstes Wurzel-Mittelquadrat-Fehler als Kriterium für die Qualität der Passform. Natürlich, über-passend ein Modell wird eine in-Probe Schätzung der Fehler kleiner machen, so seine Behauptung, dass seine Modelle sind besser, weil sie kleinere RMSE ist falsch. In kurzer Zeit, da er das falsche Kriterium für die Beurteilung, wie gut ein Modell ist, verwendet, erreicht er die falschen Schlussfolgerungen über Regression gegen ARIMA. Id wette das, wenn er die prädiktive Fähigkeit der Modelle stattdessen getestet hätte, wäre ARIMA an die Spitze gekommen. Vielleicht kann man es versuchen, wenn sie Zugang zu den Büchern haben, die er hier erwähnt. Ergänzend: Für mehr über die Regressionsidee, möchten Sie vielleicht auschecken ältere Zeitreihen Bücher, die geschrieben wurden, bevor ARIMA wurde die beliebteste. Zum Beispiel, Kendall, Time-Series. 1973, Kapitel 11 hat ein ganzes Kapitel über diese Methode und Vergleiche mit ARIMA. Soweit ich kann sagen, der Autor nie beschrieben seine Home-Brew-Methode in einer Peer-Review-Publikation und Verweise auf und aus der statistischen Literatur erscheinen minimal und seine wichtigsten Publikationen zu methodischen Themen stammen aus den 70er Jahren. Streng genommen, keines davon beweist alles andere als ohne genügend Zeit oder Sachkenntnis, um die Ansprüche selbst zu beurteilen, würde ich sehr zögern, irgendwelche davon zu benutzen. Ndash Gala Jul 18 13 at 11: 31Der Unterschied von Moving Average (Time Series) - Funktion berechnet die Differenz zwischen einem Wert und seiner Zeitreihe gleitenden Durchschnitt. Parameter ------------------ Daten Die zu analysierenden Daten. Dies ist typischerweise ein Feld in einer Datenreihe oder ein berechneter Wert. Periode Die Anzahl der Daten, die im Durchschnitt enthalten sind, einschließlich des aktuellen Wertes. Beispielsweise enthält eine Periode von 3 den aktuellen Wert und die beiden vorherigen Werte. Funktionswert ------------------------ Der Zeitreihen-Gleitdurchschnitt wird berechnet, indem eine lineare Regressionsgerade über die Werte für die vorgegebene Periode angepasst und dann bestimmt wird Der aktuelle Wert für diese Zeile. Eine lineare Regressionslinie ist eine Gerade, die so nahe wie möglich an allen gegebenen Werten liegt. Die Zeitreihe, die zu Beginn einer Datenreihe gleitend ist, wird nicht definiert, bis genügend Werte vorhanden sind, um den vorgegebenen Zeitraum zu füllen. Beachten Sie, dass ein Zeitreihen-Gleitende Durchschnitt stark von anderen Arten von gleitenden Durchschnitten unterscheidet, indem der aktuelle Wert dem letzten Trend der Daten folgt, nicht ein tatsächlicher Durchschnitt der Daten. Aus diesem Grund kann der Wert dieser Funktion größer oder kleiner sein als alle Werte, die verwendet werden, wenn der Trend der Daten im Allgemeinen zunimmt oder abnimmt. Der Unterschied zum gleitenden Durchschnitt ist der gleitende Durchschnitt, der von dem aktuellen Wert subtrahiert wird. Verwendung ----------- Verschieben von Durchschnittswerten sind nützlich, um geräuschvolle Rohdaten zu glätten, wie zB Tagespreise. Die Preisdaten können von Tag zu Tag sehr unterschiedlich sein und verdecken, ob der Preis im Laufe der Zeit auf - oder absteigt. Durch das Betrachten des gleitenden Durchschnitts des Preises ist ein allgemeineres Bild der zugrunde liegenden Trends zu sehen. Da gleitende Mittelwerte verwendet werden können, um Trends zu sehen, können sie auch verwendet werden, um zu sehen, ob Daten den Trend stoßen. Dies macht den Unterschied zu dem gleitenden Durchschnitt nützlich für die Hervorhebung, wo die Daten vom Trend abbrechen. Mike, zuerst installieren R (wenn Sie noch nicht), führen Sie R und installieren Sie das TeachingDemos Paket (genau wie abhängig von Ihrem System), Laden Sie das Paket mit der Bibliothek (TeachingDemos) und geben Sie dann loess. demo ein, um die Hilfeseite aufzurufen, um zu sehen, wie es ausgeführt wird. Sie können nach unten scrollen, wo das Beispiel ist und kopieren und fügen Sie diesen Code in die R39s-Befehlszeile ein, um die Beispiele zu sehen , Dann laufen Sie mit Ihren eigenen Daten weiter zu erforschen. Ndash Greg Snow Mar 23 12 at 17:15 Hier ist eine einfache, aber detaillierte Antwort. Ein lineares Modell passt zu einer Beziehung über alle Datenpunkte. Dieses Modell kann die erste Ordnung (eine andere Bedeutung von linear) oder Polynom zur Berücksichtigung von Krümmung oder mit Splines, um für verschiedene Regionen mit einem anderen Regierungsmodell Rechnung zu tragen. Ein LOESS Fit ist eine lokal bewegte gewichtete Regression basierend auf den ursprünglichen Datenpunkten. Was bedeutet, dass ein LOESS-Fit die ursprünglichen X - und Y-Werte eingibt, sowie einen Satz von Output-X-Werten, für die neue Y-Werte berechnet werden (in der Regel werden die gleichen X-Werte für beide verwendet, aber oft werden weniger X-Werte für passende XY-Paare verwendet Wegen der erhöhten Berechnungen erforderlich). Für jeden Ausgang X-Wert wird ein Teil der Eingangsdaten verwendet, um einen Fit zu berechnen. Der Teil der Daten, im allgemeinen 25 bis 100, aber typischerweise 33 oder 50, ist lokal, dh es ist derjenige Teil der ursprünglichen Daten, der dem jeweiligen Ausgangswert X am nächsten liegt. Es ist eine bewegliche Passform, da jeder Ausgabe-X-Wert eine andere Teilmenge der Originaldaten mit unterschiedlichen Gewichten erfordert (siehe nächster Absatz). Diese Untermenge von Eingangsdatenpunkten wird verwendet, um eine gewichtete Regression durchzuführen, wobei Punkte am nächsten zu dem ausgegebenen X-Wert bei größerem Gewicht liegen. Diese Regression ist in der Regel erste Ordnung zweiter Ordnung oder höher ist möglich, aber erfordern größere Berechnungsleistung. Der Y-Wert dieser gewichteten Regression, berechnet am Ausgang X, wird als Modell Y-Wert für diesen X-Wert verwendet. Die Regression wird an jedem Ausgangswert X neu berechnet, um einen vollständigen Satz von Ausgangssignalen Y zu erzeugen. Beantwortet Feb 21 15 um 21:08
No comments:
Post a Comment