Monday, 6 November 2017

Moving Average As Dependent Variabel


Die ARIMA-Modelle sind in der Theorie die allgemeinste Klasse von Modellen zur Prognose einer Zeitreihe, die durch Differenzierung (wenn nötig) vielleicht 8220 stationary8221 gemacht werden kann In Verbindung mit nichtlinearen Transformationen, wie zB Protokollierung oder Abscheidung (falls erforderlich). Eine Zufallsvariable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften alle über die Zeit konstant sind. Eine stationäre Reihe hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine konstante Amplitude, und sie wackelt in einer konsistenten Weise. D. h. seine kurzzeitigen Zufallszeitmuster sehen immer im statistischen Sinne gleich aus. Die letztgenannte Bedingung bedeutet, daß ihre Autokorrelationen (Korrelationen mit ihren eigenen vorherigen Abweichungen vom Mittelwert) über die Zeit konstant bleiben oder daß ihr Leistungsspektrum über die Zeit konstant bleibt. Eine zufällige Variable dieser Form kann (wie üblich) als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal (wenn eines offensichtlich ist) könnte ein Muster einer schnellen oder langsamen mittleren Reversion oder einer sinusförmigen Oszillation oder eines schnellen Wechsels im Vorzeichen sein , Und es könnte auch eine saisonale Komponente. Ein ARIMA-Modell kann als 8220filter8221 betrachtet werden, das versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Vorhersagegleichung für eine stationäre Zeitreihe ist eine lineare Gleichung (d. H. Regressionstyp), bei der die Prädiktoren aus Verzögerungen der abhängigen Variablen und oder Verzögerungen der Prognosefehler bestehen. Das heißt: Vorhergesagter Wert von Y eine Konstante undeine gewichtete Summe aus einem oder mehreren neuen Werten von Y und einer gewichteten Summe aus einem oder mehreren neuen Werten der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, handelt es sich um ein reines autoregressives Modell (8220 selbst-regressed8221), das nur ein Spezialfall eines Regressionsmodells ist und mit einer Standard-Regressions-Software ausgestattet werden kann. Beispielsweise ist ein autoregressives Modell erster Ordnung (8220AR (1) 8221) für Y ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur um eine Periode (LAG (Y, 1) in Statgraphics oder YLAG1 in RegressIt) verzögert ist. Wenn einige der Prädiktoren Verzögerungen der Fehler sind, handelt es sich bei einem ARIMA-Modell nicht um ein lineares Regressionsmodell, da es keine Möglichkeit gibt, 8220last period8217s error8221 als eine unabhängige Variable festzulegen: Die Fehler müssen auf einer Periodenperiode berechnet werden Wenn das Modell an die Daten angepasst ist. Aus technischer Sicht ist das Problem der Verwendung von verzögerten Fehlern als Prädiktoren, dass die Vorhersagen von model8217s keine linearen Funktionen der Koeffizienten sind. Obwohl es sich um lineare Funktionen der vergangenen Daten handelt. Daher müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, durch nichtlineare Optimierungsmethoden (8220hill-climbing8221) abgeschätzt werden, anstatt nur ein Gleichungssystem zu lösen. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average. Die Verzögerungen der stationären Reihe in der Prognose-Gleichung werden als autoregressiveQuot-Terme bezeichnet, die Verzögerungen der Prognosefehler werden als mittlere Mittelwert-Terme bezeichnet und eine Zeitreihe, die differenziert werden muß, um stationär gemacht zu werden, wird als eine integrierte quotierte Version einer stationären Reihe bezeichnet. Random-walk und random-trend Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA Modellen. Ein nicht seasonales ARIMA-Modell wird als ein quotarIMA-Modell (p, d, q) klassifiziert, wobei p die Anzahl der autoregressiven Terme ist, d die Anzahl der für die Stationarität benötigten Nicht-Seasonal-Differenzen ist und q die Anzahl der verzögerten Prognosefehler ist Die Vorhersagegleichung. Die Vorhersagegleichung ist wie folgt aufgebaut. Zuerst bezeichne y die d - te Differenz von Y. Das bedeutet, daß die zweite Differenz von Y (der Fall d2) nicht die Differenz von 2 Perioden ist. Es ist vielmehr die erste Differenz der ersten Differenz. Was das diskrete Analogon einer zweiten Ableitung ist, d. h. die lokale Beschleunigung der Reihe anstatt ihres lokalen Takts. In Bezug auf y. Ist die allgemeine Prognose-Gleichung: Hier sind die gleitenden Durchschnittsparameter (9528217s) so definiert, daß ihre Vorzeichen in der Gleichung negativ sind, und zwar nach der Konvention von Box und Jenkins. Einige Autoren und Software (einschließlich der Programmiersprache R) definieren sie so, dass sie stattdessen Pluszeichen haben. Wenn tatsächliche Zahlen in die Gleichung gesteckt werden, gibt es keine Mehrdeutigkeit, aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen. Oft werden dort die Parameter mit AR (1), AR (2), 8230 und MA (1), MA (2), 8230 usw. bezeichnet. Um das entsprechende ARIMA-Modell für Y zu identifizieren, beginnt man die Reihenfolge der Differenzierung zu bestimmen (D) Notwendigkeit, die Serie zu stationarisieren und die Brutto-Merkmale der Saisonalität zu beseitigen, möglicherweise in Verbindung mit einer variationsstabilisierenden Transformation, wie beispielsweise Protokollierung oder Entleerung. Wenn Sie an diesem Punkt anhalten und voraussagen, dass die differenzierten Serien konstant sind, haben Sie lediglich ein zufälliges oder zufälliges Trendmodell angebracht. Die stationäre Reihe kann jedoch weiterhin autokorrelierte Fehler aufweisen, was nahe legt, daß in der Vorhersagegleichung auch einige Anzahl von AR-Terme (p 8805 1) und einige MA-MA-Terme (q 8805 1) benötigt werden. Der Prozess der Bestimmung der Werte von p, d und q, die für eine gegebene Zeitreihe am besten sind, werden in späteren Abschnitten der Notizen (deren Links oben auf dieser Seite sind), aber eine Vorschau von einigen der Typen erörtert Von nicht-saisonalen ARIMA-Modellen, die üblicherweise angetroffen werden, ist unten angegeben. ARIMA (1,0,0) erstes autoregressives Modell: Wenn die Serie stationär und autokorreliert ist, kann sie vielleicht als ein Vielfaches ihres eigenen vorherigen Wertes plus einer Konstante vorhergesagt werden. Die Prognose-Gleichung ist in diesem Fall 8230, die Y auf sich selbst zurückgeblieben um eine Periode zurückgeblieben ist. Dies ist ein 8220ARIMA (1,0,0) constant8221 Modell. Wenn der Mittelwert von Y Null ist, dann würde der konstante Term nicht eingeschlossen werden. Wenn der Steigungskoeffizient 981 & sub1; positiv und kleiner als 1 in der Grße ist (er muß kleiner als 1 in der Grße sein, wenn Y stationär ist), beschreibt das Modell ein Mittelrücksetzverhalten, bei dem der nächste Periodenblockwert 981 1 mal als vorhergesagt werden sollte Weit weg vom Durchschnitt, wie dieser Zeitraum8217s Wert. Wenn 981 & sub1; negativ ist, prognostiziert es ein Mittelwert-Wiederherstellungsverhalten mit einer Veränderung von Vorzeichen, d. h. es sagt auch voraus, daß Y unterhalb der mittleren nächsten Periode liegt, wenn sie über dem Mittel dieser Periode liegt. In einem autoregressiven Modell zweiter Ordnung (ARIMA (2,0,0)), würde es auch einen Yt-2-Term auf der rechten Seite geben, und so weiter. Abhängig von den Zeichen und Größen der Koeffizienten kann ein ARIMA (2,0,0) - Modell ein System beschreiben, dessen mittlere Reversion sinusförmig oszillierend erfolgt, wie die Bewegung einer Masse auf einer Feder, die zufälligen Schocks ausgesetzt ist . ARIMA (0,1,0) zufälliger Weg: Wenn die Reihe Y nicht stationär ist, ist das einfachste mögliche Modell ein zufälliges Wandermodell, das als Begrenzungsfall eines AR (1) - Modells betrachtet werden kann, in dem die autoregressive Koeffizient ist gleich 1, dh eine Reihe mit unendlich langsamer mittlerer Reversion. Die Vorhersagegleichung für dieses Modell kann folgendermaßen geschrieben werden: wobei der konstante Term die mittlere Periodenperiodenänderung (dh die Langzeitdrift) in Y ist. Dieses Modell könnte als ein No-Intercept-Regressionsmodell angepasst werden, in dem die Die erste Differenz von Y ist die abhängige Variable. Da es nur einen nicht sonderbaren Unterschied und einen konstanten Term enthält, wird er als quotarima (0,1,0) - Modell mit constant. quot klassifiziert. Das random-walk-ohne - driftmodell wäre ein ARIMA (0,1, 0) - Modell ohne konstantes ARIMA (1,1,0) differenziertes autoregressives Modell erster Ordnung: Wenn die Fehler eines Zufallswegmodells autokorreliert werden, kann das Problem möglicherweise durch Hinzufügen einer Verzögerung der abhängigen Variablen zu der Vorhersagegleichung - - ie Durch Rückgang der ersten Differenz von Y auf sich selbst verzögert um eine Periode. Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann: Dies ist ein autoregressives Modell erster Ordnung mit einer Ordnung der Nichtsaisonaldifferenzierung und einem konstanten Term - d. e. Ein ARIMA (1,1,0) - Modell. ARIMA (0,1,1) ohne konstante einfache exponentielle Glättung: Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem Random-Walk-Modell wird durch das einfache exponentielle Glättungsmodell vorgeschlagen. Es sei daran erinnert, dass für einige nichtstationäre Zeitreihen (z. B. diejenigen, die geräuschschwankungen um einen langsam variierenden Mittelwert aufweisen) das Zufallswegmodell nicht ebenso gut funktioniert wie ein gleitender Durchschnitt von vergangenen Werten. Mit anderen Worten, anstatt die letzte Beobachtung als Prognose der nächsten Beobachtung zu nehmen, ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und das lokale Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt vergangener Werte, um diesen Effekt zu erzielen. Die Vorhersagegleichung für das einfache exponentielle Glättungsmodell kann in einer Anzahl mathematisch äquivalenter Formen geschrieben werden. Von denen eine die sogenannte 8220-Fehlerkorrektur8221-Form ist, in der die vorhergehende Prognose in der Richtung ihres Fehlers angepasst wird: Weil e t-1 Y t-1 - 374 t-1 per Definition umgeschrieben werden kann : Es handelt sich um eine ARIMA (0,1,1) - konstante Vorhersagegleichung mit 952 1 1 - 945. Dies bedeutet, dass Sie eine einfache exponentielle Glättung durch Angabe als ARIMA (0,1,1) - Modell ohne passen Konstant und der geschätzte MA (1) - Koeffizient entspricht 1-minus-alpha in der SES-Formel. Denken Sie daran, dass im SES-Modell das durchschnittliche Alter der Daten in den 1-Periodenprognosen 1 945 beträgt, was bedeutet, dass sie tendenziell hinter Trends oder Wendepunkten um etwa 1 945 Perioden zurückbleiben werden. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen eines ARIMA-Modells (0,1,1) ohne Konstante 1 (1 - 952 1) ist. Wenn beispielsweise 952 1 0,8 beträgt, ist das Durchschnittsalter 5. Da sich 952 1 1 nähert, wird das ARIMA-Modell (0,1,1) ohne Konstante zu einem sehr langfristigen gleitenden Durchschnitt und als 952 1 Ansätze 0 wird es ein random-walk-ohne-Drift-Modell. What8217s der beste Weg, um für Autokorrelation zu korrigieren: Hinzufügen von AR-Begriffe oder Hinzufügen von MA-Begriffen In den vorherigen beiden Modellen, die oben diskutiert wurden, wurde das Problem der autokorrelierten Fehler in einem zufälligen Fußmodell auf zwei verschiedene Arten behoben: durch Hinzufügen eines Verzögerungswertes der differenzierten Reihe Auf die Gleichung oder das Hinzufügen eines verzögerten Wertes des Prognosefehlers. Welcher Ansatz am besten ist Eine Regel für diese Situation, die später noch ausführlicher diskutiert wird, besteht darin, dass die positive Autokorrelation normalerweise am besten durch Hinzufügen eines AR-Terms zum Modell behandelt wird und negative Autokorrelation in der Regel am besten durch Hinzufügen eines MA-Semester. In der Wirtschafts - und Wirtschaftszeitreihe entsteht häufig eine negative Autokorrelation als Artefakt der Differenzierung. (Im allgemeinen differenziert die Differenzierung die positive Autokorrelation und kann sogar einen Wechsel von positiver zu negativer Autokorrelation bewirken.) Daher wird das ARIMA (0,1,1) - Modell, in dem die Differenzierung von einem MA-Begriff begleitet wird, häufiger verwendet als ein ARIMA-Modell (1,1,0). ARIMA (0,1,1) mit konstanter einfacher exponentieller Glättung mit Wachstum: Durch die Implementierung des SES-Modells als ARIMA-Modell gewinnen Sie tatsächlich etwas Flexibilität. Zuerst darf der geschätzte MA (1) - Koeffizient negativ sein. Dies entspricht einem Glättungsfaktor von mehr als 1 in einem SES-Modell, das nach dem SES-Modellanpassungsverfahren üblicherweise nicht zulässig ist. Zweitens haben Sie die Möglichkeit, einen konstanten Term in das ARIMA-Modell zu integrieren, wenn Sie es wünschen, um einen durchschnittlichen Trend, der nicht Null ist, abzuschätzen. Das Modell ARIMA (0,1,1) mit Konstante hat die Vorhersagegleichung: Die Ein-Perioden-Prognosen aus diesem Modell sind qualitativ denjenigen des SES-Modells ähnlich, mit der Ausnahme, dass die Trajektorie der Langzeitprognosen typischerweise a ist (Deren Neigung gleich mu ist) und nicht eine horizontale Linie. ARIMA (0,2,1) oder (0,2,2) ohne konstante lineare exponentielle Glättung: Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei nicht-sauren Differenzen in Verbindung mit MA-Begriffen verwenden. Die zweite Differenz einer Folge Y ist nicht einfach die Differenz von Y und selbst von zwei Perioden verzögert, sondern sie ist die erste Differenz der ersten Differenz - i. e. Die Änderung in der Änderung von Y in der Periode t. Somit ist die zweite Differenz von Y in der Periode t gleich (Yt - Yt - 1) - (Yt - 1 - Yt - 2) Yt - 2Yt - 1Yt - 2. Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion: sie mißt zu einem gegebenen Zeitpunkt die Quota-Beschleunigungquot oder quotvequot in der Funktion. Das ARIMA (0,2,2) - Modell ohne Konstante sagt voraus, daß die zweite Differenz der Reihe eine lineare Funktion der letzten beiden Prognosefehler ist, die umgeordnet werden können: wobei 952 1 und 952 2 die MA (1) und MA (2) Koeffizienten. Dies ist ein allgemeines lineares exponentielles Glättungsmodell. Im Wesentlichen das gleiche wie Holt8217s Modell, und Brown8217s Modell ist ein spezieller Fall. Es verwendet exponentiell gewichtete gleitende Mittelwerte, um sowohl eine lokale Ebene als auch einen lokalen Trend in der Reihe abzuschätzen. Die Langzeitprognosen von diesem Modell konvergieren zu einer Geraden, deren Steigung von dem durchschnittlichen Trend abhängt, der gegen Ende der Reihe beobachtet wird. ARIMA (1,1,2) ohne konstante gedämpfte lineare Exponentialglättung. Dieses Modell ist in den begleitenden Dias auf ARIMA-Modellen dargestellt. Es extrapoliert die lokale Tendenz am Ende der Serie, sondern flacht es auf längere Prognose Horizonte, um eine Notiz von Konservatismus, eine Praxis, die empirische Unterstützung hat einzuführen. Siehe den Artikel auf quotWarum die Damped Trend Werke von Gardner und McKenzie und die quotGolden Rulequot Artikel von Armstrong et al. für Details. Es ist grundsätzlich ratsam, bei Modellen zu bleiben, bei denen mindestens einer von p und q nicht größer als 1 ist, dh nicht versuchen, ein Modell wie ARIMA (2,1,2) anzubringen, da dies zu Überbeanspruchungen führen kann Die in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen näher erläutert werden. Spreadsheet-Implementierung: ARIMA-Modelle wie die oben beschriebenen lassen sich einfach in einer Tabellenkalkulation implementieren. Die Vorhersagegleichung ist einfach eine lineare Gleichung, die sich auf vergangene Werte von ursprünglichen Zeitreihen und vergangenen Werten der Fehler bezieht. Auf diese Weise können Sie eine ARIMA-Prognosekalkulation einrichten, indem Sie die Daten in Spalte A, die Prognoseformel in Spalte B und die Fehler (Daten minus Prognosen) in Spalte C speichern. Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach Ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in Zellen an anderer Stelle in der Kalkulationstabelle gespeichert sind. Inabhängige Variablen und abhängige Variablen Die Nachricht wurde an EDSTAT-LLISTEN. PSU. EDU und sci. stat gesendet. edu auf 6142004 11:16 PM Forscher benutzen häufig die Ausdrücke "nonindependent variablequot" und quotdependent variablequot, wenn sie die Variablen beschreiben, die in ihrer Forschung studiert wurden. Ich bin der Meinung, dass diese Begriffe häufig unangemessen verwendet werden. Ich bin sehr daran interessiert zu lernen, wie Sie definieren diese Begriffe für Studenten in Ihrem Unterricht. Bitte antworten Sie off-list auf wuenschkECU. edu. Ich werde auf der Liste eine Zusammenfassung der erhaltenen Antworten posten. Vielen Dank. Karl L. Wuensch, Institut für Psychologie, East Carolina University, Greenville NC 27858-4353 Voice: 252-328-4102 Fax: 252-328-6283 WuenschKECU. edu core. ecu. edupsycwuenschkklw. htm Hier sind meine eigenen Gedanken zu diesem Thema . Im Laufe der Jahre habe ich immer unangenehm mit der Art, wie viele Menschen die Begriffe unabhängig variabel und abhängigen variabel. Ich glaube nun, dass diese Ausdrücke nur verwendet werden sollten, wenn es sich um experimentelle Forschung handelt, dh Forschung, bei der die unabhängige (n) Variable (n) manipuliert wird und die abhängige Variable passiv beobachtet wird. Forscher verknüpfen den Begriff unabhängige Variable häufig mit Ursache und abhängiger Variable mit Wirkung. Unter Verwendung der Begriffe unabhängige Variable und abhängige Variable mit nichtxperimentell gesammelten Daten können Prod-Forscher bei der Herstellung Kausalattributionen, wenn sie nicht. Lassen Sie mich Ihnen ein Beispiel. Vor einigen Jahren unterstützte ich einen Doktoranden mit seiner Dissertation. Er untersuchte die Korrelate einer einzigen Ergebnisvariable, die als kontinuierlich behandelt wurde. Zu seinen Vorhersagevariablen gehörten verschiedene kategorische Variablen. Alle Variablen wurden von Elementen auf einer Umfrage, die Studenten an Florida State abgeleitet abgeleitet. Es wurden keine Variablen manipuliert. Ich dummy codiert die kategorischen Variablen und warf sie, zusammen mit einigen kontinuierlichen Prädiktoren, in eine multiple Regression. Eine Woche oder so, nachdem ich die Ergebnisse an die Doktorandin geschickt hatte, schrieb er zurück und erklärte mir, dass der Dissertationsdirektor die kategorialen Prädiktoren, die von ANOVA analysiert wurden, nicht durch multiple Regression (als ob es einen Unterschied gab) wollte. Warum, fragte ich. Nun, glaube es oder nicht, die Antwort, die ich bekam, war, dass, wenn wir die Analyse als ANOVA getan haben, dann würden diese Prädiktoren unabhängige Variablen und wir könnten daraus schließen, dass sie Änderungen in der abhängigen Variablen. Sie können sich meine Antwort vorstellen. Ich landete sagen, meine Kunden einfach ändern Sie die Phrase mehrere Regression zu ANOVA, um den Regisseur glücklich zu machen. Ist dieser Vorfall eine Anomalie Bedauerlicherweise nicht, nach meiner Erfahrung. Ich kann nicht zählen, wie oft das Ph. D. Forscher haben mir gesagt, dass, wenn sie ihre Daten mit einem unabhängigen Stichproben t (wo die Gruppierungsvariable heißt die unabhängige Variable), dann bedeutende Ergebnisse zeigen, dass die unabhängige Variable verursachte Änderungen in der abhängigen Variablen, sondern dass, wenn sie ihre Daten analysieren Mit einer Korrelationsregression Analyse, dann können sie nicht interpretieren eine signifikante Assoziation als Beweis der Verursachung - Sie wissen, dass alte Korrelation nicht implizieren Verursachung Bullshit (siehe core. ecu. edupsycwuenschkStatHelpCorrelation-Causation. htm). Bei einigen Gelegenheiten habe ich diesen Personen gezeigt, daß die gepoolten Varianzenunabhängigen Abtastwerte t-Tests absolut äquivalent zu dem t sind, das verwendet wird, um die Signifikanz der Punkt-Biserie r zu testen. Ihre Kiefer fielen wirklich. Natürlich zeige ich meinen Schülern, dass ANOVA nur eine dummy-codierte multiple Regression ist. Ich rate jetzt meinen Schülern, dass andere den Begriff der unabhängigen Variablen eher mit Variablen verwenden, die manipuliert werden, anstatt beobachtet oder bekannter als vorhergesagt zu werden, oder früher in der Zeit als früher gemessen werden (wenn wir Hochschulabschlüsse von Hochschulabschlüssen vorhersagen, Variable ist unabhängig) oder sind eher kategorial als kontinuierlich oder werden eher als Ursachen und nicht als Effekte betrachtet. Ich erkläre, dass die Verwendung der Begriffe unabhängige Variable und abhängige Variable in nicht-experimentelle Forschung kann Verwirrung verursachen, aber gestehen, es selbst tun (aber ich versuche, diese schlechte Angewohnheit zu stoppen). Ich schlage alternative Begriffe wie Prädiktor-Variable, Faktor, (in ANOVA, aber die American Psychological Association nicht wie die Verwendung), Gruppierung Variable, Klassifizierung Variable, Kriterium Variable, Ergebnis Variable und Antwort Variable. Hier sind die wichtigsten Punkte (in meinem Kopf) von den Befragten meiner Anfrage: Verwenden Sie die Begriffe unabhängige Variable und abhängige Variable nur mit experimenteller Forschung. Mit nicht-experimenteller Forschung verwenden Sie Prädiktorvariable und Kriteriumvariable. Unabhängige Variablen stehen zeitabhängigen abhängigen Variablen gegenüber. Die unabhängige Variable ist diejenige, die Sie als kausal denken, die abhängige Variable ist diejenige, von der Sie denken, dass sie von der unabhängigen Variablen betroffen ist. Es ist hilfreich, zwischen manipulierten unabhängigen Variablen und gemessenen unabhängigen Variablen zu unterscheiden. An einem Punkt in der Klasse kann es hilfreich sein, alle verschiedenen Begriffe, die verwendet werden, um Forschungsvariablen zu beschreiben (wie unabhängige Variable, erklärende Variable, Prädiktor, Regressor, Kovariat, begleitende Variable, Störungsvariable, Kontrollvariable, abhängige Variable, , Reaktionsgröße, Kriterium, etc.) und diskutieren. Die Art und Weise die Begriffe unabhängige variable und abhängige Variable verwendet werden in diesen Tagen verursacht viel Verwirrung und einige Unfug. B eing anspruchsvoll über bloße Wortschatz ist unwahrscheinlich, zu helfen. Sogar die anspruchsvollsten experimentellen Psychologen sehen, was in der Tat kausalen Schlußfolgerungen rechtfertigt, sind so naiv und veraltet, daß sie es nicht wirklich wert sind, so energisch zu verteidigen. Hier sind die Antworten, die ich erhalten, unbearbeitet, außer für meine Verwendung von Fettschrift. Ich bin nicht sicher, was youre auf der Suche nach re falsche Definition von IVs und DVs, aber heres, was ich sage: In meinem Intro stats Kurse, beginne ich mit einer Diskussion der Arten von Forschung als der Kontext, in dem Statistiken verwendet werden. Ich verwende verschiedene Namen für Variablen in der Beobachtungsforschung vs Variablen in echten Experimenten. Ich sage ihnen, dass wahre Experimente (oder Quotexperimente, so dass sie nicht denken, Theres ein Unterschied) durch zufällige Zuordnung von Teilnehmern zu Gruppen und Manipulation der verschiedenen Gruppen Erfahrungen gekennzeichnet sind. Ich sage ihnen, die manipulierte Variable ist eine unabhängige Variable. Und ich gebe ihnen eine Erinnerung für die Erinnerung an ihren Namen: Die IV kommt zuerst in der Zeit, so ist es unabhängig von den Ergebnissen der Studie. Bei dieser Art der Forschung ist die Ergebnisvariable die abhängige Variable. Die zweitens in der Zeit kommt und hängt davon ab, was die Menschen erlebt haben. Dann fange ich an, über Beobachtungsforschung als das andere Ende eines Spektrums zu sprechen, und ich sage, daß diese Art der Forschung durch nicht ein Experiment gekennzeichnet wird. Es fehlt die Randomisierung und Manipulation. Dann sage ich ihnen Im in der Minderheit in den Namen, die ich für Variablen in der Beobachtungsforschung verwende. Der erste, der in der Zeit kommt, ist eine Prädiktorvariable. Es ist oft eine Gruppierungsvariable wie eine IV. Aber wenn es Gruppen gibt, sind sie in der Regel natürlich vorkommen - Männer vs Frauen, Alkoholiker vs Nichtalkoholiker, etc. Ich sage ihnen, die Ergebnisvariable ist das Kriterium variabel - analog zum DV, ist es an zweiter Stelle in der Zeit. Ich gebe auch der mnemonic, dass die Reihenfolge der Variablen nicht alphabetisch ist: IV vor DV, PV vor CV. So eine PV möglicherweise nicht eine Gruppierung Variable könnte es eine Punktzahl wie menschliche Babys Geburtsgewicht, die Entwicklungsprobleme vorhersagen können. Dann erkläre ich, dass, obwohl viele Zeitschriftenartikel nicht die Unterschiede machen, die ich in Variablennamen mache, mein Mentor an der University of Oklahoma (Larry Toothaker) und ich über 38 Jahre Erfahrung im Unterrichten von Statistiken teilen Unterschied zwischen Arten von Forschungsstudien. Lise DeShea ldesh2uky. edu Im Allgemeinen in einer Experiment andor Regressionsstudie. IV ist die Variable, die SIE denken, die verursacht. Oder ist der Vorläufer der DV. Die Sie denken, ist das Ergebnis. Experiment: IV könnte die Methode der Unterweisung sein. Der Experimentator manipuliert dies. Die DV könnte Punkte auf einem Test. Das Ergebnis (angeblich) aufgrund der IV Regression: IV könnte HS-Noten sein. Dass Sie denken, hat einen Einfluss auf die DV-oder College-Noten. (In der Regel IV kommt vor der Zeit auf die DV) Regression kann ein wenig zweideutig. Wenn Sie Höhe verwenden, um Gewicht zu schätzen. Ist H die IV. Nicht so sicher, da das Gegenteil ist ebenso logisch und BOTH sind co-contiguous in der Zeit. Es sei denn, H wurde im Alter von 5 und W genommen im Alter von 10 Am besten kann ich um 8:30 Uhr tun. Später Dennis fügte hinzu, dass er nicht glaubte, dass vorsichtiger mit der Verwendung der Begriffe "nonindependent variablequot" und quotdependent variablequot würde helfen, Leser erinnern, ob die Forschung experimentell oder nicht. quot Ich benutze den Begriff quotindependent Variable quot eine Variable, die ich manipulieren können . Oder eine Variable, die einen gewissen Effekt auf die abhängige Variable haben wird. Tanguma, Jesus TANGUMAJCOBA. PANAM. EDU Ich sage den Schülern, dass abhängige Variablen die gemessenen Variablen sind, die tabelliert, gemittelt und so weiter sind. Jede Forschungsfrage hat mindestens eine abhängige Variable. Unabhängige Variablen bilden die Grundlage für einen Vergleich zwischen Gruppen, Bedingungen usw., indem sie die Unterschiede zwischen den Gruppen oder Bedingungen definieren, um die der Vergleich erfolgt. Nicht jede Forschungsfrage hat eine unabhängige Variable. Ferner unterscheide ich zwischen den manipulierten unabhängigen Variablen quot und den quantitativ gemessenen unabhängigen Variablen. Mit den offensichtlichen Bedeutungen. Forschungsfrage: Was ist das durchschnittliche Einkommen von CEOs von Fortune 500 Unternehmen Abhängige Variable: Einkommen. Unabhängige Variable: Keine. Forschung Frage: Welcher Prozentsatz der Fortune 500 CEOs sind männlich Abhängige Variable: Gender. Unabhängige Variable: Keine. Forschung Frage: Haben männliche oder weibliche Fortune 500 CEOs mehr Geld Dependent variabel: Einkommen. Unabhängige Variable: Geschlecht. (Gemessen) Forschungsfrage: Hat ein bestimmtes Durchsetzungsvermögen Schulungskurse Fortune 500 CEOs mehr Geld machen Abhängige Variable: Einkommen. Unabhängige Variable: Schulung vs No-Training Kontrolle. (Manipuliert) (Diskussion der zufälligen Zuordnung vs Selbstauswahl, etc.). Hoffe, dass hilft, Prof. Jeff Miller Abt. Psychologie Dunedin, Neuseeland Mein Ansatz ist deskriptiv und nicht präskriptiv. Ich ziehe es vor, alle Begriffe auf dem Tisch zu erhalten - unabhängige Variable, erklärende Variable, Prädiktor, Regressor, Kovariate, begleitende Variable, Störungsvariable, Kontrollvariable, abhängige Variable, Antwortvariable, Kriterium usw. - und diskutieren dann die Ähnlichkeiten und Unterschiede ihrer Bedeutungen zu verschiedenen Menschen. Ray Koopman koopmansfu. ca Ich mag Antwort und erläuternd. Edward J. Gilroy, PhD egilroydiac 13453 W. Oregon Ct. Telefon: 303-986-4944 Lakewood, CO 80228 FAX: 413-702-4639 Mein Verständnis ist, dass die Menschen sich von dieser Terminologie zugunsten der klareren: Vorhersageantwort entfernen. Fathom Dynamic Statistics Software Ich unterrichte sehr traditionell zuerst - manipuliert vs gemessenen Variablen, etc. Aber es wird komplizierter, wenn wir auf die Regression zu bekommen. Dort muss ich über vorhergesagte und Prädiktoren reden. Und dann, wenn das lineare Modell kommt (in der Nähe des Endes eines ein Semesterkurs, dann sehen wir, dass die beiden sind grundsätzlich die gleiche Sache. Großes Thema. Ich freue mich auf die Ergebnisse Richard S. Lehman Email: richard. lehmanfandm. Edu Emeritus Professor für Psychologie Franklin amp Marshall College Lancaster, PA, 17604-3003 Ich bin mir nicht sicher, ob quotenabhängige und quotindependentquot die besten Adjektive sind. In einigen Fällen sind sie völlig irreführend, zum Beispiel, wenn die quotindependentquot Variablen nicht wirklich voneinander unabhängig sind. Warum nicht Schauen Sie sich eine Reihe von anderen Ausdrücken für die gleichen Konzepte. Zum Beispiel in neuronalen Netzwerken gibt es die Input-und Output-Variablen, die den Fluss von Informationen in das und aus dem Modell. Im Glauben-Netzwerke, die quotevidence und Abfrage Variablen vermitteln die Rolle der einzelnen Variablen in der Schlussfolgerung, während sie nicht wirklich in der Modellierung unterschieden werden kann: bevor man die Frage stellt, sind alle Variablen die gleichen. Bei der großen Vielfalt der aufgeführten Begriffe ist wirklich verlangt ein Glossar und Standardisierung. Es gibt nämlich mehrere Bedeutungen, nicht nur zwei. Id sogar argumentieren, dass die Bedeutung von abhängigen und unabhängigen so selten anwendbar ist (außer als Annahme), dass es beseitigt werden sollte. Künstliches Intelligenzlaboratorium, Fakultät für Computer - und Informationswissenschaften, Universität Ljubljana. Ive versucht, die Nutzung zu vermeiden, wann immer möglich. Lehrbücher dont in der Regel erlauben ein, um das Problem völlig zu vermeiden, aber man kann die eigene Nutzung der Sprache zu kontrollieren. Im allgemeinen versuchte Ive, quasi quadratisch oder quadratisch quadratisch oder quasi quasi austauschbar zu verweisen (obwohl der Quotientquantientyp eher für formale ANOVA-Entwürfe als für multiple Regressions - oder GLM-Kontexte gilt) und die Ansprechvariablenquot (oder die Ansprechoberflächenquot bei mehreren) oder Oder auch quotobserved variabel quot, auch mehr oder weniger austauschbar. Meine Auffassung von quotindependentquot und quotdependentquot als Adjektive in diesem Zusammenhang ist, dass man kaum ein Paar wählen könnte, das eher dazu neigt, Fehler und Missverständnisse hervorzubringen, wenn man bewusst versucht hätte, sich zu verschleiern. Irgendwann wurde es mir müde, zu erklären, warum man Quotindependentquot verwendet, um einen Satz von Variablen zu beschreiben, der normalerweise arentunabhängig ist (zumindest nicht im Sinne von unabhängig von jedem anderen), außer im künstlichen Kontext entworfener, ausgeglichener Faktorialexperimente. Wenn das Lehrbuch diesem Gebrauch folgt, muss eine ziemlich gut einige Lippenbekenntnisse dafür bezahlen (und daher eine solche Erklärung einmal durchlaufen), aber es ist nicht notwendig, diese Kennzeichnung über eine solche Anerkennung hinaus zu unterzeichnen. Die unabhängige Variable ist auf der horizontalen Achse und die abhängige Variable auf der vertikalen Achse aufgetragen, ist, was ich sagen, meine Studenten. Für Statistiken Ich addieren erklärende variable unabhängige Variable und Antwort variable abhängige Variable. Dies ist auf der Community College Ebene. Stan Brown, Oak Road Systems, Cortland County, New York, USA Ich habe auch die gleiche Abfrage über die Lehre in den Psychologischen Wissenschaften Hier sind die Antworten, die ich erhielt von Mitgliedern dieser Gruppe. In einem Experiment ist die unabhängige Variable die Variable, die vom Experimentator gesteuert (variiert) wird, und die abhängige Variable ist die Variable, die wir messen, um zu bestimmen, ob die Manipulation der unabhängigen Variablen eine Wirkung hat. Ja, ich bin damit einverstanden, dass diese oft missbraucht werden, und ich habe große Mühe, all die möglichen legitimen und illegitimen Verwendungen zu erwähnen. Dies ist, wie ich versuche, es den Schülern zu erklären: Grundsätzlich ist IV für ein Experiment reserviert - eine Variable kann variieren, während alle anderen irgendwie konstant gehalten oder gleichgesetzt werden. Das ist die IV und es muss Ebenen haben. DV ist weit verbreitet, aber es ist immer eine gemessene Variable, etwas, das wird eine Art von Einheiten angeschlossen haben. Es kann das Ergebnis eines Experiments sein und das ist die bevorzugte Verwendung, nur um die Dinge nicht verwirrend zu halten. Aber es wird auch oft verwendet, um irgendeine gemessene Variable zu bezeichnen, wäre daher für Korrelationen anwendbar - obwohl ich über Variable 1 und Variable 2 in diesem Fall spreche, ohne in das gesamte DV-Konzept einzutreten, weil für eine Korrelation wir eher sind Haben Dummy-Variablen und dann seine unangenehm, um über die als DV gesprochen haben. Annette Kujawski Taylor, Ph. D. Abteilung für Psychologie Universität von San Diego taylorsandiego. edu 1. Streng genommen definiere ich den Begriff unabhängige Variable, um die Variable bedeuten, die in einem echten Experiment manipuliert wird. Auch möchte ich gleichzusetzen, quotfactorquot auf unabhängige Variable. 2. Folglich ist die abhängige Variable die Antwort, die in Abhängigkeit von der unabhängigen Variablen variieren kann. 3. Jedoch lehre ich, dass, wenn es sich bei der Studie um ein Quasitexperiment handelt, in dem eine Variable manipuliert wird, aber nicht von der Kontrolle externer Variablen begleitet wird (z. B. zwei intakte Gruppen, die unterschiedliche Behandlungen erhalten), dann können wir die manipulierte Variable unabhängig nennen. 4. Eine Konsequenz davon ist, dass eine Studie, die ausschließlich aus Subjektvariablen besteht, kein Quasitexperiment ist, sondern eine Ex-post-Facto-Studie ist. 5. Ich verwende nicht die Begriffe unabhängige und abhängige Variablen für die nicht-experimentelle Forschung. Bei dieser Art von Forschung können die Variablen auf der Quotequotendotenseite ex post facto oder eine persönliche Eigenschaft des Subjekts (Subjektvariable) sein. Im Idealfall sollte dieser Begriff verwendet werden, um sie zu beschreiben. Die Antwort der Person kann als Antwortvariable bezeichnet werden. 6. In einer Korrelationsstudie kann ein Pearson r zwischen dem gemessenen IQ und der Reaktionszeit berechnet werden. Ich schlage vor, dass gemessene IQ als Prädiktor-Variable und Reaktionszeit eine vorhergesagte Variable genannt werden. 7. Manchmal ist es auch sinnvoll, Subjektvariablen-Prädiktorvariablen aufzurufen. Stuart J. McKelvie, Ph. D. Vorsitzender, Abteilung für Psychologie, Bischofs-Universität smckelviubishops. ca Einige Psychologen haben argumentiert, dass es nicht angemessen ist, DV und IV zu verwenden, es sei denn der resercher hat quotexperimentales controlquot über dem IV (es manipuliert es direkt). Solche Psychologen neigen dazu, sich zu mißhandeln, wenn die Begriffe in korrelationalen oder quai-experimentellen Situationen verwendet werden. Ich vermute, dies ist die Art von quotmiusequot youre sprechen. Eigentlich ist eine solche eingeschränkte Nutzung ziemlich gut auf die Psychologie beschränkt. In der Mathematik, IV und DV werden weit verbreitet für ziemlich gut jedes X und Y überhaupt. Meistens wird der Charakter der Variablen überhaupt nicht spezifiziert, viel weniger, ob es eine quotexperimentelle Kontrolle gibt, die eine äquivalente kausale Beziehung zwischen ihnen und dergleichen bedeutet. Ein weiterer Fall von Psychologen, die über die quotexperimentalquot Charakter ihrer quotscience. quot :-) Grüße, - Christopher D. Green Abteilung für Psychologie York University e-mail: christoyorku. ca Karl L. Wuensch schrieb: Vielen Dank für Ihre Kommentare. Wie Sie später sehen werden, werde ich verärgert, wenn Psychologen sich auf eine Klassifikationsvariable als unabhängige Variable in der nichtxperimentellen Forschung beziehen und dann argumentieren, dass sie, da sie eine unabhängige Variable (Ursache) und eine abhängige Variable (Effekt) haben, feste Kausalattributionen machen können. Das ist, kein Zweifel, eine schlechte Sache zu tun. Ich weiß nicht, dass anspruchsvolle über nur Vokabular kann das Problem jedoch beheben. Jedenfalls sind selbst die anspruchsvollsten experimentellen Psychologen, was die kausale Schlußfolgerung tatsächlich rechtfertigt, so naiv und veraltet, daß sie sich nicht so kräftig entschuldigen. Hume und Mühle sind kaum das neueste Wort in der Theorie der Kausalität. -) Wuensch, Karl L schrieb: Ich habe immer eine sehr quotcommon sensequot Ansatz zur Kausalität - wenn ich in der Regel machen kann Y ändern durch Manipulation von X, bin ich bequem Bezug auf X als eine Ursache von Y, auch wenn es andere Ereignisse, die Kann Y ändern, auch wenn die Korrelation zwischen X und Y nicht perfekt ist, und selbst wenn X wahrscheinlich auf Y durch eine Folge von dazwischenliegenden Variablen arbeitet. Ich gehe lieber mit beobachteten als latenten Variablen um. Ich weiß nicht, dass diese Sicht quasi sinnlich ist, aber es ist sicherlich nah an der Humean-Position, die die Psychologie im frühen 20. Jahrhundert angenommen hat (außer dass Ihre Version durch Ihre Verwendung des Begriffs quotmakequot in der Definition praktisch kreisförmig gemacht wird). Hume sagte einfach direktionale Korrelation. Es gibt so viele berühmte Gegenbeispiele, die ziemlich sicher waren, dass auch seine Inadeqaute (z. B. Tag zuverlässig vor der Nacht kommt, aber Tag nicht Casue Nacht, wie Thomas Reid wies im 18. Jahrhundert). Wenn youre, das an etwas von der Arbeit interessiert ist, die auf Ursache im intervening Jahrhundert getan worden ist, theres eine gute Ansammlung, die von Ernest Sosa und von Michael Tooley bearbeitet wurde, betitelte einfach Causation (Oxford, 1993). Grüße, Christopher D. Green Vielleicht hätte ich die quoteveryday usagequot Bedeutung sagen sollen, anstatt die quotcommon Sinnquot Bedeutung von quotcause. quot Was ich im Sinn habe, ist im Wesentlichen Colllingwoods (ein Essay über Metaphysik, Oxford, Clarendon, 1940, S. 285) Die die Ursache ist, ist ein Ereignis in der Natur, und seine Ursache ist ein Ereignis oder Zustand der Dinge, indem wir produzieren oder verhindern, was wir produzieren oder verhindern können, dessen Ursache es ist, zu sein Ein Beispiel nutzte Collingwood das Spiegeln eines Lichtschalters (X) und die daraus resultierende Änderung der Beleuchtung (Y). Ich weiß, aus der alltäglichen Erfahrung, dass das Umschalten des Lichtschalters wird gefolgt werden, in der Regel durch eine Änderung der Beleuchtung, und der Zustand der Lichtschalter ist etwas, was ich manipulieren kann. Ich bin ziemlich komfortabel sagen, dass das Umschalten der Schalter eine Änderung in der Höhe der Beleuchtung verursacht - natürlich, wenn Sie mich drücken, würde ich erkennen, dass die Beziehung nicht perfekt ist (wenn die Macht aus ist oder die Leitung gebrochen oder die Glühbirnen gebrochen , Manipulation von X wird Y nicht beeinflussen) und dass ihre anderen Ursachen für Y sind (Manipulation der Jalousien, zum Beispiel). In Bezug auf die Beziehung zwischen Tag und Nacht, gut, ich kann nicht von beiden zu manipulieren. -) Zurück zur Stat Help Page Diese Seite wurde zuletzt am 28. Januar 2007 überarbeitet.

No comments:

Post a Comment