So wählen Sie unabhängige Variablen für Ihre ökonometrischen Modell
Eine der wichtigsten Entscheidungen, die Sie machen, wenn Sie Ihre ökonometrischen Modells spezifiziert ist, welche Variablen als unabhängige Variablen enthalten. Hier finden Sie heraus, welche Probleme auftreten können, wenn Sie sind zu wenige oder zu viele unabhängige Variablen in Ihrem Modell, und Sie sehen, wie diese Fehlspezifikation Ihre Ergebnisse auswirkt.
Das Weglassen relevanten Variablen
Wenn eine Variable, die in dem Modell gehört, von der geschätzten Regressionsfunktion ausgeschlossen ist, ist das Modell falsch angegeben und Bias in den geschätzten Koeffizienten verursachen.
Sie haben eine ausgelassen Variable Bias, wenn ein ausgeschlossener Variable eine gewisse Wirkung (positiv oder negativ) auf die abhängige Variable hat, und es ist mit mindestens einer Ihrer unabhängigen Variablen korreliert.
Die mathematische Natur der Spezifikation Vorspannung kann unter Verwendung eines einfachen Modells ausgedrückt werden. Nehmen wir an, das wahre Populationsmodell gegeben durch
woher X1 und X2 Variablen sind die beiden, die beeinflussen, Y. Aber aufgrund von Unwissenheit oder Mangel an Daten, anstatt schätzen Sie diese Regression:
die auslässt X2 von den unabhängigen Variablen. Der erwartete Wert von
in dieser Situation ist,
Aber diese Gleichung verstößt gegen das Gauß-Markov-Theorem, weil
Die Größe der Vorspannung kann ausgedrückt werden als
woher
wenn die Wirkung von X2 auf Y und
ist die Steigung von dieser Regression:
das fängt die Korrelation (positiv oder negativ) zwischen dem ein- und ausgeschlossenen Variable (n).
Auswirkungen der berücksichtigter Variablen auf abhängige Variable | Die Korrelation zwischen eingeschlossen und berücksichtigter Variablen: | |
---|---|---|
Positiv | Negativ | |
Positiv | Positive Bias | Negative Bias |
Negativ | Negative Bias | Positive Bias |
In der Praxis werden Sie wahrscheinlich etwas weggelassen Variable Bias zu haben, weil es unmöglich ist, alles zu kontrollieren, die abhängige Variable beeinflusst. Allerdings können Sie Ihre Chancen auf eine Minimierung weggelassen variable Vorspannung durch die Vermeidung einfache Regressionsmodelle (mit einer unabhängigen Variablen) und einschließlich der Variablen erhöhen, die wahrscheinlich die wichtigste theoretisch (und möglicherweise, aber nicht notwendigerweise statistisch) bei der Erklärung der abhängigen Variablen zu sein .
Einschließlich irrelevanten Variablen
Wenn eine Variable in dem Modell nicht gehört, und ist in der geschätzten Regressionsfunktion enthalten ist, wird das Modell überdimensioniert. Wenn Sie das Regressionsmodell, indem eine irrelevante Variable overspecify, bleiben die geschätzten Koeffizienten unvoreingenommen. Sie hat jedoch eine unerwünschte Wirkung, die Standardfehler der Koeffizienten zu erhöhen.
In einem einfachen Regressionsmodell (mit einer unabhängigen Variablen), der geschätzten Standardabweichung des Regressionskoeffizienten für X ist
woher
ist die geschätzte Varianz des Fehlers und
Variation ist die Summe in X.
Wenn Sie zusätzliche unabhängige Variablen in das Modell zu integrieren, wird die geschätzte Standardfehler für jede gegebene Regressionskoeffizienten gegeben durch
woher
die aus der Regression der R-Quadrat Xk auf den anderen unabhängigen Variablen oder Xs. weil
der Zähler verringert. Eine irrelevante Variable hilft nicht der Variation erklären Y, so ohne Verrechnung Abnahme
die Standardfehler zunimmt.
Nur weil Ihre geschätzte Koeffizient statistisch nicht signifikant ist es nicht unerheblich zu machen. Ein gut angegebene Modell umfasst in der Regel einige Variablen, die statistisch signifikant und einige, die es nicht sind. Zusätzlich Variablen, die nicht statistisch signifikant sind, können genug erklärt Variation beitragen zu den Standardfehler keine negativen Auswirkungen haben.