3 Haupt Linear Wahrscheinlichkeitsmodell (LPM) Probleme

Unter Verwendung der gewöhnlichen kleinsten Quadrate (OLS) Technik, um ein Modell mit einem Dummy-abhängigen Variablen abzuschätzen, wie die Schaffung eines bekannten lineare Wahrscheinlichkeitsmodell,

oder LPM. LPMs sind nicht perfekt. Drei spezifische Probleme können auftreten:

  • Nicht-Normalität der Fehlerterm

  • heteroskedastischen Fehler

  • Potenziell unsinnige Prognosen

Nicht-Normalität der Fehlerterm

Die Annahme, dass der Fehler normal verteilt wird, ist entscheidend für die Durchführung Hypothesentests nach dem ökonometrischen Modells abzuschätzen.

Der Fehlerterm eines LPM hat eine Binomialverteilung anstelle einer Normalverteilung. Es impliziert, dass die traditionelle t-Tests für individuelle Bedeutung und F-Tests für die allgemeine Bedeutung sind ungültig.

Wie Sie sehen können, hat der Fehlerterm in einem LPM eine von zwei möglichen Werte für eine bestimmte X Wert. Ein möglicher Wert für den Fehler (wenn Y = 1) durch A gegeben, und der andere mögliche Wert für den Fehler (falls Y = 0) von B. ist daher gegeben, es ist unmöglich für den Fehlerterm eine Normalverteilung zu haben.

bild0.jpg

Heteroskedasticity

Das klassische lineare Regressionsmodell (CLRM) geht davon aus, dass der Fehlerterm homoskedastic ist. Die Annahme von homoskedasticity ist erforderlich, um zu beweisen, dass die OLS Schätzer effizient sind (oder am besten). Der Beweis, dass OLS Schätzer effizient sind, ist ein wichtiger Bestandteil des Gauß-Markov-Theorem. Das Vorhandensein von Heteroskedastie kann bewirken, dass das Gauß-Markov-Theorems auf andere unerwünschte Eigenschaften für die OLS Schätzer verletzt und führen zu werden.

Der Fehlerterm in einer LPM ist heteroskedastischen weil die Varianz nicht konstant ist. Stattdessen hängt die Varianz eines LPM Fehlerterm auf den Wert der unabhängigen Variablen (s).

Unter Verwendung der Struktur des LPM, kann die Varianz der Fehlerterm wie folgt charakterisieren

image1.jpg

Weil die Varianz des Fehlers hängt von dem Wert von X, es zeigt Heteroskedastie statt homoskedasticity.

Unbounded vorhergesagten Wahrscheinlichkeiten

Die grundlegendste Wahrscheinlichkeitsgesetz besagt, dass die Wahrscheinlichkeit eines Vorkommnisses muss innerhalb des Intervalls enthalten sein [0,1]. Aber die Natur eines LPM ist, daß sie nicht diese Grundgesetz der Wahrscheinlichkeit nicht gewährleistet ist erfüllt. Obwohl die meisten der vorhergesagten Wahrscheinlichkeiten von einer LPM haben vernünftige Werte (zwischen 0 und 1), können einige vorhergesagten Wahrscheinlichkeiten unsinnige Werte haben, die kleiner als 0 oder größer als 1 ist.

Werfen Sie einen Blick auf die folgende Abbildung und konzentrieren Sie sich auf die Segmente der Regressionsgeraden, wo die bedingte Wahrscheinlichkeit größer als 1 oder kleiner als 0. Wenn die abhängige Variable kontinuierlich ist, Sie müssen nicht über unbeschränkte Werte für die Sorge bedingte Mittel. Allerdings dichotome Variablen sind problematisch, da die bedingten Mittel bedingten Wahrscheinlichkeiten darstellen. Interpretieren Wahrscheinlichkeiten, die nicht begrenzt werden durch 0 und 1, ist schwierig.

image2.jpg

Sie können ein Beispiel für dieses Problem mit den tatsächlichen Daten sehen:

image3.jpg

Die meisten der geschätzten Wahrscheinlichkeiten aus der LPM Schätzung innerhalb des [0,1] Intervall enthalten ist, aber die vorhergesagte Wahrscheinlichkeit für die siebte Beobachtung ist negativ. Leider sorgt für nichts in der Schätzung eines LPM, dass alle vorhergesagten Wahrscheinlichkeiten innerhalb einer angemessenen Werte bleiben.

Menü