Ordinale Probit-Modelle

Anwendung:

Liegt die abhängige Variable in einer ordinalen Skalierung vor und man möchte ein Regressionsverfahrung zur multivariaten Dependenzanalyse heranziehen, so bietet sich ein ordinales Probit-Modell an:
Gehen wir von folgendem Beispiel aus: Ein Konsument soll seine finanzielle Situation in der nahen Zukunft (sagen wir ein halbes Jahr) im Vergleich zur aktuellen Situation mit den drei Ausprägungen „besser“, „gleich“ oder „schlechter“ einschätzen.
Es lässt sich durchaus sagen, dass „besser“ vom Sinngehalt her größer ist als „gleich“ und beide größer sind als „schlechter“, d.h. wir haben eine Rangordnung. Nun wollen wir wissen, von welchen unabhängigen Variablen (Bsp.: Soziale Klasse, Bildung, Alter, Geschlecht etc.) diese Einschätzung beeinflusst wird. Es bietet sich auf Grund dieser ordinalen Skalierung an, ordinale Probit-Modelle zu verwenden, welche im Folgenden nun kurz erläutert werden.

Probit-Modelle sind den Logistischen Regressionen recht ähnlich, unterscheiden sich jedoch in der Hinsicht, dass sie der Standard-Normalverteilung und keiner logistischen Verteilung folgen. Der einzige Grund für die vermehrte Verwendung von Logistischen Modellen in der Vergangenheit lag in einem Mangel an Rechenleistung, der jedoch dank der rasanten Entwicklung der Computer-Technologie hinfällig geworden ist. Im Gegensatz zur linearen Regression liegt bei diesen Modellen der Fokus auf der Ausgabe der Wahrscheinlichkeit für verschiedene spezifische Werte von x. Das bedeutet, die partiellen Effekte sind nicht mehr konstant, sondern hängen von den Ausprägungen von x ab. Die Interpretation der Regressoren alleine ist daher weniger sinnvoll, denn sie geben lediglich die Richtung der Effekte an. Jedoch lassen sich, wie zuvor angesprochen, Wahrscheinlichkeiten für spezifische Fälle berechnen, in eine dieser drei Kategorien zu fallen und gleichzeitig die marginalen Effekte auslesen.

Das Ordinale Probit Modell als eine Variante der Ordered Response-Modelle stellt hierbei eine Verallgemeinerung des Binary Choice Probit-Modells dar, das innerhalb der abhängigen Variablen mehr als zwei Ausprägungen zulässt. Eine Möglichkeit wäre es gewesen, die abhänige Variable dichotom zu rekodieren, jedoch erlauben Ordered Response-Modelle den vollen Informationsgehalt von ordinalen Variablen auszuschöpfen. Bei linearen OLS-Modellen besteht die Annahme, dass die Abstände zwischen zwei Ausprägungen immer gleich groß sind. D.h. der Abstand zwischen 1 und 2 ist genauso groß, wie der Abstand zwischen 3 und 4. In ordinalen Modellen existieren diese Zahlen lediglich als Ranking, es wird aber keine Aussage über die Abstände zwischen den Kategorien bzw. Kategoriegrenzen getroffen.
Die Wahrscheinlichkeit in eine Kategorie j der abhängigen ordinalen Variable zu fallen wird formal folgendermaßen dargestellt:

Wahrscheinlichkeit

Es lässt sich daraus jedoch nur schließen, mit welcher Wahrscheinlichkeit der spezifische Fall in eine bestimmte Kategorie fällt. Wo genau seine Position innerhalb dieser Kategorie liegt, d.h. ob er sich an einer der Grenze zu nächst tieferen oder höheren Kategorie befindet oder ob er im Mittelfeld zu lokalisieren ist, lässt sich an Hand dieser Zahl nicht ausdrücken.

Gütemaß:

Gibt bei einer linearen Regression das ausgegebene R² die durch das Modell erklärte Varianz als Gütemaß an, lässt sich das z.B. von STATA ausgegebene Pseudo-R² nach McFadden auf Grund der Nicht-Linearität des Modells lediglich in der Hinsicht „je höher, desto besser“ interpretieren.
Ein weiteres Gütemaß stellt der Likelihood-Ratio-Test dar. Im Zuge dieses Testes wird der letzte Iterationswert vom ersten Iterationswert abgezogen. Im Gegensatz zum R²MF wird keine Standardisierung vorgenommen, sondern lediglich mit -2 multipliziert.
Formal sieht dieser Test wie folgt aus:

LR

Die Nullhypothese wird abgelehnt, wenn die empirische Likelihood-Ratio größer dem tabellierten χ²-Wert für die entsprechende Zahl der Freiheitsgrade ist. In diesem Fall ist mindestens eine der unabhängigen Variablen signifikant von Null verschieden.

Weiterführende Literatur: