Ordinaldaten

Es gibt verschiedene Modelle, die verwendet werden können, um die Struktur von Ordinaldaten zu beschreiben. Im Folgenden werden vier Hauptklassen von Modellen beschrieben, die jeweils für eine Zufallsvariable definiert sind Y {\displaystyle Y}

Y

, mit Ebenen indiziert durch k = 1, 2, … , q {\displaystyle k=1,2,\dots ,q}

{\displaystyle k=1,2,\dots ,q}

.

Beachten Sie, dass in den folgenden Modelldefinitionen die Werte von μ k {\displaystyle \mu _{k}}

\mu _{k}

und β {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

nicht für alle Modelle für den gleichen Satz von daten, aber die Notation wird verwendet, um die Struktur der verschiedenen Modelle zu vergleichen.

Proportional odds modelbearbeiten

Das am häufigsten verwendete Modell für Ordinaldaten ist das proportional odds model, definiert durch log ⁡ = log ⁡ = μ k + β T x {\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\log _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

wobei die Parameter μ k {\displaystyle \mu _{k}}

\mu _{k}

die Basisverteilung der Ordinaldaten beschreiben, x {\displaystyle \mathbf {x} }

\mathbf { x}

sind die Kovariaten und β {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

sind die Koeffizienten, die die Effekte der Kovariaten beschreiben.

Dieses Modell kann verallgemeinert werden, indem man das Modell mit μ k + β k T x {\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

anstelle von μ k + β T x {\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta} ^{T}\mathbf {x} }

, und dies würde das Modell sowohl für nominale Daten (in denen die Kategorien keine natürliche Ordnung haben) als auch für ordinale Daten geeignet machen. Diese Verallgemeinerung kann es jedoch erheblich erschweren, das Modell an die Daten anzupassen.

Basiskategorie logit modelEdit

Das Basiskategorie-Modell ist definiert durch log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{ T}\mathbf {x} }

Dieses Modell schreibt den Kategorien keine Reihenfolge vor und kann daher sowohl auf Nominaldaten als auch auf Ordinaldaten angewendet werden.

Bestellt Stereotyp modelEdit

Der bestellten Stereotyp-Modell ist definiert durch den log ⁡ = μ k + ϕ k β T x {\displaystyle \log \Links=\mu _{k}+\phi _{k}\vec {\beta } ^{T}\vec {x} }

{\displaystyle \log \Links=\mu _{k}+\phi _{k}\vec {\beta } ^{T}\vec {x} }

, wobei der score-Parameter eingeschränkt sind, so dass 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}

{\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}

.

Dies ist ein sparsameres und spezialisierteres Modell als das Logit-Modell der Basiskategorie: ϕ k β {\displaystyle \phi _{k}\mathbf {\beta } }

{\displaystyle \phi _{k}\mathbf {\beta } }

kann als ähnlich wie β k {\displaystyle \mathbf {\beta } _{k}}

{\displaystyle \mathbf {\beta } _{k}}

.

Das nicht geordnete Stereotypmodell hat dieselbe Form wie das geordnete Stereotypmodell, jedoch ohne die Reihenfolge, die ϕ k {\displaystyle \phi _{k}} auferlegt wird

\phi _{k}

. Dieses Modell kann auf nominale Daten angewendet werden.

Beachten Sie, dass die angepassten Werte ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

angeben, wie einfach es ist, zwischen den verschiedenen Ebenen von Y zu unterscheiden {\displaystyle Y}

Y

. Wenn ϕ ^ k ≈ ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k}\approx {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k}\approx {\hat {\phi }}_{k-1}}

dann zeigt das an, dass der aktuelle Datensatz für die Kovariaten x {\displaystyle \mathbf {x} }

\mathbf {x}

liefern nicht viele Informationen, um zwischen den Ebenen k {\displaystyle k}

k

und k − 1 {\displaystyle k-1}

k-1

bedeutet nicht unbedingt, dass die tatsächlichen Werte k {\displaystyle k}

k

und k − 1 {\displaystyle k-1}

k-1

liegen weit auseinander. Und wenn sich die Werte der Kovariaten ändern, dann ergeben sich für diese neuen Daten die angepassten Werte ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

und ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k-1}}

könnte dann weit auseinander liegen.

Benachbarte Kategorien logit modelEdit

Das Modell benachbarter Kategorien ist definiert durch log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k} ^{T}\mathbf {x} }

obwohl die häufigste Form, die in Agresti (2010) als „proportional odds form“ bezeichnet wird, definiert ist durch log ⁡ = μ k + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+ \mathbf {\beta } ^{T}\mathbf {x} }

Dieses Modell kann nur auf Ordinaldaten angewendet werden, da die Modellierung der Wahrscheinlichkeiten von Verschiebungen von einer Kategorie zur nächsten Kategorie impliziert, dass eine Reihenfolge dieser Kategorien existiert.

Das benachbarte Kategorien−Logit-Modell kann als Sonderfall des Basiskategorien-Logit-Modells betrachtet werden, wobei β k = β ( k – 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

{\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

. Das benachbarte Kategorien−Logit-Modell kann auch als Sonderfall des geordneten Stereotyp-Modells betrachtet werden, wobei ϕ k ∝ k – 1 {\displaystyle \phi _{k}\propto k-1}

{\displaystyle \phi _{k}\propto k-1}

, d.h. die Abstände zwischen den ϕ k {\displaystyle \phi _{k}\propto\phi _{k}\phi _{k} werden im Voraus definiert, anstatt basierend auf den Daten geschätzt zu werden.

Vergleiche zwischen den Modellen

Das proportionale Quotenmodell hat eine ganz andere Struktur als die anderen drei Modelle und auch eine andere zugrunde liegende Bedeutung. Beachten Sie, dass die Größe der Referenzkategorie im proportionalen Odds-Modell mit k {\displaystyle k}

k

variiert , da Y ≤ k {\displaystyle Y\leq k}

{\displaystyle Y\leq k}

mit Y > k {\displaystyle Y>k}

{\displaystyle Yk}

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.