Ordinale gegevens

Er zijn verschillende modellen die kunnen worden gebruikt om de structuur van ordinale gegevens te beschrijven. Vier grote klassen van het model worden hieronder beschreven, elk gedefinieerd voor een willekeurige variabele Y {\displaystyle Y}

Y

, met niveaus geïndexeerd door k = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}

{\displaystyle k=1,2,\dots ,q}

.

merk op dat in de modeldefinities hieronder, de waarden van μ k {\displaystyle \mu _{k}}

\mu _{k}

en β {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

niet de hetzelfde voor alle modellen voor dezelfde verzameling gegevens, maar de notatie wordt gebruikt om de structuur van de verschillende modellen te vergelijken.

Proportional odds modelEdit

De meest gebruikte model voor ordinale data is de proportionele odds model, gedefinieerd door het log ⁡ = log ⁡ = μ k + β T x {\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

waar de parameters μ k {\displaystyle \mu _{k}}

\mu _{k}

beschrijf de basis verdeling van de ordinale gegevens, x {\displaystyle \mathbf {x} }

\mathbf {x}

zijn de covariaten en β {\displaystyle \ mathbf {\beta } }

\mathbf{\beta}

zijn de coëfficiënten die de effecten van de covariaten beschrijven.

Dit model kan worden gegeneraliseerd door het definiëren van het model met behulp van μ k + β k T x {\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

in plaats van μ k + β T x {\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

, en dit maakt het model geschikt voor nominale data (waarin de categorieën hebben geen natuurlijke ordening) als ordinale gegevens. Deze generalisatie kan het echter veel moeilijker maken om het model aan de gegevens aan te passen.

Baseline category logit modelEdit

het baseline category model wordt gedefinieerd door log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

Dit model legt geen volgorde op aan de categorieën en kan dus zowel op nominale als op ordinale gegevens worden toegepast.

Bestelde stereotype modelEdit

De bestelde stereotype model is gedefinieerd door het log ⁡ = μ k + ϕ k β T x {\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

waar de score parameters worden beperkt zodanig dat 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \punten \leq \phi _{q}=1}

{\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \punten \leq \phi _{q}=1}

.

Dit is een meer parsimonious, en meer gespecialiseerde, model dan de baseline categorie logit-model: ϕ k β {\displaystyle \phi _{k}\mathbf {\beta } }

{\displaystyle \phi _{k}\mathbf {\beta } }

kan worden beschouwd als vergelijkbaar met β k {\displaystyle \mathbf {\beta } _{k}}

{\displaystyle \mathbf {\beta } _{k}}

.

het niet-geordende stereotype model heeft dezelfde vorm als het geordende stereotype model, maar zonder de volgorde opgelegd aan ϕ k {\displaystyle \phi _{k}}

\phi _{k}

. Dit model kan worden toegepast op nominale gegevens.

merk op dat de passende scores, ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

, aangeven hoe gemakkelijk het is om onderscheid te maken tussen de verschillende niveaus van Y {\displaystyle Y}

y

. Als ϕ ^ k ≈ ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k}\ca {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k}\ca {\hat {\phi }}_{k-1}}

vervolgens dat geeft aan dat de huidige set van gegevens voor de covariates x {\displaystyle \mathbf {x} }

\mathbf {x}

doen niet veel informatie om onderscheid te maken tussen de niveaus k {\displaystyle k}

k

en k − 1 {\displaystyle k-1}

k-1

, maar dat hoeft niet te betekenen dat de werkelijke waarden van k {\displaystyle k}

k

en k − 1 {\displaystyle k-1}

k-1

liggen ver uit elkaar. En als de waarden van de covariates wijzigen, dan voor dat nieuwe gegevens op de vaste scores ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

en ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k-1}}

kunnen dan ver uit elkaar.

Aangrenzende categorieën logit modelEdit

De aangrenzende categorieën model is gedefinieerd door het log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

hoewel de meest voorkomende vorm, als bedoeld in Agresti (2010) als de “proportional odds vorm” is gedefinieerd door het log ⁡ = μ k + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T} \ mathbf {x}}

Dit model kan alleen worden toegepast op ordinale gegevens, aangezien het modelleren van de waarschijnlijkheid van verschuivingen van de ene categorie naar de volgende categorie impliceert dat een volgorde van deze categorieën bestaat.

de aangrenzende categorieën logit model kan worden gezien als een speciaal geval van de basislijn categorie logit model, waar β k = β ( k − 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

{\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1))}

. De aangrenzende categorieën logit-model kan ook worden beschouwd als een speciaal geval van de bestelde stereotype model, waar ϕ k) ∝ k − 1 {\displaystyle \phi _{k}\propto k-1}

{\displaystyle \phi _{k}\propto k-1}

, d.w.z. de afstanden tussen de ϕ k {\displaystyle \phi _{k}}

\phi _{k}

vooraf gedefinieerde, in plaats van naar schatting gebaseerd op de gegevens.

vergelijkingen tussen de modeledit

het proportionele odds model heeft een heel andere structuur dan de andere drie modellen, en ook een andere onderliggende betekenis. Merk op dat de grootte van de referentie-categorie in de proportionele odds model varieert met k {\displaystyle k}

k

omdat Y ≤ k {\displaystyle Y\leq k}

{\displaystyle Y\leq k}

vergeleken met Y > k {\displaystyle Y>k}

{\displaystyle Yk}

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *