Dane porządkowe

istnieje kilka różnych modeli, które można wykorzystać do opisania struktury danych porządkowych . Poniżej opisano cztery główne klasy modelu, każda zdefiniowana dla zmiennej losowej Y {\displaystyle Y}

Y

, z poziomami indeksowanymi przez k = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}

{\displaystyle k=1,2,\dots ,kropki, Q}

.

Należy zauważyć, że w poniższych definicjach modelu wartości μ k {\displaystyle \mu _{k}}

\mu _{k}

I β {\displaystyle \mathbf {\beta}}

\mathbf{\beta}

nie będzie taka sama dla wszystkich modeli dla tego samego zestawu danych, ale notacja jest używana do porównania struktury różnych modeli.

model kursów Proporcjonalnychedit

najczęściej stosowanym modelem dla danych porządkowych jest model kursów proporcjonalnych, zdefiniowany przez log ⁡ = log ⁡ = μ k + β t X {\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\Beta } ^{t}\mathbf {x} }

gdzie parametry μ k {\displaystyle \mu _{K}}

\mu _{K}

opisują rozkład bazowy danych porządkowych, x {\displaystyle \mathbf {x} }

\mathbf {x}

są kowariatami i β {\displaystyle \mathbf {\beta}}

\mathbf{\beta}

są współczynnikami opisującymi efekty kowariatów.

Ten model można uogólnić , definiując model za pomocą μ k + β k t X {\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

zamiast μ k + β t X {\displaystyle \mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle \mu _{K}+\mathbf {\Beta } ^{t}\mathbf {x} }

, a to sprawi, że model będzie odpowiedni dla danych nominalnych (w których Kategorie nie mają naturalnego uporządkowania), a także dane porządkowe. Jednak to uogólnienie może znacznie utrudnić dopasowanie modelu do danych.

Kategoria bazowa model logitedytuj

model kategorii bazowej jest zdefiniowany przez log ⁡ = μ k + β k t X {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{K}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

Ten model nie nakłada porządkowania na kategorie i dlatego może być stosowany zarówno do danych nominalnych, jak i porządkowych.

zamówić stereotyp modelEdit

zamówionego stereotyp model jest zdefiniowany log ⁡ = μ i (K) + ϕ K i β T X {\właściwości wyświetlania stylu wartość \magazyn \lewej=\mu _{k}+\Phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

{\właściwości wyświetlania stylu wartość \magazyn \lewej=\mu _{k}+\Phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

, gdzie wynik ustawienia ograniczone są takie, że 0 = 1 ϕ ≤ ϕ 2 ≤ ⋯ ≤ ϕ M = 1 {\właściwości wyświetlania stylu wartość 0=\phi _{1}\leq i \pi _{2}\leq i \punktów \leq i \Pi _{M}=1}

{\właściwości wyświetlania stylu wartość 0=\phi _{1}\leq i \pi _{2}\leq i \punktów \leq i \Pi _{M}=1}

.

jest to bardziej skomplikowany i wyspecjalizowany model niż podstawowy model logitu kategorii: ϕ k β {\displaystyle \phi _{k}\mathbf {\beta } }

{\displaystyle \phi _{k}\mathbf {\beta } }

można uważać za podobny do β k {\displaystyle \mathbf {\Beta } _{K}}

{\displaystyle \mathbf {\beta } _{K}}

.

nieregulowany model stereotypu ma taką samą formę jak uporządkowany model stereotypu, ale bez kolejności narzuconej na ϕ k {\displaystyle \phi _{k}}

\phi _{k}

. Model ten można zastosować do danych nominalnych.

zwróć uwagę, że dopasowane wyniki , ϕ ^ k {\displaystyle {\Hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

, wskazują, jak łatwo jest rozróżnić różne poziomy Y {\displaystyle Y}

y

. Jeśli ϕ ^ k ≈ ≈ ^ k − 1 {\displaystyle {\hat {\phi }}_{k}\approx {\hat {\phi }}_{K-1}}

{\displaystyle {\hat {\phi }}_{k}\approx {\hat {\phi }}_{K-1}}

to oznacza , że bieżący zestaw danych dla kowariatów x {\displaystyle \mathbf {x} }

\mathbf {x}

nie dostarczają zbyt wielu informacji, aby odróżnić poziomy K {\displaystyle K}

k

I K − 1 {\displaystyle K-1}

K-1

, ale nie musi to oznaczać, że rzeczywiste wartości K {\displaystyle k}

k

I k − 1 {\displaystyle k-1}

K-1

są daleko od siebie. A jeśli wartości kowariatów się zmienią, to dla tych nowych danych dopasowane wyniki ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

I ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{K-1}}

{\displaystyle {\Hat {\Phi }}_{K-1}}

sąsiednie kategorie model logitedytuj

model sąsiadujących kategorii jest zdefiniowany przez log ⁡ = μ k + β k t X {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{K}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\Beta } _{k}^{t}\mathbf {x} }

chociaż najczęstszą formą, określoną w Agresti (2010) jako „forma proporcjonalna” jest zdefiniowana przez log ⁡ = μ k + β t X {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\Beta } ^{T} \ mathbf {x} }

Ten model może być zastosowany Tylko do danych porządkowych, ponieważ modelowanie prawdopodobieństwa przesunięć z jednej kategorii do następnej kategorii oznacza, że istnieje kolejność tych kategorii.

model logit kategorii sąsiadujących można traktować jako szczególny przypadek modelu logit kategorii bazowej, gdzie β k = β ( k − 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

{\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

. Model logit kategorii sąsiadujących można również traktować jako szczególny przypadek uporządkowanego modelu stereotypu, gdzie ϕ k ∝ k − 1 {\displaystyle \phi _{k}\propto k-1}

{\displaystyle \phi _{k}\propto k-1}

, tj. odległości między ϕ k {\displaystyle \phi _{k}}

\Phi _{k}

są zdefiniowane z góry, a nie są szacowane na podstawie danych.

porównania pomiędzy modelamiedytuj

model kursów proporcjonalnych ma zupełnie inną strukturę niż pozostałe trzy modele, a także inne znaczenie bazowe. Należy zauważyć , że rozmiar kategorii referencyjnej w modelu kursów proporcjonalnych różni się od k {\displaystyle k}

k

, ponieważ y ≤ k {\displaystyle Y\leq k}

{\displaystyle Y\leq k}

jest porównywany do Y > k {\displaystyle y>K}

{\displaystyle yk}

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *