Ordinaalitiedot

on olemassa useita eri malleja, joilla voidaan kuvata ordinaalitiedon rakennetta. Alla on kuvattu neljä malliluokkaa, joista jokainen on määritelty satunnaismuuttujalle Y {\displaystyle Y}

Y

, joiden tasot on indeksoitu K = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}

{\displaystyle k=1,2,\Dots ,Q}

.

huomaa, että alla olevissa mallimääritelmissä μ k {\displaystyle \mu _{k}}

\mu _{k}

ja β {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

ei ole sama kaikille saman tietojoukon malleille, mutta merkintää käytetään vertailemaan eri mallien rakennetta.

Proportional odds modelEdit

yleisimmin käytetty ordinaalidatan malli on proportional odds model, jonka määrittelee log ⁡ = log ⁡ = μ K + β T x {\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }missä parametrit μ K {\displaystyle \mu _{k}}\mu _{k}

kuvaavat järjestysdatan perusjakaumaa, x {\displaystyle \mathbf {x}}

\mathbf {x}

ovat kovariaatit ja β {\displaystyle \mathbf {\beta } }

\mathbf{\beta}

ovat kovariaattien vaikutuksia kuvaavat kertoimet.

tämä malli voidaan yleistää määrittelemällä malli μ k + β K T x {\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

sijasta μ K + β T x {\displaystyle \mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }, ja tämä tekisi mallista sopivan nimellistiedolle (jossa luokilla ei ole luonnollista järjestystä) sekä järjestysdataa. Tämä yleistys voi kuitenkin vaikeuttaa huomattavasti mallin sovittamista aineistoon.

perustason Luokka logit modelEdit

perustason luokkamalli määritellään log ⁡ = μ K + β K T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

Tämä malli ei aseta luokille järjestystä, joten sitä voidaan soveltaa sekä nimelliseen dataan että järjestysaineistoon.

Tilata stereotypia modelEdit

tilata stereotypia malli on määritelty log ⁡ = μ k + ϕ k β T x {\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

missä pisteet parametrit on rajoitettu siten, että 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}

{\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}

.

Tämä on parsimaisempi ja erikoistuneempi malli kuin perustason kategorian logit-malli: ϕ K β {\displaystyle \phi _{k}\mathbf {\beta } }

{\displaystyle \phi _{k}\mathbf {\beta } }

voidaan ajatella samanlaisena kuin β k {\displaystyle \mathbf {\beta}}

voidaan ajatella samanlaisena kuin β k {\displaystyle \mathbf {\beta} _{k}}

{\displaystyle \ mathbf {\beta} _{k}}

.

järjestämättömällä stereotyyppimallilla on sama muoto kuin järjestetyllä stereotyyppimallilla, mutta ilman määräystä, joka on määrätty ϕ k {\displaystyle \phi _{k}}

\phi _{k}

. Tätä mallia voidaan soveltaa nimellisiin tietoihin.

huomaa, että sovitetut pisteet ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

osoittavat , kuinka helppoa on erottaa y {\displaystyle Y}

y

. Jos ϕ ^ k ≈ ϕ ^ ^ K − 1 {\displaystyle {\hat {\phi }}_{k}\approx {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k}\approx {\hat {\phi }}_{K-1}}, tämä osoittaa, että nykyinen tietojoukko kovariaatit x {\displaystyle \mathbf {x}}

\mathbf {x}

eivät anna paljoakaan tietoa tasojen k {\displaystyle k}

k

ja K − 1 {\displaystyle K-1}

K-1

, mutta se ei välttämättä tarkoita, että todelliset arvot k {\displaystyle k}

k

ja K − 1 {\displaystyle k-1}

k-1

ovat kaukana toisistaan. Ja jos kovariaattien arvot muuttuvat, niin kyseiselle uudelle datalle sovitetut pisteet ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

ja ϕ ^ K − 1 {\displaystyle {\hat {\phi }}_{K-1}}

{\displaystyle {\Hat {\Phi }}_{K-1}}

saattaa tällöin olla kaukana toisistaan.

vierekkäiset luokat logit modelEdit

viereisten luokkien malli on määritelty log ⁡ = μ K + β K T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{t}\mathbf {x} }

vaikka yleisin muoto, johon Agresti (2010) viittaa ”suhteellisena todennäköisyysmuotona”, on määritelty log ⁡ = μ k + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle \Log \Left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

tätä mallia voidaan soveltaa vain ordinaalitietoihin, sillä yhdestä kategoriasta seuraavaan kategoriaan siirtyvien todennäköisyyksien mallintaminen merkitsee sitä, että näiden kategorioiden järjestys on olemassa.

viereisen kategorian logit − mallia voidaan pitää perustason kategorian logit-mallin erikoistapauksena, jossa β k = β ( k-1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

{\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

. Viereistä logit − mallia voidaan pitää myös järjestetyn stereotyyppimallin erikoistapauksena, jossa ϕ K ∝ K-1 {\displaystyle \phi _{k}\propto k-1}

{\displaystyle \phi _{k}\propto k-1}

, eli etäisyydet the k {\displaystyle \phi _{k}}

\Phi _{k}

määritellään etukäteen sen sijaan, että ne arvioitaisiin tietojen perusteella.

mallien vertailut

suhteellisella kerroinmallilla on hyvin erilainen rakenne kuin kolmella muulla mallilla ja myös erilainen taustalla oleva merkitys. Huomaa , että verrannollisen kertymämallin viiteluokan koko vaihtelee k {\displaystyle k}

k

, koska Y ≤ k {\displaystyle Y\leq k}

{\displaystyle Y\leq k}

verrataan y > k {\displaystyle y>k}

{\displaystyle YK}

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *