Date ordinale

există mai multe modele diferite care pot fi utilizate pentru a descrie structura datelor ordinale. Patru clase majore de model sunt descrise mai jos, fiecare definită pentru o variabilă aleatoare Y {\displaystyle Y}

Y

, cu niveluri indexate de k = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}

{\displaystyle k=1,2,\dots ,q}puncte, Q}

.

rețineți că, în definițiile modelului de mai jos, valorile lui X {\displaystyle \mu _{k}}

\mu _{k}

și X {\displaystyle \mathbf {\beta}}

\mathbf{\beta}

nu va fi aceeași pentru toate modelele pentru același set de date, dar notația este utilizată pentru a compara structura diferitelor modele.

cote proportionale modelEdit

modelul cel mai frecvent utilizat pentru datele ordinale este modelul cotelor proportionale, definit de log = log x + log T x {\displaystyle \log \left = \log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle\log\left=\log\left=\mu _{K} + \mathbf {\Beta} ^ {t} \ mathbf {x}}

unde parametrii k {\displaystyle \ mu _{k}}

\ mu _ {k}

descriu distribuția de bază a datelor ordinale, x {\displaystyle \ mathbf {x}}

\ mathbf {x}

sunt covariatele și {\displaystyle \mathbf {\beta}}

\mathbf{\beta}

sunt coeficienții care descriu efectele covariatelor.

acest model poate fi generalizat prin definirea modelului folosind X {\displaystyle \mu _{k} + \mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } _{K}^{T}\mathbf {x} }

în loc de X X {\displaystyle \mu _{k}+\mathbf {\beta } ^{t}\mathbf {x} }

{\displaystyle \mu _{k} + \mathbf {\beta } ^{t}\mathbf {x} }

, iar acest lucru ar face modelul potrivit pentru datele nominale (în care categoriile nu au o ordonare naturală), precum și date ordinale. Cu toate acestea, această generalizare poate face mult mai dificilă adaptarea modelului la date.

Baseline category logit modelEdit

modelul de categorie baseline este definit de log-uri_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_log_ beta} _{k}^{t} \mathbf {x}}

acest model nu impune o ordonare categoriilor și astfel poate fi aplicat datelor nominale, precum și datelor ordinale.

Ordonat stereotip modelEdit

ordonat stereotip model este definit de jurnal ⁡ = μ k + ϕ k β T x {\displaystyle \log \stânga=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \stânga=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

în cazul în care scorul parametri sunt limitate, astfel încât 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \punctele \leq \phi _{q}=1}

{\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \punctele \leq \phi _{q}=1}

.

acesta este un model mult mai parsimonios și mai specializat decât modelul logit de categorie de bază: XV k {\displaystyle \phi _{k}\mathbf {\beta } }

{\displaystyle \phi _{k}\mathbf {\beta } }

poate fi considerat ca fiind similar cu cel al lui\Beta} _{k}}

{\displaystyle\mathbf {\beta} _{k}}

.

modelul stereotip neordonat are aceeași formă ca și modelul stereotip ordonat, dar fără ordonarea impusă pe k {\displaystyle \phi _{k}}

\phi _{k}

. Acest model poate fi aplicat datelor nominale.

notați că scorurile montate, la fel ca și scorurile montate, la fel ca și scorurile montate, la fel ca și scorurile montate, la fel ca și scorurile montate, la fel ca și scorurile montate, la fel ca și scorurile montate, la fel ca și scorurile montate, la fel ca și scorurile montate, la fel ca și scorurile montate, la fel caYy . În cazul în care K − 1 {\displaystyle {\hat {\phi }}_{k}\aprox {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k}\aprox {\hat {\phi }}_{k-1}

atunci aceasta indică faptul că setul curent de date pentru covariabile x {\displaystyle \mathbf {x}}

\mathbf {x}

nu oferă prea multe informații pentru a distinge între nivelurile k {\displaystyle k}

k

și K − 1 {\displaystyle K-1}

k-1K-1imedia.org/api/rest_v1/media/math/render/svg/c3c9a2c7b599b37105512c5d570edc034056dd40″ style=”vertical-align: -0.338ex; width:1.211ex; height:2.176ex;” alt=”k-1K-1″>

, dar asta nu înseamnă neapărat că valorile reale k {\displaystyle k}

k

și k − 1 {\displaystyle k-1}

k-1

sunt departe unul de altul. Și dacă valorile covariatelor se schimbă, atunci pentru aceste noi date, scorurile potrivite sunt de la: x ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

și X ^ K − 1 {\displaystyle {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{K-1}}

ar putea fi apoi departe.

Adiacente categorii logit modelEdit

adiacente categorii model este definit de jurnal ⁡ = μ k + β k T x {\displaystyle \log \stânga=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \log \stânga=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

deși cea mai comună formă, prevăzute în Agresti (2010) ca „proporțional șansele forma” este definit de jurnal ⁡ = μ k + β T x {\displaystyle \log \stânga=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \stânga=\mu _{k}+\mathbf {\beta } ^{T} \ mathbf {x} }

acest model poate fi aplicat numai datelor ordinale, deoarece modelarea probabilităților deplasărilor de la o categorie la următoarea categorie implică existența unei ordonări a acestor categorii.

modelul logit al categoriilor adiacente poate fi gândit ca un caz special al modelului logit de categorie de bază, în cazul în care X = X ( K − 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

{\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

{\displaystyle \ mathbf {\beta} _ {k} = \ mathbf {\beta} (k-1)}

. Modelul logit al categoriilor adiacente poate fi, de asemenea , gândit ca un caz special al modelului stereotip ordonat, în cazul în care x − 1 {\displaystyle \phi _{k}\propto k-1}

{\displaystyle \phi _{k}\propto k-1}

, adică distanțele dintre X-1 {\displaystyle \phi _{k}}

\Phi _{k}

sunt definite în avans, mai degrabă decât estimate pe baza datelor.

comparații între modeledit

modelul cotelor proporționale are o structură foarte diferită față de celelalte trei modele și, de asemenea, o semnificație subiacentă diferită. Rețineți că dimensiunea categoriei de referință din modelul cotelor proporționale variază cu k {\displaystyle k}

k

, deoarece y XQC {\displaystyle Y\leq k}

{\displaystyle y\LEQ k}

este comparat cu y > k {\displaystyle y>k}

{\displaystyle YK}

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *