順序データの構造を記述するために使用できるいくつかの異なるモデルがあります。 モデルの4つの主要なクラスは以下で説明され、それぞれが確率変数Y{\displaystyle Y}
に対して定義され、レベルはk=1,2,…,q{\displaystyle k=1,2,\dots,q}
で索引付けされている。
以下のモデル定義では、μ k{\displaystyle\mu_{k}}
とβ{\displaystyle\mathbf{\beta}}
の値は、同じデータセットのすべてのモデルで同じではないが、同じデータセットのすべてのモデルで同じではないことに注意してください。表記法は、異なるモデルの構造を比較するために使用されます。
比例オッズモデル編集
順序データの最も一般的に使用されるモデルは、log=log=μ k+β T x{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}
は順序データx{\displaystyle\mathbf{x}}
は共変量であり、β{\displaystyle\mathbf{\beta}}
は共変量の効果を記述する係数である。
このモデルは、σ k+β k T x{\displaystyle\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}
の代わりにσ k+β K T x{\displaystyle\mu_{k}+\mathbf{\beta}_{k}T{T}\mathbf{x}}を使ってモデルを定義することによって一般化することができる。{k}+\mathbf{\beta}^{t}\mathbf{x}}
、これはモデルをノミナルデータ(カテゴリが自然順序付けを持たない)と順序データに適したものにする。 しかし、この一般化は、モデルをデータに適合させることをはるかに困難にする可能性があります。
Baseline category logit modelEdit
baseline category modelはlog=σ k+β K T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}
このモデルはカテゴリに順序を課すものではないため、ノミナルデータと順序データに適用できます。
注既成概念にとmodelEdit
の順序付けられた既成概念モデル定義がすでにログ=μ k+抽k β T x{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}}
に譜のパラメータは制約される0=抽1≤抽2≤⋯≤抽q=1{\displaystyle0=\phi_{1}\leq\phi_{2}\leq\dots\leq\phi_{q}=1}
.
これはベースラインカテゴリーロジットモデルよりも節約性が高く、より専門化されたモデルである:∑k β{\displaystyle\phi_{k}\mathbf{\beta}}
はβ k{\displaystyle\mathbf{\beta}_{k}}
。
順序付けられていないステレオタイプモデルは順序付けられたステレオタイプモデルと同じ形式を持つが、π k{\displaystyle\phi_{k}}
に課された順序はない。 このモデルは、公称データに適用することができます。
フィットスコアπ^k{\displaystyle{\hat{\phi}}_{k}}
は、Y{\displaystyle Y}
の異なるレベルを区別することがいかに簡単であるかを示していることに注意してください。 もしλ^k λ^k−1{\displaystyle{\hat{\phi}}_{k}\approx{\hat{\phi}}_{k-1}}
ならば、それは共変量x{\displaystyle\mathbf{x}}
レベルk{\displaystyle k}
とk−1{\displaystyle k-1}
を区別するための多くの情報を提供しないが、それは必ずしも実際の値kであることを意味するものではない。 {\displaystyle k}
とk−1{\displaystyle k-1}
は遠く離れている。 そして、共変量の値が変化すると、その新しいデータに対して適合スコアσ^k{\displaystyle{\hat{\phi}}_{k}}
and σ^k−1{\displaystyle{\hat{\phi}}_{k-1}}
は遠く離れている可能性があります。
隣接圏logit modelEdit
隣接圏モデルはlog=∑k+β K T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}
隣接圏ロジットモデルは、β k=β(k−1){\displaystyle\mathbf{\beta}_{k}=\mathbf{\beta}(k-1)}
というベースラインカテゴリーロジットモデルの特別な場合と考えることができる。 隣接圏ロジットモデルは、順序ステレオタイプモデルの特別な場合と考えることもでき、ここでρ k∈k−1{\displaystyle\phi_{k}\propto k−1}
、すなわちρ k{\displaystyle\phi_{k}}
は、データに基づいて推定されるのではなく、事前に定義されています。
モデル間の比較edit
比例オッズモデルは、他の三つのモデルとは非常に異なる構造を持ち、また、異なる基礎となる意味を持っています。 比例オッズモデルにおける参照カテゴリのサイズはk{\displaystyle k}
で変化することに注意してください。Y≤k{\displaystyle Y\leq k}
はY>k{\displaystyle y>k}