順序データ

順序データの構造を記述するために使用できるいくつかの異なるモデルがあります。 モデルの4つの主要なクラスは以下で説明され、それぞれが確率変数Y{\displaystyle Y}

Y

に対して定義され、レベルはk=1,2,…,q{\displaystyle k=1,2,\dots,q}

{\displaystyle k=1,2,\dots,q}

で索引付けされている。

以下のモデル定義では、μ k{\displaystyle\mu_{k}}

\mu_{k}

とβ{\displaystyle\mathbf{\beta}}

\mathbf{\beta}

の値は、同じデータセットのすべてのモデルで同じではないが、同じデータセットのすべてのモデルで同じではないことに注意してください。表記法は、異なるモデルの構造を比較するために使用されます。

比例オッズモデル編集

順序データの最も一般的に使用されるモデルは、log⁡=log⁡=μ k+β T x{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}

{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}で定義される比例オッズモデルである。ここで、パラメータμ k{\displaystyle\mu_{k}}\mu_{k}

は順序データx{\displaystyle\mathbf{x}}

\mathbf{x}の基底分布を記述する。

は共変量であり、β{\displaystyle\mathbf{\beta}}

\mathbf{\beta}

は共変量の効果を記述する係数である。

このモデルは、σ k+β k T x{\displaystyle\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}

{\displaystyle\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}

の代わりにσ k+β K T x{\displaystyle\mu_{k}+\mathbf{\beta}_{k}T{T}\mathbf{x}}を使ってモデルを定義することによって一般化することができる。{k}+\mathbf{\beta}^{t}\mathbf{x}}

{\Displaystyle\mu_{k}+\mathbf{\beta}^{t}\mathbf{x}}

、これはモデルをノミナルデータ(カテゴリが自然順序付けを持たない)と順序データに適したものにする。 しかし、この一般化は、モデルをデータに適合させることをはるかに困難にする可能性があります。

Baseline category logit modelEdit

baseline category modelはlog⁡=σ k+β K T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}

{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}で定義される。}

このモデルはカテゴリに順序を課すものではないため、ノミナルデータと順序データに適用できます。

注既成概念にとmodelEdit

の順序付けられた既成概念モデル定義がすでにログ⁡=μ k+抽k β T x{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}}

{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}}

に譜のパラメータは制約される0=抽1≤抽2≤⋯≤抽q=1{\displaystyle0=\phi_{1}\leq\phi_{2}\leq\dots\leq\phi_{q}=1}

{\displaystyle0=\phi_{1}\leq\phi_{2}\leq\dots\leq\phi_{q}=1}

.

これはベースラインカテゴリーロジットモデルよりも節約性が高く、より専門化されたモデルである:∑k β{\displaystyle\phi_{k}\mathbf{\beta}}

{\displaystyle\phi_{k}\mathbf{\beta}}

はβ k{\displaystyle\mathbf{\beta}_{k}}

{\displaystyle\mathbf{\beta}_{k}}

順序付けられていないステレオタイプモデルは順序付けられたステレオタイプモデルと同じ形式を持つが、π k{\displaystyle\phi_{k}}

\phi_{k}

に課された順序はない。 このモデルは、公称データに適用することができます。

フィットスコアπ^k{\displaystyle{\hat{\phi}}_{k}}

{\displaystyle{\hat{\phi}}_{k}}

は、Y{\displaystyle Y}

Y

の異なるレベルを区別することがいかに簡単であるかを示していることに注意してください。 もしλ^k λ^k−1{\displaystyle{\hat{\phi}}_{k}\approx{\hat{\phi}}_{k-1}}

{\displaystyle{\hat{\phi}}_{k}\approx{\hat{\phi}}_{k-1}}

ならば、それは共変量x{\displaystyle\mathbf{x}}

\mathbf{x}

レベルk{\displaystyle k}

k

とk−1{\displaystyle k-1}

k-1

を区別するための多くの情報を提供しないが、それは必ずしも実際の値kであることを意味するものではない。 {\displaystyle k}

k

とk−1{\displaystyle k-1}

k-1

は遠く離れている。 そして、共変量の値が変化すると、その新しいデータに対して適合スコアσ^k{\displaystyle{\hat{\phi}}_{k}}

{\displaystyle{\hat{\phi}}_{k}}

and σ^k−1{\displaystyle{\hat{\phi}}_{k-1}}

{\displaystyle{\hat{\phi}}_{k-1}}

は遠く離れている可能性があります。

隣接圏logit modelEdit

隣接圏モデルはlog⁡=∑k+β K T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}

{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}T{t}\mathbf{x}}で定義される。最も一般的な形式であるが、agresti(2010)で「比例オッズ形式」と呼ばれるものは、log⁡=μ k+β t x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}^{t}\mathbf{x}}{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}t{t}\mathbf{x}}で定義される。 あるカテゴリから次のカテゴリへのシフトの確率をモデル化することは、それらのカテゴリの順序付けが存在することを意味するため、このモデ

隣接圏ロジットモデルは、β k=β(k−1){\displaystyle\mathbf{\beta}_{k}=\mathbf{\beta}(k-1)}

{\displaystyle\mathbf{\beta}_{k}=\mathbf{\beta}(k-1)}

というベースラインカテゴリーロジットモデルの特別な場合と考えることができる。 隣接圏ロジットモデルは、順序ステレオタイプモデルの特別な場合と考えることもでき、ここでρ k∈k−1{\displaystyle\phi_{k}\propto k−1}

{\displaystyle\phi_{k}\propto k-1}

、すなわちρ k{\displaystyle\phi_{k}}

\phi_{k}

は、データに基づいて推定されるのではなく、事前に定義されています。

モデル間の比較edit

比例オッズモデルは、他の三つのモデルとは非常に異なる構造を持ち、また、異なる基礎となる意味を持っています。 比例オッズモデルにおける参照カテゴリのサイズはk{\displaystyle k}

k

で変化することに注意してください。Y≤k{\displaystyle Y\leq k}

{\displaystyle Y\leq k}

はY>k{\displaystyle y>k}

{\displaystyle yk}

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です