ロジスティック回帰は、従属変数が二分法(バイナリ)の場合に実施する適切な回帰分析です。 すべての回帰分析と同様に、ロジスティック回帰は予測分析です。
ロジスティック回帰は解釈が難しい場合がありますが、Intellectus Statisticsツールを使えば、簡単に分析を行うことができ、出力をわかりやすく解釈してくれます。
肺がんになる確率 (はい vs. いいえ) は、体重が 1 ポンド増えるごとに、また、1 日の喫煙本数が 1 パック増えるごとに、どのように変化するでしょうか。
体重、カロリー摂取量、脂肪摂取量、および年齢は、心臓発作を起こす確率 (はい vs. いいえ) に影響を与えますか
二項ロジスティック回帰の主な前提条件
- 従属変数は二分性でなければなりません (例…存在 vs. 不存在)。 これは、連続予測変数を標準化スコアに変換して、-3.29以下または3.29以上の値を除去することで評価できます。 これは予測変数間の相関行列によって評価できる。 Tabachnick and Fidell (2013)は、独立変数間の相関係数が0.90未満であれば仮定は満たされると示唆しています。
ロジスティック回帰分析の中心は、イベントの対数オッズを推定する作業です。 数学的には、ロジスティック回帰は次のように定義される重回帰関数を推定します。
logit(p)
for i = 1…n .
オーバーフィッティング。 ロジスティック回帰分析のモデルを選択する際、もう一つの重要な考慮点はモデルの適合性です。 ロジスティック回帰モデルに独立変数を追加すると、常に対数オッズで説明される分散の量が増加します(通常、R²で表されます)。 しかし、モデルにどんどん変数を追加していくと、オーバーフィッティングとなり、モデルが適合したデータ以外のモデルの一般性が低下してしまいます。
R2の報告。 バイナリーロジスティック回帰では、数多くの擬似R2値が開発されています。 これらは、人為的に高かったり低かったりする原因となる多くの計算上の問題があるため、細心の注意を払って解釈する必要があります。 より良い方法は、利用可能な適合度テストのいずれかを提示することです。Hosmer-Lemeshowは、カイ二乗テストに基づく適合度の一般的な尺度です。