ロジスティック回帰をロジスティック分布とジグモイド関数とロジスティック関数を経てわかりやすく解説

ポチップ

ロジスティック分布とジグモイド関数（pythonでも用いる）と各性質の証明

ロジスティック回帰を理解するために、ロジスティック分布を学習します。ロジスティック分布は連続型確率変数の１種です。この章では名著『現代数理統計学の基礎』の章末問題を用いてロジスティック分布の一般形の期待値と分散を導出する流れを学びます。まずはロジスティック分布の持つ各性質を調べていきましょう。

現代数理統計学の基礎共立講座数学の魅力

著:久保川達也, 著:新井仁之, 著:小林俊行, 著:斎藤毅, 著:吉田朋広

ポチップ

ロジスティック分布が確率密度関数であることの証明

ロジスティック分布の持ついくつかの性質を調べます。

この関数が確率密度関数としての性質を満たしているか？を調べます。

ジグモイド関数をロジスティック分布の分布関数として計算！微分の関係も大切

次にロジスティック分布のy軸についての対称性とジグモイド関数の導出に関する問題を考えます。

ジグモイド関数とはロジスティック分布の分布関数のことです。

ロジスティック分布とロジスティック関数は異なるものなのでご注意ください。

ジグモイド関数は学力向上などで使われるS字カーブの別名とも言われています。

ロジスティック分布と標準一様分布

ここではロジスティック分布の変数変換の問題で一様分布が絡む問題を考えます。結論でロジスティック分布に似た結論が出てくることにご注目ください。

この問題は素直な問題ですね。久保川先生の模範解答と異なる方法で解いていますね。

僕は技巧的な方法は思いつかなかったので、分布関数を経由する方法で解きました。

ロジスティック分布とハザード関数

次にロジスティック分布の変数変換ならびにハザード関数を求めてみます。ハザード関数の問題での結論ではジグモイド関数が出てくることにご注目ください。

とても不思議な結論でしたね。

ロジスティック分布の一般化

最後の小問はロジスティック分布を一般化させる問題です。

『現代数理統計学の基礎』の原題には注釈がありませんが、ロジスティック分布においてσは正であることにご注意ください。

σが正であることは、正規分布などでもお馴染みのルールですね。

図06のσ>0の時の答えがロジスティック分布の一般式になります。次の章の図07に詳細を載せます。

ロジスティック分布の積率母関数から期待値や分散を導出

この章ではロジスティック分布の期待値と分散を導出します。積率母関数を経由する流れで計算していきます。まずはロジスティック分布を復習として紹介します。

ロジスティック分布の積率母関数

ここでは特殊な置換積分を行います。逆にいうとこの置換積分を知らないと処理不能になります。

機械学習の分野ではお馴染みの文字の置き換えです。

最後はベータ関数に帰着させて終了ですね！

ベータ関数についての記事はこちらで復習できますのでご確認ください。

ロジスティック分布の期待値

積率母関数が求まりましたので次の手順で期待値を求めます。

①Xの期待値を求める。
②変数変換を用いてYの期待値を求める。

Xの期待値が0なのは図02の解答の図からも察することはできますね！ですのでこの結果は覚えやすいです！

ロジスティック分布の分散

ロジスティック回帰の記事が今日中に書けそうです。ロジスティック分布の分散の導出がかなり難しく手こずりました。ディガンマ関数とゼータ関数が繋がるようで感動しました。だからπの２乗が出てくるのかと納得しました。ζ(2)が出てくる箇所も記事に書く予定です。オイラー定数γはガンマ関数由来かも。
— 志田龍太郎 (@nananairu7) February 18, 2024

ロジスティック分布の分散の導出は難しい

このtweetにあるように、ロジスティック分布で難しいのは分散の導出です。できるだけ丁寧に説明していきます。

オイラー定数γが絡んでいるようですね。

その通りです。ディガンマ関数の周辺はとても難易度が高いです。オイラー定数γに関する参考図書『オイラーの定数ガンマ ―γで旅する数学の世界』を紹介します。

オイラーの定数ガンマ ―γで旅する数学の世界―

著:Julian Havil, 翻訳:新妻弘

ポチップ

ロジスティック分布の分散でまさかのζ(2)が出てくるなんてとても面白いですよね！

この章の最後にロジスティック分布の期待値と分散の結果をまとめます。

ロジスティック関数から考えるロジスティック回帰（ロジットモデルとオッズ比の関係）

ここからロジスティック回帰に入ります。まずはなぜロジスティック回帰が必要なのかを考えます。

ジグモイド関数の正体

図12のようなyの値が0か1から成るデータでは単回帰分析よりもS字カーブのようなジグモイド関数が登場する回帰分析を行った方がよりデータにフィットする結果が得られそうです。

この時のジグモイド関数をロジスティック関数といいます。

このわかりやすい図は『統計学大百科事典仕事で使う公式・定理・ルール113』を参考にさせていただきました。

統計学大百科事典仕事で使う公式・定理・ルール113

著:石井俊全