志田龍太郎

東京大学修士→30代セミFIRE元数学教諭(麻布高など指導)/アクチュアリー数学と統計検定1級(2024年に再挑戦)/数検1級→高3・漢検1級→教諭時代に合格/ブログ+SNS運営/現在逆手懸垂の訓練中/AmazonAssociates連携

2024/2/7

主成分分析での固有値の役割を行列の考えを用いてわかりやすく解説

多変量解析の1つの山場である主成分分析について解説します。 判別分析よりも数段難しい印象です。なぜこんなに難しく感じるのでしょうか? 線型代数の知識を知っている状態で解説している書籍が多い理由と、次元を削減していく内容なので行列処理で理解していかないと理解が難しくなる理由があるためです。 今回の主成分分析は線型代数の固有値の知識をかなり用います。線型代数の知識について不安な方は、数学検定1級の記事をご覧になってください。具体的な学習法が書かれています。 https://www.muscle-castle. ...

2024/2/3

判別分析を行列表示と具体的な説明を通してわかりやすく解説

母集団との距離の考えを用いて、サンプル(本来考えたい状況)がどちらの母集団に属するかを判別する解析法を判別分析といいます。 どちらの母集団になるのかをきちんと数学的に考えていくのですね。ただまったくどうやって判別していくのかが見えません。 たとえばあるXさんがいたとします。XさんはAグループとBグループのどちらに属しているかを考えます。通常の感覚だと、XさんとAグループの距離感と、XさんとBグループの距離感を考えて、距離が短い方のグループに属していると判断ができますよね。これと同じことを多変量解析で考えま ...

2024/2/1

数量化1類の重回帰分析と異なる点を理解して活用できるようにする方法

前回の記事で重回帰分析が終わりました。記事をアップしたのが昨日でしたが、思い返すと回帰分析の2記事(単回帰分析と重回帰分析)だけでも相当な量がありました。 今回は数量化1類ですね。名前からしてなんだか難しそうなイメージですが、実際はどうでしょう? 数量化1類は重回帰分析とほぼ変わらない内容です。重回帰分析と異なる点を意識すれば思ったよりも早い段階で活用できる段階まで到達できます。 重回帰分析があれだけの学習量だったのには理由があったのですね。 今回の数量化1類の例などのアイデアのヒントは『多変量解析法入門 ...

2024/2/1

重回帰分析を行列表示から始めて全公式をわかりやすく解説

前回の記事で単回帰分析を詳しく解説しましたので、今回は重回帰分析になります。とても難しいのですが、多変量解析の中では2番目に登場する内容です。単回帰分析よりも精密な分析が可能です。 重回帰分析は便利そうなのは伝わりました。では、どのように難しいのですか? 重回帰分析は重回帰モデルを行列表示して進めていくと、ほとんどが単回帰分析のときと変わらないとお気づきになると思います。しかし、テコ比などの具体的な計算となると、単回帰分析とは計算量が大きく異なり難易度が増します。 本記事では重回帰分析の内容をほぼすべて消 ...

2024/1/30

単回帰分析のやり方を行列表示で説明し全公式をわかりやすく導出

多変量解析の話題の第一弾として、単回帰分析を学びます。回帰分析は多変量解析の書籍の始めに登場するものです。多変量解析は色々な種類があり、これらを使いこなせる方は分析が上手い方という認識です。 僕が最初に単回帰分析を知ったのは数学検定1級を受けるために『確率統計キャンパス・ゼミ』で統計を勉強していたときでした。数学検定1級の1次検定でも「回帰直線を求めよ」という問題が出るためです。 単回帰分析はどのような分析手法なのですか? 説明変数xを用いて目的変数yを予測するためのものです。単回帰分析では回帰直線という ...

2024/1/27

カイ2乗検定の例として同等性検定・独立性の検定・正確性の検定・マクネマー検定をわかりやすく解説

前回で勉強したカイ2乗検定(適合度の検定)を基本として、クロス表(分割表)を利用するさまざまなカイ2乗検定を紹介します。理解としてつながる順番(同等性検定・独立性の検定・正確性の検定・マクネマー検定)で解説していきます。 適合度の検定で、学んだピアソンのカイ2乗検定統計量がカイ2乗分布に従うことを次の記事でご確認ください。 今回勉強する、同等性検定・独立性の検定・正確性の検定・マクネマー検定などではカイ2乗分布の自由度に関する考察が大事になります。その都度、自由度はいくつになるのか?を一緒に考えていきまし ...

2024/1/25

カイ2乗検定(適合度検定)の計算根拠をわかりやすく解説

カイ2乗分布が関係するピアソンの適合度検定を勉強します。 メンデルの法則などで有名な検定ですね。実生活での応用が多いと聞きます。 統計検定1級のバイブルになりつつある久保川先生の新作『データ解析のための数理統計入門』では、適合度検定で1つの章になるほど、実社会においてとても大事な検定のお話です。 身近な例では、適合度の検定はどのような状況で使えますか? 例えば理想的な6面サイコロはどの目も出る確率は等しく1/6のはずですよね。複数回の実験した結果、1〜6の目が出る確率が不均一だったとします。このサイコロは ...

2024/1/24

多変量正規分布の期待値や分散や分散共分散行列から独立性や周辺分布の公式までわかりやすく解説

統計検定1級で登場する頻出度が高くて最も難しい分布は多変量正規分布です。 多変量正規分布は主成分分析などの多変量解析にもつながる重要な分布ですが、とても難しくて挫折してしまいました。どのような順で勉強しなおしたら良いか教えてください。 多変量正規分布はアクチュアリー数学でも統計検定1級では頻出です。しかし参考書によって扱われている範囲が異なり、勉強していなかった部分が出てしまったとなりかねない分布です。 https://www.muscle-castle.com/standard-normal-distr ...

2024/1/21

f検定とウェルチの検定などを用いて母平均の差の区間推定を行う5つの流れ

今回は2つの母集団について扱います。3つ以上の母集団については分散分析の話になり難易度が上がるため、また後日に取り上げていこうと思います。 今回はどのようなことを調べていくのですか? 2つの母集団の母平均の差の区間推定を行います。そのときの区間推定の手法は複数あり、どのような時にどの手法を用いるか?に関して場合分けが生じます。 https://twitter.com/nananairu7/status/1748627440103276553 母平均の差の区間推定にはいろんな種類がある 母分散が等分散か?に ...

2024/1/18

二項分布の母比率の区間推定で信頼区間を求めるときに精密法でF分布を用いる理由と正規分布を用いた近似法の計算式を丁寧に解説

本記事はアクチュアリー数学で最も難易度が高い公式である二項母集団の母比率(母百分率や母不良率ともいう)の区間推定の解説をします。難易度が高いため、F分布の内容をおさえた上でお読みください。 https://www.muscle-castle.com/f-distribution-expected-value-variance/ 今回はF分布がメイン級の扱いです 二項母集団の母比率の区間推定では近似法と精密法があります。 精密法は公式がたくさんありすぎて、丸暗記をするのはとても難しいです。何か覚え方のコツな ...