統計の応用・余談

2018年NPBプロ野球の主要選手をクラスター分析してみた。

クラスター分析とは クラスター分析の種類・方法 クラスタ間の距離の選び方 距離の計算方法 2018年NPBの主要選手をクラスター分析する 概要 セ・リーグ打者のクラスター分析 パ・リーグ打者のクラスター分析 NPBの打者を別の距離の計算法を用いてクラスター…

2018年のMLB打者を主成分分析してみた。

主成分分析とは 2018年MLBの打者データを主成分分析 規定打席に到達した選手で再び主成分分析 主成分分析とは 主成分分析とは多くのデータのまとめる分析方法です。難しい言葉でいうと、複数の変数を1次式のデータに収縮させる事です。 本当は自学自習の為に…

MLBとコンカフェに通うヲタクで理解する相関係数

相関係数とは2つの値の関連の大きさを測る尺度です。一般的には大きい正の値になるほど正の相関を持ち、大きい負の値に成る程負の相関を持ちます。比例と反比例みたいな感じ。実は何種類かあるんです。 Pearsonの相関係数 正の相関~解釈添え~ 負の相関 相関…

MLB2018の安打数は正規分布を描いているのかQ-Qplotで考察する

今回はRを用いてQ-Qplotに関する話をしたいと思います。Q-Qplotは準一級の範囲だと思います。統計好きの人が問題にしたそうな内容ですよね。知りませんが。 Q-Qplotとは? Q-Qplotの実例 得られたデータが正規分布している時のイメージ step1 得られた分布を…

青木宣親から学ぶ 野球は統計学で説明できるのか?~2項分布編~

みなさんは青木宣親選手をご存知でしょうか? Noriこと青木宣親選手は日本だけでなくMLBでも活躍できた日本の野球史に名を残す現役の名選手です。 青木選手は1982年に宮崎県日向市で産声を上げました。 それからというものの、早稲田時代ではリーグ4連覇を果…