2019-03-01から1ヶ月間の記事一覧

2018年のMLB打者を主成分分析してみた。

主成分分析とは 2018年MLBの打者データを主成分分析 規定打席に到達した選手で再び主成分分析 主成分分析とは 主成分分析とは多くのデータのまとめる分析方法です。難しい言葉でいうと、複数の変数を1次式のデータに収縮させる事です。 本当は自学自習の為に…

MLBとコンカフェに通うヲタクで理解する相関係数

相関係数とは2つの値の関連の大きさを測る尺度です。一般的には大きい正の値になるほど正の相関を持ち、大きい負の値に成る程負の相関を持ちます。比例と反比例みたいな感じ。実は何種類かあるんです。 Pearsonの相関係数 正の相関~解釈添え~ 負の相関 相関…

MLB2018の安打数は正規分布を描いているのかQ-Qplotで考察する

今回はRを用いてQ-Qplotに関する話をしたいと思います。Q-Qplotは準一級の範囲だと思います。統計好きの人が問題にしたそうな内容ですよね。知りませんが。 Q-Qplotとは? Q-Qplotの実例 得られたデータが正規分布している時のイメージ step1 得られた分布を…

青木宣親から学ぶ 野球は統計学で説明できるのか?~2項分布編~

みなさんは青木宣親選手をご存知でしょうか? Noriこと青木宣親選手は日本だけでなくMLBでも活躍できた日本の野球史に名を残す現役の名選手です。 青木選手は1982年に宮崎県日向市で産声を上げました。 それからというものの、早稲田時代ではリーグ4連覇を果…

2項分布の話

2項分布は数学か賭博が好きな方ならお馴染みの分布でしょう。気長に聞いてください。 ベルヌーイ分布 2項分布 中心極限定理 ベルヌーイ分布 2項分布について説明する為に、まずベルヌーイ分布(試行)について知っておくと理解が円滑に進むでしょう。ベルヌー…

正規分布と中心極限定理について

to 正規分布は統計を学んでいく上で最も重要な連続分布であると結論付けられるでしょう。なぜならば、中心極限定理という定理によって正規分布以外の分布でも標本数nが大きければ標本の平均値の分布は正規分布に近似できるという側面を正規分布は抱えている…

研究デザイン(コホート研究・症例対照研究・横断研究)

研究について漠然と知っている方も多いと思いますが、研究の種類は多岐に渡ります。今回はその中でも最も有名な、時間軸に沿って分ける事で区別されるコホート研究・症例対照研究・横断研究の3つについて説明していきたいと思います。 コホート研究 症例対照…

ROC曲線とは?

前回の感度と特異度の話を発展させていきます。使う表は引き続き10人の癌マーカーの数値を使います。tmduto.hatenablog.com 罹患or非罹患 マーカーA濃度 罹患者 0.19 罹患者 0.17 非罹患者 0.17 罹患者 0.13 非罹患者 0.12 罹患者 0.09 非罹患者 0.07 非罹患…

感度・特異度とかの話(仮)

現在の日本の医療は西洋医学を主軸としている訳ですが、東洋医学と比較して幾つか特徴があります。例えば西洋医学では風邪を引いた患者にずっと同じ風邪薬が処方されるのに対して、東洋医学では風邪の引き始めやピーク・引き終わりは異なる状態と考えて別の…