機械学習勉強会 20170622

created at 2017/07/19 18:51:45
統計学入門 (基礎統計学Ⅰ)

統計学入門 (基礎統計学Ⅰ)

  • 東京大学教養学部統計学教室
  • 東京大学出版会

今は統計学入門
週一で1時間程度各自でもくもくして、章末問題で同期を取るという方法でやってみている。

今回の内容

第2章 1次元のデータ

2.3 散らばりの尺度

  • 散らばり (dispersion)の尺度: 分布の形状を示す指標
    • レンジ (range)
      • 分布の存在する範囲の長さ。分布の端から端までの距離
      • $R = {\rm max}(x_1, x_2, \dots, x_n)-{\rm min}(x_1, x_2, \dots, x_n)$
    • 四分位偏差 (quartile deviation, semi-interquartile range)
      • 第3四分位点と第1四分位点の隔たりの半分
      • レンジを改良したもの。異常値の影響を受けにくい
      • $Q = \frac{1}{2}(Q_3-Q_1)$
    • 平均偏差 (mean deviation)
      • 各観測地が平均からどれだけ離れているか(偏差 deviation)についての平均
      • $d=\frac{1}{n}\left(|x_1-\overline{x}|+|x_2-\overline{x}|+\dots+|x_n-\overline{x}|\right)$
    • 分散 (variance)
      • $S^2=\frac{1}{n}\sum(x_i-\overline{x})^2$
    • 標準偏差 (standard deviation)
      • $S = \sqrt{S^2}$
    • 変動係数 coefficient of variation
      • 分布の中心が著しく異なる場合に分散(標準偏差)では散らばり具合を比較できない
      • $C.V. = S_x/\overline{x}$
    • 標準得点 (standard score)
      • 分布を一次変換して平均を0、分散を1とした(標準化 standardization)分布
      • $z_i = \frac{x_i-\overline{x}}{S_x}$
      • **Z得点 (Z score)
    • 偏差値得点
      • 分布を一次変換して平均を50、標準偏差を10とした分布
      • $T_i = 10z_i + 50$

練習問題

所感

  • esaの数式機能めっちゃ便利 :heart_eyes:
  • でもあんなに書いたのにTeXはすっかり全部忘れてる :disappointed:

次回