データの分析

データの分析

変量,データ

平均値
$\overline{x}=\frac{1}{n}(x_1+x_2+\cdots+x_n)$

中央値,最頻値

範囲
第1四分位数$Q_1$ : 下位のデータの中央値
第2四分位数$Q_2$
第3四分位数$Q_3$ : 上位のデータの中央値
四分位範囲 : $Q_3-Q_1$
四分位偏差 : $\frac{Q_3-Q_1}{2}$

箱ひげ図

分散 : $s^2=\frac{1}{n}{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2}$ 標準偏差 : $s=\sqrt{\frac{1}{n}{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2}}$

xのデータの分散=$x^2$のデータの平均値-$(xのデータの平均値)^2$

散布図
正の相関関係,負の相関関係,相関関係がない

共分散
相関関係
$r=\frac{s_{xy}}{s_xs_y}=\frac{\frac{1}{n}{(x_1-\overline{x})(y_1-\overline(y))+\cdots+(x_n-\overline{x})(y_n-\overline{y})}}{\sqrt{\frac{1}{n}{(x_1-\overline{x})^2+\cdots+(x_n-\overline{x})^2}}\sqrt{\frac{1}{n}{(y_1-\overline{y})^2+\cdots+((y_n-\overline{y})^2}}}$ $=\frac{(x_1-\overline{x})(y_1-\overline{y})+\cdots+(x_n-\overline{x})(y_n-\overline{y})}{\sqrt{{(x_1-\overline{x})^2+\cdots+(x_n-\overline{x})}{(y_1-\overline{y})+\cdots+(y_n-\overline{y})}}}$

$-1\leq r\leq1$

表計算ソフト

関連記事

コメント