データの分析
データの分析
変量,データ
平均値
$\overline{x}=\frac{1}{n}(x_1+x_2+\cdots+x_n)$
中央値,最頻値
範囲
第1四分位数$Q_1$ : 下位のデータの中央値
第2四分位数$Q_2$
第3四分位数$Q_3$ : 上位のデータの中央値
四分位範囲 : $Q_3-Q_1$
四分位偏差 : $\frac{Q_3-Q_1}{2}$
箱ひげ図
分散 : $s^2=\frac{1}{n}{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2}$ 標準偏差 : $s=\sqrt{\frac{1}{n}{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2}}$
xのデータの分散=$x^2$のデータの平均値-$(xのデータの平均値)^2$
散布図
正の相関関係,負の相関関係,相関関係がない
共分散
相関関係
$r=\frac{s_{xy}}{s_xs_y}=\frac{\frac{1}{n}{(x_1-\overline{x})(y_1-\overline(y))+\cdots+(x_n-\overline{x})(y_n-\overline{y})}}{\sqrt{\frac{1}{n}{(x_1-\overline{x})^2+\cdots+(x_n-\overline{x})^2}}\sqrt{\frac{1}{n}{(y_1-\overline{y})^2+\cdots+((y_n-\overline{y})^2}}}$
$=\frac{(x_1-\overline{x})(y_1-\overline{y})+\cdots+(x_n-\overline{x})(y_n-\overline{y})}{\sqrt{{(x_1-\overline{x})^2+\cdots+(x_n-\overline{x})}{(y_1-\overline{y})+\cdots+(y_n-\overline{y})}}}$
$-1\leq r\leq1$
表計算ソフト