前回に続き、講座のためにRを使っている。
今回も忘れないようにメモを残す。
回帰分析をする
summary(lm(目的変数 ~ 説明変数))
こいつを実行すると、以下のような結果が出る
Call:
lm(formula = obj1 ~ exp1)
Residuals:
Min 1Q Median 3Q Max
-92673 -16813 -3670 13049 152624
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.572e+04 1.677e+03 27.26 <2e-16 ***
exp1 3.300e-03 2.035e-04 16.22 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 25550 on 998 degrees of freedom
Multiple R-squared: 0.2085, Adjusted R-squared: 0.2077
F-statistic: 263 on 1 and 998 DF, p-value: < 2.2e-16
この中の「Coefficients」にある「Intercept」が、「y = ax + b」の「b」の部分になる。
そして、今回の説明変数「exp1」の横にある数字が「a」の部分になる。
つまり、線形回帰の式としては
y = 3.300e-03 * x + 4.572e+04
という式になる。
また、決定係数(R2)は「Multiple R-squared」の値なので、今回なら
0.2085
になり、今回の説明変数は微妙という事になる。
まとめ
機械学習の勉強のために数学を勉強し始めて、とりあえず数学が一段落(勉強した端から忘れていくが…)したので、統計学に手を出しつつ遂に機械学習への第一歩を進もうかという段階。
統計のためにRをやっているが、実は後々の事を考えるとpythonでやった方がpythonの勉強にもなって一石二鳥なのではと考え始めたり…。
まずはpythonの環境構築とやらから調べてみるかなぁ。
コメント