16  Regresi Linear

16.1 Regresi Linear (Manual)

\[ \hat Y=bX+a \]

dimana

  • \(\hat Y\) adalah skor prediksi \(Y\) berdasarkan nilai \(X\) yang diketahui

  • \(b\) adalah slope (kemiringan garis)

  • \(X\) adalah prediktor

  • \(a\) merupakan titik potong garis terhadap sumbu \(y\)

X

Y

X_sq

Y_sq

XY

0.06

466.40

0.00

217,530.55

27.28

-2.25

306.75

5.05

94,093.35

-689.04

-2.13

496.64

4.53

246,653.08

-1,056.90

-1.44

298.44

2.08

89,067.21

-430.53

-0.42

349.77

0.18

122,338.07

-147.15

-1.44

463.17

2.07

214,528.86

-666.78

-1.57

441.98

2.48

195,347.29

-696.08

-2.23

322.59

4.96

104,065.86

-718.61

-3.52

327.42

12.36

107,206.67

-1,151.22

-1.36

380.41

1.85

144,710.47

-517.39

Berdasarkan data dapat diketahui

  • \(\Sigma X\) atau jumlah skor pada variabel prediktor (\(X\)) adalah \(-16.3\),

  • \(\Sigma Y\) atau jumlah skor variabel penjelas (\(Y\)) adalah \(3853.57\)

  • \(\Sigma X^2\) atau jumlah setiap nilai \(X\) dikuadratkan adalah \(35.56\)

  • \(\Sigma Y^2\) atau jumlah setiap nilai \(Y\) dikuadratkan adalah \(1535541\)

  • \(\Sigma XY\) atau jumlah hasil kali \(X\) dan \(Y\) adalah \(-6046.42\)

\[ b=\frac{\Sigma XY-(\Sigma X \Sigma Y/n)}{\Sigma X^2-[(\Sigma X)^2/n]} \]

\[ b=\frac{-6046.42-[(-16.3 \times 3853.57)/10]}{35.56-[(-16.3)^2/10]} \]

\[ b=\frac{234.899}{8.991}=0.026 \]

\[ a=\frac{\Sigma Y-b\Sigma X}{n} \]

\[ a=\frac{3853.57-(0.026 \times -16.3)}{10}=385.40 \]

\[ \hat Y=0.026X+385.4 \]

16.2 Regresi Linear Menggunakan R

m1 <- lm(MATH~ESCS, pisa)
summary(m1)

Call:
lm(formula = MATH ~ ESCS, data = pisa)

Residuals:
     Min       1Q   Median       3Q      Max 
-166.809  -44.263   -4.197   39.057  236.052 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  400.066      3.010  132.91   <2e-16 ***
ESCS          17.476      1.659   10.54   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 61.85 on 1295 degrees of freedom
Multiple R-squared:  0.07894,   Adjusted R-squared:  0.07823 
F-statistic:   111 on 1 and 1295 DF,  p-value: < 2.2e-16

Berdasarkan output diperoleh

\[ \hat Y=17.476X+400.066 \]

plot(MATH~ESCS, pisa)

16.3 Regresi Berganda

\[ \hat Y= b_1X_1+b_2X_2+a \]

dimana

  • \(X_1\) adalah variabel independen pertama

  • \(X_2\) merupakan variabel independen kedua

  • \(b_1\) bobot regresi untuk \(X_1\)

  • \(b_2\) bobot regresi untuk \(X_2\)

  • \(a\) adalah intersep

m2 <- lm(MATH ~ ESCS+growth, data = pisa)
anova (m1, m2)
Analysis of Variance Table

Model 1: MATH ~ ESCS
Model 2: MATH ~ ESCS + growth
  Res.Df     RSS Df Sum of Sq      F    Pr(>F)    
1   1295 4953276                                  
2   1294 4494367  1    458909 132.13 < 2.2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1