선형회귀 분석은 간단하게 설명하자면 '주어진 데이터를 가장 잘 설명하는 직선 하나를 찾는 것' 이다.
선형회귀분석은 두가지 가 존재한다.
1. 하나의 독립변수에 대하여 선형회귀분석을 하면 단순선형회귀 라 하며
2. 독립변수가 여러개인 경우에는 다중선형회귀 라한다.
단순선형회귀분석을 한다는 것은 x와 y라는 데이터가 주어졌을때, y=w*x+b라는 직선의 방정식에서 데이터를 가장 잘 표현하는 변수 w와 b를 찾는다는 것이다.
** w : 가중치(weight, 기울기), b : 편차(bias, 절편)
w, b 쌍에 대해서 데이터와 얼마나 잘 맞는지 수치적으로 계산할 수 있어야하는데 이때 사용되는 척도 중에 대표적인 것으로 평균제곱오차(MSE) 가 있다.