Farz edelim ki şirketimizin gelecek yıllarına ait satış tahminlerini bulmak istiyoruz. Elimizdeki verilere dayanarak bir çıkarımda bulanabiliriz. Bunu yapabilmenin en kolay yollarından birisi lineer regresyon analizidir. Linear regression istatistik biliminde iki veya daha fazla değişken arasındaki ilişkiyi ölçmek için kullanılan bir analiz türüdür. Veri seti üzerinde verilerin arasından geçen en optimum doğruyu bulmayı amaçlarız. Bu doğru sayesinde istediğimiz değeri tahmin edebiliriz.

Matematikten bildiğimiz gibi doğrunun denklemi Y = b0 + b1 * X şeklindedir. Denklem de X değeri x-eksenini, y değeri ise y-eksenini gösterir. b0 için doğrunun y noktasını kestiği nokta diyebiliriz. b1 de doğrunun eğimidir. Literatürde farklı kaynaklarda m olarak da gösterilebilir. Şekildeki gibi verisetindeki veriler üzerinden bir doğru geçirdiğimizde, doğru bazı noktalara yakın bazı noktalara uzak olacaktır. Amacımız veriler içinden geçen en optimum doğruyu bulabilmek olduğu için gerçek değer ile doğru üzerinde bulunan gerçeğin bir yansıması olan tahmini değeri birbirinden çıkararak aradaki farkı bulmamız gerekir.
Residual = y – y^
y^ tahmin edilen değeri gösterir. y ise gerçek değerimizdir. Residual ise gerçek değer ile tahmin edilen değer arasındaki fark olarak tanımlayabiliriz. Bu hesaplama her nokta için ayrı ayrı hesaplanması gerekiyor. Bunu yapmamızdaki amacımız hatayı düşürerek en uygun doğruyu bulmaktır. Buna line fit etmek de deniyor. Residual değerlerini hesaplarken bazı değerler doğrunun altında kaldığı için y^– y sonucuna göre (-) bir değerlerde çıkmakta. Toplam hatayı bulabilmek için residual değerleri toplanırken eksi ve artı değerleri birbirini götürdüğü doğru bir işlem yapabilmek için residual değerinin karesi alınır. Bu sayede hata hesaplarken eksi değerler sebebiyle kayıp yaşamamış oluyoruz. Yaptığımız işlemleri matematiksel olarak ifade edersek.

Mean Squared Error (MSE) denklemi her bir nokta için hesaplanmış hataların toplamını gösterir. yi-yi^ her veri noktası için residual değerimizi, n parametresi ise sample sayımızı yani verisetimizdeki nokta sayımızı ifade ediyor. MSE formülünü kullanarak elde edilen değerleri minimize ederek en uygun doğruyu elde etmiş oluyoruz. Başka bir deyişle amacımız min(MSE) değerini bulabilmek.
Bu sayede üstteki şekildeki olduğu gibi tüm veri noktalarının arasından geçen en optimum doğruyu bulmuş oluyoruz. Bu doğruyu bulduktan sonraki işimiz kolay çünkü x veya y den biri biliniyorsa doğru denkleminden diğerini bulabiliriz. Doğru denklemini kullanarak doğru üzerinde bulunan gelecekteki değerleri tahmin etmiş oluyoruz.