Recta de regresión: Fórmula y cómo se calcula. Ejercicios resueltos

A continuación vamos a ver qué es la recta de regresión, para qué sirve y cómo se calcula, explicado con todo detalle y con ejercicios resueltos paso a paso.

¡Empezamos!

Si has llegado hasta aquí es porque seguramente hay algún ejercicio que no sabes resolver y necesitas clases de matemáticas online. Si después de leer esto, quieres que te ayude a resolverlo o que te despeje alguna duda, puedes hacer dos cosas: o seguir buscando por Internet o contactar conmigo e ir directo al grano y ahorrarte tiempo.

Lo que vas a leer es tan sólo un ejemplo de lo que puedo enseñarte con mi método para enseñar matemáticas. Puedo explicarte paso a paso cualquier duda que no entiendas:

QUIERO APRENDER MATEMÁTICAS

Sólo tienes que dejarte guiar por mí verás como tu nota y tu tiempo libre subirán como la espuma.

Qué es una recta de regresión

Supongamos que tenemos una nube de puntos de unos datos obtenidos de una muestra, como por ejemplo estos:

Estos puntos siguen una cierta tendencia y sugieren una forma que puede ajustarse a una recta.

Podemos obtener una recta en torno a la cual se agrupan los puntos y que se ajusta a la tendencia que guardan los puntos. A esta recta es a lo que llamamos recta de regresión:

Las rectas de regresión cumplen las siguientes características:

  • Pasan por el centro de gravedad de la nube de puntos (punto cuyas coordenadas son las medias de cada variable)
  • La suma de los cuadrados de las distancias (verticales u horizontales) a los puntos es mínima, es decir, que desde la recta, las distancias a los puntos es la mínima. La recta de regresión pasa por en medio de todos esos puntos minimizando la distancia a estos:

De esta forma, la recta de regresión representa la tendencia de la nube de puntos.

La recta de regresión nos permite, conocidos los valores de una de las variables, estimar de manera aproximada los valores esperados de la otra variable.

Las estimaciones realizadas serán fiables siempre y cuando el valor del coeficiente de correlación lineal de Pearson, se aproxime lo máximo posible a 1 o a -1. Cuando dicho coeficiente esté en torno a 0, las estimaciones realizadas no tienen ningún sentido.

Fórmula de las rectas de regresión

¿Cómo es la ecuación de una recta de regresión? Vamos a verlo:

Ecuación de la recta de regresión de Y sobre X

Partimos de la ecuación punto pendiente, que tiene la siguiente ecuación:

Donde X0 y Y0 son las coordenadas de un punto por el que pasa la recta:

Y m es la pendiente de la recta:

En nuestro caso, la recta de regresión pasa por el punto G, que tiene de coordenadas las medias de cada una de las variables:

Y m es igual a la covarianza dividida entre la varianza de x:

Por tanto, la fórmula de la recta de regresión se me queda de la siguiente manera:

Esta recta es la que minimiza la distancias de los puntos a la recta en vertical:

Concretamente, esta es la ecuación de la recta de regresión de Y sobre X, que es la que minimiza las distancias en vertical a la recta.

Ecuación de la recta de regresión de X sobre Y

También podemos obtener la ecuación de la recta de regresión de X sobre Y, donde en este caso la pendiente sería igual a la covarianza entre la varianza de Y:

Y su ecuación sería:

Cuya estructura es similar a la ecuación anterior, solo que cambia la Y por la X. Esta ecuación no tiene por qué ser la misma que la ecuación de la recta de regresión de X sobre Y, aunque cuanto más fuerte sea la correlación, más se aproximarán ambas rectas, pero repito, no tiene por qué ser la misma recta.

Esta recta es la que minimiza la distancias de los puntos a la recta en horizontal:

Cómo calcular la ecuación de la recta de regresión

Vamos a ver cómo calcular la ecuación de la recta de regresión, siguiendo con el enunciado del mismo ejercicio de la lección anterior:

Se sabe que el número de clientes diarios de un núcleo de población que acuden a un centro comercial depende de la distancia entre ambos.  Los datos de seis centros comerciales y sus distancias a un núcleo de población son los siguientes:

a) Hallar las dos rectas de regresión

b) Si un centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?

c) Si desea recibir diariamente 1000 clientes, ¿a qué distancia del núcleo debe situarse?

Partimos de que ya conocemos los siguientes valores, para no alargar el ejercicio:

Apartado a:

Nos piden calcular las dos rectas de regresión.

Empezamos calculando la ecuación de la recta de regresión de Y sobre X, que recordemos, tiene esta fórmula:

Sustituimos cada variable por su valor:

Primero operamos la fracción:

Y ahora resolvemos el paréntesis multiplicando su contenido por el número que queda delante:

Por último, pasamos el -26 sumando al miembro contrario y nos queda la siguiente ecuación y operamos:

Ahora vamos a calcular de forma análoga la ecuación de la recta de regresión de X sobre Y:

Sustituimos cada variable por su valor:

Operamos la fracción:

Resolvemos el paréntesis:

Y despejamos la x pasando el -4,66 sumando al segundo miembro y operando:

Ahora vamos a dar respuesta a las preguntas de los apartados b y c:

En este caso, podemos hacer estimaciones porque el coeficiente de correlación lineal está muy próximo a 1 (puedes calcularlo para comprobarlo).

Nos preguntan que cuántos clientes se puede esperar si un centro comercial está a 2 km, es decir, nos dicen que y=2 km y nos preguntan por el valor de x.

En este caso, que sabemos el valor de «y» y nos preguntan por el de x, utilizamos la ecuación de la recta de regresión de X sobre Y:

Sustituimos la «y» por su valor y calculamos el valor de x:

Es decir, se esperarían 11,38 cientos de clientes, o lo que es lo mismo, 1138 clientes.

Nos pregunta también que si se desea recibir 1000 clientes, que a qué distancia del núcleo debe situarse. En este caso nos están diciendo que x=10 (1000 son 10 cientos) y nos preguntan por el valor de «y».

Cuando sabemos el valor de x y nos preguntan por el valor de «y», utilizamos la ecuación de la recta de regresión de Y sobre X:

Sustituimos la x por su valor y calculamos el valor de «y»:

Por tanto, el centro comercial debe situarse a 9,18 km del núcleo de población.

¿Necesitas ayuda en matemáticas? ¿Quieres que te explique cualquier duda que te surja?

Puedo enseñarte exactamente lo que necesitas aprender para aprobar las matemáticas.

He diseñado un método práctico y efectivo que te ayudará a entender las matemáticas, paso a paso, explicándote justo lo que necesitas para saber resolver todos tus ejercicios y problemas. Todo con un lenguaje sencillo y ameno que entenderás perfectamente.

Con mi método:

  • Sabrás los pasos exactos que tienes que dar para resolver tus ejercicios y problemas
  • Conseguirás resultados en muy poco tiempo, sin dedicar más horas a intentar entenderlo por tu cuenta sin llegar a ninguna conclusión

Suena bien ¿no?

¿Por qué tardar 2 horas buscando por Internet si puedes aprenderlo en menos de 20 minutos?

Sé lo que te impide entender las matemáticas y sé lo que necesitas para entenderlas. ¿Quieres informarte de como puedes aprender matemáticas conmigo? Pulsa el botón para saber más:

ENSÉÑAME MATEMÁTICAS