¿Cuál es la diferencia entre r-cuadrado y r-cuadrado ajustado?

Fundamentos sobre regresión lineal, PARTE 4: Coeficiente de correlación R y R^2 (Noviembre 2024)

Fundamentos sobre regresión lineal, PARTE 4: Coeficiente de correlación R y R^2 (Noviembre 2024)
¿Cuál es la diferencia entre r-cuadrado y r-cuadrado ajustado?
Anonim
a:

Una diferencia importante entre R-cuadrado y R-cuadrado ajustado es que R-cuadrado supone que cada variable independiente en el modelo explica la variación en la variable dependiente. Da el porcentaje de variación explicada como si todas las variables independientes en el modelo afectaran a la variable dependiente, mientras que el R-cuadrado ajustado da el porcentaje de variación explicado solo por aquellas variables independientes que en realidad afectan a la variable dependiente. R-cuadrado no puede verificar si la figura del coeficiente del estadio y sus predicciones están perjudicadas. Tampoco muestra si un modelo de regresión es satisfactorio; puede mostrar una figura R-cuadrado para un buen modelo, o una figura alta R-cuadrado para un modelo que no se ajusta.

El R-cuadrado ajustado compara el poder descriptivo de los modelos de regresión que incluyen diversos números de predictores. Cada predictor agregado a un modelo aumenta R-cuadrado y nunca lo disminuye. Por lo tanto, un modelo con más términos puede parecer mejor ajustado simplemente por el hecho de que tiene más términos, mientras que el R-cuadrado ajustado compensa la adición de variables y solo aumenta si el nuevo término mejora el modelo por encima de lo que sería se obtiene por probabilidad y disminuye cuando un predictor mejora el modelo menos de lo que se predice por azar. En una condición de sobreajuste, se obtiene un valor incorrectamente alto de R cuadrado, que conduce a una menor capacidad de predicción. Este no es el caso con el R-cuadrado ajustado.

El R-cuadrado ajustado es una versión modificada de R-cuadrado para el número de predictores en un modelo. El R-cuadrado ajustado puede ser negativo, pero no siempre, mientras que un valor R-cuadrado está entre cero y 100 y muestra la relación lineal en la muestra de datos, incluso cuando no hay una relación básica. El R-cuadrado ajustado es la mejor estimación del grado de relación en la población básica. Para mostrar la correlación de los modelos con R-cuadrado, elija el modelo con el límite más alto, pero la mejor y más fácil forma de comparar los modelos es seleccionar uno con el R-cuadrado ajustado más pequeño. El R-cuadrado ajustado no es un modelo típico para comparar modelos no lineales, sino regresiones lineales múltiples.