Tabla de contenidos
- Grados de libertad en estadística descriptiva
- Grados de libertad en la media
- Grados de libertad en la varianza
- Grados de libertad de los residuos de una regresión
En el presente artículo le mostramos 3 formas de comprender los grados de libertad de manera rápida y sencilla, partiendo de lo más sencillo hacia lo más complejo. Para ello analizaremos su utilidad en los estimadores estadísticos media y varianza y finalmente en una regresión.
Grados de libertad en estadística descriptiva
Consideremos el siguiente caso: deseamos saber cuántas rosas tienen en promedio los rosales de un parque, siendo el total de rosales 100. Elegimos aleatoriamente 5 rosales y contamos el número de rosas, teniendo los siguientes resultados:
Las estadísticas descriptivas de la muestra son las estimaciones de los valores poblacionales teorizados, esto quiere decir, que se halla estos valores con el fin de estimar la media, mediana, varianza, desviación estándar y curtosis de la población total de rosales.
De manera general, los grados de libertad (GL O DF por sus siglas en inglés: degrees of freedom) son las cantidades de piezas de información o número de observaciones de la muestra que se tiene para estimar los valores poblacionales.
Algebraicamente, los grados de libertad son la cantidad de valores que se puede elegir libremente antes que los valores restantes tomen un valor automático, «n-k», donde n es el número de observaciones y r las restricciones a la puede estar sujeta. En la imagen 1 podemos ver la tabla con las estadísticas descriptivas para la muestra de los 5 rosales. Los GL para la media y varianza son 5 y 4 respectivamente. En las siguientes secciones explicamos el porqué.
Grados de libertad en la media
Tal como se mencionó, el cálculo de los estimadores de una muestra se realiza para estimar los valores poblaciones, en este caso se calcula la media muestral para estimar la media poblacional .
Siendo la fórmula de la media la suma de los elementos de la muestra divida por la cantidad de elementos, la suma de los elementos sería igual a:
Los grados de libertad de la media es igual al número de elementos en la muestra (DF = n) ya que no tiene ninguna restricción. Todos los elementos de la muestra pueden tomar cualquier valor. Sin embargo, esto no sucede con la varianza.
Grados de libertad en la varianza
Los grados de libertad de la varianza es igual al número de elementos en la muestra menos 1 (DF = n-1) ya que tiene como restricción que la suma de todas desviaciones es igual a cero.
La restricción se expresa de la siguiente manera:
Teniendo como dato previo que la suma de las desviaciones es igual a cero, los primeros cuatro elementos pueden tomar cualquier valor, sin embargo, el último valor debe ser tal que la suma resulte cero. Por eso se dice que la varianza tiene n-1 grados de libertad.
Grados de libertad de los residuos de una regresión
Una regresión con una variable explicativa se expresa de la siguiente manera:
Donde el residuo tiene las características de tener media 0 e igual varianza. En la imagen 1 se pudo constatar que la sumatoria de las desviaciones es cero. Con estos supuestos tenemos dos restricciones para los grados de libertad.
En la imagen 9 podemos ver las expresiones para ambas restricciones. En la restricción 1, luego de depejar podemos asignar cualquier valor a los 4 primeros residuos, sin embargo, el residuo 5 debe ser tal que la suma resulte 0. Entonces, hasta este punto tenemos 4 grados de libertad.
El residuo 5 es conocido y se usa para la segunda restricción. Teniendo este dato previo, podemos elegir cualquier valor para los 3 primeros residuos, sin embargo el residuo 4 debe ser tal que la suma con el residuo 5 resulte 0. Entonces, en total tenemos 3 grados de libertad.
Entonces, los grados de libertad de los residuos de una regresión se expresa de la siguiente manera: