En avicultura el valor de la predicción cada vez tiene una mayor presencia, ya que con nuestra experiencia somos capaces de inferir qué puede ocurrir cuando se dan unas determinadas condiciones.
Correlación & regresión
Estadísticamente tenemos dos conceptos que pueden ayudarnos:
- La correlación nos permite conocer si dos eventos o variables están relacionadas
- La regresión nos permitirá estimar una variable a partir de la otra.
En el mundo de la avicultura, las predicciones pueden tener gran relevancia y pueden servir para determinar la efectividad de un tratamiento en función de la dosis empleada, el efecto de un aditivo en función de su nivel de inclusión, etc.
Variables cuantitativas & cualitativas
El intento de relacionar variables entre sí nos lleva a determinar si las variables que queremos analizar se pueden cuantificar o son cualitativas.
El trabajo con variables cuantitativas es relativamente sencillo y fácil de entender intuitivamente. Sin embargo, el trabajo con variables cualitativas (aquellas que no tienen un valor numérico real) es mucho más complejo y requiere comprender algunas cuestiones previas
Las variables cuantitativas presentan valores numéricos reales como:
- Títulos de anticuerpos
- Parámetros bioquímicos de la sangre
- Parámetros productivos
En este caso, podemos afirmar que el valor 100 es el doble del valor 50. No es de extrañar que, en determinadas ocasiones, podemos tener dudas razonables sobre si una variable es cuantitativa o cualitativa. Imaginemos que no podemos asignar números reales a las cualidades, pero sí podemos ordenarlas de alguna forma. Veremos cómo podemos gestionar este tipo de variables en el ámbito que nos ocupa.
Relación entre variables: correlación
La correlación es un método de análisis estadístico que nos va a indicar si dos variables están relacionadas entre sí linealmente. Cuando dos variables están relacionadas de manera lineal, observaremos que aumentos en una de ellas llevan asociados aumentos o descensos -en función de si la relación es positiva o negativa- en la otra.
Coeficiente de relación
La forma de cuantificar la potencia de esta relación lineal entre dos variables cuantitativas se lleva a cabo mediante el llamado “coeficiente de correlación”, que Karl Pearson describió en 1895. Este coeficiente “r” es independiente de las unidades de medida:
- Está acotado entre -1 y +1.
- Cuanto más se acerca el valor de “r” a estos extremos, podemos afirmar que existe una mayor relación entre las variables
- Si el valor de “r” se acerca a 0, entenderemos que no existe una relación lineal entre las variables.
- El signo del valor de “r” nos indica si ambas variables aumentan o disminuyen a la vez (signo positivo) o si cuando una aumenta la otra disminuye (signo negativo).
- La correlación entre dos variables se puede representar gráficamente de forma como una nube de puntos.
Imaginemos que queremos saber si la ganancia media diaria en pollos de carne y el índice de conversión están relacionados de manera lineal. Para ello representamos la gráfica de la Figura 1 y observamos la distribución de los puntos, donde parece razonable pensar que la nube de puntos sigue un cierto patrón. Al calcular el coeficiente de correlación de Pearson comprobamos que su valor es negativo y se acerca razonablemente a -1, lo cual significa que ambas variables están relacionadas linealmente de manera que podemos esperar que cuando una variable aumenta disminuya la otra. Ciertamente es así: en las estirpes de pollos de carne, para una misma edad de sacrificio, cuanto mayor es la GMD, menor es el índice de conversión
Coeficiente de correlación de Spearman
Se puede llevar a cabo el estudio de la correlación entre variables cuando éstas no son cuantitativas pero sí se pueden ordenar, como ya hemos mencionado anteriormente. En este caso, podríamos determinar si existe relación entre ellas mediante un nuevo método estadístico, el “coeficiente de correlación de Spearman”.
El coeficiente de correlación nos dice si dos variables están relacionadas de manera lineal y del signo de esa relación, pero no sirve para predecir cuánto cambiará una variable cuando la otra se incremente en una unidad. El método estadístico que nos permite hacer esta predicción se denomina regresión.
Obsérvese que el valor del coeficiente de correlación de Pearson es negativo y se acerca razonablemente a -1, lo cual significa que ambas variables están relacionadas linealmente y que cuando aumenta una disminuye la otra.
La predicción: regresión
La regresión es el método de análisis estadístico que nos permite establecer una ecuación de predicción entre una variable cuantitativa y otra u otras.
La predicción más sencilla es la regresión lineal simple, en la que se trabaja únicamente con dos variables y se intenta estimar una a partir de la otra. El objetivo final de la regresión es obtener una ecuación de predicción del tipo:
La regresión nos permitirá cuantificar cuánto disminuye el IC cuando la GMD aumenta en una unidad
Cuantificar cuánto disminuirá el IC en función del aumento del GMD en una unidad será comprobado una vez determinemos que existe una relación lineal entre ambas variables: a nadie se le ocurriría intentar predecir el IC de los pollos a partir de la altura de los granjeros ya que sabemos que ambas variables son independientes.
En la Figura 2 podemos ver que el coeficiente de la regresión obtenida es de -0,0165, lo que significa que por cada gramo que aumenta la GMD, el IC disminuye 0,0165 unidades, al menos en el rango de crecimiento del que tenemos datos. En una regresión de este tipo, la fuerza de la predicción (el ajuste de los datos a la ecuación) también se puede medir y, en realidad, el modo de determinarlo se parece bastante al de la correlación.
Coeficiente de determinación
El parámetro que lo mide es r2, llamado “coeficiente de determinación” (calculado de forma similar a coeficiente de correlación de Pearson) que se interpreta de forma similar a r:
- Un r2 que se aproxima a 1 (en este caso ya no hay positivos ni negativos), nos indica que los datos observados se ajustan muy bien a la ecuación obtenida y la predicción será bastante fiable,
- Si r2 se acerca a 0, no podremos hacer ninguna predicción
En la Figura 2 están representados los datos obtenidos, la ecuación de regresión y su correspondiente coeficiente de determinación.
Se observa que el ajuste es medianamente bueno (r2 = 0,46) y que la mejora del índice de conversión es del 0,0165 por cada gramo de mejora de la GMD.
Predicciones complejas: regresión múltiple
El análisis de regresión lineal simple es un sencillo método para estudiar la relación entre dos variables cuantitativas y establecer la posibilidad de predecir cómo una variable influye en la otra.
En muchas ocasiones, la predicción de una variable mediante otra no es demasiado útil, porque existen variables que pueden influir; por lo tanto, nos interesa incluir más de una variable de predicción, de manera que la predicción sea más precisa y útil.
Será de gran interés llevar a cabo muchas predicciones considerando todas las variables independientes en su conjunto. Aquí nos va a ayudar un nuevo método de análisis estadístico: la regresión múltiple
Regresión múltiple
Imaginemos que queremos intentar predecir si los rendimientos de unas aves mejorarán o empeorarán cuando cambian las condiciones meteorológicas. Para ello definimos un parámetro productivo como el IC. Sin embargo, las condiciones meteorológicas difícilmente se pueden resumir en una única variable. Así pues, nos encontramos con temperatura máxima, mínima, humedad, precipitaciones, etc., obteniendo una ecuación del tipo:
En una regresión múltiple, podemos medir la fuerza de la predicción con el coeficiente de determinación r2, que se interpreta como el de la regresión lineal simple. No se calcula como el cuadrado del coeficiente de correlación, pues no existe tal coeficiente de correlación.
¿Son todas las variables predictivas igualmente importantes?
La medida de la importancia de cada una de estas variables nos la dará el grado de significación (p) de cada una de ellas: cuando esté por debajo de un determinado umbral (habitualmente tomamos 0,05 como referencia) podremos estar razonablemente seguros de que esa variable tiene importancia en la ecuación y explica una parte significativa de la predicción. En el caso de las regresiones múltiples la representación gráfica no es posible, por lo que únicamente podremos analizar los resultados numéricos.
Predicciones de variables cualitativas: regresión logística & análisis discriminante
Podemos decir que también existe la posibilidad de analizar las relaciones entre variables cualitativas. Cuando la variable respuesta es cualitativa y las variables predictivas son cuantitativas, utilizaremos el análisis discriminante. Si la variable respuesta es cualitativa pero las variables predictivas pueden ser tanto cualitativas como cuantitativas, utilizaremos una regresión logística.
Un ejemplo de este tipo de predicciones son las que nos muestran la probabilidad de supervivencia (variable cualitativa: el individuo vive o muere) a partir de toda una serie de variables predictivas (incidencia de enfermedades, ambiente, datos productivos, parámetros vitales, historia de la granja, etc.).
PDF