Contenido disponible en: English (Inglés)
- ¿Cuáles deberían ser los datos que nos tiene que aportar una publicación?
- ¿Qué nos dicen los diferentes resultados que se obtienen en los estudios?
- ¿Cómo debemos interpretarlos?
Un artículo científico debería, además de informarnos de una serie de hallazgos que los autores han realizado con una experimentación, ser una guía que permitiera a otros investigadores, siguiendo los mismos métodos y con los mismos o parecidos materiales llegar (o no) a parecidas conclusiones que los autores del mismo.
¿En qué deberíamos fijarnos cuando leemos un artículo?
Bradbury et al. en la tabla 3 de su artículo nos informan del efecto de los niveles de fitasa entre los días 1 al 14 usando un diseño factorial 2x2x2 (dos fuentes de calcio, dos niveles de calcio y dos niveles de fitasa, ver tabla 1).
La media es un parámetro estadístico descriptivo de una población.
Hay múltiples parámetros estadísticos descriptivos como la media, desviación típica, proporción, etc.
Al iniciar el experimento, los autores o nosotros mismos desconocemos el dato real de la ganancia de peso, del consumo y del índice de conversión de la población total de pollos (Cobb-500 en este caso).
Lo que hacemos al elegir estos 1120 pollos del experimento, es tomar una muestra, y por tanto, estimaremos el valor del parámetro estadístico de interés, en este caso la media.
¿Tendríamos siempre los mismos resultados al hacer la prueba con una muestra de 1120 pollos Cobb-500? Claro que no, pueden ser muy parecidos, pero no iguales, por eso el valor que obtenemos de una muestra se denomina estima de la media y como tal tiene un error asociado
El valor del estadístico (la media) de la muestra se utiliza para estimar el valor del parámetro, desconocido, de la población. Si las muestras son aleatorias, los estadísticos dan estimaciones puntuales no sesgadas de los parámetros correspondientes.
No obstante, como resultado, la estima puntual no nos da suficiente información sobre la prueba.
Es imprescindible, que cada estima (media, proporción, etc) vaya acompañada siempre de su precisión (o de su error de estimación) que nos dará una idea de cuán buena es nuestra estima del valor verdadero, valor que nunca conoceremos.
Imaginemos que repetimos el estudio de Bladbury y cogemos 1120 pollos, los dividimos en dos grupos de forma aleatoria y obtenemos las ganancias de peso entre 1 y 14 días.
Esto lo hemos simulado y hemos obtenido los siguientes resultados:
¿Qué es la desviación estándar?
Es un parámetro que describe la variabilidad de los datos y es necesario para conocer la precisión de nuestro muestreo.
- Como en el caso de la media, no conocemos la desviación estándar de la población, sino que la estimamos a partir de la muestra.
- Para el cálculo de la desviación estándar muestral se resta de cada uno de los valores de nuestro muestreo, la media estimada.
- Para que la suma de las diferencias no sea 0, elevamos al cuadrado esta diferencia.
- Finalmente dividimos por el número de datos “n” menos uno.
¿Qué es el error estándar de la media?
Si realizamos el muestreo aleatorio de cada grupo un número elevado de veces, de cada muestreo, obtenemos una media.
- Estos valores no serán iguales entre ellos, y su variabilidad, medida como desviación estándar es el error estándar de la media.
- Si medimos una variable con una variabilidad muy pequeña, (todos los pollos son iguales, desviación estándar muy baja) la variabilidad de las medias en diferentes pruebas también será pequeña.
- En cambio, si la variable medida tiene mucha variabilidad (desviación estándar alta) las medias de cada prueba también diferirán más.
Así, formalmente, el error estándar de la media (ESM) estimada en una población con desviación típica “s”, y un tamaño muestral “n”, es:
Si pensamos que nuestra variable aleatoria por el hecho de serlo sigue la famosa Ley Normal, el 95% de los valores de las ganancias de peso de los pollos dentro de cada uno de los grupos estará aproximadamente entre el valor de la media de su grupo y 2 veces (formalmente el valor es 1,96) el valor de la desviación estándar.
Si los valores de los intervalos obtenidos sin fitasa o con 500 FTU de fitasa no se superponen, intuitivamente ya podemos ver que, la media del tratamiento sin fitasa estará por debajo de la media del tratamiento con 500 FTU de fitasa, y por tanto atribuimos un efecto del tratamiento no debido al azar (estadísticamente significativo).
También intuitivamente podemos ver que, conforme más estrecho sea cada uno de estos intervalos, el error de muestreo habrá sido más pequeño y tendremos, más confianza en nuestros datos.
¿Esta diferencia en los intervalos es importante?
En estadística, un resultado o efecto es estadísticamente significativo cuando es improbable que haya sido debido al azar.
Una «diferencia estadísticamente significativa» solamente significa que hay evidencias estadísticas de que hay una diferencia; no significa que la diferencia sea grande, importante o radicalmente diferente.
Esta diferencia nos la da el tamaño del efecto de la diferencia.
La diferencia estadísticamente significativa se define con un valor conocido como valor “p” y es la probabilidad estadística de obtener por puro azar, en este caso, una ganancia media de peso tan o más alejada de 477 g/ave (grupo sin fitasa) que la media de 500 g/ave (grupo con fitasa).
¿Qué significa el 95%?
Si realizásemos nuestro muestreo de pollos 100 veces (1120 pollos tomados al azar 100 veces y someterlos a las mismas dietas), cada muestra nos daría una media y un intervalo de confianza.
A la larga, el 95% de estos intervalos incluiría el verdadero valor medio de la ganancia de peso real, que nunca conoceremos.
No podemos saber nunca si el intervalo obtenido en el experimento pertenece al 95% de los intervalos que incluye la media verdadera o al 5% restante que no: es el método el que acierta el 95% de las veces.
CONCLUSIÓN
Así pues, al informar de los resultados de experimentos, los autores deberían darnos además de los estadísticos calculados (media, proporción…), el número de observaciones de cada conjunto de datos, su error estándar, su intervalo de confianza y el valor de la significación estadística.
PDF