Monday, July 23, 2012

Controversia del mes: pruebas de hipótesis


Imagen de http://1pixel2.es/2009/05/17/mama-me-han-metido-algo-en-la-copa/


En el último número de Significance, Baker & Mudge proponen realizar pruebas de hipótesis minimizando las oportunidades de obtener falsos positivos y falsos negativos. Hoy discutiré algunos aspectos interesantes de su artículo que llamaron mi atención.


Ellos argumentan que la hipótesis nula siempre es falsa. Este es el argumento de muchos pensadores que se cuestionan acerca de la validez de las pruebas estadísticas como las conocemos hoy. Si usted está haciendo pruebas de hipótesis justo en este instante, pregúntese acerca de sus hipótesis nulas. Son ciertas? seguramente no. Por ejemplo, considere una prueba sobre una media en un proceso industrial. La hipótesis nula podría ser que la vida media de un componente es de 120 días. Pues bien, esa afirmación es del todo falsa pues, como lo menciona Gelman, no tiene sentido cuando el espacio paramétrico es continuo.


Yo diría muy burdamente que existe una validez práctica muy importante. Aún cuando las hipótesis nulas no sean estrictamente verdaderas. Piense en una diferencia de medias, para la cual se realiza una prueba a dos colas. Obviamente resulta imposible pensar en que  la hipótesis nula (la resta de las medias es nula) es verdadera, en sentido estricto. Sin embargo, es muy plausible que el efecto sea tan pequeño que de lo mismo pensar en que la hipótesis nula sea verdadera. Incluso, es posible pensar - sin ser bayesiano - que exista una diferencia entre cero (la supuesta diferencia de medias) y la verdadera diferencia de medias, para la cual su medida de probabilidad sea nula... si la anterior frase le quedó sonando, piénselo muy bien puesto que, en el mundo frecuentista, los parámetros no son variables aleatorias sujetas a medidas de probabilidad; pero, en el mundo bayesiano, esto tiene todo el sentido.


Para rematar, esto señores se preguntan ¿de dónde sale ese numerito alpha? ¿por qué es siempre igual a 0.05? Esa es una pregunta que ojalá muchos estudiantes realizaran en clase. Si usted es estudiante le recomiendo que la formule en clase. Realmente no tiene sentido que en todas las disciplinas ese valor sea el mismo. Si usted está realizando pruebas psicométricas, el valor es 0.05; si está haciendo una prueba de hipótesis en un experimento con animales, el valor es el mismo 0.05; si se trata de una prueba sobre microarreglos en genética, el valor es idéntico. Pareciera un guarismo arbitrario impuesto por los profesores de estadística. Yo creo que así es. Concuerdo con los autores en que ni tiene ningún fundamento lógico. De hecho, el anónimo Student advertía de los peligros de confundir ajuste estadístico con importancia.


¿Y cuál es su opinión?

3 comments:

  1. Wilfredo Gavidia Silva escribe que, en efecto muchos nos preguntamos respecto al famoso y conocido valor de 0,05. En un artículo de los Profesores Pedro Monterrey y Carlos Gomez-Restrepo de la U Javeriana, donde realizan un rastreo y narran como se da la controversia del procedimiento entre R. A. Fisher y J Neyman junto con E. Pearson.

    Aquí está el enlace http://med.javeriana.edu.co/publi/vniversitas/serial/v48n3/3-APLICACION.pdf

    ReplyDelete
  2. 1. La hipótesis nula siempre es falsa? No se . Si yo planteo si la medias de dos poblaciones son iguales, lo que estoy tratando de probar es que no lo son o que una es mayor a la otra. Si estoy planteando que el modelo de regresión es no significativo, estoy tratando de mostrar que si lo es. Ahora, si resulta ser verdadera la hipótesis nula, cual es la evidencia que me dice que lo es? ¿Porque el p-value=0.06, es mayor a alpha=0,05 (valor predeterminado)?, que pasa si en lugar de tomar alpha=0,05 se asume igual 0,07 entonces es falsa la hipótesis?. Quien determina el alpha?. Por otro lado, que pasaría si se aumentara el tamaño de la muestra o se cambiara la muestra? posiblemente cambiaría el resultado. Porque dar una conclusión con una muestra en particular? porque no con otra o con otras, si existen, dependiendo del tamaño de la población, infinitas muestras posibles?
    2. En mis clases los alumnos me preguntan, porque no pueden tomar alpha=0.01 ó 0.1 ó 0.025 y yo les pregunto ¿quien es el investigador usted o yo?, yo no determino el alpha ese valor depende de la investigación y del investigador no de la estadística ni del profesional estadístico (en clase se trabaja con el 0.05 por comodidad pero no porque sea de obligatoriedad teórica tomarlo).

    ReplyDelete
  3. Si genero los siguientes datos:

    X ~ U(0,1)
    Y ~ N(0,1),

    y planteo el modelo

    E(Y|X=x) = b*x

    La hipótesis nula H0: b=0 es cierta, no?

    ReplyDelete