Saturday, April 16, 2011

¡Me tomo un tinto y tumbo el muestreo!

El título de este post refleja literalmente las palabras de algunos obstinados colegas que, además de arribistas, muestran su ignorancia tratando de enmarcarlo todo dentro de modelos de probabilidad, despreciando la teoría de la aleatorización. Está bien que no les guste el muestreo, pero una cosa es la antipatía por una materia y otra es llegar a tal punto de negar la realidad.


Definitivamente se debe tener muy poco sentido común para afirmar que al tomarse un tinto, es posible invalidar una teoría con décadas de existencia, que ha sido formulada por las mentes más brillantes de la estadística. A lo que me refiero es que existe una actitud incorrecta de parte de un pequeño cúmulo de profesionales, que desestiman el muestreo.


Quiero traer a colación las palabras de uno de los estadísticos más importantes del mundo, Andrew Gelman. Este tipo adora los modelos, es un bayesiano de ultra-derecha, ha escrito muchos libros y atículos en temas de modelos y fíjense en lo que dice:




... el muestreo es más que una metáfora, es crucial en muchos aspectos de la estadística. Esto es evidente en los estudios de opinión pública y salud, donde los análisis se basan en muestras aleatorias, y en las estadísticas del medio ambiente, donde variables continuas de naturaleza física se estudian a partir de muestras del espacio-tiempo. Pero, incluso en las zonas donde el muestreo es menos evidente, puede ser importante. Considere la posibilidad de experimentos médicos, donde el objetivo siempre es la inferencia de la población en general, no sólo para los pacientes en el estudio. Del mismo modo, el objetivo de los neurocientíficos es conocer los aspectos generales de los cerebros de humanos y animales, no sólo para estudiar las criaturas en particular de las que se dispone de datos. En última instancia, la muestra es sólo otra palabra para subconjunto, y en ambas inferencia bayesiana y clásica, la generalización adecuada de la muestra a la población depende de un modelo para la toma de muestras o el proceso de selección. No tengo ningún problema con el uso del muestreo como marco para la inferencia, y yo creo que esto funcionará aún mejor si se hace hincapié en la generalización a partir de muestras reales de las poblaciones reales - no sólo construcciones matemáticas - que son esenciales para gran parte de nuestras inferencias aplicadas.




5 comments:

  1. Andrés, explíqueme esta frase que no entendí, por favor: «tratando de enmarcarlo todo dentro de modelos de probabilidad, despreciando la teoría de la aleatorización».

    ReplyDelete
  2. Me parece importante recalcan que el muestreo es una de las herramientas estadisticas, mas importantes por su aplicabilidad y porque sus resultados en algunas ocasiones dicen mas que un modelo que en ocasiones solo es valido para los datos poblaciones. El muestreo surge como una alternativa que nos acerca a la realidad.

    ReplyDelete
  3. Me refiero a esos colegas que van ajustando modelos sin preguntar cómo fueron obtenidos los datos. En mis cátedras de muestreo avanzado yo enseño modelos, me gustan. Pero soy muy cuidadoso al hacer hincapié en que los modelos deben tener en cuenta cómo fueron seleccionados los datos.

    ReplyDelete
  4. No solo los modelos, la inferencia no tiene sentido si los resultados no se han obtenido a partir de datos muestrales. En un modelo econométrico como es posible hacer suponer normalidad de los errores, normalidad de los parámetros, normalidad de la variable dependiente si los datos no provienen de una muestra, eso es imposible (teorema de Gauss-Markov)

    ReplyDelete
  5. [...] no deberá ser tenido en cuenta. Y pues bien, tumbaron a Bayes. Eso me hace pensar que aquellos que quieren tomarse un tinto y tumbar el muestreo posiblemente lo logren… Nooo, qué va, con tipos tan duros como Daniel y el reconocimiento que ha [...]

    ReplyDelete