Friday, June 17, 2011

¡Que no y que no! No hay poblaciones infinitas

  • Después de 40, la población se considera como infinita.


Esta es la excusa perfecta a la que convergen los profesionales de todas las disciplinas cuando quieren defender sus ideas del tamaño de muestra o simplemente cuando su impertinencia hace que hablen más de la cuenta. Lo cierto es que esa regla de los cuarenta y las poblaciones infinitas se hace muy difícil de entender. Tal vez yo no sea demasiado avezado para comprender tal "teorema" del muestreo, pero a continuación expondré mis argumentos y con eso me daré por bien servido, porque será un medio para desfogar mi ira, no contra mis colegas de otras disciplinas, sino contra la idiosincrasia impertinente que domina estas latitudes.

Un buen ejemplo del dominio de este arte, diría yo oscura, de dominar el infinito, lo viví hace poco en una reunión en la que se negociaba la realización de un estudio con una firma encuestadora de renombre nacional. Uno de los presentes hizo un comentario que me hizo sentir todo un neófito en temas estadísticos. Se trataba de un profesional no estadístico, que de verdad admiro mucho por sus características administrativas, que exponía que cuando él estaba en la universidad, cursando el pregrado, tomó una clase de probabilidad en donde el profesor hacía referencia a la ley fuerte de los grandes números. Después de argumentar lo anterior, afirmó que el tamaño de muestra en el estudio en cuestión era adecuado porque después de cierto número de encuestas la población se consideraba infinita.

Otro ejemplo lo viví en el marco de una asesoría que realicé a una propuesta técnica en la que me disgustaba el tamaño de muestra que habían propuesto. Yo sugerí que debían aumentar el tamaño de muestra para que se alcanzaran los errores mínimos de muestreo. Craso error… Acto seguido, me citaron a una reunión a la que asistió hasta el gerente de la compañía para indagar más acerca de mi recomendación. En esa reunión, uno de los funcionarios de la firma, con marcador en mano, me < > que no se debía aumentar el tamaño de muestra, puesto que la población era grande y esto era equivalente a que la población pudiera ser considerada como infinita. Por tanto, el tamaño de muestra que ellos proponían no debía cambiar. Lo más valioso, en ese proceso de aprendizaje, ocurrió cuando el funcionario dibujó en el tablero una curva y me explicó el concepto de asíntota.

En primer lugar, y esto lo digo en mis clases, yo jamás he trabajado en estudios o investigaciones que involucren poblaciones infinitas. Realmente no creo que ninguno de mis colegas estadísticos lo haya hecho alguna vez. De hecho, si alguna vez me ofrecen trabajar en alguna investigación que tenga como objeto una población infinita, yo declinaría inmediatamente la oferta, simplemente porque el infinito es algo que yo no entiendo aún, incluso cuando algunos colegas estadísticos y no estadísticos parecen dominarlo con excelencia.

Mi segundo argumento puntual es el siguiente: no existen poblaciones infinitas. O.K., existen las estrellas, los átomos y demás. Pero ese tipo de poblaciones no son de interés en estudios sociales, o de mercadeo, que es donde se utiliza el muestreo. Como ese tipo de poblaciones no es de interés, entonces no me gusta que me salgan con argumentos traídos de los cabellos.

Tercero, aunque la teoría de probabilidad es la base del muestreo, no es posible afirmar que las poblaciones son infinitas. En realidad, si después de cuarenta, todas las poblaciones son infinitas, entonces todas las estrategias de muestreo serían iguales, todos los tamaños de muestra serían iguales y todos los errores de muestreo serían los mismos. En estudios por muestreo, el hecho de que la población sea grande, no garantiza nada.

Cuarto, la inferencia que nos enseñaron en el pregrado, no es apta para ningún diseño de muestreo, a excepción del diseño de muestreo aleatorio simple con reemplazo. Espero que esto quede claro, si usted o sus clientes realizan una muestra, la inferencia que se debe utilizar es diferente a la que nos han enseñado, y esto se debe tener en cuenta cuando se realizan los diseños del tamaño de muestra.

Quinto, no es cierto que entre más muestra haya, menos error de muestreo existe. Lo anterior, si bien es válido para estrategias de muestreo aleatorias simples, no es necesariamente lo que ocurre cuando se utilizan diseños de muestreo complejos. Por ejemplo, si se utiliza un diseño de muestreo de tamaño de muestra aleatorio, como Bernoulli o Poisson, así se realice un censo, va a existir error de muestreo. Por lo tanto, la asíntota en estos casos es simplemente un argumento que no aplica en nada.

Seis, que por favor, por misericordia, el que no sepa de muestreo que no se meta, que no opine y que no se inmiscuya en asuntos que no le conciernen. Yo, siendo estadístico, jamás opinaría acerca de un modelo de riesgo o de un modelo de series de tiempo. Así de sencillo, un curso en pregrado no es suficiente para licitar, no es suficiente para auditar y no es suficiente para siquiera pretender dar una estimación del tamaño de muestra en un estudio. Si se quiere ser efectivo, hay que especializarse en el tema. Afortunadamente, cada vez son más los muchachos que se interesan por el muestreo. Alguien me dijo que hay más de sesenta alumnos en la UNAL-Bogotá en muestreo II y en la USTA-Bogotá la cifra, si bien no es tan alta, no es nada despreciable y es una de las electivas más pedidas.

10 comments:

  1. Hola Andrés

    Estoy de acuerdo con que "después de 40 la población se considera infinita" es una locura pero...

    1.Si hay estadísticos que trabajan con poblaciones "infinitas".

    2.¿ El muestreo solo se utiliza en estudios sociales o de mercadeo?... no estoy de acuerdo con eso.

    No me parece que modelos como los de probabilidad para la evolución de la secuencia del ADN, por ejemplo, sean inútiles o irrelevantes o que no sean de interés. Por ejemplo los modelos para mutaciones de "sitios infinitos" o los modelos de alelos infinitos, "se asume que existen tantos alelos que cada mutación crea un nuevo "tipo" que no ha existido antes.. se asume que es infinito porque por ejemplo si un gen tiene 500 nucleotidos, el número de secuencias posibles de ADN sería 10^301 y para cualquiera de estas hay 3*500=1500 secuencias que pueden ser alcanzadas por un cambio sencillo de base, entonces la probabilidad de retornar donde uno comenzó en dos mutaciones es 1/1500 (si se asume la misma probabilidad para todos los remplazamientos). Así el número total de alelos es esencialmente infinito." (Durret, 2008). ... y si hay métodos de muestreo para estas poblaciones.

    En física en los modelos basados en modelos coalescentes también se utiliza muestreo... y también para poblaciones infinitas.


    Si hablamos desde el punto de vista del álgebra, dice un algebrista que tengo al lado, lo que yo llamo infinito es finito. Aunque por lo que escribiste en el segundo argumento creo que lo que para mi es infinito para ti también.

    Por último, yo no soy ninguna experta en nada de nada. Sé a ciencia cierta que tienes mucha más experiencia que yo y sabes muchísimo más sobre muestreo, sobre estadística y sobre la vida que yo. Quiero que sepas que esto que escribí es con todo el respeto que mereces. Mi intención no es ofender ni cuestionar sino debatir.

    Un saludo cordial

    ReplyDelete
  2. Estimad@ No Quiero... gracias por su valioso y enriquecedor comentario... Si bien es cierto que el argumento de las poblaciones infinitas es válido en algunas circunstancias, como las que usted muy amablemente menciona, vale la pena mencionar que no es válido en el contexto de investigación social, con hogares y personas.

    Pero, por lo que usted afirma, sí hay estadísticos que trabajan con poblaciones infinitas... muchos, y en diversas áreas.

    Y claro que el muestreo no sólo se utiliza en investigaciones sociales. Lo que pasa es que yo lo utilizo en ese contexto y es ahí donde aparece ese argumento de las poblaciones infiniras.

    Disculpe mi vehemencia al abordar este tema. Pero usted entenderá que por el afán de ahorrarse costos, las empresas sacan argumentos "infinitamente" absurdos. máxime si es una encuesta de estadísticas oficiales en donde mis impuestos se desperdician y redundan en utilidades para terceros. No tengo nada en contra de que las empresas se enriquezcan, pero que lo hagan con validez.

    Por último, gracias una vez más por su comentario acertado y l@ invito a comentar más seguido en este espacio.

    ReplyDelete
  3. Hola Andrés,

    Trabajo de hace muchos años en investigación de mercados, mercadeo creo que decís acá. Como tu, yo jamás he trabajado en estudios o investigaciones que involucren poblaciones infinitas y, como tu, entiendo que la inferencia adecuada en diseños muestrales distintos al aleatorio simple con reemplazo es diferente de la que se enseña más o menos apresuradamente en cursos de pregrado.

    Pero también entiendo (porque es mi negocio) que ningún cliente ahorra costos interpretando como infinitas las poblaciones en lugar de asumir que son, por ejemplo, finitas y equivalentes a 50.000 consumidores distribuidos de manera conocida. El cliente, ese de los 50.000 consumidores, solo quiere saber qué piensa su consumidor del producto que vende y lo que pide es saber cuantas encuestas le salen por un determinado dinero que tiene disponible para marketing y, secundariamente, qué fiabilidad merecen los resultados que proporcionen dichas encuestas. No más. Se presupone que alguna fiabilidad hay y que cuanto más dinero gastes más fiabilidad habrá.

    Entiendo tu enojo por la falta de consistencia desde la teoria estadística de los razonamientos habituales pero esto no varía substancialmente el dinero que los clientes están en disposición de gastar. Los funcionarios de la firma como les llamas, presentan un razonamiento relativamente fácil de comprender a quienes deben tomar una decisión de gasto orientada a reducir la incertidumbre en lo que ya conocen. El gasto no crecera si cuentas al cliente que debe gastar más para tener un resultado en que pueda tener más confianza. Esos clientes interpretan que un resultado es fiable estadísticamente o que no lo es.

    Si al cliente le cuentas que un más adecuado razonamiento muestral hace recomendable gastarse más dinero y que si no lo tiene mejor no gastar nada (porque no es suficientemente fiable) probablemente acabe convencido que mejor no gastar dinero en investigar la (su) realidad social. Probablemente.

    ReplyDelete
  4. Hola,

    Gracias por responder a mi comentario.

    Por acá estaré aportando en los temas que me gusten, cuando crea que mi aporte pueda tener algún valor.

    Un saludo

    PD. Soy una mujer

    ReplyDelete
  5. "Seis, que por favor, por misericordia, el que no sepa de muestreo, así sea estadístico, que no se meta, que no opine y que no se inmiscuya en asuntos que no les conciernen. Yo, siendo estadístico, jamás opinaría acerca de un modelo de riesgo o de un modelo de series de tiempo. Así de sencillo, un curso en pregrado no es suficiente para licitar, no es suficiente para auditar y no es suficiente para siquiera pretender dar una estimación del tamaño de muestra en un estudio. Si se quiere ser efectivo, hay que especializarse en el tema".

    Fascinante posición. Entonces los que vemos una (1) materia de análisis de datos multivariante, un (1) muestreo, una (1) sola materia en regresión multivariada, una (1) materia sobre series de tiempo, una (1) investigación de operaciones, una (1) teoría de colas, y etc. ¿no tenemos derecho a nada? He pretendido... he pretendido...

    Salud.

    ReplyDelete
  6. Me refiero a que en materia de estadísticas oficiales, no es suficiente un curso de muestreo. No estoy diciendo que sea necesario un doctorado, pero sí es necesaria mucha experiencia y agrado por el tema... De lo contrario, es posible que el argumento de poblaciones infinitas no desaparezca.

    Por otro lado, me parece que una sola materia es el principio. Por ejemplo, un medico general, ha cursado y aprobado muchas materias, pero no tiene el nivel de profundidad de un especialista, por ejemplo, en cardiología. Y eso no quiere decir que el médico general sea menos que el Cardiologo... Saludos. AG

    ReplyDelete
  7. Qué más Andrés,

    Concuerdo con el comentario de Freddy López. Pedir conocimiento y experticia de cualquier tema a la hora de opinar es caer en una falacia de autoridad: solo quienes tienen tantos años de experiencia y han visto tantos cursos sobre determinado tema pueden opinar. Nada más anti-Kuhniano en filosofía e historia de la ciencia y fácilmente refutable epistemológicamente.

    Por otro lado, no tiene mucho sentido hablar de un muestreo infinito a menos que no se refieran a... infinito. Ni siquiera la población de estrellas o la de partículas elementales en el universo (calculada esta última en 10^80) son infinitas, en eso estoy de acuerdo con usted. Pero en lo que no puedo estar de acuerdo es en la descalificación que parece dar de las leyes de los grandes números, que por supuesto son muy útiles en la práctica si se aplican bien.

    Saludos.

    ReplyDelete
  8. Daniel, gracias por su comentario... Estoy de acuerdo en que la entrada es un poco exagerada... A veces es necesario exagerar !!!

    Por otro lado, y me corrige si me equivoco, las leyes de los grandes números se aplican a sucesiones infinitas de variables aleatorias X1, X2, ... Resulta que en muestreo no hay tales, sino que existen características de interés X1,..., XN que no son variables, no son aleatorias y se consideran parámetros fijos pero desconocidos. Por esa razón, los argumentos de las leyes no son pertinentes.

    ReplyDelete
  9. Como está Dr.
    Su comentario me parece muy exagerado al decir que no podemos decir nada respecto a un tema en especial de estadística, siendo solamente estadístico. Entonces la pregunta, ¿necesito ser Doctor para opinar?? Me disculpa pero no estoy de acuerdo con su apreciación. Está limitando la libertad de expresión y pensamiento estadístico de las personas, especialmente en los estudiantes de pregrado. Además está siendo muy regionalista en su apreciación de que en Bogotá se están especializando en muestreo.

    ReplyDelete
  10. Gracias por su comentario... Yo no soy doctor... Por otro lado, cualquier persona puede opinar sobre cualquier tema... Sin embargo, por la falta de conocimiento, se pueden generar argumentos absurdos, como el de las poblaciones infinitas. Hablo de Bogotá, pues es de lo que sé... Pero, si usted sabe de otras regiones, le agradecería que nos informara. Saludos. AG

    ReplyDelete