Tuesday, April 7, 2009

¡Pitágoras bruto!

CS002876


En esta semana de reflexión les dejo este mensaje anónimo que llegó a mi correo electrónico… En verdad me ha hecho pensar mucho… ahí les va:




Ya lo afirma Andrew Gelman en su excelente libro Teaching Statistics, si Pitágoras hubiese estudiado estadística… YO opino que si eso hubiese pasado, él nunca habría postulado tan grande estupidez (aunque en realidad fueron sus discípulos quienes enunciaron tal falacia). Falacia y gran mentira puesto que desde hoy yo he tumbado el famoso teorema de Pitágoras. Como decía un gran maestro en una gran universidad… me acabo de tomar un tinto y he tumbado la teoría milenaria de Pitágoras. De paso, voy a demandar al ministerio de educación por lavarle la mente a los indefensos niños… pobres criaturas que nada pueden hacer ante la conspiración de un gobierno que no tiene en cuenta el desarrollo de tan grande y todopoderosa ciencia… la estadística.


Voy a publicar mi descubrimiento en una gran revista… no en una revistica como esas que han salido en el último año en Colombia, dizque para incentivar la investigación de mediocres profesorcitos que jamás saldrán de Cundinamarca… lo mío es grande, es muy grande y digno de la alta alcurnia de la literatura estadística… tal vez JASA o la Royal se ajustan a lo que yo quiero. Si mi universidad me patrocina, me voy directo a las Joint Statistical Meetings que tendrán lugar en Washington… esa será la oportunidad que la ciencia estaba esperando… conocerme a mí. De otra forma, si no consigo apoyo, pues renuncio y me largo al otro lado del charco. Yo sé que allá, en el marco de alguna conferencia del simposio internacional de estadística expondré mi descubrimiento y será muy fácil conseguir trabajo en una universidad de renombre que merezca todo mi saber y mi excelente carisma.


Por otro lado, voy a callarle el pico de una vez por todas a todos aquellos que no creen en la significación estadística… ¡Brutos!... deberían entregar el título… sobre todo ese tal Andrés que, siendo estadístico, le echa pestes y pestes a la ciencia que le da de comer... estoy harto de los blogs y de páginas mediocres que discuten sumitas, resticas y, a lo más, derivadas… ¿y yo qué? Jamás me han mencionado en esas entradas, lo cual demuestra la mediocridad del autor.


Bueno, al grano… después de muchas simulaciones, he descubierto que el teorema de Pitágoras carece de sentido estadístico… es decir, es una mentira. Por ahí dicen y recalcan que la estadística debe tener sentido desde el punto de vista del usuario… jajajaja… que error tan grave… a continuación lo demostraré. Es más, lo demostraré en R.


Me encontré los siguientes datos, que provienen de Pitágoras… yo no sé… pero no me importa la teoría de ese tío… a mí me importan los datos. Los datos de las dos variables explicativas, que las llaman catetos, son



> x


[1] 2.731734 2.063456 1.254018 2.084789 1.301384 1.938547 2.549817 1.144791


[9] 1.947545 2.067407 2.493400 2.074311 2.816731 2.457791 2.093760


> z


[1] 7.234464 6.297769 8.205349 8.614326 7.502430 4.783516 4.360439 6.457423


[9] 4.766488 6.089330 6.560284 6.691666 4.075007 4.113226 4.387267

Y los datos de la variable respuesta, que la llaman hipotenusa o algo así, son



> y2


[1] 59.79984 43.91974 68.90031 78.55295 57.98006 26.63999 25.51499 43.00886


[9] 26.51234 41.35411 49.25436 49.08116 24.53966 22.95936 23.63194

Me han pagado una suma considerable de dinero para crear un modelo… muy fácil… un modelo lineal… un modelo de regresión… un modelo estadístico.



>Call:


lm(formula = y2 ~ x + z)


Coefficients:


Estimate Std. Error t value Pr(>|t|)


b0 -40.9131 4.3625 -9.378 7.13e-07 ***


x    4.5446 1.2352 3.679 0.00315 **


z   12.3628 0.4192 29.490 1.44e-12 ***


---


Multiple R-squared: 0.988, Adjusted R-squared: 0.986

Con un ajuste del 98% he descubierto que


$latex hat{Y}=-40.91+4.54X+12.36Z$


Que nadie me diga que mi modelo no está bien. Bueno, queridos "colegas"… voy a patentar esto… Adios.



Mi respuesta: La regresión múltiple es una herramienta muy potente, incluso sirve para enorgullecer más al estadístico. Qué vaina!!! Que viva la humildad del gremio !!!

18 comments:

  1. Y el de Pitágoras no era este?

    z2 <- z^2
    x2 summary(lm(y2~x2+z2))

    Call:
    lm(formula = y2 ~ x2 + z2)

    Residuals:
    1 2 3 4 5
    -3.691e-17 4.499e-18 -2.462e-17 9.993e-19 5.603e-17

    Coefficients:
    Estimate Std. Error t value Pr(>|t|)
    (Intercept) -1.567e-16 4.057e-17 -3.863e+00 0.061 .
    x2 1.000e+00 3.938e-17 2.539e+16 <2e-16 ***
    z2 1.000e+00 1.555e-15 6.432e+14 <2e-16 ***
    ---
    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 5.064e-17 on 2 degrees of freedom
    Multiple R-Squared: 1, Adjusted R-squared: 1
    F-statistic: 3.235e+32 on 2 and 2 DF, p-value: < 2.2e-16

    ReplyDelete
  2. ¿El punto es...?
    Mmm... parece que no hay punto

    ReplyDelete
  3. Increíble, lo veo y no lo creo.

    Bueno, espero no estar equivocado.
    El teorema de Pitágoras afirma que: “En un triangulo rectángulo la suma del cuadrado de los catetos es igual al cuadrado de la hipotenusa” (Bueno algo así o eso creo, en fin…)

    Ahora según lo escrito (o por lo menos lo que yo entendí)
    La suma de los cuadrados de dos números positivos (Obvio al ser medidas son positivas) se puede expresar como una función lineal más un error, tal que

    Y=-40.91+4.54X+12.36Z+e

    La única restricción que puedo intuir en el escrito es que los dos números son positivos.

    Qué pasa si hago el trabajo más fácil y coloco algunas restricciones (Yo esperaría que si aplica en general, aplicaría para casos particulares). Hacer el mismo análisis utilizando números enteros y asumiendo que los catetos miden igual (X=Z).

    ReplyDelete
  4. Otra forma sería:

    lm(y2~I(x^2)+I(z^2)-1)

    ReplyDelete
  5. Apoyo el incremento del conocimiento, pero eso no es a costa de descalificar a los demás... Simplemente hay que admirar un conocimiento que logró mantenerse más 25 siglos, aunque finalmente, sea superado por algún otro... Ese es y ha sido el devenir de la ciencia a lo largo de la historia. No tenemos motivo alguno para pensar que con el Teorema de Pitágoras sería diferente. Creo que el término "bruto" con el que te refieres a este insigne matemático griego y las frases descalificadoras con las que aludes a unos profesores dañan tu descubrimiento. Para ser un profesional capaz de transfomarse a sí mismo, hay que ser libre y alcanzar la libertad implica desprenderse de esos aires de superioridad. Espero que la JASA o las JRSS (quizá la Series B) te publique tu contribución. otra opción puede ser la revista Sankya (The Indian Journal of Statistics)... Suerte con la publicación

    ReplyDelete
  6. me excuso por haberte acusado de expresarte en forma inadecuada. Comencé a leer desde el recuadro azul y me perdí el principio... Lo siento...

    ReplyDelete
  7. “Que nadie me diga que mi modelo no está bien...” El punto es, Sr. Anónimo, que su modelo (y = -40.91 + 4.54X + 12.36Z) no podría estar mal puesto que éste es meramente una RELACIÓN FUNCIONAL de la verdadera relación entre y,X,Z dada por el TEOREMA DE PITÁGORAS. Los modelos estadísticos no son modelo deterministicos. Los primeros solo son aproximaciones funcionales de los segundos.

    ReplyDelete
  8. “Que nadie me diga que mi modelo no está bien…” Al contrario... todos los modelos, estadísticos o no, están errados... sin embargo, algunos son útiles... Box

    http://predictive.wordpress.com/2008/06/22/modelos-estadisticos-2/

    ReplyDelete
  9. Como lector del blog, y en particular como estadístico, me siento indignado y no comparto la opinión del autor y mucho menos sus comentarios, si es cierto, q no le gustan los blogs, porque envía comentarios a este, tampoco debería utilizar palabras tan fuertes como “estupidez”, y mucho menos ser tan despectivo con los colegas al utilizar frases como “dizque para incentivar la investigación de mediocres profesorcitos que jamás saldrán de Cundinamarca”. Acaso cuantos doctorados tiene nuestro autor anónimo para utilizar estas frases, o con qué autoridad puede hablar de otras personas.
    Es obvia la falta de cultura del autor anónimo, en todos los aspectos, en mi humilde concepto, el que debería entregar el titulo es otro, y si en Colombia no hacemos investigación de su nivel (que por cierto no es muy alto y se comprueba con los comentarios anteriores), lo invito a cumplir su propia frase “me largo al otro lado del charco”.
    Cordial saludo, a todos los lectores.

    ReplyDelete
  10. Extiendo un cordial saludo a todos los lectores y comentaristas del blog (inclusive al anónimo) ... espero que este post haya servido para que reflexionemos... Derfinitivamente nuestra profesión es motivo de orgullo, uno porque es una ciencia per se y dos porque sirve como complemento a otras ciencias o ramas del saber. Pero eso sí, estadística aplicada sin una buena base teórica (bases tanto estadística como de las otras ramas del saber) no sirve para nada.

    Creo que el ejemplo de sacarle la varianza y el promedio a las cédulas o documnetos de identificación quedó mandado a recoger... desde ahora utilizaré este post para hacer caer en cuenta a los alumnos que deben ser conscientes de lo que se hace...

    Saludos a todos (inclusive al anónimo)

    ReplyDelete
  11. Excelente punto Andrés, este blog será un muy buen ejemplo en clase.

    Sin embargo, me pregunto qué ser humano con una neurona en la cabeza, que haya visto al menos un curso de matemáticas en su vida, sería capaz de contradecir el teorema de Pitágoras con un argumento tan absurdo como el de el escrito. ¿Ese anónimo realmente existe?

    ReplyDelete
  12. Por respeto al autor anónimo no publicaré ni su nombre ni su correo. Sin emabrgo, le deseo suerte en la publicación de su artículo o en algún congreso internacional al otro lado del charco, donde sería bien recibido.

    ReplyDelete
  13. Anonimo dice:
    La suma de los cuadrados de dos números positivos (Obvio al ser medidas son positivas) se puede expresar como una función lineal más un error, tal que
    Y=-40.91+4.54X+12.36Z+e

    Agradeceré citar la fuente para deducir eso.Que servira de mucho


    Y apoyo a IVAN, el modelo no debe acaso ser:
    x2= x^2
    z2=z^2
    summary(lm(y2~x2+z2))

    ReplyDelete
  14. Hubiera sido leer este post hace buen tiempo, y decirle al señor anónimo que no es para nada comparables con Pitágoras, quien presenta una ley general. Por lo contrario aquí solo se presenta un modelo para un rango muy pequeño de x e z donde se puede ajustar un modelito manipulado, pero si intentas extrapolar este modelo no servirá porque en rangos más grandes se notará que la relaci{on existente no es lineal.

    ReplyDelete
  15. Dejando a un lado lo polémico del estilo, lo que realmente se pregunta el anónimo es: ¿para qué modelar? ¿qué es un modelo? ¿qué validez tiene?
    Mucha gente quiere un modelo estadístico-matemático de un fenómeno. Debemos cuestionarnos, qué es y para qué sirve lo que estamos haciendo. A menos que queramos seguir diciéndole al investigador:
    " - Lo que usted necesita es un modelo lognormal lineal multivariado. - Y eso qué es? - Pues lo que usted necesita."

    ReplyDelete
  16. bueno, aunque el objetivo parece que es sugerir un mal uso de los conceptos, en general se tiene que , en la versión del teorema de pitágoras en algebra lineal que en un espacio vectorial (V) con producto interno, la hipotenusa es igual a la suma de los cuadrados de los productos interiores de ella con cada vector que pertecene a un conjunto ortonormal de vectores (S) e V. Esta igualdad se cumple si y solo si la hipotenusa pertenece al espacio generado por S. Lo anterior, se ilustra en la desigualdad de bessel, que se necesita para demostrar que la mejor aproximación de la hipotenusa al espacio generado por s, se tiene cuando se cumple una extensión de esta desigualdad, que por supuesto es el enfoque vectorial de la regresión lineal (sin tomar en cuenta el espacio de los errores, que surge en modelos lineales). Sin embargo, como los elementos del espacio vectorial, son vectores (en este caso no son aleatorios) pues no tiene sentido tener en cuenta el espacio del error. Sin embargo, de hecho el teorema de pitágoras, se usa (en su forma vectorial) para demostrar esta aproximación de la que se habla.

    ReplyDelete