15 agosto 2018

Las mentiras estadísticas



He escrito varias veces acá mismo sobre Sir Francis Galton y su famoso experimento de donde sacó la idea de la regresión estadística. Que tipo más interesante, vivía midiendo frecuencias y anotando todo, me lo imagino haciendo cálculos a mano ¿que no habría hecho con una calculadora o con computadores? Galton fue el precursor del Big Data.

Pero no fue su inteligencia ni us aportes a la ciencia lo más extraordinario de su vida, sino todo lo contrario: inventó una gran herramienta matemática y fue el primero en caer engañado por ella. Es casi un lugar común decir que la estadística inferencial se presta para engañar y presentar conclusiones equivocadas o sesgadas bajo el pretexto de ser "matemáticas" lo que le da un sello de respetabilidad incluso a las ideas ás absurdas.

Basado en sus investigaciones sobre la regresión llegó a las conclusiones más descabelladas. Galton era un convencido de la frenología, es decir que las proporciones del cráneo podían mostrar la predisposición criminal o bondadosa de las personas ¿cuantos se habrán podrido en la cárcel por la mala suerte de haber nacido con la frente estrecha o los pómulos altos? Hoy nos parece un chiste, pero en esos años era un asunto serio, especialmente porque estaba apoyado por el prestigio científico de don Francis.

Víctima de su propia trampa. Los engaños estadísticos, intencionales o no, se siguen perpetrando todos los días. conozco a muchos profesores que se jactan de su preparación, aunque en realidad lo único que saben es alimentar de datos algún software y creer a pie juntillas en la "magia negra" de las mtemáticas, usan modelos con nombres impresionantes, ecuaciones paramétricas, regresiones múltiples y cosas por el estilo, pero la verdad es que ni tienen idea de lo que se trata ni de lo que están haciendo, a lo más leyeron una descripción resumida en las instrucciones del software o en alguna revista y lo usan sin tener idea de lo que están haciendo.

En lugar de tanta ejercitación inútil que se enseña en la educación media, mejor enseñaran cosas con valor práctico como los fundamentos de la economía y de la estadística. Cuando yo sea presidente del Mundo esos serán estudios obligatorios.

12 comentarios:

  1. el "doctor en estadística" engel funciona así y saca siempre conclusiones equivocadas, no le apunta a una, pero tiene un grupo de seguidores más patéticos que esos que le iban a limpiar la mierda a flores en tiempos en que se le respetaba.

    ResponderBorrar
  2. Engek es mentiroso y superficaql, un político disfrazado de economista. Es increíble como cambian sus artículos cuando son cosas que no tienen significado político y cuando si lo tienen, en este último caso miente sin asco. La mejor muestra fueron sus opiniones en defensa de la última reforma tributaria, daban verguenza ajena

    ResponderBorrar
  3. El modelo de eso puede ser muy interesante. Acaso la gente tiene una real idea "subconciente" del valor del peso pero no puede conocerla? ¿acaso cada quien tiene una idea del valor real pero desvía arriba o abajo por tendencias propias? . Pero esto suena increíble. Entonces, otra posibilidad: cada quien tiene un método impreciso por exceso o por defecto de valuar? Entonces, lo que se promedia en el gran número son los individuos que sobrevalúan con los que subvalúan. Nadie sabe, pero la realidad emerge de dos formas opuestas de estimar... es un concepto inasible.

    ResponderBorrar
  4. La explicación causal -y por eso se considera que la regresión es "matemáticamente cierta" es la ley débil de los grandes números, que dice que en muchos intentos los sucesos al azar siempre tienden a converger a cierto valor de probabilidad, no se necesita ningún conocimiento subconciente, solo que las estimaciones sean sin ninguna relación entre ellas.

    Galton inventó también una maquinita muy ingeniosa, la "máquina de Galton" que muestra esto con bolitas que pasan al azar entre ranuras.Es maravilloso verla funcionar
    https://www.youtube.com/watch?v=1DTRzPRfu6s

    ResponderBorrar
  5. Otra máquina de Galton más explicada en
    https://www.youtube.com/watch?v=8P2pfJ_gXPE

    Es la explicación detrás de la "sabiduría de las multitudes" cada estimación puede ser correcta o equivocada, si son independientes y al azar, en un gran número convergerán -en promedio- al valor real porque todos tienen una idea grosera -por ejemplo del peso del buey- nadie dirá que pesa un gramo o cien toneladas, así los errores se anulan y el promedio converge muy bien el peso original

    ResponderBorrar
  6. Buena la clase, a prueba de alumnos dispersos.
    EL tio Taleb, si es una de mis chifladuras leer sus publicaciones, causo cierto revuelo con su ¿existe la suerte?, engañados por el azar. Hay que leerlo.
    Hace un tiempo publicaron en Facebook esta maquinita "magica", aun hay gente que se la cree ;-)
    https://www.youtube.com/watch?v=BQdKEfKxzlY

    ResponderBorrar
  7. Es de las últimas de mi curso, ahora tengo que pulirlas un poco y las mando, todavía tengo tiempo.

    Si leí "Engañados por el azar", muy bueno, lo único que me molesta de Taleb es su admiración por Soros, creo que lo sobreestima caleta.

    Por otra parte hay una conversación muy buena y relajada de Taleb con el gran tyler Cowan, de la Marginal Revolution University, vale la pena verla, está en audio pero tambiém transcrita para los que nos perdemos escuchando inglés

    COn la maquinita que separa colores se les pasó la mano parece jaja

    ResponderBorrar
  8. Ah, el link de la conversación en
    https://medium.com/conversations-with-tyler/tyler-cowen-nassim-nicholas-taleb-skin-in-the-game-black-swan-104620da8a57

    ResponderBorrar
  9. Gracias por el link.
    Me tinca que es asunto de personalidad, el y Soros se pasan el mundo por sus partes intimas, o al menos eso simulan.
    Medium es genial, no se como se financian con 5 dolares mensuale; o cero en mi caso.

    ResponderBorrar
  10. Un día me invitaron a ver un programa de pronósticos climáticos que era espectacular y entregaba unas gráficas excelentes. El asunto se complicó un poco cuando consulte de donde obtenían los datos que se ingresaban al programa y me indicaron que al no tener estaciones meteorológicas en el altiplano, los datos de entrada eran estimados... A reglón seguido pregunte que cuando harían un convenio con el ejército o carabineros para poner un tarrito con una regla para medir la pluviosidad y me dijeron que no estaba considerado... En resumen tendríamos excelentes datos proyectados a partir de un montón de datos sacados de la teoría de los dígitos oscilantes (a dedo)

    ResponderBorrar
  11. jajaja! shit-in, shit-out
    Si a todos los problemas que tiene el muestreo, le agregamos los problemas propios de la estadística ingerencial (no linealidad, dispersión de los datos, etc.) y MÁS ENCIMA le sumamos datos base de manla calidad, tenemos toda una farsa montada y disfrazada con software, números y gráficos.

    La mejor muestra de las miserias de la estadística inferencial son los pronósticos electorales, estos muestran muy bien la naturaleza del asunto: la estadística predice relativamente bien cuando las condiciones son evidentes y cualquiera las puede hacer al ojímetro, en los otros casos solo funciona como una moneda tirada al aire: a veces si, a veces no

    ResponderBorrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"