03 marzo 2014

Inferencia Bayesiana para dummies


Imaginemos el siguiente juego: nuestro oponente tiene en una mano un dado común de 6 caras y en la otra un dado de 12 caras, siempre tira los dados con la misma mano y nosotros no vemos los resultados, pero si sabemos cada vez que el número es mayor o igual que 4, con que mano fueron tirados. Noten que no nos dicen el número, solo si es o no mayor o igual que 4.

Sabemos que el dado de 12 caras tiene más probabilidades (0.75) que el de 6 (0.5) de dar números mayores de 4, así es que si observamos muchas tiradas podríamos suponer con facilidad en que mano estaba ese dado. Pero tenemos una restricción: hay que pagar por cada tirada, así es que deseamos hacer la predicción con las menos tiradas posibles.

Este juego simple es el que usó la profesora para introducirnos al Enfoque Bayesiano. Se trata de un juego donde tenemos que balancear el costo de pagar muchas tiradas para estar más seguros contra el riesgo de hacer una predicción equivocada por observar muy pocas tiradas.

Al principio del juego, si no tenemos ninguna información privilegiada, las probabilidades que el "dado bueno" (de 12 caras) esté en la mano derecha o izquierda son 0.5 en cada caso. Tenemos entonces dos hipótesis en competencia: H1: el dado bueno esta en la mano derecha y H2: el dado bueno está en la mano izquierda.

Se hace la primera tirada y nos informan que la mano derecha obtuvo un número mayor o igual que 4. Recuerden que nuestras probabilidades eran 0.5 para ambas manos ¿podríamos decir ahora que estas probabilidades cambian?, si, según el enfoque bayesiano podemos estimar que la mano derecha tiene una probabilidad "un poco mayor" que la izquierda. El cálculo de cuan "poco más" se hace aplicando el Teorema de Bayes a partir del árbol de probabilidades que muestra la figura


La probabilidad obtenida para la mano derecha ahora es de 0.6 y se conoce como "probabilidad posterior dado que hayamos obtenido un buen resultado en la mano derecha" (probabilidad de la hipótesis, dados los datos). El método bayesiano entonces es iterativo y actualiza las probabilidades a medida que va recolectando datos, produciendo un efecto de sintonía fina para obtener predicciones más exitosas. Para la segunda iteración entonces las probabilidades serán H1 (0.6), H2 (0.4) y así se suponer que puede obtenerse una convergencia más rápida y con menos tiradas que permita establecer la hipótesis correcta.

Una debilidad más o menos evidente es que si nos equivocamos en la estimación inicial de probabilidades el error se puede amplificar (por eso en este juego hicimos una "educated guess" de 0.5-0.5 al partir) pero ese efecto se hace más débil mientras más datos se recolectan.

Había leído muchas introducciones al uso del Teorema de Bayes pero ninguna tan clara y sencilla como esta. Se las mandó la profesora Mine Çetinkaya-Rundel, me aclaró un montón de puntos oscuros que tenía acerca del método.

17 comentarios:

  1. Interesante planteo.
    Respecto del cambio climático, siempre el tema podrá ser llevado a un caso único y por tanto imposible de probar con estadísticas. Necesitaríamos disponer de varios planetas habitados, algunos con tecnología de extracción de hidrocarburos y otros no, y que los primeros tengan calentamiento global y no los demás, etc..
    Para mí está probado, como dice el señor Miguel. Un poco bayesianamente: ¿ cuántas posbilidades tiene un pronóstico falso de tener éxito?. Hace unas décadas unos químicos del aire empiezan con la tesis, se les dice primero que los datos de temperatura no son concluyentes. Pero después vienen el retroceso de los glaciares, de las capas polares, los insectos tropicales que migran hacia latitudes más altas, el aumento de los fenómenos climáticos extremos y el promedio térmico también sube.
    Ergo se les dice que la Tierra ha cambiado mucho muchas veces. Pero cuántas veces cambió después que se enunciara una teoría que avisaba del cambio?
    Esto no es como el error malthusiano de creer que la Tierra se iba a superpoblar si no había pestes ni guerras ni crisis alimentarias. Los ricos dejaron de tener hijos, eso no lo adivinó Malthus.
    En cuanto a la aceptación de las hipótesis científicas, a eso muchas veces se lo anuncia muy asepticamente. Según Kuhn, las teorías nuevas surgen más que nada para desrmar la galleta de inconsistencias que tenía una teoría anterior - por ejemplo, la sencillez copernicana para dejar de lado la madeja ptolemaica - y al principio es más que nada intuición.
    Quiero decir, es muy lindo decir que la teoría es seria basada en un montón de datos pero la verdad es que al principio no están los datos porque nadie hizo los experimentos adecuados a la nueva teoría.
    Por eso la predicción acertada es psicológicamente tan potente, aún en la ciencia.

    ResponderBorrar
  2. Ah Ulschmidt, en el caso del "calentamiento global" la hipótesis es que el aumento de las temperaturas es causado por el uso de hidrocarburos.

    De entrada, tal como dices no se puede hacer un estudio experimental con esto, solo observacional y a lo más que se puede llegar es a establecer una correlación.

    Pero resulta que hay muchas correlaciones posibles con un aumento de temperatura, entre ellas que la falta de piratas es la causa del calentamiento, porque hay una correlación casi perfecta http://www.forbes.com/sites/erikaandersen/2012/03/23/true-fact-the-lack-of-pirates-is-causing-global-warming/

    Bueno, yo veo otra correlación todavía más clara entre el surgimiento de los negocios de energías no convencionales (subsidiados) y la aparición de estudios contra el uso de hidrocarburos, lo que me hace pensar -junto con las dificultades para probar seriamente una hipótesis contra el uso de hidrocarburos- que se trata de un negociado.

    Por eso me molesta el uso de métodos seudo científicos para dar una falsa respetabilidad ante la opinión pública ignorante a opiniones que se deberían discutr en el campo que les es propio, en este caso el político y económico. Los "argumentosd científicos" en estos casos son muy distintos de los argumentos de las ciencias físicas o químicas porque los métodos usados también lo son. Solo tienen la apariencia, el lingo de estas ciencias para hacerse pasar como respetables.

    ResponderBorrar
  3. Sorry Bradanovic, pero lo que dices es basura pura.

    No niego que haya aprovechadores, estos los hay en cualquier circunstancia. Hay tantos o mas intereses detras del petroleo que de las energia no-convencionales, sin embargo tu ves solo ahi una conspiracion.

    La evidencia del calentamiento global NO viene solo del reciente aumento de gases invernaderos y su correlacion con temperaturas globales.

    La evidencia viene de muchas otras fuentes, incluida la correlacion geologica de temperaturas y concentracion de CO2, la cual es excelente. Viene del estudio de las propiedades fisicas de los gases invernaderos. De modelos atmosfericos. Del estudio de atmosferas planetarias donde los modelos atmosfericos son puestos a prueba. Del balance termico. Del estudio del Sol. De un monton de experimentos de laboratorio. Etc, etc, etc.

    Poner en duda toda esa evidencia es ser mas que ciego es caer en la tontera.

    Lo que puedes discutor si quieres es de los posibles efectos, pues ahi no existe acuerdo cientifico.

    MV






    ResponderBorrar
  4. Para bajar a tu mísero nivel te contestaré que estás comentado una burrada.

    Lee bien lo que estoy diciendo:

    1.- que la hipótesis causa-efecto entre el uso de hidrocarburos y el calentamiento global, es observacional, o sea solo puede establecer una correlación

    2.- si existe o no un calentamiento global es un asunto que no conozco y del que no me pronuncio en ninguna parte

    3.- que la falta de pensamiento crítico y la aceptación ciega de "argumentos científicos" es tremenda, como ejemplo pongo esta que establece ciegamente una relación causal basada en correlaciones y pongo el caso de la correlación con los piratas como un ejemplo, deben existir cientos de otras, es cuestión de buscar.

    ResponderBorrar
  5. No, porque la correlacion entre el aumento reciente del CO2 atmosferico y temperatura superficial NO ES la unica evidencia.

    Tu lo pones como que lo fuera. Eso es falso.

    MV

    ResponderBorrar
  6. No agregaste ni una sola en toda tu perorata. Entiende que no es el calentamiento global lo que discutimos, sino la relación causal con los hidrocarburos. Eso no está ni remotamente "probado"

    ResponderBorrar
  7. Bueno, de última, el cambio climático es un hecho y algo hay que hacer al respecto.
    Digo, que si se demostrara que se debe a la escasez de erupciones volcánicas que produzcan oscurecimiento y enfriamiento de la atmósfera durante los últimos dos siglos IGUAL algo intentaría el hombre para controlarlo.
    Y de lo único que se sabe es del efecto invernadero del CO2 como eventual mecanismo de control.
    Hay proyectos como arrojar bombas atómicas en la Luna para que el halo de polvo circunvale la Tierra y la enfría un poco, pero todavía son un poco locos.

    ResponderBorrar
  8. Se pueden poner en órbita grandes paneles fotovoltaticos para que den sombra y transmitan la electricidad a la tierra mediante microondas, reemplazando generación con combustibles fósiles...total, proponer ideas locas es gratis

    ResponderBorrar
  9. Creo que ese es otro gran error Ulschmidt, aunque suene muy de sentido común lo que en realidad conviene en economía suele ser muy contra intuitivo.

    ¿Deben los gobiernos gastar billones y prohibir ciertas actividades económicas solo por si acaso, en un intento por "restaurar" un equilibrio supuestamente roto?

    Económica y socialmente no tienen ningún sentido, el famoso "equilibrio ecológico" jamás ha existido en la historia y aunque no nos guste vivimos en un universo precario y cambiante, en lugar de ese supuesto equilibrio lo que hay es una lucha continua de adaptación al cambio.

    Siempre han existido cambios climáticos, existió una edad del hielo mil veces peor que el calentamiento global con el que nos asustan los catastrofistas.

    En cualquier caso es pura retórica: se van a seguir usando los combustibles fósiles hasta que se terminen como corresponde hacerlo y las personas se irán adaptando a las condiciones cambiantes como siempre lo han hecho.

    ResponderBorrar
  10. Yo creo que el ser humano se ha preocupado de mantener el equilibrio con el ambiente desde siempre. Construyeron las Pirámides nada más para enterrar a sus faraónes-dioses, y las pirámides truncadas aztecas para sacrificar unos miles de prisioneros al año para que no se apague el Sol.
    En Nazca se la pasaron alineando piedras para hablar con los dioses, en imágenes que ninguno de ellos podía realmente ver.
    Tantas proezas arquitectónicas que son una grave carga para la economía del momento pero ayudan al futuro del turismo.
    Entonces una canalización lógica de ese impulso por controlar el futuro y pactar con el Crador es lógico que ahora se canalice por la cruzada climática.
    Encima ahora hasta es posible que sea cierto que salvamos el Mundo.

    ResponderBorrar
  11. jajaja ¡bingo!

    Muy cierto, creo que se trata de algo parecido.

    Anónimo, así es, las soluciones sin presupuesto son las más lindas de todas "soñar no cuesta nada" jaja

    ResponderBorrar
  12. Claramente el culpable es el señor de arriba grande y amarillo que nos ilumina todos los días (EL SOL).

    Y creo que son ciclos. En los 70 los metereologos estaban asustados porque la temperatura media del planeta descendía año a año ( aun cuando el uso del diésel y derivados en la industria y en el transporte, aumentaba a pasos agigantados)

    El pto que le doy a Tomas es que el "calentamiento global" generó toda una industria , que es bien lucrativa: simposios, estudios, nuevas carreras, nuevos dptos. en los gobiernos, nuevos instrumentos financieros como los bonos de carbono.; y que va ser difícil que desaparezcan ( o que quieran que desaparezcan).

    Siempre digo que lo mejor de esto es que se buscan alternativas a la de estar quemando petróleo por siempre ( ya van como 120 años de ese camino), no todas van a resultar o ser prácticas, pero hay mejora de conocimiento y a la larga creo que se va a poder tener una energía tan masiva como el petróleo , pero mas limpia y espero mas barata.

    ResponderBorrar
  13. Claro que hay una industria muy rentable a costa de asustar a la gente cuando hagamos lo que hagamos a cada uno de nosotros nos va a llegar igual la hora de estirar la pata. Si hay algo ridículo es todo ese catastrofismo de los ambientalistas.

    ResponderBorrar
  14. Hoy no es posible pronosticar la temperatura a 5 dias. Ahora a un siglo...

    ResponderBorrar
  15. Eso es otra parte que ni habíamos tocado, los modelo hacen unas simplificaciones bestiales de cosas complicadísimas como son el clima (que puede cambiar por el aleteo de una mariposa, como dicen). Basta con que algún doctor o premio nobel de lo que sea dé su bendición y la tracalada de giles se lo traga.

    ResponderBorrar
  16. Le dejo un apunte sobre el tema del cambio climático. Es una idea que leí en alguna parte pero no recuerdo dónde. La gente que defiende la idea de que el causante es el ser humano basa su afirmación en la imposibilidad de negar la existencia de dicho cambio. Obviamente no es lo mismo señalar la existencia de un problema que averiguar su causa. Pero existe un cierto espíritu de búsqueda de la certidumbre a cualquier precio en base al cual, la existencia de un problema justifica de por sí la creencia en la causa señalada.

    El núcleo de la Tierra es un reactor termonuclear. La desintegración es un fenómeno aleatorio puro ( cuántico) y no periodizable. Dentro del enfriamiento general del planeta, patata caliente, hay momentos de repuntes de la temperatura por la disipación de toda esa enorme energía nuclear hacia la corteza. Es la propia Tierra, de vez en cuando en las escalas geológicas, la que se calienta por dicho efecto.

    A mi personalmente me pareció una buena teoría. Es cuantitativamente creíble ( lo que no sucede con el efecto invernadero de la industria).

    ResponderBorrar
  17. Claro Anónimo, existen muchUs4as explicaciones para el cambio climático, miles, pero por motivos políticos y económicos se escoge y promociona solo una, la reducción de CO2 ha dado paso a muchas industrias que de por si no son rentables ni eficientes, como los paneles solares para plantas de potencia, los ambientalistas no son para nada desinteresados (bueno la mayoría son simplemente ignorantes que repiten argumentos de autoridad) pero hay muchos US$ en juego.

    Lo más divertido es que lo normal es que el clima siempre cambie, de manera más o menos violenta, lo anormal es el período de estabilidad que hemos tenido por tanto tiempo, aunque son segundos en tiempo geológico.

    ResponderBorrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"