17 abril 2015

Big Data, modelos y estadísticas



Doctor Strangelove nos enseña como ganar en la bolsa
Lástima que este video no tiene subtítulos. Encontré una investigación interesante del profesor Tobias Preis que muestra como la cantidad de búsquedas de algunas palabras en Google o en Wikipedia podrían usarse para predecir la subida o baja en el precio de las acciones. El análisis de búsquedas de Google parece una técnica de big data sencilla, al alcance de cualquiera y como decía en una entrada anterior podría usarse para predicciones basadas en el principio de "sabiduría de las multitudes", solo hay que ponerse a jugar un buen rato buscando correlaciones.

Claro que lo que propone este "Doctor Strangelove" no serviría para ganar de manera consistente en el mercado de valores, porque el sistema anulará a cualquier predictor consistente en mediano plazo, pero supongo que serviría para hacer unas cuantas pasadas antes que los demás se den cuenta. En todo caso nos da una idea del poder que puede llegar a tener el big data.

Un bombón de los modelos matemáticos
Encontré otro video de Clio Crewsswel, que trata de vender el enfoque opuesto -de los modelos matemáticos- este si que se puede obtener con subtítulos en español haciendo click en el icono de rueda dentada y escogiendo el idioma. Es muy divertida  aunque superficial, se lo perdono por rica, nada más.



En su propaganda a los modelos matemáticos no se toma la molestia de aclarar cuales son las restricciones y simplificaciones de los modelos que muestra, los vende como "muy sofisticados" pero no tengo dudas que deben ser simplificaciones brutales y las conclusiones, como podemos ver, son todas triviales. Es un buen ejemplo de lo que he escrito contra los modelos matemáticos del comportamiento humano pero como ya dije, se le perdona todo por RICA.

Estadísticas de EdX
Todos estos ociosos paseos por Youtube solo muestran a que nivel está llegando mi desocupación, para aprovechar un poco el tiempo empecé con un curso de EdX llamado I -heart- Statistics de unos profesores de la Universidad de Notre Dame. No lo voy a seguir completo pero me interesa entender algunas cosas fundamentales de la estadística frecuentista que nunca las he entendido bien. Normalmente los cursos de estadística caen en enseñar en detalle los procedimientos y fórmulas, como si fueran recetas de cocina, pero muy pocos se dedican a justificar o explicar las ideas que hay detrás de los procedimientos.

Está lleno de number cruncher, expertos en usar programas estadísticos como el SPSS o el R, que interpretan con gran seguridad los resultados de las pruebas, pero muy pocos tienen realmente idea de lo que están haciendo. A mi lo que me tiene especialmente intrigado es la relación entre estadística y el análisis combinatorio, es algo que se estudia al comienzo de los cursos pero se olvida o se deja de lado demasiado pronto para mi gusto. Creo que mucha gente pierde de vista esa relación, que -al menos como yo la veo- es parte fundamental de las pruebas estadísticas, muy importante para entender que diablos significan.

Es muy curioso, la mayoría de los profesores de estadística que he tenido tienen poca idea de lo que hablan, o si saben algo no se nota, o no son capaces de explicarlo. Cuando uno los aprieta un poco con preguntas se van enseguida al argumento de autoridad. Es muy parecido a lo que pasa con muchos profesores de microeconomía, se manejan muy bien con la mecánica pero no tienen idea de que es lo que están haciendo. Bueno, hubo una excepción, mi primer profesor de estadística don Erich Glass tenía la película muy clara, pero ya está muerto, fuí bien amigo con él y me encantaría poder hacerle unas preguntas ahora que he estudiado un poco más del asunto pero ya no hay caso.

En fin, está estadísticamente comprobado (que frase más odiosa y falsa) que el ocio es la madre de todos los vicios. Por estos días yo debería ser un vicioso perdido, sin remedio.

8 comentarios:

  1. Existe alguna razon de que gente que sabe "la papa" como ganar en la bolsa, prefiera hacer videos sobre eso? Y que de hecho ganan mas plata con eso?

    Recuerdo que alguna vez lei una entrevista al chino-canadiense (?) que creo 'la formula' para calcular el riesgo compuesto de los creditos subprimes. El decia, que no habia ningun problema si unos pocos la ocupaban, pero la cosa no funcionaba si todos la hacian. Algo como esto:

    http://xkcd.com/958/

    MV

    ResponderBorrar
  2. jaja excelente caricatura. Yo creo que tiene razón, es un asunto de oportunismo, en economía los comportamientos oportunistas son tácticamente exitosos o sea se pueden hacer pasadas que solo funcionan una o dos veces y así es como funcionan casi todos los negocios.

    Por eso yo dudo que sirvan los modelos, ni en economía ni en ninguna de las ciencias sociales porque el éxito en estos casos se basa en la impredictabilidad (o como se diga, lo que no se puede predecir). Eso de que "el riesgo se premia" o "el lucro está en el riesgo" es más profundo de lo que parece, al menos en negocioscasi todo se mueve gracias a la incerteza, de existir alguna manera de predecir se llegaría rápidamente a una situación de equilibrio y la economía se destruye porque queda inmovil, es lo imprevisible lo que le da movimiento.

    Pero lo verdaderamente imprevisible, no los "riesgos calculados" o tonteras por el estilo sino que las cosas que son imposibles de predecir, esas son el motor de la economía y de muchos otros comportamientos humanos yo creo.

    Es como si alguien descubre una buena martingala en la ruleta, la puede hacer solo un par de veces porque el propio éxito de la martingala la mata.

    De ahí que para hacer negocios siempre hay que recurrir un poco a chanchullos como información privilegiada, coimas y cosas así, porque nadie especularia (que es el corazón de todo negocio) si la cosa dependiera exclusivamente del azar, pero tampoco nadie puede hacer las cuchufletas de manera consistente todo el tiempo.

    Lo de la bolsa de valores es el ejemplo más bonito, porque las autoridades tratan de que sea una lotería, pero tampoco pueden cerrar todas las puertas al oportunismo y las cuchufletas porque el sistema perdería interés

    Es un poco como cuando dicen que las tragamonedas son máquinas "de habilidad y destreza", aunque sea mentira tine que existir a o menos ea sensación en los que juegan.

    ResponderBorrar
  3. Muy bien la rubia ! Los australianos en general son algo intermedio entre los yankees y los ingleses, y sus logros están opacados por ambos.

    ResponderBorrar
  4. Sin duda Ulschmidt la rubia australiana es un bom-bom, aunque sus ecuaciones no me convencen mucho si se me aparece con esos tacos aguja yo le diría a todo que si.

    De Australia tengo puros estereotipos como Cocodrilo Dundee, la cerveza y ah... La Stupenda, Joan Southerland, una diosa del bel canto.

    ResponderBorrar
  5. y Nicole Kidman, Elie Macpherson, Cate Blanchet y la espectacular Naomi Watts.
    Abundan las rubias hermosas. Igual los australianos se la pasan tomando cerveza en el pub y las dejan solas en casa.

    ResponderBorrar
  6. Diablos Ulschmidt, esa si que es lista, en fin, me imagino que también habrán otras no tan lindas y maridos celosos también, de no ser así emigro mañana mismo, solo para dar un vistazo.

    ResponderBorrar
  7. Yo tuve un muy buen profesor de estadística, de esos que explican el concepto más que las fórmulas. Se llama Ricardo Aravena y está aún en la UC, por si lo ciber-ves por ahí.

    Otro que tiene buena fama es Guido del Pino, pero no podría opinar pues no fui alumno suyo. De Aravena sí puedo decir que es un maestro en el tema.


    Saludos,
    El biministro.

    ResponderBorrar
  8. Yo llego muy bien hasta el anáalisis combinatorio y la estadítica descriptiva, todo eo me parce bastant científico pero pasados a las pruebas de hipótesis, la búsqueda de "significancias" y cosas por el estilo, siempre me han parecido muy, muy débiles y que se prestan para toda clase de engaños. Al final eso de "demostrar" que dos eventos no ocurrieron por azar y que hay una relación causal, creo que es simplemente "vodoo science" una especie de superchería nomás, disfrazada con mucho cálculo.

    ResponderBorrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"