16 diciembre 2010

Modelamiento para dummies

Bueno, todo conocimiento es aproximado. Un interesante artículo sobre el sesgo de los modelos en el blog de Tercera Cultura me trajo a la memoria la irritación que me produce leer artículos de ciencias sociales que tratan de dar respetabilidad científica a sus opiniones abusando de métodos de las ciencias exactas como los modelos matemáticos y estadísticas.

Recuerdo que el año pasado, cuando recién empezaba a estudiar cosas básicas de economía los profesores me decían "estás haciendo juicios de valor, esto es ciencia y no opinología", lo que me irritaba es que ellos hacían sus propios juicios de valor y los disfrazaban con demostraciones estadísticas o modelos más débiles que la palabra de un político. No digo que los modelos no sirvan, pero no tienen ni la sombra de validez que pretenden darle.

Es curiosa la idea de ciencia que existe desde las ciencias sociales. Normalmente la identifican con la búsqueda de la verdad y piensan que cualquier conclusión que cumpla los protocolos del método científico tiene un valor de verdad especial o superior que aquella que no los cumple. Esto que puede ser válido en problemas sencillos de física o química, pierde casi toda su validez en las ciencias sociales porque la naturaleza de los problemas es infinitamente más complicada.

Las matemáticas son la herramienta por excelencia para crear modelos. Popularmente se cree que son muy exactas, pero nada más lejos de eso, las matemáticas tienen un enorme campo de estudio acerca de las inexactitudes y las aproximaciones. Una de las más populares es la aproximación lineal. Resulta que los modelos lineales son los que nos permiten predecir con más facilidad y nos dan los mejores resultados. Se llaman lineales porque cuando los escribimos en una ecuación nos da la forma de primer grado, o sea la incognita no está al cuadrado, al cubo ni nada de eso y al graficar nos da una línea recta.

Pero retrocedamos un poco y veamos como se construye un modelo: un caso simple es cuando tenemos dos magnitudes variables y están relacionadas porque una depende de la otra. Por ejemplo nuestro auto que se mueve en linea recta a velocidad constante, mientras mayor sea la velocidad, más espacio recorre en el mismo tiempo. Así nuestro modelo se puede escribir en forma de una ecuación donde la velocidad es igual al espacio recorrido dividido por el tiempo empleado: v=s/t

Si la velocidad es constante podemos hacer una tabla que al graficar nos dará una línea recta, porque nuestro modelo es lineal.

La velocidad como una línea recta es un modelo muy conveniente porque nos permite predecir con facilidad que -por ejemplo- en 10 horas a esa velocidad habremos recorrido 20 kilómetros, ¡ni siquiera necesitamos multiplicar, basta con prolongar la recta con una regla!.

Un lindo modelo, pero es ideal porque no hay chofer en el mundo capaz de conducir un auto a la misma velocidad exacta de 2 km/h durante horas y los caminos reales rara vez son perfecta e indefinidamente rectilíneos. De aquí sacamos nuestra primera conclusión: mientras mejor y más exacto es el modelo, también es más trivial y menos útil. Entonces vienen las aproximaciones.

La mayoría de las aproximaciones de las matemáticas consisten en linealizar o bajar el grado de las ecuaciones para tratarlas "como si fueran" líneas rectas. Ya habrán notado que las ecuaciones podemos presentarlas de dos formas, como una fórmula de álgebra (igualdad) o -gracias a Rene Descartes- como la curva en un gráfico. Solo las ecuaciones de primer grado son rectas y las de grado superior (que tienen cuadrados, cubos, etc.) son todas curvas.

Recapitulando: cualquier fenómeno donde tengamos magnitudes variables donde la variación de unas depende de la variación de la otra se puede escribir como una o un conjunto de ecuaciones, o también como una curva en un gráfico. Esto es un modelo matemático porque nos permite saber que valor tendrá una variable cuando cambie la otra, sin necesidad de medirlo: el modelo nos permite predecir.

¿Y como se hace esta predicción? es simple en principio: basta con resolver la ecuación o -lo que es lo mismo- encontrar el largo de la curva o la superficie bajo ella, o sea resolver un problema de álgebra o bien geométrico, ambos métodos sirven. El problema geométrico es simple cuando se trata de figuras con lados rectos: el área de un cuadrado, un tríangulo o cualquier polígono regular es sencilla de calcular y exacta, pero cuando hay curvas la cosa se complica como vimos en la entrada sobre la circunferencia y el número Pi.

La dificultad de hacer modelos matemáticos de fenómenos reales es que los modelos solo entregan predicciones exactas para problemas sencillos, y los problemas sencillos no necesitan modelos, normalmente son predictibles a puro ojo, o por inspección simple para decirlo de manera más siutica. A medida que el problema se va complicando comienzan a aparecer dos clases de inexactitudes: una por la no linealidad que obliga a usar métodos aproximados de linealización.

El otro problema es mucho peor porque estamos obligados a simplificar el modelo dejando fuera todo lo que no nos parece relevante. Aquí es donde la pretensión científica de imparcialidad se nos va al diablo, porque en este punto es donde se introducen sesgos y juicios de valor incluso en los modelos más "exactos". En matemáticas se llama "modelo canónico" al que no tiene simplificaciones ni juicios de valor y prácticamente todos los modelos canónicos tienen bajo o ningún potencial predictivo.

Y eso que hasta el momento solo he hablado de modelos completamente determinísticos, que se pueden representar por ecuaciones simples porque no hay ninguna intervención del azar. ¿Que pasa cuando hacemos por ejemplo un modelo de comportamiento del consumidor? ¿o un modelo predictivo de tendencias políticas?. Aquí viene mi opinión personal: yo creo que esas cosas tienen mucho, mucho, MUCHO más arte que ciencia. Tiendo a confiar mucho más en juicios de valor subjetivos y razonados que en demostraciones estadísticas y elaborados modelos matemáticos, porque, mal que mal, yo algo entiendo de como se cocinan. Hasta mañana.

12 comentarios:

  1. Sistema de control

    Planta sistema politico social: sistema no lineal variante en el tiempo.

    tipo de controlador "democracia emulando pid roñoso"

    Respuesta error futuro Td "gente rango 18-25 años (Salvemos las ballenas)"
    respuesta error actual Kp "gente entre 25-40 años (la economia esta como el ajo)"
    respuesta error acumulado Ti "gente entre sobre 40 años (pinocho tiene la culpa, en los tiempos de alessandri padre...)"

    tiempo de muestreo 4 años

    perturbnaciones de salida: montones muchas imposibles de predecir o medir

    perturbaciones en el sensor: montones, el manejo de la información es brutal

    Salidas del sistema:

    PIB
    nivel de desarrollo
    crecimiento demografico
    otras??

    Entradas del sistema
    * información a las masas
    * tasas de interés
    * política fiscal

    Este control es autosintonizante mediante algoritmo neurofuzzy ... que segun dicen es como las reverendas y el sistema a veces se hace inestable

    ResponderBorrar
  2. ¡Ah Nervio, imagínate entrar variables como "política fiscal"!

    Un festín de sesgo para los cocineros. El sesgo no es malo cuando se acepta, el problema es cuando se disfraza de "ciencia".

    ResponderBorrar
  3. Laplace, integrales, convoluciones... álgebra de bloque!
    Que emocionantes recuerdos. Al final, sabe, cuando llegué a ese momento en que todo modelizador encuentra los límites de la modelización llegué a sospechar que nuestra esclavitud al resultado numérico es el fracaso de la modelización en los sistemas complejos.
    Porque supongamos que no puede calcularse pero que podemos llegar a relacionar que tal variable es lineal, o no lineal, o cuadrática con la otra, o que su maximo ocurre tras la inflexión de la otra, en fin, PERO ESO NOS DEVOLVERIA AL ANALISIS CLASICO Y NOS SACARIA DEL ANAILIS NUMERICO. La integración por intervalos finitos nos liquidó el criterio.

    ResponderBorrar
  4. Ah si, algo me acordé cuando ví el monito que era Laplace para transformar ecuaciones diferenciales en algebraicas. En una entrada anterior confundí las series de Fourrier con la transformada de Laplace, pero no andaba tan perdido porque algo tienen que ver. El descubrimiento de los "operadores" es una de esas genialidades de algún matemático que simplifican la vida a generaciones de sufridos estudiantes!, en realidad nunca entendí bien la teoría que permite convertir derivadas e integrales en multiplicaciones y divisiones (¿o es al revés?) pero para efectos prácticos es genial.

    Yo creo que todos los que hemos hecho algo de modelamiento primero nos deslumbramos con tanta maravilla que ofrecen las herramientas matemáticas, pero si no llegamos a ponerlo en duda y desilusionarse un poco de todo el maldito asunto es que nunca llegamos a entenderlo.

    El que no se ha desilusionado de los modelos es porque todavía no los entiende :D

    ResponderBorrar
  5. Que buenos recuerdos. Hace más de 20 años en los laboratorios de electrónica haciendo de todo para que los datos se ajustaran mínimamente al modelo teórico. Como eso casi nunca ocurría tocaba entrar a "cocinar". Eso si que era ingenio. Cocinar para que todo pareciera consistente es un arte en si mismo. Afortunadamente nunca ejercí de ingeniero. Pero si aprendí muchas cosas útiles.

    ResponderBorrar
  6. Entonces somos doblemente colegas: en lo e cocinar informes de laboratorio y no haber ejercido ;D

    Casi todo lo que lleva matemáticas es cocinable, los proyectos de inversión o la contabilidad por poner solo dos ejemplos. Para que hablar de los estudios de psicología, antropología, sociología, economía etc...

    ResponderBorrar
  7. jeje primera ves que te veo escribir con un emoticon.

    "El que no se ha desilusionado de los modelos es porque todavía no los entiende :D"

    Por mi parte voy en primer año de ciencias politicas aca en temuco, en la universidad catolica de temuco, aun no esta acreditada la carrera pero me tinca y ya estoy dentro.

    Y claro veo mucho de lo dices, y tambien lei el articulo de tercera cultura, me gustan las ciencias duras, son fascinantes, y por lo mismo me copa cuando ciencias blandas como la que estudio, o de rango medio mas especificamente, hacen esas importanciones de modelos o teorias pero a medio pelo. me ha tocado leer papers realemente desastrosos en ese sentido, me parece bien aquella busqueda por datos mas duros, los problemas sociales se pueden solucionar mejor con esa clase de datos algunas veces, la mayoria, y por ello lo veo necesario, sin embargo cuando ya comienzan la paranoias de las ciencias sociales con sesgos enormes, pff, se va a las pailas todo aquel esfuerzo por alcanzar la verdad de veritas que buscan.

    de hecho hay todo un rollo por "ser ciencia", sobrevalorado a mi parecer, mejor acercar de manera mas objetiva "el metodo cientifico" que buscar ese status a palos ciegos

    ResponderBorrar
  8. Exequiel, como yo lo veo hay una especie de deificación de las ciencias exactas, que han tarído muchos avances y comodidades pero solo sirven para problemas bien simples como el rigen del universo,la naturaleza de la materia y cosas así.

    Puede parecer chiste o ironía pero es cierto: es mucho más factible encontrar una explicación buena y predictiva al origen del universo que al comportamiento de un grupo de consumidores o la evolución de una tendencia política, las ciencias sociales estudian fenómenos infinitamente más complejos y estos problemas se manejan mucho mejor con intuición u otras formas superiores del pensamiento, como el "tufómetro" por ejemplo.

    Lógico que la predictibilidad y el % de aciertos es mucho menor, pero es ridículo suponer -como algunos lo hacen- que los fenómenos sociales podrán ser predecibles con un éxito similar a los de ciencias exactas (que si las miramos con cuidado no tienen nada de exactas).

    Lo malo es cuando se usan métodos matemáticos para engañar, confundir y dar apariencia de "respetables" a opiniones o ideología, que pueden ser muy válidas siempre que no se vistan con ropa ajena.

    ResponderBorrar
  9. Eso de cocinar resultados me recordó a cuando en los proyectos de Sw se estima un esfuerzo (pa cobrar las lucas). Por muchas herramientas de estimación que hayan en la empresa, ésta no se utiliza para saber cuantas HH serán necesarias para el proyecto, sino a la inversa, la herramienta de estimación se cocina para que cuadre con las X HH que pronosticó al ojo el personaje.
    Bueno, es otro tema, pero tb hay "cocinadas"

    ResponderBorrar
  10. Ah eso fue lo que más me chocó una vez que trabajé (confieso que he pecado, no lo volveré a hacer) para una empresa norteamericana.

    Me dijeron que me pagaban por hora "¿y como van a controlar cuantas horas trabajé?" pregunté, y me contestaron "bueno, tu nos dices pues". Plop, jamás habia visto algo así, y creo que no es muy raro en ese país.

    Obviamente yo dividí lo que quería ganar por el valor hora, cuidando de no pasarme para la punta y que me llegara la P.L.R. "The chilean way"

    ResponderBorrar
  11. ¿no te sabes las mentiras clasicas de los profesores?:
    "no lo aprendan de memoria...al final lo entenderan"
    "creanme...esto es lo mas aproximado a la realidad"
    "contesten la encuesta con confianza...no los afectara"

    (el profe einstein decia:
    "La realidad es simplemente una ilusión, aunque muy persistente.

    ResponderBorrar
  12. ja! Tom Wilke dice lo mismo "It´s all ilusion" ;D

    ResponderBorrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"