07 septiembre 2020

Twitter y las encuestas

Encontré interesante este twitt de Pepe Auth, el auto asumido "experto electoral" de la Concertación, creo que toca un tema que puede ser de mucha importancia en la política a futuro, que es el valor predictivo de las encuestas por Twitter y el uso de las empresas encuestadoras como parte de los aparatos de propaganda de los partidos políticos

Desde que yo era chico recuerdo que había empresas encuestadoras dedicadas a "sondear" la opinión pública y era claro que algunas de estas empresas eran solo agencias de propaganda, como MORI de Marta Lagos, que ni siquiera le cuadraban los porcentajes y más de una vez pasó vergüenza cuando se lo hacían notar mientras estaba exponiendo sus resultados. Pero también habían encuestas "serias", que trabajaban con las universidades para diseñar el muestreo y se preocupaban por seguir las normas técnicas aceptadas de los "experimentos estadísticos", un ejemplo de esto sería la encuesta CEP.

El problema es que las empresas deshonestas pero tampoco las serias han sido predictivas, lo que me hace pensar que la estadística inferencial, como método, no tiene valor predictivo relevante cuando se trata de hacer estimaciones y pronósticos de opinión pública,. A estas alturas, para mi ya es algo evidente.

Solo recordemos el fracaso de todas las encuestadoras, que daban un porcentaje cercano o mayor al 50% a Sebastian Piñera en primera vuelta mientras que sacó apenas 36.8%, también daban entre un 1% y 3% a J. A, Kast, que sacó 7.9%. Claro que las encuestadoras se podrían defender diciendo que "pronosticaron" el triunfo de Bachelet en 2013, donde dos empresas se acercaron bastante (CEP y Opina Mercurio), pero en ese caso la tendencia era clarísima, Bachelet estaba el el peak de su popularidad, era "la mami de Chile" y no se necesitaba ninguna encuesta para predecir que ganaría a Matthei, candidata sin carisma ni arrastre electoral.

En suma, los sondeos de opinión no sirven para predecir decisiones humanas, excepto cuando el resultado es evidente, bien porque las empresas son deshonestas y se usan como herramienta de propaganda o bien por limitaciones intrínsecas del método estadístico, que hace fallar incluso los pronósticos de las empresas más serias.

En los años 60-70, cuando todavía había gran confianza en la estadística "científica", la empresa americana Gallup tenía un enorme prestigio y se le consideraba un oráculo electoral. Hoy muy pocos le hacen caso después de una larga serie de pronósticos fallidos. En general, los sondeos de opinión pública solo son útiles para pronosticar victorias abrumadoras, y para eso no se necesita hacer ninguna encuesta. Una interesante historia de los sondeos se puede leer en Wikipedia.

Twitter
Para el plebiscito que se viene en octubre, está ocurriendo un fenómeno inusual porque, como dice Auth "en todos los sondeos el apruebo dobla o más el rechazo", es decir que según él, la opción "apruebo" ganaría por mayoría arrolladora. Sin embargo se han hecho cientos da encuestas en Twitter y ninguna ha dado por ganador al "apruebo" en esas condiciones, de hecho CNN dejó de hacer esas encuestas porque el resultado favorecía sistemáticamente la opción "rechazo".

Hay distintas explicaciones para esta discrepancia, pero dos son las principales que se usan para desacreditar las encuestas de Twitter. Una explicación sería que Twitter es una "cámara de eso" donde la gente se junta solo con quienes tiene afinidad de opiniones, así es que las encuestas solo reflejarían el eco de grupos de opinión muy similar. La otra explicación son "los bots", es decir que existen miles de cuentas falsas, automatizadas, destinadas a inclinar las tendencias en un determinado sentido.

Ambas cosas son ciertas, pero no explican esta discrepancia entre las encuestas de empresas y las encuestas de Twitter. Es verdad que existen "cámaras de eco" donde todos pensamos lo mismo y publicamos prácticamente lo mismo, dando ánimos a nuestras respectivas posturas con twitazos, trending topics y tonteras por el estilo, pero las encuestas del plebiscito no han sido hechas soloen cámaras de eco del "apruebo", sino en diferentes sitios de los medios, que tienen una audiencia transversal y prácticamente siempre los resultados han dado lo mismo . 

Entonces la segunda explicación serían "los bots". Es un hecho que existe gente y organizaciones dedicadas a crear falsas cuentas para publicar twits y votar en las encuestas, pero esta es una moneda de dos caras: los bots existen para ambas opciones y no hay ninguna explicación razonable por la que los bots del "rechazo" sean más que los del "apruebo". Otra cosa es que por los factores tecnológicos involucrados, es muy difícil que los bots sean más que unos pocos miles, si es que llegan a esa cantidad, porque para cada 8-10 bots más o menos  hay que comprar un teléfono celular y una tarjeta SIM, no me parece que sea algo tan masivo como para generar artificialmente una tendencia sin que se note.

Ni las cámaras de eco ni los bots pueden establecer una tendencia arrolladora en un sistema donde participan millones. En Chile Twitter tiene unos 4.8 millones de cuentas que son regularmente depuradas por la empresa, si pensamos en un millón opinando sobre política, las encuestas de Twitter, -donde no se puede votar dos veces desde una misma cuenta- probablemente tienen mucha más transparencia que los sondeos de opinión hechos por empresas, funcionan con muestras mucho más grandes, las distorsiones son conocidas y probablemente tenderán a anularse entre sí.

En fin, nos queda muy poco para ver quien tiene la razón, si las empresas encuestadoras o las encuestas de Twitter. En sus inicios, la mayoría de la gente despreciaba las redes sociales, diciendo que eran un antro inútil donde los menos educados publicaban cualquier estupidez. Pero a medida que han ido creciendo se puede dar el caso de "la sabiduría de las multitudes" y podría ser que incluso con métodos sucios se llegue a predicciones limpias y mucho mejores que los actuales métodos estadísticos, que desde hace años vienen mostrando que son inútiles y mucho más fáciles de manipular.

Si yo fuese a favor del "apruebo" estaría bastante preocupado por esta discrepancia entre Twitter y los sondeos de opinión, porque nos podríamos llevar una gran sorpresa, algo como lo que se vio para el Brexit por ejemplo.

14 comentarios:

  1. Desde hace años las encuestas no cumplen con la condicion basica: que cada gil de la poblacion tenga igual probabilidad de ser encuestado; en un pais es fiscamente impracticable, entonce se usan sucedaneos a los que se aplica un error estimado que corresponderia "si la encuesta fuese probabilistica". En chileno: chiva.
    Pero ademas hay sesgos por todos lados, La gente dejo de contestar encuestas en sus casas, y en la calle pocos se quedan a contestar y se seleccionan mas o menos al lotijuay , no hay manera de atinar a una muestra telefonica, es tan buena, o mala, como cualquier "encuesta periodistica", y no hay manera de saber si la gente encuestada habla desde la correccion esperada en el ambiente politico, ni si cambiara de opinion (si es que la tiene), cuando vaya a votar.
    EL asunto de las respuestas esperables es mucho mas distorcionador cuando se trata de asuntos controversiales con una posicion o ambas, muy duras.
    Al final el trabajo estadistico puede ser bien hecho, aunque eso solo consta en las que publican sus bases de datos, pero ese analisis vale una hectarea de callampas como pronostico.

    ResponderBorrar
  2. ¿Puedo compartir un enlace? Me da lata no compartirlo, son mas de 40 GB de libros y no se cuando lo cierren.
    https://mega.nz/folder/ZUZRzIwA#m7V1lWL4hmO3APQYRll0Ew

    ResponderBorrar
    Respuestas
    1. Hay algún índice o clasificación de contenido? Gracias por tu dato.

      Borrar
  3. Claro que si Wilson, hay tres tipos de problemas con las encuestas: uno es que resulta casi imposible cumplir con los requisito etadísticos de una "buena muestra representativa" sobre asuntos de opinión en la vida real, eso tiene muchos problemas como los que mencionas, además está el conocido problema de las "preferencias declaradas versus las reveladas". Otro tipo de problemas es que para una encuesta resulta sumamente fácil falsificar los datos recolectados, hay toda una cadena que va desde los que toman los datos, quienes los procesan, quienes los analizan, etc. que pueden falsearlos con la más completa impunidad. Como si fuera poco hay un tercer problema con las limitaciones intrínsecas del método estadístico, que no funciona bien con seres humanos, un buen ejemplo de esto es la econometría, que a partir de una mism situación llega a conclusiones otalmente diferentes usndo métodos mucho más "limpios" y verificables que las encuestas de opinión, la econometría -que usa la misma clase de estadística, es igual de mala para hacer pronósticos, por eso ningún economista se hace rico, en cambio se dedican a dar clases como asalariados durante toda su vida

    ResponderBorrar
  4. Datazo como siempre Wilson!!, estoy embelesado ojeando el nuevo Kamasutra ahora mismo

    ResponderBorrar
  5. Lo de Wilson siempre es bueno. Me trae a la memoria,
    últimamente estoy escuchando conferencias con celular y auricular antes de apoliyarme (dormir, en lenguaje tanguero) . Sigo mucho a la Fundaciòn Juan March que tiene conferencias grabadas desde 1975 sobre temas como cerámica griega o los rollos del Mar Muerto.
    Normalmente no las termino pero duermo como un angelito y espero que la cultura ingrese en la capa subliminal del cerebro.
    https://www.march.es/conferencias/anteriores/

    Por ejemplo, hace como 10 noches que no puedo terminar "Aproximación al período Edo" con la profesora Kayoko Takagi . Su modulada voz oriental que adormece siempre, pero cualquier día saldré hablando del arte del laqueado, estoy seguro.

    ResponderBorrar
  6. ¡Otro datazo! Ahora mientras hojeo el Nuevo Kamasutra escucho la lectura teatralizada de textos de Fausto, que buen sitio ¡gracias Ulschmidt!

    ResponderBorrar
  7. En mi politizada familia, hacemos una polla de las elecciones. Una de ellos, contra todo pronóstico (por ser la menos aficionada al tema político), acertó exacto el resultado, llevándose obviamente el pozo para ella sola. Había copiado a la pata el resultado de la encuesta por Twitter del chino Rios. De su variopinto e inmenso grupo de seguidores, respondió su encuesta unos 100 mil si mal no recuerdo. Acertó seco.
    Creo que cumple varias condiciones. Muy masiva y allí hay de todos lados.
    Que Cadem ni nada. Yo estoy esperando al chino Rios.

    ResponderBorrar
  8. Marcelo, yo creo que las redes sociales serán la muerte de las empresas encuestadoras, es cuestión de tiempo que se establezca algún sucesor de Twitter pero de Open Source, que no tenga un dueño y se empiecen a organizar sitios de apuestas, eso dará resultados MUCHÍSIMO más exactos que los métodos estadísticos que se usan hoy en las encuestas. L sabiduría de las multitudes funciona, cuando realmente son multitudes, con todos los defectos y errores, creo que ese será el camino que tomará no solo la política sino la economía y muchas otras disciplinas humanistas.

    Yo creo que el Chino Rios debe estar asustado por el acierto de su primera encuesta, tal vez tenga miedo de no estar a la altura en un segunda vez

    ResponderBorrar
  9. Ojalá haya una grata sorpresa, pero la verdad es que las encuestas dejaron de ser creíbles desde hace tiempo. Solo hay que ver las elecciones de EEUU de 2016.

    ResponderBorrar
  10. Ya no me importa nada, Don Tomas.
    Estoy 100% Moralizado y ni 1000 Pepe Auth me van a desmovilizar.
    Saludos.

    ResponderBorrar
  11. jaja por supuesto, habría que ser muy bruto para ser influenciado por lo que dice un pelmazo como Auth, no es nuestro caso al menos!

    ResponderBorrar
  12. Parece que no hay, al mnos yono he visto

    ResponderBorrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"