Tomas Bradanovic: ranking

En el año 1906, en una granja de Plymouth, Inglaterra, un señor de apellido Galton hizo un experimento muy simple pero de resultados históricos para las matemáticas. El experimento de Galton consistió en juntar a 787 personas comunes y corrientes y pedirles que escribieran su estimación sobre el peso de un buey que estaba a la vista de todos. Cada persona miraba al buey, escribía en un papel su peso estimado y lo echaba en una urna.

Entre los que estimaban el peso habían unos cuantos granjeros y carniceros, pero la gran mayoría eran personas comunes y corrientes que no tenían idea de cuanto podía pesar un buey. Contra toda intuición el peso promedio estimado fue de 1187 libras, mientras que el peso real del buey eran 1188 libras, o sea una exactitud del 99.92%. Y esto no se debió a una coincidencia, porque el experimento se ha repetido innumerables veces desde entonces con resultados similares. Esto dio origen a un principio matemático llamado "la sabiduría de las multitudes". El paper de Francis Galton lo pueden leer aquí.

Y tiene una explicación matemática, en palabras simples se puede decir que -si se cumplen ciertas condiciones- las estimaciones de una multitud completamente ignorante serán muy acertadas porque los errores de sub estimación y sobre estimación tienden a compensarse convergiendo el promedio al valor correcto. Las condiciones que deben cumplirse para que esto ocurra son tres:

1.-Definición exacta de la pregunta (con una respuesta exacta, objetiva)

2.-Las estimaciones deben ser completamente independientes y sin sesgo (no deben haber influencias mutuas ni ideas preconcebidas)

3.-Una cantidad de estimaciones independientes lo suficientemente grande

Si las multitudes ignorantes son sabias porque los errores se compensan ¿por que entonces es tan malo el desempeño de las democracias? Creo que es obvio que la condición (2) no se cumple en ninguna de sus dos partes, eso explica por que la sabiduría de las multitudes no funciona en la política.

Estaba entretenido aprendiendo sobre esto en el curso Networks: friends, money and bytes, Aparece en el capítulo que describe como Amazon recomienda sus artículos. Si hacen clic en la figura de arriba verán una típica página de Amazon -con mi cámara fotográfica soñada- que al lado de cada producto muestra las estrellas de recomendación y un número.

Esta cámara en particular ha obtenido 4 de 5 estrellas y ha sido revisada por 41 clientes. Todo eso es muy sencillo, las 4 estrellas son el puntaje promedio, redondeado, de los 41 puntajes. El problema es si yo quiero compararla con -digamos- la Nikon D3100, que tiene un precio similar, también tiene 4 de 5 estrellas pero la evaluaron 425 personas.

Intuitivamente podemos pensar que un puntaje de 4 sobre 425 revisiones es mejor que el puntaje de 4 con 41 revisiones y mucho mejor que un puntaje de 4 con -digamos- 2 revisiones. ¿pero que hay de una cámara que tenga un puntaje de 3 pero con 10000 revisiones?. Es un problema de ranking similar al que tiene Google para ordenar los resultados de búsqueda, no hay un solo criterio sino varios que actuan siguiendo algúna sofisticada fórmula matemática.

Si vemos esta página, que hace un ranking de todas las cámaras fotograficas veremos que no están ordenadas simplemente por el puntaje obtenido sino por un algoritmo que considera el puntaje y la cantidad de evaluaciones además de otros factores.

El efecto de "sabiduría de las multitudes" se incluye usando una controvertida rama de las estadísticas llamada "estimación Bayesiana", que asume que la historia pasada da información acerca del futuro, independiente del conocimiento que tengamos del fenómeno. Estas estimaciones bayesianas las hacemos todo el tiempo, creo que Laplace fue el que plenteó el siguiente problema "si durante los miles de años que se tiene registro, todos los días el sol ha salido por oriente y se pone por ocidente ¿cual es la probabilidad que eso ocurra mañana?

Desde la estadística clásica en estado de ignorancia, que un evento se haya repertido muchísimas veces no entrega información, bien podría salir el sol mañana por el lado opuesto. Parece contra intuitivo pero ambas estimaciones tienen fundamentos conceptuales diferentes y las dos son válidas.

La cosa es que una estimación Bayesiana incorpora esta información en la llamada "regla de sucesión" que dice más o menos que mientras más se haya repetido un evento en el pasado, mayor probabilidad que se repita en el futuro.

Así, después de una serie de fórmulas y algo de cálculo integral se llega a que la estimación Bayesiana introduce un factor que hace que la probabilidad de que algo ocurra se mueva en una zona entre el valor de algo que nunca ha ocurrido antes hasta algo que ha ocurrido muchísimas veces. Así es como se incluye la sabiduría de las multitudes al cálculo de los rankings de Amazon.

Claro que el algoritmo exacto es un secreto de Amazon, pero mediante ingeniería reversa se ha podido determinar que se basa en el promedio de los puntajes, ajustado por una estimación Bayeciana, más unos bias dependientes de la calidad de los revisores y de las veces que se reporta que el artículo ha salido malo dentro de los primeros 30 días.

Esto, como todas las demás cosas que hemos visto en el curso, no solo tiene que ver con el problema específico de Amazon, sino que con el problema general de construir rankings, que es fundamental en la economía de redes.

Y como consideré que el curso está sumamente interesante, estoy escribiendo un nuevo Blog llamado 20Q para dummies, los invito a que lo vean porque allí trato de colocar en palabras sencillas cada una de las lecciones que nos están pasando.

P.D. y si usted es un real ocioso, como yo, no deje de visitar galton.org, seguro que la va a disfrutar

Como no se me había ocurrido antes, cuando fuí a renovar la licencia de conducir me encontré con un primo de la Pilar que me contó que se iba a acampar a la playa como todos los años, ahí mismo se me ocurrió que le podía prestar la casa rodante con lo que se instalarían mucho más cómodos que en carpas y así es como llegaron a buscarla y estuvieron toda la tarde enganchando, dando la vuelta hasta que se la llevaron, espero que la estén disfrutando. Ahora tengo un montón de amigos que me la han pedido, hagan fila muchachos, el próximo es Marcelo y de ahí vamos viendo. La verdad es que siempre me ha gustado hacer favores y si puedo ayudar a algún amigo en algo que no me cueste mucho lo hago encantado, soy una especie de favorólogo profesional.

Conversando con un tipo sobre como evaluaba el impacto de un sitio web, me di cuenta del enorme desconocimiento que existe sobre como funciona Internet, incluso entre los que se creen expertos en la materia. El número de visitas claramente no es un buen medidor de impacto porque hay muchas formas de generar tráfico. De partida se pueden comprar visitas: por unos 9 dólares mensuales se pueden comprar 10.000 visitas diarias. Recuerdo a un amigo mío que tenía decenas de miles de vistas diarias, simplemente inscribió su sitio en un par de directorios porno. Por alguna razón desconocida para mi, tiempo atrás fuí favorito de Google images y recibía entre 500 hasta 900 visitas diarias, la mayoría de un par de segundos, luego todo volvió a la normalidad y tengo mi promedio normal de 270 visitas de las cuales supongo que deben ser unas 100 visitas "reales".

Lo de visitas reales es un concepto difícil de cuantificar pero muy fácil de entender: cuando yo escribo en este blog tengo el objetivo de que me lean con interés lo que puse y que lo lea gente que a mi también me interesa, esas son las visitas reales. Muchas otras visitas llegan por equivocación, porque pusieron "Arica" en Google y se encontraron con un blog que seguramente ni les interesa, o porque encontraron una imagen que les servía, esas visitas no son reales y para todos los efectos prácticos sería mejor que no las tuviera: añaden ruido y encubren la verdadera audiencia del blog.

Un buen indicador para saber si una visita es real o no es su duración, las visitas de menos de 30 segundos no sirven para nada. Es increíble lo poco que duran las visitas en la mayoría de los sitios web. En este blog por ejemplo, la duración promedio es de 1 minuto 55 segundos, buena para mi gusto porque considera todas las visitas incluso las que duran unos pocos segundos, o sea las visitar reales deben durar unos 10 a 15 minutos. El blog de Arica, the alternative guide en cambio tiene muchas menos visitas (alrededor de 40 diarias) pero con una duración de 3 minutos 52 segundos en promedio, esto significa que muchos visitantes pasan una hora o más en el sitio.

Así es que ya saben, ni se preocupen por el número de visitas que no significa casi nada, lo importante es la duración y la calidad de las visitas, de lo bueno poco como decía mi abuela.

01 octubre 2012

La sabiduría de las multitudes

25 enero 2008

De lo bueno poco