21 febrero 2012

Identificación por estilo

"Resumen-Se estudian las técnicas para la identificación de un autor anónimo a través de estilometría lingüística, es decir, la comparación de la escritura contra el estilo de un corpus de textos de autoría conocida. Demostramos experimentalmente la eficacia de nuestras técnicas con hasta 100.000 autores probados. Debido a la creciente disponibilidad de muestras de escritura en línea, nuestro resultado tiene serias implicaciones para el anonimato y la libertad de expresión-un blogger anónimo o denunciante puede ser desenmascarado a menos que tomen medidas para ocultar su estilo de escritura.

Si bien hay un enorme cantidad de literatura sobre reconocimiento de autoría basado en el estilo de escritura, casi ninguno de ellos ha estudiado corpus de más de unos pocos cientos de autores. El problema es cualitativamente diferente en gran escala, como se muestra (...). En más del 20% de los casos, los clasificadores pueden identificar correctamente un autor anónimo entre un corpus de textos de 100.000 autores; en aproximadamente 35% de los casos el autor correcto se encuentra en los primeros 20 intentos. Si permitimos que al clasificador no hacer una conjetura, a través de la estimación de confianza somos capaces de aumentar la precisión de la estimación superior de 20% a más del 80% con sólo una reducción a la mitad del recuerdo"
. Este es el paper completo

Muy interesante el reconocimiento por estilo. Los que participamos en foros de Internet por años -en mi caso chile.soc.politica y otros- lo conocemos bien, después de algunos años se pueden reconocer los estilos en detalles minúsculos como la forma de organizar las oraciones, las muletillas, palabras que usan con más frecuencia o similitudes de contenido.

Yo reconozco por estilo muchas veces, creo que debo tener más de un 40% de aciertos, recuerdo trolleos característicos, hombres que se hacen pasar por mujer, o por otras personas distintas, casi siempre hay algún detalle de estilo que los delata. Con la cantidad de texto que yo tengo publicado en Internet debería ser muy fácil reconocerme, por eso jamás he publicado algo anónimo, aunque podría probar alguna vez, a ver si me pillan.

Gracias a la recomendación de Ulschmidt y el link de Leus estoy leyendo
Facundo, el libro clásico de Faustino Sarmiento y en verdad es muy entretenido, al comienzo sale una descripción que me hace recordar a mi casa, igualito:

La villa nacional es el reverso de esta medalla: niños sucios y cubiertos de harapos viven con una jauría de perros; hombres tendidos por el suelo en la más completa inacción; el desaseo y la pobreza por todas partes; una mesita y petacas por todo amueblado; ranchos miserables por habitación, y un aspecto general de barbarie y de incuria los hacen notables.

Creo que la falta de plata tiene algo que ver, pero no es toda la explicación. La tendencia a la flojera, desidia la tenemos en los genes. No hay caso, de vez en cuando nos viene la manía por tener todo limpio y ordenado -son chispas de algún ancestro del mestizaje- pero la genética mapuche es más fuerte, siempre nos gana.

¿Han estado alguna vez dentro de una ruca mapuche o huiliche? yo si, en el campo de Chiloé los teníamos de vecinos y no eran de esas rucas para consumo turístico que hay en Temuco, sino los verdaderos lugares -espantosos- donde vivían. Me imagino que cuando algún amigo gringo viene a mi casa, desordenada y ruinosa debe ser lo mismo que cuando yo iba donde mis vecinos huiliches. Menos mal que mis mejores amigos gringos -Tom Wilke, Mila, Rudy- son 4x4, y McDonnell como buen irish no se cuenta como gringo.

Durante muchos años soñé con hacerme una linda casa, pero sin plata todo se fue al diablo. Falta de plata y flojera es una pésima combinación. La mayoría de los chilenos vivimos en un lugar limpio y ordenado cuando nos sobra la plata para pagarle a alguien que limpie y ordene, de otra manera el ocio nos gana sin ningún problema, es un problema genético.

Ah, me pongo a escribir una cosa y termino con otra, que importa, solo tonteras que se me ocurren en el momento, quería escribir de algo importante pero ya se me olvidó, será para una próxima oportunidad.

15 comentarios:

  1. ni con plata... para darmelas de buen hombre me compre una linda casa... unos gatos y unos perros... que mi señora dejo adentro de la casa... en dos meses mi casa nueva era una pocilga XD y termine viviendo casi en un establo

    ResponderBorrar
  2. jajaja, es la flojera que llevamos en los genes, no hay remedio!!! Los alemanes en cambio pasan todo el día limpiando y ordenando, los fines de semana se dedican a hacer reparaciones ¡están chiflados! No saben lo que es vicir...

    ResponderBorrar
  3. a todo esto en aysen... entre todos los petitorios hay uno por el que yo igual saldria a la calle..

    "las carreteras se estan concesionando y nos siguen cobrando impuesto especifico"

    ResponderBorrar
  4. Hay un argumento muy fuerte contra el impuesto específico, los que lo defienden dicen que es para compensar las "externalidades" de congestión, contaminación y daño a los caminos que producen los autos ¿Y por que se paga en las regiones donde no existe ni congestión, ni contaminación, ni daño a los caminos aparte del desgaste normal?.

    Creo que eso de muestra que las regiones seguimos subvencionando a santiasco y le debería tapar la boca a cualquier ministro de hacienda, presente o futuro.

    ResponderBorrar
  5. Yo no se que esperan en la octava para salir a bloquear todo

    se refina la bencina en talcahuano, como enap es monopolio fiscal se envia la bencina al centro de despacho en santiago y se envia de vuelta a concepcion

    dos fletes y e 40 a 100 pesos mas cara la bencina que en santiago, al lado de la refineria.

    Eso, mas que no hay forma de salir de aca sin pagar entre 3000 y 6000 pesos de peaje, mas la asignacion a dedo de cuotas de pesca, es motivo más que suficiente para declarar la republica independiente del BioBio

    ...


    hay una historia simpatica de la republica de hualqui,


    "a Republica Independiente de Hualqui (aprox. en 1823)
    Después de lograda la independencia de Chile, la región más afectada del país se encontraba en la Provincia de Concepción, diezmada por aquel "guerra a muerte" encabezada por Vicente Benavides. Muchos episodios sangrientos tuvieron como escenario al poblado de Hualqui.
    El hambre, las enfermedades, y la postracion económica derivada del abandono gubernamental dieron lugar a la gestación de un hecho muy interesante y tal vez único en la Historia de Chile.
    En efecto, y como una respuesta a esta situación de abandono, un grupo de vecinos organizó un movimiento de rebelión destinado a remplazar a las autoridades establecidas y dejar a Hualqui bajo la administración exclusiva de las autoridades locales previamente elegidas para regir los destinos y solucionar problemas antes planteados.
    Sin duda que un hecho de tales características no podía pasar inadvertido para el gobierno chileno, siendo necesario enviar un batallón del ejército de Concepción a objeto de fustrar el movimiento revolucionario que amenazaba la estabilidad del gobierno interior."

    ResponderBorrar
  6. Identificación por estilo, que buen tema... ya me había puesto a pensar en el tema, en esta entrada (la primera de la nueva era en mi angry-blog jaja)Comentarios políticos en blogs y noticias de Chile.. Me recuerda un asunto, ¿leyó el blog de la cam.. vall..? no colocó el nombre completo, por que dicen que la invoca jaja. Era fácil darse cuenta que había más de 3 estilos de escritura, la tipa creo ni sabía la dirección de su blog, y capaz que el mismo tellier escribiera las entradas.

    Sobre las bencinas, pues hace años, personas de la COPEC y la entonces YPF, me dijeron que la estructura de precios esta diseñada para subvencionar a smogtiago en unos cuantos pesos ($10 era en ese momento). Por eso en Conce el combustible es más caro que en smogtiago, a pesar de la refinería. Las regiones le pagamos la bencina a smogtiago y de paso, el metro, y el fraude de lagos llamado transantiago.

    ResponderBorrar
  7. Yo creo que las tomas, bloqueos, protestas callejeras, etc. todas perjudican a la gente que no desea protestar, siempre es un chantaje social que debería ser duramente reprimido.

    Si alguien desea protestar tiene la herramienta a la mano: que el y su familia dejen de pagar todos los impuestos que pueda y le diga a sus amigos que hagan lo mismo. Así se protesta mucho mejor y todos ganan.

    Cada peso que se evade de impuestos es una protesta directa y redistribución inmediata de dinero que pasa a manos del pueblo compañero.

    Heitai, solo una vez leí el blog de Camila Vallejos, era muy aburrido. Un blog con disparidad de estilos o escrito por un "colectivo" normalmente no tiene gracia, es solo "preach to the choir" predicarle al coro dicen los gringos, no sirve.

    Y claro, el específico de los combustibles y los precios regionales constituyen un subsidio de las regiones a Santiago, yo creo que el impuesto específico íntegro que se paga en Arica, por ejemplo, es un subsidio, porque acá los autos no producen ninguna de las externalidades con que se justifica el impuesto.

    ResponderBorrar
  8. El periodista/escritor cubano asilado en España Montaner es un firme partidario de los sistemas - si aplicas el sistema bueno, le sirve a todos y si aplicas el malo, fracasan todos - y el ejemplo contundente que da es:
    - Alemania del Este era comunista, estaba llena de alemanes, pero igual iba por el fracaso y la pobreza,
    - Alemania del Oeste era capitalista y democrática, estaba llena de alemanes, absolutamente triunfantes y prósperos,
    Y desde luego la corrección política obliga a adherir a esto. Pero esta claro que Sarmiento - y muchos en su tiempo - ven un problema de raza - pongamos que no era raza: un problema de cultura - más que de paquete ideológico. Algo mucho más complejo para alcanzar el desarrollo.

    ResponderBorrar
  9. Es interesante si se trata de sistema o cultura, yo creo que en economía es muy importante el sistema porque eso alienta o desalienta la inversión y la creación de riqueza (clásico: sist económicos socialistas versus capitalistas, Alemania del Este versus Oeste, URSS vs. USA, CUba vs. Chile, etc.)

    Pero en política los sistemas de orden administrativo del gobierno (tipo de parlamento, sistema de gobierno, federalismo vs unitarios, etc.) no tiene -creo yo- casi ningún efecto sobre el buen o mal gobierno.

    Hay democracias horrorosas (Haiti) y dictaduras muy buenas (Taiwan en los 60s para poner un ejemplo lejano) y viceversa. Países unitarios que andan bien vs federales que andan mal, y viceversa. Presidencialismos que andan bien vs parlamentarismos que andan mal y viceversa. Etc.

    Por eso yo creo que en cuestiones de política la organización del estado casi no tiene interés, da más o menos lo mismo, otra muestra de que el estado es innecesario para eldesarrollo de los países, una traba, un mal necesario por la defensa y orden público.

    ResponderBorrar
  10. ¿Dictadura buena el Kuomintang? Andá, Bradanovic... Lo que les salvó fue contar con el apoyo de EE.UU., dada la naturaleza anticomunista del partido en Taiwán. Lo irrisorio es que gobernaban también con un esquema de partido único similar a sus detestados...

    ResponderBorrar
  11. Si hay ejemplos de dictaduras buenas y malas esos serian corea del sur y chile.

    En los anos 70, cuando corea era harto mas pobre que chile, los dos paises entran en sendas y prolongadas dictaduras militares. Casi 2 decadas en ambos casos, e igual de fascistas, anticomunistas y carniceras. Chile se fue por el camino de los chicago boys. En cambio la dictadura coreana aplico a concho el modelo de sustitucion de importaciones**. Complementado con educacion estatal gratuita y de calidad, y una fuerte direccion estatal en el desarrollo de los chaebol. La mano invisible relegada a tareas menores: el precio del zapallo en la feria, articulos matuteados, etc.
    El resultado esta a la vista. Corea es una potencia industrial que exporta de todo, muy prospera e igualitaria. Basicamente en nivel europeo medio. Chile, en cambi, es prospero solo si lo comparen con el salvador, es terrible de desigual y regala todas las riquezas a precio de huevo.

    Per capita los coreanos son el doble de ricos. Si ademas consideramos la desigualdad.

    ** pude incluso constatar que hasta fabrican "chilean dulce de membrillos". Importan los membrillos. Eso ilustra cuan patetico es el legado de daniel lopez. Ni dulce de membrillo les podemos vender, prefieren hacerlo ellos.

    ResponderBorrar
  12. Me llegó el link de la profe burra (http://www.youtube.com/watch?v=tCOJ5SgYt5I). Yo no puedo criticarla, tenía (y tengo) los mismos problemas con los números. Cuando en un examen había "números" sufría una enormidad. Con matemática simbólica me iba excelente. De puro milagro logré egresar de ingeniería.

    ResponderBorrar
  13. jajaja ¡GENIAL! que manera de reirme, ¿2x0? = 0, NO 2x0=2!!! jajaja sublime, quien sabe adonde tenía la cabeza la señora pero increíble y después 4x0=4! bueno, cualquiera se equivoca pero equivocarse multiplicando por 0 o por 1 significa que no tiene muy claro lo que significa multiplicar ;D

    ResponderBorrar
  14. Que pena, ya no le podré decir “payaso sonriente” a su excelencia el presidente de la república. Dentro de poco, el estilo de “sapeo” de la RDA será cosa de niños

    ResponderBorrar
  15. El verdadero anonimato por Internet nunca ha existido, si alguien quiere saber desde donde está alguien conectado so puede saber, a menos que se use TOR que pone la navegación más lenta que un tren a pedales

    ResponderBorrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"