17 diciembre 2025

Uno nunca termina de aprender

Voy como avión ¿Otra vez dando la lata con la inteligencia artificial? Si, otra vez, porque su uso como asistente para programar en Python me tiene muy entusiasmado.

Todo partió con una idea. En la entrada anterior sobre este tema, Centurio me comentó si se podría "archivar sus entradas de este blog por temas". 

Esa fue la idea, al menos intuitivaemnte, y la forma técnica era crear un archivo índice en html (una página web) de categorías. año por año.

Me pareció una idea interesante, auque algo que jamás lo podría hacer manualmente, en lo que me queda de vida al menos. 

Pero es un buen ejemplo de lo que se puede hacer con Python y la extraordinaria biblioteca BeautifulSoup para hacer scrapping a páginas en html.

En los primeros años del blog, yo a cada entrada le ponía etiquets más o menos descriptivas, para poder categorizarlas. Hasta que me aburrí y lo mandé al diablo. Después, cuando buscaba la manera de recuperar algún tema me tocaba lamentarlo, muchas veces.

Como ya he agarrado vuelo en eso de hacer cosas usando Python y la IA, hoy en la mañana me puse manos a la obra, fui a Gemini y coloqué el siguiente prompt:

Tengo varios archivos html de mi blog como el que adjunto en un subdirectorio y quisiera introducirles etiquetas por temáticas y luego crear una página índice que clasifique las entradas de cada archivo según esas etiquetas. En resumen, mi idea es hacer un scrapping de cada archivo para determinar etiquetas o categorías, insertar esas etiquetas en cada entrada y crear un nuevo html con un índice que muestre los artículos por temática ¿puedes hacer un script en python que haga eso?

La respuesta fue: ¡Claro que sí! Es un proyecto de automatización muy útil para organizar un blog estático. Para lograrlo, utilizaremos BeautifulSoup, que es la librería estándar de Python para manipular HTML, y re (expresiones regulares) para la detección de temas

Después vino el intercambio ya conocido: me mandaba script que no funcionaban, yo les mandaba de vuelta resultados y sugerencias y después de probar con cuatro script llegamos a una solución satisfactoria para mi archivo de respaldo que se puede ver aquí, para el año 2005.

El resultado no es perfecto pero algo funciona. La dificultad es que tengo que definir de antemanos duplas de categorías y palabras clave que buscar en el script, cosas como esta

MIS_CATEGORIAS = {
    "Política y Economía": ["impuestos", "gobierno", "economía", "mendigos", "riqueza"],
   "Historia": ["siglo", "guerra", "huara", "drake", "historia"],
    "Física y Ciencia": ["átomo", "energía", "ecuación", "universo", "ciencia", "dirac"],
    "Vida en Arica": ["arica", "playa", "morro", "puerto", "murciélago"],
    "Informática": ["software", "código", "python", "linux"]
}

El programa funciona así: revisa todas las entradas del mes y hace un xcrapping buscando si alguba ebtrada contiene la palabra clave, por ejemplo "impuestos" y la agrega al índice de "Política y Economía". 

Una vez que termina con ese mes pasa a la página siguiente y así sucesivamente. Cuando termina el índice crea una página en html para desplegarlo. Sirve, pero como  dij no es perfecto, porque hay que afinar mucho eso de la aparición de las palabras.

Claro que no es muy preciso porque basta que aparezca la palabra "matemáticas" en una entrada para que la categorize como ciencia. O sea fue un bonito experimento pero no resolvía el problema del cliente, que es lo principal cuando uno hace cualquier cosa computinesca.

Pero lo que si se necesita es experiencia en programación para el trabajo de depuración de los errores. La depuración es fundamental e inevitable. Si no somos capaces de depurar el código que nos entrega la IA estamos fritos. 

También se necesita mucha paciencia y tolerancia a la frustración, como en todas estas cosas relacionadas con la programación.

Para la depuración hay una herramienta excelente que se llama Visual Studio Code VSC, para Windows al menos trabaja extraordinariamente bien y tiene una curva de aprendizaje muy rápida, a mi me tomó solo unos minutos acostumbrarme a usarlo.

Si quieren seguir el proceso completo de la conversación con Gemini, lo pueden ver aquí. Puede ser muy útil e instructivo si quieren aprender como se usa la IA en estas cosas.

Aunque eso servía, para indexar las páginas que tengo archivadas, no era la solución del problema. Entonces noté que había un gadget llamado "etiquetas" en la plantilla del blog, lo activé y -adivinen qué- ¡aparecieron mágicamente miles de equiquetas, incluso ordenadas por frecuencia!

Si revisan la barra lateral derecha, hasta el final, verán las etiquetas y lo mejor es que son sumamente precisas, se corresponden perfectamente con el tema de las entradas. Quedé tan intrigado que me fui a Gemini a preguntar cómo lo habían hecho, preguntando:

he notado que en mi blog http://bradanovic.blogspot.com al activar "etiquetas" en la plantilla muestra un índice con muchísimas etiquetas y son muy precisas ¿cómo hicieron eso? ¿blogger etiqueta por tema las entradas automáticamente?

La respuesta -técnica y detallada- me dejó boquiabierto:

En realidad, Blogger no etiqueta automáticamente las entradas por tema. Todo ese índice detallado y preciso que ves en tu blog es el resultado de tu propio trabajo acumulado a lo largo de los años.

Aquí te explico por qué te da esa impresión y cómo funciona técnicamente:

Etiquetado Manual Consistente: Cada vez que escribes una entrada en Blogger, en el panel lateral derecho hay un campo llamado "Etiquetas". Si tú (o quien administre el blog) has ido escribiendo palabras clave ahí durante años, Blogger simplemente las colecciona todas. Lo que ves ahora es la suma de miles de entradas donde fuiste asignando temas específicos de forma manual.

El Gadget de "Etiquetas": Al activar este elemento en el diseño de la plantilla, Blogger escanea todas tus entradas publicadas, extrae cada palabra única que hayas usado como etiqueta y genera un índice. Si tienes etiquetas muy precisas (como nombres de personas, ciudades o términos técnicos), es porque tú las escribiste así en su momento.

Sugerencias de Blogger: Lo más parecido a algo "automático" es que, cuando empiezas a escribir una etiqueta en una entrada nueva, Blogger te sugiere las que ya has usado antes para ayudarte a mantener la consistencia, pero la elección final siempre es del autor.

Efecto de "Larga Cola" (Long Tail): En blogs con mucha trayectoria como el tuyo, es común olvidar cuántas etiquetas distintas se han usado. Al activar el gadget después de mucho tiempo, aparece esa lista "mágica" con cientos de categorías que parecen haber sido clasificadas por una inteligencia artificial, pero es solo el reflejo de tu historial de escritura.

En resumen: Blogger no tiene una función nativa que lea el texto y decida el tema; lo que ves es tu propia base de datos de etiquetas mostrada de forma organizada por la plantilla.

Este video explica paso a paso cómo se crean y organizan las etiquetas manualmente para que luego aparezcan correctamente en el índice de tu blog.

Diablos y rediablos, parece que es verdad eso que uno nunca termina de aprender. Tantos años de usas esta cosa y no tenía idea de esos detalles. Aunque para ser francos, no entendí completamente la explicación y me sonó a chamullo. Tal vez sea mi ignorancia nomás.

Epílogo
Para salir un poco de este asunto que me tiene tan entusiasmado, colocaré un pequeño epílogo con pildoritas de actualidad, en mi nueva sección de comentarios telegráficos

Motosierra ¡como saltaron los merluzos -en todo el mundo- con la foto de Kast con Milei y su motosierra! ¡sufran ratas! Más van a sufrir las decenas de miles de funcionarios de confianza y galletas que les van a dar -espero- su merecida P.L.R. a partir de marzo. 

Buenas ideas, Kast está empezando con algunas buenas ideas. Me gustó mucho la Operación Sitio 3.0. porque yo viví en la 1.0 de Frei Montalva y en la 2.0 del Capitán General. Aplaudo de pié esa idea. 

Esa es la verdadera solución de casa para los pobres y clase media en Chile, no hay ninguna otra que sea factible. Creo que tendré que escribir una entrada sobre eso algún día.

También me hizo mucha simpatía eso de irse a vivir a La Moneda, tal como lo hizo el caballo Ibañez, su último inquilibo. Son varias las buenas ideas pero solo quería mencionar esas dos que me llamaron la atención. 

TACO en su máximo esplendor, ahi tienen a todo el Comando Sur desplegado frente a las costas de Venezuela, engullendo millones cada día a cambio de una ganancia estratégica infinitesimal. 

Hasta un palurdo como Maduro se da el lujo de reirse en la cara del presidente TACO. Otro gallo habría cantado con Netanyahu o cualquier presidente de Israel a cargo del asunto, esos si que son de verdad.

Ucrania está librando su propia Batalla de Inglaterra en Prokovsk y Kupianks, el propio Zelensky fue a sacarse una foto a las puertas de esta última localidad ¡que ridículo está haciendo Putin, otro miserable cobarde.

Creo que Donald Trump está entrando en un acelerado proceso de auto destrucción, ha hecho todo lo humanamente posible para perder el apoyo del Partido Republicano, que son los únicos que lo pueden salvar de una probable destitución.

Y como si fuera poco ha protagonizado bochornosos desacatos ante los tribulaes. Ahora la Corte Suprema, que creía que comían de su manito, también le está dando vuelta la espalda, ojalá caiga pronto y para qué decir Putin y Maduro. Les deseo lo peor.

Bueno, como dice el corrido "ya con esta me despido", será hasta mañana. Y no se olviden de chequear la barra derecha, al final, con las etiquetas temáticas.  

5 comentarios:

  1. Muchas gracias por ordenar el blog. Hasta ese momento tenía que usar el buscador que me mandaba a post del 2006, jajaja. Espero que esto pueda ayudar a leer las entradas.
    Trump es bastante corto de mente. Acaba de decir que acá en Perú mueren 28 mil personas al año por picaduras de serpientes. No sé de donde se sacó ese dato, los que más "pican" son los choros que están imparables. En fin, que lo peor de todo es el daño que le hace a la derecha mundial. Quiérase o no, los gringos son el país más influyentes y cada idiotez que se manda el naranja influye en todo el mundo.
    Anticaviar

    ResponderBorrar
    Respuestas
    1. Si Anticaviar, hace mucho tiempo quería hacer una especie de índice temático. No se si demorará mucho la carga con tantos liks al lado, yo tengo conexión más o menos rápida y me carga sin problema.

      Creo que puede srvir lo de las etiquetas, además están ordenadas por frecuencia, así es que se puede ver de que es lo que más he escrito. Claro que el etiquetado no es perfecto (es bien cimplicado computacionalmente) pero es bastante preciso, todavía no comprendo 100% como lo hace.

      ¡28 mil muertos al año por mordeduras de serpiente! eso es tan absurdo como irrealista. Cuando anduve por Madre de Dios estaba lleno de serpientes venenosas pero no asustaban a nadie porque son muy tímidas y se arrancan de las personas. Mucho más peligrosos son los mosquitos y los monos con hidrofobia, esos si que son bravos!

      Trump no solo es ignorante sino que la demencia senil lo lleva a hablar cosas incoherentes sin ningún filtro, que tragedia más grande para USA, pero creo que tiene fecha de vencimientoi pronto, hasta las midterm tal vez.

      Estados Unidos es un gran país y aliado natural de las democracias en América del Sur, nuestro otro gran aliado es España, la madre patria, nos conviene buscar las mejores relaciones con ambos, gobierne quien gobierne. Son los intereses permanentes, más allá de la contingencia.

      Borrar
  2. Excelente avance Don Tomás,
    Ahora solo hay que ordenar las palabras en celeste de la derecha por índice alfabético para que sea más fácil de llegar al tema que uno desea. Como un diccionario.

    ResponderBorrar
    Respuestas
    1. Ah, está ordenado por abecedario pero no encuentro los temas donde se refiere a la madre patria.

      Borrar
  3. Puede instalar antigravity de google para hacer la tarea, pero funciona mejor con una cuenta de gemini de pago, hay baratas revendidas por internet si busca, atte Pedro .
    Posdata : se retiraron las subvenciones a los carburantes acá, me pregunto aguantara el Paz ?

    ResponderBorrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"