17 diciembre 2025

Uno nunca termina de aprender

Voy como avión ¿Otra vez dando la lata con la inteligencia artificial? Si, otra vez, porque su uso como asistente para programar en Python me tiene muy entusiasmado.

Todo partió con una idea. En la entrada anterior sobre este tema, Centurio me comentó si se podría "archivar sus entradas de este blog por temas". 

Esa fue la idea, al menos intuitivaemnte, y la forma técnica era crear un archivo índice en html (una página web) de categorías. año por año.

Me pareció una idea interesante, auque algo que jamás lo podría hacer manualmente, en lo que me queda de vida al menos. 

Pero es un buen ejemplo de lo que se puede hacer con Python y la extraordinaria biblioteca BeautifulSoup para hacer scrapping a páginas en html.

En los primeros años del blog, yo a cada entrada le ponía etiquets más o menos descriptivas, para poder categorizarlas. Hasta que me aburrí y lo mandé al diablo. Después, cuando buscaba la manera de recuperar algún tema me tocaba lamentarlo, muchas veces.

Como ya he agarrado vuelo en eso de hacer cosas usando Python y la IA, hoy en la mañana me puse manos a la obra, fui a Gemini y coloqué el siguiente prompt:

Tengo varios archivos html de mi blog como el que adjunto en un subdirectorio y quisiera introducirles etiquetas por temáticas y luego crear una página índice que clasifique las entradas de cada archivo según esas etiquetas. En resumen, mi idea es hacer un scrapping de cada archivo para determinar etiquetas o categorías, insertar esas etiquetas en cada entrada y crear un nuevo html con un índice que muestre los artículos por temática ¿puedes hacer un script en python que haga eso?

La respuesta fue: ¡Claro que sí! Es un proyecto de automatización muy útil para organizar un blog estático. Para lograrlo, utilizaremos BeautifulSoup, que es la librería estándar de Python para manipular HTML, y re (expresiones regulares) para la detección de temas

Después vino el intercambio ya conocido: me mandaba script que no funcionaban, yo les mandaba de vuelta resultados y sugerencias y después de probar con cuatro script llegamos a una solución satisfactoria para mi archivo de respaldo que se puede ver aquí, para el año 2005.

El resultado no es perfecto pero algo funciona. La dificultad es que tengo que definir de antemanos duplas de categorías y palabras clave que buscar en el script, cosas como esta

MIS_CATEGORIAS = {
    "Política y Economía": ["impuestos", "gobierno", "economía", "mendigos", "riqueza"],
   "Historia": ["siglo", "guerra", "huara", "drake", "historia"],
    "Física y Ciencia": ["átomo", "energía", "ecuación", "universo", "ciencia", "dirac"],
    "Vida en Arica": ["arica", "playa", "morro", "puerto", "murciélago"],
    "Informática": ["software", "código", "python", "linux"]
}

El programa funciona así: revisa todas las entradas del mes y hace un xcrapping buscando si alguba ebtrada contiene la palabra clave, por ejemplo "impuestos" y la agrega al índice de "Política y Economía". 

Una vez que termina con ese mes pasa a la página siguiente y así sucesivamente. Cuando termina el índice crea una página en html para desplegarlo. Sirve, pero como  dij no es perfecto, porque hay que afinar mucho eso de la aparición de las palabras.

Claro que no es muy preciso porque basta que aparezca la palabra "matemáticas" en una entrada para que la categorize como ciencia. O sea fue un bonito experimento pero no resolvía el problema del cliente, que es lo principal cuando uno hace cualquier cosa computinesca.

Pero lo que si se necesita es experiencia en programación para el trabajo de depuración de los errores. La depuración es fundamental e inevitable. Si no somos capaces de depurar el código que nos entrega la IA estamos fritos. 

También se necesita mucha paciencia y tolerancia a la frustración, como en todas estas cosas relacionadas con la programación.

Para la depuración hay una herramienta excelente que se llama Visual Studio Code VSC, para Windows al menos trabaja extraordinariamente bien y tiene una curva de aprendizaje muy rápida, a mi me tomó solo unos minutos acostumbrarme a usarlo.

Si quieren seguir el proceso completo de la conversación con Gemini, lo pueden ver aquí. Puede ser muy útil e instructivo si quieren aprender como se usa la IA en estas cosas.

Aunque eso servía, para indexar las páginas que tengo archivadas, no era la solución del problema. Entonces noté que había un gadget llamado "etiquetas" en la plantilla del blog, lo activé y -adivinen qué- ¡aparecieron mágicamente miles de equiquetas, incluso ordenadas por frecuencia!

Si revisan la barra lateral derecha, hasta el final, verán las etiquetas y lo mejor es que son sumamente precisas, se corresponden perfectamente con el tema de las entradas. Quedé tan intrigado que me fui a Gemini a preguntar cómo lo habían hecho, preguntando:

he notado que en mi blog http://bradanovic.blogspot.com al activar "etiquetas" en la plantilla muestra un índice con muchísimas etiquetas y son muy precisas ¿cómo hicieron eso? ¿blogger etiqueta por tema las entradas automáticamente?

La respuesta -técnica y detallada- me dejó boquiabierto:

En realidad, Blogger no etiqueta automáticamente las entradas por tema. Todo ese índice detallado y preciso que ves en tu blog es el resultado de tu propio trabajo acumulado a lo largo de los años.

Aquí te explico por qué te da esa impresión y cómo funciona técnicamente:

Etiquetado Manual Consistente: Cada vez que escribes una entrada en Blogger, en el panel lateral derecho hay un campo llamado "Etiquetas". Si tú (o quien administre el blog) has ido escribiendo palabras clave ahí durante años, Blogger simplemente las colecciona todas. Lo que ves ahora es la suma de miles de entradas donde fuiste asignando temas específicos de forma manual.

El Gadget de "Etiquetas": Al activar este elemento en el diseño de la plantilla, Blogger escanea todas tus entradas publicadas, extrae cada palabra única que hayas usado como etiqueta y genera un índice. Si tienes etiquetas muy precisas (como nombres de personas, ciudades o términos técnicos), es porque tú las escribiste así en su momento.

Sugerencias de Blogger: Lo más parecido a algo "automático" es que, cuando empiezas a escribir una etiqueta en una entrada nueva, Blogger te sugiere las que ya has usado antes para ayudarte a mantener la consistencia, pero la elección final siempre es del autor.

Efecto de "Larga Cola" (Long Tail): En blogs con mucha trayectoria como el tuyo, es común olvidar cuántas etiquetas distintas se han usado. Al activar el gadget después de mucho tiempo, aparece esa lista "mágica" con cientos de categorías que parecen haber sido clasificadas por una inteligencia artificial, pero es solo el reflejo de tu historial de escritura.

En resumen: Blogger no tiene una función nativa que lea el texto y decida el tema; lo que ves es tu propia base de datos de etiquetas mostrada de forma organizada por la plantilla.

Este video explica paso a paso cómo se crean y organizan las etiquetas manualmente para que luego aparezcan correctamente en el índice de tu blog.

Diablos y rediablos, parece que es verdad eso que uno nunca termina de aprender. Tantos años de usas esta cosa y no tenía idea de esos detalles. Aunque para ser francos, no entendí completamente la explicación y me sonó a chamullo. Tal vez sea mi ignorancia nomás.

Epílogo
Para salir un poco de este asunto que me tiene tan entusiasmado, colocaré un pequeño epílogo con pildoritas de actualidad, en mi nueva sección de comentarios telegráficos

Motosierra ¡como saltaron los merluzos -en todo el mundo- con la foto de Kast con Milei y su motosierra! ¡sufran ratas! Más van a sufrir las decenas de miles de funcionarios de confianza y galletas que les van a dar -espero- su merecida P.L.R. a partir de marzo. 

Buenas ideas, Kast está empezando con algunas buenas ideas. Me gustó mucho la Operación Sitio 3.0. porque yo viví en la 1.0 de Frei Montalva y en la 2.0 del Capitán General. Aplaudo de pié esa idea. 

Esa es la verdadera solución de casa para los pobres y clase media en Chile, no hay ninguna otra que sea factible. Creo que tendré que escribir una entrada sobre eso algún día.

También me hizo mucha simpatía eso de irse a vivir a La Moneda, tal como lo hizo el caballo Ibañez, su último inquilibo. Son varias las buenas ideas pero solo quería mencionar esas dos que me llamaron la atención. 

TACO en su máximo esplendor, ahi tienen a todo el Comando Sur desplegado frente a las costas de Venezuela, engullendo millones cada día a cambio de una ganancia estratégica infinitesimal. 

Hasta un palurdo como Maduro se da el lujo de reirse en la cara del presidente TACO. Otro gallo habría cantado con Netanyahu o cualquier presidente de Israel a cargo del asunto, esos si que son de verdad.

Ucrania está librando su propia Batalla de Inglaterra en Prokovsk y Kupianks, el propio Zelensky fue a sacarse una foto a las puertas de esta última localidad ¡que ridículo está haciendo Putin, otro miserable cobarde.

Creo que Donald Trump está entrando en un acelerado proceso de auto destrucción, ha hecho todo lo humanamente posible para perder el apoyo del Partido Republicano, que son los únicos que lo pueden salvar de una probable destitución.

Y como si fuera poco ha protagonizado bochornosos desacatos ante los tribulaes. Ahora la Corte Suprema, que creía que comían de su manito, también le está dando vuelta la espalda, ojalá caiga pronto y para qué decir Putin y Maduro. Les deseo lo peor.

Bueno, como dice el corrido "ya con esta me despido", será hasta mañana. Y no se olviden de chequear la barra derecha, al final, con las etiquetas temáticas.  

19 comentarios:

  1. Muchas gracias por ordenar el blog. Hasta ese momento tenía que usar el buscador que me mandaba a post del 2006, jajaja. Espero que esto pueda ayudar a leer las entradas.
    Trump es bastante corto de mente. Acaba de decir que acá en Perú mueren 28 mil personas al año por picaduras de serpientes. No sé de donde se sacó ese dato, los que más "pican" son los choros que están imparables. En fin, que lo peor de todo es el daño que le hace a la derecha mundial. Quiérase o no, los gringos son el país más influyentes y cada idiotez que se manda el naranja influye en todo el mundo.
    Anticaviar

    ResponderBorrar
    Respuestas
    1. Si Anticaviar, hace mucho tiempo quería hacer una especie de índice temático. No se si demorará mucho la carga con tantos liks al lado, yo tengo conexión más o menos rápida y me carga sin problema.

      Creo que puede srvir lo de las etiquetas, además están ordenadas por frecuencia, así es que se puede ver de que es lo que más he escrito. Claro que el etiquetado no es perfecto (es bien cimplicado computacionalmente) pero es bastante preciso, todavía no comprendo 100% como lo hace.

      ¡28 mil muertos al año por mordeduras de serpiente! eso es tan absurdo como irrealista. Cuando anduve por Madre de Dios estaba lleno de serpientes venenosas pero no asustaban a nadie porque son muy tímidas y se arrancan de las personas. Mucho más peligrosos son los mosquitos y los monos con hidrofobia, esos si que son bravos!

      Trump no solo es ignorante sino que la demencia senil lo lleva a hablar cosas incoherentes sin ningún filtro, que tragedia más grande para USA, pero creo que tiene fecha de vencimientoi pronto, hasta las midterm tal vez.

      Estados Unidos es un gran país y aliado natural de las democracias en América del Sur, nuestro otro gran aliado es España, la madre patria, nos conviene buscar las mejores relaciones con ambos, gobierne quien gobierne. Son los intereses permanentes, más allá de la contingencia.

      Borrar
  2. Excelente avance Don Tomás,
    Ahora solo hay que ordenar las palabras en celeste de la derecha por índice alfabético para que sea más fácil de llegar al tema que uno desea. Como un diccionario.

    ResponderBorrar
    Respuestas
    1. Ah, está ordenado por abecedario pero no encuentro los temas donde se refiere a la madre patria.

      Borrar
    2. Las etiquetas salen ordenadas según los temas que más se repiten, primero, y después de eso por orden alfavético. Por ejemplo lo que más entradas hay es sobre Arica, Chile, Tacna. educación, Perú, etc.

      Para los temas que no están etiquetados, puedes usar la ventana con la lupa en la parte superior izquierda, por ejemplo si colocas "españa" allí aparecerán las entradas relacionadas co España, ya sea en el título o en el contenido.

      Borrar
    3. ¡Perfecto!!!
      Pude encontrar todas las entradas sobre la madre patria buscando en la lupa como usted me ha indicado. No sabía que existía.

      Borrar
  3. Puede instalar antigravity de google para hacer la tarea, pero funciona mejor con una cuenta de gemini de pago, hay baratas revendidas por internet si busca, atte Pedro .
    Posdata : se retiraron las subvenciones a los carburantes acá, me pregunto aguantara el Paz ?

    ResponderBorrar
    Respuestas
    1. Que interesante eso de Antigravity, lo instalé y -kasta donde he entendido- es una especie de VSC con esteroides de IA, muy interesante, aunque me pierdo un poco con tanto mumbo jumbo computin ¿por qué no hablan en cristiano, malditos computines?

      Sobre el retiro a las subvenciones del petróleo, yo creo que en Bolivia la mayoría de la gente lo tenía descontado hace rato, creo que la mayoría preferirán pagar mucho más por el litro a cambio de tenerlo disponible y en abundancia. En fin ya nos contará Pedro u otro de nuestros regulares que viven en Bolivia.

      Borrar
  4. para no perder la costumbre, vamos con algo nada que ver, han visto el precio de las memorias de computador? ahora resulta que cuestan más las memorias que todo el resto, en el último año han subido casi 5 veces, la supuesta IA se está llevando todo elemento electrónico, como antes se llevaron todo los giles de las cripto monedas, quería comprar otro computador con 64 gigas de memoria, el computador cuesta 570 mil con 16 gigas de ram, si se quiere subir a 64 gigas, hay que agregar 670 mil, así no se puede, tendremos que cuidar el computador actual fijo

    Mister OT (buen nombre, gracias por el bautizo)

    ResponderBorrar
    Respuestas
    1. Mr OT jaja que buena! Oye, pero para qué quieres tanta RAM ¿para juegos? Yo siempre he funcionado con 8 Gb sin problemas, pero bueno, el que quiera celeste, que le cueste. En todo caso 100 lucas por más memoria RAM me parece un abuso del vendedor del equipo, nunca he visto RAM que falle así es que yo aplicaría Aliexpress de una

      Borrar
    2. no, si fuese 100 lucas ya lo habría comprado, los 670 mil es sólo la memoria extra, el total sube a 1.240.000, locura, en ali cuestan casi lo mismo, 630 mil 2 módulos de 32gb, y necesito eso, tengo que tener vivaldi, el browser, con 12 pestañas, cada pestaña con entre 10 y 100 pilas, 32gb es lo mínimo, 64 debe ser perfecto https://es.aliexpress.com/item/1005010441908597.html?spm=a2g0o.productlist.main.4.302f76ecTWKhBY&algo_pvid=49e29685-d7d5-4a43-8414-e1cf0ebdc848&algo_exp_id=49e29685-d7d5-4a43-8414-e1cf0ebdc848-3&pdp_ext_f=%7B%22order%22%3A%22-1%22%2C%22eval%22%3A%221%22%2C%22fromPage%22%3A%22search%22%7D&pdp_npi=6%40dis%21CLP%21326700%21326700%21%21%212430.45%212430.45%21%402101e80f17660623717096917e4a91%2112000052421107121%21sea%21CL%210%21ABX%211%210%21n_tag%3A-29910%3Bd%3A640be5e%3Bm03_new_user%3A-29895&curPageLogUid=rvfu6mELfTkj&utparam-url=scene%3Asearch%7Cquery_from%3A%7Cx_object_id%3A1005010441908597%7C_p_origin_prod%3A

      Borrar
    3. Lo dicho, el que quiera celeste... Yo acabo de chequear, tengo 6 Gb DDR 3, tengo 10 ventanas abiertas , igual uso Vivaldi, tengo también corriendo el VCD con 7 cámaras en línea y no noto retraso ni nada, claro que la RAM está al 93% :D

      Borrar
    4. increíble, solo el VCD consume poco más del 10% de la RAM

      Borrar
    5. y qué versión de windows tienes? debe ser antiguo, con 8 megas se arrastra windows 11

      Borrar
    6. Windows 10 Home 22H2 single languaje, con todas sus actualizaciones al día de hoy. El Windows 11 no me gustó su usabilidad así es que lo instalé y desinstalé al poco tiempo, pero igual anadaba perfecto.

      Este mismo Windows 10 lo tengo en un viejísimo sub notepad Acer Aspire One con Celeron y 4 Gb de RAM, ese si anda un poquito lento, pero igual es perféctamente operativo, lo usaba para viajar, es pequeñísimo y si me lo roban no vale ni 30 lucas.

      Hay una tendencia -errónea creo yo- a sobredimensionar el hardware, cuando hay muchas cosas que pueden optimizarse. Yo que soy genéticamente amarrete siempre voy por esa parte.

      El laptop que uso todos los días es un Acer Aspire ES 15 del año del rey perico, me lo regaló la Pilar cuando se le rompió la pantalla y yo lo uso en el escritorio con un buen monitor externo, mouse alámbrico externo y teclado mecánico también externo, todo regalado.

      Lo único que le he comprado es el disco SSD de 112 Gb que me costó como 20 lucas, lo uso siempre al 70% de su capacidad como disco C:

      Todo lo importante lo almaceno en el servidor NAS y también en 6 o 7 discos duros viejos que tengo solo para eso.

      Por si acaso mi segundo nombre es "frugal"

      Borrar
  5. Sobre JAK, lo más lindo es que tiene a todo el mundo corriendo en círculos con cada cosa que dice o hace.

    El tema de vivir en La Moneda, por ejemplo, no debería haber sido interesante en absoluto, pero el merluzismo lo convirtió en una polémica que ya lleva varios días activa: “que no se puede tocar ni un tornillo porque es monumento nacional”, “que es apropiarse de un símbolo de todos los chilenos”, “que va a deshonrar la memoria de Allende”, “que es un derroche”, etc.

    Cómo olvidar que Bachelet mandó a pintar un salón dos veces sólo porque no le gustaba el color, o que “reconstruyó” el salón Independencia forrando con trupán, o que a ella, a Lagos y al merluzo les hemos pagado arriendo de casas durante todas sus presidencias.

    Eso, sin embargo, no quita algunas chambonadas como ese inexplicable (en apariencia al menos) viaje a Argentina, o el dislate de ofrecerle ministerios por la prensa a Daza, pero son cosas menores, IMHO.

    Saludos,
    El Triministro.

    ResponderBorrar
    Respuestas
    1. Habrán críticas, palos porque bogas y porque no bogas, pero la cosa es que ya es presidente y puede hacer lo que mejor le parezca dentro de sus facultades: vivir donde quiera, viajar donde se le antoje, decir lo que quiera, etc.

      No se puede ser monedita de oro y gustarle a todos. Creo que están todavía con el shock inicial, ya se acostumbrarán, siempre es así

      Borrar
  6. Don Tomás,
    1.-¿Cómo puedo vaciar GB inservibles en mi disco duro?
    2.-¿Habrá algún programa fiable que lo realice sin riesgo para el computador?

    ResponderBorrar
    Respuestas
    1. El gold standard para limpiat discos es -hasta donde yo se- CCleaner de Piroform
      https://www.ccleaner.com
      Se descarga gratis, analiza y limpia no solo el disco sino también el monstruoso registro de Windows. Lo hace todo automático.

      Ojo que también borra las cookies así es que si tienes aplicaciones que se conectan automáticamente tendrás que recordar esas contraseñas, al menos para la primera vez (por ejemplo para el correo de Google y cosas así)

      Hay muchos programas para eso, ninguna pone en riesgo al equipo, exepto con lo que te digo de las contraseñas y los micro datos almacenados en cookies

      Borrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"