Páginas

15 febrero 2026

Inteligencia Artificial para Dummies (según Gemini)

Necesito una explicación general, muy sencilla pero rigurosa de como se entrena a un modelo de IA, Debe partir con un ejemplo muy simple de combinación lineal y luego ir desarrollando los conceptos de "pesos", "perillas", "neurona" y "red neuronal"

Versión corta (resumen)

La Inteligencia Artificial sin Magia Negra

Casi todos hoy hablan de la Inteligencia Artificial como si fuera una entidad mística o un cerebro electrónico superdotado, pero en realidad su funcionamiento es mucho más terrenal. 

Para entenderlo sin saber de computación, hay que dejar de pensar en programas que siguen reglas y empezar a pensar en sistemas que aprenden por repetición, igual que un perro o un niño pequeño.

Tradicionalmente, para que una computadora hiciera algo, un programador debía darle instrucciones exactas: si pasa A, haz B. El problema es que el mundo es demasiado complejo para darle reglas a todo. La IA cambió el juego; en lugar de darle reglas, le damos ejemplos. Miles de millones de ejemplos.

Imagina que quieres enseñarle a alguien a distinguir un vino bueno de uno malo, pero esa persona nunca ha probado el alcohol. Obviamente no le das una lista de compuestos químicos. En lugar de eso, le das a probar mil copas distintas. 

Con cada sorbo, tú le dices: este es bueno, este es malo. Después de la copa número mil, esa persona habrá detectado patrones en el sabor, el olor y el color que tú ni siquiera sabrías explicar con palabras. Eso es la IA: un sistema de detección de patrones basado en la estadística.

Cuando usas un traductor o un generador de texto, la máquina no está pensando ni entiende el significado de las palabras. Lo que hace es calcular probabilidades. 

Si escribes El gato se subió al..., la IA busca en su memoria de millones de textos y calcula que la palabra más probable que sigue es techo. No sabe qué es un gato ni qué es un techo, solo sabe que estadísticamente esas palabras suelen ir juntas.

Para que esto funcione se necesita una potencia de cálculo brutal y una cantidad de datos gigantesca. Por eso mencionabas lo de los marcadores de Madagascar; ellos son los que le dicen a la máquina qué es cada cosa en esos ejemplos iniciales. 

Sin esos humanos que etiquetan el mundo, la IA sería como un genio encerrado en una habitación oscura: tendría toda la capacidad de aprender, pero nada que mirar para empezar a entender.

En resumen, la IA es matemática aplicada a gran escala para adivinar qué es lo que sigue o qué es lo que está viendo, basándose en todo lo que aprendió del pasado. No es magia, es solo una imitación muy sofisticada de la experiencia humana acumulada en formato digital.

Versión larga (y más detallada)

Para entender cómo se entrena una inteligencia artificial, lo mejor es olvidar los robots de las películas y pensar en algo mucho más cotidiano: una radio antigua llena de perillas o el acto de ajustar la temperatura de la ducha.

En esencia, entrenar una IA es un proceso de "ensayo y error" muy organizado, donde una máquina intenta adivinar una respuesta, se equivoca, y usa ese error para ajustar sus controles internos hasta que deja de fallar.

Vamos a desglosar este proceso paso a paso, desde una simple suma hasta la complejidad de una red neuronal

El punto de partida: La combinación lineal

Imaginen que quieren predecir el precio de una taza de café basándose únicamente en cuántos gramos de grano utiliza. Entonces sospechas que hay una relación simple: a más café, más caro.

Podríamos escribir una fórmula matemática muy básica para esto:

Precio = (Cantidad de café × Valor del gramo) + Costo de la taza de plástico

En el mundo de la IA, a esta estructura la llamamos combinación lineal. Es "lineal" porque, si la dibujáramos en un gráfico, sería una línea recta: si doblo la cantidad de café, el precio sube de forma proporcional.

Aquí tenemos dos elementos clave que la máquina debe aprender: el "valor del gramo" y el "costo de la taza". Si la máquina no sabe nada de economía, empezará inventando esos números al azar.

El concepto de "Pesos" y "Perillas"

En la fórmula anterior, el "valor del gramo" es lo que en IA llamamos un Peso (weight). Se llama así porque determina cuánto "pesa" o cuánto influye una información de entrada en el resultado final.

Si el peso es muy alto, un pequeño cambio en la cantidad de café disparará el precio. Si el peso es cero, la cantidad de café no importa en absoluto para el resultado.

Podemos imaginar estos pesos como perillas de control. Entrenar a la IA es, literalmente, mover esas perillas hacia la izquierda o hacia la derecha para ver qué pasa con el resultado.

El "costo de la taza" es lo que llamamos Sesgo (bias). Es un valor base que se suma al final, independientemente de la cantidad de café que usemos. Es como el "piso" mínimo del precio.

¿Qué es una Neurona Artificial?

En computación, una neurona no es una célula viva, sino un pequeño nodo de cálculo que hace exactamente lo que acabamos de describir.

Una neurona recibe varias entradas (por ejemplo: cantidad de café, cantidad de leche, cantidad de azúcar). A cada una de esas entradas le asigna una "perilla" (un peso). Luego, suma todo eso y añade un "sesgo"

Sin embargo, hay un ingrediente extra. Si las neuronas solo sumaran cosas, la IA sería muy tonta y solo podría entender problemas lineales y simples.

Para que la IA sea "inteligente", la neurona pasa el resultado por un filtro llamado "función de activación". Este filtro decide si la información es lo suficientemente importante como para "disparar" la neurona y pasar el dato a la siguiente etapa. Es como un interruptor que dice: "si el resultado es menor a 0, ignóralo; si es mayor, pásalo".

De una neurona a la Red Neuronal

Una sola neurona puede predecir el precio de un café, pero no puede reconocer un rostro en una foto o traducir un libro del chino al español. Para tareas complejas, necesitamos millones de neuronas trabajando juntas.

Cuando conectamos miles de estas neuronas en capas, formamos una Red Neuronal.

La estructura funciona así: la primera capa recibe los datos brutos (los píxeles de una imagen, por ejemplo). Estas neuronas procesan la información y pasan sus resultados a una segunda capa de neuronas. Esta segunda capa analiza lo que recibió de la primera, y así sucesivamente.

En las primeras capas, la red detecta cosas simples como líneas o bordes. En las capas finales, esas líneas se combinan para identificar formas complejas como ojos, narices o, finalmente, una cara completa.

El proceso de entrenamiento: El "Ensayo"

Entrenar a la red es un proceso de tres pasos que se repite millones de veces. El primero es la Propagación hacia adelante (Forward Propagation).

Le entregamos a la red un dato del cual ya sabemos la respuesta. Por ejemplo, le mostramos la foto de un gato. Como la red está "nueva", todas sus perillas (pesos) están en posiciones aleatorias.

La información viaja a través de todas las capas, las neuronas hacen sus cálculos locos con sus perillas al azar, y al final la red lanza una predicción: "Estoy 80% seguro de que esto es una tostadora".

Midiendo el error: La Función de Pérdida

Obviamente, la red se equivoca al principio. Aquí entra el segundo paso crítico: medir qué tan mal lo hizo. Esto se hace mediante una fórmula matemática llamada Función de Pérdida o Costo.

Si la red dijo "tostadora" cuando era un "gato", la función de pérdida devuelve un valor muy alto. Es como un profesor que le dice al alumno: "Te equivocaste por mucho, estás muy lejos de la verdad".

El objetivo de todo el entrenamiento es que este valor de "pérdida" llegue a ser lo más cercano a cero posible.

El ajuste: Propagación hacia atrás y Descenso de Gradiente

Aquí es donde ocurre la "magia" técnica. Una vez que sabemos que la red se equivocó, necesitamos ajustar las millones de perillas (pesos) para que la próxima vez no cometa el mismo error.

Pero, ¿cuál perilla debemos mover? ¿La de la neurona 5 de la capa 2 o la de la neurona 500 de la capa 10?

Para esto se usa la Propagación hacia atrás (Backpropagation). El error viaja desde el final de la red hacia el principio. El sistema calcula cuánto contribuyó cada neurona al error final.

Luego, mediante un algoritmo llamado Descenso de Gradiente, la red decide hacia qué lado girar cada perilla. Es como estar en una montaña en medio de la niebla y querer bajar al valle: como no ves el fondo, das un paso hacia donde sientas que el suelo se inclina hacia abajo.

La IA da un pequeño paso (ajusta un poco los pesos), vuelve a intentar predecir, mide el error, y vuelve a ajustar.

La importancia de los datos

Para que este proceso funcione, la IA necesita ver miles o millones de ejemplos. Si solo le mostramos tres fotos de gatos, la red pensará que todos los gatos son de ese color o están en esa posición específica.

Esto se llama "Sobreajuste" (overfitting): la red memoriza los ejemplos en lugar de aprender el concepto general de "gato". Es como un alumno que se memoriza las respuestas del examen pero no entiende la materia.

Por eso, el entrenamiento requiere bases de datos gigantescas y una potencia de cálculo enorme para girar esas perillas millones de veces por segundo.

Resumen del ciclo

En conclusión, el entrenamiento de una IA no es más que un ciclo enorme de:

Intentar adivinar basándose en los pesos actuales de las neuronas.

Comparar la adivinanza con la realidad para ver el tamaño del error.

Repartir la culpa del error entre todas las neuronas de la red.

Ajustar ligeramente cada perilla para reducir el error la próxima vez.

Al cabo de millones de repeticiones, las posiciones de esas perillas se vuelven tan precisas que la red parece exhibir un comportamiento inteligente, aunque en el fondo solo esté resolviendo una gigantesca ecuación matemática de miles de millones de términos.

Epílogo (por el Tomás B)

Si tuviste la paciencia de llegar hasta aquí te felicito, no acostumbro a poner entradas tan largas y creo que con la versión corta es suficiente para una comprensión general del asunto. Pero si alguna vez estudiaste en matemáticas sobre las combinaciones lineales, creo que la versión larga te podría aombrar.

Al menos a mi me pareció impresionante e inesperado, ver como algo que parece tan prosaico --las matrices-- pudo crear este texto que acabas de leer, y que explica claramente como es y cómo se entrenan los modelos de inteligencia artificial ¡usando un modelo de inteligencia artificial!

Me acordé del chiste ese de los años de la U: "para entender la recursividad hay que entender primero qué es la recursividad" (o algo así)

17 comentarios:

  1. Hablando de IA Bitcoin . Usted lo dijo guru...El precio está cada vez más bajo y hasta el Bukele se encuentra en problemas....

    ResponderBorrar
    Respuestas
    1. Era re predecible desde hace años, no había que ser muy pitoniso para darse cuenta. Lo de Bukele es escandaloso porque jugó con plata del tesoro público. Eso no se hace.

      Borrar
  2. Pufff.. está es la formula para matar tu templo. Para leer a la IA mejor le pregunto directo :(

    ResponderBorrar
    Respuestas
    1. El gran problema que Don Tomás se está alargando mucho y uno no sabe si lo que se narra es IA o es él...Es delicado el asunto.
      "En el mundo de la IA, a esta estructura la llamamos combinación lineal. Es "lineal" porque, si la dibujáramos en un gráfico, sería una línea recta: si doblo la cantidad de café, el precio sube de forma proporcional."
      El problema que es una ecuación logarítmica. A mayor cantidad, menor el precio unitario (peso)....y precio final (sesgo)

      El resultado es gracias a una estadística, pero sabemos por la regla inversa de Pareto que es un engaño encubierto...Es decir, la IA tendría un 80% de respuesta errónea al primer intento. Una "función de activación" erronea.

      Borrar
    2. No es problema mío, yo escribo como me sale nomás. Además siempre indico claramente que contenido lo redacto yo y cual es de Gemini, el que siempre copio textual. Si es demasiado largo no lo lenn y listo.

      Una precisión matemática importante: aquí no existen ecuaciones logarítmicas ni exponenciales, son todas combinaciones LINEALES es decir todas las variables son de primer grado.

      Por eso la cosa funciona, con potencias un modelo así sería imposible hacerlo funcionar, son polinomios de primer grado con n variables, del tipo
      F(x1,x2...xn)=K1x1+K2x2....KnXn+C

      Cuando graficas eso salen solo líneas rectas, por eso se les puede aplicar los potentes métodos del álgebra lineal: matrices, vectores y valores propios, etc.

      La idea original que está en la base de todos los modelos de IA fue de los inventores del algoritmo de Google para calcular el Page Rank, si no me equivoco parece ser una extensión de esa idea base de las matrices.

      El uso de la estadística en esto también es muy diferente a lo que se supone, por lo que entiendo solo se usan estadísticas descriptivas para calcular probabilidades, me parece que no se usa inferencia estadística en absoluto.

      Lo de Pareto no corre para esto, eso se refuere a asuntos donde actua el comportamiento humano y en la IA el comportamiento humano no juega ningún papel, es solo una estimación mecánica por aproximaciones sucesivas.

      La dirección de los cambios en las perillas, como lo entendí yo, se calcula con derivadas, eso permite variar las pendientes sucesivamente hasta llegar a un "valle" que podría ser un resultado correcto o una alucinación.

      Al menos eso es lo que entendí yo. antes tenía una idea confusa de como funcionaba la cosa, pero con esta respuesta de Gemini -que está copiada textualmente- creo que lo pude entender mucho mejor, especialmente en los principios matemáticos con que se van formando las respuestas.

      Borrar
    3. Gracias Don Tomás por su atenta respuesta. Que bueno que diferencie en forma marcada lo que es de la IA y lo que está escrito por usted. Es importante. Yo personalmente opino que usted no debería poner nada textual de la IA todo ese conocimiento debería ser analizado y luego escrito por usted en su magnífico blog. La electrónica para Dummies es un excelente ejemplo de ello.

      Borrar
    4. El problema es que hasta hace días yo no tenía la más remota idea de este asunto, así es que mal voy a poder interpretar muchas cosas, recién estoy tratando de entenderlas a un nvel básico pero que sirva para guirme en el uso de la herramienta.

      Así es que aunque la redacción de Gemini no es para nada amena, la explicación es muy esclarecedora, a mi al menos me abrió varias ventanas de cosas que apenas entendía confusamente. En realidad esto lo escribí principalmente para mi y lo publico por i a alguien le interesa entender cómo funciona.

      Es bueno saber eso porque así vamos adquiriendo una capacidad que casi nadie tene todavía: entender para qué sirve y para qué no sirve, evitarnos preguntar tonteras que nos llevarán a alucinaciones y respuestas ridículas, etc.

      Esto que parece marginal, yo creo que será extremadamente importante en poco tiempo más, porque la IA es potencialmente TAN útil que saber cuando y cómo usarla será un activo enorme para cualquiera.

      Borrar
    5. Lo de la electrónica era muy distinto porque es algo que hasta cierto nivel yo domino perfectamente, así es que puedo redactar de eso con la misma soltura de cuerpo como redacta Gemini sobre la IA.

      A propósito no deja de asombrarme que la mejor explicación -en todo sentido- que he leído sobre la IA es hecha por ella misma. "Para entender la recustividad primero tiees que entender qué es la recursividad" jaja

      Borrar
  3. Con todo el humo que se está haciendo últimamente con el tema de las IA, es bueno conocer cómo funcionan realmente. Hay demasiada expectativa con eso de la IA generativa y muchos se están embolsando buen dinero metiendo cuentos a algukos bobos
    Anticaviar

    ResponderBorrar
    Respuestas
    1. Hay varias cosas interesantes en l forma en que se están usando las máquinas para que "aprendan", esto podría tener aplicaciones en la enseñanza a los humanos por ejemplo, que siempre ha estado muy centrada en "desarrollar el ingenio", cuando podría ser mucho más sencillo dar problemas resueltos a los estudiantes para que los repitan.

      Hace años yo descubrí que la programación se aprende mucho mejor copiando muchos pedazos de código ya hechos (snippets) que con el tiempo uno eles empieza a hacer variaciones. Por eso mi curso "Python en 3 días" no se proponen problemas para que los "resuelvan" sino trozos de código para que piemero los copien, los analicen y después empiecen a diseñar variantes, modificándolos.

      Yo creo que esa idea de enseñar, enfrentando al estudiante a problemas complicados que requieren mucha memoria u concentración, supone que "el ingenio" es una capacidad que se desarrolla como un músculo y que mientras más complicados son los problemasque engrenta el estudiante, más desarrollará su "ingenio".

      Pienso que no ocurre así. Hay gente que es muy ingeniosa, por ejemplo en álgebra o para jugar al ajedrez y cosas así, y al mismo tiempo son muy tontos en todo lo demás.

      El problema, creo yo, es que no está bien comprendido en qué consiste -y menos cómo se desarrolla- la inteligencia "general", y esto que se está haciendo con las máquinas podría mejorar esa comprención. Tal bez algo se pueda aprender de todo esto.

      Borrar
  4. A sugerencia de mi hijo, pedí a la cosa artificial esa ( me niego a llamarla inteligencia) que me confeccionara una imagen de un esqueleto humano con sus dos riñones y conexiones principales, en su ubicación y proporciones reales, para efectos docentes. Habitualmente las obtengo de fotografías de libros.
    La imagen que creó era absurda. Intenté en dos oportunidades más, corregir lo que había hecho y fuimos de mal en peor. Al final le "comenté" que no tenia idea de anatomía humana. Y..... jajaja, me dio la razón y me dio las gracias por la critica constructiva.
    Seguiré esperando a HAL 9000. Quizás algún día.....

    ResponderBorrar
    Respuestas
    1. Ah, Marcelo Jorquera el anterior comentario.

      Borrar
    2. jajaja Marcelo, ese es el peor problema de la IA, pero es un error de capa 8 como dicen los computines (o sea humano)

      Ceo que tiene que ver con las expectativas exageradas de pensar que la IA es una especie de "supercerebro" que puede responder bien a cualquier cosa por medio de algún procedimiento medio mágico,

      Hay muchas cosas que estas aplicaciones no aon cpaces de responder correctamente, pero como son máquinas diseñadas para contestar siempre (por el objetivo comercial de su diseño) muchas veces nos entrega una alucinación, como tu esqueleto.

      Otra cosa que pasa con esto es el hecho que cosas que para nosotros parecen muy simples de resolver, para la IA son prácticamente imposibles,

      Por ejemplo los vehículos que se conducen solos en medio del tráfico normal. Eso es algo que a nosotros nos parece sencillísimo, yo mismo hace unos años decía que en pocos años iban a desaparecer los choferes y estaríamos repletos de autos sin conductor.

      Sin embargo ese es un problema gigantesco para la IA y aunque existen taxis sin chofer en China y San Francisco, la gente ni se imagina lo riesgososy sujetos a toda clase de problemas que son. Por eso hasta ahora no se han masificado.

      Por otra parte problemas que a nosotros nos parecen imposibles, la IA los puede hacer con gran facilidad. Dicen que los diagnósticos médicos, mecánicos, el desarrollo de altas matemáticas (demostración de teoremas y xosas así), la secuenciación genética, sintetizar quimicos, etc. todas esas cosas que a partir de datos y que requieren mucha experiencia acumulada, además de una capacidad enorme de calcular probabilidades, son cosas que la IA las puede hacer muy bien.

      Por eso cuando yo me jactaba que podía escribr un soneto mucho mejor que Chatgpt, lo que decía era absurdo porque componer sonetos o crear buenos chistes y cosas así son cosas que están muy fuera del alcance de estas aplicaciones.

      Lo de anatomía muestra otra limitación importante de la IA: es que la capacidad de entrenamiento no es infinita. Farte una respuesta anatómicamente exacta no es algo demadiado complicado SIEMPRE Y CUANDO hayan entrenado el modelo para eso y los marcadores humanos hayan ingresado al modelo miles de etiquetas de anatomía, cosa que no creo que hayan hecho los que diseñaron la aplicación.

      Creo que hay una regla muy buena para saber para qué cosas sirve y para qué no: lo que a nosotros nos parece muy difícil, para la IA es fácil y viceversa.

      Entonces para todas las preguntas que nosotros conocemos bien la respuesta y las hacemos "para probarla" probabblemente se equivoque, porque son cosas extremadamente difíciles para una máquina.

      Y para cosas qe nos parecen extremadamente complicadas y difíciles probablemente muchas veces nos sorprenderá con respuestas acertadas.

      En estas cosas, Arthur Clarke y Asimov parece que andaban más perdidos que el teniente Bello-

      Borrar
  5. la pregunté cómo esconder dinero y las mejores formas de hacerlo, sabe mucho, es experto en tarjetas virtuales y sitios no peligrosos para hacerlo, lo único útil que le he encontrado, las perillas están ajustadas, parece que todo el mundo le pregunta por lo mismo

    Mr OT

    ResponderBorrar
    Respuestas
    1. Esa intuición me parece que es correcta, para las cosas que le preguntan mucho y que están dentro de lo que puede responder bien, normalmente las respuestas son adecuadas y muy útiles. Al menos así lo he podido ver yo, que estoy muy interesado en el asunto.

      Borrar
  6. Mi interés en la Inteligencia artificial tiene que ver en una sensación que he tenido siempre pero me cuesta explicarla.

    Por ejemplo cuando estudié electrónica habían ciertas cosas que me parecían chino, me costó mucho aprenderlas, especialmente en matemáticas y física. Muchas de esas cosas nunca las aprendí aunque me las pude arreglar para aprobar los cursos con entrenamiento de fuerza bruta.

    En esos años me fui haciendo a la idea que yo soy medio tonto, en comparación a algunos de mis compañeros, que entendían y se manejaban con cosas que a mi me quedaban como poncho. Especialmente los que tenían una gran capacidad de memoria y concentración para resolver problemas complicados, dos cosas en las que siempre fallé.

    Y ahora me estoy dando cuenta que la IA se puede hacer cargo de buena parte de esas cosas en las que yo tengo las capacidades muy limitadas y que me podría concentrar en desarrollar las cosas que me salen bien -como inventar chistes y sonetos- cosas que está fuera del alcance de la IA.

    Por eso me gusta el tema, puede servir para cultivar mi flojera mental, que es enorme.

    ResponderBorrar

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"