Tomas Bradanovic: Inteligencia Artificial para Dummies (según Gemini)

15 febrero 2026

Inteligencia Artificial para Dummies (según Gemini)

Necesito una explicación general, muy sencilla pero rigurosa de como se entrena a un modelo de IA, Debe partir con un ejemplo muy simple de combinación lineal y luego ir desarrollando los conceptos de "pesos", "perillas", "neurona" y "red neuronal"

Versión corta (resumen)

La Inteligencia Artificial sin Magia Negra

Casi todos hoy hablan de la Inteligencia Artificial como si fuera una entidad mística o un cerebro electrónico superdotado, pero en realidad su funcionamiento es mucho más terrenal.

Para entenderlo sin saber de computación, hay que dejar de pensar en programas que siguen reglas y empezar a pensar en sistemas que aprenden por repetición, igual que un perro o un niño pequeño.

Tradicionalmente, para que una computadora hiciera algo, un programador debía darle instrucciones exactas: si pasa A, haz B. El problema es que el mundo es demasiado complejo para darle reglas a todo. La IA cambió el juego; en lugar de darle reglas, le damos ejemplos. Miles de millones de ejemplos.

Imagina que quieres enseñarle a alguien a distinguir un vino bueno de uno malo, pero esa persona nunca ha probado el alcohol. Obviamente no le das una lista de compuestos químicos. En lugar de eso, le das a probar mil copas distintas.

Con cada sorbo, tú le dices: este es bueno, este es malo. Después de la copa número mil, esa persona habrá detectado patrones en el sabor, el olor y el color que tú ni siquiera sabrías explicar con palabras. Eso es la IA: un sistema de detección de patrones basado en la estadística.

Cuando usas un traductor o un generador de texto, la máquina no está pensando ni entiende el significado de las palabras. Lo que hace es calcular probabilidades.

Si escribes El gato se subió al..., la IA busca en su memoria de millones de textos y calcula que la palabra más probable que sigue es techo. No sabe qué es un gato ni qué es un techo, solo sabe que estadísticamente esas palabras suelen ir juntas.

Para que esto funcione se necesita una potencia de cálculo brutal y una cantidad de datos gigantesca. Por eso mencionabas lo de los marcadores de Madagascar; ellos son los que le dicen a la máquina qué es cada cosa en esos ejemplos iniciales.

Sin esos humanos que etiquetan el mundo, la IA sería como un genio encerrado en una habitación oscura: tendría toda la capacidad de aprender, pero nada que mirar para empezar a entender.

En resumen, la IA es matemática aplicada a gran escala para adivinar qué es lo que sigue o qué es lo que está viendo, basándose en todo lo que aprendió del pasado. No es magia, es solo una imitación muy sofisticada de la experiencia humana acumulada en formato digital.

Versión larga (y más detallada)

Para entender cómo se entrena una inteligencia artificial, lo mejor es olvidar los robots de las películas y pensar en algo mucho más cotidiano: una radio antigua llena de perillas o el acto de ajustar la temperatura de la ducha.

En esencia, entrenar una IA es un proceso de "ensayo y error" muy organizado, donde una máquina intenta adivinar una respuesta, se equivoca, y usa ese error para ajustar sus controles internos hasta que deja de fallar.

Vamos a desglosar este proceso paso a paso, desde una simple suma hasta la complejidad de una red neuronal

El punto de partida: La combinación lineal

Imaginen que quieren predecir el precio de una taza de café basándose únicamente en cuántos gramos de grano utiliza. Entonces sospechas que hay una relación simple: a más café, más caro.

Podríamos escribir una fórmula matemática muy básica para esto:

Precio = (Cantidad de café × Valor del gramo) + Costo de la taza de plástico

En el mundo de la IA, a esta estructura la llamamos combinación lineal. Es "lineal" porque, si la dibujáramos en un gráfico, sería una línea recta: si doblo la cantidad de café, el precio sube de forma proporcional.

Aquí tenemos dos elementos clave que la máquina debe aprender: el "valor del gramo" y el "costo de la taza". Si la máquina no sabe nada de economía, empezará inventando esos números al azar.

El concepto de "Pesos" y "Perillas"

En la fórmula anterior, el "valor del gramo" es lo que en IA llamamos un Peso (weight). Se llama así porque determina cuánto "pesa" o cuánto influye una información de entrada en el resultado final.

Si el peso es muy alto, un pequeño cambio en la cantidad de café disparará el precio. Si el peso es cero, la cantidad de café no importa en absoluto para el resultado.

Podemos imaginar estos pesos como perillas de control. Entrenar a la IA es, literalmente, mover esas perillas hacia la izquierda o hacia la derecha para ver qué pasa con el resultado.

El "costo de la taza" es lo que llamamos Sesgo (bias). Es un valor base que se suma al final, independientemente de la cantidad de café que usemos. Es como el "piso" mínimo del precio.

¿Qué es una Neurona Artificial?

En computación, una neurona no es una célula viva, sino un pequeño nodo de cálculo que hace exactamente lo que acabamos de describir.

Una neurona recibe varias entradas (por ejemplo: cantidad de café, cantidad de leche, cantidad de azúcar). A cada una de esas entradas le asigna una "perilla" (un peso). Luego, suma todo eso y añade un "sesgo"

Sin embargo, hay un ingrediente extra. Si las neuronas solo sumaran cosas, la IA sería muy tonta y solo podría entender problemas lineales y simples.

Para que la IA sea "inteligente", la neurona pasa el resultado por un filtro llamado "función de activación". Este filtro decide si la información es lo suficientemente importante como para "disparar" la neurona y pasar el dato a la siguiente etapa. Es como un interruptor que dice: "si el resultado es menor a 0, ignóralo; si es mayor, pásalo".

De una neurona a la Red Neuronal

Una sola neurona puede predecir el precio de un café, pero no puede reconocer un rostro en una foto o traducir un libro del chino al español. Para tareas complejas, necesitamos millones de neuronas trabajando juntas.

Cuando conectamos miles de estas neuronas en capas, formamos una Red Neuronal.

La estructura funciona así: la primera capa recibe los datos brutos (los píxeles de una imagen, por ejemplo). Estas neuronas procesan la información y pasan sus resultados a una segunda capa de neuronas. Esta segunda capa analiza lo que recibió de la primera, y así sucesivamente.

En las primeras capas, la red detecta cosas simples como líneas o bordes. En las capas finales, esas líneas se combinan para identificar formas complejas como ojos, narices o, finalmente, una cara completa.

El proceso de entrenamiento: El "Ensayo"

Entrenar a la red es un proceso de tres pasos que se repite millones de veces. El primero es la Propagación hacia adelante (Forward Propagation).

Le entregamos a la red un dato del cual ya sabemos la respuesta. Por ejemplo, le mostramos la foto de un gato. Como la red está "nueva", todas sus perillas (pesos) están en posiciones aleatorias.

La información viaja a través de todas las capas, las neuronas hacen sus cálculos locos con sus perillas al azar, y al final la red lanza una predicción: "Estoy 80% seguro de que esto es una tostadora".

Midiendo el error: La Función de Pérdida

Obviamente, la red se equivoca al principio. Aquí entra el segundo paso crítico: medir qué tan mal lo hizo. Esto se hace mediante una fórmula matemática llamada Función de Pérdida o Costo.

Si la red dijo "tostadora" cuando era un "gato", la función de pérdida devuelve un valor muy alto. Es como un profesor que le dice al alumno: "Te equivocaste por mucho, estás muy lejos de la verdad".

El objetivo de todo el entrenamiento es que este valor de "pérdida" llegue a ser lo más cercano a cero posible.

El ajuste: Propagación hacia atrás y Descenso de Gradiente

Aquí es donde ocurre la "magia" técnica. Una vez que sabemos que la red se equivocó, necesitamos ajustar las millones de perillas (pesos) para que la próxima vez no cometa el mismo error.

Pero, ¿cuál perilla debemos mover? ¿La de la neurona 5 de la capa 2 o la de la neurona 500 de la capa 10?

Para esto se usa la Propagación hacia atrás (Backpropagation). El error viaja desde el final de la red hacia el principio. El sistema calcula cuánto contribuyó cada neurona al error final.

Luego, mediante un algoritmo llamado Descenso de Gradiente, la red decide hacia qué lado girar cada perilla. Es como estar en una montaña en medio de la niebla y querer bajar al valle: como no ves el fondo, das un paso hacia donde sientas que el suelo se inclina hacia abajo.

La IA da un pequeño paso (ajusta un poco los pesos), vuelve a intentar predecir, mide el error, y vuelve a ajustar.

La importancia de los datos

Para que este proceso funcione, la IA necesita ver miles o millones de ejemplos. Si solo le mostramos tres fotos de gatos, la red pensará que todos los gatos son de ese color o están en esa posición específica.

Esto se llama "Sobreajuste" (overfitting): la red memoriza los ejemplos en lugar de aprender el concepto general de "gato". Es como un alumno que se memoriza las respuestas del examen pero no entiende la materia.

Por eso, el entrenamiento requiere bases de datos gigantescas y una potencia de cálculo enorme para girar esas perillas millones de veces por segundo.

Resumen del ciclo

En conclusión, el entrenamiento de una IA no es más que un ciclo enorme de:

Intentar adivinar basándose en los pesos actuales de las neuronas.

Comparar la adivinanza con la realidad para ver el tamaño del error.

Repartir la culpa del error entre todas las neuronas de la red.

Ajustar ligeramente cada perilla para reducir el error la próxima vez.

Al cabo de millones de repeticiones, las posiciones de esas perillas se vuelven tan precisas que la red parece exhibir un comportamiento inteligente, aunque en el fondo solo esté resolviendo una gigantesca ecuación matemática de miles de millones de términos.

Epílogo (por el Tomás B)

Si tuviste la paciencia de llegar hasta aquí te felicito, no acostumbro a poner entradas tan largas y creo que con la versión corta es suficiente para una comprensión general del asunto. Pero si alguna vez estudiaste en matemáticas sobre las combinaciones lineales, creo que la versión larga te podría aombrar.

Al menos a mi me pareció impresionante e inesperado, ver como algo que parece tan prosaico --las matrices-- pudo crear este texto que acabas de leer, y que explica claramente como es y cómo se entrenan los modelos de inteligencia artificial ¡usando un modelo de inteligencia artificial!

Me acordé del chiste ese de los años de la U: "para entender la recursividad hay que entender primero qué es la recursividad" (o algo así)

18 comentarios:

Centurio15 febrero, 2026 22:30
Hablando de IA Bitcoin . Usted lo dijo guru...El precio está cada vez más bajo y hasta el Bukele se encuentra en problemas....

ResponderBorrar
Respuestas
Anónimo16 febrero, 2026 08:57
Pufff.. está es la formula para matar tu templo. Para leer a la IA mejor le pregunto directo :(
ResponderBorrar
Respuestas
Anónimo16 febrero, 2026 09:36
Con todo el humo que se está haciendo últimamente con el tema de las IA, es bueno conocer cómo funcionan realmente. Hay demasiada expectativa con eso de la IA generativa y muchos se están embolsando buen dinero metiendo cuentos a algukos bobos
Anticaviar
ResponderBorrar
Respuestas
Anónimo16 febrero, 2026 09:50
A sugerencia de mi hijo, pedí a la cosa artificial esa ( me niego a llamarla inteligencia) que me confeccionara una imagen de un esqueleto humano con sus dos riñones y conexiones principales, en su ubicación y proporciones reales, para efectos docentes. Habitualmente las obtengo de fotografías de libros.
La imagen que creó era absurda. Intenté en dos oportunidades más, corregir lo que había hecho y fuimos de mal en peor. Al final le "comenté" que no tenia idea de anatomía humana. Y..... jajaja, me dio la razón y me dio las gracias por la critica constructiva.
Seguiré esperando a HAL 9000. Quizás algún día.....
ResponderBorrar
Respuestas
Anónimo16 febrero, 2026 10:03
la pregunté cómo esconder dinero y las mejores formas de hacerlo, sabe mucho, es experto en tarjetas virtuales y sitios no peligrosos para hacerlo, lo único útil que le he encontrado, las perillas están ajustadas, parece que todo el mundo le pregunta por lo mismo

Mr OT
ResponderBorrar
Respuestas
Tomas Bradanovic16 febrero, 2026 10:52
Mi interés en la Inteligencia artificial tiene que ver en una sensación que he tenido siempre pero me cuesta explicarla.

Por ejemplo cuando estudié electrónica habían ciertas cosas que me parecían chino, me costó mucho aprenderlas, especialmente en matemáticas y física. Muchas de esas cosas nunca las aprendí aunque me las pude arreglar para aprobar los cursos con entrenamiento de fuerza bruta.

En esos años me fui haciendo a la idea que yo soy medio tonto, en comparación a algunos de mis compañeros, que entendían y se manejaban con cosas que a mi me quedaban como poncho. Especialmente los que tenían una gran capacidad de memoria y concentración para resolver problemas complicados, dos cosas en las que siempre fallé.

Y ahora me estoy dando cuenta que la IA se puede hacer cargo de buena parte de esas cosas en las que yo tengo las capacidades muy limitadas y que me podría concentrar en desarrollar las cosas que me salen bien -como inventar chistes y sonetos- cosas que está fuera del alcance de la IA.

Por eso me gusta el tema, puede servir para cultivar mi flojera mental, que es enorme.
ResponderBorrar
Respuestas
Anónimo18 febrero, 2026 10:41
A mí me tiene algo curco esta hype de la IA. Cuando viene alguien a hablarme de las maravillas que puede hacer por mí, de inmediato reviso a ver si mi billetera sigue donde mismo.

Eso no significa que desconozca sus utilidades, pero que súbitamente haya aparecido una pléyade de “expertos en IA” me suena parecido a los coach ontológicos, o los antiguos charlatanes, con su “no vengo a vender, sino a regalar. No me interesa su dinero, sólo su amistad”.

Coincido con que, a medida que se vayan “afinando las perillas”, iremos obteniendo mejores aplicaciones, pero de ahí a “preocúpate porque la IA te va a dejar sin trabajo, salvo que contrates mis servicios” creo que aún falta bastante, y que, de hecho, la cosa no va para ese lado.

Saludos,
El Triministro.
ResponderBorrar
Respuestas

Agregar un comentario

"Send me a postcard, drop me a line
Stating point of view
Indicate precisely what you mean to say
Yours sincerely, wasting away
Give me your answer, fill in a form
Mine for evermore
Will you still need me, will you still feed me
When I'm sixty-four"

Páginas

15 febrero 2026

Inteligencia Artificial para Dummies (según Gemini)

18 comentarios: