Handout 1 - Inteligencia Artificial y Machine Learning

Introducción al Business Analytics · Semana 15 · 06278-ECO

Autor/a

PhD. Eduard F. Martínez-González

@emartigo Eduard F. Martínez G. eduard-martinez eduard-martinez.github.io

1 Objetivo del handout

El foco está en ubicar lo que aprendiste en el semestre dentro del mapa más amplio de la IA. La palabra “IA” se usa todos los días en la prensa, en reuniones gerenciales y en propuestas de proveedores — pero designa cosas muy distintas. Confundirlas lleva a decisiones de inversión equivocadas y a proyectos que fracasan no por falta de tecnología, sino por falta de claridad conceptual.

Este handout te da el mapa. No para que te conviertas en ingeniero de IA, sino para que como analista puedas hacer la pregunta correcta cuando te toque opinar, decidir o explicar.

1.1 Lo que cubriremos

Las definiciones de IA, Machine Learning, Deep Learning y LLMs como círculos concéntricos
Ejemplos vigentes de IA que no es ML: sistemas expertos, motores de ajedrez, GPS
Tres casos de negocio que ilustran cuándo conviene cada tipo de IA
Riesgos característicos de cada categoría
Un marco simple de decisión para elegir herramienta según problema

2 Las definiciones, una por una

Antes de cualquier debate sobre qué tecnología elegir, conviene tener las definiciones limpias. Vamos en orden, de lo más amplio a lo más específico.

2.1 Inteligencia Artificial (IA)

Inteligencia Artificial es el campo que estudia cómo lograr que las máquinas realicen tareas que asociamos con la inteligencia humana: percibir, razonar, decidir, planificar, aprender, comunicarse.

La definición es amplia a propósito. Bajo ese paraguas caben enfoques muy distintos: desde un sistema basado en reglas escritas por humanos hasta un modelo que aprende patrones por sí solo. Lo único que comparten es la intención: que la máquina haga algo que normalmente requeriría una persona pensando.

Conviene resistir la tentación de creer que IA es siempre lo más nuevo o lo más avanzado. Un corrector ortográfico es IA. Un sistema que valida si una declaración de renta sigue el reglamento de la DIAN también lo es. Y un modelo de lenguaje que escribe poemas también. Son IA de naturalezas completamente distintas, y precisamente por eso conviene afinar el vocabulario.

2.2 Machine Learning (ML)

Machine Learning es un subcampo de la IA en el que la máquina aprende patrones a partir de datos, sin que un humano le escriba reglas explícitas.

En la semana 11 entrenaste un árbol para predecir, por ejemplo, si un cliente abandona o no un servicio. En ningún momento le dijiste al árbol “si la edad es mayor a 40 y el saldo es menor a un millón, entonces abandona”. Le entregaste los datos y el algoritmo encontró esa regla (u otra parecida) por sí solo.

Esa es la idea central de ML: en lugar de programar las reglas, programas el procedimiento que descubre las reglas a partir de ejemplos. Eso lo distingue de un sistema basado en reglas tradicional, donde un experto humano escribe cada condición a mano.

2.3 Deep Learning

Deep Learning es un subcampo del ML que usa redes neuronales con muchas capas para aprender patrones especialmente complejos, sobre todo en datos no estructurados como imágenes, audio o texto.

El nombre viene de “profundo” porque las redes tienen muchas capas apiladas. No necesitas entender la matemática para tener la intuición: cada capa aprende una representación más abstracta que la anterior. En reconocimiento de imágenes, las primeras capas detectan bordes, las intermedias detectan formas y las últimas detectan objetos completos. En texto, las capas iniciales aprenden patrones léxicos y las finales aprenden relaciones semánticas.

El árbol que entrenaste no es Deep Learning. Es ML clásico. Es perfectamente válido y para muchísimos problemas de negocio es la mejor opción. Confundir “ML” con “Deep Learning” es uno de los errores más comunes en conversaciones de proyecto.

2.4 LLMs (Large Language Models)

Un LLM es un modelo de Deep Learning entrenado sobre cantidades enormes de texto, especializado en producir y entender lenguaje.

ChatGPT, Claude, Gemini y Llama son ejemplos visibles de LLMs. Son la categoría más comentada en los últimos años, pero conceptualmente son una rama específica del Deep Learning, no un campo aparte ni superior. En el handout 2 entraremos en detalle sobre cómo funcionan, qué los caracteriza y para qué sirven.

2.5 El mapa visual: círculos concéntricos

La forma más útil de retener todo lo anterior es visualizarlo como cuatro círculos uno dentro del otro. Cada uno está contenido en el anterior, lo que significa que todo LLM es Deep Learning, todo Deep Learning es ML, y todo ML es IA — pero el reverso no es cierto.

Cada vez que escuches la palabra “IA”, visualiza este diagrama y pregúntate en qué círculo está lo que se está discutiendo. Es uno de los ejercicios más útiles que puedes hacer para construir criterio.

3 IA que no es ML: ejemplos históricos que importan

Una de las confusiones más comunes hoy es creer que IA y ML son sinónimos. No lo son. Hay décadas de IA anterior al boom del ML y muchos sistemas en producción que siguen siendo IA sin ser ML. Veamos cuatro ejemplos que pertenecen al anillo exterior del diagrama anterior — el espacio entre el círculo de IA y el círculo de ML.

3.1 Sistemas expertos para diagnóstico médico

En los años setenta y ochenta se construyeron sistemas como MYCIN, donde médicos especialistas escribieron miles de reglas del tipo “si el paciente presenta el síntoma X y el resultado del laboratorio Y, entonces considera la enfermedad Z con cierta probabilidad”. El sistema razonaba combinando esas reglas. Es IA porque imita razonamiento experto, pero no es ML: ningún algoritmo aprendió las reglas, fueron escritas a mano por humanos.

3.2 Motores clásicos de ajedrez

Programas como Deep Blue, el que derrotó a Kasparov en 1997, funcionaban evaluando millones de jugadas posibles y eligiendo la mejor según una función de evaluación diseñada por humanos. Es IA porque la máquina toma decisiones estratégicas, pero no es ML clásico. Los motores más recientes (como AlphaZero) sí usan ML, pero esa generación previa no.

3.3 GPS y navegación

Cuando Google Maps calcula la mejor ruta entre tu casa y la universidad, está aplicando algoritmos de búsqueda en grafos (variantes de Dijkstra o A*). Eso es IA: la máquina resuelve un problema que requeriría pensamiento humano. Pero no es ML: el algoritmo no aprendió a buscar rutas a partir de ejemplos; sigue un procedimiento matemático bien definido.

3.4 Reconocedores de voz anteriores al Deep Learning

Antes de que llegaran los modelos profundos, los sistemas de reconocimiento de voz combinaban modelos acústicos, diccionarios fonéticos y reglas gramaticales codificadas. Eran IA, pero no ML en el sentido moderno.

Advertencia

Tener estos ejemplos a la mano evita un error muy frecuente: creer que cualquier solución “inteligente” requiere entrenar un modelo con datos. A veces un buen sistema basado en reglas resuelve mejor el problema, con menos costo, menos riesgo y mucho más fácil de auditar.

4 Tres situaciones, tres tipos de IA

Las definiciones tienen su mejor traducción en ejemplos. Lo que sigue son tres casos de negocio realistas. Léelos preguntándote: “¿en qué círculo del diagrama cae esto?”.

4.1 Caso 1 · Entidad financiera prediciendo impago

Un banco quiere anticipar qué clientes incumplirán el pago de un crédito de consumo. Tiene años de historial: edad, ingreso, score crediticio, antigüedad laboral, número de productos, historial de pagos, ciudad. Entrena un árbol de clasificación (o un ensamble) sobre esos datos. El modelo aprende patrones del tipo “clientes con tres o más productos activos y antigüedad laboral menor a un año en cierto rango de ingreso tienen mayor probabilidad de impago”.

Esto es ML clásico supervisado, lo mismo que viste en la semana 11. La etiqueta “impagó / no impagó” existe en los datos históricos, y eso permite entrenar y evaluar con matriz de confusión. Es la herramienta correcta porque los datos son estructurados y la pregunta es predictiva.

4.2 Caso 2 · Cadena minorista segmentando clientes

Una cadena de retail tiene datos transaccionales de millones de clientes: frecuencia de visita, ticket promedio, categorías compradas, sensibilidad a promociones. Quiere agruparlos en perfiles para diseñar campañas distintas. No tiene una etiqueta de “tipo de cliente”: el objetivo es descubrir los grupos.

Esto es ML no supervisado, como el k-means de la semana 10. Es la herramienta correcta porque no hay etiqueta y el objetivo es exploratorio: descubrir estructura, no predecir un resultado.

4.3 Caso 3 · Validación tributaria por reglas

La administración tributaria de un país necesita validar que cada declaración de renta cumpla con docenas de condiciones del estatuto: que los topes deducibles no se excedan, que ciertos códigos sean coherentes con la actividad económica del contribuyente, que las cifras sumen lo que deben sumar. Las reglas están escritas en una norma legal. Si un caso las viola, debe marcarse para revisión humana.

Aquí no conviene ML. El conocimiento ya existe formalizado en una norma. Un sistema basado en reglas es más transparente, más auditable, más fácil de actualizar cuando cambie la ley y mucho más defendible ante un contribuyente que pregunte por qué su declaración fue marcada. Es IA, pero IA no-ML. Confundir esto y querer “entrenar un modelo” sería una mala decisión técnica y regulatoria.

Conexión con semanas 10 y 11

El Caso 1 es exactamente el tipo de problema que abordaste con árboles (semana 11). El Caso 2 es el tipo de problema que abordaste con k-means (semana 10). El Caso 3 muestra algo nuevo: no todo problema de “automatización inteligente” merece ML. A veces el mejor sistema es el más simple y el más auditable.

5 Limitaciones y riesgos por categoría

Cada tipo de IA tiene sus propias debilidades. Como analista, lo que más vale es saber qué puede salir mal en cada caso.

5.1 ML clásico

Depende fuertemente de la calidad de los datos. Si los datos históricos están sesgados (por ejemplo, si solo otorgaste crédito a un perfil específico de cliente), el modelo aprende ese sesgo. Si las condiciones del negocio cambian (lo que se llama concept drift), el modelo se vuelve obsoleto. Y en problemas con muchas variables y poca data, sobreajusta — lo que conociste como overfitting en la semana 11.

5.2 Deep Learning

Necesita volúmenes enormes de datos y poder de cómputo. Sus decisiones son más difíciles de interpretar que las de un árbol. Para una entidad financiera o un sector regulado, esa opacidad puede ser un obstáculo serio, porque las decisiones automatizadas deben poder explicarse al cliente y al regulador.

5.3 Sistemas basados en reglas

Son frágiles cuando el mundo no se ajusta a las reglas. Mantenerlos cuesta: cada cambio normativo o de negocio obliga a tocar el código. No generalizan: si surge un caso que las reglas no previeron, el sistema falla — a veces en silencio, a veces de forma ruidosa.

5.4 LLMs

Los veremos en detalle en el handout 2, pero conviene adelantar lo central: alucinan (afirman cosas falsas con seguridad), heredan sesgos del corpus de entrenamiento, no son deterministas y no se evalúan con métricas tan limpias como una matriz de confusión.

Advertencia

No existe la categoría perfecta. Cada tecnología tiene sus modos de fallar, y elegir bien implica anticipar cuáles de esos fallos resultan tolerables en tu contexto y cuáles no.

6 Marco de decisión: ¿cuándo usar qué?

Como analista, conviene tener una pauta rápida para orientar conversaciones técnicas. La tabla siguiente sintetiza el criterio.

Tu situación	Herramienta de primera elección	Por qué
Datos estructurados con etiquetas históricas y quieres predecir (impago, churn, conversión)	ML supervisado clásico (regresión, árboles, ensambles)	Interpretable, evaluable con matriz de confusión, barato
Datos sin etiquetas y quieres descubrir estructura (segmentos, anomalías)	ML no supervisado (k-means, clustering, anomalías)	El objetivo es exploratorio, no predictivo
Reglas conocidas, estables y verificables (normativa, validaciones formales)	Sistema basado en reglas	Auditable, trazable, fácil de actualizar al cambio de ley
Texto no estructurado (resumir, generar, responder en lenguaje natural)	LLMs	El terreno cambia: evaluación distinta, ver handout 2

Advertencia

No asumas que la herramienta más nueva es la mejor. Un árbol simple bien entrenado con buenos datos suele ganarle a un modelo sofisticado mal entrenado. Y un sistema de reglas bien diseñado puede ser superior a un modelo complejo para problemas regulados.

7 Síntesis: cinco ideas para llevarte

Primero, IA es el campo amplio. ML es un subcampo donde la máquina aprende patrones de datos. Deep Learning es un subcampo del ML. Los LLMs son un caso particular del Deep Learning. Visualízalo siempre como círculos concéntricos.

Segundo, hay IA que no es ML. Sistemas expertos, motores de ajedrez clásicos, GPS y validadores de reglas son ejemplos vigentes y útiles.

Tercero, lo que entrenaste en este curso es ML clásico. Es una rama pequeña pero poderosa, y para muchísimos problemas de negocio es la opción correcta.

Cuarto, la herramienta se elige por el problema, no al revés. La pregunta no es “¿cómo aplicamos IA?” sino “¿qué tipo de problema tenemos y qué tipo de IA encaja?”.

Quinto, cada categoría tiene sus propias formas de fallar. Conocerlas es lo que separa a un analista con criterio de un consumidor pasivo de tecnología.

7.1 Material adicional (opcional)

Russell & Norvig, Artificial Intelligence: A Modern Approach — referencia clásica del campo, especialmente los capítulos 1 y 2 para la visión histórica
Google ML Crash Course — definiciones y ejemplos interactivos — developers.google.com/machine-learning/crash-course
An Introduction to Statistical Learning (ISLR) — Capítulo 1: panorámica del aprendizaje estadístico — statlearning.com

7.2 Checklist de preclase

Antes de pasar al handout 2 debes poder explicar con tus propias palabras:

¿Cuál es la diferencia entre IA, ML, Deep Learning y LLMs?
¿Puedes dar al menos dos ejemplos de IA que no sea ML?
¿Es el árbol de clasificación de la semana 11 Deep Learning? ¿Por qué?
Frente a un problema de negocio, ¿puedes identificar si conviene ML supervisado, ML no supervisado, reglas o LLM?
¿Puedes nombrar al menos un riesgo característico de cada categoría?
¿Por qué un sistema basado en reglas puede ser superior a un modelo de ML en ciertos contextos?
¿Por qué decimos que la limpieza de datos no es IA?

Si alguna pregunta te deja en silencio, vuelve a la sección correspondiente antes de continuar.

7.3 Preguntas de comprensión

1. Un gerente de una startup colombiana propone “implementar IA para todo lo que se pueda automatizar en la empresa”. ¿Qué preguntas le harías antes de aceptar la propuesta y por qué?

Ver respuesta

Conviene desagregar la frase “IA para todo”. Las preguntas razonables son: ¿qué tareas específicas se quieren automatizar?, ¿hay datos históricos para esas tareas?, ¿están etiquetados?, ¿el problema tiene reglas conocidas o requiere aprender patrones?, ¿qué costo tiene equivocarse?, ¿cómo se va a evaluar el sistema?

Sin esas respuestas, “IA para todo” es una intención sin proyecto. Cada tarea posiblemente requerirá una herramienta distinta: algunas ML supervisado, otras reglas, otras LLMs, otras simplemente buena automatización tradicional.

2. Compara el árbol de clasificación que entrenaste en la semana 11 con un sistema basado en reglas escritas por un experto humano. ¿En qué se parecen y en qué se diferencian?

Ver respuesta

Ambos pueden expresar su lógica como una serie de reglas si-entonces y ambos pueden auditarse en términos de qué condiciones llevaron a qué decisión. La diferencia central es el origen de las reglas: en el árbol, las reglas las descubrió el algoritmo a partir de datos históricos; en el sistema experto, las escribió una persona con conocimiento del dominio.

Eso tiene implicaciones: el árbol se actualiza reentrenando con nuevos datos; el sistema experto, reescribiendo reglas. El árbol depende de la calidad de los datos; el experto depende del conocimiento del especialista.

3. Una empresa quiere reducir el tiempo que toma responder los correos del servicio al cliente. ¿Es un problema de ML clásico, de LLMs, de reglas, o una combinación? Argumenta.

Ver respuesta

Probablemente una combinación. Clasificar el correo en una categoría (queja, solicitud, consulta de saldo) puede hacerse con ML supervisado o con un LLM. Redactar la respuesta en lenguaje natural es claramente terreno de LLM. Validar que ciertos correos críticos (reclamos formales, casos legales) escalen siempre a un humano se hace mejor con reglas.

La pregunta interesante no es “qué tecnología usar” sino “qué pieza del flujo resuelve cada tecnología mejor”.

4. ¿Por qué decimos que la limpieza de datos no es IA, si para muchos proyectos de IA es la fase más larga y más decisiva?

Ver respuesta

Porque la limpieza no involucra que la máquina razone, aprenda o decida: es transformación y verificación. Pero es absolutamente necesaria para que cualquier proyecto de IA funcione. Eso explica una verdad incómoda del oficio: gran parte del trabajo de un analista o científico de datos no es modelar, es preparar.

Por eso este curso empezó por ahí. Sin datos limpios no hay IA buena, por sofisticada que sea.

5. Recibes la propuesta de un proveedor que ofrece “un modelo de Deep Learning para predecir cuándo un cliente abandonará el servicio, con accuracy superior al 95%”. Solo tienes 800 registros históricos. ¿Qué te genera dudas en esa propuesta?

Ver respuesta

Varias señales de alerta. Primero, Deep Learning con 800 registros es típicamente exagerado: redes neuronales profundas necesitan miles o decenas de miles de ejemplos para funcionar bien. Un árbol o una regresión logística probablemente rendiría igual o mejor con esa cantidad de datos, y sería interpretable. Segundo, el 95% de accuracy debe leerse con cuidado: si las clases están desbalanceadas (por ejemplo, solo 5% de clientes abandona), un modelo que prediga “no abandona” para todos ya alcanza 95% sin aprender nada. Tercero, el proveedor no menciona cómo se evaluó ese 95% — ¿train o test? ¿con qué partición? Sin esos detalles, la cifra no significa nada.

7.4 Glosario mínimo

Inteligencia Artificial (IA): campo que estudia cómo lograr que las máquinas realicen tareas asociadas con la inteligencia humana.

Machine Learning (ML): subcampo de la IA donde la máquina aprende patrones a partir de datos, sin reglas escritas por humanos.

Deep Learning: subcampo del ML basado en redes neuronales con muchas capas, especialmente útil para datos no estructurados.

LLM (Large Language Model): modelo de Deep Learning especializado en lenguaje, entrenado sobre grandes cantidades de texto.

Sistema basado en reglas: programa que toma decisiones siguiendo condiciones lógicas escritas por humanos. Es IA, no es ML.

ML supervisado: aprendizaje a partir de datos con etiqueta conocida. Predecir impago, churn o conversión.

ML no supervisado: aprendizaje a partir de datos sin etiqueta. Segmentar clientes, detectar anomalías.

Overfitting: cuando un modelo se ajusta tan bien a los datos de entrenamiento que pierde capacidad de generalizar.

Datos estructurados: datos organizados en filas y columnas, como una tabla de ventas.

Datos no estructurados: texto libre, imágenes, audio, video. Requieren procesamiento especializado.

En el handout 2 entraremos en cómo funcionan los LLMs, qué pueden y no pueden hacer, y cómo se convierten en agentes capaces de actuar. En el handout 3 abordaremos la habilidad más importante para trabajar con ellos: formular buenos prompts.