El fin último del desarrollo de tecnologías de Inteligencia Artificial (IA), que lideran compañías como OpenAI, es llegar a contar con modelos de inteligencia artificial general (IAG), capaces de resolver cualquier tarea o petición de los usuarios, y de analizar todo tipo de información proveniente de distintos formatos o registros sensoriales. Y una herramienta clave para la construcción de estos modelos de propósito general son los agentes inteligentes (o agentes de IA).

Los agentes inteligentes son, básicamente, modelos desarrollados para fines específicos, optimizados para resolver problemas puntuales de distintas áreas tales como asistencia al consumidor, internet de las cosas (IoT) o en cadenas de suministros y logística. Su propósito es asistir a los humanos en tareas relativamente mecánicas, y al combinarlos se pueden crear modelos de propósito general.

Una característica central de esta tecnología es que su funcionamiento es autónomo. Aunque en principio son entrenados por humanos, luego pueden operar de forma independiente, analizando la información de un sistema o aplicación o, en el caso de que se apliquen en productos físicos como robots, el entorno que los rodea. Un ejemplo de uso para este último caso son los autos con sistemas de conducción autónoma, que perciben esa información a través de sensores y la analizan para definir qué acciones tomar.

Los agentes de IA le permiten a vehículos de conducción autónoma identificar objetos.

En términos generales hay dos tipos de agentes de IA: aquellos que siguen reglas predefinidas; y los que de manera autónoma aprenden y se adaptan a diferentes situaciones para responder de la mejor manera posible.

A su vez, estos agentes se pueden clasificar, dependiendo de su funcionamiento, como reactivos (responden directamente a los estímulos); deliberativos (planifican para tomar distintas decisiones); o con capacidades de aprendizaje (se adaptan en base a los datos y la experiencia).

Un uso que da cuenta de las posibilidades que ofrecen este tipo de agentes es el que anunció, a fines del año pasado, la compañía OpenAI. Tras el auge de su modelo de IA conversacional, presentaron una nueva herramienta para los usuarios de pago, que les permite crear sus propios agentes personalizados según el rol que se necesite, como por ejemplo un “coach de escritura creativa” o un “compañero de viaje”. En este caso, a través del procesamiento de lenguaje natural (PLN), se puede interactuar con agentes mejor preparados para resolver tareas específicas, en comparación con ChatGPT, que es de propósito general.

Percepciones y actuadores

Para que estos modelos entren en funcionamiento, lo primero que deben recibir son las denominadas “percepciones”, es decir, las entradas sensoriales que el agente de IA recibe de su entorno. Estas proporcionan información sobre el estado actual del entorno observable en el que opera el agente. Por ejemplo, si se trata de un chatbot de atención al cliente, las percepciones pueden incluir mensajes de texto, información del perfil del usuario, su ubicación e incluso reconocimiento de sus emociones.

Otro caso sería el de un vehículo de conducción autónoma, que recibe información a través de sus múltiples sensores y la procesa a partir de los parámetros que conforman su base de conocimiento.

Siguiendo el mismo ejemplo, la base podría estar compuesta por información sobre los caminos, normas de tránsito como límites de velocidad y situaciones que fueron generadas por humanos durante la etapa de entrenamiento de los agentes, antes de llevar adelante las pruebas en la calle.

A partir de la información de las percepciones entran en acción los “actuadores”, que son los que ejecutan las acciones en base al análisis. Por ejemplo, un actuador puede ser un generador de respuestas de texto que se envían al usuario en un chat de asistencia, o uno que acciona los frenos de un auto si detecta un objeto estático a una determinada distancia.

También pueden ser notificaciones de aplicaciones, como por ejemplo una notificación o un correo de alerta que se envían al titular de una cuenta bancaria cuando se realiza una transferencia.

Diagrama del funcionamiento de un agente inteligente.

Además del trabajo sobre estos dos elementos, la retroalimentación también es fundamental para la mejora de los agentes de IA a lo largo del tiempo. Esta retroalimentación puede provenir, por un lado, de un operador humano o de otro sistema de IA que supervise al agente en cuestión.

Por otro lado, el entorno también puede proporcionar retroalimentación en forma de resultados de las acciones del agente. Este circuito de retroalimentación permite al agente adaptarse, aprender de sus experiencias y tomar mejores decisiones en el futuro.

Tipos de agentes de IA

  • Agentes de reflejos simples: estos agentes, adecuados para tareas con complejidad limitada, operan en función de un conjunto de reglas de condición-acción predefinidas. Reaccionan a la percepción actual y no consideran la historia de percepciones anteriores.
  • Agentes de reflejos basados en modelos: los agentes basados en modelos tienen un enfoque más avanzado. Mantienen un modelo interno del entorno y toman decisiones basadas en la comprensión de su modelo.
  • Agentes basados en utilidades: toman decisiones considerando la utilidad esperada de cada acción posible. A menudo se emplean en situaciones en las que es esencial sopesar diferentes opciones y seleccionar la que tenga la mayor utilidad esperada.
  • Agentes de aprendizaje: están diseñados para operar en entornos desconocidos. Aprenden de sus experiencias y adaptan sus acciones con el tiempo. El aprendizaje profundo y las redes neuronales se utilizan a menudo en el desarrollo de agentes de aprendizaje.
  • Agentes de creencia-deseo-intención: estos agentes modelan el comportamiento humano manteniendo creencias sobre el entorno, los deseos y las intenciones. Pueden razonar y planificar sus acciones en consecuencia, lo que las hace adecuadas para sistemas complejos.
  • Agentes basados en la lógica: utilizan el razonamiento deductivo para tomar decisiones, generalmente sobre reglas lógicas. Son muy adecuados para tareas que requieren un razonamiento lógico complejo.