Doxa 2385

Los agentes de IA no están preparados para trabajar de cara al consumidor, pero pueden destacarse en los procesos internos

Un proyecto en una empresa de telecomunicaciones europea muestra por qué las empresas deberían empezar a pequeña escala y centrarse en tareas administrativas

Por Nathan Furr, Jur Gaarlandt, Sid Mohan y Andrew Shipilov
IA generativa
Harvard Business Review

#Doxa 
Resumen. Las empresas pueden generar valor con IA agentic, pero a menudo empiezan por el camino equivocado. Si bien puede ser tentador usar IA agentic para aplicaciones de cara al cliente, estas tienden a ser complejas, desordenadas e implacables con los errores, lo que no es ideal para la IA agentic. Sin embargo, las operaciones de back-end son una mejor opción. Un proyecto en una empresa de telecomunicaciones europea ilustra este aspecto. Centrándose en reducir el tiempo y el coste de las llamadas de servicio, la empresa logró usar agentes para reducir el tiempo de resolución en un 60%, ahorrar más de un millón de euros anuales recurrentes y mejorar significativamente su puntuación neta de promotores. Este ejemplo ofrece lecciones para los líderes, pero también ilustra los desafíos comunes que deberán afrontar en este proceso.
En los últimos dos años, hemos oído hablar mucho de la IA generativa. Pero a pesar de todo el revuelo sobre cómo podría transformar el mundo empresarial, encontrar ejemplos concretos de lo que está haciendo actualmente no siempre es fácil. Con mayor frecuencia, las empresas informan que tienen dificultades —y fracasos— para generar valor con sus experimentos de IA.

La adopción por parte de los consumidores también sigue siendo relativamente baja. A pesar del uso de palabras como "revolución", los datos muestran que la mayoría de los usuarios se conectan semanalmente en lugar de a diario, a diferencia del uso más frecuente de redes sociales o plataformas como Google. Esto sugiere que la generación de IA aún no se ha convertido en un verdadero hábito de consumo. La gente la usa ocasionalmente, a veces con intensidad, pero no se ha convertido en un pilar de la vida diaria. En otras palabras, la publicidad exagerada aún está por delante de la realidad.

A pesar de estos informes, creemos que la generación de IA representa un cambio fundamental de la misma magnitud que internet o los teléfonos inteligentes. Internet nos brindó aproximadamente dos décadas de innovación y desarrollo empresarial. La revolución de los teléfonos inteligentes generó 15 años de crecimiento impulsado por las aplicaciones móviles. Creemos que la generación de IA impulsará una era de transformación similar, quizás una década o más de creación de nuevo valor.

Este patrón es común en las nuevas tecnologías (el optimismo excesivo seguido de la desilusión y luego la creación de valor real, a menudo articulado a través del ciclo de exageración de Gartner ). En nuestra opinión, muchos de los principales defensores de la IA exageran al hacer declaraciones audaces de que sectores enteros de la economía serán reemplazados en breve por la IA. Esto se debe a que la IA real y funcional en empresas establecidas es un trabajo duro: requiere datos relativamente limpios, mapeo de procesos y experimentación profunda, e incluso entonces a menudo requiere un humano en el circuito. Sin embargo, estamos viendo un progreso real, entre bastidores, cuyos ejemplos sugieren que el uso de sistemas multiagente para automatizar y reemplazar tareas repetitivas puede conducir a un aumento más largo y más fundamental en la productividad.

En nuestra opinión, los líderes no deberían intentar adivinar qué sucederá en 10 años. En cambio, deberían preguntarse qué pueden lograr de forma realista en los próximos dos. Según los proyectos que hemos realizado desde finales de 2024, la IA agéntica está demostrando ser un verdadero punto de inflexión (al menos a corto plazo), aportando valor real a las empresas. La realidad también es que las ganancias financieras por proyecto son buenas, pero ninguna de ellas es espectacular. Estas ganancias incrementales son similares a las de Lean, una comparación que también hizo Satya Nadella, CEO de Microsoft.

Basándonos en nuestro trabajo en una cartera de proyectos que implementan con éxito sistemas de IA agéntica, hemos descubierto que para tener éxito con esta tecnología es necesario superar las expectativas, comprender sus capacidades y aprovechar al máximo las oportunidades de creación de valor. También requiere un enfoque práctico para la implementación de sistemas multiagente, basado en la experimentación y el aprendizaje.

El auge del paradigma del flujo de trabajo agente
En los últimos años hemos visto cómo la madurez de la tecnología de IA ha evolucionado rápidamente a través de al menos tres fases distintas:
  • Incitación (2022): El entusiasmo inicial se centró en las "incitaciones poderosas". En las pruebas de concepto (POC), las incitaciones parecían funcionar. Sin embargo, en producción, la fiabilidad disminuyó rápidamente. Los procesos de negocio suelen requerir una precisión del 95-99 %. Basándonos en la experiencia de más de 50 casos, estimamos que la incitación por sí sola rara vez superó el 70 %.
  • Generación Aumentada por Recuperación (RAG, 2023): RAG mejoró la estabilidad al vincular los resultados de la IA gen a las bases de conocimiento. Si bien las pruebas de concepto (POC) parecían prometedoras, la complejidad de la producción a menudo exponía debilidades que resultaban en una precisión inaceptablemente baja.
  • Sistemas agénticos (2024 a la fecha): Los avances más recientes implican redes de pequeños agentes especializados. Algunos enrutan preguntas. Otros realizan tareas muy específicas. Otros verifican y corrigen resultados. Fundamentalmente, la reducción de los costos de los tokens hace que los sistemas multiagente en cascada sean comercialmente viables. Este diseño en capas mejora significativamente la fiabilidad.
Este otoño se produjo una explosión de iniciativas comerciales basadas en agentes. OpenAI se asoció con Stripe y Shopify. Google anunció su Protocolo de Pago con Agentes, que automatiza el proceso de compra y transacción. Si bien las empresas podrían verse tentadas a seguir el ejemplo de los gigantes tecnológicos, es posible que no sea aquí donde surja la primera ola de valor sostenible. En una encuesta reciente de Bain a consumidores, el 76 % afirmó no sentirse cómodo utilizando sistemas basados ​​en agentes para compras; la mayoría mencionó preocupaciones sobre la seguridad y la privacidad como motivo de su reticencia.

Los contextos de cara al cliente no se adaptan bien a las capacidades actuales de los agentes de IA. Son desordenados e impredecibles; las entradas no están estructuradas, el tono y el contexto cambian constantemente, y los reguladores y consumidores tienen poca tolerancia a las alucinaciones o los errores. Los sistemas multiagente pueden alcanzar altos niveles de precisión, pero para ello es necesario tratar a cada agente como a un niño pequeño. No le pedirías a un niño pequeño que pusiera la mesa. Pero si divides la tarea y lo guías paso a paso —"primero, pon un plato", "ahora, añade los tenedores", "después, los vasos"—, el niño puede hacer una contribución significativa. Fundamentalmente, el entorno también debe estar controlado: sin hermanos ruidosos, sin mascotas que distraigan, y solo uno de los padres dando instrucciones. Pero al desarrollar sistemas multiagente estructurados como si se instruyera a un niño pequeño —dividiendo la tarea, dando las tareas una por una, comprobando la precisión de las tareas— estamos construyendo sistemas notablemente precisos.

Cabe destacar que estos sistemas suelen utilizarse para procesos de back-end, donde la perfección no es esencial, ya que se cuenta con un humano involucrado. Por el contrario, si bien los experimentos de front-end pueden ser inspiradores, es poco probable que sean la primera área de creación de valor empresarial real. Los procesos de back-end y operativos son un terreno fértil, ya que son estructurados y repetitivos, mucho más adecuados para la automatización del flujo de trabajo mediante agentes. Las tareas con un alcance preciso, los entornos bien definidos y las entradas estructuradas pueden generar proyectos que contribuyan significativamente.

Creación de sistemas agentes a nivel empresarial
A escala empresarial, diseñar estos sistemas es conceptualmente sencillo, pero operativamente exigente. Como marco general para la creación de sistemas multiagente, 1) se envía una tarea a un agente enrutador, como Google ADK, que, como un padre que instruye a un niño pequeño, divide la tarea en subtareas; 2) las subtareas son completadas por agentes de tareas individuales que realizan una parte más pequeña de la tarea, como el padre que le dice a un niño que ponga los vasos en la mesa y a otro que coloque los tenedores; después, 3) un agente de validación verifica los resultados de estas subtareas; y 4) si se detecta un error, un agente de mejora recomienda un ajuste.

Un ecosistema de herramientas, metodologías y servicios en rápido crecimiento respalda este enfoque, y son excelentes para procesos no esenciales. Sin embargo, al abordar las operaciones esenciales —donde la integridad de los datos y el control de las alucinaciones son esenciales—, se necesitan agentes con código personalizado, una mayor integración con los sistemas empresariales y un mejor control y protección.

Un ejemplo de caso: Reinventar las operaciones de campo
Para ilustrarlo, consideremos un proyecto que realizamos con un importante proveedor de internet europeo. Nuestro objetivo era reducir tanto el tiempo de resolución como el coste de las llamadas de servicio. La mayoría de las personas han tenido que llamar al servicio de asistencia por una conexión interrumpida, repetir la información varias veces y, finalmente, esperar a un técnico. Lo que ocurre (o no ocurre) entre bastidores es revelador: los técnicos a menudo llegan con información incompleta, obligados a resolver el problema desde cero. Esto provoca largos periodos de inactividad —a veces superiores a un mes— y miles de horas de operador desperdiciadas.

Decidimos empezar poco a poco. Nos centramos en construir un sistema centrado en ayudar a los técnicos a realizar sus tareas con mayor rapidez y eficacia: un ayudante en el proceso, no un agente independiente. Como parte de este esfuerzo, integramos datos de más de 15 sistemas de información, proporcionando a los técnicos un resumen de las fallas reportadas y un historial de las soluciones que se habían probado. Esto les proporcionó una visión general de la tarea (por ejemplo, solucionar un problema de conexión de un cliente) que podían leer o escuchar de camino al trabajo. De esta manera, podían empezar a trabajar en la solución en cuanto llegaban, ahorrando tiempo que a menudo se perdía en la resolución del problema.

A continuación, creamos una función que generaba recomendaciones para la siguiente mejor solución. Otra función incluía una interfaz conversacional que permitía al técnico consultar los sistemas informáticos subyacentes de la empresa de internet en lenguaje natural para encontrar las causas raíz. Finalmente, automatizamos muchas acciones simples y repetitivas: por ejemplo, corregir los registros de CRM cuando se conectaba el hogar equivocado o activar el reinicio de la red cuando fallaba un interruptor en la caja de conexión central del vecindario. Esto le ahorró mucho tiempo al técnico, ya que no tuvo que llamar al centro de llamadas interno para que le ayudaran con pequeños cambios y solucionar el problema.

Durante ocho meses, trabajamos de forma iterativa: mapeamos procesos, solucionamos problemas y agregamos funcionalidad paso a paso, con comentarios semanales de los técnicos de campo que probaban la solución basada en tabletas.

Los resultados:
  • Reducción del 60% en el tiempo de resolución
  • Más de un millón de euros ahorrados de forma recurrente anualmente
  • Mejora significativa en la puntuación neta de promotores del cliente
Con base en estos resultados, el cliente quería ampliar la escala a siete regiones más. Esto requirió mucho más trabajo: la metodología y algunos componentes de los agentes eran reutilizables, pero cada región contaba con sistemas de TI diferentes. Cada implementación requería nuevas integraciones y mapeos de datos. La expansión a cada una de las siete regiones requirió la mitad del esfuerzo inicial que la primera por región añadida.

Los desafíos de la implementación de sistemas multiagente
Como se ilustra arriba, las implementaciones de sistemas multiagente pueden generar valor real con éxito, pero muy poca gente habla del verdadero trabajo que conlleva su implementación. ¿Cuáles fueron las realidades y los obstáculos que enfrentamos?

Probar rápidamente vs. escalar.
¿Lo construimos con una arquitectura escalable desde el principio? Aunque nos guste afirmarlo, habría sido imposible. Así como los innovadores descubren iterativamente la adecuación producto-mercado, los casos de uso del sistema multiagente y la solución evolucionaron iterativamente a medida que nos embarcamos en un ciclo de rápida experimentación. Además, la tecnología, la metodología y los servicios para construir estos sistemas evolucionaron rápidamente.

No empezamos con el sistema completo. En su lugar, empezamos con un LLM más RAG como pieza central para resolver básicamente el primer caso de uso. Durante las pruebas, descubrimos que necesitábamos dividir el sistema en agentes más pequeños que realizaran tareas más especializadas para aumentar la fiabilidad; poco a poco, esto evolucionó hasta convertirse en un sistema completamente agentico. Finalmente, desarrollamos un sistema altamente fiable y funcional que aporta valor. Con este conocimiento y los resultados actuales, lo estamos reconstruyendo para crear una arquitectura mucho más robusta que permita escalar otras áreas de la empresa y que sea más fácil de mantener.

Zonas problemáticas vs. causas raíz.
Como regla general, descubrimos que los líderes y gerentes intermedios saben aproximadamente qué procesos requieren más tiempo o esfuerzo, pero tienen opiniones erróneas sobre dónde residen la complejidad y la oportunidad. Solo los operadores lo saben. Esto implica que se deben hacer dos cosas antes de poder realmente empezar a construir: 1) dedicar suficiente tiempo a comprender los problemas desde la perspectiva del gerente, y 2) hablar con los operadores sobre cuál consideran que es la causa raíz de cualquier problema.

Por ejemplo, los gerentes nos indicaban partes del proceso donde se desperdiciaba tiempo o recursos (p. ej., en el centro de servicios compartidos) y nos indicaban que buscáramos los "elementos de conocimiento" adecuados para que el operador resolviera un problema más rápidamente. Sin embargo, cuando comenzamos a trabajar directamente con los operadores, descubrimos que la mitad de ellos encontraban los "elementos de conocimiento" en 10 segundos, mientras que la otra mitad tardaba minutos en encontrar la misma información porque no eran buenos buscando en el sistema. Este no es un problema que la IA de los agentes pueda resolver bien; es un problema de capacitación. Pero también descubrimos que los líderes y gerentes habían pasado por alto por completo que los operadores dedican aproximadamente el 50% de su tiempo a completar el CRM después de las llamadas de los clientes. Este es un buen problema para un agente, que puede transcribir la llamada y colocar toda la información en los campos correctos, acelerando enormemente el proceso y mejorando la calidad de los datos. El operador solo tiene que verificar y presionar OK.

Los sistemas de TI no son los que ralentizan el proceso, lo hacen las personas.
Las partes más complejas y que requerían más esfuerzo de nuestro trabajo consistían en entablar las conversaciones de gestión adecuadas, convencer a las partes interesadas e identificar y resolver las dependencias que surgían debido a nuestro trabajo. Integrarse con una docena de sistemas de TI para que la solución funcione es complejo desde una perspectiva tecnológica, pero el verdadero desafío reside en que cada uno de estos sistemas cuenta con sus propios equipos de desarrollo con diferentes plazos, prioridades y hojas de ruta. Poner a disposición los puntos finales de la API y probarlos podía llevar dos semanas de trabajo. Acceder a las respectivas hojas de ruta de estos sistemas llevó mucho más tiempo. La mayoría de los equipos con los que coordinamos restaron prioridad a este trabajo durante varios meses, alegando (probablemente con razón desde su punto de vista) que tenían tareas más importantes que priorizar.

Las modelos pueden alucinar y lo harán.
Los agentes aún son bastante inestables y pueden alucinar, lo que requiere fuertes medidas de seguridad y comprobaciones como el LLM como juez (el agente de validación). El indicador del sistema del agente debe ser lo suficientemente potente y, a la vez, lo suficientemente ligero para que el agente ejecute las tareas correctamente. Esto requiere matices, tiempo y conocimientos de ciencia e ingeniería de datos para que estos sistemas agénticos funcionen con la fiabilidad necesaria para su empresa. En otras palabras, los buenos desarrolladores y la experiencia en el sector empresarial siguen siendo muy relevantes.

La nueva disciplina de la transformación agencial
¿Qué lecciones más generales podemos extraer del caso? En muchos sentidos, se siente como redescubrir Lean: rediseñar el trabajo desde cero. La diferencia radica en que las herramientas actuales son mucho más potentes, lo que permite no solo una optimización incremental, sino también un rediseño completo de los procesos, incluso en todos los departamentos.

Más allá de las capacidades de datos e IA, el éxito depende de un profundo conocimiento de los procesos: comprender el estado actual, prever el futuro y traducirlo en pasos pequeños y viables. En ese sentido, estamos presenciando el regreso de los " Cinturones Negros Lean ", pero esta vez, impulsados ​​por la IA de última generación.

El trabajo es detallado y metódico, no glamuroso. Hay que ir paso a paso. El enfoque se desarrolla con método, no con magia. Cada nueva área de negocio requiere un análisis nuevo y una adaptación personalizada.

Los agentes totalmente autónomos aún están lejos. Por ahora, la configuración más eficaz mantiene a un humano involucrado, lo que hace que el operador sea más inteligente, más rápido y esté mejor equipado.

Al principio, el progreso es gradual. Solo cuando los sistemas centrales se conectan y la información fluye fluidamente, se observan mejoras significativas en la eficiencia.

La tecnología también evoluciona más rápido que los proyectos. Las herramientas que usábamos hace ocho meses ya están obsoletas. Por eso nos centramos en casos de uso con recuperación de la inversión en un año, antes de que la tecnología subyacente cambie.

Más importante aún, las empresas deben desarrollar capacidades internas: ingenieros de datos, científicos de datos, diseñadores de experiencia de usuario (UX) de IA de la generación anterior y lo que algunos llaman ingenieros de contexto o cinturones negros de IA de la generación anterior: personas que comprenden profundamente los procesos y pueden desglosar la transformación en pasos alcanzables. Desarrollar estas capacidades como empresa les permitirá crear nuevos flujos de trabajo de agencia con mayor rapidez (a medida que la tecnología evoluciona), lo que puede ser un verdadero factor diferenciador frente a la competencia.

Finalmente, si bien estas iniciativas se integrarán con el tiempo en las operaciones comerciales habituales, es fundamental iniciarlas con una gobernanza sólida que integre las perspectivas técnicas y comerciales. Ese equilibrio es lo que transforma la experimentación en transformación.

La década que viene
Puede que el entusiasmo por la Generación IA haya superado su adopción, pero su potencial es real. Al igual que las revoluciones de Internet y los teléfonos inteligentes que la precedieron, este cambio de plataforma transformará las industrias, no mediante una disrupción repentina, sino mediante años de reinvención disciplinada.

Las organizaciones que ganen no sólo adoptarán herramientas; desarrollarán la capacidad de reinventarse continuamente a través de ellas.

Lea más sobre IA generativa o temas relacionados Tecnología y análisis, IA y aprendizaje automático, Automatización e informática empresarial

Nathan Furr es profesor de Estrategia en INSEAD y coautor de cinco libros superventas, entre ellos The Upside of Uncertainty, The Innovator's Method, Leading Transformation, Innovation Capital y Nail It then Scale It.

Jur Gaarlandt es socio de Artefact en Benelux.

Sid Mohan es el Director de Ciencia de Datos e IA de Artefact para el norte de Europa y los EE. UU. Sid aporta una experiencia significativa por haber implementado numerosas soluciones de IA y de IA agente para numerosos clientes estadounidenses y europeos.

Andrés Shipilov es profesor titular de la Cátedra John H. Loudon de Gestión Internacional en INSEAD. Es coautor de Network Advantage: How to Unlock Value From Your Alliances and Partnerships (Ventaja de red: Cómo liberar valor de sus alianzas y asociaciones).


No hay comentarios:

Publicar un comentario