Doxa 2562

¿Tu IA tiene un problema de personalidad?

Por Aleksandra Przegalinska, Tamilla Triantoro, Leon Ciechanowski, Konrad Sowa, Anna Kovbasiuk y Richard B. Freeman
IA generativa
Harvard Business Review

#Doxa #IA #asistente #personalidad #respeto #honestidad #utilidad #conversación #ayuda #comunicación #tecnología
Resumen. A medida que las empresas integran la IA más profundamente en el trabajo, el rendimiento depende no solo de lo que los sistemas pueden hacer, sino también de cómo se comportan. Las investigaciones demuestran que las personalidades de la IA —ya sean de apoyo u hostiles— influyen en el estrés, la resistencia y la calidad del trabajo de los empleados, a menudo de manerasLas encuestas tradicionales son inexactas. Los gerentes deberían considerar el estilo de interacción con la IA como una opción de diseño controlable, medir la fricción junto con la adopción y ver las soluciones alternativas que buscan los empleados como señales de un comportamiento defectuoso del sistema, no como mala conducta.
Lo más importante de la IA que su empresa acaba de implementar puede no ser su inteligencia, sino cómo interactúa con los usuarios. Casi nadie en la alta dirección lo evalúa, y nuestra investigación sugiere que deberían hacerlo. Muchos líderes aún evalúan la IA como antes se evaluaban las bases de datos: por su capacidad, velocidad y costo. Pero hay otro factor que puede ser igual de importante para el rendimiento: la personalidad y el estilo de interacción de la IA.

Esto es importante porque los empleados ya no utilizan la IA solo para completar tareas. Cada vez más, también dedican tiempo a gestionar el propio sistema. Que la IA mejore el rendimiento organizacional depende no solo de sus capacidades, sino también de su comportamiento en la colaboración diaria. Y ese comportamiento es algo que las organizaciones pueden diseñar y controlar.

Evaluación de cómo las personas de IA afectan a los usuarios
En su concepción original, la IA en general, y la IA generativa en particular, funcionan como un sistema de apoyo subordinado: receptivo, complaciente y orientado a ayudar a un humano a completar una tarea. Pero a medida que estos sistemas se vuelven más autónomos y se integran más profundamente en los flujos de trabajo, los empleados los perciben como compañeros de equipo, evaluadores e, incluso, en algunos casos, supervisores informales. En ese punto, la forma en que el sistema interactúa comienza a ser importante. Dado que la IA generativa responde de forma probabilística, su comportamiento no puede especificarse completamente mediante reglas: surgen patrones de interacción consistentes, independientemente de la intención de los diseñadores. Los usuarios reconocen estos patrones como una personalidad: solidaria, cautelosa, desdeñosa u obstructiva.

Para examinar cómo la IA moldea estas respuestas, realizamos un estudio de laboratorio controlado con 58 participantes. Monitorizamos la respuesta fisiológica de cada participante en tiempo real de dos maneras. Una fue midiendo la conductancia de la piel, la actividad electrodérmica asociada con los niveles de excitación emocional en los individuos (es la misma señal que detecta un polígrafo). La otra fue utilizando electromiografía facial (fEMG) para medir los pequeños impulsos eléctricos generados por los músculos faciales al contraerse, lo que permite detectar el ceño fruncido (afecto negativo) y la sonrisa (afecto positivo).

También analizamos las conversaciones de los participantes con las IA que creamos, evaluamos la calidad de su trabajo final mediante valoraciones anónimas de expertos y recopilamos autoinformes posteriores a la tarea (información sobre sus propios pensamientos, sentimientos, creencias o comportamientos proporcionada por los participantes). Una muestra de este tamaño es habitual en la investigación psicofisiológica. Cada participante aporta miles de datos fisiológicos registrados de forma continua, y las sesiones requieren mucho tiempo para su ejecución y análisis, por lo que los estudios de esta índole priorizan la profundidad sobre la amplitud.

Los participantes completaron una tarea de marketing simulada de cuatro partes para una empresa ficticia de ecotecnología, colaborando con un chatbot de IA que actuaba como su supervisor. Treinta y un participantes trabajaron con un líder servidor que se caracterizaba por ser alentador, paciente y dispuesto a respetar el criterio del empleado; este perfil se basó en investigaciones sobre liderazgo empoderador. Veintisiete trabajaron con un líder de la tríada oscura que se caracterizaba por ser sarcástico, impaciente y propenso a atribuirse méritos y culpar a los demás; este perfil se basó en investigaciones sobre liderazgo tóxico. La única diferencia radicaba en el estilo de interacción. Ambos recibieron instrucciones de no resolver la tarea por el participante, por lo que cualquier diferencia en los resultados reflejó la forma de colaboración, más que la cantidad de ayuda proporcionada.

Lo que la gente decía frente a lo que realmente experimentaba.
Las investigaciones sobre la experiencia de las personas con la IA en el trabajo suelen basarse en autoinformes, pero estos solo ofrecen una visión parcial. En nuestro estudio, analizamos cuatro fuentes de información: el comportamiento de las personas durante la interacción con el bot, sus reacciones corporales en tiempo real, la calidad de su trabajo final y sus comentarios posteriores. El análisis de estas cuatro fuentes nos permitió comprender claramente la brecha entre la experiencia de las personas y sus declaraciones posteriores.

El primer patrón fue conductual. La IA hostil generó costos de coordinación ocultos. En lugar de simplemente usar el sistema, los participantes tuvieron que sortearlo. En la condición de la tríada oscura, las conversaciones se prolongaron, mientras que las respuestas de la IA se acortaron. Los usuarios realizaban más trabajo y recibían menos interacción útil a cambio. La resistencia también aumentó drásticamente. Los mensajes en los que los usuarios rechazaron o desafiaron a la IA representaron el 13 % de los intercambios en esta condición, en comparación con el 1 % en la condición de líder servidor. Los intentos de anular el sistema, mediante la inyección de mensajes o indicándole que interpretara un personaje diferente, ocurrieron cuatro veces más a menudo.

El tono emocional de las conversaciones también lo confirmó. La frustración era casi inexistente con el bot líder servidor, apareciendo en aproximadamente uno de cada 100 mensajes. Con el bot de la tríada oscura, aumentó a casi uno de cada cinco. El lenguaje defensivo, poco frecuente en el primer grupo, se volvió habitual en la tríada oscura. Los participantes que se enfrentaban a la IA hostil parecían menos seguros de sí mismos, incluso mientras se esforzaban más. Alternaban entre la conformidad, la resistencia, la negociación y la búsqueda de ayuda mientras buscaban una estrategia que hiciera útil al sistema. Los participantes que trabajaban con la IA líder servidor se adaptaron a un ritmo y lo mantuvieron.

Los datos fisiológicos confirmaron un aumento del estrés y la tensión física. La conductancia de la piel alcanzó un pico del 72 % en la condición de tríada oscura y se mantuvo elevada tras finalizar cada interacción. En otras palabras, los cuerpos de los participantes se mantuvieron alerta al interactuar con IA hostil. Si un texto en pantalla es suficiente para desencadenar esta respuesta en un laboratorio, los responsables deberían considerar seriamente las consecuencias de una exposición prolongada en entornos laborales reales donde hay mucho en juego.

El trabajo en sí también se vio afectado. Expertos independientes, sin saber qué bot habían utilizado los participantes, calificaron al grupo de líderes servidores con mejores resultados en cuanto a exhaustividad, originalidad, adecuación estratégica y calidad general. La diferencia fue de aproximadamente un punto en una escala de siete puntos. La variabilidad también fue aproximadamente el doble en la condición de la tríada oscura. Esto significa que una personalidad de IA mal diseñada no solo redujo la calidad promedio del trabajo, sino que también hizo que el rendimiento fuera menos predecible entre las personas. Para los gerentes, el resultado no es solo un trabajo de menor calidad, sino una fuerza laboral cuyo rendimiento se vuelve más difícil de anticipar.

Entonces llegó la sorpresa: los informes de los participantes apenas mostraron diferencias. En medidas estándar como disfrute, satisfacción, atención y opiniones sobre la IA, ambos grupos parecían prácticamente iguales. Las herramientas que muchas organizaciones utilizan para evaluar las implementaciones de IA —como encuestas de satisfacción, análisis de opinión y cuestionarios posteriores al lanzamiento— fueron las menos sensibles a los efectos que observamos. Los empleados pueden decir que la herramienta funciona bien, pero su comportamiento, niveles de estrés y calidad laboral cuentan una historia diferente, especialmente a largo plazo.

Conclusiones para los gerentes
Nuestros hallazgos sugieren que los gerentes deberían tomar tres medidas.

1. Tratar la personalidad de la IA como una variable de diseño controlada. Las organizaciones ya exigen que los sistemas de IA cumplan con estándares de precisión, imparcialidad y seguridad. La personalidad de la IA también debe incluirse en esta lista. Esto es especialmente importante para las herramientas utilizadas en funciones de evaluación o supervisión, como los asistentes de redacción que analizan el trabajo, los sistemas de revisión de código y las herramientas automatizadas de retroalimentación del desempeño. Las decisiones sobre la adquisición e implementación de IA deben incluir estándares de interacción, no solo de capacidad. Alguien en la organización debe ser responsable de responder dos preguntas: ¿ Cómo debe comportarse nuestra IA cuando no está de acuerdo con un empleado? ¿Qué evidencia tenemos de que se comporta de esa manera de forma consistente?

2. Mide la fricción, no solo la adopción. La mayoría de las empresas controlan si los empleados utilizan una herramienta de IA: tasas de inicio de sesión, volumen de consultas y puntuaciones de satisfacción. Estas cifras reflejan la implicación, no si la herramienta ayuda a las personas a trabajar mejor. Lo que pasan por alto es la fricción, el esfuerzo adicional que los empleados dedican a lidiar con el sistema en lugar de obtener valor de él. También deberían medirla. La fricción revela lo que la adopción no puede: si la IA facilita el trabajo o simplemente lo complica.

En nuestro estudio, la fricción se manifestó en intercambios más prolongados, reformulaciones repetidas de la misma solicitud y un aumento en los intentos de discutir o anular la IA. Estas mismas señales se observan en el trabajo, en los registros de uso habituales y sin necesidad de equipos especiales. Una herramienta puede tener una alta adopción y, al mismo tiempo, generar mucha fricción: los empleados la siguen utilizando por necesidad, pero la sortean discretamente.

3. Interprete los intentos de anulación como una indicación de un sistema de IA anómalo, no como un mal comportamiento de los empleados. Cuando trabajadores sin formación en seguridad ni intenciones maliciosas intentan anular, eludir o neutralizar el comportamiento de un sistema de IA, los responsables no deben asumir que el problema principal reside en la mala conducta de los empleados. A menudo, estos comportamientos indican que el diseño del sistema está provocando una resistencia predecible. En nuestro estudio, los intentos inmediatos de engañar a la IA para que ignorara sus propias reglas o actuara como un personaje diferente solo se observaron en la condición de IA hostil. Cuando las personas se resisten a la IA, puede deberse a que la IA se resiste primero. En muchos casos, solucionar ese problema de diseño será más económico y productivo que imponer nuevas restricciones, supervisión o normas de uso a los empleados.
...
Nuestro bot de la tríada oscura es una forma exagerada de toxicidad, llevada al extremo para visibilizar un efecto que, de otro modo, pasaría desapercibido. Pero la toxicidad adopta muchas formas: una IA aduladora, infinitamente complaciente y deseosa de agradar, puede ser igualmente corrosiva, embotando el pensamiento crítico de los usuarios y aprobando sin más ideas débiles. La lección no es que la IA deba ser más amable o sumisa, sino que el estilo de interacción es una variable crítica con consecuencias en ambos sentidos. Por lo tanto, las organizaciones deberían preocuparse tanto por la personalidad de la IA como por su capacidad técnica.

Esta investigación fue financiada por el Centro Nacional de Ciencias de Polonia (NCN) OPUS 21.

Lea más sobre IA generativa o temas relacionados: Tecnología y análisis, Gestión y Gestión del estrés.

Aleksandra Przegalinska es vicepresidenta y profesora de la Universidad Kozminski, además de investigadora asociada del Centro Harvard para el Trabajo y una Economía Justa.

Tamilla Triantoro es profesora asociada en la Escuela de Negocios de la Universidad de Quinnipiac y miembro del Programa de Justicia Global de la Universidad de Yale.

Leon Ciechanowski es profesor asistente en la Universidad Kozminski y anteriormente fue científico visitante en el Centro de Inteligencia Colectiva del MIT.

Konrad Sowa es profesor adjunto, gerente de productos de IA y subdirector del Centro de Investigación de la Raza Humana en la Universidad Kozminski de Varsovia.

Anna Kovbasiuk es investigadora y ayudante de cátedra en la Universidad Kozminski de Varsovia.

Richard B. Freeman  ocupa la Cátedra Herbert Ascherman de Economía en la Universidad de Harvard y es codirector del Programa de Trabajo y Vida Laboral en la Facultad de Derecho de Harvard.


No hay comentarios:

Publicar un comentario