La IA de última generación podría solucionar las evaluaciones de desempeño, o empeorarlas aún más
Muchos gerentes ahora utilizan la IA para perfeccionar las evaluaciones de desempeño de los empleados. La mayor oportunidad reside en usarla para resaltar aquello que los hace excepcionales
Por Crisanto Dellarocas
Gestión del desempeño de los empleados
Harvard Business Review
#Doxa #IA #RRHH #GestiónDelDesempeño #EvaluaciónDeEmpleados #FeedbackAutomatizado #AnálisisDeDesempeño #TecnologíaLaboral #IAParaGerentes #MejoraContinua #SesgosEnIA #ÉticaEnRRHH #ProductividadConIA #LiderazgoConIA #DesarrolloProfesional #MétricasDeDesempeño
Resumen. La IA generativa puede mejorar enormemente el valor de las evaluaciones de desempeño, pero la mayoría de las empresas simplemente la utilizan para producir versiones más pulidas de las evaluaciones narrativas tradicionales con mayor rapidez, en lugar de mejorarlas. Un enfoque mejor consiste en utilizar la IA generativa para descubrirEvidencia directa del desempeño: decisiones, influencia, mentoría y resolución de problemas integradas en el trabajo diario. Bien implementada, la IA podría transformar las evaluaciones, pasando de la narración persuasiva a la evidencia conductual verificable, creando sistemas de evaluación más precisos, transparentes y orientados al desarrollo.
Las empresas están desplegando rápidamente sistemas de IA generativa para optimizar las evaluaciones de desempeño. Performance Assist de Citi recopila datos de toda la organización para elaborar las evaluaciones. LLM Suite de JPMorgan facilita la redacción de las evaluaciones de fin de año. Según se informa, el asistente interno de IA de Boston Consulting Group reduce el tiempo de redacción de evaluaciones en un 40 %. Estos sistemas demuestran una capacidad impresionante, pero hasta ahora, la mayoría de las organizaciones los utilizan para producir con mayor rapidez versiones más elaboradas de las evaluaciones narrativas tradicionales.
Sin embargo, la perfección no es sinónimo de fiabilidad. Al suavizar la forma en que los gerentes describen el desempeño, estos sistemas pueden hacer que las evaluaciones parezcan más consistentes y creíbles de lo que realmente son, ocultando las inconsistencias y los puntos ciegos que las han caracterizado durante mucho tiempo. Aun así, esta misma tecnología podría lograr algo mucho más valioso: alejar las evaluaciones de desempeño de las narrativas sobre el trabajo y orientarlas hacia la evidencia directa del trabajo en acción: lo que las personas realmente hicieron, decidieron e influyeron.
Deficiencias que la IA de nueva generación podría solucionar
Las narrativas de evaluación del desempeño siempre han adolecido de inconsistencias en la evaluación y evidencia incompleta. Las investigaciones demuestran que distintos gerentes suelen describir un mismo desempeño de maneras radicalmente diferentes, influenciadas por las relaciones personales, la memoria selectiva y la capacidad narrativa. Cuando las organizaciones han intentado lograr evaluaciones más objetivas, se han apoyado en lo más fácil de medir: resultados, métricas y entregables formales.
Estos enfoques suelen pasar por alto las contribuciones de orden superior que definen un desempeño excepcional: la visión estratégica que redirige una iniciativa fallida, la mentoría que acelera el crecimiento de otros, la resolución de conflictos que mantiene a los equipos en marcha. Estas capacidades permanecen en gran medida invisibles, creando una brecha persistente entre lo que las organizaciones pueden medir y lo que realmente impulsa el éxito.
La IA genérica podría utilizarse para descubrir estas contribuciones; explico cómo en este artículo. Sin embargo, la mayoría de las organizaciones están pasando por alto esta oportunidad y están orientando la IA en la dirección equivocada.
El enfoque equivocado
Para aligerar la carga de las evaluaciones de desempeño, muchas empresas están utilizando la IA para redactar informes de evaluación. A primera vista, esto parece un avance. En realidad, corre el riesgo de agravar el problema subyacente. Los documentos generados con IA tienden a converger hacia un mismo tono fluido y seguro. La variedad que antes distinguía una evaluación minuciosa de un elogio genérico se está desvaneciendo en un tono persuasivo pero estandarizado.
Esta homogeneización afecta la presentación, no el contenido. Los gerentes siguen trabajando con observaciones incompletas e impresiones subjetivas. La IA simplemente hace que todas las narrativas suenen igual de convincentes. El resultado son reseñas que parecen más fiables de lo que realmente son, lo que dificulta la detección de información errónea.
Un camino mejor
En lugar de ayudar a los gerentes a redactar informes más convincentes sobre el desempeño, la IA podría ayudarlos a descubrir y analizar casos reales de trabajo. La misma tecnología que hace que las pruebas débiles parezcan más sólidas podría facilitar la búsqueda de pruebas sólidas.
¿Cómo se traduce este cambio en la práctica? En lugar de pedirle a un asistente de IA que ayude a redactar un párrafo más convincente sobre el «pensamiento estratégico» de un empleado, la organización le pide a la IA que identifique los memorandos de decisión, los cambios de rumbo en los proyectos y los correos electrónicos interdepartamentales donde se evidencia dicho pensamiento estratégico. La evaluación del desempeño se basa, en esencia, en las fuentes primarias, no en un lenguaje evaluativo. Los gerentes y los comités de promoción examinan los documentos originales: aquellos donde se ejerció el juicio, se demostró la influencia y se definieron los resultados.
No se trata de “demuestra liderazgo estratégico”, sino del memorando específico donde se identificó y corrigió una suposición errónea. No se trata de “maneja la ambigüedad”, sino del análisis posterior donde se reestructuró una iniciativa fallida. No se trata de “muestra una influencia interorganizacional excepcional”, sino de las directivas textuales que impulsaron una reestructuración regional.
La evaluación del comportamiento se vuelve práctica a gran escala: gracias a la IA, el elevado coste de recuperar y analizar la evidencia pertinente se ha reducido drásticamente. Los sistemas de IA podrían analizar los patrones de interacción de los empleados para descubrir competencias de orden superior que las métricas tradicionales pasan por alto. Podrían examinar las redes de comunicación para identificar a los empleados que ayudan constantemente a otros a resolver problemas, analizar los patrones de toma de decisiones en las discusiones de proyectos para detectar el pensamiento estratégico o mapear los flujos de influencia en los correos electrónicos y las transcripciones de reuniones para revelar el liderazgo en acción.
Este cambio ya no es teórico. Junto con las implementaciones de IA que ya están en marcha, una tendencia paralela ha estado sentando las bases discretamente: cada vez más organizaciones experimentan con la evaluación basada en evidencia. Las organizaciones de ventas llevan mucho tiempo evaluando a los representantes individuales en función de los datos del embudo de ventas capturados por el sistema (cumplimiento de cuotas, tasas de éxito, velocidad de negociación, volumen de actividad) extraídos directamente de los paneles de control de CRM. Amazon reestructuró su proceso de revisión Forte para exigir a sus empleados corporativos que presenten de tres a cinco logros concretos, como proyectos entregados, objetivos alcanzados, iniciativas lanzadas o mejoras de procesos, como un insumo clave para las autoevaluaciones.
Estos esfuerzos representan un progreso, pero siguen limitados por lo que es más fácil de medir. Las métricas capturan los resultados, no las contribuciones más profundas que dan forma a los logros: la visión arquitectónica, la mentoría y el liderazgo colaborativo, una brecha que la IA ahora puede empezar a cerrar.
Aprovechando el potencial de la IA de última generación
Los elementos básicos ya están presentes. Esto es lo que los altos directivos pueden hacer ahora para convertir lo posible en realidad:
Replantea el debate sobre el desempeño centrándote en los momentos trascendentales en lugar de en las etiquetas de rasgos y las afirmaciones de excelencia.
En lugar de pedir a los gerentes que describan el "liderazgo", el "pensamiento estratégico" o la "capacidad para desenvolverse en situaciones ambiguas" de un empleado, las evaluaciones de desempeño deberían plantear una pregunta diferente: ¿Qué momentos en el trabajo de esta persona revelan con mayor claridad esas capacidades? Un solo episodio trascendental —en el que un empleado cuestionó una suposición errónea, reorientó un proyecto fallido o logró el consenso de las partes interesadas en torno a una difícil decisión— suele revelar más sobre la capacidad que una página entera de lenguaje evaluativo. La IA puede ayudar a identificar estos episodios analizando los registros del proyecto, las comunicaciones y los documentos para descubrir los puntos de inflexión donde el juicio fue más importante. La discusión sobre el desempeño entonces pasa de debatir adjetivos a examinar la evidencia: qué decisión se tomó, qué razonamiento la respaldó, qué alternativas se consideraron y qué sucedió como resultado.
Acción del lunes por la mañana: Haga preguntas diferentes en su próxima conversación sobre el desempeño. En lugar de "¿Califica su pensamiento estratégico?", pregunte "¿Qué momento de este trimestre demostró mejor su pensamiento estratégico?". En lugar de "¿Cómo evaluaría su liderazgo?", pregunte "¿Cuándo su influencia cambió de manera más clara la dirección de un proyecto?".
Utilizar herramientas de IA directas, ya implementadas en toda la empresa, para sacar a la luz evidencias de comportamiento en lugar de pulir la narrativa.
La mayoría de las empresas ya implementan asistentes de IA integrados en sus herramientas de trabajo cotidianas: Microsoft Copilot, Google Workspace AI, Claude Cowork o asistentes de gestión del conocimiento internos. Actualmente, estos sistemas se utilizan normalmente para resumir documentos o ayudar a los gerentes a elaborar informes más elaborados. Sin embargo, las organizaciones deberían orientarlos hacia una tarea diferente: analizar los patrones de interacción de los empleados para identificar evidencias de competencias de orden superior.
Acción del lunes por la mañana: Utiliza tu asistente de IA para buscar momentos en los que los empleados influyeron en las decisiones o ayudaron a resolver problemas, en lugar de pedirle que redacte el texto de la evaluación. Prueba con: «Busca ejemplos en los que [ nombre del empleado ] cambió el rumbo de un proyecto o ayudó a alguien a resolver un problema técnico» en lugar de «Ayúdame a redactar una evaluación de desempeño para [ nombre del empleado ]».
Establecer un sistema de gobernanza que equilibre la transparencia con el control de los empleados y evite que la vigilancia se desvíe de su objetivo.
El cambio hacia la recopilación de evidencia conductual mediante inteligencia artificial requiere una gobernanza que equilibre la verificación, el control de los empleados y límites claros.
- Verificación: La IA debe actuar como un sistema de verificación que remita a fuentes verificables, mientras que los humanos conservan todo el criterio interpretativo. Cada evidencia que la IA presente debe estar directamente vinculada a su fuente original para que los responsables puedan verificar de forma independiente lo sucedido.
- Control del empleado: Otorgue a los empleados el control sobre su propio portafolio de evidencias. Así es como podría funcionar: los sistemas de IA identificarían episodios de comportamiento potencialmente relevantes y se los presentarían primero al empleado, quien luego elegiría qué evidencias incluir en su evaluación de desempeño.
- Límites claros para evitar la desviación del alcance: Las evaluaciones de desempeño deben basarse en documentos de trabajo formales (documentos de diseño, retrospectivas de proyectos, propuestas para clientes, especificaciones técnicas) en lugar de comunicaciones informales o mensajes privados. Las organizaciones deben especificar qué sistemas están incluidos en el alcance, hasta qué punto se remonta la evidencia y qué tipos de evidencia son apropiados. La IA nunca debe generar calificaciones de desempeño ni decisiones automatizadas, sino solo recopilar evidencia que los humanos interpreten dentro de un contexto más amplio.
Acción del lunes por la mañana: Definir qué canales de comunicación y tipos de documentos son válidos para la evaluación del desempeño y cuáles no. Dejar claro: «Las evaluaciones de desempeño pueden basarse en documentos del proyecto, actas de reuniones y decisiones de diseño, pero no en mensajes directos de Slack, correos electrónicos personales ni conversaciones informales».
...
Estos pasos crean un camino que conecta las limitaciones de medición actuales con las posibilidades organizativas del futuro. Las organizaciones que opten por esta vía no solo mejorarán sus evaluaciones de desempeño, sino que también construirán sistemas que reconozcan, desarrollen y recompensen todo el potencial humano que impulsa el éxito sostenible.
La tecnología existe. Están surgiendo precedentes organizativos. La única incógnita es si los líderes utilizarán la IA para perpetuar un sistema obsoleto o si lo transformarán en algo que finalmente refleje lo que hace excepcionales a sus mejores empleados.
Lea más sobre la gestión del desempeño de los empleados o temas relacionados: IA generativa y gestión del talento.
Chrysanthos Dellarocas es profesor titular de Sistemas de Información (Cátedra Richard C. Shipley) en la Escuela de Negocios Questrom de la Universidad de Boston. Anteriormente, fue vicerrector asociado de aprendizaje digital e innovación de la Universidad de Boston, donde lideró iniciativas de transformación digital a nivel institucional. Es autor del artículo de Substack titulado « La crisis de las credenciales».