Doxa 2243

Una forma sencilla de mejorar la lectura de datos

Por Jeffrey D. Camm y Lucy D'Agostino McGowan
Análisis y ciencia de datos
Harvard Business Review

#Doxa #análisis #datos #ciencia #lectura #dirigente #consumidor #estadística #subordinado #directivo #decisión #contexto #media #desviación #estándar #típica #problema #observación #porcentaje #confusa #residir #denominador #líder
Resumen. Es probable que los altos dirigentes sean consumidores de estadísticas calculadas por sus subordinados directos para ayudarles a tomar decisiones con conocimiento de causa. Mientras se observan los datos, el presentador decide qué estadísticas son relevantes en un contexto determinado. ¿Debe presentarse la media de los datos? ¿Debe presentarse también la desviación típica? Los autores argumentan que hay un problema estadístico básico en la forma en que observamos los datos: el uso de porcentajes puede utilizarse de forma confusa para influir en los demás. La confusión suele residir en el denominador. Como líderes, tenemos que responder a los datos. Una pregunta sencilla pero esclarecedora que debemos hacernos es: "¿Cuál es el denominador?".
Edwards Deming dijo célebremente: "En Dios confiamos; todos los demás aportan datos". A medida que hemos evolucionado de la analítica a la ciencia de datos y a la IA, el mundo nunca ha estado más impulsado por los datos. Y como líder, se espera que tome decisiones sólidas respaldadas por datos. Sin embargo, los líderes rara vez utilizan los datos en bruto directamente para la toma de decisiones. En su lugar, es probable que sean consumidores de estadísticas calculadas por sus informes directos para ayudarles a tomar decisiones informadas.

Mientras se observan los datos, el presentador decide qué estadísticas son relevantes en un contexto determinado. ¿Debe presentarse la media de los datos? ¿Debe presentarse también la desviación típica? ¿Debe presentarse la distribución completa de los datos? ¿Deben presentarse las diferencias en los datos brutos, por ejemplo las ventas, o el cambio porcentual en la cuota de mercado?

Lo que debe recordar es lo siguiente Las estadísticas no son datos; son descripciones de datos. Para tomar decisiones más inteligentes, debe saber cómo cuestionar las estadísticas o, como escribió recientemente el columnista de The Wall Street Journal Jason Zweig, "aprender a replicar a las estadísticas es su primera línea de defensa".

En nuestra experiencia, hemos observado una cuestión estadística básica en particular: el uso de porcentajes puede utilizarse de forma confusa para influir en los demás. La confusión suele residir en el denominador. Al igual que Zweig, cuando nos enfrentamos a los porcentajes, defendemos que los líderes deben contestar, es decir, cuestionar las estadísticas. Una pregunta sencilla pero esclarecedora que hay que hacerse es: "¿Cuál es el denominador?".

Veamos tres casos en los que hacer esta pregunta podría ayudar a evitar interpretaciones erróneas y confusiones.

Porcentaje frente a diferencia absoluta
Un presentador tiene la opción de proporcionar un cambio absoluto o porcentual. Por ejemplo, en su artículo sobre la volatilidad del mercado bursátil, Zweig habla de cómo los profesionales del marketing financiero juegan con sus emociones con titulares en línea como "EL DOW SE DESPLOMA MÁS DE 1000 PUNTOS". Lamenta el truco de "ocultar el denominador". Este es un ejemplo clásico de cuándo hay que preguntarse: ¿Cuál es el denominador?

Eche un vistazo a la ecuación siguiente.

Aquí, conocer el denominador nos permite convertir el cambio en el valor del Dow en un porcentaje, que es como solemos pensar en un cambio en nuestras inversiones. Si el valor del Dow es de 40.000, por ejemplo, entonces podemos convertirlo a un cambio porcentual haciendo la división y multiplicando por 100:

Ahora, vuelva a leer ese titular y pregúntese: ¿Es una caída del valor del 2,5% un desplome? Eso es algo subjetivo, pero un titular del tipo "El Dow se desploma un 2,5%" no parece generar la misma sensación de urgencia. De ahí que la forma en que utilicemos (o no) ciertas estadísticas y la verborrea puedan ser persuasivas e inducir a error a los responsables de la toma de decisiones.

Como líder, es prudente preguntarse por qué el presentador opta por ofrecer datos brutos frente a porcentajes. Por ejemplo, si un director regional de ventas informa de que un nuevo punto de venta ha aumentado las ventas en 100.000 dólares este mes, saber cuáles fueron las ventas del mes pasado es muy relevante. Si las ventas del mes pasado fueron de 200.000 $, se trata de un impresionante aumento del 50% en las ventas. Si las ventas fueron de 1.000.000 de dólares, entonces se trata de un aumento menos impresionante del 10%.

Este mismo uso persuasivo se produce cuando sólo se presenta el cambio porcentual. Si el director regional de ventas informa: "Hemos tenido un descenso de las ventas en nuestra tienda de Manhattan este último mes, pero es sólo del 2%", sería bueno conocer el denominador de este porcentaje. Si la tienda de Manhattan es una tienda de muy alto rendimiento, un 2% puede ser muchos ingresos.

Lo esencial es estar plenamente informado. Siempre debe esperar recibir el porcentaje y el denominador, la diferencia relativa y la absoluta. Por ejemplo: "Las ventas aumentaron un 50%, de 200.000 a 300.000 dólares".

Otro problema que hemos visto es lo que llamamos el problema del participio pasado. Sencillamente, si un porcentaje se triplica (o duplica) la cantidad absoluta sólo se triplica (o duplica) si el denominador es el mismo en ambos casos.

Si su responsable de marketing le dice que su cuota de mercado se ha triplicado en el último año, es probable que se trate de una muy buena noticia. Pero no significa que los ingresos se hayan triplicado en el mismo periodo. De hecho, es posible que los ingresos hayan disminuido. Supongamos que los ingresos del año pasado fueron de 50 millones de dólares y los del mercado de 1.000 millones. Su cuota de mercado fue de 50/1000 = 5%. Si el mercado se reduce drásticamente, digamos a 200 millones de dólares y su cuota de mercado este año es de 30 millones de dólares, su cuota de mercado se ha triplicado del 5% al 30/200, es decir, un 15%, pero sus ingresos se redujeron en 20 millones de dólares. Pregunte siempre: "¿Cuál es el denominador?". En este caso, el tamaño del mercado en el año anterior y el tamaño del mercado en el año actual son los denominadores relevantes.

El denominador sesgado
Nuestro segundo caso tiene que ver con un denominador sesgado, asociado con mayor frecuencia a los porcentajes procedentes de respuestas a encuestas. Aunque algo anticuado, en su columna sobre aplicaciones erróneas de las estadísticas, Arnie Barnett ofrece un excelente ejemplo de este caso.

En la década de 1980, Midway Airlines operaba un servicio de transporte entre Chicago y Nueva York. El 20 de octubre de 1983, un anuncio del New York Times afirmaba que "el 84% de los viajeros de negocios frecuentes a Chicago prefieren Midway Metrolink a American, United y TWA". ¿Cuál es el denominador aquí? Presumiblemente, encuestaron a viajeros de negocios frecuentes entre Nueva York y Chicago para ver qué aerolínea preferían. Por supuesto, cabría preguntarse: "¿Con qué frecuencia hay que volar entre Nueva York y Chicago para que se cuente?". El sesgo en el denominador en este caso es aún más flagrante. En letra muy pequeña, al pie del anuncio, dan la respuesta a "¿Cuál es el denominador?". Dice así: "Encuesta realizada entre los pasajeros del Midway Metrolink entre LaGuardia y Chicago". Así que, al parecer, ¡el denominador sólo incluía a los pasajeros de sus vuelos! Como indicó Barnett, la única conclusión que realmente puede sacar de esta encuesta es que el 16% de sus propios clientes prefieren otra compañía aérea.

Como líder, es probable que realice un seguimiento de métricas como la satisfacción del cliente y el compromiso de los empleados. Piense en una encuesta sobre el compromiso de los empleados cuyo resultado sea que el 80% de los encuestados declaran estar muy satisfechos con su trabajo. Debería preguntarse "¿Cuál es el denominador?". Por ejemplo, si la encuesta sólo se envió a los empleados que no estaban de cara al cliente, es probable que los resultados estuvieran sesgados.

Con los resultados de las encuestas, le beneficiará conocer el porcentaje de encuestados en cada categoría de respuesta y las cifras brutas. En el caso de las encuestas voluntarias de satisfacción del cliente, siempre existe el peligro de un sesgo por recibir sólo respuestas extremas (clientes extremadamente satisfechos o extremadamente insatisfechos). Conocer el porcentaje de clientes que responden frente al número de encuestas distribuidas, es decir, el porcentaje de clientes que responden, proporciona una valiosa información sobre lo representativas que pueden ser las estadísticas de la encuesta.

El condicional invertido
En enero de 2025, el Cirujano General de EE.UU. Vivek Murthy emitió un aviso sobre el consumo de alcohol y el riesgo de cáncer. El asesoramiento describe las pruebas de una relación causal entre el consumo de alcohol y varios tipos diferentes de cáncer. Para algunos tipos de cáncer, las pruebas sugieren que el riesgo de cáncer aumenta incluso para un consumo bajo o moderado de alcohol. Una de las medidas recomendadas fue ampliar la etiqueta de advertencia sobre el alcohol para incluir el riesgo de cáncer.

A continuación, The Wall Street Journal publicó una refutación de la necesidad de ampliar el etiquetado sobre el alcohol que ilustra lo que llamamos el condicional invertido. Un miembro del consejo editorial cuestiona los datos utilizados por el Dr. Murthy y, a continuación, utiliza el siguiente argumento para oponerse a la recomendación del Dr. Murthy: "el informe atribuye parcialmente sólo el 17% de estas muertes estimadas al consumo moderado de alcohol. De las 609.820 muertes por cáncer en 2023, esto significaría que el consumo moderado de alcohol contribuyó a 3.400 o alrededor del 0,6%".

¿Cuál es el denominador en este argumento? El denominador aquí es el número de muertes por cáncer (609.820). El 0,006 es la probabilidad de que su cáncer se atribuya al consumo moderado de alcohol dado que usted tiene cáncer. La probabilidad relevante para evaluar el riesgo de beber alcohol moderadamente es la probabilidad de contraer cáncer dado que usted bebe alcohol moderadamente. Piénselo de esta manera, cuánta gente tiene cáncer es irrelevante para el riesgo de cáncer por beber alcohol moderadamente, precisamente porque muchas otras cosas pueden causar cáncer. El Surgeon General's Advisory proporciona una estimación del riesgo de cáncer en función del sexo y de la cantidad de alcohol consumida. Éstas son las estadísticas relevantes que uno necesita para responder a preguntas como "Si soy un varón que consume una bebida alcohólica al día, ¿cuál es mi riesgo de desarrollar cáncer?".

Supongamos que su equipo de marketing está informando sobre lo eficaz que ha sido su oferta de prueba gratuita y afirma: "¡El 75% de nuestros clientes que han adquirido nuestro producto premium mejorado han utilizado nuestra prueba gratuita!" Eso suena muy impresionante. Sin embargo, esta métrica no es relevante para determinar la eficacia de la oferta de prueba gratuita. Está utilizando el denominador equivocado.

Para evaluar la eficacia de la oferta de prueba gratuita, no necesita el porcentaje de compras premium que utilizaron la prueba gratuita, necesita el porcentaje de usuarios de la prueba gratuita que acaban comprando el producto premium. Para ilustrar esto, imaginemos un escenario sencillo.

Supongamos que 1.500 clientes realizaron la prueba gratuita de actualización, 100 clientes compraron la nueva actualización y de los 100 que compraron el nuevo producto actualizado, 75 habían utilizado la prueba gratuita.
Pero para evaluar la eficacia de la prueba gratuita, necesitamos lo siguiente:
Es decir, la tasa de conversión fue sólo del 5%.

Creemos que siempre es una buena idea cuestionar los datos. Cuando se utilizan porcentajes, es imprescindible que la información importante no quede enmascarada por las estadísticas. Pida que se hable tanto de porcentajes como de absolutos. La claridad llega preguntando "¿Cuál es el denominador?". Si quiere saber lo eficaz que es algo, tiene que estar en el denominador.

Lea más sobre análisis y ciencia de datos o temas relacionados: tecnología y análisis.

Jeffrey D. Camm es titular de la Cátedra Presidencial Inmar en Análisis y director académico del Centro para el Impacto del Análisis en la Escuela de Negocios de la Universidad Wake Forest. Es coautor del libro "Data Duped: How to Avoid Being Hoodwinked by Misinformation" (Rowan y Littlefield).

Lucy D'Agostino McGowan es profesora adjunta del Departamento de Ciencias Estadísticas de la Universidad Wake Forest. Se la puede encontrar en podcasts sobre Casual Inference y en línea.


No hay comentarios:

Publicar un comentario