¿Entiende la variación en sus datos?
Por Thomas C. Redman
Datos
Harvard Business Review
Es bastante fácil para los gerentes ver que las cosas en el mundo de los negocios varían. Algunas campañas de marketing producen excelentes resultados; los similares no. Hay momentos en que la cadena de suministro funciona sin esfuerzo, y otros momentos en los que se enreda cada paso. Algunos días los números se ven bien, y otros días simplemente no cuadran. La variación es el enemigo natural de un gerente, lo que hace que sea más difícil resolver lo que realmente está sucediendo, hacer predicciones válidas y tener el control.
No tiene que ser así. Ordenar la variación proporciona el contexto necesario, señala la oportunidad y ayuda a los gerentes a mantener la calma cuando algo sale mal. Los gerentes deben aprender a medir la variación, comprender lo que les dice sobre su negocio, descomponerlo y, cuando sea necesario, reducirlo.
Aconsejo a los gerentes que resuelvan la variación y lo que la está causando. Hacerlo proporciona el contexto necesario, señala la oportunidad y les ayuda a mantener la calma cuando algo sale mal. Considere el siguiente ejemplo. La siguiente figura muestra las tasas de error durante las primeras tres semanas de un proceso de facturación:
Después de la segunda semana, el gerente responsable estaba avergonzado: ¿podría su equipo realmente estar funcionando tan mal? Después del tercero, ella suspiró aliviada. La tasa de error puede ser alta, ¡pero al menos la tendencia estaba en la dirección correcta! Ella había estado exaltando a su gente para "trabajar más duro para reducir la tasa de error". ¡Finalmente, estaban escuchando!
Desafortunadamente, su interpretación no se mantuvo. Aquí están las medidas para las próximas siete semanas:
La ilusión de este gerente se hizo añicos la próxima semana, ¡ya que la tasa de error fue aún mayor! Su error surgió porque no entendió que todos los procesos varían, ¡a menudo considerablemente!
Esta viñeta subraya el primer punto, que es simplemente reconocer que la variación es importante y tenerla en cuenta. Específicamente, siempre debe preguntar, "¿Cuál es el" más / menos "alrededor del número?" Y comprender las implicaciones. Después de la tercera semana en este ejemplo, el más / menos es cincuenta por ciento ± ocho por ciento (42% a 58%). El "ocho por ciento" son dos desviaciones estándar, una medida de variabilidad que se explica más adelante. Si lo hubiera tenido en cuenta, este gerente no habría sido tan rápido para dar crédito a sus exhortaciones a las tropas con una mejora que no estaba allí. En términos más generales, debe suponer que las diferencias dentro del signo más / menos se deben a la aleatoriedad y resistir la tentación de tomar el crédito o asignar la culpa.
A medida que profundiza en los números, es importante comprender las fuentes de variación. Por ejemplo, todos saben que algunos adultos adultos son más altos que otros, y es bastante fácil observar que los hombres, en promedio, son más altos que las mujeres. Entonces, en este caso, un componente de variación es el género. Del mismo modo, las personas de los Países Bajos son generalmente más altas, y las de Filipinas son generalmente más bajas. La nacionalidad, entonces, es otra fuente de variación. Es importante comprender estas fuentes de variabilidad si está en el negocio de la ropa, para no enviar demasiados pantalones cortos a las tiendas de ropa en los Países Bajos.
Estas fuentes se vuelven cada vez más importantes a medida que adquiere una idea de las mediciones de variación. ¡Después de todo, no puede administrar lo que no mide! Las dos medidas más importantes de variabilidad se denominan "desviación estándar" (σ) y "R-cuadrado (R2) antes mencionadas. No se desanime por los nombres no intuitivos. En cambio, concéntrate en la interpretación.
Piense en el rango de una desviación estándar (1σ) por debajo del promedio a una desviación estándar por encima del promedio que abarca aproximadamente dos tercios de una población general. Por lo tanto, como se muestra en la figura a continuación, aproximadamente dos tercios de las mujeres adultas de EE. UU. Tienen entre 5'1 "y 5’7" de altura. Piense en el promedio más / menos dos desviaciones estándar (2σ) como que abarca el 95% de una población, como también lo muestra la gráfica. Para las mujeres estadounidenses, esto significa que solo el 5% son más bajas que 4'10 "o más altas que 5’9". De manera similar, el gerente responsable del proceso de facturación debe esperar que el 95% de todas las mediciones caigan entre 42% y 58% y subraya su mala interpretación del 46% en la semana tres.
Finalmente, piense en el promedio más / menos tres desviaciones estándar (3σ) que abarca a todos menos una fracción de un porcentaje de una población.
Interprete a R2 como la "fracción de variación debida a una fuente particular". La siguiente gráfica presenta las alturas de hombres y mujeres. Tenga en cuenta que los hombres son aproximadamente cinco pulgadas más altos, en promedio, y sus alturas exhiben una variación ligeramente mayor. Cuando se trata de altura, claramente los hombres y las mujeres son diferentes. Además, la población combinada de hombres y mujeres varía aún más. Pero, ¿cuánta variación explica el género en esta población combinada? La respuesta es aproximadamente un tercio. Por lo tanto, el género es un factor importante, pero hay mucho más en juego. (Nota: Excel, hojas de Google y buenos paquetes estadísticos y analíticos proporcionan los cálculos necesarios).
Los gerentes deben tratar de identificar tantas fuentes importantes de variabilidad como puedan. Ya he notado que el género y la nacionalidad son dos fuentes. La edad puede ser un tercio, y también se pueden identificar muchos otros. Cada uno tiene su propio R2 y, cuanto más grande es el R2, más importante es la fuente. Una vez que encuentre una fuente importante de variación, dirija su atención a crear una ventaja comercial.
Es importante destacar que R2 también se aplica a modelos completos. Por lo tanto, hay un R2 incluso para el modelo más complicado de altura. Nuevamente, cuanto más grande sea el R2, mejor será el modelo.
Ahora veamos el ejemplo con la tasa de error del equipo. Los cálculos más / menos generalmente se basan en dos desviaciones estándar. El "ocho por ciento" en el "cincuenta por ciento ± ocho por ciento" anterior es 2σ. El gerente responsable de ese ejemplo debe esperar que el 95% de todas las mediciones caigan entre 42% y 58%, y subraya su mala interpretación del 46% en la semana tres.
Comprender σ y R2 permite a los gerentes hacer predicciones más poderosas, establecer control y mejorar el rendimiento. Las predicciones más simples usan límites de 3σ para el más / menos. En la siguiente gráfica, agregué estos límites (llamados límites de control superior e inferior, y etiquetados como "ucl" y "lcl" en la gráfica) cinco semanas en el futuro. El gerente ahora puede predecir con seguridad que, a menos que tomen medidas activas para cambiarlo, el proceso se llevará a cabo dentro de estos límites en el futuro previsible.
Para ser claros, ningún gerente debe estar satisfecho con este nivel de este desempeño o con la variación asociada, y este gerente no. Ella y su equipo cavaron más profundo, encontrando, luego eliminando, dos fuentes de variación. Este trabajo tomó varias semanas, lo que lleva a la tabla a continuación.
Es importante destacar que el trabajo de este gerente fue mucho más fácil a partir de la semana 24. Su proceso funcionó mejor y se eliminaron las tres cuartas partes de la variación, por lo que es más fácil predecir un futuro mejor.
Comprender la variación pone una herramienta poderosa en su quiver de ciencia de datos. Entonces, primero busque apreciar, cuantificar e identificar las fuentes importantes de variación. Luego reduzca los que pueda y tenga en cuenta a los demás para obtener una ventaja comercial. Aunque puede que no sean explícitos al respecto, todas las mejores y más populares técnicas en ciencia de datos tienen como objetivo ayudarlo a hacer eso. La variación no necesita ser tu enemigo. La oportunidad abunda.
Thomas C. Redman, "el Data Doc", es presidente de Data Quality Solutions. Ayuda a las empresas y a las personas, incluidas las nuevas empresas, las multinacionales, los ejecutivos y los líderes en todos los niveles, a trazar sus cursos a futuros basados en datos. Pone especial énfasis en la calidad, el análisis y las capacidades organizativas.
Datos
Harvard Business Review
Es bastante fácil para los gerentes ver que las cosas en el mundo de los negocios varían. Algunas campañas de marketing producen excelentes resultados; los similares no. Hay momentos en que la cadena de suministro funciona sin esfuerzo, y otros momentos en los que se enreda cada paso. Algunos días los números se ven bien, y otros días simplemente no cuadran. La variación es el enemigo natural de un gerente, lo que hace que sea más difícil resolver lo que realmente está sucediendo, hacer predicciones válidas y tener el control.
No tiene que ser así. Ordenar la variación proporciona el contexto necesario, señala la oportunidad y ayuda a los gerentes a mantener la calma cuando algo sale mal. Los gerentes deben aprender a medir la variación, comprender lo que les dice sobre su negocio, descomponerlo y, cuando sea necesario, reducirlo.
Aconsejo a los gerentes que resuelvan la variación y lo que la está causando. Hacerlo proporciona el contexto necesario, señala la oportunidad y les ayuda a mantener la calma cuando algo sale mal. Considere el siguiente ejemplo. La siguiente figura muestra las tasas de error durante las primeras tres semanas de un proceso de facturación:
Después de la segunda semana, el gerente responsable estaba avergonzado: ¿podría su equipo realmente estar funcionando tan mal? Después del tercero, ella suspiró aliviada. La tasa de error puede ser alta, ¡pero al menos la tendencia estaba en la dirección correcta! Ella había estado exaltando a su gente para "trabajar más duro para reducir la tasa de error". ¡Finalmente, estaban escuchando!
Desafortunadamente, su interpretación no se mantuvo. Aquí están las medidas para las próximas siete semanas:
La ilusión de este gerente se hizo añicos la próxima semana, ¡ya que la tasa de error fue aún mayor! Su error surgió porque no entendió que todos los procesos varían, ¡a menudo considerablemente!
Esta viñeta subraya el primer punto, que es simplemente reconocer que la variación es importante y tenerla en cuenta. Específicamente, siempre debe preguntar, "¿Cuál es el" más / menos "alrededor del número?" Y comprender las implicaciones. Después de la tercera semana en este ejemplo, el más / menos es cincuenta por ciento ± ocho por ciento (42% a 58%). El "ocho por ciento" son dos desviaciones estándar, una medida de variabilidad que se explica más adelante. Si lo hubiera tenido en cuenta, este gerente no habría sido tan rápido para dar crédito a sus exhortaciones a las tropas con una mejora que no estaba allí. En términos más generales, debe suponer que las diferencias dentro del signo más / menos se deben a la aleatoriedad y resistir la tentación de tomar el crédito o asignar la culpa.
A medida que profundiza en los números, es importante comprender las fuentes de variación. Por ejemplo, todos saben que algunos adultos adultos son más altos que otros, y es bastante fácil observar que los hombres, en promedio, son más altos que las mujeres. Entonces, en este caso, un componente de variación es el género. Del mismo modo, las personas de los Países Bajos son generalmente más altas, y las de Filipinas son generalmente más bajas. La nacionalidad, entonces, es otra fuente de variación. Es importante comprender estas fuentes de variabilidad si está en el negocio de la ropa, para no enviar demasiados pantalones cortos a las tiendas de ropa en los Países Bajos.
Estas fuentes se vuelven cada vez más importantes a medida que adquiere una idea de las mediciones de variación. ¡Después de todo, no puede administrar lo que no mide! Las dos medidas más importantes de variabilidad se denominan "desviación estándar" (σ) y "R-cuadrado (R2) antes mencionadas. No se desanime por los nombres no intuitivos. En cambio, concéntrate en la interpretación.
Piense en el rango de una desviación estándar (1σ) por debajo del promedio a una desviación estándar por encima del promedio que abarca aproximadamente dos tercios de una población general. Por lo tanto, como se muestra en la figura a continuación, aproximadamente dos tercios de las mujeres adultas de EE. UU. Tienen entre 5'1 "y 5’7" de altura. Piense en el promedio más / menos dos desviaciones estándar (2σ) como que abarca el 95% de una población, como también lo muestra la gráfica. Para las mujeres estadounidenses, esto significa que solo el 5% son más bajas que 4'10 "o más altas que 5’9". De manera similar, el gerente responsable del proceso de facturación debe esperar que el 95% de todas las mediciones caigan entre 42% y 58% y subraya su mala interpretación del 46% en la semana tres.
Finalmente, piense en el promedio más / menos tres desviaciones estándar (3σ) que abarca a todos menos una fracción de un porcentaje de una población.
Interprete a R2 como la "fracción de variación debida a una fuente particular". La siguiente gráfica presenta las alturas de hombres y mujeres. Tenga en cuenta que los hombres son aproximadamente cinco pulgadas más altos, en promedio, y sus alturas exhiben una variación ligeramente mayor. Cuando se trata de altura, claramente los hombres y las mujeres son diferentes. Además, la población combinada de hombres y mujeres varía aún más. Pero, ¿cuánta variación explica el género en esta población combinada? La respuesta es aproximadamente un tercio. Por lo tanto, el género es un factor importante, pero hay mucho más en juego. (Nota: Excel, hojas de Google y buenos paquetes estadísticos y analíticos proporcionan los cálculos necesarios).
Los gerentes deben tratar de identificar tantas fuentes importantes de variabilidad como puedan. Ya he notado que el género y la nacionalidad son dos fuentes. La edad puede ser un tercio, y también se pueden identificar muchos otros. Cada uno tiene su propio R2 y, cuanto más grande es el R2, más importante es la fuente. Una vez que encuentre una fuente importante de variación, dirija su atención a crear una ventaja comercial.
Es importante destacar que R2 también se aplica a modelos completos. Por lo tanto, hay un R2 incluso para el modelo más complicado de altura. Nuevamente, cuanto más grande sea el R2, mejor será el modelo.
Ahora veamos el ejemplo con la tasa de error del equipo. Los cálculos más / menos generalmente se basan en dos desviaciones estándar. El "ocho por ciento" en el "cincuenta por ciento ± ocho por ciento" anterior es 2σ. El gerente responsable de ese ejemplo debe esperar que el 95% de todas las mediciones caigan entre 42% y 58%, y subraya su mala interpretación del 46% en la semana tres.
Comprender σ y R2 permite a los gerentes hacer predicciones más poderosas, establecer control y mejorar el rendimiento. Las predicciones más simples usan límites de 3σ para el más / menos. En la siguiente gráfica, agregué estos límites (llamados límites de control superior e inferior, y etiquetados como "ucl" y "lcl" en la gráfica) cinco semanas en el futuro. El gerente ahora puede predecir con seguridad que, a menos que tomen medidas activas para cambiarlo, el proceso se llevará a cabo dentro de estos límites en el futuro previsible.
Para ser claros, ningún gerente debe estar satisfecho con este nivel de este desempeño o con la variación asociada, y este gerente no. Ella y su equipo cavaron más profundo, encontrando, luego eliminando, dos fuentes de variación. Este trabajo tomó varias semanas, lo que lleva a la tabla a continuación.
Es importante destacar que el trabajo de este gerente fue mucho más fácil a partir de la semana 24. Su proceso funcionó mejor y se eliminaron las tres cuartas partes de la variación, por lo que es más fácil predecir un futuro mejor.
Comprender la variación pone una herramienta poderosa en su quiver de ciencia de datos. Entonces, primero busque apreciar, cuantificar e identificar las fuentes importantes de variación. Luego reduzca los que pueda y tenga en cuenta a los demás para obtener una ventaja comercial. Aunque puede que no sean explícitos al respecto, todas las mejores y más populares técnicas en ciencia de datos tienen como objetivo ayudarlo a hacer eso. La variación no necesita ser tu enemigo. La oportunidad abunda.
Thomas C. Redman, "el Data Doc", es presidente de Data Quality Solutions. Ayuda a las empresas y a las personas, incluidas las nuevas empresas, las multinacionales, los ejecutivos y los líderes en todos los niveles, a trazar sus cursos a futuros basados en datos. Pone especial énfasis en la calidad, el análisis y las capacidades organizativas.
No hay comentarios:
Publicar un comentario