Doxa 811

Cuando los datos crean una ventaja competitiva

Por Andrei HagiuJulian Wright
Estrategia
Harvard Business Review

Muchos ejecutivos e inversores suponen que es posible utilizar las capacidades de datos del cliente para obtener una ventaja competitiva inmejorable. Cuantos más clientes tenga, más datos puede recopilar, y esos datos, cuando se analizan con herramientas de aprendizaje automático, le permiten ofrecer un mejor producto que atrae a más clientes. Luego puede recopilar aún más datos y, finalmente, marginar a sus competidores de la misma manera que lo hacen las empresas con efectos de red considerables. O eso dice el pensamiento. Más a menudo que no, esta suposición es incorrecta. En la mayoría de los casos, las personas sobrestiman enormemente la ventaja que confieren los datos.

Los ciclos virtuosos generados por el aprendizaje habilitado con datos pueden ser similares a los de los efectos de red regulares, en los que una oferta, como una plataforma de redes sociales, se vuelve más valiosa a medida que más personas la usan y, en última instancia, genera una masa crítica de usuarios que excluye a los competidores. Pero en la práctica, los efectos de red regulares duran más y tienden a ser más potentes. Para establecer la posición competitiva más fuerte, los necesita y el aprendizaje habilitado con datos. Sin embargo, pocas empresas pueden desarrollar ambos. Sin embargo, en las condiciones adecuadas, los datos generados por el cliente pueden ayudarlo a construir defensas competitivas, incluso si los efectos de la red no están presentes. En este artículo, le explicaremos cuáles son esas condiciones y le explicaremos cómo evaluar si se aplican a su negocio.
¿Que ha cambiado?

Las empresas basadas en datos han existido durante mucho tiempo. Tome las oficinas de crédito y los agregadores de información LexisNexis, Thomson Reuters y Bloomberg, solo por nombrar algunos. Esas compañías están protegidas por importantes barreras de entrada debido a las economías de escala involucradas en la adquisición y estructuración de grandes cantidades de datos, pero sus modelos de negocio no implican recopilar datos de los clientes y extraerlos para comprender cómo mejorar las ofertas.

Recopilar información del cliente y usarla para hacer mejores productos y servicios es una estrategia antigua, pero el proceso solía ser lento, limitado en su alcance y difícil de ampliar. Para los fabricantes de automóviles, las empresas de bienes de consumo envasados ​​y muchos otros fabricantes tradicionales, requería la recopilación de datos de ventas, la realización de encuestas de clientes y la celebración de grupos focales. Pero los datos de ventas a menudo no estaban vinculados a clientes individuales, y dado que las encuestas y los grupos focales eran caros y llevaban mucho tiempo, solo se recopilaron datos de un número relativamente pequeño de clientes.

Eso cambió drásticamente con el advenimiento de la nube y las nuevas tecnologías que permiten a las empresas procesar rápidamente y dar sentido a grandes cantidades de datos. Los productos y servicios conectados a Internet ahora pueden recopilar información directamente sobre los clientes, incluidos sus datos personales, comportamiento de búsqueda, opciones de contenido, comunicaciones, publicaciones en redes sociales, ubicación GPS y patrones de uso. Después de que los algoritmos de aprendizaje automático analicen este "escape digital", las ofertas de una empresa pueden ajustarse automáticamente para reflejar los hallazgos e incluso adaptarse a las personas.

Estos desarrollos hacen que el aprendizaje habilitado con datos sea mucho más poderoso que el conocimiento del cliente que las compañías produjeron en el pasado. Sin embargo, no garantizan barreras defendibles.
Construyendo fosos con aprendizaje habilitado con datos

Para determinar en qué medida una ventaja competitiva proporcionada por el aprendizaje habilitado con datos es sostenible, las empresas deben responder siete preguntas:

1. ¿Cuánto valor agregan los datos del cliente en relación con el valor independiente de la oferta?

Cuanto mayor sea el valor agregado, mayor será la posibilidad de que cree una ventaja duradera. Veamos un negocio en el que el valor de los datos del cliente es muy alto: Mobileye, el proveedor líder de sistemas avanzados de asistencia al conductor (ADAS), que incluye advertencias de prevención de colisión y de salida de carril para vehículos. Mobileye vende sus sistemas principalmente a fabricantes de automóviles, que los prueban exhaustivamente antes de incorporarlos a sus productos. Es crucial que los sistemas sean seguros y los datos de prueba son esenciales para mejorar su precisión. Al recopilarlo de docenas de sus clientes, Mobileye ha podido aumentar la precisión de su ADAS al 99.99%.

Si bien los conocimientos de los datos son poderosos, no garantizan barreras defendibles.

Por el contrario, el valor de aprender de los clientes es relativamente bajo para los fabricantes de televisores inteligentes. Algunos ahora incluyen software que puede proporcionar recomendaciones personalizadas para programas o películas basadas en los hábitos de visualización de un individuo, así como en lo que es popular entre otros usuarios. Hasta ahora, a los consumidores no les importa mucho esta función (que también ofrecen los proveedores de servicios de transmisión como Amazon y Netflix). Consideran en gran medida el tamaño del televisor, la calidad de la imagen, la facilidad de uso y la durabilidad al tomar decisiones de compra. Si aprender de los clientes fuera un factor más importante, quizás el negocio de la televisión inteligente sería menos competitivo.

2. ¿Qué tan rápido disminuye el valor marginal del aprendizaje habilitado con datos?

En otras palabras, ¿qué tan pronto llega la empresa a un punto en el que los datos adicionales del cliente ya no mejoran el valor de una oferta? Cuanto más lentamente disminuye el valor marginal, más fuerte es la barrera. Tenga en cuenta que al responder esta pregunta, debe juzgar el valor del aprendizaje por la disposición de los clientes a pagar y no por alguna otra medida específica de la aplicación, como el porcentaje de consultas de chat-bot que podrían responderse correctamente o la fracción de veces se hizo clic en una recomendación de película.

Supongamos que graficó la precisión del ADAS de Mobileye en función del uso del cliente (millas totales conducidas por los fabricantes de automóviles que lo probaron) y descubrió que unos pocos fabricantes y un nivel moderado de pruebas serían suficientes para lograr, digamos, un 90% de precisión, pero que se necesitarían muchas más pruebas con un conjunto más grande de fabricantes de automóviles para llegar al 99%, y mucho menos al 99,99%. Por supuesto, interpretar que esto significa que el valor marginal de los datos del cliente estaba disminuyendo rápidamente sería incorrecto: el valor de la mejora adicional de 9 puntos porcentuales (o incluso 0,99 puntos) en la precisión sigue siendo extremadamente alto, dada la vida útil. implicaciones de muerte o muerte. Sería difícil para cualquier fabricante de automóviles individual, incluso el más grande, generar la cantidad necesaria de datos por sí mismo o para cualquier competidor potencial de Mobileye replicar los datos. Es por eso que Mobileye pudo forjar una posición dominante en el mercado ADAS, convirtiéndola en una adquisición muy atractiva para Intel, que la compró por $ 15 mil millones en 2017.

Cuando el valor marginal de aprender de los datos del cliente sigue siendo alto, incluso después de que se haya adquirido una base de clientes muy grande, los productos y servicios tienden a tener ventajas competitivas significativas. Puede ver esto con sistemas diseñados para predecir enfermedades raras (como las que ofrece RDMD) y motores de búsqueda en línea como Baidu y Google. Aunque Microsoft ha invertido muchos años y miles de millones de dólares en Bing, no ha podido sacudir el dominio de Google en la búsqueda. Los motores de búsqueda y los sistemas de predicción de enfermedades necesitan grandes cantidades de datos del usuario para proporcionar resultados consistentemente confiables.

Un contraejemplo de una empresa donde el valor marginal de los datos del usuario disminuye rápidamente son los termostatos inteligentes. Estos productos solo necesitan unos días para conocer las preferencias de temperatura de los usuarios durante todo el día. En este contexto, el aprendizaje habilitado con datos no puede proporcionar mucha ventaja competitiva. Aunque lanzó los primeros termostatos inteligentes que aprenden del comportamiento del cliente en 2011, Nest (adquirido por Google en 2014) ahora se enfrenta a una competencia significativa de jugadores como Ecobee y Honeywell.

3. ¿Qué tan rápido se deprecia la relevancia de los datos del usuario?

Si los datos se vuelven obsoletos rápidamente, entonces, si todo lo demás es igual, será más fácil para un rival ingresar al mercado, ya que no es necesario que coincida con los años de aprendizaje de los datos del titular.

Todos los datos que Mobileye ha acumulado a lo largo de los años de los fabricantes de automóviles siguen siendo valiosos en las versiones actuales de sus productos. Lo mismo ocurre con los datos sobre los usuarios de motores de búsqueda que Google ha recopilado durante décadas. Aunque las búsquedas de algunos términos pueden volverse raras con el tiempo, mientras que las búsquedas de nuevos términos pueden comenzar a aparecer con mayor frecuencia, tener años de datos de búsqueda históricos es de un valor innegable para servir a los usuarios actuales. La baja tasa de depreciación de sus datos ayuda a explicar por qué tanto Mobileye como Google Search han demostrado ser empresas muy resistentes.

Sin embargo, con los juegos sociales casuales para computadoras y dispositivos móviles, el valor de aprender de los datos del usuario tiende a disminuir rápidamente. En 2009, este mercado despegó cuando Zynga presentó su exitoso juego FarmVille. Si bien la compañía era famosa por confiar en gran medida en el análisis de datos de usuario para tomar decisiones de diseño, resultó que las ideas aprendidas de un juego no se transferían muy bien al siguiente: los juegos sociales casuales están sujetos a modas y las preferencias de los usuarios cambian rápidamente con el tiempo, dificultando la construcción de ventajas competitivas sostenibles basadas en datos. Después de algunos éxitos más, incluidos FarmVille 2 y CityVille, Zynga dejó de producir nuevos éxitos y en 2013 perdió casi la mitad de su base de usuarios. Fue reemplazado por creadores de juegos como Supercell (Choque de clanes) y Epic Games (Fortnite). Después de alcanzar un pico de $ 10.4 mil millones en 2012, el valor de mercado de Zynga languideció por debajo de $ 4 mil millones durante la mayor parte de los próximos seis años.

4. ¿Los datos son de propiedad exclusiva, lo que significa que no se pueden comprar de otras fuentes, copiar fácilmente o realizar ingeniería inversa?

Tener datos únicos de clientes con pocos o ningún sustituto es fundamental para crear una barrera defendible. Considere Adaviv, una nueva empresa en el área de Boston en la que hemos invertido, que ofrece un sistema de gestión de cultivos que permite a los productores (ahora principalmente de cannabis) monitorear continuamente plantas individuales. El sistema se basa en IA, software de visión por computadora y una técnica de anotación de datos patentada para rastrear la biometría de las plantas que no es visible para el ojo humano, como los primeros signos de enfermedad o la falta de nutrientes adecuados. Luego traduce los datos en información que los productores pueden usar para prevenir brotes de enfermedades y mejorar los rendimientos. Cuantos más productores sirva Adaviv, más amplia será la variedad de variantes, condiciones agrícolas y otros factores sobre los que puede aprender, y mayor será la precisión de sus predicciones para clientes nuevos y existentes. Compare su situación con la de los proveedores de filtros de correo no deseado, que pueden adquirir datos de usuarios de manera relativamente económica. Eso ayuda a explicar la existencia de docenas de dichos proveedores.

Es importante tener en cuenta que el progreso tecnológico puede socavar una posición basada en datos únicos o propietarios. Un ejemplo de ello es el software de reconocimiento de voz. Históricamente, los usuarios necesitaban entrenar el software para comprender sus voces y patrones de habla individuales, y cuanto más lo usaba una persona, más preciso se volvía. Este mercado estuvo dominado por las soluciones Dragon de Nuance durante muchos años. Sin embargo, la última década ha visto mejoras rápidas en los sistemas de reconocimiento de voz independientes del hablante, que pueden capacitarse en conjuntos de datos de voz disponibles públicamente y tomar un tiempo mínimo o nulo para aprender a entender la voz de un nuevo hablante. Estos avances han permitido a muchas compañías proporcionar nuevas aplicaciones de reconocimiento de voz (servicio al cliente automatizado por teléfono, servicios de transcripción de reuniones automatizadas, asistentes virtuales), y están presionando cada vez más a Nuance en sus mercados principales.

5. ¿Qué tan difícil es imitar las mejoras del producto que se basan en los datos del cliente?

Incluso cuando los datos son únicos o propietarios y producen información valiosa, es difícil construir una ventaja competitiva duradera si las mejoras resultantes pueden ser copiadas por los competidores sin datos similares.

Un par de factores afectan la capacidad de las empresas para superar este desafío. Una es si las mejoras están ocultas o profundamente integradas en un proceso de producción complejo, lo que dificulta su replicación. Pandora, el servicio de transmisión de música, se beneficia de esta barrera. Su oferta aprovechó el proyecto patentado Music Genome de la empresa, que clasificó millones de canciones en función de unos 450 atributos, lo que permitió a Pandora personalizar las estaciones de radio según las preferencias de los usuarios individuales. Cuanto más un usuario escuche sus estaciones y califique las canciones hacia arriba o hacia abajo, mejor podrá Pandora adaptar las selecciones musicales a ese usuario. Tal rivalización no puede ser fácilmente imitada por ningún rival porque está profundamente ligada al Proyecto Music Genome. En contraste, las mejoras de diseño basadas en el aprendizaje del uso por parte del cliente de muchos productos de software de productividad de oficina, como Calendly para coordinar calendarios y Doodle para sondear a las personas sobre los horarios de las reuniones, se pueden observar y copiar fácilmente. Es por eso que docenas de compañías ofrecen software similar.

El segundo factor es qué tan rápido cambian los conocimientos de los datos del cliente. Cuanto más rápido lo hagan, más difícil será para otros imitar. Por ejemplo, muchas características de diseño de la interfaz de Google Maps se pueden copiar fácilmente (y Apple Maps, entre otras). Pero una parte clave del valor de Google Maps es su capacidad de predecir el tráfico y recomendar rutas óptimas, lo cual es mucho más difícil de copiar porque aprovecha los datos del usuario en tiempo real que se vuelven obsoletos en cuestión de minutos. Solo las empresas con bases de usuarios igualmente grandes (como Apple en los Estados Unidos) pueden esperar replicar esa característica. Apple Maps está cerrando la brecha con Google Maps en los Estados Unidos, pero no en países donde Apple tiene una base de usuarios relativamente pequeña.

6. ¿Los datos de un usuario ayudan a mejorar el producto para el mismo usuario o para otros?

Idealmente, hará ambas cosas, pero la diferencia entre las dos es importante. Cuando los datos de un usuario mejoran el producto para esa persona, la empresa puede personalizarlo individualmente, creando costos de cambio. Cuando los datos de un usuario mejoran el producto para otros usuarios, esto puede, pero no puede, crear efectos de red. Ambos tipos de mejoras ayudan a proporcionar una barrera de entrada, pero la primera hace que los clientes existentes sean muy pegajosos, mientras que la segunda proporciona una ventaja clave al competir por nuevos clientes.

Por ejemplo, Pandora fue el primer gran jugador en la transmisión de música digital, pero luego se quedó atrás de Spotify y Apple Music, que todavía están creciendo. Como notamos, el principal punto de venta de Pandora es que puede adaptar las estaciones a los gustos de cada usuario. Pero el aprendizaje entre usuarios es muy limitado: los votos hacia arriba o hacia abajo de un usuario individual le permiten a Pandora identificar los atributos de música que le gustan al usuario y luego servir las canciones de esa persona que comparten esos atributos. Por el contrario, Spotify se centró mucho más en proporcionar a los usuarios funciones para compartir y descubrir, como la capacidad de buscar y escuchar las estaciones de otras personas, creando así efectos de red directos y atrayendo a clientes adicionales. El servicio de Pandora permanece disponible solo en los Estados Unidos (donde tiene una base de usuarios leales), mientras que Spotify y Apple Music se han convertido en jugadores globales. Y aunque Sirndo XM adquirió Pandora por $ 3.5 mil millones en febrero de 2019, Spotify se convirtió en una empresa pública en abril de 2018 y a principios de noviembre de 2019 valía $ 26 mil millones. Claramente, la personalización basada en el aprendizaje de los datos de un usuario individual ayuda a mantener a los clientes existentes encerrados, pero no conduce al tipo de crecimiento exponencial que producen los efectos de red.

7. ¿Qué tan rápido pueden incorporarse a los productos los conocimientos de los datos del usuario?

Los rápidos ciclos de aprendizaje dificultan que los competidores se pongan al día, especialmente si se producen múltiples ciclos de mejora del producto durante el contrato promedio del cliente. Pero cuando se necesitan años o generaciones sucesivas de productos para realizar mejoras basadas en los datos, los competidores tienen más oportunidades de innovar mientras tanto y comenzar a recopilar sus propios datos de usuario. Por lo tanto, la ventaja competitiva de los datos del cliente es mayor cuando el aprendizaje de los clientes actuales se traduce en mejoras más frecuentes del producto para esos mismos clientes en lugar de solo para los futuros clientes del producto o servicio. Varios de los ejemplos de productos que ya hemos discutido (mapas, motores de búsqueda y sistemas de gestión de cultivos basados ​​en IA) pueden actualizarse rápidamente para incorporar el aprendizaje de los clientes actuales.

Los prestamistas directos en línea, como LendUp y LendingPoint, ofrecen un contraejemplo, que aprenden cómo tomar mejores decisiones de préstamo examinando el historial de pagos de los usuarios y cómo se correlaciona con varios aspectos de los perfiles y el comportamiento de los usuarios. Aquí, el único aprendizaje que es relevante para los prestatarios actuales es el de los prestatarios anteriores, que ya se refleja en los contratos y las tasas que se ofrecen a los prestatarios actuales. No hay ninguna razón para que los prestatarios se preocupen por cualquier aprendizaje futuro del que el prestamista pueda beneficiarse, ya que sus contratos existentes no se verán afectados. Por esa razón, los clientes no se preocupan por cuántos otros prestatarios se inscribirán al decidir si tomar un préstamo de un prestamista en particular. Los prestatarios existentes pueden preferir seguir con sus prestamistas actuales, que los conocen mejor que otros prestamistas, pero el mercado para los nuevos prestatarios sigue siendo muy competitivo.

¿Los datos confieren efectos de red?

Las respuestas a las preguntas 6 y 7 le dirán si el aprendizaje habilitado con datos creará verdaderos efectos de red. Cuando aprender de un cliente se traduce en una mejor experiencia para otros clientes y cuando ese aprendizaje se puede incorporar a un producto lo suficientemente rápido como para beneficiar a sus usuarios actuales, los clientes se preocuparán por cuántas otras personas están adoptando el producto. El mecanismo en el trabajo aquí es muy similar a los efectos de red subyacentes con las plataformas en línea. La diferencia es que los usuarios de la plataforma prefieren unirse a redes más grandes porque quieren que más personas interactúen, no porque más usuarios generen más información que mejore los productos.

Veamos nuevamente Google Maps. Los conductores lo usan en parte porque esperan que muchos otros también lo utilicen, y cuantos más datos de tráfico recopile el software de ellos, mejores serán sus predicciones sobre las condiciones del camino y los tiempos de viaje. La Búsqueda de Google y el sistema de gestión de cultivos basado en IA de Adaviv también disfrutan de efectos de red habilitados para datos.

  • A menudo, las empresas pueden nivelar el campo de juego comprando datos de fuentes alternativas.

Al igual que los efectos de red normales, los habilitados para datos pueden crear barreras de entrada. Ambos tipos de efectos presentan un gran desafío de arranque en frío o de gallina o huevo: las empresas que desean crear efectos de red regulares deben atraer un número mínimo de usuarios para comenzar los efectos, y aquellos que buscan lograr una red habilitada para datos Los efectos necesitan una cantidad inicial de datos para iniciar el virtuoso ciclo de aprendizaje.

A pesar de estas similitudes, los efectos de red regulares y los efectos de red habilitados para datos tienen diferencias clave, y tienden a hacer que las ventajas basadas en las regulares sean más fuertes. Primero, el problema del arranque en frío suele ser menos grave con los efectos de red habilitados para datos, porque comprar datos es más fácil que comprar clientes. A menudo, las fuentes alternativas de datos, incluso si no son perfectas, pueden nivelar significativamente el campo de juego al eliminar la necesidad de una gran base de clientes.

En segundo lugar, para producir efectos de red duraderos con datos habilitados, la empresa debe trabajar constantemente para aprender de los datos de los clientes. En contraste, como el cofundador de Intuit, Scott Cook, ha dicho a menudo, "los productos que se benefician de los efectos de red [regulares] mejoran mientras duermo". Con los efectos de red regulares, las interacciones entre los clientes (y posiblemente con proveedores externos de ofertas complementarias) crean valor incluso si la plataforma deja de innovar. Incluso si una nueva red social ofreciera a los usuarios características objetivamente mejores que las de Facebook (por ejemplo, una mejor protección de la privacidad), todavía tendría que lidiar con los poderosos efectos de red de Facebook: los usuarios quieren estar en la misma plataforma social que la mayoría de los otros usuarios.

Tercero, en muchos casos, casi todos los beneficios de aprender de los datos del cliente se pueden lograr con un número relativamente bajo de clientes. Y en algunas aplicaciones (como el reconocimiento de voz), las mejoras dramáticas en la IA reducirán la necesidad de datos del cliente hasta el punto en que el valor del aprendizaje habilitado con datos pueda desaparecer por completo. Los efectos de red regulares, por otro lado, se extienden aún más y son más resistentes: un cliente adicional todavía suele mejorar el valor para los clientes existentes (que pueden interactuar o realizar transacciones con él), incluso cuando el número de clientes existentes ya es muy grande.

CONCLUSIÓN

A medida que incluso los productos de consumo habituales se vuelven inteligentes y conectados (nuevos tipos de ropa, por ejemplo, ahora pueden reaccionar a las condiciones climáticas y rastrear el kilometraje y los signos vitales), el aprendizaje habilitado con datos se utilizará para mejorar y personalizar más y más ofertas. Sin embargo, sus proveedores no crearán posiciones competitivas sólidas a menos que el valor agregado por los datos del cliente sea alto y duradero, los datos sean de propiedad exclusiva y conduzcan a mejoras del producto que sean difíciles de copiar, o el aprendizaje habilitado con datos cree efectos de red.

En las próximas décadas, mejorar las ofertas con los datos de los clientes será un requisito previo para permanecer en el juego, y puede dar a los titulares una ventaja sobre los nuevos participantes. Pero, en la mayoría de los casos, no generará dinámicas de ganador para llevar todo. En cambio, las empresas más valiosas y poderosas en el futuro previsible serán aquellas que se basan en los efectos de red regulares y mejoradas por el aprendizaje habilitado con datos, como los mercados de Alibaba y Amazon, la tienda de aplicaciones de Apple y las redes sociales de Facebook.
Una versión de este artículo apareció en la edición de enero a febrero de 2020 de Harvard Business Review.

Andrei Hagiu es profesor asociado de sistemas de información en la Escuela de Negocios Questrom de la Universidad de Boston. Sígalo en Twitter: @theplatformguy.

Julian Wright es profesor de economía en la Universidad Nacional de Singapur.


No hay comentarios:

Publicar un comentario