Doxa 996

Cómo ganar con el aprendizaje automático

Por Ajay Agrawal , Joshua Gans y Avi Goldfarb
Estrategía
Harvard Business Review

La última década ha traído enormes avances en una dimensión apasionante de la inteligencia artificial: el aprendizaje automático. Esta técnica para tomar entradas de datos y convertirlas en predicciones ha permitido a gigantes tecnológicos como Amazon, Apple, Facebook y Google mejorar drásticamente sus productos. También ha estimulado a las empresas emergentes a lanzar nuevos productos y plataformas, a veces incluso en competencia con Big Tech.

Considere BenchSci, una empresa con sede en Toronto que busca acelerar el proceso de desarrollo de medicamentos. Su objetivo es facilitar a los científicos la búsqueda de agujas en los pajar, para concentrarse en la información más crucial incluida en las bases de datos internas de las empresas farmacéuticas y en la vasta riqueza de la investigación científica publicada. Para incorporar un nuevo fármaco candidato a los ensayos clínicos, los científicos deben realizar experimentos costosos y que requieren mucho tiempo. BenchSci se dio cuenta de que los científicos podrían realizar menos de estos y lograr un mayor éxito si aplicaban mejores conocimientos de la gran cantidad de experimentos que ya se habían realizado.

De hecho, BenchSci descubrió que si los científicos aprovecharan el aprendizaje automático que leía, clasificaba y luego presentaba conocimientos de la investigación científica, podrían reducir a la mitad el número de experimentos que normalmente se requieren para hacer avanzar un fármaco a los ensayos clínicos. Más específicamente, podrían usar la tecnología para encontrar los reactivos biológicos adecuados, sustancias esenciales para influir y medir la expresión de proteínas. Identificarlos revisando la literatura publicada en lugar de redescubrirlos desde cero ayuda a reducir significativamente el tiempo que lleva producir nuevos candidatos a fármacos. Eso se suma a ahorros potenciales de más de $ 17 mil millones al año, que, en una industria donde los retornos de I + D se han reducido como una navaja, podrían transformar el mercado. Además, se podrían salvar muchas vidas introduciendo nuevos medicamentos en el mercado más rápidamente.

Lo que es notable aquí es que BenchSci, en su dominio especializado, está haciendo algo parecido a lo que ha estado haciendo Google por toda Internet: usar el aprendizaje automático para liderar en la búsqueda. Así como Google puede ayudarlo a descubrir cómo arreglar su lavavajillas y ahorrarle un largo viaje a la biblioteca o un costoso servicio de reparación, BenchSci ayuda a los científicos a identificar un reactivo adecuado sin incurrir en problemas o gastos de investigación y experimentación excesiva. Anteriormente, los científicos solían usar Google o PubMed para buscar en la literatura (un proceso que tomaba días), luego leían la literatura (nuevamente, pasaban días) y luego ordenaban y probaban de tres a seis reactivos antes de elegir uno (durante un período de semanas).

Muchas empresas ya están trabajando con IA y conocen los pasos prácticos para integrarla en sus operaciones y aprovechar su poder. Pero a medida que crece esa competencia, las empresas deberán considerar un tema más amplio: ¿Cómo aprovechar el aprendizaje automático para crear un foso defendible alrededor de la empresa, para crear algo que los competidores no puedan imitar fácilmente? En el caso de BenchSci, por ejemplo, ¿su éxito inicial atraerá la competencia de Google? Y, de ser así, ¿cómo conserva BenchSci su liderazgo?

En las páginas siguientes, explicamos cómo las empresas que ingresan a industrias con un producto o servicio habilitado para inteligencia artificial pueden construir una ventaja competitiva sostenible y levantar barreras de entrada contra los que llegan tarde. Observamos que mudarse temprano a menudo puede ser una gran ventaja, pero no es toda la historia. Como comentamos, los usuarios tardíos de la nueva tecnología aún pueden avanzar, o al menos recuperar algo de terreno perdido, al encontrar un nicho.

Hacer predicciones con IA
Las empresas utilizan el aprendizaje automático para reconocer patrones y luego hacer predicciones sobre lo que atraerá a los clientes, mejorará las operaciones o ayudará a mejorar un producto. Sin embargo, antes de poder construir una estrategia en torno a tales predicciones, debe comprender las entradas necesarias para el proceso de predicción, los desafíos involucrados en obtener esas entradas y el papel de la retroalimentación para permitir que un algoritmo haga mejores predicciones a lo largo del tiempo.

Una predicción, en el contexto del aprendizaje automático, es una salida de información que proviene de ingresar algunos datos y ejecutar un algoritmo. Por ejemplo, cuando su aplicación de navegación móvil ofrece una predicción sobre la mejor ruta entre dos puntos, utiliza datos de entrada sobre las condiciones del tráfico, los límites de velocidad, el tamaño de la carretera y otros factores. Luego se emplea un algoritmo para predecir el camino más rápido a seguir y el tiempo que llevará.

El desafío clave con cualquier proceso de predicción es que los datos de capacitación, las entradas que necesita para comenzar a obtener resultados razonables, deben crearse (por ejemplo, contratando expertos para clasificar las cosas) o adquirirse de fuentes existentes (por ejemplo, registros de salud ). Algunos tipos de datos son fáciles de adquirir de fuentes públicas (piense en información meteorológica y cartográfica). Los consumidores también pueden proporcionar voluntariamente datos personales si perciben un beneficio al hacerlo. Los usuarios de Fitbit y Apple Watch, por ejemplo, permiten a las empresas recopilar métricas sobre su nivel de ejercicio, ingesta de calorías, etc., a través de dispositivos que los usuarios usan para controlar su salud y estado físico.
Mudarse temprano a menudo puede ser una gran ventaja, pero no es toda la historia.
Sin embargo, la obtención de datos de entrenamiento para permitir predicciones puede ser difícil si requiere la cooperación de un gran número de personas que no se benefician directamente de proporcionarlos. Por ejemplo, una aplicación de navegación puede recopilar datos sobre las condiciones del tráfico rastreando a los usuarios y obteniendo informes de ellos. Esto permite que la aplicación identifique ubicaciones probables de atascos y alertar a otros conductores que se dirigen hacia ellos. Pero los conductores que ya están atrapados en los gruñidos obtienen pocos beneficios directos al participar, y pueden preocuparse por la idea de que la aplicación sepa dónde están en cualquier momento (y potencialmente está grabando sus movimientos). Si las personas en atascos de tráfico se niegan a compartir sus datos o realmente apagan sus geolocalizadores, la capacidad de la aplicación para advertir a los usuarios sobre problemas de tráfico se verá comprometida.

Otro desafío puede ser la necesidad de actualizar periódicamente los datos de entrenamiento. Esto no siempre es un problema; no se aplicará si el contexto básico en el que se hizo la predicción permanece constante. La radiología, por ejemplo, analiza la fisiología humana, que generalmente es constante de persona a persona y a lo largo del tiempo. Por lo tanto, después de cierto punto, el valor marginal de un registro adicional en la base de datos de entrenamiento es casi cero. Sin embargo, en otros casos, es posible que los algoritmos deban actualizarse con frecuencia con datos completamente nuevos que reflejen los cambios en el entorno subyacente. Con aplicaciones de navegación, por ejemplo, nuevas carreteras o rotondas, calles renombradas y cambios similares harán que las predicciones de la aplicación sean menos precisas con el tiempo, a menos que se actualicen los mapas que forman parte de los datos de entrenamiento inicial.

En muchas situaciones, los algoritmos se pueden mejorar continuamente mediante el uso de datos de retroalimentación, que se obtienen mapeando los resultados reales con los datos de entrada que generaron predicciones de esos resultados. Esta herramienta es particularmente útil en situaciones donde puede haber una variación considerable dentro de límites claramente definidos. Por ejemplo, cuando tu teléfono usa una imagen tuya por seguridad, inicialmente habrás entrenado el teléfono para que te reconozca. Pero tu rostro puede cambiar significativamente. Puede que esté usando anteojos o no. Es posible que se haya hecho un nuevo peinado, se haya maquillado o haya ganado o perdido peso. Por lo tanto, la predicción de que eres tú puede volverse menos confiable si el teléfono se basa únicamente en los datos de entrenamiento inicial. Pero lo que realmente sucede es que el teléfono actualiza su algoritmo usando todas las imágenes que proporcionas cada vez que lo desbloqueas.

Crear este tipo de ciclos de retroalimentación no es nada sencillo en contextos dinámicos y donde la retroalimentación no se puede categorizar y obtener fácilmente. Los datos de retroalimentación para la aplicación de reconocimiento facial del teléfono inteligente, por ejemplo, crean mejores predicciones solo si la única persona que ingresa los datos faciales es el propietario del teléfono. Si otras personas se ven lo suficientemente similares como para ingresar al teléfono y continuar usándolo, la predicción del teléfono de que el usuario es el propietario se vuelve poco confiable.

También puede ser peligrosamente fácil introducir sesgos en el aprendizaje automático, especialmente si hay múltiples factores en juego. Suponga que un prestamista utiliza un proceso habilitado por IA para evaluar el riesgo crediticio de los solicitantes de préstamos, considerando su nivel de ingresos, historial de empleo, características demográficas, etc. Si los datos de entrenamiento para el algoritmo discriminan a un determinado grupo, digamos, personas de color, el ciclo de retroalimentación perpetuará o incluso acentuará ese sesgo, haciendo cada vez más probable que los solicitantes de color sean rechazados. La retroalimentación es casi imposible de incorporar de manera segura en un algoritmo sin parámetros cuidadosamente definidos y fuentes confiables e imparciales.

Construyendo una ventaja competitiva en la predicción
En muchos sentidos, construir un negocio sostenible en aprendizaje automático es muy parecido a crear un negocio sostenible en cualquier industria. Tienes que entrar con un producto que se pueda vender, crear una posición inicial defendible y hacer que sea más difícil para cualquiera que venga detrás de ti. Si puede hacerlo, depende de sus respuestas a tres preguntas:

1. ¿Tiene suficientes datos de entrenamiento?
Al principio, una máquina de predicción necesita generar predicciones que sean lo suficientemente buenas como para ser comercialmente viables. La definición de "suficientemente bueno" puede establecerse por regulación (por ejemplo, una IA para realizar diagnósticos médicos debe cumplir con los estándares del gobierno), usabilidad (un chatbot debe funcionar con la suficiente fluidez para que las personas que llaman respondan a la máquina en lugar de esperar para hablar con un humano en el centro de llamadas) o la competencia (una empresa que busca ingresar al mercado de búsqueda en Internet necesita un cierto nivel de precisión predictiva para competir con Google). Por lo tanto, una barrera de entrada es la cantidad de tiempo y esfuerzo necesarios para crear o acceder a suficientes datos de entrenamiento para hacer predicciones lo suficientemente buenas.

Esta barrera puede ser alta. Tomemos el caso de la radiología, donde una máquina de predicción debe ser sensiblemente mejor que los humanos altamente capacitados para poder confiar en la vida de las personas. Eso sugiere que la primera empresa en construir una IA de aplicación general para radiología (una que pueda leer cualquier imagen escaneada) tendrá poca competencia al principio porque se necesitan muchos datos para el éxito. Pero la ventaja inicial puede ser de corta duración si el mercado está creciendo rápidamente, porque en un mercado de rápido crecimiento, la recompensa de tener acceso a los datos de capacitación probablemente será lo suficientemente grande como para atraer a múltiples empresas grandes con mucho dinero.

Esto, por supuesto, significa que los requisitos de ingreso de datos de capacitación están sujetos a la economía de escala, como tantas otras cosas. Los mercados de alto crecimiento atraen inversiones y, con el tiempo, esto eleva el umbral para el próximo nuevo participante (y obliga a todos los que ya están en el sector a gastar más en desarrollar o comercializar sus productos). Por lo tanto, cuantos más datos pueda entrenar sus máquinas, mayor será el obstáculo para cualquiera que venga detrás de usted, lo que nos lleva a la segunda pregunta.

2. ¿Qué tan rápido son sus ciclos de retroalimentación?
Las máquinas de predicción explotan lo que tradicionalmente ha sido la ventaja humana: aprenden. Si pueden incorporar datos de retroalimentación, entonces pueden aprender de los resultados y mejorar la calidad de la próxima predicción.

Sin embargo, el alcance de esta ventaja depende del tiempo que se tarde en recibir comentarios. Con una exploración radiológica, si se requiere una autopsia para evaluar si un algoritmo de aprendizaje automático predijo correctamente el cáncer, la retroalimentación será lenta y, aunque una empresa puede tener una ventaja temprana en la recopilación y lectura de exploraciones, su capacidad será limitada. aprender y así mantener su liderazgo. Por el contrario, si los datos de retroalimentación se pueden generar rápidamente después de obtener la predicción, entonces una ventaja temprana se traducirá en una ventaja competitiva sostenida, porque la escala mínima eficiente pronto estará fuera del alcance incluso de las empresas más grandes.

Cuando Microsoft lanzó el motor de búsqueda Bing en 2009, contaba con el respaldo total de la empresa. Microsoft invirtió miles de millones de dólares en él. Sin embargo, más de una década después, la participación de mercado de Bing se mantiene muy por debajo de la de Google, tanto en volumen de búsqueda como en ingresos por publicidad de búsqueda. Una razón por la que a Bing le resultó difícil ponerse al día fue el circuito de retroalimentación. En la búsqueda, el tiempo entre la predicción (que ofrece una página con varios enlaces sugeridos en respuesta a una consulta) y la retroalimentación (el usuario hace clic en uno de los enlaces) es corto, generalmente segundos. En otras palabras, el ciclo de retroalimentación es rápido y poderoso.

Cuando Bing ingresó al mercado, Google ya había estado operando un motor de búsqueda basado en inteligencia artificial durante una década o más, ayudando a millones de usuarios y realizando miles de millones de búsquedas diarias. Cada vez que un usuario realizaba una consulta, Google proporcionaba su predicción de los enlaces más relevantes, y luego el usuario seleccionaba el mejor de esos enlaces, lo que le permitía a Google actualizar su modelo de predicción. Eso permitió un aprendizaje constante a la luz de un espacio de búsqueda en constante expansión. Con tantos datos de entrenamiento basados ​​en tantos usuarios, Google pudo identificar nuevos eventos y nuevas tendencias más rápidamente que Bing. Al final, el ciclo de retroalimentación rápido, combinado con otros factores —la inversión continua de Google en instalaciones masivas de procesamiento de datos y los costos reales o percibidos para los clientes de cambiar a otro motor— significó que Bing siempre se quedaba atrás.

3. ¿Qué tan buenas son tus predicciones?
El éxito de cualquier producto depende en última instancia de lo que obtiene por lo que paga. Si a los consumidores se les ofrecen dos productos similares al mismo precio, generalmente elegirán el que perciban como de mayor calidad.

La calidad de la predicción, como ya hemos señalado, suele ser fácil de evaluar. En radiología, búsqueda, publicidad y muchos otros contextos, las empresas pueden diseñar IA con una métrica única y clara de calidad: precisión. Como en otras industrias, los productos de la más alta calidad se benefician de una mayor demanda. Sin embargo, los productos basados ​​en IA son diferentes a otros porque para la mayoría de los demás productos, una mejor calidad cuesta más y los vendedores de productos inferiores sobreviven utilizando materiales más baratos o procesos de fabricación menos costosos y luego cobrando precios más bajos. Esta estrategia no es tan factible en el contexto de la IA. Debido a que la IA se basa en software, una predicción de baja calidad es tan cara de producir como una de alta calidad, lo que hace que los precios con descuento no sean realistas. Y si la mejor predicción tiene el mismo precio que la peor, no hay razón para comprar la de menor calidad.

Para Google, este es otro factor que explica por qué su liderazgo en las búsquedas puede ser inexpugnable. Las predicciones de los competidores a menudo se parecen bastante a las de Google. Ingrese la palabra "clima" en Google o Bing, y los resultados serán prácticamente los mismos: los pronósticos aparecerán primero. Pero si ingresa un término menos común, pueden surgir diferencias. Si escribe, digamos, "disrupción", la primera página de Bing generalmente mostrará definiciones de diccionario, mientras que Google proporciona definiciones y enlaces a trabajos de investigación sobre el tema de la innovación disruptiva. Aunque Bing puede funcionar tan bien como Google para algunas consultas de texto, para otras es menos preciso para predecir lo que buscan los consumidores. Y hay pocas o ninguna otra categoría de búsqueda en la que Bing se considere superior.

Alcanzando
La conclusión es que en IA, un pionero puede construir una ventaja competitiva basada en la escala si los ciclos de retroalimentación son rápidos y la calidad del rendimiento es clara. Entonces, ¿qué significa esto para los que se mudan tarde? Enterradas en las tres preguntas hay pistas sobre dos formas en las que un participante tardío puede hacerse un hueco en el mercado. Los aspirantes a contendientes no necesitan elegir entre estos enfoques; pueden probar ambos.

Identificar y asegurar fuentes de datos alternativas.
En algunos mercados de herramientas de predicción, puede haber reservas de datos de capacitación potenciales que los titulares aún no han capturado. Volviendo al ejemplo de la radiología, decenas de miles de médicos están leyendo miles de escaneos al año, lo que significa que hay cientos de millones (o incluso miles de millones) de nuevos puntos de datos disponibles.

Los primeros participantes tendrán datos de formación de unos cientos de radiólogos. Por supuesto, una vez que su software se esté ejecutando en el campo, la cantidad de escaneos y la cantidad de comentarios en su base de datos aumentarán sustancialmente, pero los miles de millones de escaneos previamente analizados y verificados representan una oportunidad para que los rezagados se pongan al día, suponiendo que puedan para agrupar los escaneos y analizarlos en conjunto. Si ese es el caso, es posible que puedan desarrollar una IA que haga predicciones lo suficientemente buenas para salir al mercado, después de lo cual ellos también pueden beneficiarse de los comentarios.

Los recién llegados también podrían considerar entrenar a una IA utilizando datos de patología o autopsia en lugar de diagnósticos humanos. Esa estrategia les permitiría alcanzar el umbral de calidad antes (porque las biopsias y autopsias son más definitivas que las exploraciones corporales), aunque el ciclo de retroalimentación posterior sería más lento.

Alternativamente, en lugar de intentar encontrar fuentes de datos de capacitación sin explotar, los recién llegados podrían buscar nuevas fuentes de datos de retroalimentación que permitan un aprendizaje más rápido que el que utilizan los titulares. (BenchSci es un ejemplo de una empresa que ha tenido éxito en hacer esto). Al ser el primero en contar con un suministro novedoso de datos de retroalimentación más rápidos, el recién llegado puede aprender de las acciones y elecciones de sus usuarios para mejorar su producto. Pero en los mercados donde los ciclos de retroalimentación ya son bastante rápidos y donde los operadores establecidos operan a gran escala, las oportunidades para implementar este enfoque serán relativamente limitadas. Y una retroalimentación significativamente más rápida probablemente desencadenaría una interrupción de las prácticas actuales, lo que significa que los nuevos participantes no competirían realmente con empresas establecidas, sino que las desplazarían.

Diferenciar la predicción.
Otra táctica que puede ayudar a los participantes tardíos a volverse competitivos es redefinir lo que hace que una predicción sea "mejor", aunque solo sea para algunos clientes. En radiología, por ejemplo, tal estrategia podría ser posible si existe una demanda en el mercado de diferentes tipos de predicciones. Los primeros participantes probablemente entrenaron sus algoritmos con datos de un sistema hospitalario, un tipo de hardware o un país. Al usar datos de entrenamiento (y luego datos de retroalimentación) de otro sistema u otro país, el recién llegado podría personalizar su IA para ese segmento de usuarios si es lo suficientemente diferente. Si, digamos, los estadounidenses urbanos y las personas en las zonas rurales de China tienden a experimentar diferentes condiciones de salud, entonces una máquina de predicción construida para diagnosticar uno de esos grupos podría no ser tan precisa para diagnosticar a los pacientes del otro grupo.
Los recién llegados podrían buscar nuevas fuentes de datos de retroalimentación que permitan un aprendizaje más rápido.
La creación de predicciones que se basan en datos provenientes de un tipo particular de hardware también podría brindar una oportunidad de mercado, si ese modelo de negocios genera costos más bajos o aumenta la accesibilidad para los clientes. Muchas de las IA actuales para radiología se basan en datos de las máquinas de rayos X, escáneres y dispositivos de ultrasonido más utilizados de GE, Siemens y otros fabricantes establecidos. Sin embargo, si los algoritmos se aplican a datos de otras máquinas, las predicciones resultantes pueden ser menos precisas. Por lo tanto, un participante tardío podría encontrar un nicho ofreciendo un producto adaptado a ese otro equipo, que podría ser atractivo para las instalaciones médicas si es más barato de comprar u operar o está especializado para satisfacer las necesidades de clientes particulares.

CONCLUSIÓN
El potencial de las máquinas de predicción es inmenso y no hay duda de que los gigantes tecnológicos tienen una ventaja. Pero vale la pena recordar que las predicciones son como productos diseñados con precisión, altamente adaptados para propósitos y contextos específicos. Si puede diferenciar los propósitos y contextos aunque sea un poco, puede crear un espacio defendible para su propio producto. Aunque el diablo está en los detalles de cómo recopila y usa los datos, su salvación también descansa allí.

No obstante, la verdadera clave para competir con éxito con Big Tech en industrias impulsadas por máquinas inteligentes radica en una pregunta que solo un humano puede responder: ¿Qué es lo que desea predecir? Por supuesto, encontrar la respuesta no es fácil. Hacerlo requiere una comprensión profunda de la dinámica del mercado y un análisis cuidadoso del valor potencial de predicciones específicas y los productos y servicios en los que están integradas. Por lo tanto, tal vez no sea sorprendente que el inversionista principal en el financiamiento de la Serie A2 de BenchSci no fuera uno de los muchos inversionistas tecnológicos canadienses locales, sino una empresa de capital de riesgo centrada en la inteligencia artificial llamada Gradient Ventures, propiedad de Google.

Una versión de este artículo apareció en la edición de septiembre-octubre de 2020 de Harvard Business Review .

Ajay Agrawal es la Cátedra Geoffrey Taber de Emprendimiento e Innovación en la Rotman School of Management de la Universidad de Toronto. Es el fundador del Creative Destruction Lab, cofundador de The Next AI y cofundador de Kindred. Es coautor de Prediction Machines: The Simple Economics of Artificial Intelligence (Harvard Business Review Press, abril de 2018).

Joshua Gans es la Cátedra Jeffrey S. Skoll de Innovación Técnica y Emprendimiento en la Rotman School of Management de la Universidad de Toronto y economista en jefe del Creative Destruction Lab. Es autor de The Disruption Dilemma (MIT Press, marzo de 2016) y coautor de Prediction Machines: The Simple Economics of Artificial Intelligence (Harvard Business Review Press, abril de 2018).

Avi Goldfarb es la Cátedra Rotman de Inteligencia Artificial y Salud en la Rotman School of Management de la Universidad de Toronto. También es el científico de datos en jefe del Creative Destruction Lab y coautor de Prediction Machines: The Simple Economics of Artificial Intelligence (Harvard Business Review Press, abril de 2018).


No hay comentarios:

Publicar un comentario