Las herramientas de IA que están transformando la investigación de mercado
Por Jeremy Korst, Stefano Puntoni y Olivier Toubia
Marketing
Harvard Business Review
#Doxa #InteligenciaArtificial #BigData #AnálisisPredictivo #MachineLearning #Automatización #Personalización #AnálisisDeSentimientos #Chatbots #SegmentaciónDinámica #TomaDeDecisiones #CustomerInsights #DataDriven
Resumen. Las respuestas y comportamientos de los consumidores reducen drásticamente el tiempo y el costo de la investigación tradicional. Las personas sintéticas agregan datos demográficos y psicográficos para representar segmentos de mercado, y los gemelos digitales utilizan datos a nivel individual para replicar a consumidores reales y obtener información más detallada. Los primeros estudios muestran que estas herramientas pueden reflejar fielmente las respuestas humanas en ciertos ámbitos, aunque también revelan limitaciones como sesgos y dificultades para captar la diversidad de opiniones. Para aprovechar el potencial de estas herramientas, se recomienda a las organizaciones experimentar con estos enfoques, definir cuidadosamente los casos de uso y las métricas de rendimiento, y validar periódicamente los datos sintéticos con respecto a referencias del mundo real.
La investigación de mercado personalizada siempre se ha caracterizado por su lentitud y alto costo, requiriendo a menudo meses de trabajo e inversiones significativas. En consecuencia, muchos profesionales del marketing han tomado decisiones estratégicas sin contar con información externa oportuna. Sin embargo, como argumentamos en nuestro reciente artículo de HBR, « Cómo la IA de última generación está transformando la investigación de mercado », la IA de última generación está transformando la recopilación, la creación y el análisis de información sobre consumidores y mercados, elementos vitales del marketing estratégico. No somos los únicos en sostener esta idea: desde la publicación de nuestro artículo, por ejemplo, tanto Andreessen Horowitz como Foundation Capital han publicado tesis de inversión que predicen que la IA de última generación transformará radicalmente la industria global de la investigación de mercado, valorada en 140 mil millones de dólares.
Creemos que en el centro de esta transformación se encontrarán dos herramientas generadas por IA diseñadas para actuar como sustitutos de las personas: la persona sintética (que representa a un individuo o grupo compuesto) y el gemelo digital (que representa a un individuo real). Al utilizar datos públicos o privados para simular respuestas humanas a preguntas y encuestas, estas nuevas herramientas prometen permitir a los profesionales del marketing realizar investigaciones y experimentos sin la carga de tiempo, costo y participación que implican las entrevistas o encuestas tradicionales. De esta forma, ambas herramientas complementan lo que denominamos el enfoque del "oráculo" para el uso de la IA en marketing, en el que los investigadores simplemente le hacen a un modelo lineal general (MLG) una pregunta básica de interés (por ejemplo, "¿Cuál es el tamaño del mercado potencial para este producto?") y esperan obtener una respuesta que pueda fundamentar la toma de decisiones.
En este artículo, analizaremos la naturaleza de cada herramienta, proporcionaremos algunos ejemplos de cómo las utilizan las empresas actualmente y, a continuación, ofreceremos una guía paso a paso a los líderes sobre cómo desenvolverse en este espacio complejo y apasionante.
La Persona Sintética
En este enfoque, investigadores, especialistas en marketing, gerentes de producto e incluso vendedores proporcionan a un modelo de IA información demográfica, psicográfica o conductual sobre un tipo o segmento de clientes para crear un perfil representativo. Luego, pueden pedirle al modelo que responda preguntas como si se tratara de ese tipo de persona. Quienes apoyan este enfoque suelen señalar que muchas, si no la mayoría, de las decisiones estratégicas de producto y marketing se basan en la información combinada de un segmento, en lugar de en la de individuos.
Los investigadores pueden obtener respuestas de estas personas sintéticas de diversas maneras. En una de ellas, que denominamos enfoque descendente, se les pide a las personas sintéticas que generen una estimación puntual o un rango para un segmento; por ejemplo, preguntando: "¿Cuál sería la disposición promedio a pagar de este segmento por el producto?". Se trata de una especie de superagente de IA, en el que siempre se puede confiar para obtener la única respuesta "óptima". Alternativamente, en lo que llamamos enfoque ascendente, se obtiene un rango de respuestas mediante la creación de una población completa de personas de consumidores simuladas que se ajustan a los criterios de segmentación. Este grupo de personas sintéticas a veces se denomina "muestra de silicio". No se trata de superagentes optimizados para proporcionar la respuesta "óptima" para el segmento; en cambio, están diseñados para variar intencionalmente de un individuo a otro, al igual que las personas dentro de cualquier segmento de mercado. Los investigadores pueden entonces formular preguntas a estas poblaciones y agregar sus respuestas, tal como se hace en la investigación de mercado tradicional.
Según nuestras observaciones y la colaboración con nuestros clientes, muchos investigadores se sienten más cómodos con el enfoque ascendente que con el descendente. ¿Por qué? Porque existe variabilidad en las respuestas y, en general, el proceso se asemeja más al de la investigación de mercado tradicional. (Investigaciones académicas recientes demuestran que las personas tienden a preferir algoritmos que realizan predicciones de forma similar al proceso que pretenden simular). Sin embargo, aún queda por determinar cuál de los dos enfoques funciona mejor y para qué fines.
Para los investigadores interesados en modelar las diferencias entre consumidores, ¿por qué no intentar replicar el comportamiento único de individuos reales para captar plenamente la heterogeneidad del mercado? De esto tratan los gemelos digitales, que se describen a continuación.
El gemelo digital
Este enfoque va más allá de los segmentos compuestos y las personas ficticias, y aplica datos a nivel individual. Si una empresa dispone de datos detallados a nivel individual sobre un grupo de clientes, obtenidos a partir de interacciones, encuestas o entrevistas anteriores, por ejemplo, podría utilizarlos para crear gemelos digitales de estas personas, quienes podrían participar en encuestas virtuales, «entrevistas» cualitativas e incluso experimentos en lugar de los individuos a los que representan. Esto tiene muchas aplicaciones potenciales interesantes, pero también algunas implicaciones éticas importantes. Dado el estado actual de la investigación en este campo, es posible que alguien ya haya creado un gemelo digital básico tuyo y lo esté utilizando para optimizar y personalizar materiales de venta o mensajes de marketing.
Algunos de los trabajos más ambiciosos en el campo de los gemelos digitales se están llevando a cabo en la Escuela de Negocios de Columbia (CBS), donde uno de nosotros (Olivier) colabora con colegas en la Iniciativa de Gemelos Digitales (DTI). El equipo de la DTI, cuyo trabajo es de código abierto, ha creado hasta la fecha más de 2000 gemelos digitales de personas reales, a partir de sus respuestas a cuatro rondas de encuestas con más de 500 preguntas que abarcan una combinación de medidas demográficas, psicológicas, de economía conductual, de personalidad y cognitivas estándar. Tras evaluar diversos enfoques para la construcción de los gemelos con los datos subyacentes, el equipo de CBS descubrió que sus mejores gemelos tenían una precisión relativa del 88 % en comparación con sus contrapartes humanas en una prueba de fiabilidad test-retest, un resultado muy prometedor. Sin embargo, al mismo tiempo, los gemelos digitales solo replicaron aproximadamente la mitad de los efectos experimentales observados en humanos al replicar 17 experimentos de economía conductual bien conocidos, lo que sugiere que se justifica realizar más pruebas.
Con esta base inicial, el equipo de Columbia decidió profundizar en el tema, realizando 19 estudios adicionales en diversos ámbitos, probando tanto a los individuos como a sus gemelos digitales. Estos estudios se seleccionaron por ser representativos de los casos de uso en los que podrían implementarse los gemelos digitales en la actualidad. Posteriormente, el equipo llevó a cabo un metaanálisis que identificó áreas de potencial para los gemelos digitales, en particular, cuestiones relevantes para las interacciones sociales (por ejemplo, la equidad de diversas decisiones publicitarias o de precios, la captura del impacto de los rasgos de personalidad en las decisiones de compra) o las interacciones entre humanos y tecnología (por ejemplo, el comportamiento del consumidor en las plataformas tecnológicas).
El metaanálisis también identificó algunas limitaciones importantes. Por ejemplo, los gemelos digitales fueron menos capaces de captar la diversidad de opiniones humanas en el ámbito político y tendieron a proporcionar respuestas socialmente deseables. Asimismo, mostraron una interesante combinación de sesgo «prohumano» (por ejemplo, una mayor tendencia que sus contrapartes humanas a creer que las personas son justas y dignas de confianza) y sesgo «protecnológico» (por ejemplo, una mayor aceptación de la contratación algorítmica y una mayor tolerancia a la publicidad dirigida en línea). Además, fueron ligeramente más precisos al predecir las respuestas de participantes con mayor nivel educativo, mayores ingresos y una ideología moderada.
¿Cómo se comparó el rendimiento de los gemelos digitales con el de las personas sintéticas? Los investigadores compararon sus gemelos digitales con personas sintéticas, basándose en un amplio conjunto de características demográficas, en los 19 estudios. Los gemelos digitales lograron captar mejor las variaciones entre los participantes, según la correlación entre las respuestas reales y las simuladas. Si bien la correlación fue moderada (0,2 en promedio), análisis adicionales sugieren que no sería realista esperar una correlación superior a 0,3 en este contexto. En cuanto a la predicción de las respuestas exactas de los participantes (medida en precisión), los gemelos digitales y las personas sintéticas obtuvieron un 75 % de precisión. Esto sugiere que, si bien la rica información individual que contienen los gemelos digitales ayuda a captar las variaciones entre las personas, no necesariamente contribuye a predecir cada respuesta individual con mayor precisión.
En definitiva, el equipo de CBS concluyó que “si bien los gemelos digitales son prometedores, todavía no están completamente listos para el horario estelar”.
Esta discusión pone de manifiesto un problema que a menudo no recibe la atención suficiente: puede que no sea obvio cómo evaluar la calidad de los datos sintéticos. Si los gerentes tienen acceso a datos a nivel individual, pueden estimar la precisión midiendo la similitud de cada respuesta sintética con su contraparte humana. Alternativamente, pueden evaluar la correlación, es decir, hasta qué punto las variaciones entre las respuestas sintéticas reflejan las variaciones entre las respuestas humanas. Si los gerentes no tienen acceso a datos a nivel individual para comparar cada respuesta sintética con su contraparte humana, pueden estimar la precisión de la respuesta sintética promedio o comparar la variación general entre las respuestas sintéticas y las humanas. Algunos gerentes podrían estar más interesados en saber si basarse en datos sintéticos conduciría a las mismas decisiones o a decisiones diferentes, pero actualmente no contamos con métricas bien establecidas para tal evaluación.
Cómo empezar
El ámbito académico y la industria apenas comienzan a aprender a aprovechar la IA de última generación para obtener información estratégica. Este campo avanza rápidamente, pero probablemente pasará algún tiempo antes de que comprendamos a fondo qué funciona, para qué propósito y por qué; por lo tanto, en un futuro próximo, prevemos que la investigación tradicional seguirá siendo el método principal para obtener información.
Dicho esto, ahora es el momento para que las empresas comiencen a experimentar y probar posibles casos de uso para comprender cómo los modelos de aprendizaje automático (LLM) y los datos sintéticos pueden complementar y mejorar su proceso de toma de decisiones. A continuación, les mostramos cómo recomendamos hacerlo.
1. Determine su caso de uso. Es fundamental tener presente el objetivo final: ¿Busca una estimación puntual de un segmento clave (p. ej., probabilidad de compra) o desea comprender cómo las personas valoran de forma diferente ciertas características del producto? ¿Intenta complementar los resultados de una encuesta tradicional con personas de difícil acceso? ¿Necesita únicamente resultados cuantitativos o busca también información cualitativa?
2. Determine el tipo de consumidores que desea simular. ¿Desea comprender mejor el punto de vista promedio o compuesto de un segmento específico (por ejemplo, un director financiero de una empresa manufacturera, un joven universitario), donde una persona sintética podría ser útil? ¿O busca obtener retroalimentación de un consumidor o grupo de consumidores específico (por ejemplo, 500 madres del medio oeste estadounidense de entre 24 y 36 años), donde podría valer la pena el esfuerzo y el costo adicionales de crear gemelos digitales que capturen las variaciones y los matices tanto dentro de cada segmento como entre ellos?
3. Obtenga los datos necesarios para calibrar las personas o gemelos. Esto puede ser un factor limitante para algunas opciones. Si dispone de una gran cantidad de datos históricos sobre consumidores específicos, la creación de gemelos digitales se convierte en una opción más viable. Sin embargo, si solo dispone de datos agregados o de acceso público, las personas sintéticas podrían ser una opción más realista. En cualquier caso, deberá experimentar con sus gemelos o personas para evaluar la cantidad de datos necesarios y determinar si existe un exceso.
4. Defina métricas de rendimiento claras y precisas. Aunque resulte tentador tratar las métricas de rendimiento como intercambiables, no lo son, y la elección de la métrica influirá en las conclusiones que se extraigan de los datos. Por lo tanto, para evitar la selección sesgada de datos a posteriori, recomendamos encarecidamente a los investigadores que se comprometan con un conjunto de métricas antes de recopilar los datos.
5. Realiza una pequeña prueba. Idealmente, esta prueba debería ser representativa de su caso de uso y debería ejecutarse con una muestra de participantes humanos que sean representativos de sus clientes. Estos datos proporcionan una medida de referencia con la que comparará los datos sintéticos.
6. Evalúe el rendimiento de sus personas sintéticas o gemelos digitales. Compara tus datos sintéticos con esa medida de referencia. Asegúrate de incluir puntos de referencia relevantes que te ayuden a contextualizar los resultados. Por ejemplo, ¿qué tan bien funciona un punto de referencia aleatorio? ¿Y otros puntos de referencia más simples que utilizan menos datos a nivel individual? Una medida absoluta de rendimiento (p. ej., 80 % de precisión) no es tan útil como una comparación entre puntos de referencia relevantes, lo que te permite explorar la relación entre costo/complejidad y rendimiento.
7. Decide si quieres escalar. En esta etapa del proceso, tendrá una visión integral del potencial de los datos sintéticos para su caso de uso. Un análisis de costo-beneficio le permitirá decidir si vale la pena incluir datos sintéticos en su proceso de investigación.
8. Realice pruebas periódicas para garantizar la validez continua y mantener sus datos actualizados. Por ejemplo, puede resultar útil realizar periódicamente estudios paralelos con las personas reales que conforman su panel de gemelos digitales para garantizar un rendimiento continuo y complementar sus datos de entrenamiento con datos humanos actualizados.
...
Dado el creciente interés en este ámbito, sin duda veremos un mayor interés en las personas sintéticas y los gemelos digitales. Puede que aún no estén del todo listos para su uso generalizado, pero lo estarán pronto, y cuando lo estén, probablemente revolucionarán el mundo del marketing. Por lo tanto, las empresas inteligentes deberían empezar a experimentar con ellos e invertir en ellos ahora mismo.
Lee más sobre marketing o temas relacionados: IA generativa, investigación de mercado, comportamiento del consumidor, experimentación, innovación disruptiva, IA y aprendizaje automático, segmentación de mercado, gestión de datos y análisis y ciencia de datos.
Jeremy Korst es el fundador de Mindspan Labs, una consultora e incubadora especializada en transformación digital mediante IA. Anteriormente ocupó altos cargos ejecutivos en Microsoft y T-Mobile. También es socio de GBK Collective, firma que ofrece análisis estratégicos a marcas globales. Es coautor del estudio anual de la Escuela Wharton sobre la adopción de IA en las empresas.
Stefano Puntoni es profesor de marketing en la Escuela Wharton de la Universidad de Pensilvania y codirector de Wharton Human-AI Research. Es uno de los principales científicos del comportamiento que estudian las aplicaciones empresariales de la IA.
Olivier Toubia Es profesor de marketing en la Escuela de Negocios de Columbia y un líder reconocido en el campo del marketing cuantitativo.
No hay comentarios:
Publicar un comentario