Doxa 1463

Agregar más datos no es la única forma de mejorar la IA.

Por Pushkar P. Apte y Costas J. Spanos
IA y aprendizaje automático
Harvard Business Review

#doxa #datos #IA #aprendizaje #sinergia #conocimiento #expertos #modelos #comportamiento #predecir #tecnología #ciencia
Resumen. A veces, un sistema basado en IA no puede descifrar el mundo físico con un grado suficiente de precisión y la opción de simplemente agregar más datos no es posible. Sin embargo, en muchos de estos casos, esta deficiencia se puede abordar mediante el uso de cuatro técnicas para ayudar a la IA a comprender mejor el mundo físico: sinergizar la IA con leyes científicas, aumentar los datos con conocimientos humanos expertos, emplear dispositivos para explicar cómo la IA toma decisiones y usar otros modelos para predecir el comportamiento.
La inteligencia artificial (IA) obtiene su "inteligencia" al analizar un conjunto de datos determinado y detectar patrones. No tiene un concepto del mundo más allá de este conjunto de datos, lo que crea una variedad de peligros.

Un píxel modificado podría confundir al sistema de IA para que piense que un caballo es una rana o, lo que es más aterrador, errar en un diagnóstico médico o en una operación de máquina. Su dependencia exclusiva de los conjuntos de datos también presenta una vulnerabilidad de seguridad grave: los agentes maliciosos pueden falsificar el algoritmo de IA al introducir cambios menores, casi imperceptibles en los datos. Finalmente, el sistema de IA no sabe lo que no sabe y puede hacer predicciones incorrectas con un alto grado de confianza.

Agregar más datos no siempre puede superar estos problemas porque las restricciones técnicas y comerciales prácticas siempre limitan la cantidad de datos. Y el procesamiento de grandes conjuntos de datos requiere modelos de IA cada vez más grandes que están superando al hardware disponible y aumentando la huella de carbono de la IA de manera insostenible.

Hemos identificado un remedio alternativo: conectar la IA basada en datos con otros aportes científicos o humanos sobre el dominio de la aplicación. Se basa en nuestras dos décadas de experiencia en el Centro de Investigación de Tecnología de la Información en Interés de la Sociedad de la Universidad de California y el Instituto Banatao (CITRIS) trabajando con académicos y ejecutivos de empresas para implementar IA para muchas aplicaciones. Hay cuatro maneras en que se puede hacer.

1. Sinergizar la IA con las leyes científicas

Podemos combinar los datos disponibles con las leyes relevantes de la física, la química y la biología para aprovechar las fortalezas y superar las debilidades de cada una. Un ejemplo es un proyecto en curso con Komatsu en el que estamos explorando cómo usar la IA para guiar la operación autónoma y eficiente de los equipos de excavación pesados. AI funciona bien en el funcionamiento de la máquina, pero no tan bien en la comprensión del entorno circundante.

Por lo tanto, para enseñarle al algoritmo de IA las diferencias entre suelo blando, grava y roca dura en el terreno excavado, usamos modelos basados ​​en la física que describen el tamaño, la distribución, la dureza y el contenido de agua de las partículas. Equipada con este conocimiento, la máquina impulsada por IA puede aplicar la cantidad justa de fuerza para agarrar un cubo lleno de tierra de manera eficiente y segura. De manera similar, usamos IA para operar un brazo quirúrgico robótico y luego lo combinamos con un modelo basado en la física que predice cómo la piel y el tejido se deformarán bajo presión. En ambos casos, ya sea tierra o tejido, la combinación de modelos basados ​​en datos y basados ​​en la física hace que la operación sea más segura, rápida y eficiente.

2. Aumente los datos con conocimientos humanos expertos

Cuando los datos disponibles son limitados, la intuición humana se puede utilizar para aumentar y mejorar la "inteligencia" de la IA. Por ejemplo, en el campo de la fabricación avanzada, es extremadamente costoso y desafiante desarrollar nuevas "recetas de proceso" necesarias para construir un nuevo producto. Los datos sobre procesos novedosos son limitados o simplemente no existen y generarlos requeriría muchos intentos de prueba y error que pueden llevar muchos meses y costar millones de dólares.

Una forma más efectiva es hacer que los humanos y la IA se aumenten y se apoyen mutuamente, según Lam Research, un fabricante líder de equipos de semiconductores que suministra instalaciones de fabricación de microelectrónica de última generación. Comenzando desde cero, los ingenieros altamente experimentados suelen hacer bien en llegar a una receta aproximadamente correcta, mientras que la IA recopila datos continuamente y aprende de esos esfuerzos. Una vez que la receta está en el estadio de béisbol, los ingenieros pueden recurrir a la IA para ayudarlos a ajustarla a un punto óptimo preciso. Dichas técnicas pueden proporcionar hasta un orden de magnitud de mejora en la eficiencia.

3. Emplear dispositivos para explicar cómo la IA toma decisiones

En la novela de ciencia ficción La guía del autoestopista galáctico, la computadora más inteligente dio 42 como respuesta a "la vida, el universo y todo", lo que provocó la risa de muchos lectores. Sin embargo, no es motivo de risa para las empresas, porque la IA a menudo funciona como una caja negra que hace recomendaciones seguras sin explicar por qué. Si la forma en que la IA toma decisiones no se puede explicar, por lo general no es procesable. Un médico no debe hacer un diagnóstico médico y un ingeniero de servicios públicos no debe apagar una parte crítica de la infraestructura en función de una recomendación de IA que no pueden explicar de forma intuitiva.

Por ejemplo, estamos trabajando en una aplicación de infraestructura inteligente donde los sensores monitorean la integridad de miles de turbinas eólicas. El algoritmo de IA que analiza estos datos puede arrojar una bandera roja cuando detecta un patrón de aumento de temperatura o intensidad de vibración. Pero ¿qué significa esto? ¿Es solo un día caluroso o una ráfaga de viento fuerte? ¿O es necesario que una cuadrilla de servicios públicos se retire inmediatamente (una operación costosa)?

Nuestra solución: agregar sensores de fibra óptica para medir la tensión física real en el material de la turbina. Luego, cuando los ingenieros de servicios públicos cotejen la bandera roja de la IA con la tensión real en el álabe de la turbina, pueden determinar la verdadera urgencia del problema y elegir la acción correctiva más segura.

4. Usa otros modelos para predecir el comportamiento

La IA basada en datos funciona bien dentro de los límites del conjunto de datos que ha procesado, analizando el comportamiento entre las observaciones reales o la interpolación. Sin embargo, para extrapolar, es decir, para predecir el comportamiento en modos operativos fuera de los datos disponibles, debemos incorporar el conocimiento del dominio en cuestión. De hecho, este es a menudo el enfoque adoptado por muchas aplicaciones que emplean " gemelos digitales " para reflejar el funcionamiento de un sistema complejo como un motor a reacción. Un gemelo digital es un modelo dinámico que refleja el estado exacto de un sistema real en todo momento y utiliza sensores para mantener el modelo actualizado en tiempo real.

Usamos esto de manera efectiva en nuestro proyecto con Siemens Technologysobre gemelos digitales para edificios inteligentes. Empleamos IA basada en datos para modelar y controlar el funcionamiento normal del edificio y para diagnosticar problemas. Luego, mezclamos juiciosamente ecuaciones basadas en la física, como ecuaciones termodinámicas básicas que rastrean el flujo de calor hacia el sistema de aire acondicionado y los espacios habitables, para predecir el comportamiento del edificio en un entorno novedoso. Usando este enfoque, pudimos predecir el comportamiento del edificio con diferentes equipos de calefacción o refrigeración o mientras opera bajo condiciones climáticas inusuales. Esto nos permitió probar modos operativos alternativos sin poner en peligro la infraestructura crítica o sus usuarios. Descubrimos que este enfoque también funciona bien en otras aplicaciones, como la fabricación inteligente, la construcción y los vehículos autónomos, desde automóviles hasta naves espaciales.

Como humanos, entendemos el mundo que nos rodea usando nuestros sentidos en conjunto. Dada una taza humeante, determinamos instantáneamente que es té por su color, olor y sabor. Los conocedores pueden ir un paso más allá e identificarlo como un té de "primera descarga de Darjeeling". Los algoritmos de IA están entrenados, y están limitados, por un conjunto de datos en particular y no tienen acceso a todos los "sentidos" como nosotros. Un algoritmo de IA entrenado solo en imágenes de tazas de café puede "ver" esta misma taza de té humeante y concluir que es café. Peor aún, ¡puede hacerlo con un alto grado de confianza!

Cualquier conjunto de datos disponible siempre estará incompleto, y el procesamiento de conjuntos de datos cada vez más grandes a menudo no es práctico ni ambientalmente sostenible. En cambio, agregar otras formas de comprensión del dominio en cuestión puede ayudar a que la IA basada en datos sea más segura y eficiente y permitirle abordar desafíos que de otro modo no podría.

Pushkar P. Apte es el director de iniciativas estratégicas de la Universidad de California para la Investigación de Tecnologías de la Información en el Interés de la Sociedad y el Instituto Banatao (CITRIS). También es asesor de tecnología estratégica en SEMI, una asociación mundial de la industria de la microelectrónica, y lidera su iniciativa Smart Data-AI.

Costas J. Spanos es director del Centro de Investigación de Tecnologías de la Información en Interés de la Sociedad de la Universidad de California y del Instituto Banatao (CITRIS). También es Profesor Distinguido Andrew S. Grove de Ingeniería Eléctrica y Ciencias de la Computación en la Universidad de California, Berkeley, y director ejecutivo de Berkeley Education Alliance for Research en Singapur (BEARS).

 

No hay comentarios:

Publicar un comentario