Logotipo de Zephyrnet

Resumen de promesas y trampas - Primera parte » Blog CCC

Fecha:

La CCC apoyó tres sesiones científicas en la Conferencia Anual de la AAAS de este año y, en caso de que no pudiera asistir en persona, recapitularemos cada sesión. Esta semana resumiremos los aspectos más destacados de la sesión “.IA generativa en la ciencia: promesas y trampas.” En la primera parte, resumiremos la introducción y la presentación de la Dra. Rebecca Willett.

El primer panel AAAS de la CCC de la reunión anual de 2024 tuvo lugar el viernes 16 de febrero, segundo día de la conferencia. El panel, moderado por el propio CCC Dr. Mateo Turco, presidente del Instituto Tecnológico Toyota de Chicago, estaba compuesto por expertos que aplican la inteligencia artificial a diversos campos científicos. Dra. Rebeca Willett, profesora de estadística e informática en la Universidad de Chicago, centró su presentación en cómo se pueden utilizar los modelos generativos en las ciencias y por qué los modelos disponibles en el mercado no son suficientes para aplicarlos a la investigación científica. Dr. Markus Bühler, profesor de ingeniería en el Instituto de Tecnología de Massachusetts, habló sobre los modelos generativos aplicados a la ciencia de los materiales, y Dr. Duncan Watson-Parris, profesor asistente en el Instituto Scripps de Oceanografía y el Instituto de Ciencia de Datos Halıcıoğlu en UC San Diego, analizó cómo se pueden utilizar los modelos generativos en el estudio de las ciencias climáticas.

El Dr. Turk, experto en visión por computadora e interacción persona-computadora, comenzó el panel distinguiendo la IA generativa de toda la IA. "En el centro de las aplicaciones de IA generativa se encuentran los modelos generativos compuestos de redes neuronales profundas que aprenden la estructura de sus voluminosos datos de entrenamiento y luego generan nuevos datos basados ​​en lo que han aprendido".

El Dr. Turk también describió las preocupaciones populares con los sistemas generativos, tanto debido a fallas de los propios sistemas, como aquellos que citan escritos legales inexistentes, como también debido a su uso por parte de malos actores para generar contenido falso, como audio o audio falso. Vídeo de políticos o famosos.

"Específicamente", dijo el Dr. Turk, "esta sesión se centrará en el uso de la IA generativa en la ciencia, como fuerza transformadora en la búsqueda de la ciencia y también como un riesgo potencial de disrupción".

La Dra. Rebecca Willett comenzó su presentación describiendo cómo se puede aprovechar la IA generativa para respaldar el proceso de descubrimiento científico. Primero se centró en cómo funcionan los modelos generativos. La siguiente imagen de las diapositivas del Dr. Willett muestra cómo un modelo de lenguaje, como ChatGPT, evalúa la probabilidad de que aparezca una palabra, dado un conjunto previo de palabras, y cómo un modelo de generación de imágenes, como DALL-E 2, genera una imagen. a partir de un mensaje determinado utilizando distribuciones de probabilidad aprendidas de miles de millones de imágenes durante el entrenamiento.

“Utilizando este principio de distribuciones de probabilidad, que subyace a todos los modelos generativos, estos modelos se pueden aplicar a ideas científicas de gran alcance, como generar posibles escenarios climáticos dado el clima actual y las políticas potenciales, o generar nuevos microbiomas con funcionalidades específicas, como uno que es particularmente eficaz para descomponer los plásticos”, dice el Dr. Willett.

Sin embargo, no basta con utilizar herramientas generativas disponibles en el mercado, como ChatGPT o DALL-E 2 para la investigación científica. Estas herramientas se crearon en un entorno muy diferente al contexto en el que operan los científicos. Una diferencia obvia entre un modelo generativo estándar y un modelo científico son los datos. En ciencia, a menudo hay muy pocos datos en los que basar las hipótesis. Los datos científicos suelen surgir de simulaciones y experimentos, los cuales suelen ser costosos y requieren mucho tiempo. Debido a estas limitaciones, los científicos tienen que elegir cuidadosamente qué experimentos realizar y cómo maximizar la eficiencia y utilidad de estos sistemas. Los modelos estándar, por el contrario, dan mucha menos importancia al origen de los datos y prefieren maximizar la cantidad de datos con los que pueden operar. En ciencia, la precisión de los conjuntos de datos y sus orígenes son increíblemente importantes, porque los científicos necesitan justificar su investigación con evidencia empírica sólida.

"Además, en las ciencias, nuestros objetivos son diferentes a simplemente producir cosas que sean plausibles", dice el Dr. Willett. "Debemos comprender cómo funcionan las cosas fuera del alcance de lo que hemos observado hasta ahora". Este enfoque está en desacuerdo con los modelos de IA generativa que tratan los datos como representativos de toda la gama de observaciones probables. La incorporación de modelos físicos y restricciones a la IA generativa ayuda a garantizar que represente mejor los fenómenos físicos.

Los modelos científicos también deben ser capaces de capturar eventos raros. “Podemos ignorar con seguridad muchos eventos raros cuando entrenamos ChatGPT, pero, por el contrario, los eventos raros suelen ser lo que más nos importa en el contexto de las ciencias, como en un modelo climático que predice eventos climáticos raros. Si utilizamos un modelo generativo que evita eventos raros y, por ejemplo, nunca predice un huracán, entonces este modelo no será muy útil en la práctica”.

Un desafío relacionado es el desarrollo de modelos generativos de IA para procesos caóticos, que sean sensibles a las condiciones iniciales. El Dr. Willett mostró el vídeo a continuación, que muestra dos partículas moviéndose en el espacio según las ecuaciones de Lorenz 63. Estas ecuaciones son deterministas, no aleatorias, pero dadas dos ubicaciones iniciales ligeramente diferentes, se puede ver que en cualquier momento dado las dos partículas pueden estar en ubicaciones muy diferentes. Desarrollar modelos de IA generativa que predigan el curso exacto de tales procesos, que surgen en la ciencia climática, la turbulencia y la dinámica de redes, es fundamentalmente difícil, pero enfoques novedosos para el modelado generativo pueden garantizar que los procesos generados compartan características estadísticas clave con datos científicos reales.

[Contenido incrustado]

Finalmente, el Dr. Willett abordó el hecho de que los datos científicos a menudo abarcan una enorme gama de escalas espaciales y temporales. Por ejemplo, en la ciencia de los materiales, los investigadores estudian materiales en la escala nanométrica para monímeros hasta sistemas a gran escala, como un avión completo. "Ese rango de escalas es muy diferente de los datos utilizados en los modelos disponibles, y debemos considerar cómo estamos construyendo estos modelos generativos de una manera que afecte con precisión estas interacciones entre escalas".

"Los modelos generativos son el futuro de la ciencia", dice el Dr. Willett, "pero para garantizar que se utilicen de forma eficaz, debemos realizar avances fundamentales en la IA e ir más allá de conectar datos a ChatGPT".

Muchas gracias por leer y sintonice mañana para leer el resumen de la presentación del Dr. Markus Buehler sobre IA generativa en mecanobiología.

punto_img

Información más reciente

punto_img