Zephyrnet Logo

Recapitulação de promessas e armadilhas – Parte Dois »CCC Blog

Data:

O CCC apoiou três sessões científicas na Conferência Anual da AAAS deste ano e, caso você não tenha podido comparecer pessoalmente, estaremos recapitulando cada sessão. Esta semana, resumiremos os destaques da sessão, “IA generativa na ciência: promessas e armadilhas.” Na Parte Dois, resumiremos a apresentação do Dr. Markus Buehler sobre IA Generativa em Mecanobiologia.

Dr. Markus Buehler iniciou sua apresentação abordando como modelos generativos podem ser aplicados no estudo da ciência dos materiais. Historicamente, na ciência dos materiais, os pesquisadores coletavam dados ou desenvolviam equações para descrever como os materiais se comportavam e as resolviam com papel e caneta. O surgimento dos computadores permitiu aos pesquisadores resolver essas equações com muito mais rapidez e tratar sistemas muito complexos, por exemplo, utilizando a mecânica estatística. Para alguns problemas, entretanto, o poder da computação tradicional não é suficiente. Por exemplo, a imagem abaixo mostra o número de configurações possíveis de uma única proteína pequena (20 ^100  ou 1.27×10^130 desenhos). Esta quantidade de configurações possíveis é maior que o número de átomos no universo observável (10^80 átomos) tornando este problema intratável até mesmo para os maiores supercomputadores. 

Antes dos modelos generativos, as equações e algoritmos criados pelos cientistas eram limitados por uma determinada característica compartilhada por todos os pesquisadores desde o início dos tempos: a humanidade. “A IA generativa permite-nos ir além da imaginação humana para que possamos inventar e descobrir coisas que não conseguimos até agora, seja porque não somos inteligentes o suficiente ou porque não temos a capacidade de ter acesso a todos os pontos de dados ao mesmo tempo”, diz o Dr. Buehler. “A IA generativa pode ser usada para identificar novas equações e algoritmos e pode resolvê-las para nós. Além disso, os modelos generativos também podem nos explicar como eles desenvolveram e resolveram essas equações, o que, em altos níveis de complexidade, é absolutamente necessário para que os pesquisadores entendam os “processos de pensamento” dos modelos.” Um aspecto fundamental de como esses modelos funcionam é traduzir informações (por exemplo, resultados de medições) em conhecimento, aprendendo uma representação gráfica delas.  

Fonte: MJ Buehler, Acelerando a descoberta científica com extração generativa de conhecimento, representação baseada em gráficos e raciocínio gráfico inteligente multimodal, arXiv, 2024

A figura abaixo mostra um novo design de material, um composto hierárquico baseado em micélio, construído a partir de IA generativa e apresentando uma combinação nunca antes vista de rizomorfos de micélio, colágeno, preenchimento mineral, funcionalização de superfície e uma interação complexa de porosidade e material. 

Fonte: MJ Buehler, Acelerando a descoberta científica com extração de conhecimento generativo, representação baseada em gráficos e raciocínio gráfico inteligente multimodal, arXiv, 2024. Esquerda: composto de Mycrlium. À direita: design de proteínas. 

Além disso, a IA generativa pode nos ajudar a visualizar sistemas complexos. Em vez de descrever interações entre átomos, a IA pode representar essas interações em gráficos, que descrevem mecanicamente como os materiais funcionam, se comportam e interagem em diferentes escalas. Essas ferramentas são poderosas, mas sozinhas não são fortes o suficiente para resolver a alta complexidade desses problemas. Para resolver isso, podemos combinar muitos modelos, como um modelo que pode fazer simulações físicas e outro que pode prever forças e tensões e como projetar proteínas. Quando esses modelos se comunicam, eles se tornam modelos agenciais, onde cada modelo individual é um agente com um propósito específico. A saída de cada modelo é comunicada aos outros modelos e considerada na avaliação global das saídas dos modelos. Os modelos Agentic podem executar simulações em dados existentes e gerar novos dados. Portanto, para áreas com dados limitados ou nulos, os pesquisadores podem usar modelos físicos para gerar dados para executar simulações. “Esse tipo de modelagem é uma das futuras áreas de crescimento para modelos generativos”, diz o Dr. Buehler. Esses tipos de modelos podem resolver problemas anteriormente considerados intratáveis ​​em supercomputadores, e alguns desses modelos podem até funcionar em um laptop padrão.

Um dos principais desafios na concepção de modelos generativos de IA inspirados na física, que os investigadores ainda estão a abordar, é como construir os modelos de forma elegante e como torná-los mais semelhantes ao cérebro humano ou aos sistemas biológicos. Os sistemas biológicos têm a capacidade de mudar seu comportamento, por exemplo, quando você corta a pele, o corte cicatriza com o tempo. Os modelos podem ser construídos para agir de forma semelhante. Em vez de treinar um modelo para curar um corte o tempo todo, podemos treiná-lo para ter a capacidade de remontá-lo para agir dinamicamente – em certo sentido, treinamos modelos para primeiro pensar sobre a pergunta feita e como eles podem ser capazes de reconfigurar 'eles mesmos' para melhor resolver uma determinada tarefa. Isto pode ser usado para fazer previsões quantitativas (por exemplo, resolver uma tarefa altamente complexa para prever o panorama energético de uma proteína), fazer previsões qualitativas e raciocinar sobre os resultados, e integrar diferentes conhecimentos e competências à medida que são desenvolvidas respostas a tarefas complexas. É importante ressaltar que os modelos também podem nos explicar como chegaram à solução, como funciona um determinado sistema e outros detalhes que podem ser de interesse do cientista humano. Podemos então realizar experimentos para prever e verificar os resultados dessas simulações para casos que sejam as ideias mais promissoras, como para aplicações de design de materiais.

Dr. Buehler falou então sobre aplicações específicas desses modelos generativos na ciência dos materiais. “Para calcular o cenário energético para resolver o problema de dobramento inverso dada uma determinada proteína, nem precisamos saber como é a proteína, só preciso saber os blocos de construção e a sequência de DNA que define esta proteína e as condições o o experimento é conduzido. Se você deseja um tipo específico de proteína com um determinado cenário energético, também podemos projetar essa proteína, sob demanda. Os modelos agênticos podem fazer isso porque têm a capacidade de combinar diferentes modelos, previsões e dados. Isto pode ser usado para sintetizar novas proteínas complexas que não existem na natureza. Podemos inventar proteínas que tenham fibras superfortes como substitutos dos plásticos, ou criar alimentos artificiais melhores ou novas baterias. Podemos usar a caixa de ferramentas da natureza para ir além do que a natureza tem a oferecer e ir muito além dos princípios evolutivos. Por exemplo, podemos projetar materiais para determinados fins, como materiais altamente elásticos ou com determinadas propriedades ópticas, ou materiais que alteram suas propriedades com base em sinais externos. Os modelos que estão a surgir agora não só são capazes de resolver estes problemas, mas também fornecem a capacidade de nos explicar como estes problemas são resolvidos. Eles também podem elucidar por que certas estratégias funcionam e outras não. Eles podem prever novas pesquisas, como pedir a um modelo que preveja detalhadamente como um determinado material se comportará, e podemos validar isso com estudos de pesquisa em laboratórios ou com simulações físicas. Isso é incompreensível e parece futurista, mas na verdade está acontecendo hoje.”

local_img

Café VC

Café VC

Inteligência mais recente

local_img