제퍼넷 로고

약속과 함정 요약 – 2부 » CCC 블로그

시간

CCC는 올해 AAAS 연례 회의에서 세 가지 과학 세션을 지원했으며, 직접 참석하지 못한 경우 각 세션을 요약해 드리겠습니다. 이번 주에는 세션의 하이라이트를 요약해 보겠습니다.과학에서의 생성적 AI: 약속과 함정.” 2부에서는 기계생물학 분야의 생성 AI에 관한 Markus Buehler 박사의 프레젠테이션을 요약합니다.

Markus Buehler 박사는 재료 과학 연구에서 생성 모델이 어떻게 적용될 수 있는지 설명하면서 프레젠테이션을 시작했습니다. 역사적으로 재료 과학 분야에서 연구자들은 재료의 거동을 설명하기 위해 데이터를 수집하거나 방정식을 개발하고 펜과 종이를 사용하여 문제를 해결했습니다. 컴퓨터의 출현으로 연구자들은 이러한 방정식을 훨씬 더 빠르게 풀 수 있었고, 예를 들어 통계 역학을 사용하여 매우 복잡한 시스템을 처리할 수 있었습니다. 그러나 일부 문제의 경우 기존 컴퓨팅 성능으로는 충분하지 않습니다. 예를 들어, 아래 이미지는 단일 작은 단백질의 가능한 구성 수를 보여줍니다(20 ^100  또는 1.27×10^130 디자인). 이 가능한 구성의 양은 관측 가능한 우주의 원자 수(10^)보다 많습니다.80 원자)는 심지어 가장 큰 슈퍼컴퓨터에서도 이 문제를 다루기 어렵게 만듭니다. 

생성 모델 이전에는 과학자들이 만든 방정식과 알고리즘은 태초부터 모든 연구자가 공유한 특정 특성, 즉 인류에 의해 제한되었습니다. “제너레이티브 AI를 사용하면 인간의 상상을 뛰어넘어 지금까지 우리가 충분히 똑똑하지 않거나 모든 데이터 포인트에 접근할 수 있는 능력이 없기 때문에 불가능했던 것을 발명하고 발견할 수 있습니다. 동시에”라고 Buehler 박사는 말합니다. “제너레이티브 AI는 새로운 방정식과 알고리즘을 식별하는 데 사용될 수 있으며 우리를 위해 이러한 방정식을 해결할 수 있습니다. 더욱이 생성 모델은 이러한 방정식을 어떻게 개발하고 해결했는지 설명할 수도 있습니다. 이는 높은 수준의 복잡성에서 연구자가 모델의 '사고 과정'을 이해하는 데 절대적으로 필요합니다.” 이러한 모델이 작동하는 방식의 주요 측면은 정보(예: 측정 결과)의 그래프 표현을 학습하여 지식으로 변환하는 것입니다.  

출처: MJ Buehler, 생성적 지식 추출, 그래프 기반 표현 및 다중 모드 지능형 그래프 추론을 통한 과학적 발견 가속화, arXiv, 2024

아래 그림은 생성적 AI로 구성되고 이전에 볼 수 없었던 균사체 뿌리줄기, 콜라겐, 광물 충전제, 표면 기능화 및 다공성과 재료의 복잡한 상호 작용의 조합을 특징으로 하는 계층적 균사체 기반 복합재인 새로운 재료 디자인을 보여줍니다. 

출처: MJ Buehler, 생성적 지식 추출, 그래프 기반 표현 및 다중 모드 지능형 그래프 추론을 통한 과학적 발견 가속화, arXiv, 2024. 왼쪽: Mycrlium 복합재. 오른쪽: 단백질 디자인. 

또한 생성 AI는 복잡한 시스템을 시각화하는 데 도움이 될 수 있습니다. AI는 원자 간의 상호 작용을 설명하는 대신 이러한 상호 작용을 그래프로 표현할 수 있습니다. 그래프는 재료가 다양한 규모에서 어떻게 기능하고, 행동하고, 상호 작용하는지 기계적으로 설명합니다. 이러한 도구는 강력하지만 단독으로는 이러한 문제의 높은 복잡성을 해결할 만큼 강력하지 않습니다. 이 문제를 해결하기 위해 우리는 물리 시뮬레이션을 수행할 수 있는 모델, 힘과 응력, 단백질 설계 방법을 예측할 수 있는 모델 등 다양한 모델을 결합할 수 있습니다. 이러한 모델이 통신하면 에이전트 모델이 되며, 각 개별 모델은 특정 목적을 가진 에이전트가 됩니다. 각 모델의 출력은 다른 모델에 전달되고 모델 출력의 전반적인 평가에서 고려됩니다. 에이전트 모델은 기존 데이터에 대해 시뮬레이션을 실행하고 새 데이터를 생성할 수 있습니다. 따라서 데이터가 제한적이거나 전혀 없는 영역의 경우 연구원은 물리 모델을 사용하여 시뮬레이션을 실행할 데이터를 생성할 수 있습니다. Buehler 박사는 “이러한 유형의 모델링은 생성 모델의 향후 성장 분야 중 하나입니다. 이러한 유형의 모델은 이전에 슈퍼컴퓨터에서는 다루기 힘든 것으로 간주되었던 문제를 해결할 수 있으며, 이러한 모델 중 일부는 표준 노트북에서도 실행될 수 있습니다.

연구자들이 여전히 다루고 있는 물리학에서 영감을 받은 생성 AI 모델을 설계하는 데 있어 주요 과제 중 하나는 모델을 우아하게 구축하는 방법과 이를 인간의 두뇌 또는 생물학적 시스템과 더 유사하게 만드는 방법입니다. 생물학적 시스템은 피부를 베었을 때 상처가 시간이 지남에 따라 치유되는 등 행동을 바꾸는 능력이 있습니다. 유사하게 작동하도록 모델을 구축할 수 있습니다. 항상 상처를 치유하도록 모델을 훈련시키는 대신, 모델을 재조립하여 동적으로 작동하도록 훈련할 수 있습니다. 어떤 의미에서 우리는 질문에 대해 먼저 생각하고 어떻게 재구성할 수 있는지 모델을 훈련시킵니다. 특정 작업을 가장 잘 해결하기 위해 '스스로'. 이는 정량적 예측(예: 단백질의 에너지 지형을 예측하기 위한 매우 복잡한 작업 해결), 정성적 예측 및 결과에 대한 추론, 복잡한 작업에 대한 답변이 개발됨에 따라 다양한 전문 지식과 기술을 통합하는 데 사용할 수 있습니다. 중요한 것은 모델이 솔루션에 어떻게 도달했는지, 특정 시스템이 어떻게 작동하는지, 인간 과학자가 관심을 가질 수 있는 기타 세부 사항을 우리에게 설명할 수도 있다는 것입니다. 그런 다음 재료 설계 응용 분야와 같이 가장 유망한 아이디어 사례에 대한 시뮬레이션 결과를 예측하고 검증하는 실험을 실행할 수 있습니다.

그런 다음 Buehler 박사는 재료 과학에서 이러한 생성 모델의 구체적인 적용에 대해 이야기했습니다. “특정 단백질이 주어졌을 때 역접힘 문제를 해결하기 위한 에너지 지형을 계산하려면 단백질이 어떻게 생겼는지 알 필요조차 없습니다. 단지 이 단백질을 정의하는 구성 요소와 DNA 서열, 그리고 단백질이 생성되는 조건만 알면 됩니다. 실험은 에서 수행됩니다. 특정 에너지 환경을 갖춘 특정 종류의 단백질을 원한다면 요청에 따라 해당 단백질을 디자인할 수도 있습니다. 에이전트 모델은 다양한 모델, 예측 및 데이터를 결합할 수 있는 능력을 갖추고 있기 때문에 이를 수행할 수 있습니다. 이는 자연에 존재하지 않는 복잡한 신규 단백질을 합성하는 데 사용될 수 있습니다. 우리는 플라스틱을 대체할 수 있는 초강력 섬유질을 가진 단백질을 발명할 수도 있고, 더 나은 인공 식품이나 새로운 배터리를 만들 수도 있습니다. 우리는 자연의 도구 상자를 사용하여 자연이 제공하는 것 이상으로 확장하고 진화 원리를 훨씬 뛰어넘을 수 있습니다. 예를 들어, 신축성이 높거나 특정 광학적 특성을 갖는 재료 또는 외부 단서에 따라 특성이 변경되는 재료와 같은 특정 목적을 위한 재료를 디자인할 수 있습니다. 현재 등장하고 있는 모델은 이러한 문제를 해결할 수 있을 뿐만 아니라 이러한 문제가 어떻게 해결되는지 설명할 수 있는 기능도 제공합니다. 또한 특정 전략은 효과가 있고 다른 전략은 효과가 없는 이유를 설명할 수도 있습니다. 그들은 특정 물질이 어떻게 행동할지 매우 자세하게 예측하기 위해 모델을 요청하는 것과 같은 새로운 연구를 예측할 수 있으며, 우리는 실험실 연구나 물리학 시뮬레이션을 통해 이를 검증할 수 있습니다. 이것은 놀랍고 미래 지향적으로 들리지만 실제로 오늘날 일어나고 있습니다.”

spot_img

최신 인텔리전스

spot_img