제퍼넷 로고

약속과 함정 요약 – 1부 » CCC 블로그

시간

CCC는 올해 AAAS 연례 회의에서 세 가지 과학 세션을 지원했으며, 직접 참석하지 못한 경우 각 세션을 요약해 드리겠습니다. 이번 주에는 세션의 하이라이트를 요약해 보겠습니다.과학에서의 생성적 AI: 약속과 함정.” 1부에서는 Rebecca Willett 박사의 소개와 발표를 요약해 보겠습니다.

2024년 연례 회의의 CCC 첫 번째 AAAS 패널이 회의 둘째 날인 16월 XNUMX일 금요일에 열렸습니다. CCC가 직접 중재하는 패널 매튜 터크 박사시카고 토요타 기술연구소(Toyota Technological Institute) 소장은 다양한 과학 분야에 인공지능을 적용하는 전문가들로 구성됐다. 레베카 윌렛 박사시카고 대학의 통계 및 컴퓨터 과학 교수인 는 생성 모델이 과학에서 어떻게 사용될 수 있는지, 그리고 기성 모델이 과학 연구에 적용하기에 충분하지 않은 이유에 대해 프레젠테이션의 초점을 맞췄습니다. 마르쿠스 뷸러 박사MIT 공과대학 교수는 재료 과학에 적용되는 생성 모델에 대해 강연했습니다. 던컨 왓슨-패리스 박사, Scripps 해양학 연구소 및 UC San Diego Halıcıoğlu 데이터 과학 연구소의 조교수, 기후 과학 연구에 생성 모델이 어떻게 사용될 수 있는지 논의했습니다.

컴퓨터 비전 및 인간-컴퓨터 상호 작용 전문가인 Turk 박사는 모든 AI와 생성형 AI를 구별하는 것으로 패널을 시작했습니다. "생성 AI 애플리케이션의 핵심에는 방대한 훈련 데이터의 구조를 학습한 다음 학습한 내용을 기반으로 새로운 데이터를 생성하는 심층 신경망으로 구성된 생성 모델이 있습니다."

Turk 박사는 또한 존재하지 않는 법적 서류를 인용하는 시스템 자체의 실패와 악의적인 행위자가 이를 사용하여 가짜 오디오 또는 가짜 콘텐츠를 생성하는 등 생성 시스템에 대한 대중적인 우려를 설명했습니다. 정치인이나 유명인의 동영상.

Turk 박사는 "구체적으로 이번 세션에서는 과학 추구에 ​​있어 변혁적인 힘이자 혼란의 잠재적 위험인 생성 AI의 활용에 초점을 맞출 것"이라고 말했습니다.

Rebecca Willett 박사는 생성 AI를 활용하여 과학적 발견 프로세스를 지원하는 방법을 설명하면서 프레젠테이션을 시작했습니다. 그녀는 먼저 생성 모델이 작동하는 방식에 중점을 두었습니다. Willett 박사 슬라이드의 아래 이미지는 ChatGPT와 같은 언어 모델이 이전 단어 집합을 고려하여 단어 발생 확률을 평가하는 방법과 DALL-E 2와 같은 이미지 생성 모델이 이미지를 생성하는 방법을 보여줍니다. 훈련 중 수십억 개의 이미지에서 학습된 확률 분포를 사용하여 주어진 프롬프트에서

“모든 생성 모델의 기초가 되는 확률 분포의 원리를 사용하여 이러한 모델은 현재 기후 및 잠재적 정책을 고려하여 가능한 기후 시나리오를 생성하거나 다음과 같은 목표 기능을 갖춘 새로운 미생물군집을 생성하는 등 과학 분야의 문샷 아이디어에 적용될 수 있습니다. 플라스틱을 분해하는 데 특히 효과적인 제품입니다.”라고 Willett 박사는 말합니다.

그러나 과학 연구를 위해 ChatGPT 또는 DALL-E 2와 같은 기성 생성 도구를 사용하는 것만으로는 충분하지 않습니다. 이러한 도구는 과학자들이 작업하는 환경과 매우 다른 환경에서 만들어졌습니다. 기성 생성 모델과 과학적 모델 사이의 한 가지 분명한 차이점은 데이터입니다. 과학에서는 가설의 기초가 되는 데이터가 거의 없는 경우가 많습니다. 과학 데이터는 일반적으로 시뮬레이션과 실험을 통해 나오며, 둘 다 비용과 시간이 많이 소요되는 경우가 많습니다. 이러한 제한으로 인해 과학자들은 실행할 실험과 이러한 시스템의 효율성과 유용성을 극대화하는 방법을 신중하게 선택해야 합니다. 이와 대조적으로 기성 모델은 작동할 수 있는 데이터의 양을 최대화하는 것보다 데이터의 출처에 대한 중요성을 훨씬 덜 둡니다. 과학에서는 데이터 세트의 정확성과 그 출처가 매우 중요합니다. 왜냐하면 과학자들은 강력한 경험적 증거로 연구를 정당화해야 하기 때문입니다.

“게다가 과학 분야에서 우리의 목표는 단순히 그럴듯한 것을 생산하는 것과는 다릅니다.”라고 Willett 박사는 말합니다. "우리는 지금까지 관찰한 범위를 벗어나 사물이 작동하는 방식을 이해해야 합니다." 이러한 접근 방식은 데이터를 가능한 관찰의 전체 범위를 대표하는 것으로 취급하는 생성 AI 모델과 상충됩니다. 물리적 모델과 제약 조건을 생성 AI에 통합하면 물리적 현상을 더 잘 표현할 수 있습니다.

과학적 모델은 또한 희귀한 사건을 포착할 수 있어야 합니다. “ChatGPT를 훈련할 때 많은 희귀 사건을 안전하게 무시할 수 있지만, 이와 대조적으로 희소한 기상 현상을 예측하는 기후 모델과 같은 과학의 맥락에서 우리가 가장 관심을 두는 것은 희귀 사건인 경우가 많습니다. 희귀한 사건을 피하고 예를 들어 허리케인을 전혀 예측하지 않는 생성 모델을 사용한다면 이 모델은 실제로는 그다지 유용하지 않을 것입니다.”

관련된 과제는 초기 조건에 민감한 혼란스러운 프로세스를 위한 생성적 AI 모델을 개발하는 것입니다. Willett 박사는 Lorenz 63 방정식에 따라 공간에서 움직이는 두 입자를 보여주는 아래 비디오를 표시했습니다. 이 방정식은 결정론적이며 무작위가 아닙니다. 그러나 두 개의 약간 다른 시작 위치가 주어지면 언제든지 두 입자가 매우 다른 위치에 있을 수 있음을 알 수 있습니다. 기후 과학, 난기류 및 네트워크 역학에서 발생하는 프로세스의 정확한 과정을 예측하는 생성 AI 모델을 개발하는 것은 근본적으로 어렵지만 생성 모델링에 대한 새로운 접근 방식을 통해 생성된 프로세스가 실제 과학 데이터와 주요 통계 특성을 공유하도록 보장할 수 있습니다.

[포함 된 콘텐츠]

마지막으로 Willett 박사는 과학 데이터가 종종 엄청난 범위의 공간적, 시간적 규모에 걸쳐 있다는 사실을 언급했습니다. 예를 들어 재료과학 분야에서 연구자들은 전체 비행기와 같은 대규모 시스템에 이르기까지 나노미터 규모의 재료를 연구합니다. "이러한 규모 범위는 기성 모델에서 사용되는 데이터와 매우 다르며, 규모 간 상호 작용에 정확하게 영향을 미치는 방식으로 이러한 생성 모델을 구축하는 방법을 고려해야 합니다."

Willett 박사는 "생성 모델은 과학의 미래입니다. 하지만 이를 효과적으로 사용하려면 AI를 근본적으로 발전시키고 데이터를 ChatGPT에 연결하는 것 이상을 이뤄야 합니다."라고 말합니다.

읽어주셔서 정말 감사합니다. 내일 시간을 내어 기계생물학 분야의 생성 AI에 관한 Markus Buehler 박사의 프레젠테이션 요약을 읽어보시기 바랍니다.

spot_img

최신 인텔리전스

spot_img