제퍼넷 로고

분자가 최고의 약물을 만들 것이라는 '직감'을 AI에 부여하는 방법

시간

직관과 AI는 이상한 짝을 이룬다.

직관은 설명하기 어렵습니다. 이유를 모르더라도 당신을 갉아먹는 것은 바로 직감입니다. 우리는 경험을 통해 자연스럽게 직관을 형성합니다. 직감이 항상 옳은 것은 아닙니다. 그러나 그들은 결정을 내릴 때 논리와 추론을 보충하기 위해 종종 우리의 잠재의식 속으로 스며듭니다.

이와 대조적으로 AI는 수백만 개의 엄밀한 데이터 포인트를 소화하여 신속하게 학습하고 입력을 기반으로 항상 합리적인 것은 아니지만 순전히 분석적인 결과를 생성합니다.

지금, 새로운 연구 in 자연 통신 이상한 쌍과 결합하여 약물 개발에 대한 화학자의 직관을 포착하는 기계 학습 시스템이 탄생합니다.

스위스에 본사를 둔 제약 회사인 Novartis의 화학자 35명의 피드백을 분석하여 팀은 악명 높은 약물 개발 단계인 인간의 생물학과 호환되는 유망한 화학 물질을 찾는 과정에서 인간의 전문 지식을 통해 학습하는 AI 모델을 개발했습니다.

첫째, 화학자들은 직관을 사용하여 5,000개의 화학 쌍 중에서 유용한 약물이 될 가능성이 더 높은 화학 쌍을 선택했습니다. 이 피드백을 통해 간단한 인공 신경망은 선호도를 학습했습니다. 새로운 화학물질에 도전했을 때 AI 모델은 각 화학물질에 약물로 추가 개발할 가치가 있는지 순위를 매긴 점수를 매겼습니다.

화학 구조 자체에 대한 세부 정보 없이 AI는 기존 약물에서 흔히 발생하는 특정 구조 구성 요소를 다른 것보다 "직관적으로" 높게 평가했습니다. 놀랍게도 이전 컴퓨터 모델링 시도에서 명시적으로 프로그래밍되지 않은 모호한 속성도 포착했습니다. 로봇 화학자는 DALL-E와 같은 생성 AI 모델과 결합하여 잠재적인 리드로 수많은 새로운 분자를 설계했습니다.

많은 유망한 약물 후보들이 “공동적 노하우”를 기반으로 했다고 팀은 썼습니다.

이 연구는 Novartis와 영국에 본사를 둔 Microsoft Research AI4Science 간의 협력으로 이루어졌습니다.

화학 토끼 구멍 아래로

우리가 매일 사용하는 의약품의 대부분은 진통제인 타이레놀, 당뇨병 관리를 위한 메트포르민, 박테리아 감염을 퇴치하는 항생제 등 작은 분자로 만들어집니다.

그러나 이러한 분자를 찾는 것은 고통스러운 일입니다.

첫째, 과학자들은 질병이 어떻게 작용하는지 이해해야 합니다. 예를 들어, 그들은 당신에게 극심한 두통을 일으키는 일련의 생화학 반응을 해독합니다. 그런 다음 그들은 종종 단백질인 사슬에서 가장 약한 고리를 찾아 그 모양을 모델링합니다. 손에 있는 구조를 통해 분자가 단백질의 기능을 방해할 수 있는 구석구석을 정확히 찾아내어 생물학적 과정을 중단시킵니다. 짜잔, 더 이상 두통이 없습니다.

덕분에 단백질 예측 AIAlphaFold, RoseTTAFold 및 그 파생물과 같은 표적 단백질의 구조를 모델링하는 것이 이제 더 쉬워졌습니다. 이에 맞는 분자를 찾는 것은 또 다른 문제입니다. 약물은 표적의 활동을 변경하는 데만 필요한 것이 아닙니다. 또한 쉽게 흡수되어 표적 기관이나 조직으로 확산되어야 하며, 안전하게 대사되어 체내에서 제거되어야 합니다.

여기가 의약화학자들이 들어오는 곳입니다. 이 과학자들은 컴퓨터 모델링 채택의 선구자입니다.. XNUMX여년 전부터 이 분야에서는 소프트웨어를 사용하여 유망한 단서를 찾기 위해 엄청난 양의 화학 물질 데이터베이스를 선별하기 시작했습니다. 각 잠재적인 리드는 추가 개발 전에 화학자 팀에 의해 평가됩니다.

이러한 과정을 통해 의약화학자들은 다음과 같은 직관을 구축하게 됩니다. 효율적으로 의사결정을 내릴 수 있도록 해준다. 유망한 약물 후보를 검토할 때. 그들의 훈련 중 일부는 다음과 같습니다. 규칙으로 증류됨 예를 들어, 이 구조는 컴퓨터가 뇌로 전달되지 않을 가능성이 높습니다. 간에 손상을 줄 수 있다는 것입니다. 이러한 전문가 규칙은 초기 심사에 도움이 되었습니다. 그러나 지금까지 의사결정의 미묘함과 복잡함을 포착할 수 있는 프로그램은 없습니다. 부분적으로는 화학자들이 이를 스스로 설명할 수 없기 때문입니다.

느낌이 있어요

새로운 연구는 AI 모델에서 설명할 수 없는 것을 포착하려고 했습니다.

팀은 전 세계 다양한 노바티스 센터에서 각기 다른 전문 지식을 갖춘 35명의 전문 화학자를 모집했습니다. 예를 들어 일부는 세포 및 조직을 대상으로 작업하고 다른 일부는 컴퓨터 모델링을 사용합니다.

직관은 측정하기 어렵습니다. 그것은 또한 정확하게 신뢰할 수 없습니다. 기본적으로 팀은 각 화학자가 자신의 선택에 일관성이 있는지, 그리고 자신의 선택이 다른 화학자의 선택과 일치하는지 여부를 측정하기 위해 멀티플레이어 게임을 설계했습니다. 각 화학자는 220개의 분자 쌍을 보여주고 의도적으로 모호한 질문을 했습니다. 예를 들어, 초기 가상 검사 캠페인에 참여하고 있고 알약으로 복용할 수 있는 약물이 필요하다고 가정해 보겠습니다. 어떤 분자를 선호하십니까?

목표는 지나친 생각을 줄이고, 화학자들이 어떤 화학 물질이 남고 어떤 화학 물질이 사라지는지에 대한 직관에 의존하도록 하는 것이었습니다. 이 설정은 화학자가 예측 모델, 즉 하드 데이터를 사용하여 특정 분자 특성을 확인하는 일반적인 평가와 다릅니다.

화학자들은 자신의 판단에 있어서는 일관적이었지만 항상 서로 동의하지는 않았습니다. 아마도 개인적인 경험이 다르기 때문일 것입니다. 그러나 AI 모델이 학습할 수 있는 기본 패턴을 형성하기에 충분한 중복이 있었다고 팀은 설명했습니다.

다음으로 그들은 5,000개의 분자 쌍으로 데이터 세트를 구축했습니다. 구조와 기타 특징에 대한 정보로 각각 라벨이 붙은 분자는 간단한 인공 신경망을 훈련하는 데 사용되었습니다. 훈련을 통해 AI 네트워크는 화학자의 피드백을 기반으로 내부 작동을 더욱 조정하여 결국 각 분자에 점수를 부여했습니다.

온전성 확인을 위해 팀은 훈련 데이터 세트와 다른 화학 쌍에 대해 모델을 테스트했습니다. 훈련 샘플 수를 늘리면 성능이 향상됩니다.

이전 컴퓨터 프로그램은 분자 구조를 기반으로 유망한 약을 만드는 규칙에 의존했지만 새 모델의 점수는 이러한 규칙을 직접적으로 반영하지 않았습니다. AI는 화학물질에 대한 보다 전체적인 관점을 포착했습니다. 약물 발견 기존의 로봇화학자 소프트웨어에서 사용되는 것보다

그런 다음 AI를 사용하여 팀은 FDA 승인 약물 수백 개와 화학 데이터뱅크에서 수천 개의 분자를 스크리닝했습니다. 명시적인 훈련 없이도 모델은 의약품으로서의 추가 개발에 더 적합한 "단편"이라고 불리는 화학 구조를 추출했습니다. AI의 점수 선호도는 기존 약물 유사 분자의 점수 선호도와 일치하여 잠재적인 리드를 만드는 요소의 요점을 파악했음을 나타냅니다.

화학 로맨스

노바티스는 인간-로봇의 화학적 로맨스를 탐구한 최초의 회사가 아닙니다.

예전에는 제약회사인 머크(Merck)에서 또한 탭 바람직한 특성에 대해 화학물질의 순위를 매기기 위해 사내 전문 지식을 활용합니다. 업계 외부에서는 University of Glasgow에서는 무기 화학 실험에 직관 기반 로봇을 사용하는 방법을 연구했습니다.

아직은 소규모 연구이고 저자들은 인간의 오류를 배제할 수 없습니다. 일부 화학자는 완전히 피하기 어려운 개인적인 편견을 기반으로 분자를 선택할 수 있습니다. 그러나 이 설정은 실험적으로 완료하는 데 비용이 많이 드는 약물 발견의 다른 단계를 연구하는 데 사용될 수 있습니다. 모델은 직관을 기반으로 하지만 규칙 기반 필터를 통해 결과를 강화하여 성능을 더욱 향상시킬 수 있습니다.

우리는 기계 학습으로 수만 개의 분자를 설계할 수 있는 시대에 있다고 팀은 설명했습니다. 직관으로 무장한 보조 AI 화학자는 신약 발견의 중요한 초기 단계에서 후보 물질의 범위를 좁히고 전체 프로세스를 가속화하는 데 도움을 줄 수 있습니다.

이미지 신용 : 유지니아 코지르 / Unsplash

spot_img

최신 인텔리전스

spot_img