제퍼넷 로고

멀티 클라우드가 의료 과학을 가속화하는 XNUMX가지 방법

시간

연구 과학자와 의료 전문가는 의학의 새로운 시대에 참여하고 있습니다. 임상 및 연구 환경에서 그 어느 때보다 많은 데이터가 수집되고 분석되고 있습니다. 그러나 제약 및 의료 회사가 AI를 적용하기 시작하면서 기계 학습 이를 위해서는 상당한 컴퓨팅 성능("컴퓨팅")과 스토리지가 필요합니다. 종종 그들은 Amazon Web Services(AWS), Microsoft(Azure), Google Cloud Platform(GCP), Oracle 등과 같은 클라우드 서비스 공급자(CSP)의 서비스에 의존하지만 각 공급자는 고유한 강점과 약점을 가지고 있습니다. 데이터와 연구 목표의 다양성으로 인해 단일 클라우드 제공업체의 솔루션이 제한 없이 일반적인 연구 조직의 요구와 규모를 모두 포괄할 수는 없습니다. 그 결과 과학 연구의 트렌드는 멀티 클라우드 전략을 사용하는 것입니다.

멀티 클라우드 전략이란 무엇입니까?

멀티 클라우드 전략은 컴퓨팅 리소스를 저렴하게 배포하고 성능을 개선하며 가동 중지 시간을 최소화하고 데이터 손실을 방지하기 위해 여러 공급업체의 클라우드 서비스를 사용하는 것으로 정의됩니다. 조직은 비용, 기술 요구 사항, 지리적 가용성 및 기타 요소를 기반으로 각 클라우드 공급자로부터 최상의 서비스를 선택할 수 있습니다. 멀티 클라우드 아키텍처를 채택하는 회사는 프라이빗 클라우드 배포 및 기존 온프레미스 인프라와 함께 여러 퍼블릭 클라우드를 활용할 수 있습니다.

데이터 아키텍처 교육 프로그램 살펴보기

이 기사에 관심이 있다면 데이터 아키텍처 기본 사항에 대한 온라인 과정을 즐길 수 있습니다.

의료 및 의료 과학에 필요한 것과 같은 연구 요구 사항의 경우 멀티 클라우드 전략을 활용하면 다양한 CSP에서 동급 최고의 서비스에 액세스하고 공급업체 종속을 방지하여 혁신 능력을 높이는 등 상당한 이점을 제공할 수 있습니다.  

연구 기관이 직면한 큰 장애물은 대기 시간과 관련된 문제입니다. 종종 연구 데이터는 분석에 사용되는 컴퓨팅 리소스에서 물리적으로 멀리 떨어져 저장되어 특히 매우 큰 데이터 쿼리의 경우 성능이 저하됩니다. 데이터 세트는 방대할 수 있으므로 비용, 시간 및 위험 때문에 데이터 세트를 이동하거나 복사하는 것은 불가능합니다. 

비용 및 지연 시간으로 인한 성능 문제를 해결하는 것 외에도 AI 및 머신 러닝을 사용하는 연구 조직은 각 클라우드 제공업체의 기능이 약간 다르며 목적에 따라 더 강력하다는 것을 발견했습니다. 각 클라우드 제공업체의 최상의 기능에 액세스할 수 있는 기능은 제약 회사 및 의료 기관의 혁신 능력을 향상시킵니다. 실제로 앙상블 학습이라는 새로운 방식을 사용하면 여러 클라우드 제공업체의 AI 알고리즘을 동시에 활용하여 단일 제공업체에서 가능한 것보다 우수한 예측 성능을 달성할 수 있습니다. 

제약 회사와 건강 연구 기관은 멀티 클라우드를 어떻게 사용하고 있습니까? 다음은 다섯 가지 주요 방법입니다.

1. 유전체학 연구

유전체학은 게놈이라고 하는 유기체의 전체 유전자에 대한 연구입니다. 고성능 컴퓨팅 및 수학 기술을 사용하여 유전체 연구원은 엄청난 양의 DNA 서열 데이터를 분석하여 건강, 질병 또는 약물 반응에 영향을 미치는 변이를 찾습니다.

다중 클라우드 전략을 사용하면 유전체학 연구원이 시퀀스 데이터를 선택하고 재사용을 위해 이를 전송, 저장 및 분류할 수 있습니다. 또한 한 번만 저장하면 모든 클라우드에서 동시에 액세스할 수 있으므로 데이터 이동을 제거하고 비용 효율성을 실현할 수 있습니다. 연구원은 다양한 CSP 각각의 동급 최고의 도구와 기능을 활용하여 지리적으로 같은 중심 위치를 선택하여 대기 시간을 최소화할 수 있습니다. 다중 클라우드 구현 덕분에 유전체 연구원은 질병 생물학 및 의약품의 새로운 표적에 대한 새로운 통찰력을 발견하게 될 것입니다. 또한 멀티 클라우드는 임상 시험을 위한 환자 선택을 지원하고 환자가 혜택을 받을 가능성이 더 높은 치료법과 일치시킬 수 있습니다. 

2. 세포 이미징 

고처리량 또는 고함량 세포 스크리닝과 같은 대규모 생물학적 실험에서 분석할 이미지의 수와 복잡성은 크고 꾸준히 증가하고 있습니다. 이러한 이미지를 처리하고 처리하려면 전용 워크플로를 적용하여 잘 정의된 이미지 처리 및 분석 단계를 수행해야 합니다. 기존 방법, 도구 및 루틴을 통합하고 이를 다양한 응용 프로그램 및 질문에 적용하고 재사용 및 교환 가능하게 함으로써 이러한 워크플로를 생성하기 위해 여러 소프트웨어 도구가 등장했습니다.

Broad Institute of MIT 및 Harvard의 이미징 플랫폼은 업계 및 비영리 파트너와 협력하여 140,000개 이상의 소분자 및 유전적 섭동에 반응하는 XNUMX억 개 이상의 세포를 표시하는 대규모 세포 이미징 데이터 세트를 생성했습니다. Cell Painting에 의해 생성된 가장 큰 세포 이미지 모음을 나타내는 이 현미경 이미지 데이터 세트는 잠재적으로 새로운 치료법을 발견하고 개발하기 위한 노력을 촉진하기 위한 참조 모음 역할을 할 것입니다.  

3. 전자 현미경

Cryo-EM은 생물학적 표본의 자연 구조를 보존하고 전자빔으로부터 보호하기 위해 샘플을 동결하는 것과 관련된 전자 현미경의 한 버전입니다. 표적 분자의 상세한 이미지와 약물 후보가 어떻게 결합하고 상호 작용하여 새로운 약물 발견을 안내하는지 확인할 수 있습니다. 그러나 내부 플랫폼에서 데이터를 처리하려면 다중 네트워크에 걸친 복잡한 데이터 흐름이 필요한 경우가 많으며 이는 다중 클라우드 전략에 이상적입니다.

4. 약물 발견

유사하게, 높은 처리량 스크리닝은 일반적으로 매우 복잡하고 비용 집약적인 프로세스인 약물 발견에 사용됩니다. 멀티 클라우드 지식 그래프 약물 용도 변경, 약물 상호 작용 및 표적 유전자 질병 우선 순위 지정을 포함한 다양한 작업에 걸쳐 상당한 가능성을 보여주었습니다. 수많은 오픈 소스 데이터베이스가 출판된 문헌과 함께 통합되어 거대한 생물 의학 지식 그래프를 생성합니다.

5. 질병 예측

연구 과학자들은 AI와 기계 학습을 활용하여 방대한 환자 데이터 세트를 생성 및 분석하여 병든 세포와 건강한 세포 간의 주요 차이점을 강조하고 있습니다. 결과적으로 그들은 치료의 지속성을 결정하고 질병의 진행을 예측할 수 있습니다. 그러나 이러한 프로세스는 퍼블릭 클라우드에서 장시간 실행되는 GPU 컴퓨팅 시간을 필요로 하므로 비용이 많이 듭니다. 그리고 과학자들은 작업하면서 점점 더 많은 데이터를 축적하기 때문에 데이터 세트는 사용하는 동안 이동하거나 복사할 수 없을 정도로 방대해지고 있습니다. 멀티 클라우드를 사용하면 POSIX 계층을 통해 분석에 데이터를 제공할 수 있습니다.

센서가 축소, 개선 및 증식하고 모든 환자 경험이 미래 치료에 대한 정보를 제공할 수 있는 잠재력이 있는 차세대 기술 시대에 들어서면서 데이터 세트는 정말 엄청나게 증가하고 있습니다. AI 및 머신 러닝이 통찰력을 계속 가속화하려면 컴퓨팅 및 스토리지가 지역이나 단일 클라우드 기술에 의해 제한되어서는 안 됩니다. 좋은 소식은 멀티 클라우드 접근 방식을 통해 이미 놀라운 확장성이 가능하다는 것입니다. 과학자들에게 멀티 클라우드 기능을 제공하는 회사와 연구 조직은 미래에 대한 의학의 가장 놀라운 발견을 최초로 공개할 가능성이 높습니다.  

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?