제퍼넷 로고

생물 정보학 도구는 합성 DNA를 정확하게 추적합니다.

시간

컴퓨터 과학자들은 PlasmidHawk로 생물 정보학의 이점을 보여줍니다

영상

크레딧 : Tommy LaVergne / Rice University

휴스턴 – (26 년 2021 월 XNUMX 일) – 합성 유전자 코드의 기원을 추적하는 것은 결코 간단하지 않지만 생물 정보학 또는 점점 더 심층 학습 계산 접근 방식을 통해 수행 할 수 있습니다.

후자가 많은 관심을 받고 있지만, Rice University의 Brown School of Engineering의 컴퓨터 과학자 Todd Treangen의 새로운 연구는 서열 정렬과 팬 게놈 기반 방법이이 분야의 최근 딥 러닝 접근 방식을 능가 할 수 있는지에 초점을 맞추고 있습니다.

"이것은 딥 러닝 접근 방식이 최근 BLAST와 같은 전통적인 접근 방식을 능가한다는 점을 감안할 때 어떤 의미에서는 곡물에 반하는 것입니다."라고 그는 말했습니다. "이 연구의 목표는이 중요한 계산 문제에 대한 추가 개선을 달성하기 위해 두 영역의 전문 지식을 결합하는 방법에 대한 대화를 시작하는 것입니다."

생물 보안 및 미생물 법의학 애플리케이션을위한 컴퓨터 솔루션 개발을 전문으로하는 Treangen과 Rice 팀은 DNA 서열을 분석하여 관심있는 엔지니어링 된 플라스미드의 출처를 식별하는 데 도움이되는 생물 정보학 접근 방식 인 PlasmidHawk를 도입했습니다.

"우리는 시퀀스 정렬 기반 접근 방식이 실험실 예측의 특정 작업에 대해 컨볼 루션 신경망 (CNN) 딥 러닝 방법보다 성능이 우수하다는 것을 보여줍니다."라고 그는 말했습니다.

Treangen과 주 저자 인 Rice 대학원생 인 Qi Wang이 이끄는 연구자들은 그들의 결과를 자연 통신.

오픈 소스 소프트웨어는 여기에서 사용할 수 있습니다 : https : //깃랩.co.kr /treangenlab /플라스미드 호크.

이 프로그램은 잠재적으로 유해한 공학 시퀀스를 추적 할뿐만 아니라 지적 재산을 보호하는데도 유용 할 수 있습니다.

“목표는 시퀀스 기여자의 지적 재산권을 보호하거나 잘못된 일이 발생하는 경우 합성 시퀀스의 출처를 추적하는 데 도움이되는 것입니다.”라고 Treangen이 말했습니다.

Treangen은 시퀀스의 원래 실험실을 추적하기위한 RNN (Recurrent Neural Network) 딥 러닝 기술을 설명하는 최근의 주목할만한 논문에 주목했습니다. 이 방법은 원산지 단일 실험실을 예측하는 데 70 %의 정확도를 달성했습니다. "이전 딥 러닝 접근 방식에 비해이 중요한 발전에도 불구하고 PlasmidHawk는 두 가지 방법에 대해 향상된 성능을 제공합니다."라고 그는 말했습니다.

Rice 프로그램은 게놈 데이터 세트에서 알려지지 않은 코드 문자열을 직접 정렬하고 합성 생물학 연구 실험실에서 일반적이거나 고유 한 범 게놈 영역과 일치시킵니다.

“원산지 실험실을 예측하기 위해 PlasmidHawk는 분류되지 않은 서열과 플라스미드 팬 게놈 사이의 일치하는 영역을 기반으로 각 실험실의 점수를 매긴 다음 알려지지 않은 서열을 최소 점수로 실험실에 할당합니다.”라고 Wang은 말했습니다.

새로운 연구에서 딥 러닝 실험 중 하나와 동일한 데이터 세트를 사용하여 연구원들은 76 %의 시간 동안 "알 수없는 시퀀스 '증착 실험실"에 대한 성공적인 예측을보고했습니다. 그들은 85 %의 시간 동안 올바른 실험실이 상위 10 개 후보에 속한다는 것을 발견했습니다.

딥 러닝 접근 방식과 달리 PlasmidHawk는 데이터 전처리를 줄여야하며 기존 프로젝트에 새 시퀀스를 추가 할 때 재교육이 필요하지 않습니다. 또한 이전 딥 러닝 접근 방식과는 대조적으로 원본 실험실 예측에 대한 자세한 설명을 제공한다는 점에서 다릅니다.

Rice의 박사후 연구원 인 Ryan Leo Elworth의 공동 저자는“목표는 계산 도구 상자를 가능한 한 많은 도구로 채우는 것입니다. "궁극적으로 최고의 결과는 기계 학습,보다 전통적인 계산 기술 및 당신이 다루고있는 특정 생물학적 문제에 대한 깊은 이해를 결합 할 것이라고 믿습니다."

# # #

Rice 대학원생 인 Bryce Kille과 Tian Rui Liu는이 논문의 공동 저자입니다. Treangen은 컴퓨터 과학 조교수입니다.

이 연구는 국립 신경 질환 및 뇌졸중 연구소, 국가 정보 국장실, 육군 연구실을 통해 국립 보건원의 지원을 받았다. Addgene은 기탁 된 플라스미드의 DNA 서열에 대한 액세스를 제공했습니다.

http : // dx에서 초록을 읽으십시오.doi.org /10.1038 /s41467-021-21180-w.

이 뉴스 릴리스는 https : /에서 온라인으로 찾을 수 있습니다./뉴스.쌀.에듀 /2021 /02 /26 /생물 정보학-도구-정확하게-합성 DNA / 추적

Twitter @RiceUNews를 통해 라이스 뉴스 및 미디어 관계를 팔로우하십시오.

관련 자료 :

미토콘드리아 스트레스 '연령'우주 비행사 : http : // news.쌀.에듀 /2020 /12 /02 /미토콘드리아 스트레스 시대 우주 비행사 /

게놈 데이터의 홍수는 박테리아 식별 노력을 방해합니다 : http : // news.쌀.에듀 /2018 /10 /30 /게놈 데이터의 홍수는 ID 박테리아에 대한 노력을 방해합니다 -2 /

Treangen Lab : https : //사이트.구글.co.kr /전망/treangen /

라이스 컴퓨터 과학과 : https : //CS웹.쌀.에듀

George R. Brown School of Engineering : https : //공학.쌀.에듀

다운로드 이미지 :

https : //뉴스 네트워크.쌀.에듀 /뉴스/파일 /2021 /02 /0221_PLASMID-1a-WEB.JPG

캡션 : Todd Treangen. (크레딧 : Tommy LaVergne / Rice University)

휴스턴의 300 에이커의 숲이 우거진 캠퍼스에 위치한 Rice University는 US News & World Report에서 지속적으로 미국 상위 20 개 대학으로 선정되었습니다. Rice는 건축, 비즈니스, 평생 연구, 공학, 인문학, 음악, 자연 과학 및 사회 과학 분야에서 매우 존경받는 학교를 보유하고 있으며 Baker Institute for Public Policy의 본거지입니다. 3,978 명의 학부생과 3,192 명의 대학원생이있는 Rice의 학부생 대 교수 비율은 6 대 1 미만입니다. 기숙 대학 시스템은 긴밀한 커뮤니티와 평생의 우정을 구축하는데, 이는 Rice가 많은 인종 / 계급 상호 작용에서 1 위를 차지하고 Princeton Review에서 삶의 질에서 1 위를 차지한 이유 중 하나입니다. Rice는 또한 Kiplinger 's Personal Finance에서 사립 대학 중 최고의 가치로 평가되었습니다.

제프 포크

713-348-6775

jfalk@rice.edu

마이크 윌리엄스

713-348-6728

mikewilliams@rice.edu

미디어 연락처
마이크 윌리엄스
mikewilliams@rice.edu

원본 소스

https : //뉴스.쌀.에듀 /2021 /02 /26 /생물 정보학-도구-정확하게-합성 DNA / 추적

관련 저널 기사

http://dx.doi.org /10.1038 /s41467-021-21180-w

출처 : https://bioengineer.org/bioinformatics-tool-accurately-tracks-synthetic-dna/

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?