Zephyrnet Logo

A ferramenta de bioinformática rastreia com precisão o DNA sintético

Data:

Cientistas da computação mostram benefícios da bioinformática com PlasmidHawk

IMAGEM

Crédito: Tommy LaVergne / Rice University

HOUSTON - (26 de fevereiro de 2021) - Rastrear a origem do código genético sintético nunca foi tão simples, mas pode ser feito por meio da bioinformática ou, cada vez mais, de abordagens computacionais de aprendizado profundo.

Embora o último receba a maior parte da atenção, uma nova pesquisa do cientista da computação Todd Treangen, da Brown School of Engineering da Rice University, está focada em se o alinhamento de sequência e os métodos baseados em pan-genoma podem superar as abordagens recentes de aprendizado profundo nesta área.

“Isso é, em certo sentido, contra a corrente, visto que as abordagens de aprendizado profundo recentemente superaram as abordagens tradicionais, como o BLAST”, disse ele. “Meu objetivo com este estudo é iniciar uma conversa sobre como combinar a experiência de ambos os domínios para obter mais melhorias para este importante desafio computacional.”

Treangen, que se especializou no desenvolvimento de soluções computacionais para biossegurança e aplicações forenses microbianas, e sua equipe na Rice introduziram o PlasmidHawk, uma abordagem de bioinformática que analisa sequências de DNA para ajudar a identificar a fonte de plasmídeos projetados de interesse.

“Mostramos que uma abordagem baseada em alinhamento de sequência pode superar um método de aprendizado profundo de rede neural convolucional (CNN) para a tarefa específica de previsão do laboratório de origem”, disse ele.

Os pesquisadores liderados por Treangen e o autor principal Qi Wang, um estudante de graduação da Rice, relataram seus resultados em um artigo de acesso aberto em Natureza das Comunicações.

O software de código aberto está disponível aqui: https: //gitlab.com /treangenlab /Plasmidhawk.

O programa pode ser útil não apenas para rastrear sequências de engenharia potencialmente prejudiciais, mas também para proteger a propriedade intelectual.

“O objetivo é ajudar a proteger os direitos de propriedade intelectual dos contribuintes das sequências ou ajudar a rastrear a origem de uma sequência sintética se algo de ruim acontecer”, disse Treangen.

Treangen observou um recente artigo de alto perfil que descreve uma técnica de aprendizagem profunda de rede neural recorrente (RNN) para rastrear o laboratório de origem de uma sequência. Esse método alcançou 70% de precisão na previsão do único laboratório de origem. “Apesar deste importante avanço em relação à abordagem anterior de aprendizado profundo, o PlasmidHawk oferece desempenho aprimorado em ambos os métodos”, disse ele.

O programa Rice alinha diretamente sequências de código desconhecidas de conjuntos de dados de genoma e os combina com regiões pan-genômicas que são comuns ou exclusivas para laboratórios de pesquisa de biologia sintética

"Para prever o laboratório de origem, o PlasmidHawk pontua cada laboratório com base na correspondência de regiões entre uma sequência não classificada e o pan-genoma plasmídeo e, em seguida, atribui a sequência desconhecida a um laboratório com a pontuação mínima", disse Wang.

No novo estudo, usando o mesmo conjunto de dados de um dos experimentos de aprendizado profundo, os pesquisadores relataram a previsão bem-sucedida de “laboratórios de depósito de sequências desconhecidas” 76% das vezes. Eles descobriram que 85% das vezes o laboratório correto estava entre os 10 melhores candidatos.

Ao contrário das abordagens de aprendizagem profunda, eles disseram que o PlasmidHawk requer pré-processamento reduzido de dados e não precisa de retreinamento ao adicionar novas sequências a um projeto existente. Ele também difere por oferecer uma explicação detalhada para suas previsões do laboratório de origem, em contraste com as abordagens anteriores de aprendizado profundo.

“O objetivo é preencher sua caixa de ferramentas computacionais com o máximo de ferramentas possível”, disse o co-autor Ryan Leo Elworth, pesquisador de pós-doutorado na Rice. “Em última análise, acredito que os melhores resultados combinarão o aprendizado de máquina, técnicas computacionais mais tradicionais e uma compreensão profunda do problema biológico específico que você está enfrentando.”

# # #

Bryce Kille e Tian Rui Liu, alunos de pós-graduação em arroz, são co-autores do artigo. Treangen é professor assistente de ciência da computação.

A pesquisa foi apoiada pelos Institutos Nacionais de Saúde por meio do Instituto Nacional de Distúrbios Neurológicos e Derrame, do Escritório do Diretor de Inteligência Nacional e do Escritório de Pesquisa do Exército. Addgene forneceu acesso às sequências de DNA dos plasmídeos depositados.

Leia o resumo em http: // dx.doi.org /10.1038 /s41467-021-21180-w.

Este comunicado à imprensa pode ser encontrado online em https: //notícias.arroz.edu /2021 /02 /26 /bioinformática-ferramenta-com precisão-faixas-dna-sintético /

Siga Rice News e relações com a mídia pelo Twitter @RiceUNews.

Materiais relacionados:

O estresse mitocondrial 'envelhece' os astronautas: http: // news.arroz.edu /2020 /12 /02 /mitocondrial-stress-idades-astronautas /

Inundação de dados do genoma atrapalha os esforços para identificar bactérias: http: // news.arroz.edu /2018 /10 /30 /inundação-de-dados-do-genoma-dificulta-esforços-para-id-bactérias-2 /

Laboratório Treangen: https: //locais.Google.com /Visão/treangen /Início

Departamento de Ciência da Computação do Rice: https: //csweb.arroz.edu

Escola de Engenharia George R. Brown: https: //Engenharia.arroz.edu

Imagem para download:

https: //rede de notícias.arroz.edu /news /arquivos/2021 /02 /0221_PLASMID-1a-WEB.jpg

LEGENDA: Todd Treangen. (Crédito: Tommy LaVergne / Rice University)

Localizada em um campus florestal de 300 acres em Houston, a Rice University é consistentemente classificada entre as 20 melhores universidades do país pelo US News & World Report. Rice tem escolas altamente respeitadas de Arquitetura, Negócios, Estudos Continuados, Engenharia, Humanidades, Música, Ciências Naturais e Ciências Sociais e é sede do Instituto Baker de Políticas Públicas. Com 3,978 alunos de graduação e 3,192 alunos de pós-graduação, a proporção de alunos de graduação para professores de Rice é pouco menos de 6 para 1. Seu sistema de faculdades residenciais constrói comunidades unidas e amizades duradouras, apenas uma das razões pelas quais Rice é classificada como No. 1 em muita interação raça / classe e No. 1 em qualidade de vida pela Princeton Review. O arroz também é classificado como o melhor valor entre as universidades privadas pela Kiplinger's Personal Finance.

Jeff Falk

713-348-6775

jfalk@rice.edu

Mike Williams

713-348-6728

mikewilliams@rice.edu

Contato com a mídia
Mike Williams
mikewilliams@rice.edu

Fonte Original

https: //notícias.arroz.edu /2021 /02 /26 /bioinformática-ferramenta-com precisão-faixas-dna-sintético /

Artigo de jornal relacionado

http://dx.doi.org /10.1038 /s41467-021-21180-w

Fonte: https://bioengineer.org/bioinformatics-tool-accurately-tracks-synthetic-dna/

local_img

Inteligência mais recente

local_img

Fale Conosco

Olá! Como posso ajudá-lo?