- Compreender e gerar proteínas, os componentes fundamentais de todas as doenças, pode levar a novos medicamentos e tratamentos
- Atualmente, o processo de projetar proteínas em laboratório exige muito poder computacional e recursos, incluindo a geração da estrutura da proteína e da sequência de aminoácidos
- O EvoDiff simplifica esse processo ao gerar proteínas variadas e de alta qualidade a partir de uma determinada sequência de proteína, sem exigir informações estruturais da proteína-alvo
- O EvoDiff em open source pode ser usado para gerar novos tratamentos, métodos de entrega de medicamentos e enzimas para reações químicas industriais
- Ele opera segundo o princípio de que 'a sequência da proteína é tudo', projetando novas proteínas ao se afastar do paradigma estrutura-função na engenharia de proteínas
- A estrutura do EvoDiff é baseada em um modelo com 640 milhões de parâmetros, treinado com dados de diversas espécies e classes funcionais de proteínas obtidos do dataset OpenFold e do UniRef50
- Como os modelos modernos de geração de imagens, trata-se de um modelo de difusão que aprende a remover gradualmente o ruído de uma proteína inicial composta quase inteiramente de ruído, aproximando-a de uma sequência proteica
- Ele gera novas proteínas, preenche lacunas em projetos de proteínas existentes e atende a objetivos funcionais específicos
- Ao projetar proteínas no espaço de sequência, e não no da estrutura, ele torna possível sintetizar proteínas desordenadas, que desempenham papéis importantes na biologia e nas doenças
- A pesquisa ainda não passou por revisão por pares, e mais trabalho de escalabilidade será necessário antes que a estrutura possa ser usada comercialmente
- A equipe do EvoDiff pretende testar em laboratório as proteínas geradas pelo modelo para determinar sua viabilidade e, se isso der certo, iniciar o trabalho da próxima geração da estrutura
Ainda não há comentários.