ARR-MEDIC CYP3A4: plataforma open source de ensino e pesquisa para prever interações medicamentosas (DDI)

flamehaven01 · 2025-09-29T13:43:03+09:00

O que é o ARR-MEDIC CYP3A4? Projeto que estima o risco de interação entre medicamentos ao prever se há inibição da enzima-chave CYP3A4, responsável por metabolizar mais da metade dos fármacos prescritos clinicamente no fígado. Foi disponibilizado como open source para fins de pesquisa e ensino, oferecendo uma demo web fácil de usar e um pipeline de ML expansível. A baseline foi projetada com cerca de 70% de acurácia para servir como ponto de partida para aprendizado conceitual e comparação de metodologias. Por que foi criado? No fim de junho de 2025 houve uma competição de IA para descoberta de novos fármacos. Em três semanas, entrei de cabeça em uma área médica que eu não conhecia nada, especialmente lendo tudo o que encontrava sobre a enzima CYP3A4, muitas vezes virando a noite, até concluir o desenvolvimento. No entanto, por morar no exterior, eu nem pude submeter o projeto. Depois de deixá-lo parado por frustração, decidi aprimorá-lo e fortalecê-lo e então publicá-lo como open source por achar que seria um desperdício deixá-lo guardado. Por que vale atenção? Segurança do paciente & polifarmácia: a inibição de CYP3A4 pode elevar a concentração de certos medicamentos em 2–10 vezes, o que pode levar a toxicidade ou falha terapêutica. Este projeto funciona como um campo de prática para identificar esse sinal de risco mais cedo. Papel de ponte: partindo do open source, apresenta um roadmap de evolução gradual de RDKit e ML clássico para GNN/Transformer. O que ele inclui? (destaques) Demo web: experiência de predição diretamente no navegador (alternância de UI em coreano/inglês, entrada e visualização de SMILES, compostos de exemplo incluídos). API & backend: REST API baseada em FastAPI (predição individual/em lote, documentação OpenAPI), armazenamento assíncrono em SQLite e suporte a Docker. Extensibilidade: fácil de customizar com descritores RDKit, adição de modelos como RandomForest/XGBoost, análise de importância de features etc. Arquitetura: estrutura composta por backend(FastAPI) / frontend(React) / models / data / docs. Teste rápido Pode ser executado da forma que você preferir entre local/Conda/Docker (uvicorn para iniciar a API, docker-compose up -d etc.). Após iniciar, confira a especificação em http://localhost:8000/docs. *Também há uma demo online no Hugging Face Spaces, então dá para experimentar sem instalar nada. 🚀 Instalação simples Linux/macOS # Clone repository git clone https://github.com/your-org/arr-medic-cyp3a4-opensource cd arr-medic-cyp3a4-opensource # Run automated installer chmod +x scripts/install.sh ./scripts/install.sh Windows # Clone repository git clone https://github.com/your-org/arr-medic-cyp3a4-opensource cd arr-medic-cyp3a4-opensource # Run automated installer scripts\install.bat Conda + RDKit (best accuracy) somente pip (modo simplificado) Docker (containerizado) Desempenho & especificações (métricas para ensino/pesquisa) Acurácia: ~70% em dados de teste de CYP3A4 baseados no ChEMBL, sensibilidade ~75%, especificidade ~65% (linha de partida para ensino e benchmark). Sistema: predição de 1 caso em

(github.com/Flamehaven)

4 pontos por flamehaven01 2025-09-29 | Ainda não há comentários. | Compartilhar no WhatsApp

O que é o ARR-MEDIC CYP3A4?

Projeto que estima o risco de interação entre medicamentos ao prever se há inibição da enzima-chave CYP3A4, responsável por metabolizar mais da metade dos fármacos prescritos clinicamente no fígado.
Foi disponibilizado como open source para fins de pesquisa e ensino, oferecendo uma demo web fácil de usar e um pipeline de ML expansível. A baseline foi projetada com cerca de 70% de acurácia para servir como ponto de partida para aprendizado conceitual e comparação de metodologias.

Por que foi criado?

No fim de junho de 2025 houve uma competição de IA para descoberta de novos fármacos. Em três semanas, entrei de cabeça em uma área médica que eu não conhecia nada, especialmente lendo tudo o que encontrava sobre a enzima CYP3A4, muitas vezes virando a noite, até concluir o desenvolvimento.
No entanto, por morar no exterior, eu nem pude submeter o projeto. Depois de deixá-lo parado por frustração, decidi aprimorá-lo e fortalecê-lo e então publicá-lo como open source por achar que seria um desperdício deixá-lo guardado.

Por que vale atenção?

Segurança do paciente & polifarmácia: a inibição de CYP3A4 pode elevar a concentração de certos medicamentos em 2–10 vezes, o que pode levar a toxicidade ou falha terapêutica. Este projeto funciona como um campo de prática para identificar esse sinal de risco mais cedo.
Papel de ponte: partindo do open source, apresenta um roadmap de evolução gradual de RDKit e ML clássico para GNN/Transformer.

O que ele inclui? (destaques)

Demo web: experiência de predição diretamente no navegador (alternância de UI em coreano/inglês, entrada e visualização de SMILES, compostos de exemplo incluídos).
API & backend: REST API baseada em FastAPI (predição individual/em lote, documentação OpenAPI), armazenamento assíncrono em SQLite e suporte a Docker.
Extensibilidade: fácil de customizar com descritores RDKit, adição de modelos como RandomForest/XGBoost, análise de importância de features etc.
Arquitetura: estrutura composta por backend(FastAPI) / frontend(React) / models / data / docs.

Teste rápido

Pode ser executado da forma que você preferir entre local/Conda/Docker (uvicorn para iniciar a API, docker-compose up -d etc.). Após iniciar, confira a especificação em http://localhost:8000/docs.
*Também há uma demo online no Hugging Face Spaces, então dá para experimentar sem instalar nada.

🚀 Instalação simples

Linux/macOS

# Clone repository  
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource  
cd arr-medic-cyp3a4-opensource  
  
# Run automated installer  
chmod +x scripts/install.sh  
./scripts/install.sh

Windows

# Clone repository  
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource  
cd arr-medic-cyp3a4-opensource  
  
# Run automated installer  
scripts\install.bat

Conda + RDKit (best accuracy)
somente pip (modo simplificado)
Docker (containerizado)

Desempenho & especificações (métricas para ensino/pesquisa)

Acurácia: ~70% em dados de teste de CYP3A4 baseados no ChEMBL, sensibilidade ~75%, especificidade ~65% (linha de partida para ensino e benchmark).
Sistema: predição de 1 caso em <2 segundos mesmo em uma única CPU, com foco em leveza para processamento em lote e atendimento a usuários simultâneos.

Roadmap

v1.0 (atual): baseline baseada em regras (~70%).
v2.0: RDKit + RandomForest/XGBoost com meta de ~80–85%.
v3.0: foco em ~85–90% com GNN/Transformer, reforçando interpretabilidade (ex.: SHAP).

Licença & aviso

Licença MIT. GitHub
Não é para uso médico ou diagnóstico: este projeto é voltado a pesquisa e ensino e não deve ser usado para decisão clínica, atendimento ao paciente ou submissões regulatórias.

Resumo em uma linha

Não é uma ferramenta para uso clínico real, mas é um código médico de ensino e pesquisa bem organizado para aprender em um só lugar o fluxo de DDI, de “conceito → experimento → evolução”.