ARR-MEDIC CYP3A4: plataforma open source de ensino e pesquisa para prever interações medicamentosas (DDI)
(github.com/Flamehaven)O que é o ARR-MEDIC CYP3A4?
- Projeto que estima o risco de interação entre medicamentos ao prever se há inibição da enzima-chave CYP3A4, responsável por metabolizar mais da metade dos fármacos prescritos clinicamente no fígado.
- Foi disponibilizado como open source para fins de pesquisa e ensino, oferecendo uma demo web fácil de usar e um pipeline de ML expansível. A baseline foi projetada com cerca de 70% de acurácia para servir como ponto de partida para aprendizado conceitual e comparação de metodologias.
Por que foi criado?
- No fim de junho de 2025 houve uma competição de IA para descoberta de novos fármacos. Em três semanas, entrei de cabeça em uma área médica que eu não conhecia nada, especialmente lendo tudo o que encontrava sobre a enzima CYP3A4, muitas vezes virando a noite, até concluir o desenvolvimento.
- No entanto, por morar no exterior, eu nem pude submeter o projeto. Depois de deixá-lo parado por frustração, decidi aprimorá-lo e fortalecê-lo e então publicá-lo como open source por achar que seria um desperdício deixá-lo guardado.
Por que vale atenção?
- Segurança do paciente & polifarmácia: a inibição de CYP3A4 pode elevar a concentração de certos medicamentos em 2–10 vezes, o que pode levar a toxicidade ou falha terapêutica. Este projeto funciona como um campo de prática para identificar esse sinal de risco mais cedo.
- Papel de ponte: partindo do open source, apresenta um roadmap de evolução gradual de RDKit e ML clássico para GNN/Transformer.
O que ele inclui? (destaques)
- Demo web: experiência de predição diretamente no navegador (alternância de UI em coreano/inglês, entrada e visualização de SMILES, compostos de exemplo incluídos).
- API & backend: REST API baseada em FastAPI (predição individual/em lote, documentação OpenAPI), armazenamento assíncrono em SQLite e suporte a Docker.
- Extensibilidade: fácil de customizar com descritores RDKit, adição de modelos como RandomForest/XGBoost, análise de importância de features etc.
- Arquitetura: estrutura composta por
backend(FastAPI)/frontend(React)/models/data/docs.
Teste rápido
- Pode ser executado da forma que você preferir entre local/Conda/Docker (
uvicornpara iniciar a API,docker-compose up -detc.). Após iniciar, confira a especificação emhttp://localhost:8000/docs. - *Também há uma demo online no Hugging Face Spaces, então dá para experimentar sem instalar nada.
🚀 Instalação simples
Linux/macOS
# Clone repository
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource
cd arr-medic-cyp3a4-opensource
# Run automated installer
chmod +x scripts/install.sh
./scripts/install.sh
Windows
# Clone repository
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource
cd arr-medic-cyp3a4-opensource
# Run automated installer
scripts\install.bat
- Conda + RDKit (best accuracy)
- somente pip (modo simplificado)
- Docker (containerizado)
Desempenho & especificações (métricas para ensino/pesquisa)
- Acurácia: ~70% em dados de teste de CYP3A4 baseados no ChEMBL, sensibilidade ~75%, especificidade ~65% (linha de partida para ensino e benchmark).
- Sistema: predição de 1 caso em <2 segundos mesmo em uma única CPU, com foco em leveza para processamento em lote e atendimento a usuários simultâneos.
Roadmap
- v1.0 (atual): baseline baseada em regras (~70%).
- v2.0: RDKit + RandomForest/XGBoost com meta de ~80–85%.
- v3.0: foco em ~85–90% com GNN/Transformer, reforçando interpretabilidade (ex.: SHAP).
Licença & aviso
- Licença MIT. GitHub
- Não é para uso médico ou diagnóstico: este projeto é voltado a pesquisa e ensino e não deve ser usado para decisão clínica, atendimento ao paciente ou submissões regulatórias.
Links
- GitHub: Flamehaven/Arr-Medic-CYP3A4
- Demo online: Hugging Face Spaces (é possível executar uma demo rápida)
- História completa do desenvolvimento: My First Attempt at a Medical AI with ELI5 (relata o processo de como foi possível construir isso mesmo sem ser um especialista médico)
Resumo em uma linha
- Não é uma ferramenta para uso clínico real, mas é um código médico de ensino e pesquisa bem organizado para aprender em um só lugar o fluxo de DDI, de “conceito → experimento → evolução”.
Ainda não há comentários.