Beta público do Claude Science
(claude.com)- Claude Science é um app em beta público criado para que pesquisadores de ciências da vida conduzam, em uma única workbench, desde a execução de análises, buscas em bancos de dados e pré-processamento de dados até a redação de resultados
- Figuras, tabelas e notebooks preservam o código gerado, o ambiente de execução e o histórico da conversa, permitindo reproduzir, modificar e validar posteriormente
- Roda em notebooks locais, máquinas Linux, nós de login de HPC e VMs na nuvem, com suporte ao envio e gerenciamento de jobs via SSH, Slurm e Modal
- É voltado a genômica, single-cell, proteômica, biologia estrutural e quimioinformática, podendo se conectar a mais de 60 bancos de dados científicos e a ferramentas NVIDIA BioNeMo
- Disponível no macOS e Linux para os planos Pro, Max, Team e Enterprise, mas, por ser um app em beta, exige revisão da documentação e configuração administrativa antes da implantação em organizações
Workbench Claude para pesquisa científica
- Claude Science não é um novo modelo, mas um app em beta público, e usa os modelos Claude existentes incluídos no plano do usuário
- O que foi acrescentado são ferramentas científicas, conexões com bancos de dados e integrações de computação ao redor do Claude, permitindo executar análises completas na infraestrutura do usuário
- É oferecido para macOS e Linux, com a página orientando o download para cada sistema operacional
- O objetivo é reunir bancos de dados científicos, ferramentas de pesquisa, ELN, modelos de proteínas e estruturas, e HPC em uma única workbench de pesquisa
Resultados reproduzíveis e fluxo de revisão
- Claude Science permite visualizar nativamente proteínas, estruturas, moléculas e outros objetos, e rastrear os resultados até o código gerado
- Figuras, tabelas e notebooks armazenam junto as seguintes informações
- O código exato que produziu o resultado
- O ambiente de execução
- A conversa que produziu o resultado
- Os resultados salvos podem ser reproduzidos, editados e defendidos mesmo meses depois
- Proteínas, alinhamentos, trilhas genômicas, estruturas químicas e PDFs podem ser visualizados em formato nativo sem instalação adicional
- O revisor em segundo plano sinaliza citações incorretas, valores não rastreáveis e figuras que não correspondem ao código subjacente
- O usuário pode anotar uma figura para solicitar correções ou fazer perguntas, e o agente lê o código que gerou aquela figura para modificá-la diretamente
- A redação dos resultados da análise pode ser feita acompanhando Markdown renderizado e pré-visualizações em LaTeX
Computação e ambiente de execução
- Gerencia o ambiente de execução necessário para cada análise, que pode rodar em um notebook, uma máquina Linux ou um nó de login de HPC
- Depois de escrever scripts de batch, envia e gerencia jobs via SSH na máquina do usuário ou em um cluster HPC, ou executa jobs com uma conta Modal
- O local de instalação pode ser escolhido conforme onde os dados estão
- Notebook
- Máquina Linux do laboratório
- Nó de login de HPC
- VM na nuvem
- Pode ser usado por meio de conexão no navegador
- Os jobs são executados em kernels locais, clusters Slurm via SSH ou em uma conta Modal
- Variáveis, dataframes e modelos carregados permanecem na memória durante toda a análise, acelerando tarefas repetitivas
Tarefas por domínio nas ciências da vida
- Claude Science oferece suporte a genômica, single-cell, proteômica, biologia estrutural, quimioinformática e outros domínios, podendo ler literatura e consultar mais de 60 bancos de dados científicos
- Os principais exemplos de uso incluem
- Análise de single-cell RNA-seq: agrupa e anota milhões de células de um tecido inteiro, encontra genes marcadores de superfície e rastreia cada figura até o código que a gerou
- Análise filogenética e evolutiva: realiza alinhamento de ortólogos, inferência de árvores por máxima verossimilhança e mapeamento filogenético de resíduos funcionais em uma única sessão reproduzível
- Trabalho com estruturas de proteínas e modelos de linguagem: importa estruturas previstas, sobrepõe domínios e variantes clínicas, e explora tudo de forma interativa em 3D
- Quimioinformática e desenho molecular: busca dados de bioatividade, calcula propriedades e similaridade, e desenha ou refina estruturas em um sketcher 2D
- Pipelines podem ser salvos como skills reutilizáveis, e as ferramentas preferidas do laboratório podem ser conectadas como connectors para uso automático em sessões futuras
- Fornece dossiês de indicação totalmente referenciados e está expandindo o conjunto de skills que compõe a base de evidências de cada programa
Conexão com a stack existente do laboratório
- Connectors trazem APIs internas, ELNs e pipelines personalizados para o workflow, fazendo o Claude Science funcionar junto das ferramentas já usadas pelo laboratório
- Workflows existentes em Python, R e shell podem ser lidos, executados e estendidos sem precisar recriá-los do zero
- Ferramentas científicas, plataformas e modelos abertos específicos de domínio podem ser plugados como skills ou connectors
- Em vez de substituir uma ferramenta específica, Claude Science atua como uma workbench integrada em que ferramentas especializadas funcionam em conjunto
Conexões com modelos, ferramentas e dados
- Indo além de um assistente de IA genérico que discute biologia, Claude Science oferece suporte à execução de pipelines, exploração de bancos de dados científicos, orquestração de jobs em clusters e rastreamento de registros de sessões anteriores
- O app inclui especialistas de análise para genômica, single-cell, proteômica, biologia estrutural, quimioinformática e outros domínios
- Pode se conectar nativamente a modelos abertos específicos de domínio e a mais de 60 bancos de dados científicos
- Usa a skill BioNeMo Agent Toolkit da NVIDIA para se conectar aos modelos e bibliotecas de ciências da vida do BioNeMo
- Exemplos incluídos são Evo 2, Boltz-2 e OpenFold3
Localização dos dados e validação
- O app Claude Science roda na infraestrutura do usuário, e os datasets brutos e a computação permanecem locais
- O conteúdo incluído em prompts e respostas do modelo é tratado de acordo com as políticas padrão de retenção da Anthropic
- Requisitos específicos de equipes podem ser discutidos por meio de contato comercial
- Todos os resultados incluem as seguintes informações
- O código exato usado na geração
- O ambiente de execução
- Uma descrição em linguagem natural da tarefa realizada
- A conversa que levou ao resultado
- O revisor em segundo plano sinaliza afirmações que não podem ser rastreadas até evidências antes que o resultado seja exibido
Planos, desconto para laboratórios e implantação enterprise
- Claude Science é um app em beta disponível no macOS e Linux para os planos Pro, Max, Team e Enterprise
- Usuários Team e Enterprise precisam que um administrador o ative primeiro
- O desconto para laboratórios Claude Team plan for research labs inclui acesso ao app Claude Science
- O público-alvo são laboratórios de pesquisa científica ativos em instituições acadêmicas e organizações de pesquisa sem fins lucrativos
- Laboratórios de biomedicina e ciências básicas, além de hard sciences como química, matemática, ciência da computação e física, estão entre as prioridades
- A elegibilidade é verificada por meio do responsável pelo laboratório
- Empresas com fins lucrativos, organizações de pesquisa contratada e equipes industriais de P&D devem consultar os planos Team e Enterprise
- O plano Enterprise oferece SSO, provisionamento SCIM, funções personalizadas e análise de uso
- Como está em beta, administradores devem revisar a documentação antes da implantação
- A documentação cobre instalação, conexão de ferramentas e computação, e configurações administrativas de Team e Enterprise
1 comentários
Opiniões no Hacker News
Criei o Biomni HPC, uma das ferramentas conectadas incluídas neste lançamento, e venho trabalhando nesse problema há bastante tempo. Também trabalhei na Anthropic, mas não fui responsável por este produto.
Como outros comentários disseram, isto é voltado para ciência de dados, mas consegue fazer muito mais do que criar gráficos e escrever artigos. Ele se integra a vários bancos de dados e ferramentas de computação, incluindo clusters institucionais de pesquisadores.
Só isso já tem muito valor. Sofri com esse problema em uma startup de bio e acabei fundando uma startup; integrar esse tipo de ferramenta e banco de dados é difícil e toma muito tempo. Mesmo que o resultado deste produto seja apenas criar uma ótima API para LLMs, já terá um grande impacto positivo. Muitos bancos de dados usados em genômica computacional ainda só são acessíveis via FTP.
LLMs são particularmente adequados para navegar por essas ferramentas e bancos de dados. Há muitas tarefas simples que são altamente especializadas, mas que se prestam bem a habilidades aprendidas em contexto. Ver bioinformatas que eram antigos clientes começando a resolver esse problema com LLMs foi o que me levou a entrar na Anthropic em 2024.
Além disso, esse padrão não está intrinsecamente preso à ciência de dados. Em algumas áreas da ciência, ele também pode se integrar a laboratórios úmidos ou CROs, e é nisso que estou dedicando tempo agora.
Esse tipo de ciência não resolve tudo, mas é útil em certos domínios. Por exemplo, muita pesquisa sobre doenças raras avança lentamente mais por um gargalo de atenção dos pesquisadores do que por falta de um avanço fundamental.
https://x.com/phylo_bio/article/2029233694775624096
Em comparação, o produto científico da OpenAI, Prism, era basicamente mais próximo de um editor LaTeX obtido pela aquisição da Crixet.
É preciso atender a políticas institucionais, leis aplicáveis, requisitos de acesso e armazenamento de dados, como os de repositórios de dados do NIH, e talvez também sejam necessários contratos legais entre a instituição e o provedor de IA. Pelo menos por enquanto, é algo difícil de mexer.
Se houver interesse, podemos conversar.
O ponto mais interessante aqui é que o Claude Science executa um servidor local e uma UI baseada na web que se conecta a esse servidor pelo navegador.
Isso é bem diferente de uma arquitetura como a do Claude Code ou do Cowork, em que a UI fica mais fortemente acoplada à máquina host e permite recursos como uso do computador.
Acho que dá para entender a estratégia. A maioria dos ambientes farmacêuticos com dados interessantes é muito rigidamente bloqueada, então não dá simplesmente para conectar um MacBook aos dados de origem.
Da mesma forma, o acesso a grandes conjuntos de dados genômicos de biobancos, como o UK Biobank ou o NIH All of Us, só é permitido por meio de plataformas remotas de análise de dados chamadas Trusted Research Environment (TRE), e normalmente o acesso à internet também é restrito. Rodar um aplicativo desktop não é fácil, mas esses ambientes em geral oferecem suporte a executar JupyterLab ou VS Code e fazer o tunelamento da UI para o usuário final. Anteriormente, liderei a equipe que criou o TRE do All of Us.
É fácil imaginar o Claude Science não como um mega-app do Claude que faz tudo, mas como algo que sobe um servidor dentro desses ambientes de dados restritos e apenas faz proxy da UI para o navegador do usuário. Esse ponto será importante para adoção em ambientes de P&D farmacêutico.
Dito isso, para cientistas computacionais de nível intermediário que usam RStudio, JupyterLab e VS Code todos os dias, o Claude Science pode ser um produto de formato bastante estranho. Fico curioso se ele vai substituir as ferramentas existentes de bancada de ciência de dados, ser usado junto com elas ou, no fim, acabar envolvendo-as.
Trabalho como analista de dados em uma empresa de geologia, lidando com dados interessantes de sensores; quando preciso de uma análise ou visualização rápida, o Claude escreve em minutos um código que eu levaria cerca de uma hora para organizar. O fato de eu conhecer bem o suficiente as bibliotecas relevantes para ler e validar o código é uma diferença importante em relação a usar cegamente uma IA caixa-preta.
Porém, hoje o Claude Code e o Jupyter no VS Code não combinam muito bem. Toda vez que o Claude faz uma alteração, ele acaba fazendo o notebook inteiro rodar de novo desde o começo. Por isso, tenho me afastado um pouco dos notebooks, deixando o Claude escrever scripts independentes e depois gastando tempo para recombiná-los em um notebook bonito.
Se não é possível se conectar a partir de um Mac, é bem provável que também não permitam que um agente no servidor envie requisições.
Testei como isso se sai na minha área, design computacional de biopesticidas baseados em RNAi
Pedi que ele criasse de uma vez um design mirando o transcrito DvSnf7 da larva-alfinete do milho ocidental, e a abordagem foi bem ingênua. Era algo que um doutorando de primeiro ano faria, mas ele fez o trabalho
Também apontou limitações, como ter usado regras de design para mamíferos e ter feito uma verificação limitada de off-targets. Não é péssimo, mas também não é excelente. Quando apontei as falhas, a IA julgou que poderia ter sabido mais e abordado melhor. Em seguida, o sistema de segurança do Opus 4.8 sinalizou a sessão
Recomendo reunir os 10 artigos principais sobre esse tema e 10 livros-texto gerais da área, convertê-los para texto simples via OCR ou extração de texto e tentar a mesma tarefa com um harness de agente melhor, como o omp.sh
/goal set create biopesticide targeting the DvSnf7 transcript of western corn rootwormNão erre
Quando disseram “Science”, eu não achei que quisessem dizer ciência de dados, mas uma UI cheia de código pandas e gráficos parece isso
Mesmo que o foco seja em áreas científicas, considerando que parece um Jupyter Notebook 2.0, talvez seja a parte menos valiosa do anúncio
Casos de uso de entender visualizações de dados como imagens foram ignorados por muito tempo, e os LLMs mais recentes estão ficando cada vez melhores em uma análise exploratória de dados decente. Ainda assim, talvez eu precise atualizar meu currículo
Pelo que já vi, eu escolheria a qualquer momento o código gerado pelo Claude em vez de código escrito por gente de matemática, física, biologia ou linguística. Também já vi o Claude cometer erros enormes durante análise de dados, mas ele provavelmente é mais confiável do que a maioria dos acadêmicos que já programam
O que define qual ciência é não é a cadeia de ferramentas, e sim o conteúdo tratado
Antes dos LLMs, os grupos técnicos que eu acompanhava debatiam ativamente quais assuntos usar, quando e para quê, e acho que essas discussões geraram muitos frameworks e ferramentas na linha de “parece uma ideia razoável, então não custa implementar”
Infelizmente, hoje tudo gira em torno de LLMs, e só se fala em como fazê-los funcionar de alguma forma. Os próprios temas para os quais esses grupos foram criados quase não são tratados
Tenho medo de que a ciência passe logo pela mesma coisa. Em vez dos temas que realmente deveriam ser discutidos, a conversa sobre LLMs pode ocupar o espaço
Se não conseguirem aproveitar de algum jeito os ativos existentes, o retorno sobre o capital investido não vai parecer bom
Não é um argumento a favor; é só que, no fim, a gestão precisa responder a acionistas que olham para essas métricas de retorno
Parece que este anúncio abriu o Claude Desktop para Linux: https://code.claude.com/docs/en/desktop-linux
Já usei ferramentas parecidas e, embora sejam impressionantes, LLMs com frequência demais inventam dados falsos, mas plausíveis, e fingem que são reais
Isso inclui manipulações bastante profundas, como configurar até conectores de banco de dados de mentira para parecer que os dados estão vindo do lugar certo, quando na verdade usam dados sintéticos
Fico curioso para saber como este produto evita isso
Indo para o lado das biociências, não era esta a empresa que fazia os LLMs parecerem um modelo corrompido?
Fico me perguntando se é algo como um Claude Cowork para ciência, ou seja, um produto para usuários menos técnicos
Um cientista com background em programação provavelmente preferiria simplesmente usar o Claude Code de forma geral e integrá-lo à stack que escolheu, mas talvez o conforto e a usabilidade do Claude Science acabem vencendo
Consigo imaginar perfeitamente uma antiga equipe de laboratório nacional integrando isso ao sistema e abandonando completamente o uso do Claude Code
Acho que deveriam chamar de Claude-bio-big-bucks
E as geociências, a física e a engenharia? Os conectores e as tecnologias são todos de biologia e farmacêutica
Antes de Trump, o orçamento anual da NSF ficava em torno de US$ 6 bilhões a US$ 8 bilhões, enquanto o orçamento anual do NIH era de cerca de US$ 50 bilhões. Essa é a diferença