Beta público do Claude Science

(claude.com)

1 pontos por GN⁺ 4 시간 전 | 1 comentários | Compartilhar no WhatsApp

Claude Science é um app em beta público criado para que pesquisadores de ciências da vida conduzam, em uma única workbench, desde a execução de análises, buscas em bancos de dados e pré-processamento de dados até a redação de resultados
Figuras, tabelas e notebooks preservam o código gerado, o ambiente de execução e o histórico da conversa, permitindo reproduzir, modificar e validar posteriormente
Roda em notebooks locais, máquinas Linux, nós de login de HPC e VMs na nuvem, com suporte ao envio e gerenciamento de jobs via SSH, Slurm e Modal
É voltado a genômica, single-cell, proteômica, biologia estrutural e quimioinformática, podendo se conectar a mais de 60 bancos de dados científicos e a ferramentas NVIDIA BioNeMo
Disponível no macOS e Linux para os planos Pro, Max, Team e Enterprise, mas, por ser um app em beta, exige revisão da documentação e configuração administrativa antes da implantação em organizações

Workbench Claude para pesquisa científica

Claude Science não é um novo modelo, mas um app em beta público, e usa os modelos Claude existentes incluídos no plano do usuário
O que foi acrescentado são ferramentas científicas, conexões com bancos de dados e integrações de computação ao redor do Claude, permitindo executar análises completas na infraestrutura do usuário
É oferecido para macOS e Linux, com a página orientando o download para cada sistema operacional
O objetivo é reunir bancos de dados científicos, ferramentas de pesquisa, ELN, modelos de proteínas e estruturas, e HPC em uma única workbench de pesquisa

Resultados reproduzíveis e fluxo de revisão

Claude Science permite visualizar nativamente proteínas, estruturas, moléculas e outros objetos, e rastrear os resultados até o código gerado
Figuras, tabelas e notebooks armazenam junto as seguintes informações
- O código exato que produziu o resultado
- O ambiente de execução
- A conversa que produziu o resultado
Os resultados salvos podem ser reproduzidos, editados e defendidos mesmo meses depois
Proteínas, alinhamentos, trilhas genômicas, estruturas químicas e PDFs podem ser visualizados em formato nativo sem instalação adicional
O revisor em segundo plano sinaliza citações incorretas, valores não rastreáveis e figuras que não correspondem ao código subjacente
O usuário pode anotar uma figura para solicitar correções ou fazer perguntas, e o agente lê o código que gerou aquela figura para modificá-la diretamente
A redação dos resultados da análise pode ser feita acompanhando Markdown renderizado e pré-visualizações em LaTeX

Computação e ambiente de execução

Gerencia o ambiente de execução necessário para cada análise, que pode rodar em um notebook, uma máquina Linux ou um nó de login de HPC
Depois de escrever scripts de batch, envia e gerencia jobs via SSH na máquina do usuário ou em um cluster HPC, ou executa jobs com uma conta Modal
O local de instalação pode ser escolhido conforme onde os dados estão
- Notebook
- Máquina Linux do laboratório
- Nó de login de HPC
- VM na nuvem
Pode ser usado por meio de conexão no navegador
Os jobs são executados em kernels locais, clusters Slurm via SSH ou em uma conta Modal
Variáveis, dataframes e modelos carregados permanecem na memória durante toda a análise, acelerando tarefas repetitivas

Tarefas por domínio nas ciências da vida

Claude Science oferece suporte a genômica, single-cell, proteômica, biologia estrutural, quimioinformática e outros domínios, podendo ler literatura e consultar mais de 60 bancos de dados científicos
Os principais exemplos de uso incluem
- Análise de single-cell RNA-seq: agrupa e anota milhões de células de um tecido inteiro, encontra genes marcadores de superfície e rastreia cada figura até o código que a gerou
- Análise filogenética e evolutiva: realiza alinhamento de ortólogos, inferência de árvores por máxima verossimilhança e mapeamento filogenético de resíduos funcionais em uma única sessão reproduzível
- Trabalho com estruturas de proteínas e modelos de linguagem: importa estruturas previstas, sobrepõe domínios e variantes clínicas, e explora tudo de forma interativa em 3D
- Quimioinformática e desenho molecular: busca dados de bioatividade, calcula propriedades e similaridade, e desenha ou refina estruturas em um sketcher 2D
Pipelines podem ser salvos como skills reutilizáveis, e as ferramentas preferidas do laboratório podem ser conectadas como connectors para uso automático em sessões futuras
Fornece dossiês de indicação totalmente referenciados e está expandindo o conjunto de skills que compõe a base de evidências de cada programa

Conexão com a stack existente do laboratório

Connectors trazem APIs internas, ELNs e pipelines personalizados para o workflow, fazendo o Claude Science funcionar junto das ferramentas já usadas pelo laboratório
Workflows existentes em Python, R e shell podem ser lidos, executados e estendidos sem precisar recriá-los do zero
Ferramentas científicas, plataformas e modelos abertos específicos de domínio podem ser plugados como skills ou connectors
Em vez de substituir uma ferramenta específica, Claude Science atua como uma workbench integrada em que ferramentas especializadas funcionam em conjunto

Conexões com modelos, ferramentas e dados

Indo além de um assistente de IA genérico que discute biologia, Claude Science oferece suporte à execução de pipelines, exploração de bancos de dados científicos, orquestração de jobs em clusters e rastreamento de registros de sessões anteriores
O app inclui especialistas de análise para genômica, single-cell, proteômica, biologia estrutural, quimioinformática e outros domínios
Pode se conectar nativamente a modelos abertos específicos de domínio e a mais de 60 bancos de dados científicos
Usa a skill BioNeMo Agent Toolkit da NVIDIA para se conectar aos modelos e bibliotecas de ciências da vida do BioNeMo
- Exemplos incluídos são Evo 2, Boltz-2 e OpenFold3

Localização dos dados e validação

O app Claude Science roda na infraestrutura do usuário, e os datasets brutos e a computação permanecem locais
O conteúdo incluído em prompts e respostas do modelo é tratado de acordo com as políticas padrão de retenção da Anthropic
Requisitos específicos de equipes podem ser discutidos por meio de contato comercial
Todos os resultados incluem as seguintes informações
- O código exato usado na geração
- O ambiente de execução
- Uma descrição em linguagem natural da tarefa realizada
- A conversa que levou ao resultado
O revisor em segundo plano sinaliza afirmações que não podem ser rastreadas até evidências antes que o resultado seja exibido

Planos, desconto para laboratórios e implantação enterprise

Claude Science é um app em beta disponível no macOS e Linux para os planos Pro, Max, Team e Enterprise
Usuários Team e Enterprise precisam que um administrador o ative primeiro
O desconto para laboratórios Claude Team plan for research labs inclui acesso ao app Claude Science
- O público-alvo são laboratórios de pesquisa científica ativos em instituições acadêmicas e organizações de pesquisa sem fins lucrativos
- Laboratórios de biomedicina e ciências básicas, além de hard sciences como química, matemática, ciência da computação e física, estão entre as prioridades
- A elegibilidade é verificada por meio do responsável pelo laboratório
Empresas com fins lucrativos, organizações de pesquisa contratada e equipes industriais de P&D devem consultar os planos Team e Enterprise
O plano Enterprise oferece SSO, provisionamento SCIM, funções personalizadas e análise de uso
Como está em beta, administradores devem revisar a documentação antes da implantação
A documentação cobre instalação, conexão de ferramentas e computação, e configurações administrativas de Team e Enterprise

1 comentários

GN⁺ 4 시간 전

Opiniões no Hacker News

Criei o Biomni HPC, uma das ferramentas conectadas incluídas neste lançamento, e venho trabalhando nesse problema há bastante tempo. Também trabalhei na Anthropic, mas não fui responsável por este produto.
Como outros comentários disseram, isto é voltado para ciência de dados, mas consegue fazer muito mais do que criar gráficos e escrever artigos. Ele se integra a vários bancos de dados e ferramentas de computação, incluindo clusters institucionais de pesquisadores.
Só isso já tem muito valor. Sofri com esse problema em uma startup de bio e acabei fundando uma startup; integrar esse tipo de ferramenta e banco de dados é difícil e toma muito tempo. Mesmo que o resultado deste produto seja apenas criar uma ótima API para LLMs, já terá um grande impacto positivo. Muitos bancos de dados usados em genômica computacional ainda só são acessíveis via FTP.
LLMs são particularmente adequados para navegar por essas ferramentas e bancos de dados. Há muitas tarefas simples que são altamente especializadas, mas que se prestam bem a habilidades aprendidas em contexto. Ver bioinformatas que eram antigos clientes começando a resolver esse problema com LLMs foi o que me levou a entrar na Anthropic em 2024.
Além disso, esse padrão não está intrinsecamente preso à ciência de dados. Em algumas áreas da ciência, ele também pode se integrar a laboratórios úmidos ou CROs, e é nisso que estou dedicando tempo agora.
Esse tipo de ciência não resolve tudo, mas é útil em certos domínios. Por exemplo, muita pesquisa sobre doenças raras avança lentamente mais por um gargalo de atenção dos pesquisadores do que por falta de um avanço fundamental.
https://x.com/phylo_bio/article/2029233694775624096
Em comparação, o produto científico da OpenAI, Prism, era basicamente mais próximo de um editor LaTeX obtido pela aquisição da Crixet.
- Fico curioso sobre o que diferencia isto de incluir ou configurar várias tecnologias de agentes. Ou se a essência deste produto é combinar muitos padrões úteis.
- Conectar a IA diretamente a fontes de dados pode ficar muito mais complexo do que receber código para executar localmente.
  É preciso atender a políticas institucionais, leis aplicáveis, requisitos de acesso e armazenamento de dados, como os de repositórios de dados do NIH, e talvez também sejam necessários contratos legais entre a instituição e o provedor de IA. Pelo menos por enquanto, é algo difícil de mexer.
- Fico curioso sobre como eles fazem a validação para filtrar alucinações de LLMs nesse tipo de trabalho.
- Algum dia, gostaria de ver visualizações muito melhores no Claude Science. Mais do que gráficos simples ou estruturas de proteínas e químicas, seria bom ter cenas com cara educacional baseadas em threejs e shaders. Seria incrível se muitos artigos em revisões de literatura viessem com esse recurso.
- Já integrei o Biomni a um workspace inteligente antes: https://blog.codesolvent.com/2025/07/ai-assistant-with-biome...
  Se houver interesse, podemos conversar.
O ponto mais interessante aqui é que o Claude Science executa um servidor local e uma UI baseada na web que se conecta a esse servidor pelo navegador.
Isso é bem diferente de uma arquitetura como a do Claude Code ou do Cowork, em que a UI fica mais fortemente acoplada à máquina host e permite recursos como uso do computador.
Acho que dá para entender a estratégia. A maioria dos ambientes farmacêuticos com dados interessantes é muito rigidamente bloqueada, então não dá simplesmente para conectar um MacBook aos dados de origem.
Da mesma forma, o acesso a grandes conjuntos de dados genômicos de biobancos, como o UK Biobank ou o NIH All of Us, só é permitido por meio de plataformas remotas de análise de dados chamadas Trusted Research Environment (TRE), e normalmente o acesso à internet também é restrito. Rodar um aplicativo desktop não é fácil, mas esses ambientes em geral oferecem suporte a executar JupyterLab ou VS Code e fazer o tunelamento da UI para o usuário final. Anteriormente, liderei a equipe que criou o TRE do All of Us.
É fácil imaginar o Claude Science não como um mega-app do Claude que faz tudo, mas como algo que sobe um servidor dentro desses ambientes de dados restritos e apenas faz proxy da UI para o navegador do usuário. Esse ponto será importante para adoção em ambientes de P&D farmacêutico.
Dito isso, para cientistas computacionais de nível intermediário que usam RStudio, JupyterLab e VS Code todos os dias, o Claude Science pode ser um produto de formato bastante estranho. Fico curioso se ele vai substituir as ferramentas existentes de bancada de ciência de dados, ser usado junto com elas ou, no fim, acabar envolvendo-as.
- Da perspectiva de alguém que faz muito trabalho de natureza científica computacional no trabalho, a combinação de Claude Code com bibliotecas padrão de dados em Python foi extremamente poderosa e acelerou muito meu fluxo de trabalho.
  Trabalho como analista de dados em uma empresa de geologia, lidando com dados interessantes de sensores; quando preciso de uma análise ou visualização rápida, o Claude escreve em minutos um código que eu levaria cerca de uma hora para organizar. O fato de eu conhecer bem o suficiente as bibliotecas relevantes para ler e validar o código é uma diferença importante em relação a usar cegamente uma IA caixa-preta.
  Porém, hoje o Claude Code e o Jupyter no VS Code não combinam muito bem. Toda vez que o Claude faz uma alteração, ele acaba fazendo o notebook inteiro rodar de novo desde o começo. Por isso, tenho me afastado um pouco dos notebooks, deixando o Claude escrever scripts independentes e depois gastando tempo para recombiná-los em um notebook bonito.
- Concordo que é uma arquitetura interessante, mas não sei bem como ela funcionaria em um servidor rigidamente controlado.
  Se não é possível se conectar a partir de um Mac, é bem provável que também não permitam que um agente no servidor envie requisições.
Testei como isso se sai na minha área, design computacional de biopesticidas baseados em RNAi
Pedi que ele criasse de uma vez um design mirando o transcrito DvSnf7 da larva-alfinete do milho ocidental, e a abordagem foi bem ingênua. Era algo que um doutorando de primeiro ano faria, mas ele fez o trabalho
Também apontou limitações, como ter usado regras de design para mamíferos e ter feito uma verificação limitada de off-targets. Não é péssimo, mas também não é excelente. Quando apontei as falhas, a IA julgou que poderia ter sabido mais e abordado melhor. Em seguida, o sistema de segurança do Opus 4.8 sinalizou a sessão
- Se você acha que isso pode ser usado para um impacto positivo real, é melhor você, sua instituição ou sua empresa se candidatarem aos programas de bio da OpenAI e da Anthropic
- Hoje em dia, as piadas praticamente se escrevem sozinhas
  Recomendo reunir os 10 artigos principais sobre esse tema e 10 livros-texto gerais da área, convertê-los para texto simples via OCR ou extração de texto e tentar a mesma tarefa com um harness de agente melhor, como o omp.sh
  /goal set create biopesticide targeting the DvSnf7 transcript of western corn rootworm
  Não erre
Quando disseram “Science”, eu não achei que quisessem dizer ciência de dados, mas uma UI cheia de código pandas e gráficos parece isso
Mesmo que o foco seja em áreas científicas, considerando que parece um Jupyter Notebook 2.0, talvez seja a parte menos valiosa do anúncio
Casos de uso de entender visualizações de dados como imagens foram ignorados por muito tempo, e os LLMs mais recentes estão ficando cada vez melhores em uma análise exploratória de dados decente. Ainda assim, talvez eu precise atualizar meu currículo
- Muitas áreas das ciências naturais e sociais usam código matplotlib mal-ajambrado para produzir resultados e visualizações, mas não necessariamente chamam isso de ciência de dados
  Pelo que já vi, eu escolheria a qualquer momento o código gerado pelo Claude em vez de código escrito por gente de matemática, física, biologia ou linguística. Também já vi o Claude cometer erros enormes durante análise de dados, mas ele provavelmente é mais confiável do que a maioria dos acadêmicos que já programam
- Pelo vídeo, parece que tinham mais bioinformática em mente. Dependendo da definição, ela pode caber sob o guarda-chuva de ciência de dados, mas geralmente não é chamada assim
  O que define qual ciência é não é a cadeia de ferramentas, e sim o conteúdo tratado
- Eles também mencionam coisas como visualização de proteínas e estruturas químicas
- Esses novos produtos estão começando a parecer todos material de propaganda do programa espacial soviético. Não sei se há algo realmente novo aí
Antes dos LLMs, os grupos técnicos que eu acompanhava debatiam ativamente quais assuntos usar, quando e para quê, e acho que essas discussões geraram muitos frameworks e ferramentas na linha de “parece uma ideia razoável, então não custa implementar”
Infelizmente, hoje tudo gira em torno de LLMs, e só se fala em como fazê-los funcionar de alguma forma. Os próprios temas para os quais esses grupos foram criados quase não são tratados
Tenho medo de que a ciência passe logo pela mesma coisa. Em vez dos temas que realmente deveriam ser discutidos, a conversa sobre LLMs pode ocupar o espaço
- Já foram investidos centenas de bilhões de dólares em LLMs
  Se não conseguirem aproveitar de algum jeito os ativos existentes, o retorno sobre o capital investido não vai parecer bom
  Não é um argumento a favor; é só que, no fim, a gestão precisa responder a acionistas que olham para essas métricas de retorno
- LLMs em geral não são muito úteis, e as pessoas estão percebendo isso
Parece que este anúncio abriu o Claude Desktop para Linux: https://code.claude.com/docs/en/desktop-linux
- Infelizmente, não há suporte a distribuições baseadas em Arch. Fico me perguntando por que não empacotaram como Flatpak
Já usei ferramentas parecidas e, embora sejam impressionantes, LLMs com frequência demais inventam dados falsos, mas plausíveis, e fingem que são reais
Isso inclui manipulações bastante profundas, como configurar até conectores de banco de dados de mentira para parecer que os dados estão vindo do lugar certo, quando na verdade usam dados sintéticos
Fico curioso para saber como este produto evita isso
Indo para o lado das biociências, não era esta a empresa que fazia os LLMs parecerem um modelo corrompido?
Fico me perguntando se é algo como um Claude Cowork para ciência, ou seja, um produto para usuários menos técnicos
Um cientista com background em programação provavelmente preferiria simplesmente usar o Claude Code de forma geral e integrá-lo à stack que escolheu, mas talvez o conforto e a usabilidade do Claude Science acabem vencendo
- lebovic respondeu, mas isso não é simplesmente o Claude Cowork; há conexões e funcionalidades especialmente relacionadas a clusters HPC
  Consigo imaginar perfeitamente uma antiga equipe de laboratório nacional integrando isso ao sistema e abandonando completamente o uso do Claude Code
Acho que deveriam chamar de Claude-bio-big-bucks
E as geociências, a física e a engenharia? Os conectores e as tecnologias são todos de biologia e farmacêutica
- Se você não quer que empresas focadas em ganhar dinheiro mirem só ciências da vida, basta financiar todas as outras áreas em escala parecida com o dinheiro despejado em ciências da vida
  Antes de Trump, o orçamento anual da NSF ficava em torno de US$ 6 bilhões a US$ 8 bilhões, enquanto o orçamento anual do NIH era de cerca de US$ 50 bilhões. Essa é a diferença

Beta público do Claude Science

Workbench Claude para pesquisa científica

Resultados reproduzíveis e fluxo de revisão

Computação e ambiente de execução

Tarefas por domínio nas ciências da vida

Conexão com a stack existente do laboratório

Conexões com modelos, ferramentas e dados

Localização dos dados e validação

Planos, desconto para laboratórios e implantação enterprise

Leituras relacionadas

1 comentários

Opiniões no Hacker News