1 pontos por GN⁺ 2025-10-20 | 1 comentários | Compartilhar no WhatsApp
  • O custo do sequenciamento de DNA está caindo mais rápido do que a Lei de Moore
  • Com o Oxford Nanopore MinION, é possível sequenciar DNA em casa por cerca de US$ 1.100
  • No experimento real, foram feitas etapas de coleta de sangue, extração de DNA e sequenciamento com nanoporo, entre outras
  • Como resultado, apenas cerca de 13% do genoma completo foi coberto e a análise foi limitada por contaminação, defeito de equipamento etc.
  • Ainda assim, foi uma experiência significativa de sequenciar parte do DNA pessoal de forma econômica

Introdução

  • O custo do sequenciamento de DNA está caindo rapidamente, e decifrar o genoma humano, que antes levou US$ 2,3 bilhões e 13 anos, agora pode ser feito em até 48 horas apenas com o equipamento Oxford Nanopore (cerca de US$ 1.000)
  • Antes, era necessário enviar amostras para terceiros terceirizados instáveis, mas este texto descreve uma tentativa de sequenciamento sem ter um laboratório próprio

Visão geral do processo de sequenciamento de DNA

  • O objetivo é obter a sequência do genoma humano (cerca de 3 bilhões de bases, feitas de A, C, G e T) a partir de 10 ml de sangue
  • Resumo de todas as etapas
    • Coleta de sangue
    • Extração de DNA humano a partir do sangue
    • Passagem do DNA extraído pelo aparelho da Oxford Nanopore por meio de um método elétrico para leitura de cada base

História rápida do sequenciamento de DNA

  • Era Sanger (1960~2003): abordagem analógica, processamento manual e progresso muito lento
    • Usa nucleotídeos defeituosos para interromper a replicação do DNA, separa cada fragmento por eletricidade e depois faz a leitura como em um código de barras
    • O sequenciamento do genoma humano levou 13 anos e US$ 2,3 bilhões
    Publicidade
  • Era Illumina (2005~década de 2010): paralelização e automação
    • Introduziu o sequenciamento baseado em síntese, melhorando drasticamente a velocidade e eficiência de processamento
  • Era do sequenciamento de molécula única:
    • Lê diretamente as bases de DNA por meio de nanoporos elétricos, sem necessidade de fragmentar os pedaços
    • Este experimento também usou esse método

Equipamentos e custos necessários

  • Kit inicial Oxford Nanopore MinION (US$ 1.000): sequenciador USB, flow cell e reagentes de preparo incluídos
  • Kit de extração de DNA Zymo (amostra gratuita)
  • Centrífuga de bancada pequena (Amazon, US$ 50)
  • Materiais de consumo de laboratório (tubo Eppendorf, lanceta, pipeta etc., US$ 50)
  • Custo total de cerca de US$ 1.100
Publicidade

Detalhes das etapas do experimento

Etapa 1: Coleta de sangue

  • É necessário cerca de 200 µL (0,2 mL) de sangue; como a lanceta pequena não fornece volume suficiente, a coleta foi feita fazendo várias punções no dedo

Etapa 2: Extração de DNA

  • O sangue contém muitos contaminantes como glóbulos vermelhos, que em grande parte não possuem DNA
  • É preciso isolar apenas o DNA dos glóbulos brancos, e isso foi feito usando enzimas do kit Zymo e filtros de centrifugação
  • Também foi seguido o processo de anexação de adaptadores do kit de preparo da Nanopore

Etapa 3: Sequenciamento com Nanopore

  • O DNA preparado é injetado na pequena entrada do MinION e conectado via USB
  • O software MinKNOW realiza basecalling em tempo real, prevendo A, T, C, G a partir do sinal elétrico com um algoritmo de rede neural

Resultados e limitações

  • Foi possível gerar aproximadamente 1 gigabase de dados em duas execuções de sequenciamento, o que representa cerca de 13% de um genoma humano de 3 bilhões de bases
  • O primeiro experimento foi interrompido por erro de hardware; houve defeito no flow cell (apenas 623 dos 2.048 poros estavam funcionais)
  • 25% da amostra apresentou contaminação de bactérias etc.
  • Para análise de SNP (polimorfismo de nucleotídeo único), é necessário sequenciar repetidamente, e a maioria das sequências de bases foi lida apenas uma vez
  • Ainda assim, com o custo baixo de US$ 1.100, foi possível obter uma experiência relevante de sequenciamento de parte do genoma humano

Agradecimentos

  • Agradeço aos amigos que participaram deste experimento comigo

1 comentários

 
GN⁺ 2025-10-20
Comentários do Hacker News
  • Ainda é difícil dizer que já entramos na “era do sequenciamento por nanoporos”; o sequenciamento por síntese continua sendo o padrão dominante

    • É preciso cortar o genoma em pequenos fragmentos e depois remontá-los com base nisso, e esse processo gera vários problemas
    • O sequenciamento por nanoporos tem uma taxa de erro alta, então na prática clínica o sequenciamento por síntese ainda é o mais usado (especialmente porque a Illumina teve grande destaque tecnológico nos últimos 10 anos)
    • Mesmo assim, os equipamentos de nanoporos são pequenos e baratos, o que os torna atraentes, e a taxa de erro pode ser parcialmente compensada com sequenciamento repetido
    • Com tecnologia baseada em síntese, se você usar uma empresa confiável, dá para sequenciar um genoma completo com cobertura de 30x por menos de 1000 euros ou dólares; já vi até opções de 180 dólares, mas não sei dizer se são confiáveis
    • Para um genoma humano completo, nanoporos ainda parece prematuro, mas para usos como sequenciamento de plasmídeos já é muito útil
      • Mesmo sem ser do setor, eu só preciso deixar os tubos na universidade e recebo o resultado por e-mail na manhã seguinte por 15 dólares, tudo graças a um workflow baseado em nanoporos
    • A taxa de erro pode ser compensada com sequenciamento repetido, mas às vezes os erros também apresentam correlação
    • No geral, o sequenciamento de leituras curtas é muito mais eficiente em custo; na nossa startup também usamos Illumina para QC de linhagens celulares e custa só 260 dólares
    • O método de sequenciamento depende do objetivo; na NAO, usamos flow cells grandes da Illumina (25B) para sequenciar barato e detectar vários vírus em águas residuais
      • Mas quando há muito vírus-alvo, como em swab nasal, nanoporos é mais adequado por causa do comprimento maior das leituras e do baixo custo por run
    • O sequenciamento clínico com leituras curtas já funciona bem o suficiente, então não há motivo para nanoporos substituir isso
    • O futuro da prática clínica está na detecção de variantes de médio a grande porte; essa área ainda não está bem elucidada, então nanoporos vem sendo bastante usado em pesquisa e no diagnóstico de doenças raras
    • O SBS (sequenciamento por síntese) é muito confiável, mas o fato de ter grande participação de mercado não significa que o avanço tecnológico parou
      • A inovação em sequenciamento está acontecendo em ML, análise simultânea de RNA-DNA, combinação de leituras longas e curtas etc.
    • Na verdade, a tecnologia de nanoporos também está sendo usada cada vez mais em laboratórios de diagnóstico, porque o custo de preparo é mais baixo e a sensibilidade chega ao nível de qPCR
      • Além disso, oferece mais tipos de informação, como metilação
      • Há também um artigo recente sobre classificação de leucemia aguda com nanoporos artigo original
      • O tempo foi um pouco exagerado, mas o importante para diagnóstico é que “funciona bem”
  • A ideia (do artigo) foi interessante, mas fiquei um pouco decepcionado com os problemas de equipamento e com o fato de terem tentado uma vez e desistido logo em seguida

    • Dizem que o flow cell tinha só 623 poros funcionando desde o início; fiquei curioso se isso é algo comum e queria encontrar mais casos de tentativas bem-sucedidas
    • Eu mesmo já tentei algo parecido, usando saliva em vez de sangue, e extraí o DNA com um kit da Qiagen
      • No meu flow cell de nanoporos, quase todos os poros funcionaram bem; talvez no caso do artigo o problema tenha sido o armazenamento
    • A quantidade de poros ativos pode variar conforme o manuseio; pela minha experiência, a preparação da amostra pode gerar muitos poros inativos
      • Se a amostra não estiver preparada corretamente, os poros podem entupir ou perder atividade
      • Quando analisei dados da Oxford Nanopore no passado, a qualidade variava tanto conforme a habilidade no preparo da amostra que dava para distinguir qual colega tinha preparado só olhando os dados
      • Eu imagino que a qualidade da amostra preparada na “garagem” dos autores tenha sido ruim
      • Como referência, eu também tive um colega que montou um laboratório móvel de sequenciamento alimentado pela energia do carro
      • O maior gargalo técnico que ele enfrentou também foi a preparação da amostra; a parte de computação não era especialmente difícil
    • Ter poucos poros ativos não dá para chamar de “normal”, mas é algo que acontece com certa frequência
      • Pela minha experiência com trabalho de NGS, cerca de 1/4 dos flow cells inteiros vinham com defeito, e a ONT tinha uma política de troca se o autoteste da célula falhasse
    • Depende da amostra, mas normalmente mais de 1200 poros ativos é o comum, e pelo menos 800 costumam ser garantidos
      • Então, nesse caso, valeria a pena pedir reembolso
    • Foi interessante porque esse caso mostrou “o que acontece se alguém realmente tentar fazer isso”
      • Tenho pouca experiência com genealogia genômica, mas já esperava que houvesse muitos problemas técnicos
  • Empresas como Nebula e Dante oferecem sequenciamento de genoma completo com cobertura de 30x ou 100x por algo em torno de 300 dólares

    • Na verdade, o genoma de 1000 dólares já foi alcançado há 10 anos
    • Eu cheguei a pesquisar a Nebula, mas ela está enfrentando uma ação coletiva sob acusação de ter repassado dados genômicos para Meta, Microsoft e Google
      • Também há muitos relatos no subreddit de pessoas que enviaram o kit e ficaram anos sem receber resultado
      • Também há questões de qualidade do sequenciamento e da taxa de falso positivo em dados genéticos DTC (direto ao consumidor), e como a 23andMe teve um caso parecido, fico relutante em enviar meu genoma para uma empresa privada
    • O menor preço do sequenciamento genômico da DanteLabs é 399 euros (466 dólares) link do produto DanteLabs
    • Nos 2.000 dólares estão incluídos o equipamento de extração de DNA e o próprio sequenciador; os sequenciadores usados por empresas como a Nebula provavelmente são equipamentos de mais de 1 milhão de dólares
      • Se quiser fazer mais barato, em vez de WGS dá para usar sequenciamento de exoma ou, dependendo do caso, simples genotipagem
      • Talvez já exista alguma empresa oferecendo WGS por 100 dólares
    • Ainda assim, no fundo isso significa que alguém (uma empresa) passa a ter posse dos meus dados genômicos
      • Sob a justificativa de interesse legítimo, ela pode fazer qualquer coisa, e o risco de a empresa ser hackeada ou vendida já se mostrou bem real
    • Esses 1000 dólares são um “preço de economia de escala”
      • É uma faixa de preço que só se torna possível com processamento em grande volume
  • No mynucleus.com, dá para fazer sequenciamento de genoma completo por 500 dólares apenas com um swab na bochecha (com 10% de desconto usando o código savraj10)

    • Não precisa de sangue, fornece risco para mais de 2.000 doenças e, se o cônjuge também fizer o teste, dá até para prever características de futuros filhos
    • Em breve devem anunciar uma nova rodada de investimento, há suporte para download dos dados brutos e também garantem conformidade de segurança com SOC2 e HIPAA
    • Por outro lado, depois do vazamento de dados pessoais da 23andMe, fico me perguntando como impedir que os dados genômicos da Nucleus sejam vendidos a terceiros caso a empresa quebre
      • Não vejo muito destaque no site sobre diferenciais de privacidade de dados
      • A Nucleus também diz que “não vende dados”, mas a 23andMe dizia o mesmo
      • A realidade é que nenhuma empresa consegue transmitir confiança total nesse ponto
      • Entregar seu genoma à Nucleus só para economizar 3.000 dólares é algo que precisa ser pensado com cuidado
    • Para mim, pesa mais confiar isso a terceiros do que o sequenciamento do meu genoma em si
      • Os 13% de cobertura mencionados no artigo não servem para nenhuma análise genômica útil; o título é exagerado
    • Queria saber qual cobertura ela realmente entrega
    • Me impressiona que um serviço que antes era caríssimo ou inacessível ao público em geral agora possa ser feito por 500 dólares
    • Queria saber se aceitam pagamento em Monero
  • Eu usei a Nebula (agora rebatizada e mais cara) para sequenciar o genoma da minha família também, e foi tudo bem simples

    • No plano “Lifetime”, deixei os arquivos FASTQ armazenados em um bucket R2; a Nebula cobra 250 dólares com assinatura de 50 dólares por mês, mas dá para cancelar logo em seguida
    • Meu arquivo VCF pode ser visto aqui
      • Dá para jogar no LLM e analisar uma variante específica (rs104894396), ou procurar no SNPedia
    • Na prática, também fiz triagem de portadores com minha esposa, mas por outro método, não pela Nebula
      • Confirmamos que ambos carregamos genes associados à perda auditiva ligados ao gene GJB2, então decidimos sequenciar também os embriões dos nossos filhos para ter uma criança saudável
    • Se alguém quiser ver um exemplo real de dado genômico, pode usar meus dados como arquivo de teste (como sou homem, também dá para verificar variantes no chrY)
    • Também usei a Dante e queria comparar os resultados das duas empresas
      • A Dante era inconveniente porque a forma de vincular a sequência ao usuário era diferente (o código tinha de ser guardado separadamente)
      • Nunca responderam às minhas perguntas, então não entendi bem como operavam
    • A tecnologia de nanoporos também é realmente fascinante, mas vi no Twitter comentários sobre problemas de controle de qualidade dos dispositivos
      • Um dia quero comparar com o genoma da minha filha também
    • Curiosamente, você tem CYP11B1 rs4541(g;a); talvez você odiasse alcaçuz
      • Você também tem CYP17A1 −34 T>C, rs743572(A;G)
      • Dependendo da combinação genética completa, podem aparecer várias características físicas ou comportamentais
      • Por exemplo, pode haver tendência a baixo peso, ansiedade, acne na adolescência, tontura ao levantar, desejo por sal e distúrbios do sono
      • Também pode haver tendência à deficiência de vitamina D, magnésio e vitaminas do complexo B, o que pode causar vários sintomas físicos e neurológicos (ATM, cãibras musculares, miopia etc.)
      • Com certos genes, também dá para inferir gosto por jogos de tabuleiro estratégicos, probabilidade de ser canhoto, inteligência, padrão de sono, talento visual etc.
      • Mas uma única variante genética não explica tudo, e é essencial ajustar dieta e estilo de vida em consulta com um médico (não sou médico; sou programador e estudo biologia e genômica como hobby)
    • Fico realmente curioso por que você é tão generoso em divulgar seu DNA completo
  • Infelizmente, o MinION Starter Kit de 1000 dólares não é mais vendido, e o link do artigo agora dá 404

    • Agora os produtos MinION com flow cell incluído começam em 4950 dólares
  • Se eu fosse fazer sequenciamento de DNA, eu jamais faria isso a menos que comprasse o equipamento e operasse tudo sozinho em modo totalmente offline

    • Isso traz riscos potenciais não só para minhas informações genômicas, mas também para futuros descendentes e para todo o meu parentesco biológico
    • O pior cenário possível é mais grave do que parece
      • Além disso, o poder de previsão em saúde é quase nulo sem dados epigenéticos
      • Pelo contrário, isso pode acabar prejudicando a saúde por ansiedade ou efeito nocebo
      • Na prática, isso só serve para confirmar um diagnóstico médico, e assim é mais seguro
  • Achei engraçado o uso de uma chaleira elétrica como substituto de PCR (thermocycler)

    • Houve uma época em que se amplificava DNA exatamente assim, alternando recipientes de água quente
    • Se tivessem isolado apenas os leucócitos do sangue para sequenciar, o resultado provavelmente teria sido melhor, mas com lanceta e equipamento mínimo isso não é simples
      • No começo dos anos 2010, em uma aula prática introdutória de biologia, eu experimentei PCR manual trocando banhos térmicos e usando um cronômetro de cozinha
      • Depois, quando usei um thermocycler de verdade, senti ainda mais o valor do equipamento
  • Queria ver dados posteriores àquele gráfico (2001–2015) que mostrava que o custo do sequenciamento caía mais rápido do que a Lei de Moore

    • Só encontro gráficos que vão até 2021, e parece que depois de 2015 o progresso desacelerou
    • Se o nanoporos ficar mais confiável, talvez venha outra mudança revolucionária
    • O gráfico começa em 2001, mas eu participei no meio dos anos 90, no EMBL, do desenvolvimento de sequenciadores por eletroforese em filme fino
      • Naquela época, conseguir algumas centenas de bases por dia já era o máximo
    • Parece que o NHGRI continuou atualizando esse gráfico, mas parou depois de 2022 por falta de verba
      • Olhando bem, parece possível que a era do genoma de 100 dólares chegue dentro de 5 anos
  • Dante e Nebula não têm uma reputação muito boa, e o ySeq tem fila de espera de 8 meses

    • O equipamento de nanoporos apresentado neste artigo também não funciona direito
    • Em 2025, na Europa, não é fácil sequenciar o próprio genoma