2 pontos por GN⁺ 2025-02-07 | 1 comentários | Compartilhar no WhatsApp
  • Disponibilidade geral do Gemini 2.0

    • A série de modelos Flash, apresentada pela primeira vez no I/O 2024, é um conjunto poderoso de modelos otimizado para tarefas de alto volume e alta frequência, e vem ganhando popularidade entre desenvolvedores
    • O 2.0 Flash agora está geralmente disponível para mais usuários, com desempenho aprimorado nos principais benchmarks
    • Recursos de geração de imagens e conversão de voz também serão adicionados em breve
  • Modelo experimental 2.0 Pro: melhor desempenho em programação e tratamento de prompts complexos

    • O Gemini 2.0 Pro é o modelo com melhor desempenho em programação e na capacidade de lidar com prompts complexos, com compreensão do conhecimento global e capacidade de raciocínio aprimoradas
    • Oferece a maior janela de contexto, com 2 milhões de tokens, permitindo analisar e compreender de forma abrangente grandes volumes de informação
    • Está disponível como modelo experimental para desenvolvedores no Google AI Studio e no Vertex AI, e também pode ser usado por usuários do Gemini Advanced
  • 2.0 Flash-Lite: o modelo com melhor custo-benefício

    • Com base no feedback positivo sobre preço e velocidade do 1.5 Flash, o 2.0 Flash-Lite oferece melhor qualidade pelo mesmo custo e velocidade
    • Supera o 1.5 Flash na maioria dos benchmarks e oferece suporte a janela de contexto de 1 milhão de tokens e entrada multimodal
    • Está disponível em prévia pública no Google AI Studio e no Vertex AI
  • Trabalho de responsabilidade e segurança

    • À medida que a família de modelos Gemini se torna mais poderosa, a empresa continua investindo em medidas robustas para garantir uso seguro e protegido
    • Usando novas técnicas de aprendizado por reforço, o próprio Gemini passa a criticar suas respostas para fornecer feedback mais preciso e orientado a objetivos
    • Equipes automatizadas de red team estão sendo usadas para avaliar o risco de ataques de cibersegurança, como injeção indireta de prompt

1 comentários

 
GN⁺ 2025-02-07
Comentários do Hacker News
  • Há confusão por falta de informações claras sobre os modelos Gemini. Também faltam informações sobre o Gemini Advanced incluído na assinatura do Google Workspace.

    • Existe apenas o nome "Gemini Advanced", sem opção de escolher o modelo.
    • O Google AI Studio é focado em criar apps wrapper de LLM, mas não é adequado para usuários que só querem respostas para perguntas.
    • As informações obtidas por busca são incertas, e há a informação de que o Gemini Advanced está incluído na assinatura do Workspace.
    • Na página gemini.google.com não há nenhuma informação sobre os modelos, e a única opção de configuração disponível é mudar para o modo escuro.
  • É possível acessar a API do Gemini pelo Google AI Studio e pelo Vertex AI.

    • Existem vários modelos, como Gemini 2.0, 2.0 Pro, 2.0 Pro Experimental, Gemini 2.0 Flash e Gemini 2.0 Flash Lite.
    • Os benchmarks são comparados apenas com os próprios modelos da empresa.
  • Há restrições sobre temas políticos durante chats por voz.

    • Quando um usuário falava sobre planejar refeições, isso foi interpretado por engano como tema político, e a conversa foi restringida.
  • Os nomes dos modelos de IA são confusos.

    • Convenções como Flash e Flash-Lite são difíceis de entender.
    • Há a opinião de que a qualidade dos modelos do Google é inferior à de outros grandes concorrentes.
  • No parsing de PDF, a relação custo-benefício é excelente.

    • O Gemini Flash-Lite é eficiente em custo, e há expectativa por benchmarks da versão Lite.
  • É possível testar novos modelos no AI Studio.

    • O modo ao vivo permite conversas em tempo real, e a câmera pode ser usada para ver o mundo ao redor.
  • O preço do Gemini 2.0 Flash-Lite é mais baixo que o do GPT-4o mini da OpenAI.

    • Os preços para entrada de texto/imagem e entrada de áudio são relativamente mais baixos.
  • O modelo Gemini Pro 2.0 é impressionante.

    • É adequado para tarefas cognitivas gerais como pesquisa, análise e escrita.
    • Recomenda-se usá-lo pelo AI Studio, já que o app Gemini tem muitos filtros e pode limitar respostas sobre temas potencialmente controversos.
  • O Gemini 2.0 Flash é excelente em tarefas multimodais.

    • É adequado para trabalho com documentos e detecção de objetos, com ótima relação custo-benefício.
    • Os modelos Qwen2.5 VL 72B e 7B apresentam desempenho melhor em tarefas com imagens de documentos.
  • O modelo Gemini 2.0 Pro Experimental está recebendo atenção.

    • Tem ótimo desempenho no tratamento de prompts complexos e em programação, além de oferecer uma janela de contexto de 2 milhões de tokens.