16 pontos por xguru 2023-12-07 | 7 comentários | Compartilhar no WhatsApp
  • Gemini é o primeiro modelo de IA a superar especialistas humanos no MMLU, com 90%
  • Como modelo de IA multimodal, também supera GPT-4V e Whisper em benchmarks multimodais de imagem/vídeo/áudio
  • Otimizado em três versões de acordo com o tamanho
    • Ultra: o maior e mais avançado modelo para tarefas complexas
    • Pro: escalável para uma ampla variedade de tarefas
    • Nano: o modelo mais eficiente para tarefas on-device
  • Entende, explica e gera código de alta qualidade nas linguagens de programação mais usadas do mundo, como Python, Java, C++, Go e outras
  • Também foi lançado o AlphaCode 2 para programação competitiva usando Gemini
  • Gemini 1.0 foi treinado em larga escala em uma infraestrutura otimizada para IA usando TPU v4 e v5e
    • Mais estável, escalável e eficiente
  • Ênfase em responsabilidade e segurança
    • Foram realizadas avaliações abrangentes de segurança
  • Gemini Pro já pode ser usado diretamente no Google Bard
    • Disponível em inglês em 170 países, com suporte a outras modalidades e novos idiomas previsto em breve
  • Gemini Nano será introduzido no Pixel 8 Pro
  • Nos próximos meses, o Gemini também será aplicado à Busca, Ads, Chrome e Duet AI
  • A partir de 13 de dezembro, desenvolvedores e clientes corporativos poderão usar a API do Gemini por meio do Google AI Studio e do Google Cloud Vertex AI (apenas Pro)
  • Gemini Ultra também estará disponível em breve
    • Está concluindo amplas verificações de confiança e segurança, incluindo validação de red team por organizações externas confiáveis, e sendo ainda mais refinado com ajuste fino e aprendizado por reforço com feedback humano (RLHF) antes da disponibilização ampla
    • Após disponibilizar o Gemini Ultra para alguns clientes, desenvolvedores, parceiros e especialistas em segurança e responsabilidade para experimentação inicial e coleta de feedback, a empresa pretende liberá-lo para desenvolvedores e clientes corporativos no início do próximo ano
    • No início do próximo ano, começando pelo Gemini Ultra, também será lançado o Bard Advanced, um novo ambiente de IA de ponta com acesso aos melhores modelos e recursos

7 comentários

 
wedding 2023-12-09

Quando vi o vídeo, pensei: "O Bard era tão ruim assim, e isso já superou tudo aquilo?"

Parece que era um vídeo encenado. Nesse caso, isso não é fraude?..
https://www.tomshardware.com/news/google-gemini-ai-video-staged

 
botplaysdice 2023-12-08

Lembro daquele tuíte: "Alguns acham que o Google está ficando para trás em IA, mas eles estão em um outro nível só deles".

Hoje as ações do Google subiram bastante.

 
ganadist 2023-12-07

Parece que o nano pode ser usado no Pixel 8 Pro.... só isso
https://blog.google/products/pixel/pixel-feature-drop-december-2023/

No escopo de aplicação, só tem o Voice Recorder, que não oferece suporte a coreano, e o gboard, no qual é preciso fazer opt-in separadamente para a beta.

 
xguru 2023-12-07

Então não é por isso que eles não vendem o Pixel na Coreia, né..? haha
Eu ainda tenho o meu Pixel 1 T_T

 
ragingwind 2023-12-07

Finalmente saiu. Fico na expectativa para ver como será quando for aplicado de forma ampla aos produtos do Google.

 
xguru 2023-12-07

O vídeo mais interessante é Hands-on with Gemini: Interacting with multimodal AI.
Como tem cerca de 6 minutos, vale muito a pena assistir. Se a IA multimodal continuar evoluindo, aquele Jarvis que víamos nos filmes vai mesmo se tornar realidade.

 
kuroneko 2023-12-07

O GPT-4 Vision também foi impressionante, mas parece que a era do verdadeiro Jarvis está mesmo chegando... +_+