Google revela o modelo de IA Gemini
(blog.google)- Gemini é o primeiro modelo de IA a superar especialistas humanos no MMLU, com 90%
- Como modelo de IA multimodal, também supera GPT-4V e Whisper em benchmarks multimodais de imagem/vídeo/áudio
- Otimizado em três versões de acordo com o tamanho
- Ultra: o maior e mais avançado modelo para tarefas complexas
- Pro: escalável para uma ampla variedade de tarefas
- Nano: o modelo mais eficiente para tarefas on-device
- Entende, explica e gera código de alta qualidade nas linguagens de programação mais usadas do mundo, como Python, Java, C++, Go e outras
- Também foi lançado o AlphaCode 2 para programação competitiva usando Gemini
- Gemini 1.0 foi treinado em larga escala em uma infraestrutura otimizada para IA usando TPU v4 e v5e
- Mais estável, escalável e eficiente
- Ênfase em responsabilidade e segurança
- Foram realizadas avaliações abrangentes de segurança
- Gemini Pro já pode ser usado diretamente no Google Bard
- Disponível em inglês em 170 países, com suporte a outras modalidades e novos idiomas previsto em breve
- Gemini Nano será introduzido no Pixel 8 Pro
- Nos próximos meses, o Gemini também será aplicado à Busca, Ads, Chrome e Duet AI
- A partir de 13 de dezembro, desenvolvedores e clientes corporativos poderão usar a API do Gemini por meio do Google AI Studio e do Google Cloud Vertex AI (apenas Pro)
- Gemini Ultra também estará disponível em breve
- Está concluindo amplas verificações de confiança e segurança, incluindo validação de red team por organizações externas confiáveis, e sendo ainda mais refinado com ajuste fino e aprendizado por reforço com feedback humano (RLHF) antes da disponibilização ampla
- Após disponibilizar o Gemini Ultra para alguns clientes, desenvolvedores, parceiros e especialistas em segurança e responsabilidade para experimentação inicial e coleta de feedback, a empresa pretende liberá-lo para desenvolvedores e clientes corporativos no início do próximo ano
- No início do próximo ano, começando pelo Gemini Ultra, também será lançado o Bard Advanced, um novo ambiente de IA de ponta com acesso aos melhores modelos e recursos
7 comentários
Quando vi o vídeo, pensei: "O Bard era tão ruim assim, e isso já superou tudo aquilo?"
Parece que era um vídeo encenado. Nesse caso, isso não é fraude?..
https://www.tomshardware.com/news/google-gemini-ai-video-staged
Lembro daquele tuíte: "Alguns acham que o Google está ficando para trás em IA, mas eles estão em um outro nível só deles".
Hoje as ações do Google subiram bastante.
Parece que o nano pode ser usado no Pixel 8 Pro.... só isso
https://blog.google/products/pixel/pixel-feature-drop-december-2023/
No escopo de aplicação, só tem o Voice Recorder, que não oferece suporte a coreano, e o gboard, no qual é preciso fazer opt-in separadamente para a beta.
Então não é por isso que eles não vendem o Pixel na Coreia, né..? haha
Eu ainda tenho o meu Pixel 1 T_T
Finalmente saiu. Fico na expectativa para ver como será quando for aplicado de forma ampla aos produtos do Google.
O vídeo mais interessante é Hands-on with Gemini: Interacting with multimodal AI.
Como tem cerca de 6 minutos, vale muito a pena assistir. Se a IA multimodal continuar evoluindo, aquele Jarvis que víamos nos filmes vai mesmo se tornar realidade.
O GPT-4 Vision também foi impressionante, mas parece que a era do verdadeiro Jarvis está mesmo chegando... +_+