Gemini: o modelo de IA mais capaz do Google até agora
(blog.google)Título do resumo: apresentação do novo modelo de IA 'Gemini' do Google e da DeepMind
- Sundar Pichai, CEO do Google e da Alphabet, acredita que a IA trará uma transformação maior do que a transição para o mobile ou para a web.
- O Google, como uma empresa centrada em IA, percorreu uma jornada de 8 anos e, com a IA generativa, passou a permitir que os usuários colaborem e criem de novas maneiras.
- O Google busca ambição em pesquisa e a capacidade de trazer grandes benefícios para a sociedade, ao mesmo tempo em que trabalha com governos e especialistas para lidar com os riscos da IA.
Apresentação do Gemini
- Demis Hassabis, CEO e cofundador do Google DeepMind, acredita que a IA trará benefícios extraordinários para a humanidade.
- O Gemini é o modelo mais capaz já criado por meio de uma colaboração em larga escala entre equipes do Google, podendo compreender e operar com diversos tipos de informação, como texto, código, áudio, imagem e vídeo.
- O Gemini 1.0 foi otimizado em três tamanhos e pode funcionar com eficiência desde data centers até dispositivos móveis.
Desempenho de ponta
- Os modelos Gemini apresentam desempenho que supera os atuais resultados de ponta em várias tarefas.
- O Gemini Ultra registrou 90,0% no MMLU, mostrando desempenho superior ao de especialistas humanos.
- Também supera modelos anteriores em benchmarks de imagem, mostrando sinais iniciais da capacidade de raciocínio complexo do Gemini.
Capacidades de próxima geração
- O Gemini é multimodal por natureza, e sua capacidade de compreensão e raciocínio em diferentes modalidades é muito superior à dos modelos anteriores.
- O Gemini 1.0 se destaca especialmente na extração de conhecimento de documentos complexos e na explicação de raciocínio em temas complexos como matemática e física.
- O Gemini pode compreender e gerar código de alta qualidade, sendo um dos principais modelos fundacionais em tarefas entre linguagens de programação e em raciocínio sobre informações complexas.
Mais confiável, escalável e eficiente
- O Gemini 1.0 foi treinado em larga escala usando a infraestrutura otimizada para IA do Google e os TPUs v4 e v5e.
- O Gemini roda mais rápido que os modelos anteriores e conta com aceleradores de IA personalizados, que desempenham papel central nos produtos de IA do Google.
- O Google anunciou o Cloud TPU v5p para acelerar o desenvolvimento do Gemini e permitir que desenvolvedores treinem modelos de IA em larga escala com mais rapidez.
Construído com responsabilidade e segurança no centro
- O Google adicionou novas medidas de proteção levando em conta as capacidades multimodais do Gemini e considerou riscos potenciais em todas as etapas do desenvolvimento.
- O Gemini passou pela avaliação de segurança mais abrangente entre os modelos de IA do Google, e a empresa trabalhou com especialistas externos para identificar pontos cegos em seus métodos internos de avaliação.
- O Gemini usa classificadores de segurança e filtros robustos para identificar e classificar conteúdos como violência ou estereótipos negativos.
Levando o Gemini ao mundo
- O Gemini 1.0 está sendo incorporado aos produtos e plataformas do Google, e o Bard usa uma versão avançada do Gemini Pro para oferecer raciocínio e compreensão mais avançados.
- Desenvolvedores e clientes corporativos podem acessar o Gemini Pro pelo Google AI Studio ou pelo Google Cloud Vertex AI.
- O Gemini Ultra será disponibilizado a clientes selecionados, desenvolvedores, parceiros e especialistas para feedback em estágio inicial, após passar por verificações de confiabilidade e segurança.
Opinião do GN⁺
O ponto mais importante deste artigo é que o Google e a DeepMind desenvolveram um novo modelo de IA chamado Gemini, abrindo uma nova era para a tecnologia de IA. O Gemini tem capacidades multimodais, o que lhe permite compreender e processar diferentes tipos de informação, como texto, imagem e áudio, oferecendo a desenvolvedores e empresas a oportunidade de criar produtos e serviços ainda mais inovadores. O que torna este artigo interessante é que ele apresenta exemplos concretos de como a tecnologia de IA pode transformar a vida humana e mostra a abordagem do Google sobre como esse avanço tecnológico deve ser conduzido com responsabilidade.
1 comentários
Também é um post duplicado no HN, então vejam o que eu publiquei separadamente no GeekNews: Google revela o modelo de IA Gemini.