Anúncio do modelo Gemini 1.5 Flash
- Novo modelo multimodal tão poderoso quanto o Gemini 1.5 Pro, mas otimizado para tarefas mais específicas, frequentes e de baixa latência
- Mais adequado para gerar respostas rápidas
- As capacidades de tradução, raciocínio e programação do Gemini 1.5 também foram aprimoradas
- A janela de contexto do Gemini 1.5 Pro (quantidade de informação que pode absorver) dobrou de 1 milhão para 2 milhões de tokens
Project Astra: a visão de futuro de IA ao estilo Star Trek do Google
- Um assistente de IA multimodal que tem como objetivo ver e compreender por meio da câmera do dispositivo, lembrar a localização de objetos e executar tarefas em nome do usuário
- Foi aplicado à maioria das demos mais impressionantes deste I/O
- O objetivo é se tornar um verdadeiro agente de IA que vai além de apenas conversar e realmente executa tarefas em nome do usuário
Veo: geração de vídeo do Google no estilo Sora
- Novo modelo de IA generativa do Google para competir com o Sora da OpenAI, capaz de gerar vídeos em 1080p a partir de prompts baseados em texto, imagem e vídeo
- Pode produzir vídeos em vários estilos, como tomadas aéreas ou timelapse, e pode ser ajustado com prompts adicionais
- Já está sendo oferecido a alguns criadores para uso na produção de vídeos para o YouTube, e o Google também o apresenta como útil para produção cinematográfica
Integração do Gemini com o Workspace
- O Gemini 1.5 Pro, modelo de linguagem de próxima geração, foi integrado à barra lateral do Docs, Sheets, Slides, Drive e Gmail
- Deve ser disponibilizado no próximo mês para assinantes pagos e atuará como um assistente geral dentro do Workspace
- Pode buscar informações em todo o conteúdo do Drive
- Pode executar tarefas como redigir e-mails combinando informações do documento que você está vendo no momento ou lembrar você de responder mais tarde a um e-mail que está lendo
Expansão dos recursos do Google Lens
- Agora será possível pesquisar não apenas com imagens, mas também com vídeos
- Foi adicionada uma função em que, ao gravar um vídeo e fazer uma pergunta, a IA do Google encontra respostas relevantes na web
Uso do Gemini no Google Photos
- O recurso "Ask Photos", previsto para este verão, analisará a biblioteca do Google Photos do usuário para responder perguntas
- Vai além de apenas encontrar fotos de cães ou gatos e também pode responder a perguntas complexas, como perguntar o número da placa do próprio carro, como demonstrou o CEO Sundar Pichai
Gems: criação de chatbots personalizados no Gemini
- Assim como os GPTs da OpenAI, o Gems permitirá que o usuário dê instruções ao Gemini para personalizar a forma de resposta e a área de especialidade
- Por exemplo, em breve será possível ter um treinador de corrida positivo e persistente que ofereça motivação diária e planos de corrida (no caso de assinantes do Gemini Advanced)
Melhoria nas capacidades de conversa do Gemini
- O novo recurso Gemini Live tem como objetivo tornar o chat por voz com o Gemini mais natural
- A voz do chatbot ganha mais personalidade, e o usuário poderá interromper no meio da fala ou pedir que ele receba informações em tempo real pela câmera do smartphone
- O Gemini será integrado ao Google Calendar, Tasks e Keep para atualizar ou buscar informações, além de usar recursos multimodais para adicionar detalhes de um panfleto ao calendário pessoal, por exemplo
Circle to Search com suporte para resolver problemas de matemática
- Agora, ao circular um problema de matemática em um celular ou tablet Android, será possível receber ajuda para resolvê-lo
- A IA do Google não resolverá diretamente o problema para não incentivar estudantes a colar na lição de casa, mas vai dividi-lo em etapas para facilitar a conclusão
Reformulação da Busca do Google com IA
- O "AI Overviews" (antes chamado de "Search Generative Experience") deve ser lançado em todos os Estados Unidos nesta semana
- Agora um modelo Gemini "especializado" vai estruturar a página de resultados de busca e preenchê-la com respostas resumidas da web (semelhante ao que se vê em ferramentas de busca com IA como Perplexity ou Arc Search)
Detecção de golpes com IA no Android
- O Google afirma que, usando a IA Gemini Nano no dispositivo, celulares Android poderão detectar sinais de alerta, como padrões comuns de conversa de golpistas, e exibir avisos em tempo real para ajudar a evitar chamadas fraudulentas
- Mais detalhes sobre esse recurso serão divulgados no fim deste ano
Mais inteligência de IA em dispositivos Android
- O Google informou que em breve o Gemini permitirá que o usuário faça perguntas sobre um vídeo exibido na tela e responderá com base nas legendas automáticas
- No caso de usuários pagos do Gemini Advanced, ele também poderá absorver PDFs para fornecer informações
- Essas atualizações multimodais e outras novidades do Gemini no Android serão disponibilizadas nos próximos meses
Assistente de IA chegando ao Google Chrome
- O Google anunciou que adicionará ao Chrome no desktop uma versão leve, o Gemini Nano
- O assistente integrado usará IA no dispositivo para ajudar diretamente dentro do Google Chrome na geração de texto para postagens em redes sociais, avaliações de produtos e mais
Upgrade na marca d’água de IA SynthID
- O Google informou que ampliará os recursos do SynthID
- Ele inserirá marca d’água no conteúdo gerado pelo novo gerador de vídeo Veo, e agora também será capaz de detectar vídeos gerados por IA
6 comentários
É suficiente que o chatbot seja oferecido gratuitamente, e como não uso recursos relacionados a imagem, vídeo ou áudio, fico feliz em ver isso sendo integrado aos produtos existentes.
Avanços no Project Astra AI do Google e na geração de vídeo
Os modelos Gemini do Google já são amplamente usados por mais de 1,5 milhão de desenvolvedores para depuração de código, obtenção de insights e criação de aplicações de IA. O Project Astra está introduzindo agentes de IA capazes de processar com eficiência informações de entrada em vídeo e voz, além de um novo modelo avançado de vídeo generativo chamado Vo. O Vo pode produzir vídeos em 1080p de alta qualidade a partir de prompts de texto, imagem e vídeo, oferecendo um nível inédito de controle criativo. Desenvolvida pela DeepMind do Google, essa tecnologia tem como objetivo tornar reais ideias que antes eram impossíveis.
A TPU de 6ª geração do Google e uma reformulação inovadora em IA
O Google planeja lançar no fim de 2024 a Trillium, sua TPU de 6ª geração, com desempenho computacional 4,7 vezes maior por chip, e disponibilizá-la para clientes de nuvem. Além disso, está introduzindo novas CPUs e GPUs, incluindo o processador Axion e as GPUs Blackwell da NVIDIA, para dar suporte a diferentes cargas de trabalho; estas últimas devem estar disponíveis no início de 2025. O Google também está lançando o Gemini, uma experiência de busca totalmente renovada e baseada em IA, com alta satisfação dos usuários, começando pelos Estados Unidos. Esse novo modelo de busca permite consultas mais complexas e pesquisa por fotos, além de fornecer resultados organizados para uma experiência de usuário ainda melhor.
Novos recursos de IA do Google e inovações futuras
O Google está introduzindo uma nova página de resultados de busca organizada por IA, começando com alimentos e receitas e depois se expandindo para outras categorias. A IA pode usar fatores contextuais, como a estação do ano, para fornecer uma visão geral das causas de um problema e das etapas para resolvê-lo. Em breve, a IA do Google, Gemini, também oferecerá experiências ao vivo com especialistas pessoais personalizados chamados "Gems" e será integrada ao Project Astra para recursos de compreensão de vídeo.
Apresentando o Gemini, o novo assistente de IA para Android
O Gemini é o novo assistente de IA para Android, oferecendo experiências de IA no dispositivo com foco em privacidade de dados. Ele foi projetado para fornecer sugestões contextuais, como ajudar nos estudos e oferecer orientações passo a passo para problemas complexos. Além disso, o Gemini pode ajudar em tarefas como encontrar imagens e responder a perguntas específicas, integrando-se de forma fluida ao fluxo de trabalho do usuário.
O impacto do Gemini do Google no uso de smartphones
O Gemini do Google oferece recursos de IA para usuários de smartphones, permitindo acesso fácil a informações contidas em documentos e respostas claras para perguntas específicas. O modelo fundamental executado no dispositivo melhora a experiência no smartphone ao priorizar a privacidade do usuário e fornecer respostas mais rápidas. O futuro modelo Gemini Nano ampliará ainda mais essas possibilidades ao permitir que os celulares compreendam o mundo por meio de texto, visão, som e linguagem falada.
Corely, os principais pontos do YouTube em 10 segundos! - https://corely.ai/content/google-io-2024-everything-revealed
Gemini Flash
Google DeepMind Veo
https://killedbygoogle.com
Fico me perguntando quando o Gemini vai entrar nessa lista. Se não der dinheiro, a Google tem o costume de encerrar sem apego, então acabo não conseguindo me afeiçoar.
Se não tivesse havido o anúncio do GPT-4o, teria sido uma apresentação bem razoável, mas acabou ficando bem sem graça.
Do ponto de vista do Google, eles devem estar com muita raiva da OpenAI.
A OpenAI lançou o pedra, papel e tesoura que o Google demonstrou há um tempo, mas o Google ainda está longe disso... Vi essa apresentação pensando em quando será que vão conseguir implementar o que mostraram desta vez também kkk