O que é Gemini? Tudo sobre a IA do Google

banner_posts

O Google anunciou o Gemini 1.0 em 6 de dezembro de 2023, desenvolvido pela divisão DeepMind da Alphabet (empresa mãe). Desde que o ChatGPT estreou, o Google tenta correr atrás dos prejuízos e desenvolver um modelo IA que possa disputar espaço contra o ChatGPT no mercado. 

Então, com o Gemini, o Google espera acirrar essa disputa, visto que o modelo substitui o Bard e o Pathways Language Model (PaLM 2) como modelo LLMs mais avançado. Leia esse artigo completo e saiba mais sobre o novo modelo IA do Google, o Gemini!

Neste artigo você encontrará:

  • O que é o Gemini e como ele funciona.
  • As diferenças entre as versões Ultra, Pro e Nano.
  • Comparação com o GPT-4 e outros modelos de IA.
  • Preços e como acessar.
  • Links para mais informações.

O que é Gemini

Sundar Pichai e O que é Gemini.
Sundar Pichai apresentando o novo modelo IA do Google.

O Gemini é um modelo de IA avançado do Google multimodal, capaz de efetuar as funções básicas dos LLMs, como entender e gerar texto, mas também naturalmente processa e entende imagens, áudios, vídeos e códigos, respondendo a informações mais complexas de modo integrado. 

Ou seja, o Gemini é um modelo versátil e adaptável para diferentes atividades, que vão desde a tradução e criação de conteúdo até a integração com aplicativos e ferramentas de pesquisa. 

O Google desenvolveu o Gemini como uma família, assim como o GPT da OpenAI, desse modo, todos os modelos Gemini receberam treinamento para que trabalhem de modo multimodal nativamente (compreendam e processem diferentes tipos de informações), diferenciando os modelos de outras inteligências artificiais. 

Para o DeepMind, responsável pelo desenvolvimento do Gemini, que agora está na versão 1.5, o modelo oferece um desempenho aprimorado e eficiente, contando com um recurso experimental, mas chamado de inovador: compreensão de longo contexto.

Veja também: Cultivo de Castanha de Caju: Do Pé à Mesa

Como funciona o Gemini Google?

O Gemini conta com diferentes versões, cada uma apresenta um potencial de funcionamento diferente. Então, analisando os últimos artigos que o Google e a DeepMind disponibilizaram, conseguimos compreender melhor o funcionamento do Gemini.

Sundar Pichai e Demis Hassabis, CEOs do Google e do DeepMind, respectivamente, apresentaram o Gemini como novo modelo IA do Google em dezembro de 2023, desde então, algumas novas atualizações aparecem no modelo. 

O Gemini foi apresentado como o modelo “mais capaz e geral” da empresa, construído do zero como um modelo multimodal e também flexível, possuindo três versões: Gemini Ultra, Gemini Pro, Gemini Nano. 

O Gemini Ultra obteve 90% de pontuação no MMLU (massive multitask language understanding), um teste que combina 57 disciplinas em diferentes áreas para testar o conhecimento do mundo e habilidades de resolução de problemas. Com essa pontuação, o Gemini Ultra foi o primeiro modelo a superar especialistas humanos. Em comparação, o GPT-4 obteve 86.4%, mas isso não significa que o Gemini Ultra seja superior, como veremos posteriormente.

Comparação do Gemini
Imagem ilustrada do Google. Comparação entre os modelos.

O Gemini Ultra também conseguiu uma ótima pontuação em outro benchmark, que consiste em tarefas multimodais. 

Na prática, o Gemini, desde sua primeira versão, consegue entender, explicar e gerar código de alta qualidade nas linguagens de programação mais populares, como Java e Python, compreender texto, imagens, áudio e outras informações de maneira avançada, conta com um raciocínio avançado e recursos de última geração.

Projetado para alimentar produtos Google

Um dos motivos pelo qual o Gemini foi projetado é justamente para alimentar produtos e aplicativos desenvolvidos pelo Google. Por exemplo, quando você entra na página inicial do Bing, mecanismo de buscas da Microsoft, você consegue acessar um gerador de imagem IA e também um chatbot, diretamente do Bing. A Microsoft também integrou o GPT em outros produtos da companhia, como no Office. 

Dessa maneira, Google quer justamente utilizar essa mesma estratégia e integrar o Gemini nos produtos da companhia e desenvolveu o modelo com essa capacidade de integração.

Então, não será incomum encontrar uma variação do Gemini em diferentes produtos do Google, seja no navegador ou no próprio mecanismo de buscas da empresa.

Modelos do Gemini 

O que é Gemini
Ilustração.

Como citamos anteriormente, o Gemini está disponível em três modelos, cada um projetado para efetuar diferentes 

Gemini Ultra

Modelo mais avançado, projetado principalmente para tarefas complexas (foi esse modelo que superou o GPT-4 no MMLU).

O modelo consegue gerar imagens sem intermediários, diferente do GPT-4, estando disponível para desenvolvedores de aplicativos e plataformas, porém, não gratuitamente.

baseada na web do Google para desenvolvedores de aplicativos e plataformas. Ele também alimenta os aplicativos Gemini – mas não de graça. O acesso ao Ultra por meio do que o Google chama de Gemini Advanced requer a assinatura do plano Google One AI Premium, ao preço de 96 reais por mês. 

Com o plano, é possível conectar o Gemini à sua conta do Google, utilizando ele nos produtos Google, como no Gmail, documentos ou Google Meet.

Gemini Pro

Modelo mais dinâmico e equilibrado, projetado para ser utilizado em diferentes atividades. O Gemini Pro conta com duas versões: 1.0 e 1.5, entretanto, a versão 1.5, considerada bastante superior, está disponível apenas para uma parcela selecionada de usuários, ou no Vertex AI (pago).

O 1.5 Pro consegue analisar até 11 horas de áudio ou uma hora de vídeo, em diferentes idiomas, possuindo 35x mais capacidade de processamento de texto (suporte), também chamado de Long Context Window. No caso, essa janela de contexto longo funciona da seguinte maneira: o modelo IA consegue lembrar de informações conversadas no chat mesmo após muitas conversas, não esquecendo do que você compartilhou com ela. 

Gemini Nano

O Nano é uma versão mais leve e capaz, projetada para funcionar em telefones para que não necessite enviar essas informações para algum servidor. O Nano possui duas versões, uma superior e uma inferior. 

Atualmente, o Nano está integrado ao GBoard, aplicativo de teclado do Google, para desenvolvedores.

banner_posts

 

Gemini vs GPT

O Gemini Ultra demonstra superioridade sobre o GPT-4 e o GPT-4V em grande parte dos testes de desempenho, apesar de ainda não estar acessível ao público. De fato, paralelamente, um estudo realizado de forma independente apontou que o Pro não alcança o desempenho do GPT-3.5 turbo em diversos desses mesmos testes.

Em relação aos preços, o GPT-4 possui valor de vinte dólares, o mesmo que o Ultra, mas aqui está uma pequena diferença: o Ultra, no Brasil, possui valor de 96 reais, enquanto que o GPT-4 supera os 102 reais. 

No geral, os modelos demonstram uma incrível capacidade de resolução de problemas e funcionam em diferentes atividades e idiomas. Porém, apenas o modelo Pro está disponível para o usuário final.

Preço

Como informado anteriormente, o valor do Gemini Ultra no Brasil é de aproximadamente 20 dólares ou 100 reais, sofrendo variações pelo câmbio da moeda. Em suma, para isso, basta acessar o “Advanced”. A assinatura do Advanced também fornece Gemini no Gmail, Google Documentos e outros, 2 TB de armazenamento e benefícios do Google One Premium.

Também é possível acessar a versão Pro 1.5, mas para isso o usuário precisaria assinar o Vertex AI do Google ou o Studio.

Como acessá-lo

De fato, o Gemini Pro está disponível para os usuários, substituindo o Google Bard, basta pesquisar “Google Gemini” ou acessar: gemini.google.com

No momento, não há acesso público geral ao Gemini Pro 1.5, mas os usuários podem entrar na fila de espera do Al Studio. Portanto, para isso você precisará se inscrever no Google AI Studio.

  • Dirija-se ao Google AI Studio. Clique: Google AI Studio.
  • Você precisará especificar seu campo, juntamente com o que você espera usar o Gemini 1.5 Pro.
  • O próximo passo é tão simples quanto os dois primeiros passos – basta clicar em Inscrever-se! Você receberá um e-mail no devido tempo quando o 1.5 Pro estiver disponível para sua Conta do Google.

Pronto, agora você pode esperar pela versão 1.5 e, enquanto você espera, que tal compreender como uma das maiores empresas de agricultura do Brasil está utilizando o metaverso para disponibilizar informações para investidores e acionistas sobre a forma que opera? Veja mais: Farm Day da SLC Agrícola no Metaverso.

A sua empresa ou marca também pode aproveitar o metaverso, saiba mais.

INFORMAÇÕES SOBRE AGRISPACE – O METAVERSO DO AGRO [email protected] ou pelo WhatsApp clicando Aqui!!

Quer ficar por dentro de nossas postagens e notícias, entre em nosso canal no WhatsApp e venha conosco, descobrir o mundo do metaverso

Leia também: Imagen 2: Modelo IA de geração de imagem do Google

Deixar um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.