O Gemini, novo modelo de linguagem de inteligência artificial (IA) do Google, chega como um dos principais concorrentes do ChatGPT. A ferramenta é um modelo multimodal de IA, integrado ao chatbot Bard, permite o processamento simultâneo de dados em texto, imagem, vídeo e áudio. Em testes, a ferramenta apresentou desempenho comparável e até superior ao do GPT-3.5 e GPT-4, modelos de linguagem usados atualmente no software da OpenAI. A funcionalidade está disponível em 170 países, incluindo o Brasil, e promete respostas mais precisas, além de incorporar uma camada adicional de segurança para prevenir a disseminação de informações falsas e discriminatórias.
Apenas alguns recursos do sistema foram disponibilizados ao público e ainda é cedo para saber se a proposta do Google será capaz de superar a popularidade da ferramenta da OpenAI. Mas, com sua versão "turbinada", o Bard promete entrar de vez na disputa entre chatbots. A seguir, confira o que se sabe até agora sobre o Gemini e veja a comparação entre a nova tecnologia e o ChatGPT.
📝 Quais são os chatbots mais inteligentes para conversar com IA? Veja no Fórum do TechTudo
O que é Gemini e como ele funciona?
O Gemini é a maior e mais recente tecnologia de inteligência artificial lançada pelo Google. A versão 1.0 já foi incorporada ao chatbot da empresa, o Bard, em mais de 170 países, incluindo o Brasil. Por enquanto, a novidade está disponível apenas para instruções por meio de textos em inglês, mas outros idiomas devem ser anunciados em breve. Vale lembrar que, para experimentar as novidades, os usuários precisam definir o inglês como idioma padrão da Conta Google, garantindo que o Bard funcionará nesta língua. Com a nova tecnologia, o bot do Google promete expandir a capacidade de compreensão, resumo, raciocínio, criação de códigos e planejamento. A ferramenta surge como uma das maiores rivais do ChatGPT, com o diferencial de comportar diferentes formatos de conteúdo — como textos, códigos, imagens e vídeos — de forma simultânea.
O sistema foi apresentado em três tamanhos diferentes: o Gemini Nano está disponível para dispositivos móveis; o Gemini Pro é adequado para diversas tarefas e é o modelo incorporado pelo Bard; já o Gemini Ultra, considerado o mais avançado, é ideal para tarefas complexas com diversos formatos de informações e análise de grande volumes de dados. O modelo foi treinado com um grande volume de dados oriundos de diversas fontes, como livros, artigos, sites e código-fonte. Esse aprendizado garante uma abordagem mais ampla do que outros modelos de linguagem, que geralmente treinados em conjuntos de informações limitados — como a versão gratuita do ChatGPT, por exemplo.
O que é o ChatGPT e como ele funciona?
O ChatGPT, desenvolvido pela OpenAI, é baseado na arquitetura GPT-3.5, um tipo de modelo de linguagem pré-treinado, alimentado com um enorme conjunto de dados de texto e códigos. A ferramenta aprende a identificar padrões e relacionamentos no texto para gerar repostas mais precisas e naturais. O ChatGPT foi otimizado para conversar usando o chamado Aprendizado por Reforço com Feedback Humano (RLHF, em inglês), um método que usa demonstrações humanas e comparações de preferências para orientar a ferramenta a adotar o comportamento desejado pelo usuário.
O bot da OpenAI é capaz de realizar diversas tarefas, como auxílio à escrita, tradução e interação com clientes. Também tem uso criativo, podendo propor poemas, histórias e roteiros, além de servir para revisar e melhorar textos pré-existentes. No entanto, a base de dados utilizada pelo chatbot é limitada a publicações na web feitas até o ano de 2021. Já o ChatGPT Plus, a versão mais avançada do software, utiliza o modelo de linguagem GPT-4. Com a tecnologia, a ferramenta consegue fornecer resultados baseados em buscas em tempo real e com mais compreensão de contexto. Até o momento, esse modelo de linguagem só está disponível mediante assinatura.
Qual a diferença entre o Gemini e o ChatGPT?
A principal diferença entre o Bard com Gemini Pro e o ChatGPT — na versão gratuita — são as fontes de dados usadas para treinar suas plataformas. O aprendizado do Gemini foi projetado para processar diferentes formatos de dados ao mesmo tempo (como textos, códigos, áudios, imagens estáticas e vídeos), o que permite trabalhar com uma variedade de informações antes mesmo de gerar seus feedbacks. Além disso, o chatbot é gratuito e tem acesso à Internet em tempo real. Já o GPT 3.5, versão pública do ChatGPT, é treinado em um conjunto predefinido de dados, que não é atualizado desde 2021.
Como o Google ainda não disponibilizou todos os recursos do Gemini para testes, ainda é cedo para fazer uma comparação mais detalhada entre a plataforma e sua concorrência. Além disso, por se tratar de sistemas em desenvolvimento, seus recursos ainda podem mudar ao longo do tempo. No entanto, segundo testes divulgados pelo Google, a versão Ultra do Gemini é capaz de superar o ChatGPT-4 em diversas tarefas, apresentando desempenho de 90% em um teste com 57 disciplinas contra 86,4% do rival da OpenAI.
Gemini e ChatGPT: qual é o mais seguro?
Ambos os modelos de IA têm pontos fortes e fracos quando o assunto é segurança do usuário. O Google afirma que o Gemini é melhor treinado em dados factuais e menos propenso a gerar conteúdo prejudicial ou tendencioso em comparação ao ChatGPT. A ferramenta também conta com uma "Camada de Segurança" para identificar e prevenir resultados nocivos e discriminatórios, que têm sido um problema grave e recorrente em diversos chatbots de inteligência artificial. O acesso público limitado do Gemini nesse primeiro momento permite a realização de testes e refinamentos mais controlados antes que o recurso seja liberado completamente. No entanto, o Gemini não tem o mesmo nível de transparência que o ChatGPT, dificultando a verificação das normas de segurança prometidas pela plataforma.
O ChatGPT, por sua vez, tem código aberto, que permite maior transparência e análise do público, potencialmente levando à identificação e mitigação mais rápidas de questões de segurança. A comunidade mais ampla de usuários e estudiosos que utilizam a plataforma também pode contribuir para melhorar a segurança do modelo. Além disso, a OpenAI pesquisa e aborda ativamente os potenciais riscos de segurança associados ao ChatGPT. Por outro lado, seus dados de treinamento podem conter vieses e conteúdo prejudicial, que podem ser refletidos nos resultados. A falta de salvaguardas integradas, como as do Gemini, também aumenta o risco de gerar conteúdo prejudicial, assim como sua ampla disponibilidade.
A conclusão é que o sistema de inteligência mais seguro para cada usuário, dependerá de suas necessidades e prioridades. Para quem valoriza transparência e controle, o ChatGPT pode ser a melhor escolha. Já os que valorizam respostas mais seguras e um ambiente mais controlado, devem considerar o Gemini como a melhor opção.
Veja também: ChatGPT: 5 truques que você deveria testar no chatbot da OpenAI
ChatGPT: 5 truques que você deveria testar no chatbot da OpenAI