O Google AI anunciou a chegada do Gemma, uma nova família de modelos de linguagem open-source derivados do recém-lançado conjunto de ferramentas de inteligência artificial, Gemini.
Com Gemma, o Google entra na disputa pelo topo da lista de LLMs, desafiando diretamente os líderes Meta’s LLaMa e Mistral.
“Temos uma longa história de apoio ao código aberto responsável e à ciência, o que pode impulsionar o progresso rápido da pesquisa. Portanto, estamos orgulhosos de lançar o Gemma: um conjunto de modelos leves abertos, os melhores da categoria em seu tamanho, inspirados na mesma tecnologia usada para o Gemini”, escreveu Demis Hassabis, cofundador do Google DeepMind, em um tweet.
Gemma está disponível em duas versões: Gemma 2B, um modelo leve treinado em dois bilhões de parâmetros, otimizado para eficiência e capaz de rodar em uma variedade maior de hardwares, e Gemma 7B, um modelo mais robusto treinado em 7 bilhões de parâmetros, que oferece melhores resultados, mas requer mais poder computacional.
“No Google, acreditamos em tornar a IA útil para todos. À medida que expandimos a família de modelos Gemma, esperamos apresentar novas variantes para diversas aplicações”, disse o Google.
O anúncio da empresa abordou as bases técnicas e filosóficas do Gemma, afirmando que o modelo “é projetado com nossos Princípios de IA em primeiro plano“.
“Para entender e reduzir o perfil de risco dos modelos Gemma, conduzimos avaliações robustas, incluindo testes adversários manuais, testes adversários automatizados e avaliações das capacidades do modelo para atividades perigosas”, disse.
Logo após seu lançamento, o Gemma subiu rapidamente no ranking do frequentemente consultado Hugging Face, alcançando o segundo lugar na lista de tendências e superando todos os outros LLMs e modelos de IA open-source – exceto o Open Cascade da Stability AI, um novo gerador de imagens a partir de texto.
Números concretos respaldam a capacidade reivindicada do Gemma: ele demonstrou desempenho superior ao LlaMa-2 da Meta em vários benchmarks sintéticos. São eles:
- MMLU (conhecimento abrangendo 57 disciplinas científicas)
- Hellaswag (avaliando o raciocínio básico em tarefas diárias)
- MATH (avaliando capacidades matemáticas)
- HumanEval (teste de proficiência em codificação)
Desenvolvedores interessados em testar o Gemma podem fazê-lo gratuitamente usando o Kaggle, uma plataforma de ciência de dados e inteligência artificial criada pelo Google. A empresa também disponibilizou o Gemma através de notebooks do Google Colab e está oferecendo créditos no valor de US$300 para novos usuários do Google Cloud.
“Os pesquisadores também podem solicitar créditos do Google Cloud de até US$500.000 para acelerar seus projetos”, disse a Google.