Um misterioso chatbot de IA denominado ‘gpt2-chatbot’ esteve brevemente disponível online antes de desaparecer novamente. O chatbot fez sua estreia silenciosamente no site LMSYS Chatbot Arena – um site usado para avaliar, comparar e classificar diferentes sistemas de IA.
Com base em seu nome, alguns especulam que a ferramenta pode ser uma versão anterior do modelo de linguagem chatbot da OpenAI, GPT-2. Mas os usuários notaram que o modelo de linguagem parece igualmente poderoso – ou mais poderoso que – o GPT-4, o modelo de linguagem mais recente e avançado da OpenAI.
Na verdade, alguns internautas descobriram que o modelo de linguagem teve um desempenho melhor que o GPT-4 em determinados testes. Isto levou à especulação de que o “gpt2-chatbot” poderia ser um protótipo inicial do GPT-5, ou talvez uma versão mais atualizada e avançada do GPT-4 que, para todos os efeitos, pode ser considerada GPT-4.5.
Mas os usuários que conseguiram testar o modelo antes de colocá-lo offline notaram que havia surpreendentemente pouca informação sobre o que era o modelo de linguagem e de onde ele veio. Ainda assim, não demorou muito até que o modelo de linguagem fosse colocado off-line, com LMSYS dizendo em um tweet: “De acordo com nossa política, trabalhamos com vários desenvolvedores de modelos no passado para oferecer à comunidade acesso a modelos/pontos de verificação não lançados. (por exemplo, mistral-next, gpt2-chatbot) para testes de visualização.”
O site acrescentou que teve que desativar “temporariamente” o gpt2-chatbot devido ao “alto tráfego e limite de capacidade”.
Cresce a especulação sobre o ‘gpt2-chatbot’
Graças a um tweet subsequente do CEO da OpenAI, Sam Altman, parece que é mais provável que o modelo de linguagem seja algo novo, em vez de um modelo anterior do GPT-2.
Altman escreveu: “Eu tenho uma queda pelo GPT-2”, antes de editar o tweet para que aparecesse como “gpt-2”. E colocando mais lenha na fogueira, Steven Heidel, membro da equipe da OpenAI, escreveu um tweet dizendo: “quando gpt-2”.
Com base nessas respostas, parece mais provável que, conforme sugerido pelo LMSYS, este seja algum tipo de modelo não lançado.