Um rival do ChatGPT de código aberto acaba de ser lançado pela equipe Stable Diffusion

abril 20, 2023 gurinho

O mais novo concorrente do ChatGPT da OpenAI vem da empresa que fabrica o popular gerador de imagens de IA Stable Diffusion . Conhecido como StableLM, o Stability AI desenvolveu este chatbot de código aberto para democratizar o acesso a modelos avançados de linguagem.

A Stability AI anunciou recentemente a versão alfa do StableLM, observando que é uma solução menor e mais eficiente do que a maioria das outras. O StableLM usa apenas três bilhões a sete bilhões de parâmetros, 2% a 4% do tamanho do modelo de 175 bilhões de parâmetros do ChatGPT.

IA de estabilidade

Assim como o Stable Diffusion é um gerador de imagens mais acessível que pode ser estendido por desenvolvedores terceirizados, o StableLM oferece a mesma solução gratuita e de código aberto que um chatbot de IA disponível para todos.

Graças ao treinamento em um novo conjunto de dados experimental da EleutherAI chamado “The Pile”, o StableLM pode realizar conversas e escrever código com alto desempenho. A Stability AI observa que esse conjunto de dados contém 1,5 trilhão de tokens, três vezes maior que o conjunto de dados usado para treinar a maioria dos modelos de IA. O ChatGPT foi treinado em “The Pile”, mas passou por mais refinamentos posteriormente, incluindo aprendizado por reforço para ajudar a reduzir resultados falhos. O ChatGPT avançou consideravelmente desde que foi lançado ao público, e a maioria sente que é o líder de bate-papo de IA.

Um modelo de IA altamente eficiente é fundamental para a Stability AI, pois deseja fazer o StableLM funcionar em sistemas de baixo custo e GPUs menos potentes. Você pode instalar e executar a versão alfa do StableLM hoje. As instruções estão no repositório GitHub , juntamente com um notebook com detalhes sobre como usá-lo em um computador com recursos limitados de GPU.

A maneira mais fácil de experimentar o StableLM é acessando a página de demonstração Hugging Face. Como acabou de ser lançado e provavelmente haverá alta demanda, os tempos de resposta podem ser lentos e, como uma versão alfa, os resultados não serão tão bons quanto a versão final.

Por exemplo, quando pedi ao StableLM para me ajudar a escrever uma carta de desculpas por quebrar o telefone de alguém, ele me disse que fiz o que deveria fazer. A IA de alguma forma entendeu mal e pensou que eu dei um presente em vez de danificar um telefone.

A versão alfa do StableLM às vezes fica confusa,

O Stability AI inclui um aviso sobre os resultados, pois o StableLM é um Large Language Model pré-treinado sem nenhum ajuste fino adicional. Ele não usa aprendizado por reforço, como o ChatGPT, então as respostas “podem ser de qualidade variável e potencialmente incluir linguagem e pontos de vista ofensivos”.

Não se sabe se os modelos StableLM atualizados que estão chegando podem competir com o ChatGPT. No momento, é claramente um trabalho em andamento. O mesmo aconteceu com outro desafiante de código aberto chamado CollosalGPT .

Este não é o fim da história, no entanto. A Stability AI disse que modelos maiores com 15 bilhões, 30 bilhões e 65 bilhões de parâmetros estão em andamento e devem ajudar a refinar os resultados. Um modelo de 175 bilhões de parâmetros está planejado para o futuro. Dado o tamanho limitado do modelo disponível atualmente, o StableLM teve um bom começo.

A natureza de código aberto e a implementação leve da versão alfa do StableLM servem ao propósito de permitir que os desenvolvedores comecem a trabalhar em aplicativos. Há potencial suficiente para crescimento e melhoria que vale a pena ficar de olho neste novo chatbot de IA.