Pesquisa descobre que ser rude com o ChatGPT gera respostas mais precisas do que ser educado
A ética de falar com um chatbot de IA e que tipo de informação ele pode retornar é um tópico de debate acalorado. Os riscos de informações médicas enganosas , incitação a atos violentos e distanciamento de experiências do mundo real geram conversas intensas. Mas parece que a linguagem que você usa ao falar com ferramentas de IA como ChatGPT e Gemini também afeta a qualidade das respostas que você recebe. De acordo com pesquisas recentes, ser rude pode ser mais útil do que agir educadamente.
O panorama geral
De acordo com um artigo de pesquisa pré-impresso realizado por especialistas da Universidade Estadual da Pensilvânia, quando a mesma pergunta foi feita ao ChatGPT em tons diferentes, as perguntas rudes "superaram consistentemente" as perguntas educadas. A precisão das respostas fornecidas pelo ChatGPT com perguntas educadas foi de 80,8%, enquanto a mesma pergunta descrita de forma muito rude aumentou a precisão das respostas para 84,8% em um formato de teste de múltipla escolha.
A equipe definiu o tom das perguntas em cinco níveis, de Muito Educado e Educado a Rude e Muito Rude, com o Neutro no meio. "Prompts neutros são aqueles sem frases educadas como "por favor" e imperativos imperativos e depreciativos como "Seu idiota, descubra isso", descreve a equipe no artigo de pesquisa.
Senhores, vamos manter as boas maneiras, independentemente disso!
Em sua análise, a equipe não foi explícita, mas, em vez disso, baseou-se em perguntas rudes que eram algo como "Coitada da pessoa, você ao menos sabe como resolver isso?". A imagem acima descreve a precisão média dos resultados do ChatGPT com base em como o tom da pergunta passou de muito cortês para grosseiro.
Meu chatbot de IA está sentindo emoções?
Os resultados da pesquisa mais recente, intitulada "Cuidado com o tom de voz", contradizem os resultados de outro artigo publicado há mais de um ano. O estudo analisou meia dúzia de chatbots em vários idiomas e relatou que a grosseria deteriora a qualidade das respostas e insere viés, erros ou omite informações úteis nas respostas fornecidas por um chatbot de IA.
- No entanto, vale a pena ter em mente que os especialistas por trás da pesquisa mais recente testaram o ChatGPT apenas em um tipo muito específico de tarefa, que envolveu 250 variações de 50 questões de múltipla escolha.
- Você pode não obter os mesmos resultados com outros chatbots, como Gemini, Claude ou Meta AI. Além disso, os testes foram conduzidos nos modelos de raciocínio GPT-4o da OpenAI, enquanto a versão mais recente do ChatGPT, disponível ao público, foi desenvolvida com base no novo modelo GPT-5.
- Também vale a pena notar que o espectro de “grosseria” e “educação” é amplo, e a qualidade das respostas varia de acordo com as palavras e a linguagem do usuário.
A questão mais importante é o quanto a "carga emocional da frase" afeta as respostas geradas por um chatbot de IA e se é possível fazer generalizações amplas sobre seu comportamento. Também é bastante interessante notar que os modelos de linguagem de grande porte (LLMs) deveriam, idealmente, focar na recompensa e na precisão na resolução de um problema, em vez de serem afetados pelas emoções da consulta.

