Exclusivo: o espanhol nativo do Copilot é uma ‘virada de jogo’, diz especialista da Microsoft

As marcas de IA continuam a prometer experiências mais uniformes e humanas para seus produtos, e a Microsoft não é diferente. A marca está trabalhando para tornar os recursos de seu assistente de IA mais coesos com o mundo cotidiano. Isso inclui uma voz mais autêntica no idioma espanhol para seu produto Copilot. A empresa lançou seu recurso Copilot Voice em outubro passado, que será atualizado em breve com vozes nativas de língua espanhola para atender à comunidade latina nos EUA e no mundo.

Entra Elm e Alder, as vozes espanholas nativas do Copilot. A IA pode detectar quando o espanhol está sendo falado e responder perfeitamente em espanhol fluente com sotaque nativo. Da mesma forma, expressa um sotaque nativo ao falar inglês em espanhol. Falei com um especialista em produtos da Microsoft para explorar o processo por trás do desenvolvimento das novas vozes e a intenção por trás do fornecimento dessa linguagem única e representação cultural dentro do conjunto de IA da Microsoft.

"No mercado dos EUA, você tem todas essas origens e pessoas variadas e diversas que são seu público. Em nossa pesquisa, queremos ser representativos de nossas comunidades", afirma Laura Parra Rangel, designer de produto de IA da Microsoft. “Percebemos que havia uma pequena lacuna para a comunidade hispânica nos EUA. Há uma enorme comunidade Latinx nos EUA. Temos uma enorme comunidade que pode se beneficiar com isso.”

O impacto das vozes espanholas

O Copilot Voice já recebeu algumas críticas positivas em sua versão em inglês, com Michael Muchmore da Garon descrevendo uma experiência inicial com o recurso de voz de IA como “quase como conversar com um amigo”. Ele observou que ele ainda responderá mesmo em meio a padrões normais de fala, como tropeços na fala ou interrupção da IA. O Copilot continuará atendendo sua consulta.

Tal recurso certamente seria benéfico quando implementado em idiomas adicionais de forma nativa. Particularmente, para um grupo demográfico que é colectivamente o segundo maior grupo étnico nos EUA. De acordo com Census.gov, mais de 65 milhões de pessoas identificaram a sua etnia como hispânica ou latina em 2023.

"Para mim, as experiências de voz são incríveis. Agora que temos opções em espanhol, é apenas uma virada de jogo para mim: uma opção realmente decente em espanhol para ter essas experiências. Algo que pode mudar e alternar entre inglês e espanhol, assim como faço na minha vida normal", diz Parra Rangel.

“Estou falando sobre algo em inglês e então algo me veio à mente em espanhol, e estou constantemente alternando entre um e outro, e tenho certeza de que isso é verdade para muitas, muitas pessoas em todo o mundo”, acrescentou ela.

Em conjunto com o próximo lançamento do idioma espanhol nativo do Copilot, a Microsoft divulgou um relatório pesquisando 504 mães latinas dos EUA com idades entre 25 e 40 anos sobre como elas usam a IA em suas vidas cotidianas. A campanha, chamada “Abuela Approved AI”, descobriu que 56% das mães latinas consideram a IA como parte de sua equipe de apoio familiar próximo; 60% das mães incluem IA em suas tarefas diárias, incluindo entretenimento, crescimento pessoal, trabalho ou negócios e tradução de idiomas; 70% das mães observam que usam IA para acesso 24 horas por dia, 7 dias por semana, para apoio em vez de conselhos de outras pessoas, enquanto 51% indicam que consideram a IA uma fonte que podem acessar para apoio sem julgamento. Finalmente, 87% das mães latinas referenciaram a IA para enriquecimento e preservação cultural, incluindo hobbies, receitas de família e língua nativa, sendo a IA uma ponte para aprender conceitos novos e antigos.

Alguns exemplos práticos dados por mães latinas sobre como o Copilot Voice as beneficiou em suas vidas diárias incluem o uso do aplicativo móvel para digitalizar os ingredientes disponíveis em suas casas para criar uma receita que se alinhe com sua cultura. Eles também detalharam o uso de instruções em espanhol para criar histórias de ninar exclusivas, em primeira pessoa, em idioma nativo, para promover o bilinguismo e o multiculturalismo em seus filhos.

"Falo espanhol fluentemente, é minha primeira língua. Inglês é minha segunda língua, mas vejo pessoas de primeira geração nos EUA pensando: quero falar espanhol. Quero preservar minha cultura. E ter o Copilot os ajuda a preservar sua cultura", diz ela.

"É ótimo ter uma voz verdadeiramente hispânica no mercado com quem posso falar e que soa [familiar]. Com sotaque argentino ou com sotaque da República Dominicana, isso é incrível", acrescentou ela.

Voz em todas as plataformas

O Copilot Voice foi lançado pela primeira vez usando o modelo GPT-4o AI da OpenAI. Outros serviços, como o Think Deeper da Microsoft, também incluem o Copilot Voice e usam modelos mais poderosos, como o GPT o1 . Notavelmente, um recurso como Think Deeper é principalmente baseado na web; no entanto, os usuários podem acessar outras configurações do Copilot Voice por meio de desktops Microsoft Windows e macOS e interfaces móveis iOS e Android .

Parra Rangel observou que trabalhar com a equipe de IA da Microsoft mudou sua perspectiva sobre como os recursos de voz poderiam ser apresentados. Tendo anteriormente associado a voz estritamente ao celular, observar o desenvolvimento do Copilot Voice permitiu-lhe ver como um recurso de voz também pode ser compatível com uma experiência de desktop.

"Claro, você sempre tem a opção de usar a voz no desktop. Como designer de produtos, eu costumava ver isso apenas como algo móvel, mas agora isso é uma virada de jogo. A forma como experimentamos a voz em todas as plataformas, seja computador ou celular. Esta é apenas a ponta do iceberg", diz ela.

Perguntei à Microsoft se haveria alguma atualização de modelo para o recurso nativo de espanhol do Copilot e aguardo uma resposta. Também perguntei à empresa se ela planeja lançar versões nativas de outros idiomas para o Copilot Voice e ela disse que responderá.

O apelo mais amplo do Copilot

Enquanto as marcas de tecnologia promovem os destaques dos novos recursos, o gerente de produto reconheceu as possíveis preocupações dos usuários sobre a confiança na IA, incluindo privacidade, segurança e outros erros ou falhas notáveis. Ela observou que algumas pessoas podem resistir ao uso do Copilot devido ao estigma de usar IA, diminuindo a inteligência ou sentindo que a IA pode tirar sua capacidade de pensar ou criar originalmente. Parra Rangel disse que os usuários podem pensar no Copilot como alguém com quem trocar ideias ou fazer uma pergunta rápida, não como alguém para gerar conteúdo completo.

"Algo que o Copilot tem é que ele é voltado para todas as faixas etárias. É diferente de uma mídia social de nicho voltada talvez para a Geração Z ou apenas para a geração Y. Acho que o Copilot é superinclusivo nesse sentido. Não importa sua idade, você sempre pode se beneficiar do Copilot", diz ela.

Dando um exemplo de como ela usa o Copilot de maneira pessoal, Parra Rangel observou que aproveita as configurações de idioma perfeitas para criar uma ferramenta de aprendizagem de idiomas no aplicativo que ela pode usar em qualquer lugar. Existe uma configuração de velocidade de fala que permite aos usuários ajustar a rapidez ou lentidão com que a voz fala. Ela disse que diminuirá a velocidade da voz para melhor compreensão e usará o Copilot Voice como seu treinador pessoal no treinamento de idiomas. Atualmente, o Copilot oferece suporte a 40 idiomas, e 14 são considerados muito bem suportados.

Parra Rangel considera que a introdução de vozes nativas espanholas tem o potencial de promover a aprendizagem da língua para os utilizadores do Copilot, independentemente de serem hispânicos.

"Você ainda pode se beneficiar de ter essas vozes verdadeiramente falantes de espanhol para aprender coisas novas, um novo idioma, ou se quiser melhorar seu espanhol, ou se viver em uma área diversificada onde as pessoas falam espanhol ou outras línguas. Essa é uma maneira muito boa de aprender a cultura e a língua do seu vizinho", diz ela.

Ela acrescentou que a única maneira de dissipar qualquer boato sobre o Copilot e seus recursos é experimentá-lo.