Google Gemini facilita navegação na web para usuários com problemas de visão e audição

Dispositivos Android oferecem há anos um recurso de leitor de tela integrado chamado TalkBack . Ele ajuda pessoas com problemas de visão a entender o que aparece na tela do celular e permite que elas o controlem com a voz. Em 2024, o Google adicionou a inteligência artificial Gemini à solução para oferecer aos usuários uma descrição mais detalhada das imagens.

O Google agora está reforçando o recurso com uma nova camada de conveniência interativa para os usuários. Até agora, o Gemini só descrevia imagens. Agora, quando os usuários visualizam imagens, podem até fazer perguntas complementares sobre elas e ter uma conversa mais detalhada.

Como isso ajuda usuários com dificuldades de visão?

“Na próxima vez que um amigo lhe enviar uma foto da sua nova guitarra, você poderá obter uma descrição e fazer perguntas complementares sobre a marca e a cor, ou até mesmo o que mais está na imagem”, diz o Google. Isso se baseia na atualização de acessibilidade que integrou o Gemini ao sistema Talkback no final do ano passado.

O menu Talkback no Android agora exibe um recurso dedicado à descrição da tela, que coloca o Gemini no comando. Assim, por exemplo, se os usuários estiverem navegando por um catálogo de roupas, o Gemini não apenas descreverá o que aparece na tela, mas também responderá a perguntas relevantes.

Por exemplo, os usuários podem fazer perguntas como "Qual vestido seria o melhor para uma saída em uma noite fria de inverno?" ou "Qual molho combinaria melhor com um sanduíche?" O Gemini também poderá analisar a tela inteira e informar os usuários sobre detalhes granulares do produto ou se há descontos disponíveis.

Tornando as legendas expressivas e melhorando o zoom do texto

No navegador Chrome, o Google está dando uma pequena melhora nas legendas geradas automaticamente para vídeos. Digamos que você esteja assistindo a uma partida de futebol. As legendas não acompanharão mais apenas as palavras do comentarista, mas também corresponderão às suas emoções e expressões.

Por exemplo, em vez de "gol", usuários com deficiência auditiva verão um sonoro "gooooooo" para dar um toque extra de ênfase emocional. O Google está chamando essas legendas de "Legendas Expressivas".

Além da fala humana, agora elas também abrangem sons importantes, como assobios, gritos de alegria ou até mesmo o pigarro do interlocutor. Legendas expressivas estarão disponíveis em todos os dispositivos com Android 15 ou posterior, nos EUA, Reino Unido, Canadá e Austrália.

Outra mudança significativa que chega ao navegador Chrome é o zoom de texto adaptável, que é essencialmente uma atualização do sistema de zoom de página disponível em celulares Android. Agora, quando os usuários aumentam o tamanho do texto, isso não afeta o layout do restante da página.

"Você pode personalizar o quanto deseja ampliar e aplicar facilmente a preferência a todas as páginas que visita ou apenas a algumas específicas", diz o Google. Os usuários poderão ajustar o alcance do zoom usando um controle deslizante na parte inferior da página.