Eles não podem mais viver sem a função negligenciada dos óculos inteligentes

As legendas se tornaram um “plug-in” para as pessoas modernas. O deslocamento é barulhento e é fácil revelar seus segredos ao tentar pegar alguma coisa, e você se distrairá ao estudar. Somente ouvindo e observando você poderá evitar que a barra de progresso seja em vão.

No entanto, para alguns, as legendas são mais do que apenas a cereja do bolo.

Quando o protagonista masculino de “O Jogador Fora de Controle” colocou os óculos, ele viu informações que eram originalmente imperceptíveis e não eram mais um NPC passivo.

Na realidade, existe também uma espécie de óculos inteligentes que podem fornecer uma “barragem ambulante”. Embora menos ficção científica, também leva a um mundo com mais informações.

Eu posso ver o que você disse

A importância da tecnologia é que quando Deus fecha uma porta, ela abre uma janela.

O vídeo de unboxing de um blogueiro com deficiência auditiva recebeu 800 mil curtidas no TikTok. Seu desejo há muito acalentado se tornou realidade e ele chorou de alegria. O poder da mais pura explosão de emoção emocionou o público que nunca o havia conhecido antes.

▲ Foto de: TikTok@chrissymarshall_

Ela segurava uma caixa na mão, rindo e chorando ao mesmo tempo. Ela gesticulou em linguagem de sinais e tentou falar uma frase completa: “Há muitos anos que espero pela tecnologia desta caixa”.

A caixa contém óculos de legenda, que se parecem com óculos comuns, mas permitem que ela "veja" os sons ao seu redor. Aqueles sons que ela não conseguia ouvir no passado se transformaram em linhas verdes brilhantes de legendas de ficção científica. .

Segundo informações do vídeo, os óculos usados ​​​​por este blogueiro se chamam Hearview, que são especialmente desenvolvidos para deficientes auditivos. Foram lançados em maio deste ano. São de uma empresa de tecnologia nacional, mas não são para uso doméstico. uso e o mercado está no exterior.

Pode ser usado para entretenimento, assistir filmes, vídeos e assistir ao jogo ao vivo de "Black Myth: Wukong".

A julgar pela experiência de assistir ao vídeo "Friends", o texto está um pouco atrasado, mas preciso, e o aplicativo móvel emparelhado também pode distinguir diferentes alto-falantes.

Ao mesmo tempo, também pode ser usado em conversas cara a cara para facilitar que pessoas com deficiência auditiva façam pedidos de comida em restaurantes, façam compras em supermercados, conversem com guias de compras e naveguem enquanto dirigem…

O princípio do HearView não é complicado. Ele emparelha com o aplicativo móvel, captura o som através do microfone do smartphone e usa o algoritmo de IA para converter a fala em texto em tempo real, e as legendas são exibidas nos óculos.

Caso o deficiente auditivo precise responder a outras pessoas, ele pode inserir uma mensagem no aplicativo e converter o texto em fala. As legendas anteriores também são salvas no aplicativo.

O HearView afirma que sua precisão de fala para texto chega a 95% e pode transcrever fala de até 10 metros de distância. Neste ponto, surge uma questão: o desempenho irá deteriorar-se em ambientes ruidosos, como os mercados húmidos?

Embora o HearView afirme que o aplicativo móvel possui uma função de cancelamento de ruído, pesquisei vários vídeos de experiência e não consegui encontrar medições reais em um ambiente barulhento, por isso é difícil explorar o efeito.

O site oficial menciona apenas algumas informações de parâmetros. Possui bateria com duração de 7 horas e pesa 52 gramas. Também é equipado com vibração e avisos visuais para lembrar os usuários de possíveis perigos.

É leve e durável e parece que vale a pena comprar, mas é tão caro que é difícil fazer amigos – US$ 1.799, cerca de 12.800 yuans.

Além disso, o Hearview tem muito espaço para melhorias. Atualmente, ele suporta apenas inglês e espanhol e planeja oferecer suporte a alemão e francês. Ainda não pode realizar tradução mútua entre idiomas.

A cor do texto é apenas verde brilhante, o que garante legibilidade em diversas telas e condições de iluminação. No entanto, o usuário não tem escolha, o que é uma mosca na sopa.

Mas existência significa valor. As legendas já fazem parte da vida de muitas pessoas. Isso não basta. Elas devem ser acompanhadas por quem mais precisa delas de uma forma mais conveniente e intuitiva.

Embora existam muitos óculos de legenda, existem mais desafios na vida

Na verdade, os óculos de legenda em tempo real não são novidade. Há dois anos, eram até uma mania. Muitos projetos interessantes foram lançados, mas é difícil para eles serem perfeitos.

A startup britânica de AR XRAI desenvolveu o XRAI Glass, um aplicativo de voz para texto compatível com uma variedade de óculos AR.

No entanto, um repórter da revista Wired colocou óculos AR compatíveis com XRAI Glass e descobriu que, embora a voz para texto seja boa, sempre há atrito de um tipo ou de outro durante o uso.

Em primeiro lugar, em termos de experiência do usuário, se você usa implantes cocleares e aparelhos auditivos, pode ser desconfortável usar óculos. Embora esses óculos AR já sejam muito leves, eles ainda são mais grossos que os óculos comuns.

Além disso, a conversão de fala em texto não funciona bem quando há ruído de fundo alto ou quando muitas pessoas estão falando, reduzindo bastante sua praticidade.

O preço também é um problema. Os óculos AR que custam mais de 300 dólares já fizeram a carteira doer. O XRAI Glass também exige um pacote de assinatura mensal de dezenas de dólares. não é surpreendente.

Há também um produto semelhante ao Hearview na China – os óculos de legenda para ouvintes da Liangliang Vision, que são divididos em uma versão para aparelho auditivo e uma versão para tradução, que pode compreender mandarim, dialetos e línguas estrangeiras, e oferece suporte à tradução entre idiomas.

Seu uso é semelhante ao Hearview Baixe o aplicativo Translator, emparelhe os óculos com seu telefone via Bluetooth, conecte-se à Internet usando Wi-Fi ou um hotspot, converta a fala em texto em tempo real no telefone e exiba o texto no. copos.

No entanto, alguns usuários relataram na App Store que os ouvintes ainda não têm suporte suficiente para dialetos. Esta é uma direção de otimização muito necessária, mas difícil. Pessoas idosas que têm problemas de audição e estão acostumadas a falar em dialetos são as que mais precisam desse tipo de produto.

Alguns blogueiros do YouTube também comentaram que a taxa de reconhecimento de fala do ouvinte é alta e a velocidade também é rápida, mas se o sotaque for forte, a taxa de reconhecimento será menor.

▲ Foto de: YouTube@Assistente de tecnologia

Se você não se ater ao formato dos óculos, é muito interessante um protótipo de produto desenvolvido por estudantes da Universidade de Yale e da Universidade de Stanford, chamado Transcribe Glass.

Não é um par de óculos, mas um head-up display que se encaixa na armação dos óculos e funciona imediatamente, conectando o dispositivo a um aplicativo complementar para iOS e Android, permitindo aos usuários escolher sua fala preferida. software de texto.

As legendas geradas são transmitidas ao dispositivo via Bluetooth Low Energy e sobrepostas ao campo de visão real do usuário em tempo real. O que é raro é que o preço é extremamente amigável de US$ 95, mas mesmo a versão beta ainda está na lista de espera, e nenhuma informação sobre seu lançamento foi disponibilizada até o momento.

Além de produtos com foco em fala para texto, os óculos inteligentes AR multifuncionais para todos geralmente também incluem funções de legenda.

Óculos inteligentes sem fio multifuncionais com preços entre RMB 2.000 e RMB 3.000 na China basicamente suportam fala para texto e tradução em tempo real em vários idiomas, mas a eficiência da tradução pode não ser tão boa quanto os óculos AR projetados para audição. prejudicada Quando a função de fala para texto está continuamente ativada, a duração da bateria também é um problema.

Quando perguntei sobre uma marca de óculos inteligentes para a cabeça, a resposta que recebi foi “não recomendado para deficientes auditivos”.

▲ No dia 22 de outubro, consultei o atendimento ao cliente de uma marca de óculos inteligentes

Na verdade, este tipo de produto é mais adequado para grandes fabricantes, especialmente o Google, que possui profundo acúmulo técnico em reconhecimento de voz, tradução automática e AR, e está muito à frente em capacidades de tradução e fala para texto em tempo real.

No I/O de 2022, o Google lançou um óculos AR que pode ser traduzido em tempo real, com suporte para 24 idiomas e até linguagem de sinais americana. As legendas ficam bem ao lado do interlocutor, mas é apenas um protótipo de demonstração e há. sem acompanhamento.

Tecnologia para o bem é a principal premissa dos óculos de legenda. Todos os tipos de "criticas" estão, na verdade, fora do clima ardente, esperando que o produto não fique satisfeito com o status quo, continue a evoluir, faça de novo, melhore de novo, e. tornar-se melhor.

As legendas são um direito, veja o mundo como se estivesse assistindo a um filme

Segundo estatísticas da Organização Mundial da Saúde, aproximadamente 466 milhões de pessoas em todo o mundo sofrem de perda auditiva, das quais mais de 9 milhões são profundamente surdas.

Mesmo que usem implantes cocleares ou aparelhos auditivos, as pessoas com deficiência auditiva ainda precisam se concentrar para entender o que os outros estão dizendo. Ao mesmo tempo, algumas palavras com pronúncias semelhantes são difíceis de distinguir apenas pela leitura labial. Em condições ideais, apenas cerca de. 40% das palavras em inglês As informações da fala podem ser capturadas por meio dos movimentos labiais do locutor.

É por isso que um mundo com deficiência auditiva precisa de palavras como complemento. Alguém tem trabalhado duro para isso há muito tempo.

O ator cubano-americano de cinema mudo Emerson Romero, que também tinha deficiência auditiva, foi o pioneiro na legenda de filmes falados em 1947.

Na era do cinema mudo, o público podia entender o enredo por meio de imagens do filme e texto inserido. No entanto, quando surgiram os filmes falados, muitos espectadores com deficiência auditiva como ele perderam a oportunidade de assistir ao filme porque não conseguiam ouvir as falas e o filme não tinha legendas. .

Então Romero decidiu fazer suas próprias legendas à mão: como os filmes da época eram reproduzidos em película, ele fatiava o filme e inseria imagens com legendas entre os frames.

A tecnologia de legendas subsequente pode ser vista como uma continuação do espírito de Romero. Ao mesmo tempo, existem mais designs para facilitar a visualização de filmes por pessoas com deficiência auditiva. Por exemplo, alguns cinemas americanos fornecem óculos com legendas pré-fabricadas.

Em 2012, a Sony lançou óculos de legenda CC para alguns cinemas. Ao contrário das legendas comuns, as legendas CC não incluem apenas conteúdo de diálogo, mas também incluem informações não-verbais, como música de fundo, efeitos sonoros e sons ambientais.

Os óculos apresentam pequenos projetores de cada lado, e as legendas verdes parecem flutuar na frente da tela grande.

O público pode ver claramente as legendas, não importa onde esteja no teatro. Os usuários também podem ajustar o brilho, a distância de exibição e o ângulo das legendas e alternar entre seis idiomas.

Os óculos ainda suportam 3D, para que os usuários não precisem usar um par extra de óculos para assistir a filmes em 3D. Isso é importante para evitar uma situação em que a ponte do nariz fique muito ocupada: assistir filmes usando óculos normais, óculos 3D e óculos de legenda CC ao mesmo tempo.

▲ Foto de: Reddit@ellowTonkaTrunk, publicada em 2022

Esta cena é um tanto irônica, mas é como uma metáfora – para entender o mundo de uma perspectiva comum, algumas pessoas sempre precisam pagar mais.

Os óculos de legenda em tempo real, que ainda não são perfeitos, mas são promissores no futuro, pelo menos nos permitem ver uma possibilidade maravilhosa.

Bong Joon-ho, o diretor do filme coreano “Parasita”, disse certa vez no Oscar: “Depois de superar a barreira das legendas de 2,5 centímetros de altura, você verá mais filmes maravilhosos”.

Quando aparecem legendas comuns em filmes na vida, permite que quem precisa delas veja mais informações e tenha o direito de não desistir da conversa.

Há uma frase no vídeo promocional dos óculos AR do Google Translate que é muito comovente: Eu olho diretamente nos seus olhos e você parece olhar diretamente nos meus olhos.

Quase não há sentido de existência, que é o melhor estado da tecnologia.

Sob a premissa de garantir eficiência e precisão, a comunicação pode retornar à natureza. Não há necessidade de ocupar as duas mãos, não há necessidade de abaixar a cabeça para olhar para o celular e, em vez disso, não há necessidade de ficar olhando para os lábios. , cara a cara e contato visual, exatamente como a aparência que existia há milhares de anos.

É tão forte quanto a geada do outono e pode evitar desastres malignos. E-mail comercial: [email protected]

# Bem-vindo a seguir a conta pública oficial do WeChat do aifaner: aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo |