O aplicativo de IA que ele criou para a filha ganhou o Apple Design Award. Também encontrei estes aplicativos em inglês com ideias únicas.
Com a IA, a barreira linguística parece ter sido "quebrada". A tradução não é mais um problema, o polimento se torna automático e imitar, reescrever e copiar diferentes estilos ficou ainda mais fácil.
Essas conveniências, de fato, reduziram bastante o fardo — não precisamos mais mastigar cada palavra e não precisamos mais de tantos momentos de "memorização". Mas, por isso, nos obrigam a repensar: depois de toda essa "economia de esforço", o que resta entre nós e a linguagem?
Aprender um idioma se torna um "uso baseado em ferramentas"? A linguagem ainda é uma forma de perceber o mundo, um meio para nos narrarmos e um caminho para as pessoas explorarem o mundo e as coisas?
Talvez a resposta não venha tão cedo. Mas, pelo menos, podemos observar algumas novas ferramentas primeiro: neste tópico especial, a APPSO conversou com os desenvolvedores do Capwords, Read Easy e Para Translation, ferramentas relacionadas ao inglês. Todas elas floresceram com o apoio da IA — algumas retornaram a cenas da vida real para encontrar âncoras de memória, algumas criaram designs delicados na experiência de leitura e algumas simplesmente reconstruíram o processo de leitura.
Mais importante, todos apontam na mesma direção: depois que a dificuldade da linguagem é reduzida pela tecnologia, o que realmente precisa ser reconstruído é o relacionamento entre nós e a própria linguagem.
Capwords: Vocabulário é o "atrito" com a vida
Chamar este produto, que acaba de ganhar o Apple Design Award, de "ferramenta de aprendizado de inglês" é obviamente limitado demais. O Capwords é mais como um dispositivo sobre linguagem, memória e cenas da vida: ele reconhece palavras tirando uma foto, e seu design de adesivos, aliado a um estilo visual leve e animado, faz com que as pessoas não consigam evitar dar mais algumas olhadas e aprender mais algumas palavras.
Por trás do design quase intuitivo do Capwords, existe um conceito simples, porém profundo: o aprendizado de idiomas deve retornar à vida cotidiana. Pode começar com um simples apontar, uma caminhada ou a curiosidade sobre "como se diz isso?".
APPSO: Tudo começou porque uma criança teve uma necessidade muito simples: apontar para algo e perguntar: "Como se diz isso em inglês?". Essa foi a fonte da inspiração e o início do projeto, certo?
DTD: Sim, minha filha tem uns três anos, nem três. Costumo levá-la para brincar no verão. Vamos a parques ou praças em frente a prédios comerciais. Durante a brincadeira, ela me fazia algumas perguntas, como "Qual o nome desta planta?", "Como se lê esta placa de trânsito?". Eu explicava enquanto brincava, e às vezes usava alguns produtos de identificação para ajudá-la a verificar. Talvez seja porque ela estava na fase em que sua curiosidade explodia, e na verdade havia muitas cenas assim.
Um dos momentos mais memoráveis foi quando uma planta chamada "raiz de broto de cachorro" cresceu nas rachaduras do piso de um prédio comercial. Ela apontou e disse: "Pai, tem uma raiz de broto de cachorro!" Essas cenas me tocaram profundamente. Somado ao fato de ela ter me feito algumas perguntas como "Como se diz isso em inglês?", pensei: essa combinação de "cena + imagem + informação" pode ajudá-la a se lembrar melhor. Também sou designer, então sou mais sensível a imagens ou informações.
▲Foto de: [email protected]
Então, em muitas dessas cenas de interação com minha filha, senti que a linguagem em si deveria existir na vida, e deveríamos nos perguntar quais métodos podemos usar para ajudar nessa questão. Provavelmente é esse o processo.
APPSO: Você percebeu na época que necessidades semelhantes existiam não apenas entre crianças, mas também entre um grupo maior de usuários?
DTD: Não, porque não sou bom em inglês, não sou bom em memorizar ou em forçar pontos de conhecimento na minha cabeça. Não sou formado em Pedagogia, então meu entendimento sobre aprendizagem de línguas é que ela acontece na vida. Se houver um ambiente, como quando você vê ou fala sobre algo durante um bate-papo, quando você vê um objeto ou uma imagem, haverá memórias associadas. Vou resumir alguns princípios, como por que uma determinada imagem me atrai, ou um prédio colorido, ou um prédio distinto em nossa cidade, o que atrai minha atenção pode ser a associação dos gráficos em minha mente, o que é muito importante. Este pode ser meu resumo pessoal como designer, e pode não ser completamente científico.
▲ Imagem de: [email protected]
APPSO: A maioria dos softwares de caça-palavras do mercado são pesados, mas o Capwords torna o processo muito simples e pode ser concluído com um clique. Mas você já se preocupou com o impacto nos resultados da aprendizagem?
DTD: Por que você não nos conta sobre essa CLU?
CLU: Na verdade, quando lançamos o projeto do produto, nosso ponto de partida não era o aprendizado de idiomas. Voltando ao que acabei de dizer, queríamos apenas responder às perguntas da minha afilhada – essa é a semente de tudo. Gradualmente, perceberemos que as imagens criarão uma espécie de "atrito" com nossas vidas . Em outras palavras, ao criar atrito com objetos do mundo real, podemos fortalecer pontos de memória. Quando esses pontos de memória são combinados com a cena do momento e novas palavras ou coisas entram no cérebro, nossa memória dessas informações se tornará mais profunda.
Observamos em nosso cotidiano que as pessoas têm uma curiosidade natural desde a infância e se lembram naturalmente de tudo que é novo . Por exemplo, quando vamos ao Japão, mesmo sem falar uma palavra em japonês, dizemos palavras simples como "obrigado" e algumas outras. Ou, ao descrever coisas fofas, usamos palavras como "kawaii", porque essas coisas são novas para nós .
Portanto, não o posicionamos como um produto que simplesmente ensina inglês ou vocabulário quando iniciamos o projeto. E com base em nossas observações, feedback dos usuários e implementação real, uma das coisas que estamos fazendo é diminuir o limiar para aprender um novo idioma, para que as pessoas se interessem mais. À medida que as pessoas se interessam mais por um idioma, elas gradualmente encontrarão uma maneira mais sistemática de aprendê-lo.
APPSO: Você recebeu algum feedback particularmente impressionante dos usuários até agora?
@61: Posso te contar uma coisa. Um dos meus antigos mentores tem uma filha no ensino fundamental. Durante a fase de testes, dei a ele um código de resgate, e ele jogou Capwords com a filha no iPad, escaneando tudo na casa, até a cabeça careca do pai (risos).
No dia seguinte, o pai dela veio até mim e me disse que a filha dele tinha anotado todas as palavras que havia escaneado no dia anterior em seu diário e começado a revisá-las sozinha. Nos dias seguintes, a primeira coisa que a filha dele fez ao chegar da escola não foi brincar de Festa do Ovo, mas sim dar uma olhada pela casa com o iPad para encontrar "o que mais ela ainda não havia escaneado".
DTD: Fiquei realmente impressionado com o feedback de alguns usuários. Vi um usuário dizer que este foi o produto de IA menos parecido com IA que ele já usou, e outro disse que este foi o produto de IA mais acolhedor que ele já usou este ano . É exatamente isso que queremos alcançar.
APPSO: De fato, o modelo está totalmente integrado ao processo de uso, e a presença da IA não é forte. Vocês encontraram algum desafio durante o desenvolvimento?
CLU: Na verdade, acho que a IA ainda tem alguns limites e condições, mas o julgamento da IA em si é semelhante ao senso comum dos seres humanos. Por exemplo, já testamos que a IA reconhece uma xícara de líquido marrom como café, mas se eu fizer essa bebida sozinho, sei que na verdade é chá de ervas, então o resultado do reconhecimento é inconsistente com a minha cognição.
Mas isso não é um problema com a IA, apenas a identificação incorreta acontece. Por isso, adicionamos um item de ajuste durante o design, para que, se o resultado do reconhecimento do sistema não corresponder à cognição, o usuário possa inserir o item correto.
DTD: Em relação à velocidade de reconhecimento, mesmo modelos grandes levam tempo. Todo o processo de envio da imagem e dos dados de volta leva cerca de cinco ou seis segundos. Quando lançamos a primeira versão no ano passado, testamos e pareceu funcionar bem. Todos acharam incrível. Minha esposa e minha filha, em especial, acharam incrível. Mas quando usei, ainda achei os seis segundos muito dolorosos.
Posteriormente, otimizamos algumas palavras-chave, ajustamos o tamanho das imagens e utilizamos diversos designs interativos para reduzir a percepção de tempo do usuário, ocultando esse tempo por trás de diferentes formas de interação. Portanto, meu entendimento é que podemos resolver alguns problemas que o modelo atual, em termos de experiência, não consegue resolver.
CLU: Outra coisa é que, quando um objeto é identificado, você vê o efeito de um adesivo sendo arrancado. Naquela época, queríamos criar um efeito de descolagem de objetos do mundo real a partir de adesivos. No processo de descolagem, o carregamento completo está sendo feito, mas o usuário não está ciente disso, e, no final, a experiência pode ser muito tranquila.
▲ Imagem de: [email protected]
Acredito que, no final, a IA será definitivamente integrada ou se tornará uma infraestrutura. Não há necessidade de refletir implementações técnicas específicas. Os usuários precisam apenas se concentrar nos efeitos trazidos pela IA, e esse resultado deve ser o que eles esperam, ou até mesmo superar as expectativas.
Leia com facilidade: Ler não é fugir do texto original, mas sim aproximar-se do texto original
Tradução e texto original são como suco e polpa: o primeiro derrete na boca, enquanto o segundo retém toda a sua textura fibrosa. Certamente é mais fácil absorver informações na sua língua nativa, mas sempre há momentos em que queremos nos aproximar do texto original e vivenciar o ritmo e a textura da própria língua.
O Read Easy oferece uma "terceira via": uma combinação de chinês e inglês. Ele facilita a extração de informações, mantendo a conexão entre nós e o texto original — você pode alternar a qualquer momento ou marcar palavras-chave no texto original. Não se trata de "traduzir e sair", mas sim de uma ponte entre a tradução e o texto original, que pode ser revertida a qualquer momento.
APPSO: Agora, muitas ferramentas estão competindo para ver quem consegue "traduzir mais rápido e melhor", mas o RE preserva muito do inglês. Por que vocês querem manter a ideia de "manter o texto original"?
Zhijie: Devido ao posicionamento diferenciado, o posicionamento inicial era criar um produto para o aprendizado de inglês. Primeiro, achávamos que as pessoas estariam mais dispostas a pagar por produtos educacionais e, segundo, o aprendizado de idiomas é um cenário importante para a IA, embora não soubéssemos o que fazer especificamente na época. Como todos sabemos, o campo do aprendizado de inglês é muito competitivo, então estávamos pensando por onde começar. Descobrimos que não havia produtos que fizessem um trabalho particularmente bom na leitura em inglês, então pensamos se haveria novas soluções. Isso levou ao design subsequente e, naturalmente, buscamos manter o texto original.
Durante o processo, o posicionamento mudou um pouco, pois ainda quero criar um produto que eu mesmo possa usar. Atualmente, está mais próximo da posição intermediária no espectro de "obter informações – aprender inglês". Não preciso fazer o exame sozinho, e aprender inglês não é uma necessidade rígida, mas ainda espero poder ler mais conteúdo em inglês. Acho que a diferença entre ler uma tradução e ler o texto original é como a diferença entre olhar uma foto e ir ao local. Ir ao local não é necessário, mas lhe dará uma sensação diferente.
APPSO: A coisa mais comum que deixa as pessoas travadas na leitura são palavras desconhecidas. Ao projetar o recurso "Anotações no Texto", como vocês decidem quais palavras devem ser marcadas e quais devem ser puladas?
Zhijie: Idealmente, podemos marcar palavras que os usuários podem não entender com base no seu nível de inglês, para que eles não precisem procurar palavras constantemente, o que prejudicaria a fluência na leitura. Em outros casos, embora os usuários possam entender, se forem marcados, isso ajudará a julgar visualmente o conteúdo geral de uma frase rapidamente, como marcar nomes de pessoas e lugares em cores diferentes.
Quanto à implementação funcional, ela é atualmente gerada inteiramente por IA, portanto, não é totalmente controlável quais palavras são anotadas. Em grande parte, a IA aprende quais palavras anotar com base nos dados de treinamento que eu forneço a ela.
APPSO: As partes marcadas têm cores diferentes, em negrito e sem negrito. Essas marcações não são todas acessíveis aos usuários, mas são geradas automaticamente. O que isso significa?
Zhijie: Na verdade, no início do design, eu queria permitir que os usuários personalizassem o estilo visual. Para isso, criei uma "linguagem de marcação" semelhante ao Markdown. O Markdown em si não se importa com o estilo visual. A apresentação visual é realizada pelo próprio software. No entanto, devido à limitação de energia, a entrada para personalização do estilo não foi adicionada ao produto.
O estilo visual padrão atual é determinado após algumas tentativas. Não é bom o suficiente, mas pode basicamente usar cores para distinguir diferentes níveis visuais.
APPSO: O formato das anotações atrapalhará o ritmo da leitura? Como você equilibra toda a experiência de leitura?
Zhijie: Se o inglês do usuário for muito bom, as anotações podem de fato interferir na leitura, assim como quando lemos chinês, não precisamos dessas marcações. Mas para pessoas como eu, que têm algum conhecimento de inglês, mas ainda têm dificuldade para ler línguas estrangeiras, as anotações são úteis. Pessoas com visão normal sentirão tontura ao usar óculos míopes, mas os óculos podem fazer com que pessoas míopes enxerguem com mais clareza.
APPSO: "Chinês e inglês misturados" é um design muito ousado. A primeira reação de muitas pessoas é: "Isso ainda é aceitável?". Como surgiu essa ideia? Houve alguma cena ou experiência de leitura específica que desencadeou a inspiração?
Zhijie: Quando crio um produto, gosto de enumerar várias possibilidades. É um pensamento deliberado. Por exemplo, posso reescrever a frase original em inglês, transformar a frase complexa em uma frase simples, ou posso adicionar algumas interações, ou até mesmo gerar uma imagem? Misturar chinês e inglês é uma das possibilidades. Como é simples de desenvolver, eu fiz isso primeiro.
APPSO: Quais são as vantagens desse design? É mais fácil ou consegue reter melhor o nível semântico? Você teme que isso faça com que as pessoas dependam da língua materna e não queiram entender a frase original?
Zhijie: Acho que a vantagem é que permite aos usuários entender rapidamente um parágrafo em sua língua nativa e aprender um pouco de inglês com as palavras dispersas. No espectro de posicionamento mencionado anteriormente de "obter informações – aprender inglês", a função de misturar chinês e inglês estará mais próxima do ponto final de obtenção de informações.
O que o usuário deseja fazer e se ele está disposto a entender a frase original não é determinado por um produto. O usuário sempre tem o direito de escolher. Mesmo que o produto não ofereça tradução, ele pode usar outros produtos se quiser ver a tradução. O RE oferece a possibilidade de facilitar a leitura em inglês para aqueles que desejam ler o texto original. Seria melhor se mais pessoas pudessem participar, mas se não, não pode ser forçado. Mesmo que uma pessoa esteja disposta a ler o texto original, ela não quer ler o texto original o tempo todo. Quando você não quer beber Americano, beber latte também é bom.
APPSO: Como isso é alcançado tecnicamente?
Zhijie: Não há dificuldade alguma. É implementado com um conjunto de instruções: "Você é um especialista em idiomas. Sua tarefa atual é converter um parágrafo de texto em um texto misto de chinês e inglês, mantendo o texto original inalterado. O objetivo é permitir que os usuários entendam o significado do parágrafo e aprendam inglês ao mesmo tempo, então, por favor, preste atenção, isso é muito importante…"
APPSO: "Tornar a IA mais séria" realmente fará diferença? (Risos)
Zhijie: Não testei rigorosamente, mas, com base na experiência, posso dizer que pode melhorar a estabilidade. Sem esses truques, um em cada dez itens de processamento pode dar errado. Com esses truques, ficará melhor. No passado, eu escreveria algo para deixar a IA fazer o seu melhor.
Apareça apenas quando necessário
A tradução instantânea em dispositivos móveis sempre foi um cenário desafiador: a tarefa original não pode ser interrompida e, ao mesmo tempo, você deseja obter a tradução mais precisa possível. Muitos fabricantes estão tentando resolver esse problema global, e a solução da Para Translation é inesperadamente "inteligente".
Através do formato picture-in-picture, a tradução é adicionada a todo o processo de leitura. Basta uma janela flutuante para acessar rapidamente a tradução sem precisar sair da página atual. Sem interrupções, sem necessidade de alternar, mas ela sempre aparece "exatamente quando você precisa".
APPSO: Como surgiu a ideia de criar uma ferramenta dessas? Isso tem a ver com seus próprios hábitos?
Daxin: É verdade. Costumo ler algumas redes sociais e fóruns estrangeiros, mas são todos em inglês. Toda vez, tiro uma captura de tela ou copio o texto e traduzo em uma ferramenta de tradução, o que é muito trabalhoso.
No ano passado, um amigo meu criou uma área de transferência global que usa a função picture-in-picture para ler o conteúdo da área de transferência sem precisar ler o conteúdo selecionado pelo usuário. Imaginei que, se ela consegue ler o conteúdo da área de transferência, também deveria conseguir exibir o texto na área de transferência. Depois de estudar a viabilidade, trabalhei com minha equipe de desenvolvimento para criar uma ferramenta de tradução conveniente.
APPSO: Qual foi o maior impacto da mudança original? Afetou a compreensão do conteúdo? Qual é o feedback atual dos usuários sobre esta nova ferramenta?
Daxin: Isso afeta principalmente minha experiência de leitura. Para mim, que prezo pela eficiência, é extremamente desconfortável ficar alternando entre as páginas a cada vez. Demora mais para ler uma publicação. O que espero conseguir é que, ao ver uma publicação, eu possa terminá-la e passar para a próxima.
Depois de criar esta ferramenta, descobri que a base de usuários abrange diversos setores. Há dois grupos específicos: estudantes internacionais e profissionais de comércio exterior. Estudantes internacionais costumam conversar com colegas, colegas de classe e amigos quando estão no exterior. Usuários de comércio exterior e estrangeiros precisam conversar online, mas essas ferramentas de bate-papo geralmente não oferecem funções de tradução nem exigem pagamento. A Para Translation atende a essa demanda, e o preço é relativamente acessível.
APPSO: Como é selecionado o modelo base? Quais são as diferenças entre os diferentes modelos?
Daxin: O DeepSeek é o principal atualmente, mas modelos tradicionais nacionais e internacionais também estão conectados. Depois de testar muitos modelos, a principal vantagem do DeepSeek é que ele é mais preciso do que outros. A principal desvantagem é que ele é lento, e adicionarei alguns dos meus próprios conhecimentos após a tradução e darei um polimento adicional em todo o parágrafo, mas isso também pode ser causado por eu não ter depurado completamente.
O Doubao é rápido, mas menos preciso. Já testei em alguns fóruns em inglês. Há algumas expressões coloquiais e localizadas, e ele só as traduz literalmente. Mesmo que eu use prompts para ajustar, não é o ideal. Atualmente, o DeepSeek é o principal, mas também suporta alternância e seleção manual pelos usuários.
APPSO: O design picture-in-picture é muito interessante. O que você achou desse ponto de entrada?
Daxin: Um amigo meu criou um produto no ano passado. Aliás, a própria Apple não tem a capacidade de abrir uma janela flutuante global. Renderizamos os resultados da tradução em um vídeo, exibimos no formato picture-in-picture e adaptamos para a saída de streaming, o que melhora a experiência geral.
APPSO: Esse é um caminho muito inteligente.
Daxin: Alguns dos meus amigos nerds de tecnologia perguntaram como você teve essa ideia. Mas, na verdade, o picture-in-picture ainda tem muitas limitações funcionais, então também fizemos muitas otimizações. Por exemplo, quando o texto traduzido é muito longo, você pode rolar clicando no botão de reprodução, clicar no botão de voltar ou avançar para rolar para cima e para baixo e gravar os resultados da tradução na área de transferência, o que pode ajudar os usuários a reescrever o texto com um clique.
Acho que todo designer vale a pena aprender sobre a interação com a Apple. Amigos que estão acostumados com a Apple sabem que é possível pesquisar arrastando para baixo na área de trabalho. Também adicionei esse hábito operacional ao aplicativo. Você também pode acessar a pesquisa agregada imediatamente arrastando para baixo na página inicial. Em termos relativos, os usuários começarão mais rápido.
Nas duas páginas de adição de modelos grandes e configuração de estilos, por exemplo, quando os usuários estão configurando, eles precisam preencher algumas variáveis na caixa de entrada. Consultei as instruções de atalho e as coloquei acima do método de entrada, para que os usuários possam adicioná-las imediatamente clicando.
APPSO: Você mencionou anteriormente que seu inglês é limitado, mas agora desenvolveu uma ferramenta em inglês. Pela sua experiência pessoal, você se tornou mais disposto a trabalhar com conteúdo em inglês por causa do desenvolvimento deste produto?
Daxin: De fato, agora acabo navegando por posts estrangeiros no meu celular com mais frequência do que antes. Antes, eu lia principalmente no computador e instalava um plugin de tradução. No entanto, os aplicativos no celular são relativamente fechados e não consigo usar ferramentas de tradução como os computadores. Desde que desenvolvi essa ferramenta, acabo abrindo esses softwares para verificar antes de dormir, então passo mais tempo navegando pelos posts no meu celular.
APPSO: Você prefere que ele continue sendo uma ferramenta do que assumir a função de aprendizado.
Daxin: Sim, é uma ferramenta eficiente. Espero que os usuários possam abri-la e operá-la rapidamente quando precisarem de tradução. Espero que os usuários possam iniciar o Para sem perceber, a qualquer hora, em qualquer lugar, a qualquer momento.
#Bem-vindo a seguir a conta pública oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.