Entrevista exclusiva com a equipe de ajuste do Vivo TWS 5 Hi-Fi Edition: trazendo a sinfonia mais autêntica “ao vivo” para o público

"As pessoas sempre superestimam as mudanças nos próximos 1 a 2 anos, mas subestimam as mudanças nos próximos 10 anos." As palavras de Bill Gates têm uma versão mais concreta. Yu Yang, professor e reitor do Departamento de Engenharia Musical do Conservatório de Música de Xangai, diretor do Laboratório de Acústica Musical de Xangai e compositor, comentou sobre a versão Hi-Fi do vivo TWS 5:
Se este fone de ouvido vivo tivesse sido vendido há dez anos, não sei por quanto teria sido vendido.
É claro que, com os recursos tecnológicos de 10 anos atrás, nenhum fabricante ousaria afirmar ser capaz de criar um fone de ouvido Bluetooth Hi-Fi verdadeiramente sem fio com redução de ruído de 60 dB e transmissão full-link sem perdas. O ponto do professor Yu Yang é que, embora os fones de ouvido vivo TWS 5 Hi-Fi de 499 yuans não sejam caros apenas em termos de qualidade de som, eles elevam a qualidade sonora e a estética da música portátil em celulares a um nível inimaginável há 10 anos.

Para restaurar a sinfonia mais difícil
Ao afinar um par de fones de ouvido, destacar as notas agudas, altas e claras, ou os graves vibrantes são métodos mais óbvios e eficazes. Até mesmo as pessoas mais tímidas sentirão o estímulo auditivo direto em algumas músicas conhecidas para audição.
Mas a versão Hi-Fi do vivo TWS 5 escolheu outro caminho: o vivo Golden Ear Acoustic Laboratory e a equipe de afinação do Conservatório de Música de Xangai trabalharam juntos para ajustar a qualidade do som, desconstruindo as características de ressonância de 32 instrumentos na sinfonia e criaram em conjunto o efeito sonoro "Ultimate Master".

Embora as palavras sejam sempre insuficientes para descrever o som, e poucas pessoas consigam escrever uma frase como "garrafa de prata quebra de repente e água espirra, cavalaria de ferro avança e espadas e armas soam", a vivo ainda tenta o seu melhor para descrever a experiência auditiva do "Mestre do Som" da seguinte forma:
Deixe a cavidade de madeira do violoncelo respirar ao lado dos seus ouvidos, e o atrito metálico do trompete se transforma no farfalhar da folha de ouro. Simultaneamente, o código acústico do Salão Dourado de Viena é codificado na microcavidade, permitindo que as sutis pinceladas de Brahms e Debussy sejam capturadas vividamente neste pequeno espaço. É mais do que apenas notas; é o diálogo mais autêntico entre instrumentos e ar.
Um engenheiro acústico do Laboratório Acústico Golden Ear da vivo disse ao iFanr:
Sinfonias são extremamente desafiadoras para sistemas acústicos de fones de ouvido. A música vocal popular normalmente enfatiza melodia e ritmo, e a instrumentação geralmente se baseia em um arranjo de quatro peças. Sinfonias, por outro lado, exigem ritmos, melodias, timbres e harmonias complexos. A música em si apresenta instrumentação complexa, dinâmica ampla, ampla extensão e um palco sonoro amplo e profundo. Essas características são difíceis de alcançar com fones de ouvido TWS.
Em outras palavras, em comparação com a música pop com vocais e uma pequena quantidade de acompanhamento instrumental, a complexidade da sinfonia é muito maior, e a ampla faixa sonora e o grande campo sonoro representam um grande desafio para fones de ouvido TWS de tamanho pequeno.
Ele explicou ainda por que é tão difícil reproduzir a sinfonia em fones de ouvido TWS:
Na verdade, é difícil e vazio explicar a experiência auditiva do som com conceitos, porque o som é essencialmente uma sensação. Mesmo que seja a mesma "sensação de presença", a experiência interior de cada um é diferente.
Entendemos que "sensação de leveza" corresponde a "clareza e resolução". Como podemos realmente restaurar a vibração do ar causada pelos instrumentos na cena musical através dos alto-falantes? É como se os instrumentos ou vocais em um concerto chegassem diretamente aos nossos tímpanos apenas através da vibração do ar, e as mudanças sutis nas subidas e descidas das cordas pudessem ser claramente distinguidas. Isso requer maior clareza e resolução nos fones de ouvido.
"Atmosfera" corresponde a "calor e camadas". Da perspectiva da psicologia auditiva, sons quentes e em camadas podem criar melhor a sensação de atmosfera. De modo geral, são necessárias frequências médias e baixas densas e claras, com frequências altas, médias e baixas distribuídas uniformemente e suavemente conectadas.
Como descrito acima, "o diálogo mais autêntico entre instrumentos musicais e ar" é, na verdade, a personificação do Hi-Fi.
Restaurar uma sinfonia é, na verdade, o teste definitivo do Hi-Fi. Uma partitura alta é aquela que produz a sensação de "imersão e como se você estivesse lá", porque a partitura completa está "verdadeiramente lá".

A equipe de afinação do Conservatório de Música de Xangai, que trabalhou com o Laboratório Acústico Golden Ear da Vivo para realizar a afinação da qualidade sonora, incluiu Yu Yang, professor e diretor do Departamento de Engenharia Musical do Conservatório de Música de Xangai; Liu Hao, professor, orientador de doutorado, diretor do Laboratório de Musicoterapia com Inteligência Artificial; diretor do Departamento de Música Étnica; compositor e fagotista do Conservatório de Música de Xangai; Qin Shile, professor do Departamento de Engenharia Musical; diretor da Seção de Ensino e Pesquisa em Design e Produção Musical; Chen Shizhe, professor associado do Departamento de Engenharia Musical; diretor da Seção de Ensino e Pesquisa em Tecnologia Musical e Arte; e afinador de som de primeiro nível; e Wang Xin, engenheiro de gravação, engenheiro de gravação de primeiro nível e afinador de som de primeiro nível da Orquestra Sinfônica de Xangai. Esta é uma equipe completa, engajada em música sinfônica, da composição à execução, à gravação e à afinação. Quando perguntados sobre qual era sua maneira preferida de ouvir sinfonias, suas respostas foram exatamente as mesmas:
Vá até a cena.
Portanto, "restaurar a sinfonia mais difícil" se tornou uma tarefa que exigiu que a equipe acústica da vivo e a equipe de afinação do Conservatório de Música de Xangai demonstrassem seus respectivos pontos fortes e se entendessem.
Isso não requer apenas a criação de uma estrutura acústica mais sofisticada dentro da pequena cavidade do fone de ouvido TWS, mas também o fortalecimento do True Wireless Hi-Fi, desde a transmissão do sinal até a decodificação de áudio e, por fim, o desempenho True Wireless Hi-Fi completo apresentado pela unidade acústica. Também requer um profundo conhecimento da arte da sinfonia e uma melhor capacidade estética.

As versões vivo TWS 5 e vivo TWS 5 Hi-Fi utilizam o diafragma acústico de cerâmica de tungstênio de segunda geração, um componente essencial do sistema acústico. O diafragma converte os sinais elétricos recebidos em vibrações físicas, que, por sua vez, impulsionam o ar em movimento e o transmitem ao tímpano, produzindo o som que ouvimos. O diafragma acústico de cerâmica de tungstênio de segunda geração, graças ao seu nanorrevestimento quádruplo, oferece alta rigidez e elasticidade, resultando em resolução, transientes e resposta dinâmica excepcionais. Com uma faixa de resposta de frequência de 16 Hz a 48 kHz, ele pode capturar melhor os detalhes sonoros ricos, aprimorando a pureza sonora e a expressão dinâmica.
A versão Hi-Fi do vivo TWS 5 é o primeiro fone de ouvido na plataforma Dimensity a oferecer suporte à transmissão de áudio sem perdas e pode suportar uma taxa de transmissão de áudio sem fio de 1,4 Mbps.
Esta é uma linha, pois a taxa de bits da qualidade de som de CD (16 bits/44,1 kHz) é de 1,4 Mbps. A versão Hi-Fi do vivo TWS 5 suporta o protocolo de transmissão ultra-claro LHDC 5.0 e, pela primeira vez na plataforma Dimensity, suporta transmissão de áudio sem fio LHDC sem perdas. Embora a taxa de transmissão seja de até 1,4 Mbps, ela pode proporcionar uma experiência de qualidade de som sem perdas de 48 kHz/16 bits.
Com base nessa sólida base técnica, a equipe de afinadores do Conservatório de Música de Xangai usou seus pontos fortes.
Em termos de afinação detalhada, a música de cordas, como base da sinfonia, é uma grande família de instrumentos, abrangendo toda a faixa de frequência, do violino ao baixo, e ostentando harmônicos ricos. Foi exatamente nisso que o Laboratório Acústico Golden Ear da Vivo e a equipe de afinação do Conservatório de Música de Xangai se concentraram. Sua primeira tarefa foi afinar os detalhes da seção de cordas. Além disso, eles enfrentaram os desafios de afinar os instrumentos característicos, especialmente instrumentos de sopro e percussão, que são difíceis de afinar. Como os timbres desses instrumentos são difíceis de capturar com precisão, a equipe de afinação da qualidade sonora precisou testar repetidamente a fórmula ideal do timbre, como se estivesse misturando cores em uma paleta de pintura a óleo, para garantir a restauração precisa da textura e da profundidade de cada nota.

Há também uma parte mais importante, que diz respeito à estética musical, ou estética auditiva.
O professor Yu Yang do Grupo Mestre de Afinação do Conservatório de Música de Xangai disse ao iFanr:
Ao ajustar a qualidade do som deste fone de ouvido, fortalecemos principalmente a tonalidade estética da audição e a definição da qualidade do som.
Produtos criados exclusivamente por meio de avanços tecnológicos costumam ser orientados por dados, objetivos e baseados em métricas, mas podem não necessariamente soar excelentes. Por exemplo, um piano tem centenas de cordas e 88 teclas. Se fosse afinado inteiramente por máquina, poderia ser afinado com incrível precisão, até o último milímetro, mas o resultado não seria necessariamente agradável. Nossa equipe se concentrou em integrar padrões estéticos acústicos relativamente subjetivos, porém universais, com o hardware objetivo desses fones de ouvido, alcançando um ajuste harmonioso e permitindo que todos experimentem o que é um bom som.

▲ Yu Yang, professor e reitor do Departamento de Engenharia Musical do Conservatório de Música de Xangai, ouvindo música
O que é um bom som?
Chegar a um consenso sobre a resposta não foi fácil para ambas as partes envolvidas. A definição de bom som é subjetiva e individual. Desta vez, o debate mais acalorado entre a equipe de acústica da vivo e os especialistas em afinação do Conservatório de Música de Xangai girou em torno da questão: "Devemos atender ou liderar as preferências acústicas predominantes do mercado?"
Se for para atender ao mercado, as frequências altas e baixas serão deliberadamente exageradas para tornar a experiência auditiva mais estimulante.
Se você quer liderar o mercado em estética acústica, então você deve começar com o senso de equilíbrio de uma sinfonia.
O resultado final, é claro, já foi esclarecido pela cooperação entre as duas partes. Em última análise, ambas querem ser líderes mais vanguardistas na questão central do "bom som", que está relacionada à essência da música.
No entanto, a discussão é sempre contínua e nova. Como integrar os níveis subjetivo, artístico e estético com os níveis objetivo, técnico e quantitativo para alcançar um estado em que possam ser mutuamente explicados e verificados continua sendo uma questão de longo prazo que merece discussão contínua por ambas as partes.

A “luz” e o “calor” da tecnologia
A tecnologia às vezes é como uma fogueira. Quando você se aproxima dela, consegue sentir a radiação e o calor da tecnologia, e sentir o calor.
A redução de ruído é um recurso técnico que os usuários podem perceber claramente.
As versões vivo TWS 5 e vivo TWS 5 Hi-Fi oferecem profundidades de redução de ruído de até 60 dB e uma largura de banda de redução de ruído de 5500 Hz. Como mencionado acima, em relação à qualidade do som, hardware potente e especificações de ponta dependem, em última análise, de cenários específicos.
O Laboratório Acústico Vivo Golden Ear disse ao iFanr:
Nossa pesquisa constatou que os principais cenários para o uso de fones de ouvido pelos usuários ocorrem principalmente em situações cotidianas, como em casa, no deslocamento diário e em caminhadas na rua. Em particular, o ruído em cenários de deslocamento diário e viagens de negócios é relativamente alto, e os pontos problemáticos dos usuários não foram bem resolvidos. Portanto, realizamos coleta e análise de ruído específicas para esses cenários de alto ruído e, finalmente, depuramos nosso efeito de redução de ruído mais satisfatório.
A profundidade é um dos indicadores que representam o efeito de redução de ruído, mas isso não significa que essa profundidade precise ser alcançada em todas as cenas. Para obter o melhor efeito, ajustamos especialmente a curva de redução de ruído como um complemento para essas cenas.
Assim como as imagens de celulares, muitos anos atrás, a busca pela fotografia era relativamente simples. Por exemplo, retratos exigiam um forte desfoque de fundo, a pele precisava ser alisada para parecer um ovo descascado e as cenas noturnas precisavam ser tão brilhantes quanto a luz do dia. Hoje, o nível estético das imagens de celulares foi significativamente aprimorado. Os retratos devem transmitir uma sensação de vida, cheia de sangue, e as cenas noturnas devem ter um equilíbrio entre claro e escuro, com uma sensação de profundidade noturna.
A redução de ruído nos fones de ouvido TWS não se resume a ir além dos limites e atingir a redução máxima de ruído. Exagerar, independentemente do cenário específico, não é confortável. Por isso, a vivo otimizou o vivo TWS 5 e o vivo TWS 5 Hi-Fi para três cenários típicos de transporte: aviões, metrôs e ônibus. Por exemplo, o som mais alto e irritante em aviões é o ruído de baixa frequência do motor. Portanto, no modo de redução de ruído "Avião", o ruído de baixa frequência é suprimido e amplificado adequadamente.
Existem também alguns cenários que merecem mais atenção aos detalhes. Por exemplo, durante as horas douradas do trabalho matinal ou durante um cochilo ao meio-dia, você pode ativar o "modo de imersão" para reduzir o ruído e adicionar um pouco de ruído branco, o que pode ajudar as pessoas a se concentrarem mais.

▲ As versões vivo TWS 5 e vivo TWS 5 Hi-Fi oferecem suporte a tela pop-up de conexão personalizada
Há muitos outros exemplos de uso da tecnologia para mudar diretamente a experiência nas versões vivo TWS 5 e vivo TWS 5 Hi-Fi, como: modo de jogo de baixa latência de 42 ms, que garante áudio e vídeo quase sincronizados em jogos de tiro FPS; resistência IP54 à poeira e água, que pode lidar com a intrusão de chuva, suor e poeira em dias chuvosos e durante exercícios; "Tradução de IA" vinculada ao "vivo Translator" em telefones vivo, que também desempenha um papel importante em cenários de viagens internacionais, e assim por diante.
Mas às vezes, como uma fogueira, a tecnologia não funciona apenas com calor, mas também com luz.
O professor associado Chen Shizhe, da equipe de afinação do Conservatório de Música de Xangai, está explorando pesquisas em música e IA. Ele descobriu que a qualidade da música estrangeira gerada por sua equipe com IA é muito superior à da música nacional. Isso não se deve ao algoritmo, mas à qualidade dos dados. A fonte de dados usada para treinar o modelo grande não é boa o suficiente, e a qualidade da música gerada também será inferior.

▲ Chen Shizhe, professor associado do Departamento de Engenharia Musical e diretor da Seção de Tecnologia Musical e Ensino e Pesquisa de Arte do Conservatório de Música de Xangai, ouvindo música
O professor associado Chen Shizhe, da equipe de afinação do Conservatório de Música de Xangai, também contou ao iFanr a lógica subjacente à decisão final do Conservatório de Música de Xangai de cooperar com a vivo:
O equipamento de reprodução usado por nossos filhos nas aulas de música desde a infância não é muito bom. É uma caixa de som pequena e barata ou uma caixa de som pequena pendurada na parede. Em outras palavras, eles foram treinados para prestar pouca atenção à qualidade do som desde a infância.
Mesmo quando o karaokê era popular, muitas obras musicais foram gravadas para se adequarem aos alto-falantes, o que também estabeleceu um padrão. Por um lado, promoveu o desenvolvimento da indústria do áudio e, por outro, influenciou a estética musical de muitas pessoas.
No passado, dispositivos de reprodução que competiam em volume e estimulação sensorial influenciavam profundamente a perspectiva auditiva de todos, mas uma estética musical melhor e mais científica precisa ser baseada em uma curva auditiva mais equilibrada e precisa, bem como em melhores dispositivos de reprodução.
Esta também é a mais recente demanda dos consumidores atuais por fones de ouvido. Wang Youfei, gerente geral do departamento de desenvolvimento de terminais inteligentes da vivo, disse ao iFanr:
Com a melhoria da estética musical em toda a sociedade, a popularização da música sem perdas e a iteração da tecnologia de áudio de diversos fabricantes, os consumidores também passaram a exigir mais do som ouvido em fones de ouvido. Os requisitos de qualidade sonora evoluíram gradualmente de "ouvir o som" para "restauração do som original em nível de estúdio", e os consumidores esperam obter uma experiência musical mais imersiva.
O avanço da tecnologia e dos produtos, a melhoria da estética musical e a atualização das necessidades do usuário são três aspectos interligados, e a relação entre eles está se tornando cada vez mais próxima.

Na visão da vivo e do Conservatório de Mestres de Afinação Musical de Xangai, a versão Hi-Fi do vivo TWS 5 espera se tornar um produto que conecta o passado e o futuro.
Por um lado, suas curvas equilibradas e precisas, aliadas à qualidade sonora de alta fidelidade, remodelam a estética musical até então aceita, caracterizada por estímulos intensos e sons graves. Por outro lado, para a criação musical na futura era da IA, o corpus musical da IA exige música de alta qualidade sonora e apelo estético. Fones de ouvido que apresentem com precisão tanto a qualidade estética quanto a sonora são a alavanca para a criação musical e a pedra angular que determina o nível de nossa proeza musical na era da IA.
O mais importante é que, como disse o professor Yu Yang, da equipe de afinação do Conservatório de Música de Xangai, o progresso tecnológico, por um lado, melhorou a experiência do usuário e, por outro, reduziu o limite. Costumávamos dizer que fones de ouvido eram "apenas para ouvir ruído por menos de 10.000 yuans", mas agora a Vivo pode alcançar "alta fidelidade por menos de 500 yuans".
A compreensão musical do Laboratório Acústico Golden Ear também foi enriquecida por meio desta colaboração. Anteriormente, eles condensavam sua busca pelo som em "som de alta resolução, claro e acolhedor". Agora, por meio desta colaboração, eles aprofundaram a expressão do "ar" e da "atmosfera". Isso porque desejam destacar a presença e o realismo da sinfonia, para que o público possa não apenas ouvir a restauração precisa das notas, mas também perceber a ressonância espacial da execução da orquestra, as sutis transições tímbricas entre os instrumentos e a atmosfera emocional contida na música, alcançando, em última análise, um salto da "restauração técnica" para a "expressão artística".
Assim como sempre ouvimos falar do "Vienna Golden Hall", para a maioria das pessoas, este music hall é um nome abstrato, e ouvir um concerto do Festival da Primavera aqui é um conceito vago. Todos sabemos que a música aqui é linda, mas estamos sempre separados dessa beleza por um véu.
O trabalho do Golden Ear Acoustic Laboratory da vivo é, na verdade, visualizar essa beleza altamente ambígua e de alto conceito o máximo possível por meio de produtos e, assim, concluir um trabalho de educação estética.
Este é o lado "leve" da tecnologia, suave, mas tangível.
Embora, da perspectiva da educação estética musical, ou do nível da música na futura era da IA, seja difícil dizer que produtos como a versão Hi-Fi do vivo TWS 5 possam ter um impacto direto e intuitivo no curto prazo, mas, a longo prazo e em longa cadeia, esses lugares precisam ser iluminados pela "luz" antes que gradualmente percebamos: Ah, acontece que esta é a direção que devemos seguir.
Este é um esforço de uma década. Talvez em 10 anos, com a ajuda de tecnologias avançadas de áudio computacional, áudio espacial e até mesmo de interface cérebro-computador, seremos capazes de recriar virtualmente a emocionante experiência auditiva de ouvir uma sinfonia no Salão Dourado de Viena em nossos dispositivos portáteis. No entanto, não se esqueça de que o primeiro passo que dermos hoje determinará onde chegaremos.
#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.

