Entrevista exclusiva com a equipe dos AirPods: como um pequeno fone de ouvido aprendeu a monitorar 50 esportes?


Fones de ouvido com monitoramento de frequência cardíaca não são a primeira invenção da Apple.

Na última década, Jabra, Sennheiser e Beats tentaram isso, mas nenhum desses recursos impressionou Nick Harris-Fry , corredor veterano e editor de fitness do Tom's Guide. Ele experimentou fones de ouvido com sensor de frequência cardíaca de quase todas as marcas, mas sua conclusão continua a mesma: nenhum fone de ouvido se compara à precisão de uma cinta peitoral.

A cinta peitoral, aquele dispositivo um pouco estranho que fica no peito, continua sendo o monitor de frequência cardíaca mais confiável disponível aos consumidores.

Até o surgimento dos AirPods Pro 3.

Nick Harris-Fry usou uma cinta peitoral Garmin HRM600 (precisão de nível de sinal elétrico) como comparação e descobriu que a curva de frequência cardíaca dos AirPods Pro 3 quase coincidia com a da cinta peitoral, especialmente em cenários como corrida em estado estacionário e corrida intervalada que exigem precisão extremamente alta; as duas curvas se encaixam como imagens espelhadas.

O que é ainda mais surpreendente é que ele pode detectar sua frequência cardíaca, avaliar seu ritmo e identificar mais de 50 tipos de exercícios em tempo real enquanto reproduz música.

Como o AirPods Pro 3 consegue isso?

Para encontrar a resposta, o iFanr entrevistou Ron Huang, vice-presidente de percepção e conectividade da Apple, e Steve Waydo, diretor de percepção de saúde . Nesta conversa, tentamos entender não apenas como uma nova tecnologia funciona, mas também como a Apple pensa sobre a interface definitiva do "corpo".

Seu canal auditivo pode entendê-lo melhor do que seu pulso

De uma perspectiva fisiológica, o canal auditivo é uma "zona dourada" sensorial natural. Ele está localizado perto da artéria temporal superficial, tem fluxo sanguíneo estável e é cercado pelo ouvido externo, deixando-o praticamente protegido da interferência da luz externa.

Essas características fazem do canal auditivo um ponto de coleta de sinais fisiológicos mais ideal do que o pulso.

Um artigo norte-americano intitulado "Princípios da análise de fotopletismografia vestível e sua aplicação no monitoramento fisiológico" afirma claramente:

O sinal PPG (fotopletismografia) do canal auditivo é superior ao do pulso e das pontas dos dedos em termos de distribuição vascular, interferência antimovimento e supressão de luz ambiente.

Em contraste, o pulso é um campo de medição repleto de variáveis. Movimentos musculares frequentes, movimentos bruscos dos braços, suor, cabelo e até mesmo a cor da pele podem interferir na propagação dos sinais luminosos.

Steve Waydo, diretor de percepção de saúde da Apple, verificou isso repetidamente em experimentos: em cenários como treinamento de força e remo, que exigem equipamentos de preensão, os dispositivos de pulso geralmente têm dificuldade em medir a frequência cardíaca de forma estável, enquanto os sinais de fluxo sanguíneo medidos pelos fones de ouvido são mais coerentes.

No ambiente de caixa escura do canal auditivo, os AirPods Pro 3 usam uma solução PPG infravermelha (IR PPG), que é diferente da fonte de luz LED verde usada pela maioria dos dispositivos no mercado.

Steve Waydo explicou que a luz infravermelha consome menos energia e evita o constrangimento de "luz verde saindo dos seus ouvidos".

Uma consideração mais importante é que os comprimentos de onda infravermelhos são mais profundos e penetrantes, permitindo que penetrem profundamente no tecido densamente vascularizado do canal auditivo e capturem sinais de pulso mais limpos e estáveis.

O sensor do AirPods Pro 3 emite pulsos de luz infravermelha aproximadamente 250–256 vezes por segundo e os combina com dados do IMU (acelerômetro e giroscópio) para eliminar artefatos de movimento, como as vibrações rítmicas causadas pelo impacto do pé no chão ao correr ou as mudanças na aceleração causadas ao virar a cabeça.

Este algoritmo, que combina sinais ópticos com dados dinâmicos, é a chave para que os AirPods Pro 3 mantenham a precisão da frequência cardíaca durante o exercício. Não é a vitória de um único sensor, mas o resultado da coordenação de dados multimodais.

Ron Huang, vice-presidente de percepção e conectividade da Apple, acrescentou:

Quando um usuário usa um Apple Watch e um AirPods Pro 3 ao mesmo tempo, o sistema rola e compara os sinais dos últimos 5 minutos e seleciona automaticamente a fonte mais confiável.

Por exemplo, durante o treino de força, as mãos realizam mais movimentos de preensão, o que interfere nos dados do dispositivo de pulso. O sistema então prioriza o sinal de frequência cardíaca do canal auditivo.

Nessa perspectiva, o Apple Watch e o AirPods Pro não pretendem substituir um ao outro, mas sim complementar-se em diferentes cenários, construindo juntos um espelho digital mais completo e realista do mesmo corpo.

Os resultados decrescentes de dez anos de algoritmos

A equipe de Waydo vem acumulando algoritmos desde os primórdios do Apple Watch. A rede neural foi originalmente projetada para o pulso, com foco nas propriedades ópticas dos vasos sanguíneos do pulso, padrões de balanço do braço e padrões de dispersão de luz do tecido cutâneo.

Mas, surpreendentemente, o acúmulo desses dez anos não foi invalidado pela mudança de plataforma: eles se tornaram a base para o desenvolvimento do sensor de frequência cardíaca dos AirPods.

Como o espaço nos fones de ouvido é extremamente limitado, o AirPods Pro 3 usa uma "versão miniaturizada" do algoritmo de frequência cardíaca do Apple Watch.

Eles usaram dados abrangentes coletados de protótipos de fones de ouvido para refinar ainda mais o modelo, permitindo que ele monitorasse com precisão a frequência cardíaca em condições extremas. Os testes incluíram variações de tons de pele, formatos de orelha, temperatura e umidade, e intensidade do exercício, mantendo a estabilidade até mesmo em climas frios.

"Ajuste" é uma palavra-chave mencionada repetidamente na entrevista. Ela não está relacionada apenas à experiência acústica – o efeito da redução ativa de ruído e a sensação imersiva do áudio espacial –, mas também determina diretamente a precisão dos dados fisiológicos.

Quando os fones de ouvido se encaixam bem, as leituras de frequência cardíaca de ambos os ouvidos são muito precisas.

Steve Waydo disse.

Essa também é a razão oculta pela qual a Apple redesenhou a estrutura intra-auricular, otimizou o formato dos protetores auriculares de silicone e atualizou o algoritmo de ajuste adaptável nos AirPods Pro 3. Essas melhorias que parecem ser para o som também estão abrindo caminho para o monitoramento fisiológico.

Como um grande modelo de linguagem: como fazer os fones de ouvido entenderem 50 tipos de movimentos?

O monitoramento preciso da frequência cardíaca é apenas o ponto de partida.

O objetivo da Apple é dar ao AirPods Prio uma experiência esportiva comparável à do Apple Watch – não apenas sabendo a velocidade da sua frequência cardíaca, mas também entendendo qual exercício você está fazendo, quantas calorias você queimou e a distância que você correu.

Isso significa que a Apple precisa usar "todos os sensores possíveis".

Os AirPods Pro 3 são essencialmente um "miniecossistema" em termos de sistema sensorial. No caso dos fones de ouvido, eles utilizam um acelerômetro, um giroscópio e um sensor de frequência cardíaca, enquanto no caso do iPhone, o GPS e um barômetro contribuem. Os fluxos de dados gerados por esses sensores precisam ser integrados, analisados ​​e convertidos em métricas de movimento significativas em tempo real.

Ron Huang mencionou que o Apple Watch acumulou uma vasta experiência com sinais de movimento, como movimentos dos braços durante a corrida e padrões de movimento durante o treino na máquina de remo. Migrar essa capacidade para os AirPods requer "traduzir" as observações originais do movimento do pulso em observações do movimento da cabeça.

Para isso, a equipe tomou emprestadas as ideias de treinamento do Large Language Model (LLM) – aprendendo uma "gramática de ação" comum por meio de dados massivos, em vez de regras codificadas para cada movimento.

Eles treinaram um novo Modelo de Fundação de Movimento baseado em aproximadamente 50 milhões de horas de dados de movimento do mundo real do Apple Heart and Movement Study.

Foi um estudo aberto lançado pela Apple há alguns anos ao público, com participantes doando voluntariamente dados de exercícios do Apple Watch e do iPhone.

É essencialmente um modelo de regressão que entende qual atividade você está fazendo, se está trabalhando contra resistência, se está envolvendo grupos musculares grandes ou pequenos, o plano de movimento e a posição do seu corpo.

Para garantir que o algoritmo possa abranger diferentes tipos de exercícios, como Pilates, HIIT e aparelhos elípticos, a Apple convidou participantes com diferentes níveis de aptidão física e habilidade para testar e calibrar.

No laboratório: Eles usaram o que é considerado o método "padrão ouro" – usar uma máscara de oxigênio e usar um carrinho metabólico para observar a taxa real de troca de oxigênio para verificar a precisão do modelo de calorias.

Para monitorar a contagem de passos e a distância, a equipe desenvolveu uma nova rede neural de movimento de pedestres. Eles convidaram centenas de pessoas para um laboratório de biomecânica, usando esteiras calibradas para registrar a distância, sensores de pressão colocados nas solas dos sapatos para marcar os momentos de pisada e de impulso, e câmeras para capturar todo o seu percurso.

No final, eles conseguiram lançar o rastreamento de "mais de 50 tipos de esportes ao mesmo tempo" nos AirPods, algo que levou anos para ser alcançado na era do Apple Watch.

Da acústica ao corpo: o destino final da tecnologia

Como um dispositivo que está sempre próximo ao corpo, os AirPods estão naturalmente em uma posição delicada: eles estão voltados para o mundo externo, amplificando o som, filtrando o ruído e reconstruindo o espaço; eles também estão voltados para o eu interior, detectando a respiração e monitorando o pulso.

Quando um dispositivo acústico começa a entender a subida e descida de um batimento cardíaco, o ritmo de um passo e a linguagem do corpo, ele não é mais apenas um dispositivo de saída, mas uma interface perceptiva bidirecional.

De "ouvir o mundo" a "ouvir o corpo", esse caminho dá continuidade à filosofia consistente de produtos da Apple: a tecnologia deve, em última análise, retornar à percepção humana.

Fones de ouvido já foram apenas uma saída para música e um tocador de conteúdo. Agora, estão se tornando um portal para o corpo e um sensor de autoconsciência. Quando a tecnologia aprende a ouvir o corpo, ela realmente aprende a ouvir as pessoas.

De espectador e registrador da tecnologia a praticante de como a tecnologia impacta os estilos de vida.

#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.

iFanr | Link original · Ver comentários · Sina Weibo