Entrevista com Xu Chi da XREAL: Eu tenho um celular e um computador, por que eu iria querer trocá-los por óculos com inteligência artificial? Diversity Company

Nota do Editor

Quando queremos uma Coca-Cola, geralmente temos apenas duas opções: Pepsi e Coca-Cola. Ao escolher um celular, há 90% de chance de ficarmos alternando entre a Apple e marcas como Huawei, Xiaomi, OPPO e Vivo. Ao comprar roupas esportivas, as primeiras marcas que vêm à mente provavelmente são Nike e Adidas.

Mas o mundo é tão colorido porque, além desses gigantes, existem empresas que desafiam a tradição, se esforçam para criar algo diferente, focam no design e na funcionalidade e olham para o futuro.

Elas possuem modelos de negócios não convencionais, e seus designs e produtos oferecem valor único ao usuário e muitos assuntos para discussão nas redes sociais. Fundamentalmente, elas não estão sobrecarregadas pelas restrições das grandes corporações e ousam avançar de forma audaciosa. São "empresas da diversidade".

A diversidade é fundamental para um mundo aberto. A ifanr acredita que apenas as empresas que realmente valorizam e compreendem a diversidade conseguem prever o futuro mais cedo do que a maioria. Nesta coluna de mesmo nome, a ifanr compartilhará entrevistas exclusivas com essas empresas diversas, mostrando como elas estão remodelando o futuro e definindo o novo normal.

Este é o décimo artigo da coluna "Empresas da Diversidade".

Em 2017, Xu Chi se demitiu da Magic Leap e retornou à China para fundar a XREAL (antiga Nreal). Naquela época, toda a indústria de XR estava celebrando a demonstração da Magic Leap com a baleia, e todos pensavam que esse era o futuro, mas ninguém havia vendido um único óculos de RA para o consumidor final.

Passaram-se nove anos, e este campo vivenciou o auge e o declínio do metaverso da realidade virtual, a entrada de alto nível e a recepção morna do Apple Vision Pro, a expansão subsidiada da Meta Ray-Ban e a reavaliação de todas as formas de terminais pela onda da inteligência artificial.

A XREAL sobreviveu e se tornou uma das primeiras parceiras estratégicas de hardware para a plataforma Android XR do Google. De acordo com dados da IDC, a XREAL manteve sua posição como líder mundial em participação de mercado de óculos de realidade aumentada por quatro anos consecutivos. E recentemente, a XREAL submeteu oficialmente seu pedido de abertura de capital na Bolsa de Valores de Hong Kong.

Esta empresa de óculos inteligentes, que permaneceu inativa por quase uma década, está prestes a entrar em uma nova fase de negócios.

Esta entrevista exclusiva com a iFanr foi realizada antes da XREAL abrir seu capital na Bolsa de Valores de Hong Kong. Na conversa, Xu Chi não se esquivou de nenhuma pergunta incisiva — desde "Por que o Vision Pro da Apple estava fadado a ter problemas", até "Fabricantes chineses estão usando a integração da cadeia de suprimentos para vencer a primeira parte da guerra", e ainda "Nenhuma empresa no setor de óculos jamais lucrou de verdade". Mas, do começo ao fim, um consenso claro foi mantido:

Os óculos são o melhor meio para IA porque somente eles podem fornecer ao modelo o contexto da mais alta qualidade.

Xu Chi, fundador e CEO da XREAL

Sobreviver em um setor onde nenhuma empresa lucra.

P: Quando você saiu da Magic Leap para abrir seu próprio negócio, você estava trabalhando em um produto de ponta. Por que você decidiu criar uma empresa assim?

A: Quando eu estava na Magic Leap, os primeiros meses foram incríveis. De repente, você se vê no início de uma nova era e tem a oportunidade de estar na vanguarda dela. Se tiver sorte, você pode até participar da sua definição. Essa sensação é fantástica.

Na época, meu julgamento era de que essa era a próxima grande oportunidade e que certamente se concretizaria até 2020. Voltei em 2016 porque senti que, se não retornasse logo, seria tarde demais. Meu pensamento era que alguém com conhecimento nessa área certamente voltaria do exterior — como Robin Li e Charles Zhang naquela época. Essa pessoa poderia ser eu, ou um dos meus colegas, porque havia poucas pessoas que entendiam essa área naquele momento. Então, por que não você? Você não pode voltar totalmente preparado. Se as coisas não correrem bem, eu simplesmente volto. Esse era o meu pensamento simples na época.

Tem sido uma jornada difícil, com o setor passando por altos e baixos. Mas sempre me mantive fiel a uma coisa: nunca nos desviamos de nossas intenções originais. Isso também é um teste para descobrir qual é a verdadeira motivação de cada empreendedor: fama, sucesso ou riqueza?

Acreditamos sinceramente que os óculos são a próxima grande tendência, e isso não deve ser fácil. Por coincidência, entramos nesse setor muito cedo, quase como uma missão, ansiosos para descobrir qual seria a resposta final e até mesmo querendo permanecer no setor até que essa resposta seja revelada.

P: A XREAL acaba de comemorar seu nono aniversário no início deste ano. Em nove anos, vocês atenderam às expectativas?

A: Em primeiro lugar, definitivamente não atendeu às expectativas; toda a indústria não atende às expectativas, mas ainda assim estou bastante satisfeito.

Dada a nossa compreensão e entusiasmo na época, tivemos muita sorte de chegar onde estamos hoje. Ao longo do caminho, conhecemos muitas pessoas boas, indivíduos bondosos, parceiros a montante e a jusante, e nossa própria equipe, e é por isso que estamos onde estamos hoje.

É claro que, se pudéssemos passar por tudo isso novamente com a mentalidade de hoje, com certeza faríamos ainda melhor. Esse é o processo de crescimento. Costumo dizer aos meus colegas que, se o XR tivesse um museu que registrasse cada passo da sua história, o XREAL já teria deixado sua marca significativa.

P: As tendências do setor estão em constante mudança. Você já passou por momentos muito difíceis? Como os superou?

A: Com certeza.

Antes de uma indústria realmente decolar, todo momento sombrio costuma ser acompanhado por alguns momentos brilhantes. O mais memorável foi provavelmente quando a pandemia surgiu. Naquela época, nossos negócios internacionais estavam no auge, porque as pessoas precisavam desses produtos enquanto ficavam em casa, e todas as operadoras estrangeiras queriam cooperar conosco. Nossa estreia na CES foi um grande sucesso.

Mas então veio a pandemia, as pessoas não podiam sair do país, o financiamento foi interrompido, a equipe ficou instável e conflitos internos e externos surgiram simultaneamente. Internamente, houve disputas sobre estratégia e gestão, e externamente, algumas empresas que estavam indo bem de repente romperam suas parcerias.

Olhando para trás agora, me sinto muito mais tranquilo porque todos esses eram processos que deveriam ter sido dados como certos.

P: Na minha opinião, o Vision Pro replicou a tecnologia do Magic Leap e até a superou. Mas o Vision Pro não atendeu às expectativas. Isso foi um golpe para você na época?

A: Na verdade, ficamos bastante desapontados na época. Lembro-me muito bem de uma vez em que fui me encontrar com o Sr. Xing, do Meituan, e ele também estava acompanhando esse assunto. Depois que terminamos de conversar, ele perguntou: "O que a Apple está fazendo?". Eu respondi na hora: "O produto que a Apple está desenvolvendo provavelmente não vai funcionar".

Naquela época, muitas pessoas na China acreditavam que "tudo o que a Apple faz tem um motivo", e era impossível convencê-las do contrário. É difícil usar um produto que ainda nem foi lançado como prova. Mais tarde, se você quisesse dizer que a Apple fez algo errado, atrairia críticas.

Só nos resta seguir o fluxo. Mas, na verdade, já faz um tempo que sinto que há algo de errado com este produto da Apple.

P: Qual é o motivo?

A: Acho que este é o primeiro produto da Apple que não foi cortado.

Quando Steve Jobs estava na Apple, tudo girava em torno da personalização extrema: "Eu não sei o que você quer, então te dou o que você quer". Mas o Vision Pro é claramente "Eu não sei o que você quer, então te dou tudo" — ele adiciona isso e aquilo, é um produto que acumula recursos.

Dizem que essa é, de fato, a lógica interna de produto da Apple. Eles estão repetindo o caminho trilhado pelo Apple Watch — a primeira geração do relógio não foi um sucesso, mas abriu caminho para o sucesso subsequente, mostrando que focar no monitoramento da saúde e nos exercícios era a direção certa.

A ideia inicial por trás do AVP era também evitar julgamentos precipitados e tentar adicionar o máximo de recursos possível para ver o que os usuários prefeririam. No entanto, o erro foi que adicionar recursos demais ao headset o tornou pesado e desconfortável de usar.

Como resultado, o produto de primeira geração não forneceu à Apple nenhum feedback sobre "qual direção a próxima geração deveria tomar", porque o tamanho da amostra era muito pequeno. Portanto, é provável que eles sejam mais conservadores em sua próxima etapa.

P: Seus principais produtos atualmente comercializados são, na verdade, dispositivos móveis com telas grandes. Quando vocês decidiram abandonar os cálculos espaciais e, em vez disso, concentrar-se primeiro no desenvolvimento desses dispositivos? Por que vocês acreditam que esse posicionamento em relação aos dispositivos móveis com telas grandes é o correto?

A: Não foi algo que eu julguei; foi algo que me provou errado. Nossa situação atual é realmente resultado da nossa jornada. Explorando território desconhecido, o feedback genuíno do usuário é extremamente importante.

Nosso produto de primeira geração foi projetado para ser menor, mais barato e melhor. A ideia na época era fazer parceria com operadoras de telecomunicações, que tinham influência local, endosso da marca, canais e ecossistemas, enquanto nós fornecíamos a tecnologia, cuidando tanto do hardware quanto do software.

Certa vez, criamos o que consideramos o ciclo de comercialização mais completo da Coreia do Sul: aplicativos pré-instalados em celulares, óculos inclusos com os aparelhos, contratos 5G para reduzir os preços, vendas por meio de operadoras e canais da Samsung/LG, e a LG buscando conteúdo local para construir um ecossistema. Este é o ecossistema mais completo que vimos até hoje, mas não foi bem-sucedido — porque nem nós nem as operadoras tínhamos um apelo de plataforma real.

Só então você começará a refletir: quem é realmente capaz de construir uma plataforma?

Faço uma previsão ousada: apenas a Apple e o Google serão incluídos. Nem a Meta, nem a OpenAI.

Devido ao seu ímpeto e à sua presença consolidada no ecossistema de telefonia móvel nos últimos 20 anos, eles eram os únicos capazes de construir uma plataforma. Naquela época, meu pensamento era muito simples: Não façam isso.

Porque se um dia você desenvolver um sistema e o Google lançar um sistema completamente diferente, você terá essencialmente enganado todos os seus desenvolvedores. E se a lógica de interação for completamente diferente?

Então, precisamos voltar atrás e simplificar. Nossa formação é técnica, e cortar custos em áreas técnicas é o mais doloroso. Você precisa dizer para as pessoas que trabalham com SLAM: "Desculpem, antes usávamos seis graus de liberdade, agora precisamos usar três." Você pode pensar: "Qualquer um consegue trabalhar com três graus de liberdade, certo?" Mas não há outro jeito.

No entanto, nossa intenção original permaneceu inalterada — embora nos concentrássemos na tecnologia de displays, outra linha de pensamento nunca foi abandonada. Até que o Google nos encontrou.

P: Como você conseguiu essa colaboração com o Google?

A: Sempre mantivemos conexões de código aberto com o Google. Eles têm nos acompanhado internamente, incluindo alguns executivos da Apple, que compram nossos novos produtos assim que são lançados. A atenção dos seus pares é provavelmente o maior reconhecimento que você pode receber.

Até o lançamento do AVP pela Apple, o Google decidiu imediatamente seguir o mesmo caminho. No entanto, descobriu que o AVP havia fracassado. Dois fatores principais contribuíram para o seu fracasso: era muito caro e muito pesado. Devido ao alto custo, os desenvolvedores não se interessaram, acreditando que não haveria participação de mercado suficiente em três a cinco anos. Devido ao peso excessivo, os consumidores não tinham intenção de usá-lo por longos períodos ou continuamente.

A verdadeira solução reside em torná-la acessível e leve. A XREAL tem se concentrado em design leve e construção modular desde o início. Aproveitando nosso longo histórico de tecnologias essenciais em computação espacial e nossa excelente capacidade de fornecimento nacional, também somos mais competitivos em termos de preço. Assim, essa questão tornou-se uma progressão natural.

O projeto de óculos de realidade aumentada (XR) da XREAL para Android, Aura, em colaboração com o Google.

Os óculos são o melhor meio para IA.

P: Sejam dispositivos de computação espacial ou hardware de IA, qual deveria ser o formato ideal dos óculos inteligentes? Algumas pessoas do setor mencionaram uma divisão de L1 a L5. Você concorda? Porque, no campo dos óculos, a experiência atual de L1 é muito melhor do que a de L5, o que é bastante estranho.

A: Anteriormente, eu dei uma definição de L1 a L5, principalmente uma classificação de níveis de inteligência — nos estágios iniciais, eles podiam ser usados ​​ocasionalmente, mas depois se tornaram cada vez mais como um assistente pessoal. Mas por que os óculos leves não estão destinados a substituir tudo? Devido às limitações físicas da tela e da capacidade de processamento.

Se você deseja adicionar uma tela, a abordagem mais comum atualmente são os guias de onda ópticos. No entanto, mesmo em sua melhor forma, os recursos de exibição dos guias de onda ópticos são comparáveis ​​apenas aos dos displays head-up (HUDs) de carros. Eles são adequados para tradução e navegação, mas você não usaria um HUD de carro para assistir a filmes ou jogar. Além disso, nos acostumamos mal com as telas Retina — embora as telas Retina sejam a base de uma tela, elas também exigem muitas GPUs para renderizar mais pixels. Se isso fosse feito em um dispositivo leve e sempre ligado, a duração da bateria não seria suficiente.

Portanto, precisamos fazer concessões: existe um dispositivo mais leve que pode ser usado o dia todo, mas com uma tela de qualidade inferior; e existe um dispositivo relativamente mais pesado, mas com um formato portátil e recursos de tela equivalentes às telas Retina atuais. Esses dois são inerentemente distintos.

P: Então você acha que, no futuro, um par de óculos não resolverá todos os problemas?

A: Quando as pessoas pensam em óculos, podem pensar em diferentes formatos. O Meta Ray-Ban é um exemplo, o que estamos desenvolvendo agora é outro, e o capacete grande é mais um. Não se trata de escolher entre três opções. Assim como hoje em dia temos celulares, tablets, laptops e computadores de mesa, cada um atende a diferentes necessidades e tem prioridades distintas.

Os óculos de IA são projetados para serem usados ​​o dia todo, portanto, precisam ser leves. O segundo formato é o nosso atual modelo móvel, que é portátil em vez de ser usado o tempo todo. A vantagem é que, embora possa ser um pouco mais pesado, pode ser usado durante o trabalho e exibe conteúdo mais rico. Por outro lado, temos um capacete grande, incluindo o AVP, que oferece uma experiência absolutamente fantástica, mas talvez seja mais adequado para uso doméstico.

Acreditamos que essas três formas coexistirão pelos próximos 10 anos ou até mais, e nenhum dispositivo isolado substituirá tudo. Assim como nos filmes de ficção científica em que os relógios eram imaginados substituindo os celulares, infelizmente, ainda usamos relógios e celulares hoje em dia. Algumas coisas têm limites físicos.

P: Eu tenho um celular e um computador, por que preciso usar óculos para substituí-los?

A: Eu costumava pensar que os computadores e celulares de hoje comprimiram todo o mundo da informação da internet em uma grade retangular bidimensional. A verdadeira percepção tridimensional, a exibição tridimensional e a fusão dos mundos virtual e real são inevitáveis. Mas recentemente tive um novo pensamento — talvez isso por si só não seja forte o suficiente, não o suficiente para fazer os usuários sentirem: "Eu preciso fazer isso".

Esta é a nova resposta a que chegamos após mais de um ano de reflexão: devemos agradecer à IA, pois ela pode nos trazer uma forma completamente nova de interação. No passado, seja em um computador ou em um celular, era essencialmente um humano controlando uma máquina. Teclados são eficientes, mas têm uma curva de aprendizado íngreme, enquanto telas sensíveis ao toque são relativamente eficientes e têm uma curva de aprendizado baixa, mas ainda não escaparam do paradigma de "humano controlando máquina". A Apple usa rastreamento ocular para interação 3D no AVP, o que é extremamente ineficiente; é essencialmente interagir em uma tela 3D.

Quando a IA surgiu, foi uma revelação. A verdadeira próxima geração de interação não será mais sobre humanos controlando máquinas, mas sobre humanos se comunicando de forma eficiente com um agente inteligente, assim como fazemos hoje. No futuro, seu telefone, computador e óculos terão um agente inteligente, comunicando-se através dos cinco sentidos de uma forma que conecta as pessoas.

P: Muitos dispositivos de hardware de IA atualmente, como fones de ouvido e pingentes com câmeras, também servem como entrada de IA. Como você vê a concorrência com esses dispositivos? Eles são mais baratos e têm cenários de aplicação ainda mais amplos.

A: Vamos voltar aos princípios básicos. Por que os óculos são a melhor plataforma para IA? Porque, quando adicionarmos rastreamento ocular no futuro, os óculos poderão ser o único dispositivo capaz de determinar seu ponto de foco.

Por exemplo, seja com fones de ouvido ou outros dispositivos, se alguém quiser tirar uma foto e analisá-la — por exemplo, se houver três pessoas sentadas à sua frente, para quem você está olhando? — o envio da imagem inteira envolve uma enorme quantidade de processamento. Mas com o rastreamento ocular, posso detectar que você está olhando para uma pessoa específica; posso até recortar a silhueta dela e enviar apenas essa imagem para a nuvem. Os humanos também são assim naturalmente; quando estou concentrado conversando com você, posso notar apenas suas expressões faciais e não prestar atenção às árvores atrás de você. Somente óculos podem fazer isso.

Essencialmente, isso é muito semelhante ao princípio do LLM — o mecanismo de atenção. Os óculos são o terminal mais fácil para obter o contexto da mais alta qualidade.

P: Experimentei o Project Aura ontem e senti que, com uma interface realmente funcional, muitos cenários de produtividade se tornam possíveis com a ajuda do Agente de IA. Por exemplo, posso dispensar um computador — desde que eu consiga dar comandos, receber resultados claros e determinar se o trabalho do Agente atende às expectativas, já é suficiente.

A: Você fez uma excelente observação. Agora imagine que você é o CEO de uma empresa e os agentes de IA são os diversos funcionários. Como você pode fazer com que esses funcionários entendam suas instruções com cada vez mais precisão?

Não se trata de você parafrasear com palavras — porque as palavras podem distorcer algumas informações de contexto — mas sim do fato de a pessoa envolvida ter vivenciado muitos dos cenários do seu trabalho. Quando você repete uma ideia para ela, ela pode dizer: "Ah, você teve essa ideia naquele cenário, você mencionou isso enquanto conversava com alguém", porque ela tem mais informações de contexto e é mais provável que execute a tarefa com mais precisão.

Portanto, preciso aprimorar a entrada do agente de IA, transformando-a em uma entrada contextual, em vez de apenas um texto abstrato.

Projeto Aura

P: Se você fosse desenvolver óculos com inteligência artificial no futuro, como gostaria que eles fossem?

A: Espero que realmente possa me fornecer insights de uma perspectiva externa, insights que eu talvez não tenha percebido por conta própria. Ainda estou analisando a situação sob a ótica de um assistente pessoal. Espero que possa me ajudar a revisar meu trabalho ao final do dia, oferecendo ângulos e pontos que eu não havia considerado em primeira pessoa. Portanto, precisa estar disponível 24 horas por dia, 7 dias por semana, e ser multimodal.

P: Isso não contradiz sua direção atual no desenvolvimento de telas? Sua especialização técnica está mais focada em telas, mas o cenário que você acabou de mencionar parece ser possível sem uma tela.

A: O que a XREAL faz bem hoje é que, ao resolver um problema, voltamos aos princípios básicos e então usamos uma abordagem mais complexa para solucioná-lo. Assim como não fabricamos chips para telas. Por que a Tesla consegue construir carros? Alguém que trabalhava com pagamentos consegue construir carros? Por que alguém que fabrica carros consegue construir foguetes? Não é porque "isso é o mais próximo, então vou fazer". O que impressiona é que eles seguem consistentemente os princípios básicos — como resolver um problema usando um método aparentemente complexo, mas na verdade o mais direto.

P: Na sua opinião, quais são os princípios fundamentais do XREAL?

A: Um dispositivo de IA multimodal e resistente a todas as condições climáticas — com pelo menos oito horas de duração da bateria, além de memória de longo prazo — é um assistente pessoal de IA altamente rentável.

Nosso principal objetivo é criar um assistente pessoal com IA. A questão é priorizar a operação 24 horas por dia, 7 dias por semana, a exibição de informações ou a funcionalidade multimodal. Cada etapa é necessária para nos tornarmos o assistente pessoal definitivo. Essa ideia realmente ganhou forma após a maturação da IA ​​multimodal. A IA multimodal expandiu os limites do que acreditamos serem as capacidades desse campo. Minha visão inicial era de um dispositivo menor, mais leve e mais barato.

Visão de longo prazo na era caótica

P: Qual você considera ser o principal valor dos óculos inteligentes?

A: O principal valor dos óculos reside no fato de representarem a melhor forma de compartilhar contexto e atenção de alta qualidade com o modelo. O contexto atual é semelhante a um cache de CPU, uma espécie de memória de curto prazo. A memória de longo prazo, por outro lado, é um sistema de memória completamente novo. Ela surgirá nos próximos dois a três anos e é algo que todos na área de agentes têm pesquisado.

P: Isso é um consenso na indústria, ou muitas pessoas que fabricam óculos estão interessadas apenas em fabricar óculos?

A: Quando o iPhone foi lançado em 2007, não havia consenso. Na verdade, entramos em uma era caótica hoje. Assim como naquela época, ninguém conseguia prever a resposta; só podemos dizer, em retrospectiva, que Musk foi brilhante e Jobs foi incrível. Mas aquele período foi, em certa medida, uma era caótica; todos estavam em busca da resposta.

Mas o que eu quero dizer é que, quando se trata de inovação disruptiva nesta indústria, é improvável que ocorra uma situação como a de um romance de artes marciais, onde um mestre misterioso surge de repente e elimina todos. Esta indústria dá grande ênfase à pesquisa e desenvolvimento. O produto definitivo nesta era caótica, o "Momento iPhone", muito provavelmente não surgirá no meio da cadeia de suprimentos.

P: Muitos fabricantes nacionais já entraram na faixa de preço de 1000 yuans, e há cada vez mais produtos com preços exorbitantes no mercado. Como vocês mantêm a imagem da sua marca? Qual é a diferença fundamental entre vocês e as empresas que integram a cadeia de suprimentos?

A: Se continuarmos a enfatizar a originalidade, mas não conseguirmos superar as empresas com cadeias de suprimentos integradas, provavelmente significa que nossos elementos originais carecem de diferenciação. Acredito que nossos produtos sejam diferenciados, mas as coisas difíceis levam tempo.

Desde o sucesso do negócio de óculos de realidade aumentada da XREAL em 2022, tenho pensado constantemente sobre o posicionamento ideal da nossa marca. Aspiramos a produzir produtos de gama média a alta, e o reconhecimento da marca precisa de tempo para se desenvolver. O tempo é o maior inimigo das startups, e precisamos ser pacientes.

JK, da Insta360, disse certa vez: "Uma marca é a confiança que os consumidores depositam em você quando não têm informações suficientes."

Valorizamos muito essa confiança. Pode ser necessário gerar várias gerações de produtos para construí-la, mas um único produto ruim pode destruí-la. Portanto, nesse processo, não buscamos mais apenas um crescimento acelerado, mas sim um crescimento de alta qualidade.

Durante anos, temos nos dedicado a liderar o setor na transformação da experiência do usuário: chips, motores ópticos de amplo ângulo de visão e conversão de 2D para 3D em tempo real. Acredito que essas inovações se consolidarão gradualmente na mente dos consumidores. Naturalmente, alguns tentarão atalhos por meio do marketing, buscando criar a impressão de "sou como você", mas acredito que o tempo provará tudo.

P: O setor de IA está mudando quase que diariamente este ano. Como empreendedor de hardware, você se sente ansioso?

A: A lógica é a mesma da negociação de ações. Se você está sempre no mercado, observando as flutuações diariamente, é fácil que a volatilidade de curto prazo afete seu julgamento e humor. Se você adotar uma visão de longo prazo e ampliar sua perspectiva, poderá ter uma visão mais clara.

O principal desafio é testar sua determinação estratégica a longo prazo. Antes da ascensão meteórica da DeepSeek, os nomes mais conhecidos na China eram Kimi e Doubao. Naquela época, a DeepSeek optou por não anunciar seus serviços junto com outras empresas; em vez disso, concentrou-se discretamente em seu próprio desenvolvimento até que, um dia, observadores estrangeiros descobriram que ela havia até mesmo afetado o preço das ações da Nvidia. Provavelmente, achamos que fazer o mesmo é mais apropriado para nós.

Nossa base anterior nos dá alguma margem de manobra para esperar. Muitas empresas hoje são forçadas a lançar óculos, a criar óculos apenas em apresentações, porque precisam sobreviver até a próxima etapa — assim como quando fabricavam carros, todos ainda faziam óculos com base em apresentações de PowerPoint. Mas acho que é bom podermos dar um passo para trás e pensar a longo prazo.

P: O Google fez muita promoção na CES, mas não lançou nenhum produto. Vocês estão preocupados com o desenvolvimento lento da plataforma de vocês? O produto de vocês vai competir com o do Google?

A: Na verdade, o evento da Google na CES é um evento de pequena escala, fechado e para convidados. Eles convidaram muitas pessoas, incluindo nós, que passamos meio dia em sua sala de reuniões encontrando diferentes parceiros. Não tenho medo de que sejam lentos; tenho medo de que sejam rápidos. Porque uma plataforma precisa de ritmo; não basta apenas lançá-la. Também é preciso conteúdo essencial e um ecossistema. Estamos muito satisfeitos com a situação atual.

Além disso, tenho a impressão de que há uma certa pressa no desenvolvimento de IA na China atualmente. Parece que todos estão numa corrida, com a sensação de que, se chegarem seis meses atrasados, perderão a oportunidade. Mas não creio que definir esse paradigma de interação de próxima geração em IA seja uma questão de sair na frente; é uma corrida de longa distância, e estar no caminho certo é muito mais importante do que correr para a frente.

O Google fará o que fez com o Android. Acredito que em algum momento eles terão seu próprio Pixel, mas com certeza se concentrarão primeiro em construir a plataforma. Essa é a nossa estratégia bem clara. Portanto, não estamos preocupados com a concorrência no curto prazo. Eles podem ser nosso melhor parceiro — eles fazem o que nós não conseguimos, e o que fazemos é justamente o que eles mais precisam.

P: Os óculos provavelmente passarão por um processo semelhante ao dos telefones celulares e dos veículos de novas energias, indo da primeira para a segunda metade do mercado. Em que ponto você acha que estamos agora?

A: O mercado de óculos provavelmente seguirá um caminho semelhante ao dos smartphones e dos veículos de novas energias: os principais fabricantes investirão continuamente em P&D, alcançarão avanços significativos, aprimorarão rapidamente seus produtos e estabelecerão regras para o setor. Em seguida, os participantes da cadeia de suprimentos reduzirão custos e capacitarão mais fabricantes. A maioria dos fabricantes chineses está familiarizada com a segunda metade da fase – realizar pequenas iterações, inovações incrementais e produção em larga escala de produtos já definidos por outros. Mas a indústria de óculos ainda nem chegou a essa segunda metade.

O que eu menos quero ver é essa indústria usando a integração da cadeia de suprimentos e o marketing para travar uma batalha no primeiro tempo.

Porque a primeira metade do jogo ainda exige inovação e iteração tecnológica. Pessoalmente, não acho que nenhum dos produtos atuais tenha alcançado o fator "uau" do iPhone 1 original. E é improvável que esse "momento iPhone" tenha vindo de uma empresa de quarta categoria que apenas integra a cadeia de suprimentos.

Embora o mercado de óculos esteja em plena expansão, nenhum fabricante chinês ainda atingiu a marca de um milhão de unidades vendidas para um único produto. Globalmente, apenas a Meta se destaca, mas depende de subsídios. O verdadeiro ponto de virada para este setor será alcançado sem a dependência desses subsídios.

Pôsteres desenhados à mão por usuários do XREAL

P: Seu modelo de negócios ideal ainda é a venda de hardware?

A: Claro que não. Mesmo hoje, os fabricantes de modelos ainda não definiram seu modelo de negócios. O que você realmente quer perguntar é: quando um novo terminal, um novo paradigma de interação que leve a um novo terminal, surgir, como será a distribuição da cadeia de valor?

Acredito que definitivamente teremos um espaço. E como os dispositivos estão cada vez mais próximos de você, os atributos do hardware ou do ponto de entrada se tornarão cada vez mais robustos. No futuro, talvez você não precise comprar hardware, mas sim pagar uma assinatura mensal para ter esse assistente à sua disposição.

Se esse assistente estiver com você há três anos, tiver participado de quase todas as suas reuniões e não apenas registrado dados, mas também formado seus próprios julgamentos e memórias abstratas de longo prazo como se estivesse participando das reuniões, então você não conseguirá ficar sem ele.

P: Quem detém os dados? O que isso significa para a futura cadeia de valor?

A: Sempre houve uma questão neste setor: a quem pertencem os dados?

Hoje, a Samsung está fornecendo seus dados diretamente ao Google, que usa seus dados para monetizar por meio de publicidade. Mas a propriedade original dos dados pertence ao usuário. Além disso, a memória de longo prazo será desvinculada da IA ​​— assim como a CPU e a memória podem ser desvinculadas.

Quando você possui um grande número de dispositivos, você tem mais controle sobre a quem escolhe compartilhar seus dados.

P: Quando o Android XR ou a IA multimodal estiverem maduros, todos os principais fabricantes entrarão no mercado, deixando pouco tempo para as startups?

A: Você entende, né? Assim como quando estávamos desenvolvendo celulares junto com o Android, todos os fabricantes de hardware entraram na jogada. Você ia de uma mesa para outra e os chips de todo mundo mudavam. O tempo pode estar se esgotando para as startups, então manter a diferenciação e um ritmo de iteração rápido é crucial.

Todo mundo diz que quer ser como a Apple, mas a maior conquista da Apple é resolver três problemas: fabricação de hardware, desenvolvimento de sistemas e como conectar hardware e software em um paradigma de interação completo.

Mas muitas pessoas podem associá-la apenas à Lenovo, ou até mesmo à Oracle. Os diferentes níveis hierárquicos têm funções diferentes e recebem salários diferentes. Contanto que eu consiga garantir um lugar nesse ecossistema, já está ótimo, mas ainda é cedo para falar sobre uma posição específica.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.