Yin Qi abre caminho para as estrelas: a maquete em grande escala “Playoffs” ganha vida no mundo físico.

A APPSO apurou que a Jieyue Xingchen concluiu recentemente uma rodada de financiamento Série B+ superior a 5 bilhões de yuans. Entre as instituições participantes estão o Shanghai International Trust & Investment Corporation (SITIC) Pilot Fund, a China Life Equity Investment, a Pudong Venture Capital, a Xuhui Capital, o Wuxi Liangxi Fund, o Xiamen International Trade Group e a Huaqin Technology, além de outros investidores do setor. Acionistas já existentes, como a Tencent, a Qiming Venture Partners e a 5Y Capital, também participaram do investimento subsequente.
Vale ressaltar que esta rodada de financiamento supera a rodada Série C de US$ 500 milhões anunciada recentemente pela Moonlight Animation, estabelecendo um novo recorde para a maior rodada de financiamento individual no mercado de grandes modelos da China nos últimos 12 meses, e superando até mesmo os valores arrecadados em IPOs da Zhipu e da MiniMax.
As notícias sobre investimentos em IA têm sido frequentes no último mês: a Manus foi adquirida pela Meta, Yang Zhilin, da Moonlight Capital, fez uma declaração pública afirmando que "não lhe falta dinheiro", e a Zhipu e a MiniMax abriram capital em Hong Kong uma após a outra. Hoje, esta rodada de financiamento da Jieyue Capital reacendeu a agitação no setor de IA.
Em contraste, a StepLeap seguiu um caminho ligeiramente diferente: enquanto outros grandes players do mercado de modelos buscavam a certeza e aproveitavam a oportunidade para realizar um IPO e abrir o capital, a StepLeap Star, com essa quantia substancial de dinheiro, escolheu um caminho mais pesado e lento: o mundo físico.
Não existe uma abordagem certa ou errada, mas o consenso da indústria é que a temporada regular para competições de modelos em larga escala acabou. Os últimos dois anos foram focados na contagem de parâmetros e tokens — mas, a partir de 2026, os playoffs girarão em torno de uma nova proposta central:
Como a inteligência artificial pode sair dos centros de dados, entrar no mundo real e assumir o controle de mais terminais físicos?

Pessoas e empresas que transcendem os ciclos
A APPSO acredita que, além do financiamento, as mudanças no quadro de pessoal merecem maior atenção.
Uma figura chave do "ciclo anterior da IA" entrou oficialmente em cena: Yin Qi, presidente da Qianli Technology.
Yin Qi sempre esteve profundamente envolvido no planejamento estratégico da Jieyue Xingchen, e desta vez ele também assumiu uma nova identidade: Presidente da Jieyue Xingchen, sendo totalmente responsável pela estratégia e implementação industrial da empresa, formando uma relação positiva e complementar com a equipe existente.
Antes disso, a equipe da StepLeap era caracterizada por fortes capacidades técnicas, mas com experiência relativamente fraca no setor.
- O CEO Jiang Daxin é o ex-vice-presidente global da Microsoft e cientista-chefe do Instituto de Engenharia da Internet da Microsoft Ásia. Ele foi responsável pelo desenvolvimento da busca do Bing, o que significa que não só entende de tecnologia, como também tem experiência em transformar IA em um produto global de grande sucesso. No ano passado, tornou-se o único membro do IEEE (Institute of Electrical and Electronics Engineers) proveniente de uma startup chinesa de grande porte.
- O cientista-chefe Xiangyu Zhang é um dos quatro autores do ResNet, um artigo fundamental na área de aprendizado profundo, e suas contribuições para o setor são evidentes.
- Zhu Yibo, CTO, atuou anteriormente como líder técnico dos produtos de GPU do Google Cloud, dando suporte direto à Anthropic. Antes disso, foi responsável pela construção da infraestrutura de IA na ByteDance. Ele é um dos poucos engenheiros na China com experiência prática na construção de clusters com múltiplas placas de vídeo do zero.
Essa equipe superou a "batalha de cem modelos" em dois anos, chegando ao topo da lista de modelos de grande escala na China. Hoje, a Leap Forward é uma das poucas startups na China que ainda insiste no pré-treinamento e na exploração de limites de inteligência mais elevados para modelos de pedestal, e possui a matriz de modelos mais abrangente.
Contudo, a liderança tecnológica não se traduz em sucesso comercial. Na segunda metade da competição por modelos de grande escala, que se tornou ainda mais acirrada, o desempenho do modelo já não pode ser o único fator determinante para a preferência do mercado. Como levar os modelos de grande escala a aplicações práticas e gerar valor comercial tornou-se o novo divisor de águas.
Para uma empresa navegar pelos ciclos econômicos, ela precisa de pessoas que saibam como fazê-lo. Yin Qi é exatamente essa peça do quebra-cabeça que a Jieyue precisa.
Há mais de uma década, "redes neurais profundas" ainda eram uma expressão em voga, e os pesquisadores perceberam pela primeira vez a enorme utilidade que suas pesquisas e capacidades tinham para a indústria. Em 2011, Yin Qi e vários colegas da turma Yao da Universidade de Tsinghua cofundaram a Megvii Technology .
Entre os empreendedores chineses de IA, Yin Qi é uma rara "espécie anfíbia". Ao contrário de fundadores puramente acadêmicos como YueAn e Zhipu, e de fundadores com formação quantitativa como Liang Wenfeng, o principal diferencial de Yin Qi é a "experiência/capacidade prática". O negócio de IoT da Megvii atende a mais de 100 cidades na China e se expandiu para mais de dez países e regiões globalmente, com sua plataforma AIoT alcançando centenas de milhões de conexões de terminais.

Qi Yin
O nome de Yin Qi não tem sido mencionado com frequência pela comunidade de IA nos últimos anos, mas, de fato, poucas pessoas entendem a narrativa central do próximo ciclo da IA melhor do que ele:
Os modelos em larga escala vão além de artigos acadêmicos e rankings; eles precisam entrar no mundo físico e formar um ciclo fechado.
Isso também explica outro tema central da estratégia abrangente da StepLeap, além de expandir os limites de seus modelos: levar modelos em larga escala para dispositivos de consumo, como celulares e automóveis. Os dados mostram que a StepLeap estabeleceu parcerias sólidas com 60% das principais marcas de smartphones da China, com seus modelos instalados em mais de 42 milhões de dispositivos, abrangendo marcas como OPPO, Honor e ZTE, atendendo uma média de 20 milhões de usuários por dia.
No setor automotivo, a Jieyue estabeleceu parcerias sólidas com a Qianli Technology e a Geely para integrar modelos de voz completos ao cockpit inteligente AgentOS . O Geely Galaxy M9 alcançou a marca de quase 40.000 unidades vendidas em apenas três meses desde o seu lançamento; de acordo com o plano da Jieyue, a meta de instalação do modelo em veículos para este ano é de milhões de carros.
Yin Qi esteve profundamente envolvido no planejamento estratégico da Jieyue desde sua fundação e permanece na empresa desde então. Agora, a entrada oficial de Yin Qi significa que sua estratégia de longo prazo "IA + terminal" está sendo acelerada pela Jieyue e entrando na fase de implementação completa.
A combinação de seus próprios negócios inevitavelmente traz à mente a combinação xAI de Elon Musk e Tesla/Optimus: uma fornece a alma e a outra constitui o corpo.
Focando na multimodalidade: o único caminho para o mundo físico
Por que "IA + Terminal" deve apostar na multimodalidade?
De uma perspectiva puramente técnica, as capacidades multimodais constituem o "sistema sensorial" através do qual modelos complexos interagem com o mundo físico. Se o modelo complexo for um agente inteligente, o texto é mera lógica simbólica; a multimodalidade representa, de fato, os olhos, os ouvidos e a boca. Somente com capacidades multimodais a IA pode realmente perceber e se integrar à vida humana real.
Analisando mais a fundo, existem dois caminhos para alcançar essa capacidade perceptiva: um é o modelo "plug-in", líder do setor, que envolve primeiro a codificação visual e depois o envio dessa informação para um modelo de linguagem para compreensão. Embora essa abordagem seja simples, é como fornecer um guia para uma pessoa cega — inevitavelmente, há perda e atraso de informações durante o processo de conversão.
Por outro lado, o StepLeap adota a abordagem "multimodal nativa", partindo diretamente de corpora intercalados de texto e imagem e realizando treinamento de ponta a ponta. Esse modelo não é limitado por arquiteturas de junção, alcançando uma compreensão e geração multimodal mais nativas e naturais, permitindo que a IA imite os métodos humanos para entender a lógica causal do mundo físico.
Além do aspecto visual, essa "natividade" também é evidente nos modelos de áudio do Step-Audio. Por exemplo, a versão mais recente, Step-Audio-R1.1, utiliza a tecnologia MGRD (Modal Anchored Inference Distillation) para permitir que o modelo gere cadeias de inferência baseadas puramente em características acadêmicas, resolvendo o problema de que os modelos de áudio "cometem mais erros quanto mais pensam". Os resultados gerados alcançaram o primeiro lugar no ranking mundial da renomada revista Artificial Analysis.

Da compreensão do mundo à interação proativa
O multimodalismo nativo foi projetado para permitir que modelos de grande porte "compreendam o mundo", enquanto o próximo passo em direção ao mundo físico exige que esses modelos aprendam a "interagir com o mundo".
Portanto, desde então, a StepLeap tem estado profundamente envolvida na arquitetura VLA (Visão-Linguagem-Movimento). Sua importância reside em permitir que a IA veja, ouça e, mais importante, tenha capacidades de tomada de decisão e execução em ambientes digitais ou físicos, assim como os humanos.
Para concretizar esse conceito, a Step-GUI lançou a primeira série de interfaces gráficas de usuário (GUI) de código aberto verdadeiramente implantável do setor. Entre elas, a versão edge, Step-GUI-Edge, com 4 bilhões de parâmetros, demonstra capacidades extremamente robustas, apesar de seu tamanho compacto, superando até mesmo modelos com oito vezes mais parâmetros em testes de benchmark convencionais. Isso significa que, mesmo com a capacidade computacional limitada de dispositivos de consumo, modelos robustos ainda podem funcionar confortavelmente, transformando-se em agentes inteligentes com recursos de leitura de tela e operação. Significa também que todos os fabricantes de celulares podem aproveitar essa capacidade para desenvolver funções semelhantes ao Assistente Móvel Doubao.
Essa evolução da percepção à ação foi validada em implantações comerciais em larga escala. No mercado de terminais móveis, a Leap é considerada a principal fabricante de smartphones com IA. De acordo com a APPSO, a Leap já estabeleceu parcerias sólidas com 60% das principais marcas de celulares na China, incluindo modelos de ponta de marcas como OPPO, Honor e ZTE.

Hoje, as funções de IA dos celulares disponíveis comercialmente já ultrapassaram o escopo das "caixas de diálogo" do ano passado e começaram a penetrar no nível do sistema. Por exemplo, o "One-Click Screen Question" da OPPO, o "Photo Question" da Honor e o "Elderly AI Assistant" da ZTE são exemplos de funções de IA que não apenas entendem a tela e geram conteúdo, mas também executam tarefas complexas em diversos aplicativos.
Segundo dados da IDC, a taxa de penetração de smartphones com IA no mercado chinês ultrapassará os 50% em 2026, com um em cada dois smartphones possuindo recursos nativos de IA em nível de sistema.

Em relação ao consenso da indústria de que "a competição por modelos em larga escala entrou na próxima fase", Yin Qi e Jie Yue apostaram em um caminho mais difícil, porém mais seguro: a IA precisa ser incorporada à estrutura do mundo físico para sobreviver a longo prazo.
Num universo paralelo dentro do Vale do Silício, Musk integra a IA exponencial (xAI) com a Tesla/Optimus para construir um ciclo fechado completo, desde modelos de ponta até dispositivos físicos. Esse caminho exige ativos consideráveis, operações robustas e recursos industriais que a maioria das empresas modelo não possui. Mas para aqueles que sobreviveram aos ciclos econômicos, esse parece ser o caminho certo para a Inteligência Artificial Geral (IAG).
Um stepper não precisa ser dono de todas as fábricas, mas precisa estar profundamente presente.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

