Felizmente, a IA nacional da Apple não escolheu o DeepSeek
Quando todos estão adivinhando onde a IA nacional da Apple dará o próximo passo, a resposta é surpreendente e razoável. Não o mais animado, nem o mais barulhento, nem aquele com a oposição mais forte, mas o mais discreto – Ali.
De acordo com a mídia estrangeira The Information, a Apple finalmente escolheu o Alibaba como parceiro para a versão chinesa da IA.
No artigo publicado ontem à noite, notamos também a polarização de atitudes entre os internautas na área de comentários. Algumas pessoas pensam que o Alibaba é o melhor candidato e é bem merecido, enquanto outras ficam intrigadas com o fato de a Apple ter ignorado o DeepSeek e escolhido o Alibaba.
Mas se você olhar para todo o processo de seleção, pode não ser injusto que o DeepSeek seja abandonado pela Apple.
Qual é o nível do modelo Ali Qwen?
Entre as muitas grandes empresas de IA, a Alibaba é provavelmente a mais secreta.
Muitas vezes, isso não é necessariamente uma desvantagem. Na indústria de IA em constante mudança, às vezes “não é atraente o suficiente” é a maior vantagem, porque o outro lado muitas vezes significa ter os pés no chão.
Da dimensão central da força técnica, a comunidade de código aberto é como um espelho que pode refletir a verdadeira força técnica. Alibaba é um dos poucos fabricantes nacionais que consegue se manter firme diante desse espelho.
Isso pode ser visto na última lista de grandes modelos de código aberto do Hugging Face, a maior comunidade de código aberto de IA do mundo. Os dez principais modelos de código aberto são todos modelos derivados baseados no treinamento secundário do modelo de código aberto Qwen do Alibaba.
Esta lista é atualmente a grande lista de modelos de código aberto mais confiável do mundo. Suas dimensões de teste abrangem compreensão de leitura, raciocínio lógico, cálculos matemáticos, perguntas e respostas baseadas em fatos, etc.
Outro facto indiscutível é que o valor da construção de uma marca tecnológica continua a aumentar. O aclamado e popular modelo grande Qwen ultrapassou o Llama e se tornou o modelo básico de referência reconhecido pela comunidade de código aberto.
Como o primeiro grande modelo de código aberto da indústria a atingir "tamanho completo, modo completo e vários cenários", o modelo Alibaba Cloud Qwen fornece aos desenvolvedores e empresas tamanhos e versões que variam de 1,5B a 72B e até 110B, atendendo plenamente às necessidades de diferentes cenários de aplicação.
Entre eles, apenas os modelos de compreensão visual Qwen-VL e Qwen2-VL foram baixados mais de 32 milhões de vezes em todo o mundo. Há uma semana, Qwen2.5-VL lançou uma nova atualização, que mais uma vez despertou o entusiasmo da comunidade de código aberto.
Os dados falam por si. Na lista de modelos de código aberto de 2024 da Hugging Face, Qwen2.5-1.5B-Instruct se tornou o modelo de código aberto mais popular entre os desenvolvedores globais, com uma participação de download de 26,6%.
Atualmente, o número de modelos derivados Qwen ultrapassou 90.000, tornando-o o maior grupo de modelos de código aberto do mundo.
Na onda tecnológica de modelos de inferência, Qwen demonstrou um poderoso campo gravitacional. Recentemente, o modelo de inferência s1 treinado pela equipe de Li Feifei, conhecido como "Madrinha da IA", utilizou menos recursos e dados, que também se baseia no modelo de destilação Qwen-32B, e alcançou os resultados de benchmarking OpenAI o1-Preview em múltiplas capacidades.
Todas essas conquistas se devem à excelente força básica do modelo Qwen, mas é também essa força que dá ao Alibaba a confiança necessária para aceitar os altos requisitos de padrão da Apple para funções de IA.
Além disso, em comparação com outras start-ups de IA, as vantagens do Alibaba como gigante de IA estabelecido na China são evidentes. Está mais familiarizado com as necessidades dos utilizadores domésticos e tem uma melhor compreensão das políticas de conformidade de dados.
Claro, embora Ali tenha vencido no final, esse resultado não estava destinado desde o início. Nos últimos meses, a Apple conduziu várias rodadas de inspeções em diversas empresas candidatas, incluindo Tencent, ByteDance e DeepSeek.
Em uma recente teleconferência de resultados, o CEO da Apple, Tim Cook, elogiou o DeepSeek.
Cook destacou que o DeepSeek alcançou uma inovação significativa na redução dos custos de treinamento e operação do modelo V3. Ele enfatizou que a inovação que promove a eficiência é algo muito positivo, como o DeepSeek demonstrou.
No entanto, devido à falta de tamanho da equipe e grande experiência de atendimento ao cliente, não é surpreendente que o DeepSeek esteja fora do jogo. Isso se reflete no “servidor ocupado, tente novamente mais tarde”. Em contraste, o chassi técnico e a infraestrutura do Alibaba Cloud proporcionam à Apple vantagens mais proeminentes no fornecimento de suporte de poder de computação localizado.
Mais importante ainda, ao cooperar com o Alibaba, a Apple espera lançar funções de IA (como voz inteligente, compreensão visual, etc.) que estejam alinhadas com os hábitos dos usuários chineses, aumentem a competitividade dos produtos e revertam o declínio do mercado.
Segundo relatos, a Apple, que tem objetivos claros, espera encontrar um parceiro que possa compreender as necessidades dos usuários chineses com base nos dados pessoais dos usuários, o que também é uma parte importante na construção de smartphones da Apple.
Quando a Apple avaliou modelos de IA desenvolvidos por várias empresas chinesas, ficou insatisfeita com a capacidade dos modelos de compreender a intenção do usuário e incorporar o uso real do telefone pelo usuário nas respostas geradas.
Se ele pode resistir ao escrutínio de olhares críticos e ao teste de cenários difíceis, a escolha do Alibaba pela Apple para sua IA nacional pode ser a melhor resposta a essa pergunta, e também é a melhor certificação da força de Qwen.
Depois que Qwen for usado no iPhone, essas experiências serão remodeladas
À medida que a indústria de telefonia móvel inaugurava uma nova rodada de mudanças tecnológicas, o diretor de produtos da OPPO, Liu Zuohu, fez um julgamento importante na conferência de estratégia de IA da OPPO no ano passado: "Os telefones celulares com IA serão o terceiro grande estágio de mudança na indústria de telefonia móvel, depois dos feature phones e smartphones."
O desenvolvimento de telefones celulares com IA é descrito em três estágios. O primeiro é a IA em nível de aplicativo, que torna os aplicativos individuais mais inteligentes; o segundo é a IA em nível de sistema, que integra recursos de IA no nível do sistema operacional e finalmente atinge o estágio de "IA é o sistema", tornando a IA o núcleo da interação do telefone móvel;
Incluindo a recente popularidade do Deepseek, a forma de aplicação da IA no campo da telefonia móvel tornou-se cada vez mais clara. Os fabricantes de telefones celulares geralmente adotam a solução de "colaboração dispositivo-nuvem": tarefas leves são processadas localmente no telefone celular e tarefas complexas são transferidas para a nuvem.
Apple Smart também demonstrou uma arquitetura em camadas semelhante após a conferência WWDC do ano passado:
- Modelo local: Principalmente um pequeno modelo 3B que foi ajustado, dedicado a tarefas como resumo e polimento. Com o suporte do adaptador, suas capacidades não são fracas.
- Computação em nuvem privada: Se o modelo local não atender aos requisitos, ele será transferido para a nuvem para computação. A Apple garante criptografia ponta a ponta para proteger a segurança e a privacidade dos dados do usuário
- LLM de terceiros: usado para bate-papos de perguntas e respostas de uso geral. Aplicativos como Siri são conectados a modelos externos como ChatGPT.
Se nada inesperado acontecer, na última cooperação com o Alibaba, o modelo Qwen provavelmente será integrado ao ecossistema do iPhone em duas formas. Uma é essencialmente um plug-in, fornecendo serviços de IA completos como um LLM de terceiros.
Esta estratégia é consistente com a abordagem da Apple para integrar o ChatGPT nos mercados internacionais. Mas assim como a sua cooperação com a OpenAI não é exclusiva, e modelos como Google Gemini ou Claude podem ser integrados em iPhones estrangeiros no futuro, mais modelos de IA produzidos internamente também podem ser introduzidos no mercado interno.
A segunda é cooperar com o Alibaba para implantar e desenvolver uma versão destilada do modelo pequeno. Ao contrário do DeepSeek V3/R1, que se concentra no modelo ultragrande 671B, Qwen adota uma abordagem completa. Até mesmo a famosa empresa DeepSeek optou por construir 4 de seus 6 pequenos modelos de destilação de código aberto baseados em Qwen, o que por si só é o melhor endosso da força técnica do Alibaba.
Como digressão, embora a Deepseek tenha lançado o Janus-Pro-7B, um modelo multimodal que supera o OpenAI DALL·E 3, a DeepSeek atualmente não oferece suporte a recursos multimodais no lado C. E Qwen é realmente bom quando outros não o têm, e não é ruim quando outros o têm. O recém-lançado Qwen 2.5 Max também está entre os modelos multimodais de nível superior mais competitivos.
É importante notar que também há avanços na tecnologia de compressão de modelos. Em 2024, os fabricantes chineses fizeram progressos significativos na otimização do modelo de IA, utilizando a mais recente tecnologia de quantificação e poda para agilizar significativamente a escala dos parâmetros e, ao mesmo tempo, garantir a qualidade da produção.
Por exemplo, de acordo com a Canalys, o MiLM2 da Xiaomi reduziu os parâmetros do seu modelo de 6 mil milhões para 4 mil milhões, enquanto a Honor e a vivo também reduziram os seus parâmetros do modelo dos anteriores 7 mil milhões para 3 mil milhões, respetivamente. Tongyi Qianwen também usa poda estruturada para compactar o modelo de parâmetro 7B para 2,2B, enquanto mantém capacidades consideráveis de compreensão e geração.
No nível da ferramenta, as ferramentas Core ML da Apple também suportam a quantificação dos pesos do modelo, o que pode reduzir a precisão padrão do float 32 para float 16, 8 bits, 7 bits ou até 1 bit.
O processo de quantização não altera a precisão dos tensores intermediários, que normalmente são mantidos na precisão do float 32 ou float 16, e os pesos são desquantizados em tempo de execução para corresponder à precisão dos tensores intermediários, melhorando assim a precisão dos resultados da inferência.
Já no ano passado, por meio de uma série de tecnologias de otimização, incluindo planeização de baixo bit, quantização de ativação, quantização de incorporação, atualização eficiente de cache KV e uso de ferramentas Talaria para análise de latência e consumo de energia, o modelo 3B da Apple executado no iPhone 15 Pro alcançou um atraso de apenas 0,6 milissegundos para o primeiro token e poderia gerar 30 tokens por segundo, criando uma experiência tranquila.
Claro, o objetivo final da inteligência da Apple é criar um verdadeiro assistente de IA em nível de sistema.
Modelos pequenos são o bilhete e a ecologia é o trunfo final. O ecossistema do Alibaba abrange comércio eletrônico, pagamento, serviços locais e entretenimento. Após uma cooperação profunda com o iPhone AI, no futuro, os usuários poderão concluir perfeitamente todo o processo de reserva de serviços por meio de comandos de voz simples.
A competição entre telemóveis com IA está a passar de uma competição puramente técnica para uma competição de integração ecológica e experiência do utilizador. Os fabricantes precisam trabalhar juntos nas três dimensões de poder de computação local, capacidades de nuvem e sinergia ecológica para criar telefones com IA que realmente impressionem os usuários.
A julgar pela resposta do mercado, esta cooperação excedeu em muito as expectativas. Quer se trate da popularidade do DeepSeek ou do "casamento" entre Apple e Alibaba, essa frase é realmente verdadeira – um verdadeiro mestre é como um rio indo para o leste, aparentemente calmo e silencioso, mas escondendo um grande poder.
# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.