O grande modelo de Siri da Apple pode não ser o que você pensa

A IA da Apple está atrasada, mas chegando.

De acordo com o Wall Street Journal, a Apple está em discussões com o Baidu sobre a integração de IA generativa em iPhones e outros dispositivos no mercado doméstico.

Embora ainda não haja confirmação oficial, duas coisas são certas:

  • iPhone 16, iOS 18 e MacOS serão equipados com funções de IA
  • Modelos grandes em dispositivos Apple serão fornecidos por diferentes fabricantes no país e no exterior

Em comparação com as marcas nacionais que já equiparam assistentes de IA, a Apple está, sem surpresa, mais de meio ano atrasada desta vez.A lentidão parece sempre ter sido o rótulo da Apple, mas sempre pode trazer algumas surpresas enquanto avança de forma constante.

No entanto, a velocidade do progresso em grandes modelos de IA é medida em semanas ou até dias.A chegada tardia da Apple é mais uma vez um retardatário ou o início de uma nova era de ficar para trás?

Um plano um pouco comprometido, o segredo é entrar primeiro no ônibus

No último dia do mês passado, a Apple anunciou em uma breve reunião de 12 minutos que desistiria de construir carros e mudaria All in AI.Muitos membros da equipe automotiva seriam transferidos para o departamento de IA.

O Projeto Titan, que está adormecido há dez anos, falhou no último ano ao entrar em novos veículos energéticos. Será um pouco lamentável para o futuro mercado automobilístico, onde uma centena de escolas de pensamento competirão. No entanto, do ponto de vista do desenvolvimento a longo prazo de uma empresa de tecnologia, isso nada mais é do que um desenvolvimento a longo prazo. E a escolha certa.

A IA é uma aplicação básica. Numa altura em que todas as grandes empresas estão a adoptar activa ou passivamente a IA, a "disrupção" da Apple está em linha com os tempos, mas como abraçar a IA? Que tipo de inteligência artificial pode ocupar um lugar no mercado gradualmente dividido? Este é o primeiro problema que eles têm que resolver.

Para os mercados estrangeiros, a Apple está negociando ativamente com o Google para adicionar grandes modelos de IA ao iOS 18 para realizar funções de IA que outras marcas já possuem.

Embora “as duas partes ainda não tenham decidido os termos ou a marca do acordo de inteligência artificial, nem tenham finalizado como implementá-lo”, entre os muitos parceiros alternativos (OpenAI e Anthropic), Google e Gemini deverão ser os mais adequados para Apple e iPhone. .

Os modelos da série Samsung Galaxy S24 lançados em fevereiro deste ano são fora do comum com funções de IA. Funções como tradução de chamadas e escrita criativa alcançaram a média nacional. A pesquisa instantânea encurtou o caminho de pesquisa e é muito provável que se torne o principal característica dos telefones celulares AI no futuro.rota de desenvolvimento.

A versão internacional da série S24 é capaz de completar as funções acima através do suporte do modelo grande Gemini.

Falando por experiência própria, o Google completou suas primeiras tentativas no modelo principal com o maior volume de remessas do mundo.Em comparação com os fabricantes populares no lado do PC ou da Web, eles conhecem os hábitos operacionais, cenários de uso e adaptação de grandes dispositivos móveis modelos de telefone melhores. O que o aplicativo deve fazer.

Além disso, o próprio Google está mais ansioso para receber os projetos da Apple.

De acordo com estatísticas da empresa internacional de dados IDC, a quota de mercado global de smartphones da Samsung atingiu 19,4% em 2023, enquanto a Apple atingiu com sucesso o topo de 20,1%.

Se vencer a Apple, a taxa de adoção do Gemini em terminais de telefonia móvel em todo o mundo chegará a 40%, o que é extremamente bom para uma grande empresa de modelos de IA que enfrenta uma concorrência acirrada.

Além do Google, a Apple também acordou do sonho.

Ao contrário de outros fabricantes que enfatizam a "autopesquisa", a Apple utilizou a cooperação para alcançar a integração da IA ​​desde o início, e também teve suas próprias considerações.

Em primeiro lugar, na actual situação de início tardio e progresso lento, a "doutrina de utilização" é uma boa forma de competir rapidamente no mercado.A cooperação com o Google pode reduzir os custos de I&D e cobrar taxas elevadas, ao mesmo tempo que facilita as duas empresas. conflitos, pressões regulatórias atuais.

Em segundo lugar, a tecnologia da AIGC é muito boa, mas quando foi implementada, foi muito criticada pelas suas deficiências em ética, privacidade e outros aspectos. Foi entregue a um terceiro maduro, especialmente o Google, que testou com sucesso a água em Modelos Samsung, economizando esforço e preocupação e reduzindo a opinião pública e os riscos de responsabilidade.

Outro obstáculo nisso é a localização da tecnologia. Cada país e região tem requisitos diferentes para a supervisão e leis relacionadas de grandes modelos de IA. A implementação da conformidade legal é o pré-requisito para competir no mercado e desenvolver tecnologia. Portanto, nasceu a rota dupla "doméstica + internacional" .

De acordo com a cooperação inicial frutífera entre Samsung e Baidu, a Apple escolherá este caminho que foi “verificado como verdadeiro”.

A função de IA na versão do National Bank da série Samsung S24 consiste, na verdade, em tecnologias de vários fabricantes: a função de pesquisa instantânea é fornecida pelo Baidu e JD.com; o retoque inteligente de fotos é completado pelo grande modelo MiracleVision da Meitu Xiuxiu; o resumo do artigo, inteligente A escrita adota o modelo Wenxin Yiyan do Baidu.

Se a Apple também irá cooperar com vários fabricantes ainda precisa esperar por notícias subsequentes, mas a cooperação com o Baidu já é uma certeza.

No final das contas, o que a Apple quer fazer não é um assistente de voz inteligente, mas um conjunto completo de terminais de IA. No entanto, de acordo com as revelações de Macrumor, com o atual progresso da autopesquisa e conquistas técnicas, os grandes modelos da Apple ainda estão longe do nível de empresas como Google e OpenAI.

Em vez de se apressar para lançar um chatbot inteligente, é melhor usar soluções maduras como uma transição primeiro para ganhar mais tempo de pesquisa e espaço para melhorias para grandes modelos autodesenvolvidos.

O mercado atual é importante, mas a tecnologia central do futuro é fundamental

A cooperação é o primeiro passo na globalização da IA ​​da Apple, e o objetivo final é ter um grande modelo de IA autodesenvolvido.

Este é um projeto que consome dinheiro e energia, sem falar na regressão, se você progredir um pouco mais devagar, poderá ser eliminado na próxima semana. Um modelo grande e competitivo representa frequentemente domínio futuro e poder de negociação no mercado.

Cook acredita:

Abrindo novos caminhos na IA generativa, acreditamos que esta tecnologia pode redefinir o futuro.

A exploração de modelos grandes pela Apple sempre esteve na agenda.

No dia 15 deste mês, os engenheiros da Apple divulgaram discretamente um artigo de pesquisa que detalhava o processo de desenvolvimento de um novo modelo generativo de IA chamado MM1.

MM1 é uma série LLM multimodal com até 30B (30 bilhões) de parâmetros, que é o resultado da pesquisa mais recente da Apple em grandes modelos multimodais.

Em geral, o modelo autodesenvolvido pela Apple ainda está atrás do Gemini e do GPT4V em termos de resultados de testes, não mostra resultados tão surpreendentes quanto Sora na geração de resultados, nem explora uma nova rota técnica.

No entanto, ele pode controlar várias variáveis ​​de dados e descobrir os fatores mais críticos que afetam o efeito de geração do modelo em comparação. Simplificando, não é inerentemente poderoso, mas é bom em observação, prática e resumo. Após repetidas tentativas, , também pode alcançar bons resultados.

MM1 é composto por modelos densos e variantes MoE (Mixed Expert).Quando a instrução entra no MoE, se você deve ir ao mercado leste para comprar um cavalo ou ao mercado oeste para comprar uma sela, será claramente organizado por este centro de comando.

Embora os problemas sejam refinados e classificados, a eficiência da computação também é melhorada e o consumo de energia operacional é economizado.

O lançamento deste artigo representa os resultados encenados da exploração da Apple no campo da IA. Embora o MM1 não tenha subvertido a indústria nem surpreendido o mundo, seu progresso ainda pode ser visto em termos profissionais obscuros:

Nosso modelo de trabalho sempre foi fazer o trabalho primeiro e falar sobre ele depois, em vez de sermos rudes diante de nós mesmos. –Tim cook

A Apple, que não revelou muitos detalhes técnicos, na verdade ainda está planejando outra mudança: um grande modelo no lado do terminal.

Já no final do ano passado, a Apple propôs um método para implementar grandes modelos em dispositivos com "memória limitada", como o iPhone, em um artigo intitulado "Modelos de linguagem em larga escala na memória Flash: inferência eficiente de modelos de linguagem em larga escala sob Memória Limitada."

Os pesquisadores dizem que implantaram com sucesso o LLM (Large Language Model) em iPhones e outros dispositivos com restrição de memória usando a mais recente tecnologia de memória flash.

Este projeto se chama Apple GPT. Sua maior função é armazenar dados LLM diretamente na memória flash, como integrá-los ao Siri. Em comparação com o método de execução tradicional, a nova tecnologia aumenta a velocidade de inferência da CPU e GPU em até 5 vezes e 25 vezes.

“Os métodos de eficiência que desenvolvemos permitem que os modelos de IA funcionem com o dobro da capacidade de memória atual do iPhone”, disseram os pesquisadores.

Em outras palavras, é viável transportar modelos grandes na lateral. Ao reduzir a quantidade de dados transmitidos pela memória flash e melhorar o rendimento de cada transmissão, os dados LLM podem ser armazenados diretamente na memória flash.

Deixando a tecnologia de lado, Siri é a ponte entre nós e a IA

O progresso é lento, as novidades são poucas e o layout é grande. Esta é uma visão geral da exploração da IA ​​pela Apple.

Cada vez que vemos que uma determinada tecnologia da Apple está atrasada em relação ao mercado e aos concorrentes, isso dá às pessoas a ilusão de que "começou tarde demais". para ser implantado. Esse lote, mesmo aquele.

Em 2023, a Apple adquiriu um total de 32 empresas de IA, ocupando o primeiro lugar entre os gigantes da tecnologia em aquisições. A aquisição da Siri deve ser considerada o início da entrada da Apple na IA.

Em 2010, Jobs fez um telefonema para Dag Kittlaus, o "pai da Siri", o que levou a Siri a ingressar na Apple e a lançar o iPhone com um valor superior a 200 milhões de dólares americanos.

O Siri foi originalmente posicionado como um assistente para obter informações com rapidez e precisão ou para realizar tarefas complexas.

Em sua versão mais primitiva, o Siri pode se conectar a 42 serviços de rede – desde o site de resenhas de restaurantes Yelp e o site de vendas de ingressos StubHub até o site de resenhas de filmes Rotten Tomatoes e o site de cálculos matemáticos Wolfram Alpha.

Com base nas instruções, o Siri irá integrar diversas informações e responder ao usuário. A Siri pode ajudar os usuários a comprar ingressos, reservar um restaurante ou chamar um táxi sem abrir outro aplicativo.

Essas "funções de IA" que agora estão sendo promovidas vigorosamente pela AI Pin e outros assistentes inteligentes parecem ser apenas as "operações básicas" da Siri há mais de dez anos.

No entanto, a experiência real do Siri foi bastante separada pelo desenvolvimento explosivo de grandes modelos de IA.

Assistentes inteligentes são imitações passivas de pessoas, respondendo a todas as perguntas e respondendo a solicitações.

O terminal AI é uma abordagem ativa para as pessoas. Com base nos hábitos e preferências pessoais do utilizador, após resumir o passado e o raciocínio, iremos dar-lhe as sugestões e respostas mais adequadas em diferentes momentos e locais, e podemos aprender e optimizar continuamente para nos tornarmos "privados e exclusivos".

▲ Foto de: x.com

No geral, o atraso da Apple é relativamente tardio, porque os telefones móveis com IA ainda estão nos estágios iniciais de desenvolvimento.

Na verdade, a maioria das marcas nacionais já fez esforços na fase de terminais de IA, com aproximadamente as mesmas funções e especialidades diferentes.No entanto, a usabilidade de cada modelo grande só pode ser considerada passageira, exceto a eliminação da IA ​​​​dos álbuns de fotos OPPO e reais Processamento de chamadas em tempo real da Samsung. Para funções segmentadas, como tradução e chamadas de IA de Xiao Ai, a maior parte da experiência ainda é um pouco diferente daquela de aplicativos de IA independentes.

Além dos avanços tecnológicos dos fabricantes, isso também está relacionado à interface aberta do App. Por exemplo, os modelos que não suportam o resumo de chamadas de voz WeChat perderão uma grande área de espaço de aplicativo no dia a dia.

Portanto, a integração de grandes modelos, sistemas e aplicativos, bem como a exploração de novos métodos de interação, ainda têm um longo caminho a percorrer. Antes disso, as funções da IA ​​ainda não tinham atingido o nível de influenciar as decisões de compra dos consumidores.

No primeiro ano de lançamento da IA, o objetivo da Siri é preencher a lacuna de mais de meio ano com outros assistentes de IA; e como uma parte importante do layout futuro da Apple, estamos ainda mais ansiosos para que tipo de “Mais uma coisa “Siri trará em junho.”.

# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo