Exposição privilegiada da equipe Siri da Apple: lutas, lutas, reorganização
A Microsoft investiu no OpenAI e lançou o novo Bing, o Google lançou o Bard, a Adobe lançou o FireFly, a Amazon lançou o Amazon Titan e, com a popularidade do ChatGPT, ferramentas de IA ou assistentes de grandes empresas do Vale do Silício explodiram em um instante.
▲ Função copiloto do Github
Apenas a Apple, localizada em um canto da Califórnia, parece ao mundo exterior um mundo que não é perturbado pela IA.
silêncio
Depois de vivenciar a louca marcha da IA, grandes e pequenas empresas entraram uma após a outra no campo AIGC, todas marcarão a versão beta de teste e precisarão passar por uma fase de lista de espera.
Eles podem acabar errados, podem não responder à pergunta e podem até causar um pico de opinião pública, mas o Vale do Silício e nós ainda gostamos de participar disso.
Relativamente falando, a Apple sempre se manteve em silêncio sobre o AIGC, e nem os executivos nem os funcionários expressaram as verdadeiras opiniões da Apple sobre isso.
A Apple sempre prestou muita atenção em manter sua própria imagem e marca da empresa e raramente anuncia produtos ou tecnologias imaturas para o mundo exterior.
Portanto, isso também explica por que a Apple é sempre mais lenta do que outras empresas para novas tecnologias.
A Apple faz o possível para evitar fenômenos inaceitáveis quando novas tecnologias são aplicadas aos produtos.
Atualmente, a maioria dos produtos na indústria de AIGC ainda gira em torno de caixas de diálogo de páginas da Web, e o aplicativo matador ainda está em um estágio em branco.
Faz sentido para a Apple, que é focada em produtos, não comentar.
No entanto, de acordo com as informações obtidas nas informações, os engenheiros da Apple planejam combinar o modelo de linguagem grande LLM com o Siri para lançar um Siri mais inteligente, que será naturalmente aplicado ao iOS do próximo ano.
Assim como em 2011, a Apple anunciou pela primeira vez o assistente inteligente Siri, que chegou ao mercado junto com o iPhone 4s, tornando-se uma grande atualização funcional do iPhone naquele ano.
alto perfil
A julgar pela perspectiva atual, a Apple adicionou um mecanismo neural ao chip, chamando o chip SoC de "biônico" e aplicando vários modelos e algoritmos de inteligência artificial à fotografia, biometria, escrita etc.
Muitas vezes é difícil para as pessoas perceberem a grande otimização e melhoria da experiência do usuário. O uso da IA pela Apple é bastante discreto.
Mas em 2011, a Siri foi revelada como a tecnologia de inteligência artificial de maior destaque da Apple.
▲ Scott Forstall
Até agora, ainda me lembro que quando Scott Forstall apresentou o Siri, ele disse que o Siri pode entender a linguagem natural, não exige que os usuários se lembrem de formatos e gramáticas específicos e também pode ser personalizado de acordo com os hábitos do usuário.
No vídeo promocional seguinte, a Siri realmente se tornou um assistente embutido no celular que sempre responde corretamente e é bastante inteligente e humano.
É que a iteração técnica da Siri parece ter estagnado depois de 2011. Mais de dez anos depois, ainda segue a resposta "ingênua" de 2011.
Quando as pessoas estão constantemente sendo atualizadas por assistentes de voz mais avançados de outras empresas, a Siri parece um pouco desajeitada e muito fofa.
Em particular, a Siri já cobriu quase todos os dispositivos da Apple, incluindo iPhone, iPad, Mac e até AirPods. Os métodos de processamento e resposta ligeiramente antiquados da Siri a tornam ainda mais desatualizada.
Até a Apple está desapontada com a Siri internamente.A equipe de desenvolvimento de dispositivos XR da Apple não quer usar a Siri para controlar dispositivos e funções em dispositivos XR porque ela não é inteligente o suficiente.
Para tanto, Mike Rockwell, responsável pelos equipamentos XR, também considerou encontrar uma alternativa para substituir o controle de voz da Siri, mas acabou falhando.
O suposto fone de ouvido Apple XR ainda será semelhante a outros dispositivos da Apple, com controles simples usando o Siri e, claro, uma simples conversa com ele, se você quiser.
escalar
O lançamento do Siri é considerado um ponto de virada na história dos smartphones. Depois da Siri, quase todos os fabricantes de smartphones lançarão um assistente inteligente semelhante para seus produtos, para não ficar para trás.
Quanto à Apple, ela gastou US$ 200 milhões para adquirir a Siri Inc. em 2010 e integrou a Siri ao iPhone um ano depois.
Depois disso, a Apple também formou uma equipe de assistentes inteligentes Siri.No entanto, de 2011 a 2018, a equipe Siri caiu em confusão e houve alguns debates sobre gerenciamento interno e direção geral.
▲ John Giannandrea
A solução da Apple é “convidar um especialista”.
Antes disso, ele era responsável pelos negócios de pesquisa e inteligência artificial do Google e quase pode ser considerado um especialista sênior no campo de inteligência artificial do Google.
Com a adição de John Giannandrea, a Apple quer contar com sua experiência para melhorar gradualmente o status quo da Siri e ajudar a Siri a alcançar os concorrentes.
John Giannandrea também trouxe uma atmosfera de trabalho semelhante à do Google para a equipe da Siri e, quando os executivos da Apple precisavam de mudanças imediatas na Siri, ele usava o processo de "escalar a montanha" para explicar como resolver os problemas enfrentados pelo campo da IA artificial. inteligência.
Para Siri, ou a estratégia de inteligência artificial da Apple, é preciso haver um objetivo de longo prazo, durante o qual cada pequena otimização e mudança se acumulará gradualmente ao longo do tempo, e não deve ser desleixado.
Em outras palavras, John Giannandrea acredita que a base da Apple em inteligência artificial é muito fraca para se apressar.
Além disso, ele também convenceu a alta administração da Apple de que, por enquanto, eles deveriam se concentrar na formação de equipes, reter talentos relevantes e dar-lhes mais liberdade para pesquisar e desenvolver suas próprias direções interessadas.
Mais importante ainda, John Giannandrea aumentou significativamente o nível salarial da equipe de inteligência artificial para os padrões da indústria.
Depois de três truques, a equipe de inteligência artificial da Apple foi aprimorada, muitos ex-especialistas em inteligência artificial do Google foram apresentados e a startup de aprendizado de máquina Laserlike foi adquirida por US$ 150 milhões.
Seus três fundadores, Srinivasan Venkatachary, Steven Baker e Anand Shukla, mais tarde se tornaram a equipe Siri, especialistas no campo LLM da Apple e no campo de pesquisa.
O objetivo de introduzir o Laserlike é, na verdade, melhorar os recursos de pesquisa da Siri, e Venkatachary naturalmente se tornou o chefe da equipe de pesquisa da Apple.
Em 2019, a Apple adicionou ao Siri a capacidade de responder às perguntas do usuário por meio de informações da rede. A funcionalidade do Siri está sendo gradualmente completada e aprimorada.
No entanto, essas mudanças são mais como "flash in the pan".
Existem alguns projetos dentro da equipe de inteligência artificial da Apple, incluindo o projeto BlackBird, que pode portar a Siri para o iPhone, e o SiriX, um projeto que celebra o décimo aniversário da Siri.
No entanto, além da competição interna, os principais executivos da Apple são muito lentos para tomar decisões sobre a direção geral da inteligência artificial e são muito conservadores no uso de novas tecnologias, como LLMs.
▲ De A para outro Uma imagem de: as informações
No outono de 2022, Srinivasan Venkatachary, Steven Baker e Anand Shukla também trocaram a Apple pelo Google.
Curiosamente, o CEO do Google, Sundar Pichai, recrutou pessoalmente a equipe de três pessoas, e Tim Cook também a manteve.
Mas eles acham que o Google é uma empresa adequada para pesquisar o LLM e será rapidamente aplicado aos produtos.
Agora eles estão estudando no Google como reduzir o custo de treinamento de grandes modelos de linguagem e como melhorar a precisão.
Não apenas a equipe Laserlike, mas também a maioria dos outros especialistas e equipes recrutados por Giannandrea deixaram a Apple.A razão é que a Apple não parece prestar muita atenção à pesquisa de inteligência artificial.
Após a chegada de John Giannandrea, no processo de escalar a montanha no campo da inteligência artificial, talvez fosse diferente da direção estratégica geral da empresa, o que fez com que a inteligência artificial da Apple lutasse.
luta
A proteção da privacidade é uma estratégia no nível da empresa que a Apple seguiu recentemente.
Diante disso, tudo deve ser comprometido e nunca comprometido.
John Giannandrea ingressou na Apple com o objetivo claro de tornar a Siri mais inteligente, otimizando o uso de dados do usuário e algoritmos de treinamento pela Apple.
Porque, em empresas como Google e Amazon, é uma rotina coletar e analisar dados do usuário para melhorar os modelos de algoritmo do produto.
Também por causa desse processo, o algoritmo será mais inteligente e a IA se tornará mais inteligente.
A Apple coletava anteriormente dados de conversas entre a Siri e os usuários sem lembrar o ID, mas não o fazia profissionalmente, nem usava esses dados para melhorar a Siri.
Com a chegada de John Giannandrea, a Apple encontrou muitas empresas de terceirização para coletar dados relevantes e, finalmente, otimizou a Siri por meio de um processo.
Mas em 2019, o The Guardian expôs que a equipe terceirizada da Apple ouvia as conversas entre os usuários e a Siri sem consentimento, o que causou alvoroço, principalmente para a Apple, que sempre teve como foco a privacidade.
Para esse fim, a Apple acabou substituindo terceirizados por funcionários em tempo integral e modificou processos e políticas internas para tornar quase impossível para funcionários comuns ouvir as gravações de conversas da Siri.
Tais regulamentos também tornam mais difícil para a equipe de inteligência artificial otimizar em tempo real e iterar no tempo, e também é uma das razões pelas quais o Siri parece tão clássico atualmente.
“As falhas do que eles estão fazendo vão se tornar cada vez mais óbvias”, disse Pedro Domingos, professor de ciência da computação na Universidade de Washington e autor do livro de aprendizado de máquina “The Master Algorithm (The Master Algorithm)”. dados, a fim de ser mais competitivo com os outros.”
▲ Tim Cook Foto de: Bloomberg
E para algumas das respostas estranhas de Siri que muitas vezes correm para pesquisas quentes, também atrairá a atenção de Tim Cook. Freqüentemente, pulará o processo e pedirá diretamente à equipe da Siri para modificar as respostas "embaraçosas".
Para reduzir a coleta de dados devido à proteção da privacidade, evitar respostas embaraçosas e fazer correções manuais, a Apple atribui grande importância à sua imagem corporativa.
Portanto, embora a Apple agora tenha enormes fundos e recursos, muitos ex-membros da equipe de inteligência artificial da Apple acreditam que é difícil para a Apple implantar o Siri baseado em LLM em breve.
Além disso, a Apple também estabeleceu muitas regras na Siri, como perguntar sobre o preço de um iPhone, ela dará prioridade ao desvio para o site oficial da Apple em vez de dar uma resposta diretamente.
A Apple não é uma empresa pioneira em tecnologia, todos os seus serviços e tecnologias atendem a produtos, ou seja, podem vender mais iPhones, iPads e Macs.
Portanto, por muito tempo, a equipe de design tem uma palavra considerável e acha que o produto deve ser 100% perfeito.
Essa busca também continuou para a equipe de inteligência artificial Siri, mas como um algoritmo, é impossível ser 100% preciso e os erros são inevitáveis. Somente cometendo erros podemos otimizar melhor os modelos relacionados.
As diferentes atividades entre eles também tornam o trabalho da equipe de inteligência artificial muito estressante. Por persuasão de Giannandrea, a equipe de design do software teve que adicionar um botão à Siri, permitindo que os usuários informassem se a resposta estava correta.
Seja para insistir na privacidade, nas questões de fluxo de trabalho ou para fazer um produto 100% perfeito, a equipe de inteligência artificial da Siri vive uma série de lutas, assim como estar de mãos atadas com grandes empresas como Google e Amazon. de inteligência artificial.
desconhecido
Esse "desconhecido" pode se referir a muitas coisas.
A equipe de inteligência artificial da Apple introduziu muitas melhorias no Siri, como Siri X, BlackBird, Pegasus e outros projetos.
Embora alguns membros do projeto tenham saído, esses projetos estão finalmente perto da conclusão e podem ser substituídos ou otimizados no Siri atual a qualquer momento.
No entanto, como defendido por John Giannandrea, um modelo de inteligência artificial é na verdade um projeto bastante complicado, que afeta todo o corpo.
A modificação e substituição cegas podem causar problemas imprevisíveis.
Além disso, em comparação com outros assistentes de voz como o Alexa da Amazon ou o Assistente do Google, as respostas da Siri dependem muito do envolvimento humano.
Em outras palavras, o banco de dados da Siri tem muitas limitações e intervenções humanas. Após mais de dez anos de modificações e ajustes, o banco de dados tornou-se complicado e demorado.
Além disso, também é diferente do método de trabalho do banco de dados do atual modelo de linguagem grande do LLM. Ele não pode simplesmente adicionar uma interface API para executar o ChatGPT sem problemas e ter funções semelhantes.
O que a Apple precisa decidir agora é se quer uma Smart Siri, se deve derrubá-la e recomeçar ou otimizá-la camada por camada.
Além disso, ninguém nega que a lucratividade, o fluxo de caixa e as enormes capacidades de mobilização de recursos da Apple. Além disso, existem também recursos de hardware e reservas de conhecimento, como chips e terminais.
Quando a Apple está determinada a se dedicar ao campo AIGC, ela pode treinar modelos complexos de linguagem grande e criar sua própria IA generativa.
Mas a Apple precisa decidir se precisa "reinventar a roda" ou investir sua visão e recursos em como aplicar o AIGC ao terminal e incorporá-lo à ecologia.
Afinal, os LLMs que oferecem suporte a serviços complexos como o ChatGPT ainda estão em execução na nuvem e ainda está em branco para aplicá-los ao ecossistema do terminal.
Em termos de transferência de pessoal, a Apple está atualmente focando mais em especialistas em reconhecimento visual.Relativamente falando, também está focando no campo adequado para realidade virtual XR.
Para a Apple, a explosão tecnológica na indústria de AIGC tem menos de um ano, e como aplicá-la aos produtos da Apple ainda é uma tentativa muito preliminar.
E a Apple vem se preparando há muitos anos, pretendendo substituir o iPhone como a próxima grande tendência de equipamento de realidade virtual XR, talvez seja o produto que a Apple mais deva se preocupar e focar no desenvolvimento.
Quanto a transformar o Siri em Smart Siri ou Siri Copilot, deixe a equipe de IA liderada por John Giannandrea escalar a montanha por um tempo.
#Bem-vindo a prestar atenção à conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr), conteúdo mais interessante será apresentado a você o mais rápido possível.