Alguns telefones Android estão prestes a obter aplicativos de IA superpoderosos
Você já deve ter experimentado vários aplicativos generativos de IA em seu telefone. ChatGPT ou HeyPi da OpenAI são alguns exemplos de aplicativos de IA conversadores, enquanto aplicativos como Runway ML permitem criar vídeos gerados por IA diretamente no seu telefone.
Mas até agora, quase todos os aplicativos generativos de IA contam com computação baseada em nuvem, o que significa que todo o processamento mágico de IA acontece na nuvem, assim como os kits do Xbox fazem o trabalho pesado nos centros de servidores da Microsoft quando você transmite um jogo de console em seu computador. telefone ou tablet.
A MediaTek quer mudar isso, permitindo a computação de IA generativa no dispositivo, diretamente no seu smartphone. Essa ambição ambiciosa se materializará com o próximo chipset carro-chefe da MediaTek, que aparecerá em telefones Android até o final deste ano. A empresa é auxiliada em seus esforços pela Meta, controladora do Facebook, que está oferecendo o modelo Llama 2 como a pedra fundamental para aplicativos generativos de IA.
A fabricante de chips está divulgando toda uma gama de benefícios de sua abordagem de processamento de IA generativa no dispositivo, que inclui “desempenho contínuo, maior privacidade, melhor segurança e confiabilidade, menor latência, capacidade de trabalhar em áreas com pouca ou nenhuma conectividade e menor custo de operação."
Acelerando a IA generativa em telefones
O próximo chip MediaTek topo de linha empregará três táticas principais para aprimorar a experiência de IA generativa para smartphones. Primeiro, ele contará com uma pilha de software dedicada otimizada para executar o Llama 2, um modelo de linguagem grande de código aberto desenvolvido pela Meta que busca desafiar os modelos GPT da OpenAI e PaLM 2 do Google.
O Llama 2, lançado em julho, é “gratuito para pesquisa e uso comercial”. Até agora, não chegaram muitos aplicativos que dependem do modelo de linguagem Llama 2, já que os aplicativos de IA baseados em GPT são atualmente o assunto da cidade. Mas a Meta tem solicitado ativamente participantes da indústria de smartphones, incluindo a arquirrival da MediaTek, a Qualcomm.
Assim como a MediaTek, a Qualcomm também fechou um acordo com a Meta para apresentar o processamento no dispositivo para aplicativos baseados em Llama em smartphones equipados com seus principais chips a partir de 2024. Ambas as empresas também têm como alvo outras áreas de aplicação, como veículos. Hardware XR, dispositivos domésticos inteligentes e muito mais, com seus esforços de IA generativa local de dispositivo facilitados por silício de primeira linha.
Em seu próximo chip carro-chefe compatível com IA, a MediaTek também usará uma APU (unidade de processamento de IA) aprimorada que depende de “aceleração de backbone de transformador”. Os transformadores são um tipo de arquitetura de rede neural encarregada de criar grandes modelos de linguagem, como GPT (Generative Pre-Trained Transformers), que deu origem a produtos como ChatGPT e Bing Chat da Microsoft .
Finalmente, o novo chip da MediaTek também mergulhará no módulo DRAM para aprimorar a experiência do usuário em aplicativos de IA generativos baseados em Llama. DRAM, abreviação de Dynamic Random Memory, é o módulo de memória de alta velocidade e baixa latência que armazena os dados de trabalho de um aplicativo. Quanto mais DRAM houver no seu telefone, maior será o número de aplicativos que você pode executar em segundo plano sem problemas. Há uma razão pela qual fabricantes de smartphones como o OnePlus instalaram até 24 GB de DRAM em seus telefones.
O que essas atualizações de IA significam para você
Com os ajustes mencionados acima, a MediaTek diz que seu próximo chip de IA aprimorará a experiência de LLM e AIGC (Conteúdo Gerado por Inteligência Artificial), transferindo a maior parte dos requisitos de processamento para o hardware local.
Quanto ao tipo de tarefas que você pode esperar acelerar, bem, isso dependeria dos recursos do modelo Llama 2 da Meta e do tipo de aplicativos construídos sobre ele. Llama 2 é um modelo de linguagem natural baseado em texto, então você pode esperar que ele use os mesmos tipos de truques que ChatGPT ou Bard. Ele pode processar consultas e fornecer respostas com base em seus conjuntos de dados de treinamento, resumir ou expandir textos e muito mais.
Quanto à MediaTek, esta não será a primeira parceria de IA desse tipo. Em julho deste ano, a empresa assinou um acordo com o braço chinês da Unity – que desenvolve o mecanismo de desenvolvimento de jogos de mesmo nome – para explorar aplicações generativas de IA no segmento de jogos.
A MediaTek espera que seu novo chip com aplicativos Llama 2 chegue aos smartphones até o final do ano, então não precisamos esperar muito para ver como tudo isso fica em um produto real.